JP2005250594A - Address estimation device and method - Google Patents
Address estimation device and method Download PDFInfo
- Publication number
- JP2005250594A JP2005250594A JP2004056706A JP2004056706A JP2005250594A JP 2005250594 A JP2005250594 A JP 2005250594A JP 2004056706 A JP2004056706 A JP 2004056706A JP 2004056706 A JP2004056706 A JP 2004056706A JP 2005250594 A JP2005250594 A JP 2005250594A
- Authority
- JP
- Japan
- Prior art keywords
- destination
- newly created
- transmission destination
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、電子メールの宛先を推定する宛先推定装置及び宛先推定方法に関する。 The present invention relates to a destination estimation device and a destination estimation method for estimating a destination of an electronic mail.
従来のメール等のフィルタリング処理は、受信者にとって迷惑なメールを検出する受信メールのフィルタリングと、送信者のミスによって発信される意図しないメールを検出する送信メールのフィルタリングに大別できる。送信メールのフィルタリングでは、ウィルスを含むメールなど受信者にとって有害なメールを検出する方法と、送信先を間違えた機密情報を含むメールなど送信者にとって不利益なメールを検出する方法がある。 Conventional filtering processing for e-mail and the like can be broadly divided into filtering of received mail that detects annoying mail for the recipient, and filtering of sent mail that detects unintended mail that is transmitted due to a sender's mistake. There are two methods of filtering outgoing mail: a method that detects mail that is harmful to the recipient, such as mail that contains a virus, and a method that detects mail that is detrimental to the sender, such as mail that contains confidential information with the wrong destination.
この送信者にとって不利益なメールを検出する方法として、電子メールの内容開封時に内容に記載された個人を特定する情報をすべて問い合わせた上で開封を許可する方法(例えば、特許文献1参照)、所定のシステム管理者のみによって設定された送信先にしかメールを送信できないようにし、転送先アドレスの入力間違い等を防止する方法(例えば、特許文献2参照)、サーバにおいて電子メールの送信要求を受けた際に、送信要求で示される要求送信元及び要求送信先の組が、予め設定された送信元及び送信先の組リストの中に存在する場合にのみ送信可能とする方法(例えば、特許文献3参照)などが開示されている。
しかしながら、特許文献1では、受信者が受信したメールの中身を見る為に、受信したメールの中身の一部を予め知っている必要がある。又、送信者は受信者がメールの中身を見るために、照合する内容を漏れなくメールに記載する必要がある。
However, in
又、特許文献2では、管理者が送信可能メールアドレスを設定するので、ユーザがメールアドレスの入力間違えを回避することはできるが、登録された複数の送信先の中から誤った送信先にメールを送信する可能性がある。特許文献3は、送信者と受信者との組のリストを用いる方法であるが、これも特許文献2と同様に、リストに登録された複数の送信先の中から誤った送信先にメールを送信する可能性がある。 In Patent Document 2, since the administrator sets a mail address that can be sent, the user can avoid mistakes in entering the mail address, but the mail can be sent to the wrong destination from a plurality of registered destinations. May be sent. Patent Document 3 is a method that uses a list of a pair of a sender and a receiver. Similarly to Patent Document 2, a mail is sent to an incorrect destination from among a plurality of destinations registered in the list. There is a possibility of sending.
そこで、本発明は、上記の課題に鑑み、送信要求を行う段階で、誤った宛先にメールを送信することを防止する宛先推定装置及び宛先推定方法を提供することを目的とする。 In view of the above problems, an object of the present invention is to provide a destination estimation device and a destination estimation method that prevent a mail from being transmitted to an incorrect destination at the stage of making a transmission request.
上記目的を達成するため、本発明の第1の特徴は、新規作成メールの送信宛先を推定する宛先推定装置であって、(イ)複数の既送信メール及び新規作成メールの特徴量を抽出する特徴量抽出手段と、(ロ)特徴量に基づいて、送信宛先毎の所定のパラメータを算出するパラメータ算出手段と、(ハ)既送信メールから算出された所定のパラメータと、新規作成メールから抽出された特徴量とを用いて、新規作成メールの送信宛先を推定する推定手段とを備える宛先推定装置であることを要旨とする。 In order to achieve the above object, a first feature of the present invention is a destination estimation device that estimates a transmission destination of a newly created mail, and (a) extracts feature quantities of a plurality of sent mails and newly created mails. (B) a parameter calculation unit that calculates a predetermined parameter for each transmission destination based on the feature amount; (c) a predetermined parameter calculated from the sent mail and a newly created mail The gist of the present invention is a destination estimation device that includes an estimation unit that estimates a transmission destination of a newly created mail using the feature amount.
第1の特徴に係る宛先推定装置によると、新規作成メールの送信宛先を推定することにより、送信要求を行う段階で、誤った宛先にメールを送信することを防止することができる。 According to the destination estimation device according to the first feature, by estimating the transmission destination of a newly created mail, it is possible to prevent the mail from being sent to an incorrect destination at the stage of making a transmission request.
又、第1の特徴に係る宛先推定装置は、推定手段によって推定された送信宛先と、新規作成メールに設定されている送信宛先とを比較する比較手段と、比較手段の結果から、新規作成メールに設定されている送信宛先が、推定手段によって推定された送信宛先に含まれないことを検出する検出手段とを更に備えてもよい。この宛先推定装置によると、新規作成メールが誤った宛先に送信される可能性があることを検出することができる。 Further, the destination estimation apparatus according to the first feature includes a comparison unit that compares the transmission destination estimated by the estimation unit with a transmission destination set in the newly created mail, and a newly created mail based on the result of the comparison unit. And a detecting means for detecting that the transmission destination set in is not included in the transmission destination estimated by the estimating means. According to this destination estimation device, it is possible to detect that a newly created mail may be transmitted to an incorrect destination.
又、上記の宛先推定装置は、検出手段によって検出が行われた場合、その旨を出力装置に表示する確認手段とを更に備えてもよい。この宛先推定装置によると、新規作成メールが誤った宛先に送信される可能性があることを表示することにより、その旨をユーザに認識させることができる。 In addition, the destination estimation apparatus may further include confirmation means for displaying, when detection is performed by the detection means, on the output device. According to this destination estimation apparatus, by displaying that there is a possibility that a newly created mail may be sent to an incorrect destination, it is possible to make the user recognize that fact.
又、第1の特徴に係る宛先推定装置は、推定手段によって推定された送信宛先を出力装置に表示する支援手段を更に備えてもよい。この宛先推定装置によると、新規作成メールの送信宛先を表示された送信宛先から選択することにより、新規作成メールを誤った宛先に送信することを防止することができる。 The destination estimation apparatus according to the first feature may further include support means for displaying the transmission destination estimated by the estimation means on the output device. According to this destination estimation device, it is possible to prevent the newly created mail from being sent to the wrong destination by selecting the transmission destination of the newly created mail from the displayed transmission destinations.
本発明の第2の特徴は、新規作成メールの送信宛先を推定する宛先推定方法であって、(イ)複数の既送信メール及び新規作成メールの特徴量を抽出するステップと、(ロ)特徴量に基づいて、送信宛先毎の所定のパラメータを算出するステップと、(ハ)既送信メールから算出された所定のパラメータと、新規作成メールから抽出された特徴量とを用いて、新規作成メールの送信宛先を推定するステップとを含む宛先推定方法であることを要旨とする。 A second feature of the present invention is a destination estimation method for estimating a transmission destination of a newly created mail, wherein (a) a feature amount of a plurality of already sent emails and newly created emails is extracted; A step of calculating a predetermined parameter for each transmission destination based on the amount, (c) a newly created mail using a predetermined parameter calculated from the already sent mail and a feature amount extracted from the newly created mail And a step of estimating the transmission destination of the destination.
第2の特徴に係る宛先推定方法によると、新規作成メールの送信宛先を推定することにより、送信要求を行う段階で、誤った宛先にメールを送信することを防止することができる。 According to the destination estimation method according to the second feature, by estimating the transmission destination of a newly created mail, it is possible to prevent the mail from being sent to an incorrect destination at the stage of making a transmission request.
本発明によると、送信要求を行う段階で、誤った宛先にメールを送信することを防止する宛先推定装置及び宛先推定方法を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the destination estimation apparatus and destination estimation method which prevent sending a mail to an incorrect destination at the step of performing a transmission request can be provided.
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一又は類似の部分には、同一又は類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。 Next, embodiments of the present invention will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals. However, it should be noted that the drawings are schematic.
<第1の実施の形態>
第1の実施の形態では、所定のパラメータ及び特徴量を用いて、新規作成メールの送信宛先を推定し、新規作成メールに設定されている送信宛先が誤っている可能性があることを表示する宛先推定装置及び宛先推定方法について説明する。
<First Embodiment>
In the first embodiment, a transmission destination of a newly created mail is estimated using predetermined parameters and feature amounts, and it is displayed that there is a possibility that the transmission destination set in the newly created mail is incorrect. A destination estimation apparatus and a destination estimation method will be described.
第1の実施の形態では、NB(ナイーブ・ベイズ)の手法を用いて、送信宛先を推定する例について説明する。 In the first embodiment, an example in which a transmission destination is estimated using an NB (Naive Bayes) technique will be described.
(宛先推定装置)
第1の実施の形態に係る宛先推定装置1は、図1に示すように、通信手段11と、特徴量抽出手段12と、推定手段13と、比較手段14と、検出手段15と、確認手段16と、学習手段17とを備える。
(Destination estimation device)
As shown in FIG. 1, the
又、第1の実施の形態に係る宛先推定装置1は、処理制御装置(CPU)を有し、通信手段11、特徴量抽出手段12、推定手段13、比較手段14、検出手段15、確認手段16、学習手段17などをモジュールとしてCPUに内蔵する構成とすることができる。これらのモジュールは、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。又、処理制御装置(CPU)10には、記憶装置21、入力装置22、出力装置23が接続されている。
The
通信手段11は、通信ネットワーク(インターネット等)を介し、新規作成メールを送信する。 The communication means 11 transmits a newly created mail via a communication network (Internet or the like).
特徴量抽出手段12は、複数の既送信メール及び新規作成メールの特徴量を抽出し、特徴量を記憶装置21に保存する。ここで、「特徴量」とは、単語の出現頻度、メールのフォーマット、メールのプロファイルなどを抽出する。メールのプロファイルとは、例えば、メールの送信時刻やファイル容量、添付ファイルの種類、メールヘッダ、SMTPヘッダ(CC、BCCを含む)など送信メールに関するすべての情報を含む。即ち、特徴量抽出手段12は、V種類の特徴量をメールから抽出する。特徴量は、一定の要素数(ここでは、V個)を有するベクトルとして表される。以下において、学習メール(既送信メール)の特徴量をV個並べた特徴量ベクトルをxと表し、判別メール(新規作成メール)の特徴量をV個並べた特徴量ベクトルをx’と表す。
The feature
又、学習メール(既送信メール)数をN通、送信宛先の種類をL種類とし、メールから抽出する特徴量の種類毎に付与した番号をn、送信宛先毎に付与した番号をlとする。l番目の送信宛先に属する学習メール(既送信メール)の特徴量をX(l)で表す。nを学習メール(既送信メール)毎に付与した番号、vをメールから抽出する特徴量の種類毎に付与した番号とすると、特徴量X(l)は、各要素x(l) (n,v)からなるマトリクスで表される。 In addition, the number of learning emails (sent emails) is N, the type of destination is L, the number assigned for each type of feature extracted from the email is n, and the number assigned for each destination is l. . The characteristic amount of the learning mail (sent mail) belonging to the l-th transmission destination is represented by X (l) . If n is a number assigned to each learning email (sent email) and v is a number assigned to each type of feature extracted from the email, the feature X (l) is the element x (l) (n, v) .
学習手段17(パラメータ算出手段)は、式(1)を用いて、特徴量抽出手段12によって抽出された特徴量に基づいて、学習パラメータΘを算出し、学習パラメータを記憶装置21に保存する。Vを特徴量の最大次元、Lを送信宛先の種類の数とすると、学習パラメータΘは、学習パラメータの要素θ(v,l)をV×L個並べたマトリクスで表される。
式(1)において、lは既知の送信宛先の番号、Lは送信宛先の種類の数、N(l)はl番目の送信宛先に属する学習メール(既送信メール)の数、vは特徴量の次元の番号、Vは特徴量の最大次元数、x(l) (n,v)はl番目の送信宛先に属するn番目の学習メール(既送信メール)のv番目の次元の特徴量、γは任意の値、θ(v,l)はl番目の送信宛先に属する特徴量のv番目の次元における学習パラメータである。 In equation (1), l is a known destination number, L is the number of destination types, N (l) is the number of learning emails (sent emails) belonging to the lth destination, and v is a feature quantity. , V is the maximum number of dimensions of the feature quantity, x (l) (n, v) is the feature quantity of the vth dimension of the nth learning mail (sent mail) belonging to the lth destination, γ is an arbitrary value, and θ (v, l) is a learning parameter in the v th dimension of the feature quantity belonging to the l th transmission destination.
上記の説明において、v、l、n(小文字)は変数であり、V、L、N(大文字)は固定値である。又、x、x’(小文字)は、ベクトルであり、X及びΘ(大文字)は、マトリクスである。 In the above description, v, l, and n (lowercase) are variables, and V, L, and N (uppercase) are fixed values. X and x '(lower case) are vectors, and X and Θ (upper case) are matrices.
具体的には、学習手段17(パラメータ算出手段)は、式(1)を用いて、l番目の送信宛先に属する特徴量のv番目の次元の学習パラメータθ (v,l)を算出する。 Specifically, the learning unit 17 (parameter calculation unit) calculates the learning parameter θ (v, l) of the v-th dimension of the feature quantity belonging to the l-th transmission destination using the equation (1).
推定手段13は、新規作成メールについて、式(2)を用いて、学習手段17(パラメータ算出手段)によって算出された学習パラメータと、新規作成メールから抽出された特徴量とを用いて、新規作成メールの送信宛先を推定する
式(2)において、x’(v)は判別メール(新規作成メール)のv番目の次元の特徴量、F(l)は判別メール(新規作成メール)がl番目の送信宛先に属する度合いを示す判別値である。 In Equation (2), x ′ (v) is the feature quantity of the vth dimension of the discrimination mail (newly created mail), and F (l) is the degree to which the discrimination mail (newly created mail) belongs to the lth destination. This is the discriminant value shown.
具体的には、推定手段13は、l番目の送信宛先に属する特徴量のv番目の次元の学習パラメータθ (v,l)を用いて、判別メール(新規作成メール)のv番目の特徴量x’(v)が、l番目の送信宛先に属する度合いを示すF(l)の値を算出する。ここで、F(l)の値が大きいほど、判別メール(新規作成メール)の送信宛先は、l番目の送信宛先である確率が高いと判断する。 Specifically, the estimation means 13 uses the learning parameter θ (v, l) of the v th dimension of the feature amount belonging to the l th transmission destination, and uses the v th feature amount of the discrimination mail (newly created mail). The value of F (l) indicating the degree to which x ′ (v) belongs to the l-th transmission destination is calculated. Here, it is determined that the larger the value of F (l), the higher the probability that the transmission destination of the discrimination mail (newly created mail) is the lth transmission destination.
このように、式(2)によるF(l)の算出をL回行えば、F(l)の値に応じて、新規作成メールの送信宛先がL種類の送信宛先のどれに属するかを順位付けて判別することができる。 In this way, if F (l) is calculated L times using equation (2), according to the value of F (l) , which of the L types of destinations the transmission destination of the newly created mail belongs to It can be distinguished.
又、推定手段13は、一つの送信宛先候補を推定するだけでなく、複数の送信宛先候補を推定することとしてもよい。複数の送信宛先候補を挙げるためには、F(l)の値をソートして上位いくつかの送信宛先を候補とするか、もしくはF(l)の値に任意の閾値を設定して、閾値以上となる送信宛先を候補としてもよい。 Further, the estimation means 13 may estimate not only one transmission destination candidate but also a plurality of transmission destination candidates. In order to list a plurality of transmission destination candidates, sort the values of F (l) to make the top several transmission destinations candidates, or set an arbitrary threshold for the value of F (l) The above transmission destination may be a candidate.
尚、新規作成メールに複数の送信宛先が設定されている場合は、推定手段13は、それぞれの送信宛先に対して推定を行う。
When a plurality of transmission destinations are set in the newly created mail, the
比較手段14は、推定手段13によって推定された送信宛先と、新規作成メールに設定されている送信宛先とを比較する。具体的には、比較手段14は、新規送信メールの送信宛先の推定結果であるl番目の送信宛先について、送信宛先番号と送信宛先との対応表を元に、送信宛先へ変換し、新規作成メールに設定されている送信宛先と比較できるようにする。尚、新規作成メールに複数の送信宛先が設定されている場合は、比較手段14は、それぞれの送信宛先に対して比較を行う。
The
検出手段15は、比較手段14の結果から、新規作成メールに設定されている送信宛先が、推定手段13によって推定された送信宛先に含まれないことを検出する。新規作成メールに複数の送信宛先が設定されている場合は、検出手段15は、その一部が推定された送信宛先に含まれないことを検出する。
The
確認手段16は、検出手段15によって検出が行われた場合、その旨を出力装置23に表示する。例えば、図3に示すような確認画面を表示してもよい。
When the
記憶装置21は、特徴量、所定の学習パラメータ、判定値、送信宛先候補などを保存する記録媒体である。記録媒体は、例えば、RAM、ROM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。又、記憶装置21は、特徴量の抽出処理やパラメータの算出処理、送信宛先の推定処理などを処理制御装置(CPU)10に実行させるための宛先推定プログラムを保存してもよい。このような記録媒体によれば、特徴量、学習パラメータなどのデータ、あるいはプログラムの保存、運搬、販売などを容易に行うことができる。
The
入力装置22は、キーボード、マウス等の機器を指す。入力装置22から入力操作が行われると対応するキー情報が処理制御装置(CPU)10に伝達される。入力装置22は、メール本文や送信宛先などを入力することができる。
The
出力装置23は、モニタなどの画面を指し、液晶表示装置(LCD)、発光ダイオード(LED)パネル、エレクトロルミネッセンス(EL)パネル等が使用可能である。出力装置23は、新規作成メールの送信宛先が誤っている可能性がある場合、その旨を表示することができる。
The
(宛先推定方法)
次に、第1の実施形態に係る宛先推定装置を用いた宛先推定方法について、図2及び図3を用いて説明する。
(Destination estimation method)
Next, a destination estimation method using the destination estimation apparatus according to the first embodiment will be described with reference to FIGS.
図2は、新規作成メールを作成し、送信する際のフローチャートであるが、この前提として、既送信メールの特徴量に基づいて、送信宛先毎の複数の所定の学習パラメータが算出されている。 FIG. 2 is a flowchart for creating and sending a newly created mail. As a premise, a plurality of predetermined learning parameters for each transmission destination are calculated based on the feature amount of the sent mail.
(イ)まず、ステップS101において、新規作成メールを作成し、そのメールの送信宛先を設定する。 (A) First, in step S101, a newly created mail is created and a transmission destination of the mail is set.
(ロ)次に、ステップS102において、新規作成メールの送信指示を出した場合に、新規作成メールから特徴量を抽出する。 (B) Next, in step S102, when an instruction to send a newly created mail is issued, feature amounts are extracted from the newly created mail.
(ハ)次に、ステップS103において、既送信メールから算出されたパラメータと、新規作成メールから抽出された特徴量とを用いて、新規作成メールの送信宛先を推定する。この推定される送信宛先は、一つとは限らず複数の宛先を推定しても構わない。又、その際、複数の送信宛先に対して、該当する可能性が高い送信宛先に順位を付しておいてもよい。 (C) Next, in step S103, the transmission destination of the newly created mail is estimated using the parameter calculated from the already sent mail and the feature amount extracted from the newly created mail. The estimated transmission destination is not limited to one, and a plurality of destinations may be estimated. Further, at that time, a plurality of transmission destinations may be given a ranking to transmission destinations having a high possibility of corresponding.
(ニ)次に、ステップS104において、推定された送信宛先と、新規作成メールに設定されている送信宛先とを比較する。 (D) Next, in step S104, the estimated transmission destination is compared with the transmission destination set in the newly created mail.
(ホ)次に、ステップS105において、ステップS104における比較結果から、新規作成メールに設定されている送信宛先が、推定された送信宛先に含まれるか否か判断する。含まれる場合は、ステップS108に進み、新規作成メールを設定されている送信宛先へ送信する。 (E) Next, in step S105, it is determined from the comparison result in step S104 whether or not the transmission destination set in the newly created mail is included in the estimated transmission destination. If it is included, the process proceeds to step S108, and the newly created mail is transmitted to the set transmission destination.
(へ)ステップS105において、推定宛先に含まれない場合は、ステップS106に進み、設定されている送信宛先が誤っている可能性がある旨を出力装置に表示する。例えば、新規作成メールに設定されている送信宛先が「A田B子」であるが、推定宛先に「A田B子」が含まれない場合、図3に示すように、メールの送信を行ってよいか否か確認の画面が表示される。 (F) If it is not included in the estimated destination in step S105, the process proceeds to step S106, and a message indicating that the set transmission destination may be incorrect is displayed on the output device. For example, when the transmission destination set in the newly created mail is “A field B child” but the estimated address does not include “A field B child”, the mail is transmitted as shown in FIG. A confirmation screen is displayed.
(へ)ステップS107において、送信宛先が正しい場合は、図3において「Yes」ボタンが押下され、ステップS108に進み、新規作成メールを設定されている送信宛先へ送信する。一方、送信宛先が誤っている場合は、図3において「No」ボタンが押下され、ステップS101に戻り、メールの編集画面あるいは送信宛先の編集画面が表示され、再び宛先の設定をやり直す。 (F) If the transmission destination is correct in step S107, the “Yes” button in FIG. 3 is pressed, and the flow advances to step S108 to transmit the newly created mail to the set transmission destination. On the other hand, if the transmission destination is incorrect, the “No” button in FIG. 3 is pressed, the process returns to step S101, the mail editing screen or the transmission destination editing screen is displayed, and the destination setting is performed again.
(ト)次に、ステップS109において、送信メールと送信宛先と新規作成メールの特徴量を記憶装置21に格納する。
(G) Next, in step S109, the feature quantities of the outgoing mail, the outgoing address, and the newly created mail are stored in the
(チ)次に、ステップS110において、送信したメールに関する学習パラメータを算出する。 (H) Next, in step S110, learning parameters relating to the transmitted mail are calculated.
(作用及び効果)
第1の実施の形態に係る宛先推定装置及び宛先推定方法によると、所定のパラメータ及び特徴量を用いて、新規作成メールの送信宛先を推定し、新規作成メールに設定されている送信宛先が誤っている可能性があることを表示し、その旨をユーザに認識させることができる。このため、送信要求を行う段階で、誤った宛先にメールを送信することを防止することができる。従って、送信者の意図しない情報漏洩を防止することができる。又、無駄な通信トラフィックの発生を防止することができる。
(Action and effect)
According to the destination estimation apparatus and the destination estimation method according to the first embodiment, the transmission destination of a newly created mail is estimated using predetermined parameters and feature amounts, and the transmission destination set in the newly created mail is incorrect. Can be displayed, and the user can be made aware of this. For this reason, it is possible to prevent a mail from being sent to an incorrect destination at the stage of making a transmission request. Therefore, information leakage unintended by the sender can be prevented. In addition, it is possible to prevent generation of useless communication traffic.
又、第1の実施形態に係る宛先推定装置及び宛先推定方法によると、上述した式(1)を用いて、所定のパラメータを算出し、式(2)によって得られた判別値が最も大きい送信宛先を、新規作成メールの宛先候補として推定することができる。式(1)及び式(2)は、いわゆるNB(ナイーブ・ベイズ)の手法であり、新規作成メールの送信宛先が既知の送信宛先に該当する確率を、複数の既知の送信宛先それぞれに算出することができ、かつ、処理速度が早いという利点を有する。又、過学習(学習データに対する誤差が減少する反面、未学習データに対する誤差が増加する現象)に対する問題も発生し難い。 Also, according to the destination estimation apparatus and destination estimation method according to the first embodiment, a predetermined parameter is calculated using the above-described equation (1), and the transmission with the largest discriminant value obtained by the equation (2) is performed. The destination can be estimated as a destination candidate for a newly created mail. Expressions (1) and (2) are so-called NB (Naive Bayes) techniques, and the probability that the transmission destination of a newly created mail corresponds to a known transmission destination is calculated for each of the plurality of known transmission destinations. And has an advantage of high processing speed. In addition, a problem with over-learning (a phenomenon in which an error with respect to learning data decreases while an error with respect to unlearned data increases) hardly occurs.
<第2の実施の形態>
第2の実施の形態では、所定のパラメータ及び特徴量を用いて、新規作成メールの送信宛先を推定し、新規作成メールの送信宛先を表示された送信宛先から選択する宛先推定装置及び宛先推定方法について説明する。
<Second Embodiment>
In the second embodiment, a destination estimation apparatus and destination estimation method for estimating a transmission destination of a newly created mail using a predetermined parameter and feature amount, and selecting a transmission destination of the newly created mail from the displayed transmission destinations Will be described.
第2の実施の形態においても、NB(ナイーブ・ベイズ)の手法を用いて、送信宛先を推定する例について説明する。 Also in the second embodiment, an example in which a transmission destination is estimated using an NB (Naive Bayes) technique will be described.
(宛先推定装置)
第2の実施の形態に係る宛先推定装置1は、図4に示すように、通信手段11と、特徴量抽出手段12と、推定手段13と、学習手段17と、支援手段18とを備える。
(Destination estimation device)
As illustrated in FIG. 4, the
又、第2の実施の形態に係る宛先推定装置1は、処理制御装置(CPU)を有し、通信手段11、特徴量抽出手段12、推定手段13、学習手段17、支援手段18などをモジュールとしてCPUに内蔵する構成とすることができる。これらのモジュールは、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。又、処理制御装置(CPU)10には、記憶装置21、入力装置22、出力装置23が接続されている。
The
通信手段11、特徴量抽出手段12、推定手段13、学習手段17については、第1の実施の形態と同様であるので、ここでは説明を省略する。
Since the
支援手段18は、推定手段13によって推定された送信宛先を出力装置23に表示する。具体的には、支援手段18は、図6に示すように、画面上にウィンドウで宛先候補をリストアップして、出力装置23に表示する。そして、入力装置22によって選択された送信宛先を新規送信メールの送信宛先として受け付ける。又、推定手段13により、複数の送信宛先が推定され、宛先候補に優先度が付けられた場合、優先度の高い候補順に表示を行ったり、優先度を付した表示を行ったりしてもよい。
The
尚、推定された送信宛先ではなく、宛先入力ボックスに直接宛先が設定された場合は、設定された送信宛先を新規送信メールの送信宛先として受け付ける。 When the destination is directly set in the destination input box instead of the estimated transmission destination, the set transmission destination is accepted as the transmission destination of the new transmission mail.
記憶装置21は、特徴量、所定の学習パラメータ、判定値、送信宛先候補などを保存する記録媒体である。記録媒体は、例えば、RAM、ROM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。又、記憶装置21は、特徴量の抽出処理やパラメータの算出処理、送信宛先の推定処理などを処理制御装置(CPU)10に実行させるための宛先推定プログラムを保存してもよい。このような記録媒体によれば、特徴量、学習パラメータなどのデータ、あるいはプログラムの保存、運搬、販売などを容易に行うことができる。
The
入力装置22は、キーボード、マウス等の機器を指す。入力装置22から入力操作が行われると対応するキー情報が処理制御装置(CPU)10に伝達される。入力装置22は、メール本文や送信宛先などを入力することができる。
The
出力装置23は、モニタなどの画面を指し、液晶表示装置(LCD)、発光ダイオード(LED)パネル、エレクトロルミネッセンス(EL)パネル等が使用可能である。出力装置23は、推定手段13によって推定された送信宛先を表示することができる。
The
(宛先推定方法)
次に、第2の実施形態に係る宛先推定装置を用いた宛先推定方法について、図5及び図6を用いて説明する。
(Destination estimation method)
Next, a destination estimation method using the destination estimation apparatus according to the second embodiment will be described with reference to FIGS.
図5は、新規作成メールを作成し、送信する際のフローチャートであるが、この前提として、既送信メールの特徴量に基づいて、送信宛先毎の複数の所定の学習パラメータが算出されている。 FIG. 5 is a flowchart for creating and sending a newly created mail. As a precondition, a plurality of predetermined learning parameters for each transmission destination are calculated based on the feature amount of the already sent mail.
(イ)まず、ステップS201〜S203の処理は、図3のステップS101〜S103と同様であるので、ここでは説明を省略する。 (A) First, the processing in steps S201 to S203 is the same as that in steps S101 to S103 in FIG.
(ロ)次に、ステップS204において、推定された送信宛先を出力装置に表示する。例えば、図6に示すように、画面上にウィンドウで宛先候補をリストアップして、出力装置に表示する。 (B) Next, in step S204, the estimated transmission destination is displayed on the output device. For example, as shown in FIG. 6, destination candidates are listed in a window on the screen and displayed on the output device.
(ハ)次に、ステップS205において、入力装置によって、リストアップされた宛先候補から新規送信メールの送信宛先を選択する。あるいは、宛先入力ボックスに直接宛先を入力する。 (C) Next, in step S205, the input device selects a transmission destination of the new transmission mail from the listed destination candidates. Alternatively, the destination is directly input into the destination input box.
(ニ)次に、ステップS206において、リストアップされた宛先候補から送信宛先が選択された場合は、新規作成メールを選択された送信宛先へ送信する。宛先入力ボックスに送信宛先が入力された場合は、新規作成メールを設定された送信宛先へ送信する。 (D) Next, in step S206, when a transmission destination is selected from the listed destination candidates, a newly created mail is transmitted to the selected transmission destination. When a transmission destination is entered in the destination input box, a newly created mail is transmitted to the set transmission destination.
(ホ)ステップS207〜S208の処理は、図3のステップS109〜S110と同様であるので、ここでは説明を省略する。 (E) Steps S207 to S208 are the same as steps S109 to S110 in FIG.
(作用及び効果)
第2の実施の形態に係る宛先推定装置及び宛先推定方法によると、所定のパラメータ及び特徴量を用いて、新規作成メールの送信宛先を推定し、新規作成メールの送信宛先を表示された送信宛先から選択することができる。このため、送信要求を行う段階で、誤った宛先にメールを送信することを防止することができる。従って、送信者の意図しない情報漏洩を防止することができる。又、無駄な通信トラフィックの発生を防止することができる。
(Action and effect)
According to the destination estimation apparatus and the destination estimation method according to the second embodiment, the transmission destination of the newly created mail is displayed by estimating the transmission destination of the newly created mail using the predetermined parameters and feature amounts. You can choose from. For this reason, it is possible to prevent a mail from being sent to an incorrect destination at the stage of making a transmission request. Therefore, information leakage unintended by the sender can be prevented. In addition, it is possible to prevent generation of useless communication traffic.
<その他の実施の形態>
本発明は上記の実施の形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。
<Other embodiments>
Although the present invention has been described according to the above-described embodiments, it should not be understood that the descriptions and drawings constituting a part of this disclosure limit the present invention. From this disclosure, various alternative embodiments, examples and operational techniques will be apparent to those skilled in the art.
例えば、第1〜第2の実施の形態に係る宛先推定装置において、学習手段、推定手段、比較手段はNBの手法を用いてパラメータを取得し、送信メールの推定を行ったが、他のアルゴリズムを用いてこれらの処理を行っても構わない。例えば、SVM(サポート・ベクター・マシン)、kNN(kニアレスト・ネイバー)、LVA(ラーニング・ベクター・クォンタイゼーション)などを用いて、送信メールの特徴量の統計的性質を獲得し、既送信メールの特徴量の統計的性質と新規送信メールの特徴量との比較を行うことによって、所望の機能を実現しても構わない。 For example, in the destination estimation apparatus according to the first to second embodiments, the learning unit, the estimation unit, and the comparison unit acquire parameters using the NB technique and perform estimation of the outgoing mail. You may perform these processes using. For example, by using SVM (Support Vector Machine), kNN (k Nearest Neighbor), LVA (Learning Vector Quantization), etc., the statistical characteristics of the sent mail's features can be obtained and sent mail The desired function may be realized by comparing the statistical property of the feature quantity with the feature quantity of the newly sent mail.
又、第1〜第2の実施の形態に係る宛先推定装置1は、通信手段11と、特徴量抽出手段12と、推定手段13と、学習手段17などをモジュールとしてCPUに内蔵する構成とすることができると説明したが、それらが二つあるいはそれ以上のCPUに分かれていても構わない。その際はそれらのCPU間でデータのやりとりが行えるようにバスなどで装置間を接続しているとする。
The
このように、本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。 As described above, the present invention naturally includes various embodiments not described herein. Therefore, the technical scope of the present invention is defined only by the invention specifying matters according to the scope of claims reasonable from the above description.
1 宛先推定装置
10 処理制御装置(CPU)
11 通信手段
12 特徴量抽出手段
13 推定手段
14 比較手段
15 検出手段
16 確認手段
17 学習手段
21 記憶装置
22 入力装置
23 出力装置
DESCRIPTION OF
DESCRIPTION OF
Claims (5)
複数の既送信メール及び前記新規作成メールの特徴量を抽出する特徴量抽出手段と、
前記特徴量に基づいて、送信宛先毎の所定のパラメータを算出するパラメータ算出手段と、
前記既送信メールから算出された所定のパラメータと、前記新規作成メールから抽出された特徴量とを用いて、前記新規作成メールの送信宛先を推定する推定手段と
を備えることを特徴とする宛先推定装置。 A destination estimation device for estimating a destination of a newly created mail,
A feature quantity extracting means for extracting feature quantities of a plurality of sent mails and the newly created mail;
Parameter calculating means for calculating a predetermined parameter for each transmission destination based on the feature amount;
Destination estimation, comprising: an estimation unit configured to estimate a transmission destination of the newly created mail using a predetermined parameter calculated from the already sent mail and a feature amount extracted from the newly created mail apparatus.
前記比較手段の結果から、前記新規作成メールに設定されている送信宛先が、前記推定手段によって推定された送信宛先に含まれないことを検出する検出手段と
を更に備えることを特徴とする請求項1に記載の宛先推定装置。 Comparison means for comparing the transmission destination estimated by the estimation means and the transmission destination set in the newly created mail;
The detection means for detecting that the transmission destination set in the newly created mail is not included in the transmission destination estimated by the estimation means from the result of the comparison means. The destination estimation apparatus according to 1.
複数の既送信メール及び前記新規作成メールの特徴量を抽出するステップと、
前記特徴量に基づいて、送信宛先毎の所定のパラメータを算出するステップと、
前記既送信メールから算出された所定のパラメータと、前記新規作成メールから抽出された特徴量とを用いて、前記新規作成メールの送信宛先を推定するステップと
を含むことを特徴とする宛先推定方法。
A destination estimation method for estimating a destination of a newly created mail,
Extracting a plurality of sent mails and feature quantities of the newly created mails;
Calculating a predetermined parameter for each transmission destination based on the feature amount;
Estimating a transmission destination of the newly created mail by using a predetermined parameter calculated from the already sent mail and a feature amount extracted from the newly created mail. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004056706A JP2005250594A (en) | 2004-03-01 | 2004-03-01 | Address estimation device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004056706A JP2005250594A (en) | 2004-03-01 | 2004-03-01 | Address estimation device and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005250594A true JP2005250594A (en) | 2005-09-15 |
Family
ID=35031045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004056706A Pending JP2005250594A (en) | 2004-03-01 | 2004-03-01 | Address estimation device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005250594A (en) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007087327A (en) * | 2005-09-26 | 2007-04-05 | Ntt Software Corp | Electronic mail processing program |
JP2007108881A (en) * | 2005-10-11 | 2007-04-26 | Sony Ericsson Mobilecommunications Japan Inc | Personal digital assistance, character input support program and method |
JP2007157152A (en) * | 2005-12-05 | 2007-06-21 | Nec Corp | Method and apparatus for identifying potential recipient candidate |
JP2007293635A (en) * | 2006-04-25 | 2007-11-08 | Ntt Communications Kk | Mail missending prevention system, mail missending prevention method and mail missending prevention program |
JP2008097108A (en) * | 2006-10-06 | 2008-04-24 | Ntt Communications Kk | Message destination confirmation apparatus, message destination confirmation method and message destination confirmation program |
JP2009015775A (en) * | 2007-07-09 | 2009-01-22 | Canon Inc | Display processing device and display processing method |
JP2009187077A (en) * | 2008-02-04 | 2009-08-20 | Nec Corp | Recommendation information providing apparatus, recommendation information providing method, recommendation information providing system, and recommendation information providing program |
JP2009223392A (en) * | 2008-03-13 | 2009-10-01 | Toshiba Corp | Information sharing device and information sharing program |
JP2011204278A (en) * | 2011-07-11 | 2011-10-13 | Ntt Communications Kk | Message transmission address confirmation device, message transmission address confirmation method, message transmission address confirmation program |
US8090781B2 (en) | 2006-11-14 | 2012-01-03 | Sony Ericsson Mobile Communications Ab | Communication terminal, and destination-address right/wrong determining method and program thereof |
JP2014087023A (en) * | 2012-10-26 | 2014-05-12 | Canon Marketing Japan Inc | Information processing device, control method therefor, and program |
JP2018101351A (en) * | 2016-12-21 | 2018-06-28 | キヤノンマーケティングジャパン株式会社 | Information processing device, information processing method, and program |
JP6359786B1 (en) * | 2018-04-23 | 2018-07-18 | 株式会社ドリコム | Terminal, terminal control method, and program |
US10863039B2 (en) | 2019-03-22 | 2020-12-08 | Fuji Xerox Co., Ltd. | Information processing apparatus that outputs parameter on basis of learning result |
-
2004
- 2004-03-01 JP JP2004056706A patent/JP2005250594A/en active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4703333B2 (en) * | 2005-09-26 | 2011-06-15 | エヌ・ティ・ティ・ソフトウェア株式会社 | E-mail processing program |
JP2007087327A (en) * | 2005-09-26 | 2007-04-05 | Ntt Software Corp | Electronic mail processing program |
JP2007108881A (en) * | 2005-10-11 | 2007-04-26 | Sony Ericsson Mobilecommunications Japan Inc | Personal digital assistance, character input support program and method |
JP2007157152A (en) * | 2005-12-05 | 2007-06-21 | Nec Corp | Method and apparatus for identifying potential recipient candidate |
JP2007293635A (en) * | 2006-04-25 | 2007-11-08 | Ntt Communications Kk | Mail missending prevention system, mail missending prevention method and mail missending prevention program |
JP2008097108A (en) * | 2006-10-06 | 2008-04-24 | Ntt Communications Kk | Message destination confirmation apparatus, message destination confirmation method and message destination confirmation program |
US8090781B2 (en) | 2006-11-14 | 2012-01-03 | Sony Ericsson Mobile Communications Ab | Communication terminal, and destination-address right/wrong determining method and program thereof |
JP2009015775A (en) * | 2007-07-09 | 2009-01-22 | Canon Inc | Display processing device and display processing method |
JP2009187077A (en) * | 2008-02-04 | 2009-08-20 | Nec Corp | Recommendation information providing apparatus, recommendation information providing method, recommendation information providing system, and recommendation information providing program |
JP2009223392A (en) * | 2008-03-13 | 2009-10-01 | Toshiba Corp | Information sharing device and information sharing program |
JP4719234B2 (en) * | 2008-03-13 | 2011-07-06 | 株式会社東芝 | Information sharing apparatus and information sharing program |
JP2011204278A (en) * | 2011-07-11 | 2011-10-13 | Ntt Communications Kk | Message transmission address confirmation device, message transmission address confirmation method, message transmission address confirmation program |
JP2014087023A (en) * | 2012-10-26 | 2014-05-12 | Canon Marketing Japan Inc | Information processing device, control method therefor, and program |
JP2018101351A (en) * | 2016-12-21 | 2018-06-28 | キヤノンマーケティングジャパン株式会社 | Information processing device, information processing method, and program |
JP6359786B1 (en) * | 2018-04-23 | 2018-07-18 | 株式会社ドリコム | Terminal, terminal control method, and program |
JP2019191790A (en) * | 2018-04-23 | 2019-10-31 | 株式会社ドリコム | Terminal and control method of terminal and program |
US10863039B2 (en) | 2019-03-22 | 2020-12-08 | Fuji Xerox Co., Ltd. | Information processing apparatus that outputs parameter on basis of learning result |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11601450B1 (en) | Suspicious message report processing and threat response | |
US7249162B2 (en) | Adaptive junk message filtering system | |
EP3369219B1 (en) | Predictive responses to incoming communications | |
US9906539B2 (en) | Suspicious message processing and incident response | |
JP2005250594A (en) | Address estimation device and method | |
US8301719B2 (en) | Employing pixel density to detect a spam image | |
US8069128B2 (en) | Real-time ad-hoc spam filtering of email | |
WO2016164844A1 (en) | Message report processing and threat prioritization | |
EP3281144B1 (en) | Message report processing and threat prioritization | |
US8577826B2 (en) | Automated document separation | |
US20120246243A1 (en) | Electronic mail system, user terminal apparatus, information providing apparatus, and computer readable medium | |
JP2008083917A (en) | System for preventing missending of email, and missending prevention program | |
JP4746083B2 (en) | Address correctness determination system | |
JP7263721B2 (en) | Information processing device and program | |
US10439971B1 (en) | System for detecting erroneous communications | |
JP2003223403A (en) | Information transmission method, information reception method and information transmission program | |
JP2010134810A (en) | System for determination of address correctness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090210 |