JP2022031421A - Information processor, method for processing information, and program - Google Patents
Information processor, method for processing information, and program Download PDFInfo
- Publication number
- JP2022031421A JP2022031421A JP2021210163A JP2021210163A JP2022031421A JP 2022031421 A JP2022031421 A JP 2022031421A JP 2021210163 A JP2021210163 A JP 2021210163A JP 2021210163 A JP2021210163 A JP 2021210163A JP 2022031421 A JP2022031421 A JP 2022031421A
- Authority
- JP
- Japan
- Prior art keywords
- combination
- transmission
- address
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 16
- 238000012545 processing Methods 0.000 title description 5
- 230000005540 biological transmission Effects 0.000 claims abstract description 127
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 230000010365 information processing Effects 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 2
- 230000002265 prevention Effects 0.000 description 24
- 238000013500 data storage Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。 The present invention relates to an information processing apparatus, an information processing method and a program.
電子メール(以降、単に「メール」とも表す。)の誤送信対策として、メールの送信履歴を用いて、送信対象のメールに設定されている送信先アドレスが、過去に送信したことのあるアドレスであるか否かを判定する技術が従来から知られている。このような技術では、例えば、過去に送信したことのあるアドレスへのメール送信は安全であり、過去に送信したことのないアドレスへのメール送信は危険(リスクがある)ものと判定している。 As a countermeasure against erroneous sending of e-mail (hereinafter, also referred to simply as "mail"), the destination address set for the e-mail to be sent is an address that has been sent in the past using the e-mail transmission history. A technique for determining the presence or absence has been conventionally known. With such technology, for example, it is determined that sending an email to an address that has been sent in the past is safe, and sending an email to an address that has not been sent in the past is dangerous (risk). ..
しかしながら、上記の従来技術では、同時送信(同報)が禁止されているメールアドレスが設定されている場合におけるメール送信を防止することができなかった。 However, with the above-mentioned conventional technique, it is not possible to prevent the transmission of an e-mail when an e-mail address for which simultaneous transmission (broadcasting) is prohibited is set.
例えば、同報が禁止されているメールアドレスを「メールアドレスA」及び「メールアドレスB」として、メールアドレスA及びメールアドレスBは共に過去に送信したことがあるアドレスであるとする。この場合、メールアドレスA及びメールアドレスBの両方を送信先アドレスに設定したメールは安全と判定され、メール送信を防止することができなかった。 For example, it is assumed that the e-mail addresses for which broadcasting is prohibited are "e-mail address A" and "e-mail address B", and both the e-mail address A and the e-mail address B are addresses that have been sent in the past. In this case, the e-mail in which both the e-mail address A and the e-mail address B are set as the destination address is determined to be safe, and the e-mail transmission cannot be prevented.
本発明は、上記の点に鑑みてなされたもので、同時送信が禁止されている宛先へのメール同時送信を防止することを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to prevent simultaneous transmission of e-mails to destinations for which simultaneous transmission is prohibited.
上記目的を達成するため、一実施形態に係る情報処理装置は、送信対象メールの宛先に設定されている複数のメールアドレスのうちの所定の個数の組み合わせ毎に、前記組み合わせに対する特徴量を算出する第1の算出手段と、前記第1の算出手段が算出した特徴量のうちの最大又は最小の特徴量を用いて、同報が禁止されている可能性があるメールアドレスの組み合わせが前記宛先に設定されていることを示す通知を送信する送信手段と、を有する。 In order to achieve the above object, the information processing apparatus according to the embodiment calculates the feature amount for each combination of a predetermined number of the plurality of e-mail addresses set as the destinations of the e-mails to be sent. A combination of an e-mail address that may be prohibited from broadcasting using the first calculation means and the maximum or minimum feature amount among the feature amounts calculated by the first calculation means is sent to the destination. It has a transmission means for transmitting a notification indicating that it is set.
同時送信が禁止されている宛先へのメール同時送信を防止することができる。 It is possible to prevent simultaneous sending of e-mails to destinations for which simultaneous sending is prohibited.
以下、本発明の実施の形態(以降、「本実施形態」とも表す。)について説明する。本実施形態では、同時送信が禁止されている宛先へのメール同時送信を防止することが可能なメール誤送信防止システム1について説明する。なお、本実施形態では、「宛先」とは、メールの送信先となるメールアドレスのことを指すものとする。したがって、宛先とは、メールのTo欄に設定されているメールアドレスと、Cc欄に設定されているメールアドレスと、Bcc欄に設定されているメールアドレスとを指すものとする。ただし、宛先は、メールのTo欄に設定されているメールアドレスと、Cc欄に設定されているメールアドレスと、Bcc欄に設定されているメールアドレスとのうちの少なくとも1つを指すものであってもよい。
Hereinafter, embodiments of the present invention (hereinafter, also referred to as “the present embodiments”) will be described. In the present embodiment, an e-mail erroneous
本実施形態では、過去のメールの送信履歴(以降では、「送信ログ」とも表す。)を用いて学習モデルを作成した上で、この学習モデルにより、同時送信が禁止されている可能性がある宛先の組み合わせが送信対象メールに設定されているか否かを判定する。これにより、同時送信が禁止されている可能性がある宛先へメールが送信されてしまう事態を防止することが可能となる。 In the present embodiment, there is a possibility that simultaneous transmission is prohibited by this learning model after creating a learning model using the transmission history of past emails (hereinafter, also referred to as "transmission log"). Determines whether the combination of recipients is set for the email to be sent. This makes it possible to prevent a situation in which an email is sent to a destination that may be prohibited from simultaneous transmission.
<同時送信が禁止されている可能性がある宛先>
ここで、本実施形態において、同時送信が禁止されている可能性がある宛先の組み合わせと判定される場合の一例について、図1を参照しながら説明する。図1は、同時送信が禁止されている可能性がある宛先の組み合わせの一例を説明するための図である。なお、図1中のA、B、C及びDはそれぞれメールアドレスを表す。
<Destinations where simultaneous transmission may be prohibited>
Here, an example in the case where it is determined that the combination of destinations may be prohibited from simultaneous transmission in the present embodiment will be described with reference to FIG. FIG. 1 is a diagram for explaining an example of a combination of destinations where simultaneous transmission may be prohibited. Note that A, B, C and D in FIG. 1 represent e-mail addresses, respectively.
図1に示すように、例えば、送信ログ中には、宛先としてメールアドレスA、メールアドレスB及びメールアドレスDが設定された宛先パターン1のメールと、宛先としてメールアドレスA、メールアドレスB及びメールアドレスCが設定された宛先パターン2のメールと、宛先としてメールアドレスA及びメールアドレスDが設定された宛先パターン3のメールと、宛先としてメールアドレスB及びメールアドレスCが設定された宛先パターン4のメールとが存在するものとする。
As shown in FIG. 1, for example, in the transmission log, an e-mail with a
このとき、本実施形態では、例えば、送信ログ中には存在しないメールアドレスの組み合わせ又は送信回数が少ないメールアドレスの組み合わせを、同時送信が禁止されている可能性がある宛先の組み合わせとする。図1に示す例では、メールアドレスCとメールアドレスDとの組み合わせは送信ログ中に存在しないため、この組み合わせを、同時送信が禁止されている可能性がある組み合わせとする。 At this time, in the present embodiment, for example, a combination of e-mail addresses that does not exist in the transmission log or a combination of e-mail addresses that are transmitted a small number of times is used as a combination of destinations that may be prohibited from simultaneous transmission. In the example shown in FIG. 1, since the combination of the e-mail address C and the e-mail address D does not exist in the transmission log, this combination is set as a combination in which simultaneous transmission may be prohibited.
なお、メールアドレスA、メールアドレスB、メールアドレスC及びメールアドレスDはそれぞれ単独では過去に送信されたことがあるメールアドレスである。このため、従来技術(例えば、送信対象メールに設定されている送信先アドレスが、過去に送信したことのあるアドレスであるか否かを判定する技術)では、メールアドレスCとメールアドレスDとが設定されているメールのメール送信は、安全なメール送信と判定される。 The e-mail address A, the e-mail address B, the e-mail address C, and the e-mail address D are e-mail addresses that have been sent in the past by themselves. Therefore, in the conventional technique (for example, a technique for determining whether or not the destination address set in the e-mail to be sent is an address that has been sent in the past), the e-mail address C and the e-mail address D are different. E-mail transmission of the set e-mail is determined to be safe e-mail transmission.
一方で、本実施形態では、過去に存在しない組み合わせ又は出現回数(若しくは出現頻度)が少ない組み合わせは、同時送信が禁止されている可能性があるメールアドレスの組み合わせとする。このため、メールアドレスCとメールアドレスDとが設定されているメールのメール送信を、誤送信リスクがあるメール送信と判定することができ、このようなメール送信を防止することが可能となる。 On the other hand, in the present embodiment, a combination that does not exist in the past or a combination that has a small number of appearances (or frequency of appearance) is a combination of e-mail addresses that may be prohibited from simultaneous transmission. Therefore, it is possible to determine that the e-mail transmission of the e-mail in which the e-mail address C and the e-mail address D are set is the e-mail transmission having a risk of erroneous transmission, and it is possible to prevent such an e-mail transmission.
<メール誤送信防止システム1の全体構成>
次に、本実施形態に係るメール誤送信防止システム1の全体構成について、図2を参照しながら説明する。図2は、本実施形態に係るメール誤送信防止システム1の全体構成の一例を示す図である。
<Overall configuration of email mis-
Next, the overall configuration of the mail erroneous
図2に示すように、本実施形態に係るメール誤送信防止システム1には、誤送信防止サーバ10と、1台以上のメール送受信端末20とが含まれる。誤送信防止サーバ10と、各メール送受信端末20とは、例えば社内LAN(Local Area Network)等の任意の通信ネットワークを介して通信可能に接続される。
As shown in FIG. 2, the mail erroneous
誤送信防止サーバ10は、メール送受信端末20からのメールを受信すると、予め作成した学習モデルを用いて、同時送信が禁止されている可能性があるメールアドレス(以降、「同時送信禁止アドレス」とも表す。)の組み合わせが当該メールの宛先に設定されているか否かを判定する。そして、誤送信防止サーバ10は、この判定結果に応じて、例えば、同時送信が禁止されている可能性があるメールアドレスの組み合わせが宛先に含まれるため、誤送信リスクがあることを当該メール送受信端末20に通知する。学習モデルは、後述するように、送信ログを用いて統計的手法により作成される。なお、誤送信防止サーバ10は、1又は複数台のコンピュータで実現される。
When the erroneous
なお、誤送信防止サーバ10は、メールサーバとして機能するサーバであってもよいし、メールサーバとは別に設けられたサーバであってもよい。
The erroneous
メール送受信端末20は、メールの送信者(ユーザ)が利用する端末である。メール送受信端末20は、ユーザの操作に応じて、メールの作成及び送信(メールの転送及び返信も含む)を行う。また、メール送受信端末20は、メールサーバから転送されたメールを受信する。なお、メール送受信端末20は、例えば、PC(パーソナルコンピュータ)等で実現される。ただし、メール送受信端末20は、例えば、スマートフォンやタブレット端末等の各種機器又は装置で実現されてもよい。
The mail transmission /
なお、本実施形態では、送信者は、企業や団体等の構成員(例えば、企業の社員、団体の職員、学校の学生等)であるものとする。以降では、これら企業や団体等の構成員を単に「社員」と総称する。 In this embodiment, the sender is a member of a company, an organization, etc. (for example, an employee of the company, an employee of the organization, a student of a school, etc.). Hereinafter, the members of these companies and organizations are simply collectively referred to as "employees".
ここで、誤送信防止サーバ10は、機能部として、送受信部101と、判定部102と、通知部103と、モデル作成部104とを有する。これら各機能部は、誤送信防止サーバ10にインストールされた1以上のプログラムが、CPU(Central Processing Unit)等に実行させる処理により実現される。
Here, the erroneous
また、誤送信防止サーバ10は、記憶部として、学習データ記憶部111と、学習モデル記憶部112とを有する。これら各記憶部は、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)等を用いて実現可能である。ただし、これら各記憶部のうちの少なくとも1つの記憶部が、誤送信防止サーバ10と通信ネットワークを介して接続される記憶装置等を用いて実現されていてもよい。
Further, the erroneous
送受信部101は、メール送受信端末20からのメール(以降、「送信対象メール」とも表す。)を受信する。また、送受信部101は、判定部102による判定結果に応じて、送信対象メールを他の装置(例えばメールサーバ等)に送信(転送)する。
The transmission /
判定部102は、学習モデル記憶部112に記憶されている学習モデルを用いて、送受信部101が受信した送信対象メールの宛先に同時送信禁止アドレスの組み合わせが含まれるか否かを判定する。このとき、判定部102は、送信対象メールの宛先に設定されているメールアドレスを2個ずつの組み合わせに分解した上で、学習モデルにより各組み合わせのスコアを算出することで、同時送信禁止アドレスの組み合わせが当該宛先に設定されているか否かを判定する。
Using the learning model stored in the learning
通知部103は、送信対象メールの宛先に同時送信禁止アドレスの組み合わせが含まれると判定された場合、送信対象メールの送信元のメール送受信端末20に対して誤送信リスクが存在する旨の通知を送信する。
When it is determined that the destination of the e-mail to be sent includes a combination of addresses for which simultaneous transmission is prohibited, the
モデル作成部104は、学習データ記憶部111に記憶されている学習データを用いて、メールアドレスの組み合わせが、同時送信禁止アドレスの組み合わせであるか否かを判定するための学習モデルを作成する。
The
学習データ記憶部111は、学習モデルを作成するための学習データを記憶する。学習データとしては、過去にメール送受信端末20から送信されたメールの送信ログを用いる。ここで、学習データの一例を図3に示す。図3は、学習データの一例を示す図である。
The learning
図3に示すように、1つの学習データ(つまり、1つの送信ログ)には、To欄に設定されたメールアドレスを示す「送信先アドレス(To)」と、Cc欄に設定されたメールアドレスを示す「送信先アドレス(Cc)」と、Bcc欄に設定されたメールアドレスを示す「送信先アドレス(Bcc)」と、件名欄に設定された文字列を示す「件名」と、本文欄に設定された文字列を示す「本文」とが含まれる。送信先アドレス(To)、送信先アドレス(Cc)及び送信先アドレス(Bcc)に設定されたメールアドレスが「宛先」である。 As shown in FIG. 3, one learning data (that is, one transmission log) includes a "destination address (To)" indicating an email address set in the To column and an email address set in the Cc column. "Destination address (Cc)" indicating, "Destination address (Bcc)" indicating the e-mail address set in the Bcc field, "Subject" indicating the character string set in the subject field, and the text field. Includes "body" indicating the set character string. The e-mail address set in the destination address (To), the destination address (Cc), and the destination address (Bcc) is the "destination".
なお、送信先アドレス(To)、送信先アドレス(Cc)及び送信先アドレス(Bcc)には、合計で1つ以上のメールアドレスが設定されていればよい。また、各学習データには件名及び本文が必ずしも含まれている必要はなく、例えば、送信ログから宛先(送信先アドレス(To)、送信先アドレス(Cc)及び送信先アドレス(Bcc))のみを抽出して学習データとしてもよい。 It is sufficient that one or more e-mail addresses are set in total for the destination address (To), the destination address (Cc), and the destination address (Bcc). Further, each learning data does not necessarily include the subject and the text, for example, only the destination (destination address (To), destination address (Cc) and destination address (Bcc)) from the transmission log. It may be extracted and used as learning data.
学習データとする送信ログは、例えば、オンプレミスのメールサーバ等から取得されてもよいし、クラウド型のWebメールサーバ等から取得されてもよい。また、例えば、メール送受信端末20とメールサーバとの間で送信ログを収集する機器又は装置から取得されてもよい。ただし、このとき、例えば、1つのメールアドレスのみが宛先として設定されている送信ログは学習データとして用いないようにしてもよい(言い換えれば、2つ以上のメールアドレスが宛先として設定されている送信ログのみを学習データとしてもよい。)。
The transmission log as learning data may be acquired from, for example, an on-premises mail server or a cloud-type Web mail server. Further, for example, it may be acquired from a device or device that collects transmission logs between the mail transmission /
学習モデル記憶部112は、モデル作成部104により作成された学習モデルを記憶する。
The learning
なお、図1に示すメール誤送信防止システム1の構成は一例であって、他の構成であってもよい。例えば、誤送信防止サーバ10は、学習モデルの作成を行う学習装置と、学習モデルを用いて同時送信禁止アドレスの組み合わせが宛先に含まれるか否かを判定する判定装置とで構成されていてもよい。この場合、学習装置にはモデル作成部104と学習データ記憶部111とが含まれ、判定装置には送受信部101と判定部102と通知部103と学習モデル記憶部112とが含まれる。また、このとき、学習装置及び判定装置の少なくとも一方は、例えば、インターネット等の通信ネットワークを介して接続されるクラウドサーバにより実現されていてもよい。
The configuration of the mail
又は、例えば、誤送信防止サーバ10が、メール送受信端末20に含まれる構成としてもよい。
Alternatively, for example, the erroneous
<学習モデル作成処理>
次に、学習データ記憶部111に記憶されている学習データを用いて学習モデルを作成する処理について、図4を参照しながら説明する。図4は、本実施形態に係る学習モデル作成処理の一例を示すフローチャートである。なお、学習データ記憶部111には、複数の学習データ(つまり、学習データ集合)が記憶されているものとする。
<Learning model creation process>
Next, a process of creating a learning model using the learning data stored in the learning
以降の学習モデル作成処理は、学習モデル記憶部112に学習モデルが記憶されていない場合には、後述する誤送信リスク判定・通知処理を実行する前に実行しておく必要がある。なお、学習モデル作成処理は、例えば、学習モデル再作成して、学習モデル記憶部112に記憶されている学習モデルを更新する場合には、定期的に実行されたり、誤送信防止サーバ10の管理者等が指定したタイミング等に実行されたりしてもよい。
When the learning model is not stored in the learning
まず、モデル作成部104は、学習データ記憶部111から学習データを取得する(ステップS101)。このとき、モデル作成部104は、学習データ記憶部111に記憶されている全ての学習データを取得してもよいし、所定の条件を満たす学習データのみを取得(例えば、直近1年間の送信ログを学習データとして取得する等)してもよい。
First, the
次に、モデル作成部104は、各学習データの宛先に設定されているメールアドレスを2個ずつの組み合わせに分解する(ステップS102)。
Next, the
例えば、或る学習データの宛先(送信先アドレス(To)、送信先アドレス(Cc)及び送信先アドレス(Bcc)))として、「メールアドレスA」と、「メールアドレスB」と、「メールアドレスC」と、「メールアドレスD」とが設定されている場合、モデル作成部104は、これらのメールアドレスを以下の2個ずつの組み合わせに分解する。
For example, "email address A", "email address B", and "email address" as destinations of certain learning data (destination address (To), destination address (Cc), and destination address (Bcc)). When "C" and "e-mail address D" are set, the
・{メールアドレスA,メールアドレスB}
・{メールアドレスA,メールアドレスC}
・{メールアドレスA,メールアドレスD}
・{メールアドレスB,メールアドレスC}
・{メールアドレスB,メールアドレスD}
・{メールアドレスC,メールアドレスD}
このように、モデル作成部104は、各学習データの宛先に設定されているメールアドレスを2個ずつの組み合わせに分解する。一般に、1つの学習データの宛先にn個のメールアドレスが設定されている場合、これらn個のメールアドレスは、nC2個の組み合わせに分解される。以降では、表記を簡単にするため、例えば、{メールアドレスA,メールアドレスB}を単に{A,B}とも表す。他のメールアドレスの組み合わせについても同様に、{A,C}や{A,D}、{B,C}等とも表す。
・ {Email address A, email address B}
・ {Email address A, email address C}
・ {Email address A, email address D}
・ {Email address B, email address C}
・ {Email address B, email address D}
・ {Email address C, email address D}
In this way, the
次に、モデル作成部104は、上記のステップS101で取得した学習データ全体における組み合わせ毎の出現回数を算出する(ステップS103)。
Next, the
例えば、上記のステップS101で取得した学習データのうち、{A,B}の組み合わせが宛先に含まれる学習データがN1個である場合、{A,B}の出現回数はN1となる。同様に、例えば、上記のステップS101で取得した学習データのうち、{A,C}の組み合わせが宛先に含まれる学習データがN2個である場合、{A,C}の出現回数はN2となる。 For example, among the learning data acquired in step S101 above, when the learning data in which the combination of {A, B} is included in the destination is N 1 , the number of occurrences of {A, B} is N 1 . Similarly, for example, when there are N 2 learning data in which the combination of {A, C} is included in the destination among the learning data acquired in step S101 above, the number of occurrences of {A, C} is N 2 . It becomes.
このように、モデル作成部104は、上記のステップS102で分解された組み合わせ毎に、学習データ全体における当該組み合わせの出現回数を算出する。
In this way, the
次に、モデル作成部104は、上記のステップS103で算出された出現回数をパーセンタイルに変換して、組み合わせ毎のスコアを算出する(ステップS104)。ここで、パーセンタイルは、出現回数順に組み合わせを並べたものである。スコアとしては、パーセンタイルに変換した後の組み合わせを用いた任意のスコアを用いることができるが、例えば、出現回数の順位(つまり、組み合わせの順位)を用いることができる。
Next, the
ここで、パーセンタイルの一例を図5に示す。図5に示すパーセンタイルは、出現回数順(出現回数の大きい順)に組み合わせを並べたものである。図5に示すパーセンタイルでは、スコアとして、出現回数の順位を用いており、(スコア,出現回数)で表記している。例えば、(1,97)は、最も出現回数が多い或る組み合わせに対応するスコア(1)及び出現回数(97)である。また、例えば、(2,63)は、2番目に出現回数が多い或る組み合わせに対応するスコア(2)及び出現回数(63)である。 Here, an example of the percentile is shown in FIG. The percentiles shown in FIG. 5 are the combinations arranged in the order of the number of appearances (in descending order of the number of appearances). In the percentile shown in FIG. 5, the order of the number of appearances is used as the score, and is expressed by (score, number of appearances). For example, (1,97) is the score (1) and the number of occurrences (97) corresponding to a certain combination having the highest number of appearances. Further, for example, (2,63) is the score (2) and the number of appearances (63) corresponding to a certain combination having the second highest number of appearances.
このように、モデル作成部104は、上記のステップS102で分解された組み合わせをパーセンタイルに変換することで、組み合わせに対応するスコアをそれぞれ算出する。なお、スコア及び組み合わせに対応するスコアは、それぞれ「特徴量」及び「組み合わせの特徴量」等と称されてもよい。
In this way, the
次に、モデル作成部104は、上記のステップS102で分解された各組み合わせと、上記のステップS104で算出された各スコアとをそれぞれ対応付けた組を学習モデルとして学習モデル記憶部112に保存する(ステップS105)。
Next, the
例えば、上記のステップS102で分解された組み合わせが{A,B}、{A,C}、{A,D}、{B,C}、{B,D}、{C,D}であり、上記のステップS104で算出された{A,B}のスコアがs1、{A,C}のスコアがs2、{A,D}のスコアがs3、{B,C}のスコアがs4、{B,D}のスコアがs5、{C,D}のスコアがs6である場合、モデル作成部104は、例えば、{{A,B}=s1,{A,C}=s2,{A,D}=s3,{B,C}=s4,{B,D}=s5,{C,D}=s6}を学習モデルとして学習モデル記憶部112に保存する。
For example, the combinations decomposed in step S102 above are {A, B}, {A, C}, {A, D}, {B, C}, {B, D}, {C, D}. The score of {A, B} calculated in step S104 above is s 1 , the score of {A, C} is s 2 , the score of {A, D} is s 3 , and the score of {B, C} is s. 4. When the score of {B, D} is s 5 and the score of {C, D} is s 6 , the
以上のように、本実施形態に係る誤送信防止サーバ10は、過去の送信ログを学習データとして、各学習データの宛先に設定されているメールアドレスの組の出現回数からスコアを算出して学習モデルを作成する。これにより、出現回数(又は出現頻度)が低いメールアドレスの組は比較的スコアが低くなり、出現回数(又は出現頻度)が高いメールアドレスの組は比較的スコアが高くなるような学習モデルが作成される。
As described above, the erroneous
なお、本実施形態では、2つのメールアドレスで構成される組み合わせ毎に、当該組み合わせのスコアを算出したが、所定の個数のメールアドレスで構成される組み合わせ毎に、当該組み合わせのスコアを算出してもよい。これにより、例えば、後述する誤送信リスク判定・通知処理では、所定の個数のメールアドレスで構成される組み合わせが、送信対象メールに含まれるか否かを判定することができるようになる。 In the present embodiment, the score of the combination is calculated for each combination composed of two e-mail addresses, but the score of the combination is calculated for each combination composed of a predetermined number of e-mail addresses. May be good. As a result, for example, in the erroneous transmission risk determination / notification process described later, it becomes possible to determine whether or not a combination composed of a predetermined number of email addresses is included in the transmission target email.
<誤送信リスク判定・通知処理>
次に、学習モデル記憶部112に記憶されている学習モデルを用いて送信対象メールに誤送信リスクが存在するか否かを判定し、誤送信リスクが存在すると判定された場合はその旨をメール送受信端末20に通知する処理について、図6を参照しながら説明する。図6は、本実施形態に係る誤送信リスク判定・通知処理の一例を示すフローチャートである。
<Risk judgment / notification processing for erroneous transmission>
Next, using the learning model stored in the learning
まず、送受信部101は、メール送受信端末20から送信された送信対象メールを受信する(ステップS201)。
First, the transmission /
次に、判定部102は、上記のステップS201で受信した送信対象メールの宛先に設定されているメールアドレスを2個ずつの組み合わせに分解する(ステップS202)。これは、上記のステップS102と同様である。
Next, the
次に、判定部102は、学習モデル記憶部112に記憶されている学習モデルを用いて、上記のステップS202で分解された各組み合わせのスコアを算出する(ステップS203)。
Next, the
例えば、学習モデルが{{A,B}=s1,{A,C}=s2,{A,D}=s3,{B,C}=s4,{B,D}=s5,{C,D}=s6}であり、上記のステップS202で得られた組み合わせが{A,B}、{B,D}及び{C,D}である場合、判定部102は、スコアs1、s5及びs6をそれぞれ算出する。
For example, the learning model is {{A, B} = s 1 , {A, C} = s 2 , {A, D} = s 3 , {B, C} = s 4 , {B, D} = s 5 , {C, D} = s 6 }, and when the combinations obtained in step S202 above are {A, B}, {B, D} and {C, D}, the
次に、判定部102は、上記のステップS203で算出されたスコアのうち、最大のスコア(最大スコア)が所定の閾値以上であるか否かを判定する(ステップS204)。すなわち、判定部102は、最大スコアと閾値とを比較して、最大スコアが閾値以上であるか否かを判定する。なお、このような閾値は、メールの送信者毎に設定されてもよいし、グループ(例えば、組織等)毎に設定されてもよい。また、閾値としては任意の値が設定されてもよいし、例えば、明示的に値を設定しない場合には、自身が属するグループの他のユーザが設定している閾値の平均値が設定されてもよい。更に、例えば、時期によってメール送受信の頻度が異なる場合等には、時期によって閾値が自動的に変更されてもよい。
Next, the
なお、本実施形態では、出現回数(又は出現頻度)が少ないほどスコアが大きくなる学習モデルを用いたが、学習モデルによっては、出現回数(又は出現頻度)が少ないほどスコアが小さくなる場合(つまり、出現回数(又は出現頻度)が多いほどスコアが大きくなる場合)も有り得る。この場合には、判定部102は、上記のステップS204で最小のスコアが所定の閾値以下であるか否かを判定してもよいし、スコアの逆数やスコアに負を乗じた数が所定の閾値以上であるか否かを判定してもよい。
In this embodiment, a learning model is used in which the score increases as the number of appearances (or frequency of appearance) decreases, but depending on the learning model, the score decreases as the number of appearances (or frequency of appearance) decreases (that is,). , The score increases as the number of appearances (or frequency of appearance) increases). In this case, the
ステップS204で最大スコアが所定の閾値以上であると判定されなかった場合、送受信部101は、送信対象メールを他の装置(例えばメールサーバ等)に転送する(ステップS205)。この場合、送信対象メールの宛先には同時送信禁止アドレスの組み合わせが含まれていないと考えられ(同時送信禁止アドレスの組み合わせが含まれている可能性が低いと考えられ)、誤送信リスクはない(又は誤送信リスクは低い)ためである。
If it is not determined in step S204 that the maximum score is equal to or higher than a predetermined threshold value, the transmission /
一方で、ステップS204で最大スコアが所定の閾値以上であると判定された場合、通知部103は、送信対象メールの送信元のメール送受信端末20に対して、誤送信リスクが存在する旨の通知を送信する(ステップS206)。この場合、送信対象メールの宛先には同時送信禁止アドレスの組み合わせが含まれていると考えられ(同時送信禁止アドレスの組み合わせが含まれている可能性が高いと考えられ)、誤送信リスクがある(又は誤送信リスクが高い)ためである。
On the other hand, when it is determined in step S204 that the maximum score is equal to or higher than a predetermined threshold value, the
以上のように、本実施形態に係る誤送信防止サーバ10は、予め作成された学習モデルを用いて、送信対象メールの宛先に同時送信禁止アドレスの組み合わせが含まれているか否かを判定し、この判定結果に応じて、誤送信リスクがある旨の通知をメール送受信端末20に送信する。これにより、同時送信が禁止されている可能性があるメールアドレスに対して送信対象メールが同報されてしまう、といった誤送信の発生を防止することが可能となる。
As described above, the erroneous
最後に、本実施形態の具体例について、図7及び図8を参照しながら説明する。図7及び図8は、本実施形態の具体例を説明するための図である。 Finally, a specific example of the present embodiment will be described with reference to FIGS. 7 and 8. 7 and 8 are diagrams for explaining a specific example of the present embodiment.
図7に示す具体例では、4つの学習データを用いて学習モデルを作成した場合を示している。なお、E~Hはそれぞれメールアドレスを表す。 In the specific example shown in FIG. 7, a case where a learning model is created using four learning data is shown. Note that E to H each represent an e-mail address.
このとき、図7に示す例では、学習データ全体における{E,F},{E,G},{E,H},{F,G},{G,H}の組み合わせの出現回数はそれぞれ2,1,2,2,1,0であり、スコアはそれぞれ20,70,20,20,70,100であったとする。他方で、送信対象メールの送信先アドレスにはE、G及びHが含まれているものとする。この場合、送信対象メールの送信先アドレスにはG及びH(つまり、学習データに出現しない組み合わせ)が含まれているため、この送信対象メールの最大スコアは100となる。 At this time, in the example shown in FIG. 7, the number of appearances of the combination of {E, F}, {E, G}, {E, H}, {F, G}, {G, H} in the entire training data is different, respectively. It is assumed that the score is 2,1,2,2,1,0 and the scores are 20, 70, 20, 20, 70, 100, respectively. On the other hand, it is assumed that the destination address of the mail to be sent includes E, G and H. In this case, since the destination address of the email to be sent includes G and H (that is, a combination that does not appear in the learning data), the maximum score of the email to be sent is 100.
また、図8に示す具体例では、上記の4つの学習データを含む大量の学習データを用いて学習モデルを作成した場合を示している。 Further, the specific example shown in FIG. 8 shows a case where a learning model is created using a large amount of learning data including the above four learning data.
このとき、図8に示す例では、学習データ全体における{E,F},{E,G},{E,H},{F,G},{G,H}の組み合わせの出現回数はそれぞれ100,20,70,80,30,1であり、スコアはそれぞれ3,47,7,6,35,85であったとする。他方で、上記と同様に、送信対象メールの送信先アドレスにはE、G及びHが含まれているものとする。この場合、送信対象メールの送信先アドレスにはG及びH(つまり、学習データ全体で最も出現回数が少ない組み合わせ)が含まれているため、この送信対象メールの最大スコアは85となる。 At this time, in the example shown in FIG. 8, the number of appearances of the combination of {E, F}, {E, G}, {E, H}, {F, G}, {G, H} in the entire training data is different, respectively. It is assumed that the numbers are 100, 20, 70, 80, 30, and 1, and the scores are 3,47,7,6,35,85, respectively. On the other hand, as in the above, it is assumed that E, G and H are included in the destination address of the mail to be sent. In this case, since the destination address of the email to be sent includes G and H (that is, the combination having the least number of appearances in the entire learning data), the maximum score of the email to be sent is 85.
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。 The present invention is not limited to the above-described embodiment disclosed specifically, and various modifications and modifications can be made without departing from the scope of claims.
1 メール誤送信防止システム
10 誤送信防止サーバ
20 メール送受信端末
101 送受信部
102 判定部
103 通知部
104 モデル作成部
111 学習データ記憶部
112 学習モデル記憶部
1 E-mail erroneous
Claims (5)
前記第1の算出手段が算出した特徴量のうちの最大又は最小の特徴量を用いて、同報が禁止されている可能性があるメールアドレスの組み合わせが前記宛先に設定されていることを示す通知を送信する送信手段と、
を有する情報処理装置。 A first calculation means for calculating a feature amount for a predetermined number of combinations among a plurality of e-mail addresses set as destinations of e-mails to be sent, and
Using the maximum or minimum feature amount among the feature amounts calculated by the first calculation means, it is shown that a combination of e-mail addresses for which broadcasting may be prohibited is set for the destination. The means of sending notifications and
Information processing device with.
前記第2の算出手段が算出した回数又は頻度をパーセンタイルに変換することで、前記組み合わせに対する特徴量を算出する第3の算出手段と、
前記組み合わせと、前記組み合わせに対する特徴量とを対応付けたモデルを作成するモデル作成手段と、
を有し、
前記第1の算出手段は、
前記組み合わせ毎に、前記モデルを用いて、前記組み合わせに対する特徴量を算出する、請求項1に記載の情報処理装置。 Using a plurality of e-mail addresses set as recipients of each e-mail included in the past e-mail transmission history, the number or frequency of appearance of the combination in the e-mail transmission history is calculated for each predetermined number of combinations. 2 calculation means and
A third calculation means for calculating the feature amount for the combination by converting the number of times or frequency calculated by the second calculation means into percentiles.
A model creation means for creating a model in which the combination and the feature amount for the combination are associated with each other.
Have,
The first calculation means is
The information processing apparatus according to claim 1, wherein the feature amount for the combination is calculated by using the model for each combination.
前記第1の算出手順が算出した特徴量のうちの最大又は最小の特徴量を用いて、同報が禁止されている可能性があるメールアドレスの組み合わせが前記宛先に設定されていることを示す通知を送信する送信手順と、
をコンピュータが実行する情報処理方法。 The first calculation procedure for calculating the feature amount for the combination for each combination of a predetermined number of the plurality of e-mail addresses set as the destinations of the e-mails to be sent, and
Using the maximum or minimum feature amount among the feature amounts calculated by the first calculation procedure, it is shown that a combination of e-mail addresses for which broadcasting may be prohibited is set for the destination. Sending procedure to send notification and
Information processing method that the computer executes.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021210163A JP7307145B2 (en) | 2019-03-22 | 2021-12-24 | Information processing device, information processing method and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019054575A JP7001630B2 (en) | 2019-03-22 | 2019-03-22 | Information processing equipment, information processing methods and programs |
JP2021210163A JP7307145B2 (en) | 2019-03-22 | 2021-12-24 | Information processing device, information processing method and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019054575A Division JP7001630B2 (en) | 2019-03-22 | 2019-03-22 | Information processing equipment, information processing methods and programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022031421A true JP2022031421A (en) | 2022-02-18 |
JP7307145B2 JP7307145B2 (en) | 2023-07-11 |
Family
ID=87072436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021210163A Active JP7307145B2 (en) | 2019-03-22 | 2021-12-24 | Information processing device, information processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7307145B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148786A (en) * | 2005-11-28 | 2007-06-14 | Nippon Telegr & Teleph Corp <Ntt> | Electronic mail error transmission prevention device and method |
JP2012133474A (en) * | 2010-12-20 | 2012-07-12 | Fujitsu Advanced Engineering Ltd | Determination method of erroneous transmission of electronic mail, determination program and communication apparatus |
-
2021
- 2021-12-24 JP JP2021210163A patent/JP7307145B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148786A (en) * | 2005-11-28 | 2007-06-14 | Nippon Telegr & Teleph Corp <Ntt> | Electronic mail error transmission prevention device and method |
JP2012133474A (en) * | 2010-12-20 | 2012-07-12 | Fujitsu Advanced Engineering Ltd | Determination method of erroneous transmission of electronic mail, determination program and communication apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP7307145B2 (en) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9729573B2 (en) | Phishing campaign ranker | |
RU2541123C1 (en) | System and method of rating electronic messages to control spam | |
US8032602B2 (en) | Prioritization of recipient email messages | |
US10516638B2 (en) | Techniques to select and prioritize application of junk email filtering rules | |
US10027696B1 (en) | System and method for determining a threat based on correlation of indicators of compromise from other sources | |
US10104029B1 (en) | Email security architecture | |
US8874663B2 (en) | Comparing similarity between documents for filtering unwanted documents | |
US20060277259A1 (en) | Distributed sender reputations | |
US10757053B2 (en) | High confidence digital content treatment | |
US20100056187A1 (en) | Method and system for providing cellular telephone subscription for e-mail threads | |
US7818373B2 (en) | Notifying co-recipients of others currently replying to communications | |
US10110623B2 (en) | Delaying phishing communication | |
US10715471B2 (en) | System and method for proof-of-work based on hash mining for reducing spam attacks | |
CN110417647B (en) | Mail processing method, device, computer equipment and storage medium | |
US20070239830A1 (en) | Method and apparatus for instant message notification and forwarding | |
US9002771B2 (en) | System, method, and computer program product for applying a rule to associated events | |
US9825974B2 (en) | Phishing warning tool | |
US20160026520A1 (en) | Rainbow event drop detection system | |
US9749359B2 (en) | Phishing campaign ranker | |
JP6039378B2 (en) | Unauthorized mail determination device, unauthorized mail determination method, and program | |
US20200304448A1 (en) | System and Method for Detecting and Predicting Level of Importance of Electronic Mail Messages | |
JP7001630B2 (en) | Information processing equipment, information processing methods and programs | |
US11244117B2 (en) | Automatic message pre-processing | |
JP2022031421A (en) | Information processor, method for processing information, and program | |
RU2583713C2 (en) | System and method of eliminating shingles from insignificant parts of messages when filtering spam |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221004 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7307145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |