JP6620538B2 - 学習プログラム、学習方法およびメールサーバ - Google Patents
学習プログラム、学習方法およびメールサーバ Download PDFInfo
- Publication number
- JP6620538B2 JP6620538B2 JP2015237998A JP2015237998A JP6620538B2 JP 6620538 B2 JP6620538 B2 JP 6620538B2 JP 2015237998 A JP2015237998 A JP 2015237998A JP 2015237998 A JP2015237998 A JP 2015237998A JP 6620538 B2 JP6620538 B2 JP 6620538B2
- Authority
- JP
- Japan
- Prior art keywords
- mail data
- keyword
- keywords
- keyword set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/552—Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
Description
図1は、実施例1にかかるシステムの全体構成例を示す図である。図1に示すように、このシステムは、社内の社員1が送信する電子メールをメールサーバ10で分析して、セキュリティ管理者5(以下、管理者と記載する場合がある。)に通知する社内電子メールシステムである。
図2は、実施例1にかかるメールサーバ10の機能構成を示す機能ブロック図である。図2に示すように、メールサーバ10は、通信部11、記憶部12、制御部20を有する。
次に、メールサーバ10における各種処理の流れについて説明する。ここでは、分類処理、追加処理、削除処理について説明する。
図8は、メール分類処理の流れを示すフローチャートである。図8に示すように、分類判定部22は、受付部21によってメールが受け付けられると(S101:Yes)、辞書DB13を参照して、メールからキーワードを抽出する(S102)。
図9は、キーワード追加処理の流れを示すフローチャートである。図9に示すように、キーワード抽出部25は、処理開始のタイミングになると(S201:Yes)、カテゴリを1つ選択し(S202)、分類結果DB15に記憶されるメールのうち、選択されたカテゴリに分類されたメールを取得して、共起確率による登録候補(候補1)を抽出する(S203)。
図10は、キーワード削除処理の流れを示すフローチャートである。図10に示すように、削除部27は、処理開始のタイミングになると(S301:Yes)、カテゴリを1つ選択し(S302)、分類結果DB15に記憶されるメールのうち、選択されたカテゴリに分類されたメールからキーワードを抽出する(S303)。
実施例1にかかるメールサーバ10は、各カテゴリに使用されるKWを定期的に学習することができるので、時代の変化や流行等により日々変化に追従することができる。この結果、同じ抽出条件を使い続けることにより、抽出回数が減少していくことが考えられるが、定期的に抽出条件を更新することで、抽出件数の改善が期待できる。この結果、悪影響を及ぼす、コンプライアンス違反の電子メールの抽出精度を維持することができる。
上記メールサーバ10は、実施例1で説明した処理に加えて、社員1のメール送信状況を分析することができる。そこで、実施例2では、メールサーバ10が、各メールアドレスについて、どのくらい危険なメールを送信しているかなどを分析する例について説明する。なお、全体構成は、実施例1と同様なので説明を省略する。
図11は、実施例2にかかるメールサーバ10の機能構成を示す機能ブロック図である。図11に示すように、メールサーバ10は、通信部11、記憶部12、制御部20を有する。実施例1と異なる点は、危険度DB16と危険度判定部30と表示制御部31を有する点である。したがって、実施例2では、危険度DB16と危険度判定部30と表示制御部31について説明する。なお、記憶部12は、送信対象の電子メール、すなわち受付部21によって受け付けられた全メールを記憶する。
図13は、危険度判定処理の流れを示すフローチャートである。図13に示すように、危険度判定部30は、処理開始のタイミングに到達すると(S401:Yes)、分類結果DB15に記憶されるメールアドレスを1つ選択する(S402)。
次に、図14から図19を用いて表示制御部31が表示する表示例を説明する。なお、表示制御部31は、危険度判定部30や学習部24から、危険度判定結果が学習結果を毎回取得して記憶部12等に格納しておくことができる。
図14は、メール判定結果の表示例を説明する図である。図14に示すように、表示制御部31は、メールの判定結果の表示指示を受付けると、ユーザによって指定された期間の危険度判定結果や学習結果などを集計して表示することができる。
図15は、危険度状況の表示例を説明する図である。図15に示すように、表示制御部31は、危険度状況の表示指示を受付けると、最新の危険度判定結果を表示することができる。なお、最新の危険度判定結果に限らず、指定された過去の判定結果を表示することもでき、判定結果の推移を表示することもできる。
図16は、危険度毎の表示例を説明する図である。図16に示すように、表示制御部31は、危険度表示の指示を受付けると、最新の危険度判定結果にしたがって、危険度毎に該当メールアドレスの一覧を表示することができる。なお、最新の危険度判定結果に限らず、指定された過去の判定結果を表示することもできる。
図18は、グラフからキーワードの出現状況を表示させる例を説明する図である。図18に示すように、表示制御部31は、カテゴリごとの抽出件数の状況遷移を示す折れ線グラフ(図14のB参照)からいずれかの折れ線グラフが選択された場合、カテゴリごとの抽出キーワードそれぞれの抽出回数を表示することができる。
図19は、抽出条件の更新前後の抽出推移を表示させる例を説明する図である。図19に示すように、表示制御部31は、カテゴリごとの抽出件数の状況遷移を示す折れ線グラフ(図14のB参照)に、実施例1で説明した学習処理によって抽出条件である該当KW等が更新された日付を図示する。
実施例2にかかるメールサーバ10は、学習結果や危険度などを表示することができるので、コンプライアンス違反の電子メールの送信状況を把握することができ、管理者が視覚的に危険度や危険なユーザを把握することができる。また、メールサーバ10は、様々な観点のインタフェースを提供することができるので、利便性が向上する。
上記実施例で説明したカテゴリの分類数、カテゴリ名、危険度の区分数、危険度の判定条件などは、任意に設定変更することができる。また、実施例2では、折れ線グラフや円グラフを例示したが、これに限定されるものではなく、棒グラフなど他のグラフ形式を採用することもできる。除外KWやNG−KWは、各カテゴリで共通に設定することもできる。
また、図2や図11に示した各装置の各構成は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、任意の単位で分散または統合して構成することができる。例えば、学習部24と危険度判定部30を統合することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPU(Central Processing Unit)および当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
上記メールサーバ10は、例えば、次のようなハードウェア構成を有するコンピュータにより実現することができる。図20は、ハードウェアの構成例を説明する図である。図20に示すように、メールサーバ10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。
11 通信部
12 記憶部
13 辞書DB
14 カテゴリDB
15 分類結果DB
16 危険度DB
20 制御部
21 受付部
22 分類判定部
23 送信処理部
24 学習部
25 キーワード抽出部
26 登録部
27 削除部
30 危険度判定部
31 表示制御部
Claims (8)
- コンピュータに、
メールデータの抽出条件に用いられる1又は複数のキーワードを含む第1のキーワードセットに基づいて抽出したメールデータについて、所定の頻度を超えて出現するキーワードのうち、前記第1のキーワードセットに含まれない1又は複数の第2のキーワードセットを特定し、
前記第2のキーワードセットを前記メールデータの抽出条件に追加し、
前記第1のキーワードセットと前記第2のキーワードセットとに含まれるキーワードのうち、前記メールデータの新たな抽出条件に基づいて抽出したメールデータについて、所定の頻度以下の頻度での出現状況を示す特定のキーワードが存在するか否か判定し、
前記特定のキーワードが存在すると判定した場合に、前記特定のキーワードが前記第1のキーワードセットに含まれるか前記第2のキーワードセットに含まれるかに応じて、前記メールデータの抽出条件に残すか、削除するか制御する、
処理を実行させることを特徴とする学習プログラム。 - 前記追加する処理は、前記第2のキーワードセットが前記抽出条件で抽出対象外となる複数のメールデータに所定の割合以上で含まれる場合は、前記第2のキーワードセットの前記メールデータの抽出条件への追加を抑制することを特徴とする請求項1に記載の学習プログラム。
- 前記抽出条件で抽出対象外となる複数のメールデータに所定の割合以上で含まれる第3のキーワードセットを抽出し、
前記メールデータの抽出条件への追加対象から前記第3のキーワードセットを除外する処理を、を前記コンピュータにさらに実行させることを特徴とする請求項1に記載の学習プログラム。 - コンピュータが、
メールデータの抽出条件に用いられる1又は複数のキーワードを含む第1のキーワードセットに基づいて抽出したメールデータについて、所定の頻度を超えて出現するキーワードのうち、前記第1のキーワードセットに含まれない1又は複数の第2のキーワードセットを特定し、
前記第2のキーワードセットを前記メールデータの抽出条件に追加し、
前記第1のキーワードセットと前記第2のキーワードセットとに含まれるキーワードのうち、前記メールデータの新たな抽出条件に基づいて抽出したメールデータについて、所定の頻度以下の頻度での出現状況を示す特定のキーワードが存在するか否か判定し、
前記特定のキーワードが存在すると判定した場合に、前記特定のキーワードが前記第1のキーワードセットに含まれるか前記第2のキーワードセットに含まれるかに応じて、前記メールデータの抽出条件に残すか、削除するか制御する、
処理をすることを特徴とする学習方法。 - メールデータの抽出条件に用いられる1又は複数のキーワードを含む第1のキーワードセットに基づいて抽出したメールデータについて、所定の頻度を超えて出現するキーワードのうち、前記第1のキーワードセットに含まれない1又は複数の第2のキーワードセットを特定する特定部と、
前記第2のキーワードセットを前記メールデータの抽出条件に追加する追加部と、
前記第1のキーワードセットと前記第2のキーワードセットとに含まれるキーワードのうち、前記メールデータの新たな抽出条件に基づいて抽出したメールデータについて、所定の頻度以下の頻度での出現状況を示す特定のキーワードが存在するか否か判定する判定部と、
前記特定のキーワードが存在すると判定した場合に、前記特定のキーワードが前記第1のキーワードセットに含まれるか前記第2のキーワードセットに含まれるかに応じて、前記メールデータの抽出条件に残すか、削除するか制御する制御部と、
を有することを特徴とするメールサーバ。 - コンピュータに、
1又は複数のキーワードを含む第1のキーワードセットを抽出条件として抽出した複数のメールデータに対して、複数の部分集合に分類する分類処理を実行するとともに、前記複数のメールデータを解析して、キーワードを抽出し、
前記複数の部分集合のうち、前記第1のキーワードセットに含まれるキーワードのうち、部分集合に属するメールデータ中に出現しないキーワードが最も少ない部分集合を特定し、
特定した該部分集合に含まれるメールデータに含まれ、前記第1のキーワードセットに含まれないキーワードを前記メールデータの抽出条件に追加する、
処理を実行させることを特徴とする学習プログラム。 - コンピュータに、
1又は複数のキーワードを含む第1のキーワードセットを抽出条件として抽出した複数のメールデータに対して、複数の部分集合に分類する分類処理を実行するとともに、前記複数のメールデータを解析して、キーワードを抽出し、
前記複数の部分集合のうち、前記第1のキーワードセットに含まれるキーワードのうち、部分集合に属するメールデータ中に出現しないキーワードが最も少ない部分集合を特定し、
特定した該部分集合に含まれるメールデータに含まれ、前記第1のキーワードセットに含まれないキーワードを前記メールデータの抽出条件に追加する、
処理をすることを特徴とする学習方法。 - 1又は複数のキーワードを含む第1のキーワードセットを抽出条件として抽出した複数のメールデータに対して、複数の部分集合に分類する分類処理を実行するとともに、前記複数のメールデータを解析して、キーワードを抽出する抽出部と、
前記複数の部分集合のうち、前記第1のキーワードセットに含まれるキーワードのうち、部分集合に属するメールデータ中に出現しないキーワードが最も少ない部分集合を特定する特定部と、
特定した該部分集合に含まれるメールデータに含まれ、前記第1のキーワードセットに含まれないキーワードを前記メールデータの抽出条件に追加する追加部と、
有することを特徴とするメールサーバ。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015237998A JP6620538B2 (ja) | 2015-12-04 | 2015-12-04 | 学習プログラム、学習方法およびメールサーバ |
US15/345,683 US10409847B2 (en) | 2015-12-04 | 2016-11-08 | Computer-readable recording medium, learning method, and mail server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015237998A JP6620538B2 (ja) | 2015-12-04 | 2015-12-04 | 学習プログラム、学習方法およびメールサーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017102868A JP2017102868A (ja) | 2017-06-08 |
JP6620538B2 true JP6620538B2 (ja) | 2019-12-18 |
Family
ID=58798391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015237998A Active JP6620538B2 (ja) | 2015-12-04 | 2015-12-04 | 学習プログラム、学習方法およびメールサーバ |
Country Status (2)
Country | Link |
---|---|
US (1) | US10409847B2 (ja) |
JP (1) | JP6620538B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102019756B1 (ko) * | 2017-03-14 | 2019-09-10 | 한국전자통신연구원 | 신조어 자동 인식을 위한 언어 분석에 기반한 온라인 문맥 광고 지능화 장치 및 그 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6356898B2 (en) * | 1998-08-31 | 2002-03-12 | International Business Machines Corporation | Method and system for summarizing topics of documents browsed by a user |
JP2000132553A (ja) | 1998-10-22 | 2000-05-12 | Sharp Corp | キーワード抽出方法、キーワード抽出装置、及びキーワード抽出プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20030037034A1 (en) * | 2001-08-16 | 2003-02-20 | Tim Daniels | System and method for lubricants supply chain management |
JP4161171B2 (ja) | 2002-06-17 | 2008-10-08 | ヤマハ株式会社 | 情報分類装置、方法及びプログラム |
JP4233836B2 (ja) | 2002-10-16 | 2009-03-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文書自動分類システム、不要語判定方法、文書自動分類方法、およびプログラム |
CA2523279A1 (en) * | 2003-04-24 | 2004-11-11 | Secureinfo Corporation | Method, system and article of manufacture for data preservation and automated electronic software distribution across an enterprise system |
JP2005284454A (ja) | 2004-03-29 | 2005-10-13 | Tatsuya Koshi | 迷惑メール配信防止システム、当該システムにおける情報端末及び電子メールサーバ |
JP2007249584A (ja) | 2006-03-15 | 2007-09-27 | Softec:Kk | クライアントデータベース構築方法、データ検索方法、データ検索システム、データ検索フィルタリングシステム、クライアントデータベース構築プログラム、データ検索プログラム、データ検索フィルタリングプログラム及びプログラムを格納したコンピュータで読み取り可能な記録媒体並びに記録した機器 |
JP5046158B2 (ja) * | 2007-08-10 | 2012-10-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 電子メールメッセージの特性を検出する装置及び方法 |
JP2010081093A (ja) * | 2008-09-24 | 2010-04-08 | Toshiba Corp | 通信機器 |
US8843368B2 (en) * | 2009-08-17 | 2014-09-23 | At&T Intellectual Property I, L.P. | Systems, computer-implemented methods, and tangible computer-readable storage media for transcription alignment |
JP5577879B2 (ja) | 2010-06-17 | 2014-08-27 | 日本電気株式会社 | フィルタ設定システム、フィルタ設定方法、及びフィルタ設定プログラム |
WO2012066650A1 (ja) * | 2010-11-17 | 2012-05-24 | 富士通株式会社 | 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム |
JP5389853B2 (ja) * | 2011-04-08 | 2014-01-15 | 株式会社Nttドコモ | 地域情報配信サーバ、移動端末、地域情報配信システム、地域情報配信方法及び地域情報表示方法 |
US9485206B2 (en) * | 2013-12-19 | 2016-11-01 | Websafety, Inc. | Devices and methods for improving web safety and deterrence of cyberbullying |
US9882851B2 (en) * | 2015-06-29 | 2018-01-30 | Microsoft Technology Licensing, Llc | User-feedback-based tenant-level message filtering |
-
2015
- 2015-12-04 JP JP2015237998A patent/JP6620538B2/ja active Active
-
2016
- 2016-11-08 US US15/345,683 patent/US10409847B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10409847B2 (en) | 2019-09-10 |
US20170161369A1 (en) | 2017-06-08 |
JP2017102868A (ja) | 2017-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230077990A1 (en) | Privacy-preserving labeling and classification of email | |
JP6508353B2 (ja) | 情報処理装置 | |
US20170104759A1 (en) | Data protection and sharing | |
JP6555108B2 (ja) | 表示制御プログラム、表示制御方法および情報処理装置 | |
US9881345B2 (en) | Evaluating an impact of a user's content utilized in a social network | |
US11349790B2 (en) | System, method and computer program product to extract information from email communications | |
US20190164170A1 (en) | Sentiment analysis based on user history | |
JP2015513133A (ja) | キャラクター・ヒストグラムを用いるスパム検出のシステムおよび方法 | |
US10977285B2 (en) | Using observations of a person to determine if data corresponds to the person | |
US20210160368A1 (en) | Dynamic anti-disturb techniques in telephony | |
JP6620538B2 (ja) | 学習プログラム、学習方法およびメールサーバ | |
US10445381B1 (en) | Systems and methods for categorizing electronic messages for compliance reviews | |
Borradaile et al. | Whose tweets are surveilled for the police: an audit of a social-media monitoring tool via log files | |
Ishak et al. | Distance-based hoax detection system | |
US10826865B2 (en) | Visibility management enhancement for messaging systems and online social networks | |
US20230179628A1 (en) | Conversation-depth social engineering attack detection using attributes from automated dialog engagement | |
US10050922B2 (en) | Server and method for processing email messages | |
TW201606558A (zh) | 資料洩漏檢測裝置、資料洩漏檢測方法、及資料洩漏檢測程式 | |
KR20170058885A (ko) | 위험 검출 장치, 위험 검출 방법, 및 위험 검출 프로그램 | |
US10778840B1 (en) | Systems and methods for identifying unsolicited communications on a computing device | |
US20160173431A1 (en) | Electronic Message Redacting | |
Pan et al. | Improving authorship attribution in twitter through topic-based sampling | |
US10176248B2 (en) | Performing a dynamic search of electronically stored records based on a search term format | |
Parmar et al. | Utilising machine learning against email phishing to detect malicious emails | |
JP7138532B2 (ja) | メール検査システム、メール検査方法およびメール検査プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191023 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6620538 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |