JP6784975B2 - 評価装置、評価方法、評価プログラムおよび評価システム - Google Patents
評価装置、評価方法、評価プログラムおよび評価システム Download PDFInfo
- Publication number
- JP6784975B2 JP6784975B2 JP2018552368A JP2018552368A JP6784975B2 JP 6784975 B2 JP6784975 B2 JP 6784975B2 JP 2018552368 A JP2018552368 A JP 2018552368A JP 2018552368 A JP2018552368 A JP 2018552368A JP 6784975 B2 JP6784975 B2 JP 6784975B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- evaluation
- columns
- rows
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/0246—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
- H04L41/026—Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols using e-messaging for transporting management information, e.g. email, instant messaging or chat
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/42—Mailbox-related aspects, e.g. synchronisation of mailboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Computer Hardware Design (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Transfer Between Computers (AREA)
Description
3:評価システム 4:テキスト入力部
5:データ変換部 6:学習部
7:学習モデル 8:テキスト入力部
9:データ変換部 10:評価部
11:記憶部 12:メール
13:スパムメール 14:正常メール
20:テキストデータ評価装置
Claims (7)
- m行×n列のサンプルデータを取得する取得手段と、
前記サンプルデータを、m行×n列×奥行I(Iは、文字種の数)のデータフォーマットを有する3次元データに変換する変換手段であって、前記変換手段は、m行×n列のそれぞれの位置のサンプルデータの文字種を識別し、識別された文字種に対応する奥行の位置に識別情報をセットする、前記変換手段と、
前記変換手段により変換された多数の3次元データに基づき3次元データの識別情報が現れる特徴を学習することで特定のテキストデータの特徴的データ構造を生成する学習手段と、
前記学習手段により学習された前記特徴的データ構造と入力データの特徴的データ構造とが一致するかまたは近似する場合に、前記入力データが前記特定のテキストデータであると評価する評価手段と、
を有する評価装置。 - 前記入力データは、m行×n列のテキストデータであり、前記評価手段は、前記変換手段と同様にm行×n列のテキストデータを3次元データに変換し、変換された3次元データと前記特徴的データ構造とを比較する、請求項1に記載の評価装置。
- 文字種の数Iは、複数の文字種を複数の次元に分類したときの数である、請求項1に記載の評価装置。
- 前記評価手段は、入力データがスパムメールか否かを評価する、請求項1ないし3いずれか1つに記載の評価装置。
- テキストデータの特徴を学習する学習装置とテキストデータを評価する評価装置とを含む評価システムであって、
前記学習装置は、
m行×n列のサンプルデータを取得する取得手段と、
前記サンプルデータを、m行×n列×奥行I(Iは、文字種の数)のデータフォーマットを有する3次元データに変換する変換手段であって、前記変換手段は、m行×n列のそれぞれの位置のサンプルデータの文字種を識別し、識別された文字種に対応する奥行の位置に識別情報をセットする、前記変換手段と、
前記変換手段により変換された多数の3次元データに基づき3次元データの識別情報が現れる特徴を学習することで特定のテキストデータの特徴的データ構造を生成する学習手段とを有し、
前記評価装置は、
評価対象のm行×n列の入力データを、m行×n列×奥行I(Iは、文字種の数)のデータフォーマットを有する3次元データに変換する変換手段であって、前記変換手段は、m行×n列のそれぞれの位置のサンプルデータの文字種を識別し、識別された文字種に対応する奥行の位置に識別情報をセットする、前記変換手段と、
前記特徴的データ構造と前記変換された3次元の入力データの特徴的データ構造とが一致するかまたは近似する場合に、前記入力データが前記特定のテキストデータであると評価する評価手段と、
を有する評価システム。 - 前記評価装置は、メールサーバに設けられる、請求項5に記載の評価システム。
- コンピュータが実行する入力テキストデータの評価方法であって、
m行×n列のサンプルデータを取得するステップと、
前記サンプルデータを、m行×n列×奥行I(Iは、文字種の数)のデータフォーマットを有する3次元データに変換するステップであって、当該変換するステップは、m行×n列のそれぞれの位置のサンプルデータの文字種を識別し、識別された文字種に対応する奥行の位置に識別情報をセットする、前記変換するステップと、
前記変換された多数の3次元データに基づき3次元データの識別情報が現れる特徴を学習することで特定のテキストデータの特徴的データ構造を生成するステップと、
前記特徴的データ構造と入力データの特徴的データ構造とが一致するかまたは近似する場合に、前記入力データが前記特定のテキストデータであると評価するステップと、
を含む評価方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/085144 WO2018096672A1 (ja) | 2016-11-28 | 2016-11-28 | 評価装置、評価方法、評価プログラムおよび評価システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018096672A1 JPWO2018096672A1 (ja) | 2019-10-17 |
JP6784975B2 true JP6784975B2 (ja) | 2020-11-18 |
Family
ID=62194832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018552368A Active JP6784975B2 (ja) | 2016-11-28 | 2016-11-28 | 評価装置、評価方法、評価プログラムおよび評価システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11282040B2 (ja) |
EP (1) | EP3547148A4 (ja) |
JP (1) | JP6784975B2 (ja) |
CN (1) | CN109983447B (ja) |
WO (1) | WO2018096672A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020009151A (ja) * | 2018-07-09 | 2020-01-16 | 富士通株式会社 | システム、プログラム、及び方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5121828B2 (ja) | 1973-04-11 | 1976-07-05 | ||
US8533270B2 (en) * | 2003-06-23 | 2013-09-10 | Microsoft Corporation | Advanced spam detection techniques |
US8214438B2 (en) * | 2004-03-01 | 2012-07-03 | Microsoft Corporation | (More) advanced spam detection features |
US7555523B1 (en) * | 2004-05-06 | 2009-06-30 | Symantec Corporation | Spam discrimination by generalized Ngram analysis of small header fields |
EP2169560A4 (en) | 2007-07-04 | 2012-05-30 | Imatrix Corp | ELECTRONIC MAIL PROCESSING APPARATUS, ELECTRONIC MAIL PROCESSING METHOD, ELECTRONIC MAIL PROCESSING PROGRAM, AND ELECTRONIC MAIL PROCESSING SYSTEM |
JP5400301B2 (ja) * | 2008-01-23 | 2014-01-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 認証サーバ装置、認証方法、及び認証プログラム |
JP2011090442A (ja) | 2009-10-21 | 2011-05-06 | Kddi Corp | 電子メール分類装置、電子メール分類方法及び電子メール分類プログラム |
US8775341B1 (en) * | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US20120249535A1 (en) * | 2011-03-01 | 2012-10-04 | Castineiras George A | System for transformation and animation of images |
US9448636B2 (en) * | 2012-04-18 | 2016-09-20 | Arb Labs Inc. | Identifying gestures using gesture data compressed by PCA, principal joint variable analysis, and compressed feature matrices |
EP3076366A4 (en) * | 2014-02-03 | 2017-05-24 | Prosper Creative Co., Ltd. | Image inspecting device and image inspecting program |
-
2016
- 2016-11-28 EP EP16922201.5A patent/EP3547148A4/en not_active Ceased
- 2016-11-28 WO PCT/JP2016/085144 patent/WO2018096672A1/ja active Application Filing
- 2016-11-28 CN CN201680091111.5A patent/CN109983447B/zh active Active
- 2016-11-28 US US16/463,783 patent/US11282040B2/en active Active
- 2016-11-28 JP JP2018552368A patent/JP6784975B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN109983447B (zh) | 2023-07-04 |
CN109983447A (zh) | 2019-07-05 |
WO2018096672A1 (ja) | 2018-05-31 |
US20190378091A1 (en) | 2019-12-12 |
EP3547148A1 (en) | 2019-10-02 |
JPWO2018096672A1 (ja) | 2019-10-17 |
US11282040B2 (en) | 2022-03-22 |
EP3547148A4 (en) | 2020-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7930351B2 (en) | Identifying undesired email messages having attachments | |
US8112484B1 (en) | Apparatus and method for auxiliary classification for generating features for a spam filtering model | |
US8489689B1 (en) | Apparatus and method for obfuscation detection within a spam filtering model | |
CN1573782B (zh) | 先进的垃圾邮件侦测技术 | |
US7949718B2 (en) | Phonetic filtering of undesired email messages | |
CN110149266B (zh) | 垃圾邮件识别方法及装置 | |
CN103441924A (zh) | 一种基于短文本的垃圾邮件过滤方法及装置 | |
CN109039875B (zh) | 一种基于链接特征分析的钓鱼邮件检测方法及系统 | |
CN103136266A (zh) | 邮件分类的方法及装置 | |
WO2017173093A1 (en) | Method and device for identifying spam mail | |
CN110647895B (zh) | 一种基于登录框图像的钓鱼页面识别方法及相关设备 | |
US8699796B1 (en) | Identifying sensitive expressions in images for languages with large alphabets | |
JP2006293573A (ja) | 電子メール処理装置および電子メールフィルタリング方法および電子メールフィルタリングプログラム | |
Das et al. | Analysis of an image spam in email based on content analysis | |
CN110650108A (zh) | 一种基于icon图标的钓鱼页面识别方法及相关设备 | |
JP6784975B2 (ja) | 評価装置、評価方法、評価プログラムおよび評価システム | |
CN107992508B (zh) | 一种基于机器学习的中文邮件签名提取方法及系统 | |
Ergin et al. | Turkish anti-spam filtering using binary and probabilistic models | |
US10163005B2 (en) | Document structure analysis device with image processing | |
CN110955796B (zh) | 一种基于笔录信息的案件特征信息提取方法及装置 | |
CN114036264A (zh) | 一种基于小样本学习的电子邮件作者身份归属识别方法 | |
CN113746814A (zh) | 邮件处理方法、装置、电子设备及存储介质 | |
Murugavel et al. | K-Nearest neighbor classification of E-Mail messages for spam detection | |
Manek et al. | ReP-ETD: A Repetitive Preprocessing technique for Embedded Text Detection from images in spam emails | |
CN104038391A (zh) | 一种垃圾邮件检测的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190508 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200729 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6784975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |