JP6856527B2 - メッセージ分析装置、メッセージ分析方法、および、メッセージ分析プログラム - Google Patents
メッセージ分析装置、メッセージ分析方法、および、メッセージ分析プログラム Download PDFInfo
- Publication number
- JP6856527B2 JP6856527B2 JP2017523119A JP2017523119A JP6856527B2 JP 6856527 B2 JP6856527 B2 JP 6856527B2 JP 2017523119 A JP2017523119 A JP 2017523119A JP 2017523119 A JP2017523119 A JP 2017523119A JP 6856527 B2 JP6856527 B2 JP 6856527B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- message
- field
- messages
- fields
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
- G06F11/3079—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by reporting only the changes of the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Description
本発明の第1の実施の形態としてのメッセージ分析装置1の機能ブロック構成を図1に示す。図1において、メッセージ分析装置1は、クラスタリング部11と、フィールド解析部12と、パターン生成部13とを備える。メッセージ分析装置1は、メッセージ群を分析してその内容や傾向を示すメッセージパターンを生成する装置である。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1および第2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1から第3の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
11、21 クラスタリング部
12、22 フィールド解析部
13、23 パターン生成部
24 クラスタ類似性判定部
35、45 クラスタ細分化部
1001 CPU
1002 メモリ
1003 出力装置
1004 入力装置
Claims (6)
- 1つ以上のフィールドからなるメッセージの集合であるメッセージ群を、前記メッセージ間の類似性に基づいてクラスタに分類するクラスタリング手段と、
前記クラスタ内のメッセージ群を構成する各フィールドについて、その値が変異している変数部分と、変異していない不変部分とを識別するフィールド解析手段と、
前記クラスタ内のメッセージ群の変数部分を構成するフィールドの値の品詞に基づいて変数部分の重要性を判定し、判定した変数部分の重要性に基づいて、前記クラスタ内のメッセージ群をさらに分割したクラスタを生成するクラスタ細分化手段と、
前記クラスタ内のメッセージ群の全体の類似性として、前記クラスタ内のメッセージ群を構成するフィールドのうち不変部分を構成するフィールドの割合を算出し、前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するか否かを判定するクラスタ類似性判定手段と、
前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するときに、前記変数部分および前記不変部分に基づいて、前記クラスタ内のメッセージ群に共通するメッセージパターンを生成するパターン生成手段と、
を備えたメッセージ分析装置。 - 前記クラスタ細分化手段は、前記変数部分の重要性を、前記変数部分を構成するフィールド間の相関に基づいて判定することを特徴とする請求項1に記載のメッセージ分析装置。
- 前記クラスタリング手段は、前記メッセージと、該メッセージに対して類似性が所定条件を満たす他のメッセージとを同一クラスタに分類することを特徴とする請求項1又は請求項2に記載のメッセージ分析装置。
- 前記クラスタリング手段は、前記各メッセージにおいて所定のフィールドパターンに合致する部分を、前記メッセージ間で互いに類似するフィールドとみなして前記メッセージ群を前記クラスタに分類し、
前記フィールド解析手段は、前記フィールドパターンに合致する値を持つフィールドを、不変部分として識別することを特徴とする請求項1から請求項3のいずれか1項に記載のメッセージ分析装置。 - コンピュータ装置を用いて、
1つ以上のフィールドからなるメッセージの集合であるメッセージ群を、前記メッセージ間の類似性に基づいてクラスタに分類し、
前記クラスタ内のメッセージ群を構成する各フィールドについて、その値が変異している変数部分と、変異していない不変部分とを識別し、
前記クラスタ内のメッセージ群の変数部分を構成するフィールドの値の品詞に基づいて変数部分の重要性を判定し、判定した変数部分の重要性に基づいて、前記クラスタ内のメッセージ群をさらに分割したクラスタを生成し、
前記クラスタ内のメッセージ群の全体の類似性として、前記クラスタ内のメッセージ群を構成するフィールドのうち不変部分を構成するフィールドの割合を算出し、前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するか否かを判定し、
前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するときに、前記変数部分および前記不変部分に基づいて、前記クラスタ内のメッセージ群に共通するメッセージパターンを生成するメッセージ分析方法。 - 1つ以上のフィールドからなるメッセージの集合であるメッセージ群を、前記メッセージ間の類似性に基づいてクラスタに分類するクラスタリングステップと、
前記クラスタ内のメッセージ群を構成する各フィールドについて、その値が変異している変数部分と、変異していない不変部分とを識別するフィールド解析ステップと、
前記クラスタ内のメッセージ群の変数部分を構成するフィールドの値の品詞に基づいて変数部分の重要性を判定し、判定した変数部分の重要性に基づいて、前記クラスタ内のメッセージ群をさらに分割したクラスタを生成するクラスタ細分化ステップと、
前記クラスタ内のメッセージ群の全体の類似性として、前記クラスタ内のメッセージ群を構成するフィールドのうち不変部分を構成するフィールドの割合を算出し、前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するか否かを判定するクラスタ類似性判定ステップと、
前記クラスタ内のメッセージ群の全体の類似性が所定の条件を満足するときに、前記変数部分および前記不変部分に基づいて、前記クラスタ内のメッセージ群に共通するメッセージパターンを生成するパターン生成ステップと、
をコンピュータ装置に実行させるメッセージ分析プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015118217 | 2015-06-11 | ||
JP2015118217 | 2015-06-11 | ||
PCT/JP2016/002816 WO2016199433A1 (ja) | 2015-06-11 | 2016-06-10 | メッセージ分析装置、メッセージ分析方法、および、記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016199433A1 JPWO2016199433A1 (ja) | 2018-03-29 |
JP6856527B2 true JP6856527B2 (ja) | 2021-04-07 |
Family
ID=57503335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017523119A Active JP6856527B2 (ja) | 2015-06-11 | 2016-06-10 | メッセージ分析装置、メッセージ分析方法、および、メッセージ分析プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180165174A1 (ja) |
JP (1) | JP6856527B2 (ja) |
WO (1) | WO2016199433A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11115359B2 (en) * | 2016-11-03 | 2021-09-07 | Samsung Electronics Co., Ltd. | Method and apparatus for importance filtering a plurality of messages |
US11574211B2 (en) | 2017-09-27 | 2023-02-07 | Nec Corporation | Log analysis system, log analysis method, log analysis program, and storage medium |
CN110730270B (zh) * | 2019-09-09 | 2021-09-14 | 上海斑马来拉物流科技有限公司 | 一种短信分组方法、装置及计算机存储介质、电子设备 |
CN112541074A (zh) * | 2019-09-20 | 2021-03-23 | 中兴通讯股份有限公司 | 日志解析方法、装置、服务器和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949177B2 (en) * | 2007-10-17 | 2015-02-03 | Avaya Inc. | Method for characterizing system state using message logs |
US20140317137A1 (en) * | 2012-03-12 | 2014-10-23 | Hitachi, Ltd. | Log management computer and log management method |
JP2013214148A (ja) * | 2012-03-30 | 2013-10-17 | Toshiba Corp | メッセージ変換装置、及びメッセージ変換プログラム |
JP5948291B2 (ja) * | 2013-08-13 | 2016-07-06 | 日本電信電話株式会社 | 監視情報分析装置及び方法 |
-
2016
- 2016-06-10 WO PCT/JP2016/002816 patent/WO2016199433A1/ja active Application Filing
- 2016-06-10 US US15/577,839 patent/US20180165174A1/en not_active Abandoned
- 2016-06-10 JP JP2017523119A patent/JP6856527B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016199433A1 (ja) | 2016-12-15 |
JPWO2016199433A1 (ja) | 2018-03-29 |
US20180165174A1 (en) | 2018-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783046B2 (en) | Anomaly and causation detection in computing environments | |
Nouh et al. | Understanding the radical mind: Identifying signals to detect extremist content on twitter | |
JP6856527B2 (ja) | メッセージ分析装置、メッセージ分析方法、および、メッセージ分析プログラム | |
Iqbal et al. | E-mail authorship verification for forensic investigation | |
JP6150291B2 (ja) | 矛盾表現収集装置及びそのためのコンピュータプログラム | |
JPWO2015186662A1 (ja) | ログ分析装置、攻撃検知装置、攻撃検知方法およびプログラム | |
Palahan et al. | Extraction of statistically significant malware behaviors | |
CN103164698A (zh) | 指纹库生成方法及装置、待测文本指纹匹配方法及装置 | |
JP7078114B2 (ja) | ログ分析装置、ログ分析方法、プログラム | |
US20210136032A1 (en) | Method and apparatus for generating summary of url for url clustering | |
US11783034B2 (en) | Apparatus and method for detecting malicious script | |
CN111597550A (zh) | 一种日志信息分析方法及相关装置 | |
CN112241530A (zh) | 恶意pdf文档的检测方法及电子设备 | |
Swanson et al. | Extracting the native language signal for second language acquisition | |
JP5314195B2 (ja) | 自然言語処理装置、方法、及びプログラム | |
Bello et al. | Reverse engineering the behaviour of twitter bots | |
Gupta et al. | A proposed framework to analyze abusive tweets on the social networks | |
Hong | Relation extraction using support vector machine | |
JP2013191062A (ja) | データ解析装置、データ分割装置、データ解析方法、データ分割方法、データ解析プログラム、及びデータ分割プログラム | |
Stolerman et al. | Active linguistic authentication revisited: Real-time stylometric evaluation towards multi-modal decision fusion | |
Agirre et al. | Ubc-as: A graph based unsupervised system for induction and classification | |
US20120265519A1 (en) | System and method for object detection | |
Bergholz et al. | Detecting Known and New Salting Tricks in Unwanted Emails. | |
CN112597494A (zh) | 一种用于恶意程序检测的行为白名单自动收集方法 | |
KR102665757B1 (ko) | 악성 스크립트 탐지 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171120 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6856527 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |