JP5958348B2 - 分析方法、分析装置、及び分析プログラム - Google Patents
分析方法、分析装置、及び分析プログラム Download PDFInfo
- Publication number
- JP5958348B2 JP5958348B2 JP2013000705A JP2013000705A JP5958348B2 JP 5958348 B2 JP5958348 B2 JP 5958348B2 JP 2013000705 A JP2013000705 A JP 2013000705A JP 2013000705 A JP2013000705 A JP 2013000705A JP 5958348 B2 JP5958348 B2 JP 5958348B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- abnormal
- normal
- analysis
- timing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
- G06F11/3419—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0715—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
Description
まず、予めキャプチャ済みの実データや事前データ採取部410がテストデータを再現(リプレイ)するなどしてデータを採取し、システムの各機能のパスをパス分析部420が分類する。
F2=http://foo.com/appli1.cgi?flag=calc パス=p1−p3−p5
F3=http://foo.com/appli1.cgi?data=true パス=p1−p2
F4=http://foo.com/appli2.cgi?feature=3 パス=p3−p4
p1=method1()→p2=method2()→p4=method3()等
・ブロック単位(if文や{}などで区分けされたブロック)
p1=while(..)→p2=if ()...→p4=else...等
・利用者指定のログ出力箇所
p1={file=foo.java,line=35}→p2={file=foo.java,line=55}→p4={file=boo.java,line=20}等
図4に例示するように、分析フェーズ(分析ブロック401)では、2つの機能を並行して実行することができる。
次に、図5を参照して運用フェーズでの処理例について説明する。
(b)より多くのポイント(コンポーネント)を含むスライスを選択して演算〔例えば、URLが利用するコンポーネントは既知(分析済み)なので、組み合わせにより、より多くのコンポーネントを網羅するスライスを選択する。どのURLの組合せを抑えておけば大部分のコンポーネントを網羅できるか、ということを予め計算して組合せの候補を用意しておく〕。
(c)より多くのURLを網羅するスライスを選択して演算する。
集計区間を調整することで当該演算を適用可能にしたいが、単に集計区間を短くするだけでは、有効なデータを見つけることができない。なぜなら、集計区間を短くしすぎると同時に出現する機能(URL)が少ないために有効な分析にならず、また、時間幅を変えながら様々な時間幅で分析に適したデータを探すと、組み合わせが爆発して計算量の見積もりができない状態になるからである。
そこで、本実施形態では、例えば図12に示すように、機能(例えばURL)毎に正常区間と異常区間とを分けて、その区間を重ね合わせた領域を分析に使う、という工夫をする。これにより、計算量を抑えて分析可能なデータを見つけることが可能になり、分析精度が向上する。なお、図12において、機能F1及びF4は時間的前後に同様な異常あるいは正常データが存在しているものとする。また、図12には、機能F3のデータにより区間(判定区間)が2分割された様子を例示している。
事務処理システムの新サービス(航空券予約システム)提供で問題が発生した場合について図13及び図14を参照して説明する。
F1=前清算パス=p1(旅費)−p2(清算)−p4(DB1)
F2=後清算パス=p1(旅費)−p3(予約照会)−p5(DB2)−p2(清算)−p4(DB1)
F3=航空券予約状況 パス=p1(旅費)−p3(予約照会)−p5(DB2)
例えば図14に例示するように、通常の集計区間では、F1=正常、F2=正常、F3=異常、と分類されるため、分析が正しく行なわれない。仮に、F1=正常、F2=異常、F3=異常、であれば判定することが可能である。
・事前準備
まず、事前分析ブロック401のパス分析部420(図1参照)は、URL(+引数)で業務及び/又は機能を分類(F1〜F3)し、分類した業務及び/又は機能毎にパス情報を設定する(図16の処理P211及びP212)。例えば、以下のように、機能F1〜F3毎にコンポーネントp1〜p5を設定する。
F2=http://boo/... 後清算:p1−p2−p3−p4−p5
F3=http://bar/... 航空券予約状況:p1−p3−p5
F1が正常、F2及びF3が遅延の場合の異常コンポーネントを診断する。F2及びF3が異常の場合、F2及びF3のパス情報から、p1,p2,p3,p4,p5(つまり、本例の場合は全てのコンポーネント)に異常の可能性をあると判断することができる。ここで、F1は正常なので、F1のパス情報からp1,p2,p4が異常の可能性を除外する。
まず、データスライス分割部450が、パス毎に正常区間及び異常区間を分類し(処理P221)、各パスで正常区間と異常区間とが混在しない範囲で全区間のスライスを作成する(処理P222)。
例えば図15に示すように、正常区間と異常区間とを分類し、各機能の区間を重ね合わせて判定区間毎に判定を行なう。図15の場合、「判定区間1」=「正常,正常,異常」、「判定区間2」=「正常,異常,異常」、「判定区間3」=「正常,正常,異常」となる。この場合、「判定区間2」の領域(範囲)についての分析により、p3(予約照会)及びp5(DB2)が問題個所として絞り込まれる。
正常区間及び異常区間は、まばらに存在する場合と互いに重なり合った場合とが考えられる。
まばらな場合、以下の方式による分類が考えられる。
図25に例示するように、RRデータが重なり合う場合、基本的には、図26に例示するように、同一種別のRRデータの開始から終了までを1つの正常区間または異常区間とする。
できるだけ多数のコンポーネントを網羅するタイミングを探すとよい。多数のコンポーネントが出現するほど絞り込みの度合いが高いからである。また、できるだけ多数の機能(例えばURL種別)が集まるタイミングを探すとよい。パターンが多いほど絞り込みしやすいからである。
図32(A)に模式的に例示するように、遅延RRデータと時間的に重なるRRデータを切り出して、切り出した範囲で問題個所の絞り込みを行なう。これは、統計値を使ったのでは瞬間的な競合の発生が検知できない、という考えに基づいている。
実際に問題個所として絞り込みができたものを通知する。図32(B)には、p5が具体的な競合個所である例を示している。
共通の問題個所としては現れないが、問題発生時には高確率で同じように問題が発生する、という場所を暗黙の競合(競合していないはずだが裏で何かしら競合している)として通知する。これは、ある意味で短期分析と長期分析との組み合せに相当する。図32(C)には、p2及びp3が暗黙の競合個所である例を示している。
具体的な競合及び/又は暗黙の競合を含めて、競合可能性のある箇所として通知する。絞り込み度、同時発生確率等から確度をランク付けしてもよい。
分析フェーズの情報では絞り込みができない場合、このチェックポイントで問題なし(または悪化)が証明されれば特定できる、というポイントを抽出する。例えば図33において、p4及びp5のどちらが原因か特定したい場合、事前分析フェーズで使ったデータから、そのポイントを通るリクエストを投入する。ここで、ポイントから「候補リクエスト」を抽出する補完テーブル(インデックス)を用意しておくとより効率的である。
例えば、パス分析部420(図1参照)は、パス情報データベース404におけるパス情報(例えば図35(A)参照)に含まれるポイント(p1,p2,p4,p5)を全て走査し(処理P311)、ポイントが存在するか否かをチェックする(処理P312)。
問題個所特定の精度向上のために、出現確率(頻度)を使う方法が考えられる。
例えば図37に示すように、F1=p1−p2−p3及びp1−p2−p3−p4の2種類のパスを通る場合、F1のパラメータ等の外部情報ではどちらを通るか識別できない。
実運用フェーズの情報だけでは、パラメータによりF1であることが分かっても、それがF1−1のパスかF1−2のパスか識別できない。ここで、F1が70%の確率でレスポンスがよく、30%の確率でレスポンスが悪い場合、問題個所特定部460によりF1−1とF1−2との差分となるp4の個所が悪化の原因箇所であると推定することができる。
図4に例示した事前分析フェーズにおけるフローの処理P60において、パス分析部420は、例えば図38に示すような頻度情報(テーブル)を出現確率情報データベース405に登録しておく。
図40に例示するように、機能F1のパスはF1(F1−1)=p1−p2−p4−p5とF1(F1−2)=p1−p3−p5の2種類が存在し、機能F2のパスはF2=p1−p3−p5、機能F3のパスはF3=p1−p2−p3であるとする。この場合、機能F1には、パラメータ等によって分類できない複数のパスが存在していることになる。
20 サーバ
30 Webサーバ
40 AP(アプリケーション)サーバ
50 ネットワークスイッチ(NS)
401 事前分析ブロック
402 運用ブロック
403 ユーザリクエストデータベース
404 パス情報データベース
405 出現確率情報データベース
410 事前データ採取部
420 パス分析部
430 運用データ採取部
440 機能選別部
450 データスライス分割部
460 問題個所特定部
500,520 通知画面
501,511〜515,521,522 詳細表示ボタン
510 詳細表示画面
F1,F2,F3,F4 機能
p1,p2,p3,p4,p5 コンポーネント
Claims (8)
- 共用するモジュールが存在する複数の処理それぞれについて、正常及び異常のステートをログデータより算出し、
前記ステートの変化のタイミングを算出し、
算出した前記タイミングに基づき、前記複数の処理それぞれについて正常及び異常のステートが混在しない時間区間を区切り、
前記時間区間において、前記複数の処理と前記モジュールとの関係情報に基づき、異常モジュールを検出する、分析方法。 - 異なる種別のステートの開始タイミングが前記時間区間の終了タイミングである、請求項1に記載の分析方法。
- 同一種別のステートの最後の終了タイミングが前記時間区間の終了タイミングである、請求項1に記載の分析方法。
- 異なる種別のステートの開始タイミングよりも前に出現した種別のステートの終了タイミングが前記時間区間の終了タイミングである、請求項1に記載の分析方法。
- 前記異常モジュールの検出に必要十分なデータが存在しない場合に、保存してあるユーザリクエストから必要なデータを再投入することでデータ補完する、請求項1に記載の分析方法。
- 1つの前記処理が前記モジュールの集合である複数のパスを通る場合に、出現確率を用いて前記パスを特定することで、前記異常モジュールの検出を行なう、請求項1に記載の分析方法。
- 共用するモジュールが存在する複数の処理それぞれについて、正常及び異常のステートをログデータより算出する手段と、
前記ステートの変化のタイミングを算出する手段と、
前記算出したタイミングに基づき、前記複数の処理それぞれについて正常及び異常のステートが混在しない時間区間を区切る手段と、
前記時間区間において、前記複数の処理と前記モジュールとの関係の情報に基づき、異常モジュールを検出する手段と、を備えた分析装置。 - 共用するモジュールが存在する複数の処理それぞれについて、正常及び異常のステートをログデータより算出し、
前記ステートの変化のタイミングを算出し、
前記算出したタイミングに基づき、前記複数の処理それぞれについて正常及び異常のステートが混在しない時間区間を区切り、
前記時間区間において、前記複数の処理と前記モジュールとの関係の情報に基づき、異常モジュールを検出する、
処理をコンピュータに実行させる、分析プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013000705A JP5958348B2 (ja) | 2013-01-07 | 2013-01-07 | 分析方法、分析装置、及び分析プログラム |
US14/069,442 US20140195856A1 (en) | 2013-01-07 | 2013-11-01 | Analysis method, analysis apparatus, and computer-readable recording medium storing analysis program |
GB1320832.7A GB2509601B (en) | 2013-01-07 | 2013-11-26 | Analysis method, analysis apparatus and analysis program |
US15/804,034 US10733038B2 (en) | 2013-01-07 | 2017-11-06 | Abnormal module detection using aggregated time interval analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013000705A JP5958348B2 (ja) | 2013-01-07 | 2013-01-07 | 分析方法、分析装置、及び分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014132421A JP2014132421A (ja) | 2014-07-17 |
JP5958348B2 true JP5958348B2 (ja) | 2016-07-27 |
Family
ID=49918209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013000705A Active JP5958348B2 (ja) | 2013-01-07 | 2013-01-07 | 分析方法、分析装置、及び分析プログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US20140195856A1 (ja) |
JP (1) | JP5958348B2 (ja) |
GB (1) | GB2509601B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101594701B1 (ko) * | 2014-10-20 | 2016-02-16 | 삼성에스디에스 주식회사 | 이상 접속 검출 장치 및 방법 |
JP2016081483A (ja) * | 2014-10-22 | 2016-05-16 | 富士通株式会社 | 分析プログラム、分析装置、及び分析方法 |
CN104298570B (zh) * | 2014-11-14 | 2018-04-06 | 北京国双科技有限公司 | 数据处理方法和装置 |
JP6512055B2 (ja) | 2015-09-30 | 2019-05-15 | 富士通株式会社 | 分析プログラム、分析装置および分析方法 |
US12032683B2 (en) * | 2021-07-29 | 2024-07-09 | Micro Focus Llc | Abnormality detection in log entry collection |
CN114296009B (zh) * | 2022-03-10 | 2022-05-24 | 山东汇能电气有限公司 | 一种变压器运行智能分析系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4523444B2 (ja) * | 2005-02-10 | 2010-08-11 | 富士通株式会社 | 通信ネットワークにおける障害の原因を特定する障害管理装置および方法 |
JP4244940B2 (ja) * | 2005-02-24 | 2009-03-25 | 日本電気株式会社 | ネットワークの品質劣化箇所推定装置、品質劣化箇所推定方法及び品質劣化箇所推定プログラム |
JP4553315B2 (ja) * | 2006-03-07 | 2010-09-29 | 株式会社Kddi研究所 | パケット遅延から輻輳パスを分類する輻輳パス分類方法、管理装置及びプログラム |
US7412448B2 (en) * | 2006-05-17 | 2008-08-12 | International Business Machines Corporation | Performance degradation root cause prediction in a distributed computing system |
US8700953B2 (en) * | 2008-09-18 | 2014-04-15 | Nec Corporation | Operation management device, operation management method, and operation management program |
WO2011046228A1 (ja) * | 2009-10-15 | 2011-04-21 | 日本電気株式会社 | システム運用管理装置、システム運用管理方法、及びプログラム記憶媒体 |
JP5494110B2 (ja) * | 2010-03-29 | 2014-05-14 | 富士通株式会社 | ネットワークの通信経路推定方法、通信経路推定プログラム及び監視装置 |
JP5732767B2 (ja) * | 2010-07-26 | 2015-06-10 | 富士通株式会社 | 処理装置,処理方法,処理用プログラム,同プログラムを記録したコンピュータ読取可能な記録媒体 |
-
2013
- 2013-01-07 JP JP2013000705A patent/JP5958348B2/ja active Active
- 2013-11-01 US US14/069,442 patent/US20140195856A1/en not_active Abandoned
- 2013-11-26 GB GB1320832.7A patent/GB2509601B/en active Active
-
2017
- 2017-11-06 US US15/804,034 patent/US10733038B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20140195856A1 (en) | 2014-07-10 |
US10733038B2 (en) | 2020-08-04 |
JP2014132421A (ja) | 2014-07-17 |
US20180060156A1 (en) | 2018-03-01 |
GB2509601A (en) | 2014-07-09 |
GB2509601B (en) | 2020-01-08 |
GB201320832D0 (en) | 2014-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5958348B2 (ja) | 分析方法、分析装置、及び分析プログラム | |
Jin et al. | A cost-efficient approach to building in continuous integration | |
US8607198B2 (en) | Cross-concern code coverage assessment | |
US20060004528A1 (en) | Apparatus and method for extracting similar source code | |
US8972374B2 (en) | Content acquisition system and method of implementation | |
US20050138483A1 (en) | Method and apparatus for compressing log record information | |
WO2017081865A1 (ja) | ログ分析システム、方法、及び記録媒体 | |
US8006138B2 (en) | Software quality assessment based on semantic similarities | |
KR101588027B1 (ko) | 소프트웨어 현지화를 위한 테스트 케이스 생성 장치 및 방법 | |
Meskas et al. | flowCut: an R package for automated removal of outlier events and flagging of files based on time versus fluorescence analysis | |
CN116431520A (zh) | 测试场景确定方法、装置、电子设备和存储介质 | |
CN111258876B (zh) | 一种微服务架构下的精确回归测试方法及装置 | |
CN103426050B (zh) | 业务课题分析支持系统 | |
Rodrigues et al. | FaST: A linear time stack trace alignment heuristic for crash report deduplication | |
JP2016081483A (ja) | 分析プログラム、分析装置、及び分析方法 | |
JP4973738B2 (ja) | 業務フロー処理プログラム、方法及び装置 | |
US12124353B2 (en) | Operation logs acquiring device, operation logs acquiring method, and operation logs acquiring program | |
CN114503080A (zh) | 在顺序数据块的异步处理期间的错误处理 | |
US20110191778A1 (en) | Computer program, method, and apparatus for grouping tasks into series | |
CN110968779A (zh) | 网页信息爬取的处理方法和装置 | |
CN112100047A (zh) | 一种服务性能监控分析方法及装置 | |
Gao et al. | Managing concurrent testing of data race with comrade | |
US11232200B2 (en) | Apparatus for selecting representative token from detection names of multiple vaccines, method therefor, and computer readable recording medium storing program for performing the method | |
US11899737B1 (en) | System and method for managing information sourced by a primary server that is sent to other servers when a user interacts with a web page without distorting the other servers | |
Sergieieva et al. | Task identification framework to automatically detect anomalies in users’ interactions with mobile application to support usability evaluation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5958348 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |