JP7496481B1 - プロセス管理装置およびプロセス管理方法 - Google Patents
プロセス管理装置およびプロセス管理方法 Download PDFInfo
- Publication number
- JP7496481B1 JP7496481B1 JP2024020792A JP2024020792A JP7496481B1 JP 7496481 B1 JP7496481 B1 JP 7496481B1 JP 2024020792 A JP2024020792 A JP 2024020792A JP 2024020792 A JP2024020792 A JP 2024020792A JP 7496481 B1 JP7496481 B1 JP 7496481B1
- Authority
- JP
- Japan
- Prior art keywords
- thread
- fault
- classification
- likelihood function
- process management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 131
- 230000008569 process Effects 0.000 title claims abstract description 128
- 238000007726 management method Methods 0.000 title claims description 62
- 230000006870 function Effects 0.000 claims description 78
- 238000010801 machine learning Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 129
- 230000010365 information processing Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000004579 scanning voltage microscopy Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
図1は、本発明の第1の実施の形態に係るプロセス管理装置1を備えるプロセス管理システムの構成を示すブロック図である。本実施の形態に係るプロセス管理システムは、1つのプロセスが、シングルスレッド処理を実行する1つのスレッド21bを含む第1のスレッドと、マルチスレッド処理を実行する複数のスレッド21aを含む第2のスレッドとを備える場合に、そのプロセスで発生した障害が、第1のスレッドで発生した障害であるのか、あるいは、第2のスレッドで発生した障害であるのかを特定する。
図1に示すように、本実施の形態に係るプロセス管理システムは、プロセス管理装置1、および情報処理装置2を備える。プロセス管理装置1と情報処理装置2とは、例えば、バス101を介して接続されている。
プロセス管理装置1は、第1取得部10、設定部11、判定部12、第1記憶部13、および提示部14を備える。プロセス管理装置1は、1つのスレッド21bを含む第1のスレッドおよび複数のスレッド21aを含む第2のスレッドを備えるプロセス210の管理を行う。
P(X|Y)≒P(Y|X) ・・・(3)
次に、上述した機能を有するプロセス管理装置1を実現するハードウェア構成の一例について、図2を用いて説明する。
次に、上述した構成を有するプロセス管理装置1の動作を、図3のフローチャートを参照して説明する。以下では、情報処理装置2のプロセス210において、シングルスレッド処理を行うスレッド21bおよびマルチスレッド処理を行う複数のスレッド21aで障害情報が通知され、プロセス障害が発生しているものとする。
次に、本発明の第2の実施の形態について説明する。なお、以下の説明では、上述した第1の実施の形態と同じ構成については同一の符号を付し、その説明を省略する。
図4は、本実施の形態に係るプロセス管理装置1Aの構成を示すブロック図である。プロセス管理装置1Aは、第1学習装置1-1および第2学習装置1-2を備える。第1学習装置1-1は、第1取得部10、設定部11、判定部12、第1記憶部13、および提示部14を備える。第1学習装置1-1は、第1の実施の形態に係るプロセス管理装置1の機能ブロックに対応する。第2学習装置1-2は、第2記憶部15(記憶部)、第2取得部16、学習部17、および分類部18を備える。本実施の形態は第2学習装置1-2を備える点で第1の実施の形態とは構成が異なる。以下、第1の実施の形態と異なる構成を中心に説明する。
上述した構成を有するプロセス管理装置1Aの動作について、図6のフローチャートを参照して説明する。図6に示すステップS1からステップS4までの処理は、第1学習装置1-1によって実行され、第1の実施の形態で説明したプロセス管理装置1の動作に係る処理と同様である。以下、ステップS10以降の処理について説明する。
Claims (6)
- 1つのスレッドを含む第1のスレッドと、複数のスレッドを含む第2のスレッドとが実行されるプロセスの管理を行うプロセス管理装置であって、
前記第2のスレッドに含まれる前記複数のスレッドの各々に通知された障害情報の回数を観測データとして取得するように構成された第1取得部と、
前記観測データに基づいて、前記第1のスレッドで障害が発生している条件のもと前記第2のスレッドに含まれる前記複数のスレッドの各々で前記障害情報が通知される確率を、ベイズ推定モデルの尤度関数として設定するように構成された設定部と、
設定された前記尤度関数の値に基づいて、前記第1のスレッドで障害が発生しているか否かを判定するように構成された判定部と、
前記判定部による判定結果を提示するように構成された提示部と
を備えるプロセス管理装置。 - 請求項1に記載のプロセス管理装置において、
さらに、前記尤度関数を未知の入力として、学習済みの機械学習モデルに与え、前記学習済みの機械学習モデルの演算を行って、前記第1のスレッドで障害が発生したことを示す第1分類クラス、および前記第2のスレッドで障害が発生したことを示す第2分類クラスを含む分類クラスに分類するように構成された分類部を備え、
前記提示部は、前記分類部による分類結果を提示する
ことを特徴とするプロセス管理装置。 - 請求項2に記載のプロセス管理装置において、
さらに、前記尤度関数と、前記判定結果によって示される前記分類クラスとが関連付けられた学習用データを取得するように構成された第2取得部と、
前記学習用データに基づいて、前記尤度関数と前記分類クラスとの関係を、機械学習モデルを用いて学習するように構成された学習部と、
前記学習部により構築された前記学習済みの機械学習モデルを記憶するように構成された記憶部と、
を備え、
前記分類部は、前記記憶部から前記学習済みの機械学習モデルを読み出して、前記学習済みの機械学習モデルの演算を行う
ことを特徴とするプロセス管理装置。 - 1つのスレッドを含む第1のスレッドと、複数のスレッドを含む第2のスレッドとが実行されるプロセスの管理を行う、コンピュータによって実行されるプロセス管理方法であって、
前記第2のスレッドに含まれる前記複数のスレッドの各々に通知された障害情報の回数を観測データとして取得する第1取得ステップと、
前記観測データに基づいて、前記第1のスレッドで障害が発生している条件のもと前記第2のスレッドに含まれる前記複数のスレッドの各々で前記障害情報が通知される確率を、ベイズ推定モデルの尤度関数として設定する設定ステップと、
設定された前記尤度関数の値に基づいて、前記第1のスレッドで障害が発生しているか否かを判定する判定ステップと、
前記判定ステップでの判定結果を提示する提示ステップと
を備えるプロセス管理方法。 - 請求項4に記載のプロセス管理方法において、
さらに、前記尤度関数を未知の入力として、学習済みの機械学習モデルに与え、前記学習済みの機械学習モデルの演算を行って、前記第1のスレッドで障害が発生したことを示す第1分類クラス、および前記第2のスレッドで障害が発生したことを示す第2分類クラスを含む分類クラスに分類する分類ステップを備え、
前記提示ステップは、前記分類ステップでの分類結果を提示する
ことを特徴とするプロセス管理方法。 - 請求項5に記載のプロセス管理方法において、
さらに、前記尤度関数と、前記判定結果によって示される前記分類クラスとが関連付けられた学習用データを取得する第2取得ステップと、
前記学習用データに基づいて、前記尤度関数と前記分類クラスとの関係を、機械学習モデルを用いて学習する学習ステップと、
前記学習ステップで構築された前記学習済みの機械学習モデルを記憶部に記憶する記憶ステップと、
を備え、
前記分類ステップは、前記記憶部から前記学習済みの機械学習モデルを読み出して、前記学習済みの機械学習モデルの演算を行う
ことを特徴とするプロセス管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024020792A JP7496481B1 (ja) | 2024-02-15 | 2024-02-15 | プロセス管理装置およびプロセス管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024020792A JP7496481B1 (ja) | 2024-02-15 | 2024-02-15 | プロセス管理装置およびプロセス管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP7496481B1 true JP7496481B1 (ja) | 2024-06-06 |
Family
ID=91321876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024020792A Active JP7496481B1 (ja) | 2024-02-15 | 2024-02-15 | プロセス管理装置およびプロセス管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7496481B1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009223362A (ja) | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | 故障診断装置およびプログラム |
WO2022259446A1 (ja) | 2021-06-10 | 2022-12-15 | 日本電気株式会社 | 異常原因推定装置、異常原因推定方法、及びコンピュータ読み取り可能な記録媒体 |
JP7329162B1 (ja) | 2023-05-11 | 2023-08-17 | 株式会社インターネットイニシアティブ | 情報処理装置および情報処理方法 |
JP7414135B2 (ja) | 2020-06-03 | 2024-01-16 | 日本電信電話株式会社 | モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム |
-
2024
- 2024-02-15 JP JP2024020792A patent/JP7496481B1/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009223362A (ja) | 2008-03-13 | 2009-10-01 | Fuji Xerox Co Ltd | 故障診断装置およびプログラム |
JP7414135B2 (ja) | 2020-06-03 | 2024-01-16 | 日本電信電話株式会社 | モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム |
WO2022259446A1 (ja) | 2021-06-10 | 2022-12-15 | 日本電気株式会社 | 異常原因推定装置、異常原因推定方法、及びコンピュータ読み取り可能な記録媒体 |
JP7329162B1 (ja) | 2023-05-11 | 2023-08-17 | 株式会社インターネットイニシアティブ | 情報処理装置および情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Task failure prediction in cloud data centers using deep learning | |
Salfner et al. | A survey of online failure prediction methods | |
Islam et al. | Predicting application failure in cloud: A machine learning approach | |
US6629266B1 (en) | Method and system for transparent symptom-based selective software rejuvenation | |
EP2341434B1 (en) | Method and apparatus for performing root cause analysis | |
EP1623325B1 (en) | Managing tasks in a data processing environment | |
US20080250265A1 (en) | Systems and methods for predictive failure management | |
EP4091110B1 (en) | Systems and methods for distributed incident classification and routing | |
CN109656782A (zh) | 可视化调度监控方法、装置及服务器 | |
US20120072780A1 (en) | Continuous System Health Indicator For Managing Computer System Alerts | |
US7124119B2 (en) | Communication between intelligent agents and humans in a distributed system environment | |
Jauk et al. | Predicting faults in high performance computing systems: An in-depth survey of the state-of-the-practice | |
US20230038164A1 (en) | Monitoring and alerting system backed by a machine learning engine | |
CN112416562A (zh) | 一种分布式任务调度引擎的方法及装置 | |
US20220382614A1 (en) | Hierarchical neural network-based root cause analysis for distributed computing systems | |
Yoo et al. | Machine learning based job status prediction in scientific clusters | |
JP7496481B1 (ja) | プロセス管理装置およびプロセス管理方法 | |
Li et al. | Workload failure prediction for data centers | |
US11855849B1 (en) | Artificial intelligence based self-organizing event-action management system for large-scale networks | |
Lan et al. | A fault diagnosis and prognosis service for teragrid clusters | |
Watanabe et al. | Failure prediction for cloud datacenter by hybrid message pattern learning | |
EP4070197A1 (en) | Device for monitoring a computer network system | |
Wang et al. | SaaS software performance issue identification using HMRF‐MAP framework | |
CN116841792B (zh) | 一种应用程序开发故障修复方法 | |
US20240104580A1 (en) | Service level agreement management and breach detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240215 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20240215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240415 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7496481 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |