TW201701615A - 障礙診斷架構及其方法 - Google Patents

障礙診斷架構及其方法 Download PDF

Info

Publication number
TW201701615A
TW201701615A TW104120453A TW104120453A TW201701615A TW 201701615 A TW201701615 A TW 201701615A TW 104120453 A TW104120453 A TW 104120453A TW 104120453 A TW104120453 A TW 104120453A TW 201701615 A TW201701615 A TW 201701615A
Authority
TW
Taiwan
Prior art keywords
obstacle
diagnosis
module
knowledge base
analysis
Prior art date
Application number
TW104120453A
Other languages
English (en)
Other versions
TWI578739B (zh
Inventor
Chun-Yu Chang
An-Ni Ren
Chieh-Feng Li
Min-Yi Tsai
Original Assignee
Chunghwa Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Telecom Co Ltd filed Critical Chunghwa Telecom Co Ltd
Priority to TW104120453A priority Critical patent/TWI578739B/zh
Publication of TW201701615A publication Critical patent/TW201701615A/zh
Application granted granted Critical
Publication of TWI578739B publication Critical patent/TWI578739B/zh

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本發明係揭露一種障礙診斷架構及其方法,軟體定義儲存伺服器與測試客戶端自動回傳監測資訊予障礙分析模組,障礙分析模組結合障礙資訊、測試客戶端以及軟體定義儲存伺服器回傳之監測資訊三者,並經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析後,將關聯模型結果更新至障礙診斷知識庫,障礙偵測模組透過障礙知識庫能夠即時準確地診斷系統是否已發生障礙以及預測障礙是否即將發生,達到準確診斷與預測障礙之目的,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。

Description

障礙診斷架構及其方法
本發明係關於一種應用於障礙診斷架構及其方法,特別係指在針對x86架構之軟體定義儲存伺服器(Software-Defined Storage),即時診斷當下軟體定義儲存伺服器系統是否發生障礙以及預測系統是否即將發生障礙。
過往係利用一或多個裝設於行動網路機房之訊務監測儀,自動進行行動網路各介面訊務監測,並將原始訊務紀錄送往一或多個訊務解碼器進行解碼;再將已解碼之訊務紀錄送往訊務分析器進行分析;該訊務分析器進行多介面訊務分析及專家系統化問題診斷後將分析結果送往分析結果儲存庫進行儲存。訊務分析結果呈現器亦可主動發送行動網路訊務分析報表及行動網路運作問題告警給系統使用者。
或是針對系統故障診斷提出的一個架構,其中包括故障訓練模組與診斷模組。在訓練階段需要人為對目標系統進行特定故障注入,然後藉由可讀指令來監聽並收集發生特定故障時系統中可觀測的資料。收集到的資料將被訓練成故障診斷模型,其中包含置換圖(substitution graph)與檢測圖(detection graph)。這個診斷模型將在未來被用於診斷運行中的系統是否發生故障。在故障診斷階段,故障診斷模組 會根據監聽到的系統資料與診斷模型進行比對。如果監聽到的資料與模型相匹配,則可判斷系統存在相應的故障,而這樣的系統必須於試營運階段透過測試來訓練診斷模型,且並不能準確診斷出可能發生那些故障。
本案發明人鑑於上述習用方式所衍生的各項缺點, 乃亟思加以改良創新,並經多年苦心孤詣潛心研究後,終於成功研發完成本障礙診斷架構及其方法。
本發明的目的即在於提出一包括障礙診斷架構及 其方法,針對x86架構之軟體定義儲存伺服器(Software-Defined Storage),障礙診斷模組依據障礙診斷知識庫,即時診斷當下軟體定義儲存伺服器系統是否發生障礙以及預測系統是否即將發生障礙。當障礙診斷模組依據障礙知識庫得知障礙發生時,立即發送告警並通知障礙分析模組,障礙分析模組依據障礙資訊、軟體定義儲存伺服器狀態以及測試客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙知識庫的持續自我學習能夠讓系統診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
障礙診斷知識庫初始注入已知障礙,已知障礙可 為軟體定義儲存伺服器的處理器使用率門檻值、記憶體使用率門檻值、磁碟存取吞吐量門檻值、每秒操作次數門檻值、監測特定程序存在與否、客戶端回應時間或延遲時間門檻值等,或是以上各種條件之組合。障礙診斷知識庫初始後,系 統運行過程中持續診斷障礙,同時透過軟體定義儲存伺服器量測回報模組與客戶端量測回報模組回報數據收集模組軟體定義儲存伺服器狀態以及客戶端狀態,數據收集模組收集軟體定義儲存伺服器狀態以及客戶端狀態資訊,狀態包含軟體定義儲存伺服器即時處理器使用率、記憶體使用率、磁碟存取吞吐量、每秒操作次數、特定程序存在與否以及客戶端反應時間、延遲時間等資訊,經過過濾、分析後存放於資料庫內。當障礙診斷模組依據障礙知識庫得知障礙發生時,發送告警並通知障礙分析模組,障礙分析模組藉由障礙、軟體定義儲存伺服器狀態以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙診斷知識庫藉此自我學習之機制,能夠令障礙診斷更加準確。當障礙診斷知識庫越來越完整,障礙診斷模組只要觀察到系統滿足某些條件,即可預測障礙即將發生,達到障礙預測之目的。障礙知識庫的持續自我學習能夠讓系統準確診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
一種障礙診斷架構,係包括一虛擬化資源管理平 台,為接收一中央控制與監測系統之請求;一虛擬客戶端群集,為虛擬客戶端,接受虛擬化資源管理平台自動佈建測試環境進行測試,其虛擬客戶端,另具有一客戶端量測模組,以提供一障礙分析系統需接收之回報資訊;一軟體定義儲存伺服器,具有一障礙回報代理,而障礙回報代理另具有一量測回報模組,以提供該障礙分析系統需接收之回報資訊;中央控制與監測系統,具有一障礙分析系統,並收集來自虛擬客戶端群集與該軟體定義儲存伺服器之回報狀態資訊。
其中障礙分析系統,另具有:一數據收集模組,於系統運行過程中持續接收障礙回報代理以及虛擬客戶端之狀態資訊,並經由統計、過濾、分析後存放於資料庫;一障礙分析模組,於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫,則具有自行記錄學習障礙診斷;一障礙診斷模組,依據障礙診斷知識庫,診斷是否已經存在障礙以及預測障礙是否即將發生,其中建立關聯分析,係為統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法。
一種障礙診斷方法,其流程包括:障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組;客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
其中該障礙診斷知識庫,係同時可以自我學習,使障礙診斷更為準確。
本發明所提供一種障礙診斷架構及其方法,與其他習用技術相互比較時,更具備下列優點:
1.本發明讓系統運行過程中,障礙診斷模組依據所自我學習建立之障礙知識庫即時監測客戶端與軟體定義儲存伺服器狀態,立即診斷軟體定義儲存伺服器系統是否發生障礙以及預測是否即將發生障礙。
2.本發明於障礙發生時會立即回報障礙分析模組,障礙分析模組依據障礙資訊、軟體定義儲存伺服器狀態以及測試客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,關聯模型結果更新至障礙診斷知識庫。障礙知識庫的持續自我學習能夠讓系統診斷與預測未知障礙,提升軟體定義儲存伺服器系統障礙診斷正確與可靠度。
110‧‧‧虛擬化資源管理平台
120‧‧‧虛擬客戶端群集
121‧‧‧虛擬客戶端
1211‧‧‧客戶端量測模組
130‧‧‧軟體定義儲存伺服器
131‧‧‧障礙回報代理
1311‧‧‧量測回報模組
140‧‧‧中央控制與監測系統
141‧‧‧障礙分析系統
1411‧‧‧數據收集模組
1412‧‧‧障礙分析模組
1413‧‧‧障礙診斷知識庫
1414‧‧‧障礙診斷模組
1415‧‧‧資料庫
S310~S350‧‧‧障礙診斷流程
請參閱有關本發明之詳細說明及其附圖,將可進一步瞭解本發明之技術內容及其目的功效;有關附圖為:圖1為本發明障礙診斷架構及其方法之架構圖;圖2為本發明障礙診斷架構及其方法之模組圖;圖3為本發明障礙診斷架構及其方法之流程圖。
為了使本發明的目的、技術方案及優點更加清楚明白,下面結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,但並不用於限定本發明。
以下,結合附圖對本發明進一步說明:請參閱圖1、及圖2所示,為本發明障礙診斷架構及其方法之架構圖及模組圖,其中一種障礙診斷架構,係包括:一虛擬化資源管理平台110,是為接收一中央控制與監測系統140之請求;一虛擬客戶端群集120,是為虛擬客戶端121,為接受虛擬化資源管理平台110自動佈建測試環境進行測試,其虛擬客戶端121,另具有一客戶端量測模組1211,以提供一障礙分析系統141需接收之回報資訊;一軟體定義儲存伺服器130,是具有一障礙回報代理131,其障礙回報代理131,另具有一量測回報模組1311,以提供一障礙分析系統141需接收之回報資訊;中央控制與監測系統140,是具有障礙分析系統141,並收集來自虛擬客戶端群集120與軟體定義儲存伺服器130之回報狀態資訊。
其障礙分析系統141,另具有一數據收集模組1411,於系統運行過程中持續接收障礙回報代理131以及虛擬客戶端121之狀態資訊,並經由統計、過濾、分析後存放於資料庫1415;一障礙分析模組1412,係於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫1413,具有自行記錄學習障礙診斷;一障礙診斷模組1414,依據該障礙診斷知識庫1413,診斷是否已經存在障礙以及預測障礙是否即將發生。
其建立關聯分析,是為統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法。
一種障礙診斷方法,其流程包括:S310障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組; S320客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;S330數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;S340障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;S350障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
其中障礙診斷知識庫,可以同時自我學習,使障礙診斷更為準確。
上列詳細說明乃針對本發明之一可行實施例進行具體說明,惟該實施例並非用以限制本發明之專利範圍,凡未脫離本發明技藝精神所為之等效實施或變更,均應包含於本案之專利範圍中。
綜上所述,本案不僅於技術思想上確屬創新,並具備習用之傳統方法所不及之上述多項功效,已充分符合新穎性及進步性之法定發明專利要件,爰依法提出申請,懇請貴局核准本件發明專利申請案,以勵發明,至感德便。
110‧‧‧虛擬化資源管理平台
120‧‧‧虛擬客戶端群集
121‧‧‧虛擬客戶端
130‧‧‧軟體定義儲存伺服器
131‧‧‧障礙回報代理
140‧‧‧中央控制與監測系統
141‧‧‧障礙分析系統

Claims (5)

  1. 一種障礙診斷架構,係包括:一虛擬化資源管理平台,係為接收一中央控制與監測系統之請求;一虛擬客戶端群集,係為虛擬客戶端,係接受該虛擬化資源管理平台自動佈建測試環境進行測試,其虛擬客戶端,另具有一客戶端量測模組,以提供一障礙分析系統需接收之回報資訊;一軟體定義儲存伺服器,係具有一障礙回報代理,其該障礙回報代理,係另具有一量測回報模組,係以提供該障礙分析系統需接收之回報資訊;該中央控制與監測系統,係具有一障礙分析系統,並收集來自該虛擬客戶端群集與該軟體定義儲存伺服器之回報狀態資訊。
  2. 如申請專利範圍第1項所述之障礙診斷架構,其中該障礙分析系統,係另具有:一數據收集模組,係於該系統運行過程中持續接收該障礙回報代理以及該虛擬客戶端之狀態資訊,並經由統計、過濾、分析後存放於資料庫;一障礙分析模組,係於障礙發生的同時,透過障礙、軟體定義儲存伺服器以及虛擬客戶端進行統計,並建立關聯分析;一障礙診斷知識庫,係具有自行記錄學習障礙診斷;一障礙診斷模組,係依據該障礙診斷知識庫,診斷是否已經存在障礙以及預測障礙是否即將發生。
  3. 如申請專利範圍第2項所述之障礙診斷架構,其中該建立 關聯分析,係為統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法。
  4. 一種障礙診斷方法,其流程包括:障礙回報代理之量測回報模組回傳軟體定義儲存伺服器狀態於數據收集模組;客戶端量測回報模組回傳即時客戶端的狀態測試資訊於該數據收集模組;數據收集模組於系統運行過程中持續接該收軟體定義儲存伺服狀態以及客戶端狀態資訊,並經過統計、過濾、分析後存放於資料庫內;障礙診斷模組則依據障礙診斷知識庫,即時診斷是否已經存在障礙以及預測障礙是否即將發生,若診斷或預測出障礙,立即產生告警通知;障礙分析模組在障礙發生的同時會透過障礙、軟體定義儲存伺服器以及客戶端狀態,三者經過統計、障礙判斷模型、經驗法則與關聯規則挖掘演算法建立關聯分析,而關聯分析結果則更新至障礙診斷知識庫。
  5. 如申請專利範圍第4項所述之障礙診斷方法,其中該障礙診斷知識庫,係同時自我學習,使障礙診斷更為準確。
TW104120453A 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof TWI578739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Publications (2)

Publication Number Publication Date
TW201701615A true TW201701615A (zh) 2017-01-01
TWI578739B TWI578739B (zh) 2017-04-11

Family

ID=58400820

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104120453A TWI578739B (zh) 2015-06-25 2015-06-25 Obstacle diagnosis system and method thereof

Country Status (1)

Country Link
TW (1) TWI578739B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI664835B (zh) * 2017-10-18 2019-07-01 中華電信股份有限公司 用於分析行動網路中用戶通訊中斷成因之智能方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108780319A (zh) * 2018-06-08 2018-11-09 珊口(深圳)智能科技有限公司 软件更新方法、系统、移动机器人及服务器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10120775B4 (de) * 2001-04-24 2005-09-29 Msa Auer Gmbh Überwachungs- und Warnsystem für im Brand- und Katastropheneinsatz tätige Rettungskräfte
DE10161261C2 (de) * 2001-12-13 2003-10-16 Daimler Chrysler Ag Dialogsystem für Warn- und Informationssysteme
CN103414581A (zh) * 2013-07-24 2013-11-27 佳都新太科技股份有限公司 一种基于数据挖掘的设备故障报警预测处理机制
CN103888287B (zh) * 2013-12-18 2016-01-27 北京首都国际机场股份有限公司 信息系统一体化运维监控服务预警平台

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI664835B (zh) * 2017-10-18 2019-07-01 中華電信股份有限公司 用於分析行動網路中用戶通訊中斷成因之智能方法

Also Published As

Publication number Publication date
TWI578739B (zh) 2017-04-11

Similar Documents

Publication Publication Date Title
US11442803B2 (en) Detecting and analyzing performance anomalies of client-server based applications
US8156377B2 (en) Method and apparatus for determining ranked causal paths for faults in a complex multi-host system with probabilistic inference in a time series
US8230262B2 (en) Method and apparatus for dealing with accumulative behavior of some system observations in a time series for Bayesian inference with a static Bayesian network model
US7693982B2 (en) Automated diagnosis and forecasting of service level objective states
US8291263B2 (en) Methods and apparatus for cross-host diagnosis of complex multi-host systems in a time series with probabilistic inference
US8874642B2 (en) System and method for managing the performance of an enterprise application
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN102740112B (zh) 一种基于视频监控系统的设备轮巡的控制方法
Kavulya et al. Failure diagnosis of complex systems
Mariani et al. Predicting failures in multi-tier distributed systems
CN110943874B (zh) 一种家庭宽带网络的故障检测方法、装置和可读介质
KR20190021560A (ko) 빅데이터를 활용한 고장예지보전시스템 및 고장예지보전방법
JP2014532913A (ja) 診断歴に基づく不具合検出方法
US20130091385A1 (en) User-coordinated resource recovery
CN110224885A (zh) 设备监控的告警方法、装置、存储介质及电子设备
US10432477B2 (en) Performance monitoring at edge of communication networks using hybrid multi-granular computation with learning feedback
TWI578739B (zh) Obstacle diagnosis system and method thereof
Singh et al. Parametric evaluation techniques for reliability of Internet of Things (IoT)
US8385213B2 (en) Error identification in a computer-based network
US8972789B2 (en) Diagnostic systems for distributed network
CN110490132B (zh) 数据处理方法和装置
CN109309575A (zh) 一种确定监控系统健康度的方法和装置
JP6832890B2 (ja) 監視装置、監視方法、及びコンピュータプログラム
WO2023200597A1 (en) Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data
CN110719197A (zh) 一种列车车载以太网状态预测方法及装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees