TW201627883A - 設備端故障排除方法 - Google Patents
設備端故障排除方法 Download PDFInfo
- Publication number
- TW201627883A TW201627883A TW104102121A TW104102121A TW201627883A TW 201627883 A TW201627883 A TW 201627883A TW 104102121 A TW104102121 A TW 104102121A TW 104102121 A TW104102121 A TW 104102121A TW 201627883 A TW201627883 A TW 201627883A
- Authority
- TW
- Taiwan
- Prior art keywords
- repair
- weight value
- troubleshooting method
- repairing
- server
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer And Data Communications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
一種設備端故障排除方法,適於伺服器。此設備端故障排除方法包括下列步驟。接收紀錄檔,其中紀錄檔傳送自設備端。根據紀錄檔產生多個修復方案的其中之一,其中各個修復方案分別對應一權重值。提供修復方案的其中之一至設備端。接收設備端回應的結果檔,其中結果檔對應修復方案。根據結果檔調整修復方案的權重值,並回到接收記錄檔的步驟。藉此達成設備端故障排除方法自我學習的功能,以增加設備端故障排除的成功率以及便利性。
Description
本發明有關於一種設備端故障排除方法,特別是一種適於伺服器的設備端故障排除方法。
一般來說,伺服器與設備端之間都會進行連線,而設備端往往分佈於不同實體地點,且在系統上呈現不同的紀錄,當設備端發生故障時,傳統的故障排除方法均依靠人工發現設備端的故障,再由人工逐一查驗設備端的系統紀錄並判斷原因,最後根據故障原因由人工手動排除障礙。當設備端數量眾多或設備端散佈地點的物理距離較長時,傳統的設備端管理方法也相對耗費過多的人工時間且效率低落。
傳統的設備端故障排除方法,需要靠人工經驗判斷採用何種方法排除故障,除了高度仰賴人工經驗之外,也未能有效紀錄各種修復方案的解決成效,因此無法快速提出有效的修復方案。因此,伺服器對於與設備端的故障排除方法仍有改善的空間。
有鑑於此,本發明提供一種設備端故障排除方法,藉以增加設備端故障排除的效率以及便利性。
本發明提供一種設備端故障排除方法,適於伺服器。此設備端故障排除方法包括下列步驟。接收紀錄檔,其中紀錄檔傳送自設備端。根據紀錄檔產生多個修復方案的其中之一,其中各個修復方案分別對應一權重值。提供修復方案的其中之一至設備端。接收設備端回應的結果檔,其中結果檔對應修復方案。
在一實施例中,前述設備端故障排除方法更包括根據結果檔調整修復方案的權重值,並回到接收記錄檔的步驟。
在一實施例中,前述調整修復方案的權重值可包括下列步驟。根據結果檔,取得修復訊息。根據修復訊息的狀態,計算修復方案的成功率。根據成功率,調整修復方案的權重值。
在一實施例中,前述調整修復方案的權重值亦可包括下列步驟。根據結果檔,取得一第一修復時間。比較第一修復時間與其餘修復方案所記錄的第二修復時間,以產生比較結果。根據比較結果,調整修復方案的權重值。
本發明所提供的設備端故障排除方法,藉由伺服器在接收到設備端所發出的紀錄檔後才據以產生對應的修復方案,以及伺服器端在接收到設備端所回應的結果檔後,據以調整修復方案的權重值。如此一來,可以根據修復結果的成功率或修復時間,調整伺服器
提供修復方案的順序,達成設備端故障排除方法自我學習的功能,以增加設備端故障排除的成功率以及便利性,並有效降低人員查修的時間。
以上之關於本發明內容之說明及以下之實施方式之說明用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
100‧‧‧伺服器
101、102、103‧‧‧設備端
圖1為本發明之一實施例所揭露之設備端與伺服器之間資料傳送的示意圖。
圖2為本發明之一實施例所揭露之設備端故障排除方法的流程圖。
圖3為圖2之步驟S210的詳細流程圖。
圖4為圖2之步驟S210的另一詳細流程圖。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
如在說明書及申請專利範圍當中使用了某些詞彙來指稱特定元件。本領域技術人員應可理解,硬體製造商可能會用不同名詞來稱呼同一個元件。本說明書及申請專利範圍並不以名稱的差異來作為區分元件的方式,而是以元件在功能上的差異來作為區分的準則。如在通篇說明書及申請專利範圍當中所提及的“包含”為一開放式用語,故應解釋成“包含但不限定於”。“大致”是指在可接收的誤差範圍內,本領域技術人員能夠在一定誤差範圍內解決所述技術問題,基本達到所述技術效果。說明書後續描述為實施本申請的各項實施方式,然所述描述乃以說明本申請的一般原則為目的,並非用以限定本申請的範圍。本申請的保護範圍當視所附申請專利範圍所界定者為准。
還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者系統不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者系統所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、商品或者系統中還存在另外的相同要素。
圖1為本發明之一實施例所揭露之設備端與伺服器之間資料傳送的示意圖。圖2為本發明之一實施例所揭露之設備端故障排除方法的流程圖。本實施例之設備端故障排除方法適於伺服器
100,也就是用於伺服器100排除設備端101、102、103故障的方法。其中,設備端101、102、103例如為網路攝影機、連網環境感測器或與網路連線的通訊設備,但設備端的種類不以此為限。為了方便說明,在下述各項實施例中,設備端101、102、103均僅以設備端101為代表。
在步驟S202中,接收紀錄檔(log file),其中紀錄檔傳送自設備端101。也就是說,伺服器100會接收設備端101所發送紀錄檔,而此紀錄檔例如為設備端101運行或設備端101執行某一程式的結果。前述紀錄檔的發送可以是根據設定採用定時發送模式,或是依設備端101的運行狀態採不定時發送模式。並且,紀錄檔例如包括設備端101的設備位址資訊以及故障資訊。
進一步來說,設備位址資訊例如用以提供伺服器100了解設備端101的基本資料,例如設備名稱、設備種類、IP位址、連線類型、開機時間以及運行時間等基本資料,但基本資料不以此為限。故障資訊例如用以提供伺服器100了解設備端101故障的狀態與類型,例如故障種類、故障原因、故障時間以及故障持續時間等故障訊息,但故障訊息不以此為限。
在步驟S204中,根據紀錄檔挑選多個修復方案(solution)的其中之一,其中各個修復方案分別對應一權重值。也就是說,當伺服器100接收到設備端101所發出的紀錄檔時,伺服器100根據當前紀錄檔的資訊,例如從其資料庫所儲存的多種不同的修復方案
中,挑選出可對設備端101進行故障排除的修復方案。進一步來說,前述的多個修復方案分別還對應了一權重值,以便於伺服器100可根據前述權重值挑選出適合的修復方案。
在步驟S206中,提供多個修復方案的其中之一至設備端101。也就是說,在挑選合適的修復方案後,伺服器100將所選取的修復方案提供給設備端101,以進行故障排除的操作。
在本實施例中,伺服器100提供至設備端101的修復方案的其中之一的權重值例如為各個修復方案中權重值最大的。換句話說,伺服器100例如會對前述權重值進行排序,以便依據權重值大小,從多個修復方案中挑選權重值最大的修復方案,以供設備端101進行故障排除。此外,前述修復方案例如包括修復指令及/或修復程式。
在步驟S208中,接收設備端回應的結果檔(result file),其中結果檔對應修復方案。也就是說,設備端101會根據伺服器100所提供之修復方案(例如權重值為最大的),進行故障排除,以產出對應前述修複方案的結果檔,結果檔中紀錄執行修復方案的相關資訊,例如修復結果成功與否、修復時間,設備端101再將前述結果檔發送至伺服器100。
在步驟S210中,根據結果檔調整修復方案的權重值。也就是說,當伺服器100接收到設備端101所發出的結果檔時,伺服器100會根據結果檔的訊息調整先前提供給設備端101之權重值最大的修復方案的權重值,亦即對前述的權重值進行更新,以利下一次伺服
器100需要提供修復方案給設備端101時,可以根據調整後的權重值進行排序,以挑選出適合設備端101進行故障排除的修復方案。
接著,在步驟S210執行完成後,可再次回到步驟S202,並重複步驟S202至S210,以持續對設備端101進行監控及故障排除的操作,以及對應故常排除的結果調整修復方案的權重值等相關流程。
藉由上述的說明可知,伺服器100欲進行設備端101的故障排除方法,都需要先接收各個設備端101、102、103所提供的紀錄檔,以獲得紀錄檔中的設備位址資訊以及故障資訊,並根據紀錄檔的資訊從多個修復方案中挑選適合的修復方案(例如權重值最大的修復方案),再提供此適合的的修復方案至設備端101、102、103,以供設備端101、102、103進行故常排除的修復。另外,伺服器100還會進一步接收並依據設備端101、102、103所回應的結果檔,調整結果檔所對應之修復方案的權重值,以作為下一次挑選適合之修復方案的依據。
以上的實施例說明,是以伺服器100提供至設備端101的修復方案的其中之一的權重值為各個修復方案中權重值最大的為例,但本發明不以此為限。
在本發明另一實施例中,伺服器100提供至設備端101的修復方案的其中之一的權重值也可以是各個修復方案中權重值最小的。換句話說,伺服器100例如會對前述權重值進行排序,以便依
據權重值大小,從多個修復方案中挑選權重值最小的修復方案,以供設備端101進行故障排除。此外,前述修復方案例如包括修復指令及/或修復程式。
圖3為圖2之步驟S210的詳細流程圖。在步驟S312,根據結果檔,取得修復訊息。也就是說,伺服器100根據設備端101發送的結果檔,獲得設備端101進行故障排除的修復訊息。在本實施例中,修復訊息例如是修復成功或修復失敗,但修復訊息不以此為限,修複訊息例如也可以是設備狀態、修復作業時間以及修復方案對應的修復次數等修復訊息。
在步驟S314中,根據修復訊息的狀態,計算修復方案的成功率。其中,修復訊息的狀態為修復成功或修復失敗。舉例來說,當修復訊息為修復成功(例如成功排除設備端101的故障)時,則伺服器100例如增加此種修復方案的成功次數。當修復訊息為修復失敗(例如無法排除設備端101的故障)時,則伺服器100增加此種修復方案的失敗次數。接著,伺服器100則會根據前述統計的成功次數與失敗次數,計算此修復方案對應設備端101進行故障排除的成功率。
在步驟S316中,根據成功率,調整修復方案的權重值。也就是說,設備端101有多種故障類型,例如B1-B10,每種類型均可對應多種修復方案例如F1-F5。在每種故障類型中,伺服器100會依據各個修復方案的成功率,調整修復方案的權重值。在本實施例中,權重值大小與成功率高低成正比。
舉例而言,當以修復方案F1進行故障類型B1的成功率越高時,代表修復方案F1較容易修復故障類型B1,伺服器100將提高故障類型B1中修復方案F1的權重值。如此,當設備端101下次同樣發生故障類型B1時,伺服器100將優先挑選高成功率的修復方案F1,供設備端101進行故障排除,使得設備端101儘早恢復工作模式。
換句話說,當以修復方案F2進行故障類型B2的成功率越低時,代表修復方案F2不易修復故障類型B2,伺服器100將降低修復方案F2在故障類型B2的權重值。如此,當下次同樣發生故障類型B2時,伺服器100將先行挑選其他修復方案(例如修復方案F3),供設備端101進行故障排除。
圖4為圖2之步驟S210的另一詳細流程圖。
在步驟S412,根據結果檔,取得第一修復時間。也就是說,伺服器100根據設備端101發送的結果檔,獲得設備端101修復成功所耗費的第一修復時間T1。在本實施例中,第一修復時間T1例如是設備端101經由修復方案進行故障排除,修復方案將設備端101從故障模式修復至工作模式所耗費的作業時間,但第一修復時間T1不以此為限。
在步驟S414中,比較第一修復時間T1與其餘之修復方案所記錄之第二修復時間T2,以產生比較結果。舉例來說,設備端101可以有多種故障類型,例如B1-B10,且每種類型均可對應多種修復方案例如F1-F5。假設伺服器100提供故障類型B1的修復方案F1,且
設備端101據以進行對應的故障排除處理,則其故障排除處理所耗費的時間例如為第一修復時間T1。接著,伺服器100會將結果檔中的第一修復時間T1與其他排除故障類型B1的修復方案F2-F5耗費的第二修復時間T2進行比較,並產生比較結果。其中,前述比較結果例如為第一修復時間T1大於第二修復時間T2,或是第一修復時間T1小於第二修復時間T2。
在步驟S416中,伺服器100根據比較結果,調整修復方案的權重值。也就是說,在對應故障類型B1,伺服器100會依據前述的比較結果(亦即各個修復方案的修復時間長短),調整修復方案的權重值。在本實施例中,前述修復方案所對應之權重值大小例如與修復時間長短成反比。
舉例而言,當以修復方案F1進行故障類型B1的修復時間越短時,代表修復方案F1修復故障類型B1的效率較高,則伺服器100將提高故障類型B1中修復方案F1的權重值。如此,當設備端101下次同樣發生故障類型B1時,伺服器100將優先挑選修復時間短的修復方案F1,以供設備端101進行故障排除,使得設備端101儘早恢復工作模式。
換句話說,當以修復方案F2進行故障類型B2的修復時間越長時,代表修復方案F2修復故障類型B2的效率較低,伺服器100將降低修復方案F2在故障類型B2的權重值。如此,當設備端101下次同樣發生故障類型B2時,伺服器100將先行挑選其他修復方案(例如修
復方案F3),以供設備端101進行故障排除。
本實施例所提供之設備端故障排除方法,藉由伺服器接收到設備端所發出的紀錄檔後才據以產生對應的修復方案,以及設備端在接收到伺服器所提供的修復方案進行故障排除後才據以產生對應的結果檔,伺服器再根據結果檔調整修復方案的權重值。如此一來,根據修復結果的成功率或修復時間,調整伺服器提供修復方案的順序,達成設備端故障排除方法自我學習的功能,以增加設備端故障排除的成功率以及便利性,並有效降低人員查修的時間。
本發明之方法,或特定型態或其部份,可以以程式碼的型態存在。程式碼可儲存於實體媒體,如軟碟、光碟片、硬碟、或是任何其他機器可讀取(如電腦可讀取)儲存媒體,亦或不限於外在形式之電腦程式產品,其中,當程式碼被機器,如電腦載入且執行時,此機器變成用以參與本發明之裝置。程式碼也可透過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態進行傳送,其中,當程式碼被機器,如電腦接收、載入且執行時,此機器變成用以參與本發明之裝置。當在一般用途處理單元實作時,程式碼結合處理單元提供一操作類似於應用特定邏輯電路之獨特裝置。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
Claims (12)
- 一種設備端故障排除方法,適於一伺服器,該設備端故障排除方法包括:接收一紀錄檔,其中該紀錄檔傳送自一設備端;根據該紀錄檔挑選多個修復方案的其中之一,其中該些修復方案分別對應一權重值;提供該些修復方案的其中之一至該設備端;以及接收該設備端回應的一結果檔,其中該結果檔對應該修復方案。
- 如請求項1所述之設備端故障排除方法,其中該紀錄檔包括一設備位址資訊以及一故障資訊。
- 如請求項1所述之設備端故障排除方法,其中提供至該設備端的該些修復方案的其中之一的該權重值為該些權重值中最大的。
- 如請求項1所述之設備端故障排除方法,其中提供至該設備端的該些修復方案的其中之一的該權重值為該些權重值中最小的。
- 如請求項1所述之設備端故障排除方法,更包括根據該結果檔調整該修復方案的該權重值,並回到該接收該記錄檔的步驟。
- 如請求項5所述之設備端故障排除方法,其中調整該修復方案的該權重值包括:根據該結果檔,取得一修復訊息;根據該修復訊息的狀態,計算該修復方案的一成功率;以及根據該成功率,調整該修復方案的該權重值。
- 如請求項6所述之設備端故障排除方法,其中該權重值大小與該 成功率高低成正比。
- 如請求項6所述之設備端故障排除方法,其中該權重值大小與該成功率高低成反比。
- 如請求項5所述之設備端故障排除方法,其中調整該修復方案的該權重值包括:根據該結果檔,取得一第一修復時間;比較該第一修復時間與其餘之該些修復方案所記錄之第二修復時間,以產生一比較結果;以及根據該比較結果,調整該修復方案的該權重值。
- 如請求項9所述之設備端故障排除方法,其中該權重值大小與該些修復時間長短成反比。
- 如請求項9所述之設備端故障排除方法,其中該權重值大小與該些修復時間長短成正比。
- 如請求項1所述之設備端故障排除方法,其中該修復方案更包括一修復指令及/或一修復程式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104102121A TW201627883A (zh) | 2015-01-22 | 2015-01-22 | 設備端故障排除方法 |
CN201510136767.1A CN104901828A (zh) | 2015-01-22 | 2015-03-26 | 设备端故障排除方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW104102121A TW201627883A (zh) | 2015-01-22 | 2015-01-22 | 設備端故障排除方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201627883A true TW201627883A (zh) | 2016-08-01 |
Family
ID=54034232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104102121A TW201627883A (zh) | 2015-01-22 | 2015-01-22 | 設備端故障排除方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104901828A (zh) |
TW (1) | TW201627883A (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106201757B (zh) * | 2016-07-12 | 2020-05-26 | 网易(杭州)网络有限公司 | 一种异常处理方法和装置 |
CN107332722A (zh) * | 2017-08-31 | 2017-11-07 | 郑州云海信息技术有限公司 | 一种故障信息的排除方法及系统 |
CN109901544A (zh) * | 2017-12-07 | 2019-06-18 | 开利公司 | 制冷系统、用于其的故障诊断系统、故障诊断方法及控制器与存储介质 |
CN110866839A (zh) * | 2019-10-25 | 2020-03-06 | 袁茂银 | 基于多模型的地下电缆故障修复方法和装置 |
CN110825923A (zh) * | 2019-10-25 | 2020-02-21 | 袁茂银 | 基于单模型的地下电缆故障修复方法和装置 |
CN110851670A (zh) * | 2019-10-25 | 2020-02-28 | 袁茂银 | 地下电缆故障修复方法和装置 |
CN110837898A (zh) * | 2019-10-25 | 2020-02-25 | 袁茂银 | 基于模型选择的地下电缆故障修复方法和装置 |
CN110687897A (zh) * | 2019-10-28 | 2020-01-14 | 北京小米智能科技有限公司 | 故障排除方法、故障排除装置及故障排除系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050283498A1 (en) * | 2004-06-22 | 2005-12-22 | Taiwan Semiconductor Manufacturing Company, Ltd. | System and method to build, retrieve and track information in a knowledge database for trouble shooting purposes |
US8914247B2 (en) * | 2011-08-01 | 2014-12-16 | General Electric Company | Systems and methods to monitor the operation of a power generation system |
CN102663537A (zh) * | 2012-03-13 | 2012-09-12 | 凯里供电局 | 一种基于风险评估的电力设备检修系统 |
-
2015
- 2015-01-22 TW TW104102121A patent/TW201627883A/zh unknown
- 2015-03-26 CN CN201510136767.1A patent/CN104901828A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN104901828A (zh) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201627883A (zh) | 設備端故障排除方法 | |
CN110401662B (zh) | 一种工控设备指纹识别方法、存储介质 | |
WO2012101933A1 (ja) | 運用管理装置、運用管理方法、及びプログラム | |
CN106685676B (zh) | 一种节点切换方法及装置 | |
TWI646476B (zh) | 故障風險指標推定裝置以及故障風險指標推定方法 | |
CN111666187B (zh) | 用于检测异常响应时间的方法和装置 | |
CN109698763B (zh) | 一种巡检的方法、装置及计算机可读存储介质 | |
US9860109B2 (en) | Automatic alert generation | |
WO2019034095A1 (zh) | 软件处理方法、装置、电子设备及计算机可读存储介质 | |
CN108334427B (zh) | 存储系统中的故障诊断方法及装置 | |
JP4584853B2 (ja) | 被疑箇所特定装置および処理方法 | |
CN110108981B (zh) | 一种有源配电网中线路的故障诊断方法和系统 | |
JP5949785B2 (ja) | 情報処理方法、装置及びプログラム | |
CN110825466A (zh) | 一种程序卡顿的处理方法以及卡顿处理装置 | |
US10466761B2 (en) | Power system monitoring and control system | |
CN109271270A (zh) | 存储系统中底层硬件的故障排除方法、系统及相关装置 | |
US20230359514A1 (en) | Operation-based event suppression | |
CN104539449A (zh) | 一种故障信息处理方法与相关装置 | |
CN104407808A (zh) | 写入数据的方法和装置 | |
US10255128B2 (en) | Root cause candidate determination in multiple process systems | |
CN115643158A (zh) | 设备集群修复方法、装置、设备和存储介质 | |
CN111258845A (zh) | 事件风暴的检测 | |
US10671442B2 (en) | Dynamic preparation of a new network environment, and subsequent monitoring thereof | |
JP7395961B2 (ja) | ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理プログラム | |
CN107678905B (zh) | 一种监控方法和装置 |