TWI261748B - Policy-based response to system errors occurring during OS runtime - Google Patents
Policy-based response to system errors occurring during OS runtime Download PDFInfo
- Publication number
- TWI261748B TWI261748B TW093102834A TW93102834A TWI261748B TW I261748 B TWI261748 B TW I261748B TW 093102834 A TW093102834 A TW 093102834A TW 93102834 A TW93102834 A TW 93102834A TW I261748 B TWI261748 B TW I261748B
- Authority
- TW
- Taiwan
- Prior art keywords
- policy
- error
- mode
- command
- medium
- Prior art date
Links
- 230000004044 response Effects 0.000 title claims description 80
- 238000012545 processing Methods 0.000 claims abstract description 118
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000005540 biological transmission Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 6
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 3
- 238000010168 coupling process Methods 0.000 claims 3
- 238000005859 coupling reaction Methods 0.000 claims 3
- 230000007704 transition Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000005067 remediation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0748—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
- Retry When Errors Occur (AREA)
Description
1261748 (1) 玖、發明說明 【發明所屬之技術領域】 本發明係有關於系統錯誤錯誤回復, 徹底地,有關於對於操作系統之運作時間 統錯誤之根據策略的回應。 【先前技術】 電腦在辦公室環境中已成爲無所不在 電腦的使用者常不具有解決每天可能發生 故障所需之技術知識以及/或訓練。常常 障時使用者無法解決,則尋求IT技術人 要人對人的互通。有時IT技術人員能透 者如何解決故障。但在許多情形中,IT 際前往故障電腦處來診斷問題及解決故障 簡單如改變電腦上運作應用程式之軟體設 體或甚至新韌體到電腦上。 於大型辦公室環境中,辦公室電腦 (LAN)與伺服器互連結。常需由公司內部 IT部門來維護LAN以及客戶端電腦。盡 戶端電腦故障爲IT部門之責任所在。客 時間”等於耗費之使用者生產力。但是, 境中應付各種每天發生的故障係可能花費 許多IT技術人員。使用活生生的it技術 不應求,這都常造成不適當的使用者生產 更詳而言之但非 期間所發生的系 的工具。但這些 各種系統錯誤或 ’當電腦經歷故 員的幫忙,這需 過電話指導使用 技術人員必須實 。解決方法可能 定,到安裝新軟 常透過區域網路 I τ技術人員或 快診斷並解決客 戶端電腦“故障 於大型辦公室環 很大功夫,需要 人員很貴且常供 力損失。 (2) 1261748 爲了避免這種損失,已發展出診斷設備使IT技術人 員能獲得有關故障電腦之資訊,而無須實際到故障電腦處 。過去,設備製造商利用如簡單網路管理協定(SNMP)之 網路協定執行遠端系統診斷。IT技術人員能使用根據 SNMP軟體工具來詢問故障電腦之狀態,或喚起客戶端電 腦內建診斷功能來遠端監視測試結果。但是,此方式仍需 I T技術人員從伺服器電腦來監控補救過程。另外,若客 戶端電腦之運作系統已故障或“當機”,根據SNMP之軟 體可能無法回應IT技術人員的狀態詢問。因此,在系統 當機情況下,可能仍需IT技術人員實際前往客戶端電腦 處以解決問題。 【發明內容及實施方式】 在此說明對於操作系統(“ 〇 S ”)運作時間期間所發生的 系統錯誤之根據策略回應之實施系統與方法。於下說明中 ,提出多種特定細節以提供對於本發明實施例之一個全盤 的了解。但熟悉該項技藝者將認知,本發明可不需一或多 項特定細節,或其他方法、元件、材料等等據以實施。於 其他例子中,爲了避免模糊本發明之態樣而不顯示或詳述 B知的結構 '材料、或運作。 於本說明書中,對於「一實施例」或「實施例」一詞 之參照意思係指該實施例說明之特定特徵、結構、或特性 係包含於本發明之至少一實施例中。因此,於說明書中許 多地方所提及之「一實施例」或「實施例」,並不一定係 (3) 1261748 指同一個實施例。再者,可以任何適當方式結合一或多個 實施中的特定特徵、結構、或特性。 第】圖顯示根據本發明之一實施例,執行根據策略回 應系統錯誤之處理系統1 0 0的方塊圖。於一實施例中,處 理系統]00包括中央處理器(CPU) 105、記憶體單元1 10、記 憶體位置〗2 5、以及非揮發性(Ν ο η V ο 1 a t i 1 e ; N V )儲存單元 1 3 0。於一實施例中,記憶體單元1 1 0包括保護區1 1 1以及 無保護區1 1 3。於一實施例中,故障回應媒介1 3 5以及錯誤 容限策略1 4 0係儲存於記憶體單元1 1 0之保護區1 1 ]中。於 一實施例中,故障回應媒介145係儲存於NV儲存單元130 中。於一實施例中,於記憶體單元U 〇之無保護區1 1 3中儲 存且執行作業系統(OS) 150以及應用軟體H5。 處理系統100之元件係透過下列方式互連。CPU 105 係傳輸式耦接至NV儲存單元130以自該處接收並執行韌 體命令。另外,CPU 105傳輸式耦合至記憶體單元1 1〇以 執行 Ο S 1 5 0以及應用軟體1 5 5。在某些情況中,可藉由 CPU 105將韌體命令自NV儲存單元ISO傳送至記憶體單元 1 1 0,並由C P U 1 0 5從那裡執行韌體命令。 於一實施例中,C P U 1 0 5爲以英特爾架構(I n t e】 Architecture)爲基礎之CPU。於其他實施例中,CPU 1 05 可爲任何能接收、傳送、以及執行軟體命令之處理器。於 —實施例中,記憶體單元1 1 0爲系統雖雞存取記憶體(‘ RAM” )。於其他實施例中,記憶體單元1 1 0爲硬碟、軟碟 、磁帶機、或非揮發性記憶體之類的°於一實施例中’ 冬 (4) 1261748 N V儲存單元丨3 〇係唯讀記憶體裝置。於其他實施例中, NV儲存單元〗3 〇爲可程式唯讀記憶體裝置、可抹除可程式 唯讀記憶體裝置、電子可抹除可程式唯讀記憶體裝置、或 怏閃記憶體裝置之類的。 茲參考第1圖與第2圖,處理系統〗0 〇之一實施例循環 過下列狀態,以實施根據策略回應系統錯誤。於系統關閉 狀態210時,處理系統100電源係關閉。當CPU 105接收電 源開啓訊號時,狀態轉變2 1 3轉變處理系統1 〇〇至初始狀態 220 〇 於初始狀態220時,處理系統100開始早期初始化。該 初始化可能包括由 CPU 1 05執行工作,例如,載入自 NV 儲存單元1 3 0之自啓程式,執行電源開啓自我測試 (“POST”),以及搜尋連接OS 150之驅動器並載入OS 150 之檔案至記憶體單元1 1 0之無保護區1 1 3。例如,於微軟視 窗TM環境,CPU 105可將稱做10 .SYS之檔案載入無保護 區1 1 3中。於一實施例中,初始狀態2 2 0包括將故障回應媒 介1 4 5載入記憶體單元11 〇之保護區1 1 1。爲使本發明簡潔 ,一旦當故障回應媒介1 4 5自Ν V儲存單元1 3 0載入至保護 區1 1 1,將稱做故障回應媒介1 3 5。應了解到故障回應媒介 1 4 5可儲存於任何與C P U 1 0 5傳輸式耦接之非揮發性記憶 體中,如硬碟等。若處理系統1 0 0傳輸式耦接至一網路, 處理系統1 0 0亦可能於初始狀態2 2 0時,透過動態主機組態 協定(D y n a m i c Η 〇 s t C ο n f i g υ 1’ a t i ο η P r 〇 t 〇 c ο 1; D H C Ρ )或其他 適合的網路協定取得一伺服器位址。 (5) 1261748 當自啓程式將處理系統100之控制移交給os 150時, 發生狀態轉變2 2 3。狀態轉變2 2 3將處理系統1 0 0從初始狀 態22 0轉變至OS運作時間操作模式狀態23 0。於OS 運作 時間操作模式狀態2 3 0,0S 150控制處理系統100並且CPU 1 〇 5可執行Ο S 1 5 0之外的任何數量之應用軟體1 5 5。 於一實施例中,當 CPU】05接收到中斷訊號107時, 處理系統1 〇 〇透過狀態轉變2 3 3轉變至保護模式操作狀態 240。當在保護模式操作狀態240時 ,0S 運作時間將終 止。於保護模式操作狀態240期間處理系統100的運作將受 到保護,而不受到於〇 S運作時間操作模式狀態2 3 0時執 行0 S 1 5 0或應用軟體1 5 5之訛誤(C 〇 r r u p t i ο η)的影響。因此 ,CPU 105能於保護模式操作狀態240期間執行軟體命令 ,即使0S 150已當機並且CPU 105也無法於OS運作時 間操作模式狀態23 0期間進行任何有用的執行。 於一實施例中,保護模式操作狀態240爲內建於Intel SL Enhanced 4 8 9 and PentiumTM2 CPU 之系統管理模式 (“ S y s t e m M a n a g e m e n t Μ o d e ; S Μ Μ ”)。於此實施例中,當 CPU 105接收到系統管理中斷 (“System Management Interrupt; SMI”)時,將進入 SMM。當一*事件產生 SMI 時,CPU 1 05將其現有狀態之一大部分存於狀態儲存地圖 中作爲回應,初始一些暫存器以提供SMM執行環境,並 接著開始於SMM中執行。於此SMM環境中,記憶體1 1 〇 之保護區1 1 1係稱爲系統管理隨機存取記憶體(“s MR AM”) 。只有於 S Μ Μ中執行之應闱程式可存取S M R A Μ。因此 (6) 1261748 ,於0 S運作時間操作模式狀態2 3 0執行之〇 S 1 5 0以及應 用軟體1 5 5並無法存取s M R A Μ。依此方式,s M R A Μ以及 於S MM中執行之應用程式(例如,故障回應媒介丨35)將不 會受到保護,而不受到〇 S 1 5 〇或應用軟體1 5 5之訛誤的影 響。即使〇 S ] 5 0已當機或一應用軟體停滯時,於§ μ Μ中 C P U之執行將不受到影響。另外,s Μ Μ對於0 S 1 5 0來說 係透明的,且再者,〇 S不知道,亦即,〇 s 1 5 0以及應用 軟體155並不知道SMM與SMRAM。 一旦於保護模式操作狀態2 4 0,故障回應媒介1 3 5將詢 問處理系統1 0 0,以決定是否發生系統錯誤。若故障回應 媒介1 3 5偵測不到系統錯誤,處理系統} 〇 〇沿著狀態轉變 2 3 5返回OS運作時間操作模式狀態23〇。一旦處理系統 100沿著狀態轉變2 3 5返回OS運作時間操作模式狀態230 時,CPU 1 05將恢復原先關閉前之執行。 若故障回應媒介1 3 5偵測到有系統錯誤存在,故障回 應媒介1 3 5根據錯誤容限策略} 4 〇診斷系統錯誤作爲回應。 於一實施例中,錯誤容限策略1 4 〇包含一策略指令表單對 應系統錯誤。故障回應媒介1 3 5執行這些策略指令以回應 偵測到之系統錯誤。將於下詳述錯誤容限策略]4 〇。根據 由故障回應媒介1 3 5執行之策略指令,處理系統1 〇 〇將沿著 狀態轉變2 3 5返回OS運作時間操作模式狀態2 3 0,或沿著 狀態轉變2C轉變到系統關閉狀態210。處理系統1〇〇執行 狀態轉變2 3 3之頻率將於下詳述。若處理系統1 〇 〇沿著狀態 轉變2 4 3轉變成系統關閉狀態2 ] 0,則處理系統1 〇 〇將以 (7) 1261748 雷同上述之方式返回0 S運作時間操作模式狀態2 3 0 ° 茲參照第1圖至第3圖,根據本發明處理系統1 〇 〇之一 實施例,將如下般運作以實施根據策略回應系統錯誤。 於處理區塊3 0 5中,處理系統1 〇 〇係電源開啓。電源開 啓事件可爲處理系統】〇〇之使用者將處理系統100開啓之結 果,或處理系統1 〇 0重新開機之結果。自處理區塊3 0 5,處 理系統100繼續進行至如上述有關於初始狀態220之早期系 統初始化(處理區塊3 1 0)。接著,CPU 1 05將故障回應媒介 1 4 5載入記憶體單元1 1 〇之保護區1 1 1 (處理區塊3 1 5 )。於處 理區塊320中,CPU 105發動自啓目標(例如,當於微軟視 窗環境TM下操作時,10 .SYS)。於此點,處理系統100繼 續進至處理區塊3 2 5,於處理區塊3 2 5中,將進入Ο S運作 時間模式之運作狀態。 當於Ο S運作時間操作模式時,〇 S 1 5 0控制C P U 1 0 5 之操作’以及處理系統1 〇 〇之各種其他元件並未顯示。再 者’一或多個應用軟體155可於OS 150之上執行。OS運 作時間操作模式代表一般CPU i 05以及處理系統1〇0之操 作模式。 於處理區塊3 3 0中,由C P U 1 0 5接收中斷訊號1 0 7,指 示CPU 1 〇5啓動保護操作模式。於一實施例中,中斷訊號 1 0 7中斷訊號]〇 7以具有固定間隔之週期方式產生(例如, 心跳式中斷)。於一實施例中,由硬體監視計時器觸發中 斷訊號1 〇 7。監視計時器爲一種持續自一起始數倒數至零 2 m路。若監視計時器所監視之事件於監視計時器達 - 1〇- (8) 1261748
到零之前就發生,則監視計時器重設成起始數,並重頭倒 數。右該時脈電路到達零,電路將產生中斷訊號]〇 7。於 —實施例中,監視計時器監視記憶體位置1 2 5,其由〇 s 1 5 0或應用軟體1 5 5之一於固定時間間隔更新。因此,若負 責更新記憶體位置1 2 5之0 S 1 5 0或應用軟體1 5 5之一停滯 或錯誤(亦即,導致系統錯誤)時’可能不會於監視計時器 倒數至零之前更新記憶體位置1 2 5。於此事件中,監視計 時益將產生中斷訊號1 〇 7。於一實施例中,中斷訊號爲如 上所述之S ΜI。 於處理區塊3 3 0中,一旦產生中斷訊號107,CPU 105 啓動保護操作模式(處理區塊3 3 5 )並中止Ο S運作時間操作 模式。當0 S運作時間中止時,於處理區塊3 1 5載入記憶 體單元11 0之保護區U 1的故障回應媒介1 3 5,詢問各種處 理系統1 0 0之態樣,以決定發生了系統故障或系統錯誤(處 理區塊3 4 0)。於一實施例中,詢問處理系統1 〇 〇包括存取 記憶體位置1 2 5,以決定是否包含於記憶體位置1 2 5之資料 ’自從上次故障回應媒介1 3 5詢問記憶體位置1 2 5後,已於 Ο S運作時間操作模式以預定或預期之方式發展。因此, 右Ο S 1 5 0或應用軟體1 5 5之一停滯,其可能無法如故障回 應媒介1 3 5所預期般地更新記億體位置]2 5。針對0 S運作 時間操作模式與保護操作模式之間相繼之轉變,故障回應 媒介1 3 5能比較目前資料値與之前的資料値。若資料不如 預期方式改變,則故障回應媒介1 3 5決定已發生了系統錯 誤(決定區塊3 4 5 )。 -11 - (9) 1261748 於一貫施例中’記憶體位置i 2 5係可由〇 s 1 5 0和/或應 用軟體1 5 5存取之資料暫存器。於一實施例中,記憶體位 置1 2 5爲k於憶體單兀}丨〇之無保護區]]3中之一記憶體 位置或複數個記憶體位置。記憶體位置1 2 5可爲任何耦接 至CPU 105之任何一或多個記億體裝置之任何記憶體位址 之一或多個位置’其於〇 s運作時間期間以可決定之方式 發展’或於〇 S運作時間期間以可決定之方式保持靜態。 應了解雖然於第1圖僅顯示一個記憶體位置i 2 5,故障回應 媒介1 3 5可存取於處理系統i 〇 〇中之任何數目的記憶體位置 1 2 5,以收集關於處理系統丨〇 〇之操作健康狀態之診斷資訊 。於一實施例中,各應用軟體1 5 5具有至少一個於處理區 塊3 4 0之保護操作模式期間,故障回應媒介} 3 5可詢問之對 應的記憶體位置1 2 5。 故障回應媒介1 3 5除了知道記憶體位置1 2 5於處理系統 1 〇 〇之健康操作期間預期該如何發展之外,亦知道記憶體 位置1 2 5之其他屬性與特性。例如,若記憶體位置1 2 5包含 處理系統]〇〇之系統時脈資料,故障回應媒介135將具有此 資訊並知道系統時脈應以可決定之方式增加。若系統時脈 資料於記憶體位置1 2 5之相繼詢問之間,無法以預期的量 增加,則故障回應媒介135可詢問處理系統100之其他態樣 ,以決定系統時脈應用程式已故障或〇 S 1 5 0已故障。 若於決定區塊3 4 5中,故障回應媒介1 3 5決定已發生系 統錯誤,故障回應媒介根據故障容限策略140(處理區塊 3 5 5 )回應系統錯誤。於一實施例中,故障容限策略1 4 0包 -12 - (10) 1261748
含對應系統錯誤之策略指令淸單。故障回應媒介]3 5執行 這些策略指令以回應偵測到之系統錯誤。例如,其中一策 略指令可爲重設處理系統]0 0。於此情況中,處理系統1 〇 〇 將回到處理區塊3 0 5,並如上述從該處繼續。其他策略指 令可包含中止系統錯誤來源之一或多個應用軟體1 5 5,回 復已儲存之基礎輸入輸出系統影像至NV儲存單元]3 0中 ,或回復已儲存之軟體影像(例如,OS 150之系統檔)至耦 接C P U 1 0 5之硬碟(未顯示)。於一實施例中,故障回應媒 介1 3 5保持已偵測系統錯誤之際記錄。於一實施例中,若 故障回應媒介1 3 5記錄多次同樣的系統錯誤(例如_星期四 次),故障回應媒介1 3 5可決定,根據故障容限策略! 4 0以 及包含重複系統錯誤之記錄,是否需要審慎的策略指令來 回復已儲存之軟體影像或已儲存之B I Ο S影像分別至硬碟 或NV儲存單元130。 回到決定區塊3 4 5,若故障回應媒介1 3 5決定沒有發生 系統錯誤,處理系統100撤銷保護操作模式(處理區塊3 5 0 ) ,並且CPU 105重新從於OS運作時間操作模式期間離開 之處執行(處理區塊3 2 5 )。於一實施例中,〇 S運作時間操 作模式與保護操作模式之迴路無定限地持續下去。又,於 一實施例中,應用軟體1 5 5與Ο S 1 5 0重新執行而不知道它 們曾被中止過。可藉由在啓動保護操作模式前,儲存CPU 1 05狀態參數來實現透明之保護操作模式。於撤銷保護操 作模式後,儲存之狀態參數將複製回CPU ] 05,而〇s 1 5 0運作時間操作模式重新開始。 -13- (11) 1261748 第4圖顯示根據本發明之一實施例,顯示透過網路4 Ο 3 執行根據策略回應系統錯誤之伺服器-客戶端系統4 0 0之方 塊圖。於一實施例中,伺服器-客戶端系統4 00包括客戶端 系統401透過網路4 0 3傳輸式耦接至伺服器系統402。於客 戶端系統40 1之顯示實施例中包括CPU 1 05、記憶體單元 1 1 0、傳輸連結4 1 5、記憶體位置1 25、以及NV儲存單元 ]3 0。於伺服器系統4 0 2 1之顯示實施例中包括 C P U 4 0 5、 記憶體單元4 1 〇、和傳輸連結4 1 7。於一實施例中,記憶體 單元410包括策略媒介435以及故障容限策略440。 於一實施例中,客戶端系統4 0 1類似處理系統1 〇 〇,旦 具有額外功能以透過網路403與伺服器系統402溝通。傳輸 連結415耦接客戶端系統401之CPU 105至網路4 03。同樣 的,傳輸連結417耦接伺服器系統402之 CPU 4 05至網路 4 0 3。傳輸連結4 1 5與4 1 7可爲任何連接至網路並透過網路 溝通之裝置。於一實施例中,傳輸連結4 1 5與4 1 7爲網路介 面卡。網路4 0 3之實施例包括區域網路、廣域網路、和網 際網路之類的。 茲參考第4與5圖,根據本發明一實施例,客戶端系統 4 0 1之一實施例如處理5 0 0所描述的方式操作,以實施透過 網路403系統錯誤之根據策略回應。客戶端系統4〇1之實施 例與處理系統實施例類似之方式操作,除了下述之不同外 〇 於處理區塊5 0 5,客戶端系統4 0 1電源開啓。之後,客 戶端系統4 〇 ]繼續經過早期系統初始(處理區塊5 1 〇)以及載 (12) 1261748 入故障回應媒介1 4 5至記憶體單元1 1 0之保護區1 1 1 (處理區 塊5 ] 5 )。於處理區塊5 2 0中,客戶端系統4 0 1取得伺服器系 統4 0 2之伺服器位址。於一實施例中,客戶端系統4 〇 1廣播 DHCP呼叫以獲得伺服器系統402於網路4 0 3上之伺服器位 址,來影響伺服器系統402之未來的傳輸。應了解到客戶 端系統401可使用任何系統協定來影響伺服器系統402之未 來的傳輸,又,D H C P呼叫時間可發生在所述之配置於處 理500中處理區塊520之前或之後。於處理區塊525中,客 戶端系統4 0 1發動Ο S 1 5 0之自啓目標。一旦〇 S 1 5 0開始控 制C P U 1 0 5,客戶端系統4 0 1進入0 S運作時間操作模式( 處理區塊5 3 0)。 於處理區塊5 3 5中,C P U 1 0 5接收指示應啓動保護操 作模式之中斷訊號。於一實施例中,CPU 105接收指示應 啓動保護操作模式之中斷訊號107。於一實施例中,CPU 105接收來自伺服器系統402之中斷訊號4 0 7,指示客戶端 系統4 0 1將啓動保護操作模式。於一實施例中,中斷訊號 407爲透過網路403傳輸之資料封包,觸發傳輸連結415之 LAN叫醒功能。於此LAN叫醒功能實施例中,當透過網 路4 0 3接收到中斷訊號4 0 7時,傳輸連結4 1 5指示C P U 1 0 5 啓動保護操作模式。 一旦客戶端系統4 〇 1於保護操作模式中操作時,故障 回應媒介1 3 5詢問客戶端系統4 0 1,以決定是否發生系統錯 誤(處理區塊5 4 5 )。客戶端系統4 01詢問係類似上述有關於 處理系統1 0 0之發生系統錯誤種類之詢問。若故障回應媒 (13) 1261748 介1 3 5決定已發生系統錯誤時(決定區塊5 5 0 ) ’故障回應媒 介1 3 5產生錯誤訊息4 0 8,包含描述特定系統錯誤之資料’ 並透過傳輸連結4 1 5與網路4 0 3傳送該錯誤訊息4 0 8至伺服 器系統4 0 2。 於傳送該錯誤訊息4 0 8後,故障回應媒介1 3 5等待一預 定時間以接收來自伺服器系統4 0 2之策略指令4 0 9。若客戶 端系統4 〇 1接收策略指令4 〇 9 (決定區塊5 6 0 ),故障回應媒 介1 3 5剖析策略指令5 7 0並執行包含於策略指令5 7 0之內的 命令。於一實施例中,策略指令570包含簡單重設命令。 於一實施例中,策略指令5 7 〇包含命令,指示正有新的軟 體影像自伺服器系統402透過網路403傳送過來,客戶端系 統4 0 1將接收此新的軟體影像,並且客戶端系統4 〇 1將安裝 該新軟體影像於客戶端系統4 〇 1中適當的位置。於一實施 例中,此新的軟體影像包含〇 S 1 5 0未訛誤檔來代替0 S 1 5 0訛誤檔。於一實施例中,策略指令5 7 0包含命令’指示 正有新的B I Ο S影像自伺服器系統4 0 2透過網路4 0 3傳送過 來,客戶端系統4 0 1將接收此新的B I Ο S影像,並且客戶 端系統401將安裝該新BIOS影像於客戶端系統401中適當 的位置。於一實施例中,策略指令5 7 〇包含命令給故障回 應媒介1 3 5,以根據內建故障容限策略1 4 〇回應系統錯誤。 應了解到策略指令4〇9可包含全部或一些上述之命令以及 其他者。 於一實施例中,若等待一預定時間後,故障回應媒介 ]3 5沒有接收到來自伺服器系統4 02之策略指令4〇9,故障 -16- (14) 1261748 回應媒介1 3 5根據特定系統錯誤以及儲存於客戶端系統4〇 i 中之故障谷限策略1 4 〇動作,以回應偵測到之系統錯誤。 換曰之’右故障回應媒介〗3 5沒有接收到來自伺服器系統 4 02之針對如何回應特定系統錯誤之命令時,故障回應媒 介1 J 5將自行評估解決系統錯誤,根據其本身內建故障容 限策略1 4 0。
返回至決定區塊5 5 0,若故障回應媒介〗3 5沒有偵測到 系統錯誤’客戶端系統401撤銷保護操作模式(處理區塊 5 7 5 ) ’並且返回0S運作時間操作模式(處理區塊53 〇)。 於一實施例中,當客戶端系統4 〇 1電源開啓時,此啓動與 撤銷保護操作模式之迴路可無定限地持續下去。再者,啓 動保護操作模式之頻率可根據固定時間期間(例如,每J 〇 秒、每1秒等等),根據如上述硬體中斷來啓動、根據軟體 中斷啓動、或全部或一些該等之結合。
茲參照第4與6圖’根據本發明之一實施例,伺服器系 統4 0 2 —實施例如處理6 0 0所述之方法操作,以實施透過網 路403根據策略回應系統錯誤。 於處理區塊6 0 5中,伺服器系統4 0 2之系統管理者或使 用者致能執行於伺服器系統4〇2之上的策略媒介4 3 5。於一 實施例中,策略媒介43 5係由CPU 40 5執行之應用軟體並 儲存於記憶體單元4 1 〇中。於一實施例中,記憶體單元4 1 0 爲系統R A Μ。 於處理區塊6 ] 0中,策略媒介4 3 5透過網路4 0 3傳送中 斷訊號4 07,以指示客戶端系統401啓動保護操作模式。策 -17 - (15) 1261748 略媒介4 3 5可週期性地、隨機地、回應於網路4 〇 3上不尋常 網路流量或缺乏於網路4 03上來自客戶端系統401之網路流 量、於某天或某星期預定之時間(例如,網路4 03之非尖峰 使用時間期間)、或在伺服係系統4 0 2使用者之命令下,產 生並傳送中斷訊號4 07。應了解到於其他處理6〇〇之實施例 中,略過處理區塊6 ] 0,因爲客戶端系統4 〇】也許能夠自行 啓動保護操作模式而不需要接收中斷訊號4 〇 7。 於決定區塊6 1 5中,策略媒介4 3 5可能或可能沒有接收 來自客戶端系統4 0 1之錯誤訊息4 〇 8。若客戶端系統4 〇〗在 啓動保護操作模式後,偵測到系統錯誤並透過網路4 0 3傳 送錯誤訊息4 0 8,策略媒介4 3 5根據故障容限策略4 4 0 (處理 區塊6 2 5 )剖析錯誤訊息4 0 8以產生策略指令4 0 9。於一實施 例中,故障容限策略440包含對應系統錯誤種類之策略指 令(例如,改善的命令)淸單。因此,當策略媒介4 3 5接收 並剖析錯誤訊息4 0 8時,策略媒介4 3 5產生包含參照故障容 限策略4 4 0,並針對客戶端系統4 〇 1之改善的命令。於一實 施例中,當策略媒介4 3 5產生錯誤訊息4 0 8時,將考量其他 因素以及由特定客戶端系統4 01所回報之特定系統錯誤。 例如,當決定發送改善命令之種類時,策略媒介4 3 5可考 量網路403之網路流量。於高網路流量期間,策略媒介435 可不發出新軟體或BIOS影像之傳送,而以短策略指令 4 〇 9代替,例如,重設命令。策略媒介4 3 5可能考量之另外 的因素爲包含由客戶端系統4 0 ]發送之錯誤訊息4 0 8的記錄 檔。若策略媒介4 3 5發送了不尋常大量的錯誤訊息4 0 8 (例 (16) 1261748 如’ 一星期中五次),故障容限策略4 4 0可能指示策略媒介 4 3 5應上載新的軟體影像和/或β丨〇 S影像至客戶端系統4 〇 } 〇 於一實施例中,回應接收來自客戶端系統4 Ο 1之錯誤 訊息4 0 8時,策略媒介4 3 5可傳送一或多個詢問命令至客戶 端系統4 Ο 1上之故障回應媒介]4 〇,以收集由故障回應媒介 1 3 5偵測有關系統錯誤之資訊。於一實施例中,錯誤訊息 4 0 8可僅代表故障回應媒介1 3 5已偵測到於客戶端系統4 〇 1 中之系統錯誤的指示,但不包含有關系統錯誤之種類的資 訊。於利用上述詢問命令收集到更多診斷資訊後,策略媒 介43 5可使用此診斷資訊以及故障容限策略440產生策略指 令 409 ° 於決定區塊63 0中,策略媒介4 3 5決定是否傳送策略指 令4 0 9。若策略媒介4 3 5決定傳送策略指令4 0 9,則於處理 區塊64〇中傳送,接著於處理區塊620中策略媒介435先等 待一段預定時間,再於處理區塊6 1 0中透過網路4 0 3廣播另 一中斷訊號4 〇 7至客戶端系統4 0 1。如上述,若特定測率指 令40 9係上載新軟體或BIOS影像至客戶端系統401,以及 網路流量目削很1¾,策略媒介435可在當下不傳送該特定 之策略指令409。取而代之,策略媒介435可將該特定策略 指令4〇9排在一個當網路流量較低之較後面的時段。於此 情況下,客戶端系統4 〇 1將無法於設定時間內接收到策略 指令4 〇 9 ’則各戶_系統4 0 1之故障回應媒介1 3 5將自fr依 內建之錯誤容限策略4 4 0來動作。若於決定區塊6 3 0中’策 -19- (17) 1261748 略媒介435決定不傳送策略指令409,則於處理區塊620中 策略媒介4 3 5先等待一段預定時間,再傳送另一中斷訊號 4 0 7。 應了解到雖然只顯示一個客戶端系統4 0 1耦接至網路 4 0 3,其實可耦接任何數量之客戶端系統4 0 1至網路4 0 3。 另外,伺服器系統4 02可配置成如上述般服務並維持許多 客戶端系統4 0 1。 第7圖根據本發明之教示,顯示實施處理系統1 0 0、客 戶端系統401、或伺服器系統4 02之電腦系統700範例。電 腦系統7 0 0包括底盤7 0 5、螢幕7 1 0、滑鼠7 1 5 (或其他指示 裝置)、以及鍵盤7 2 0。底盤7 0 5之顯示實施例復包括軟碟 機72 5、硬碟73 0、電源(未顯示)、以及設有適當積體電路 之主機板7 3 5,該積體電路包括系統RAM 740、非揮發性 記憶體74 5、以及一或多個CPU 7 5 0。 於一實施例中,網路介面卡(NIC)(未顯示)係耦接至 主機板7 3 5之擴充槽(未顯示)。NIC用於連接電腦系統700 至電腦網路7 5 5,如區域網路、廣域網路、或網際網路。 於一實施例之網路7 5 5復耦接至遠端電腦7 60,使電腦系統 7 〇〇以及遠端電腦7 60得以溝通。 硬碟730可包括單一單元或多個單元,並可選擇性設 於電腦系統7 0 〇之外。螢幕7 ] 0係包括於此用於顯示由電腦 系統7 00執行之軟體程式以及程式模組產生之圖像和文字 。滑鼠7] 5(或其他指示裝置)可連接至序列埠、uSB埠、 或其他類似與CPU 7 5 0傳輸式耦接之匯流排埠。鍵盤7 2 〇 -20- (18) 1261748 可以類似滑鼠之方式傳輸式耦接至主機板7 3 5,令 能輸入文字與命令。 於一實施例中,非揮發性記憶體7 4 0爲N V儲 1 3 0,用於儲存個障回應媒介1 4 5。於一實施例中 74 0爲記億體單元]10具有保護區1 1 1和未保護區1 13 上述有關本發明之實施例,包括摘要內容,並 作爲徹底且限制本發明至所揭露之精確形式。熟悉 藝者應知道,雖然以說明爲目的而在此詳細揭露本 特定實施例和範例,但仍可對本發明做出各種等效 不脫離本發明之範圍。 可依照本發明詳細說明作出這些修改。不應將 請專利範圍所使用的詞彙作爲限制本發明於說明書 請專利範圍所揭露之特定實施例之內。本發明之範 部由後述申請專利範圍所訂定,並應依照現有對申 範圍解讀之原則加以解釋。 【圖式簡單說明】 藉由參照所附之圖式說明本發明之非限制與非 實施例,圖示中類似元件標有類似的參考符號,除 指明。 第1圖顯示根據本發明之一實施例,執行根據 應系統錯誤之處理系統的方塊圖。 第2圖根據本發明之一實施例,顯示執行根據 應系統錯誤之處理系統循環過之狀態的狀態圖。 使用者 存單元 ,RAM 〇 非意圖 該項技 發明之 修改而 下列申 以及申 圍應全 請專利 徹底之 非另外 策略回 策略回 -21 - (19) 1261748 第3圖根據本發明之一實施例,顯示一種實施執行根 據策略回應系統錯誤之處理系統之方法的流程圖。 第4圖根據本發明之一實施例,顯示透過網路執行根 據策略回應系統錯誤之伺服器-客戶端系統之方塊圖。 第5圖根據本發明之一實施例,顯示客戶端系統的實 施方法之流程圖,該客戶端系統係透過網路執行根據策略 回應系統錯誤。
第6圖根據本發明之一實施例,顯示伺服器系統的實 施方法之流程圖,該伺服器系統係透過網路執行根據策略 回應系統錯誤。 第7圖根據本發明之一實施例,顯示實施處理系統、 客戶端系統、或伺服器系統之電腦系統範例,以執行根據 策略回應系統錯誤。 [圖號說明] 1 00 處理系統 105 中央處理器 107 中斷訊號 110 記憶體單元 111 保護區 1 1 3 無保護區 125 記憶體位置 13 0 非揮發性儲存單元 ]3 5 故障回應媒介 -22 - (20)1261748 1 40 145 15 0 15 5 2 1 0 213 220 223 23 0 23 3 23 5 240 243 3 0 5 - 3 4 0,3 5 0,355 345 400 40 1 402 403 錯誤容限策略 故障回應媒介 作業系統 應用軟體 系統關閉狀態 狀態轉變 初始狀態 狀態轉變 〇 S運作時間操作模式狀態 狀態轉變 狀態轉變 保護模式操作狀態 狀態轉變 處理區塊 決定區塊 伺服器-客戶端系統 客戶端系統 伺服器系統 網路
CPU 中斷訊號 錯誤訊息 策略指令 記憶體單元
405 407 408 409 4 10 -23 - 1261748 415,417 傳輸連結 435 策略媒介 440 錯誤容限策略 5 00 處理 5 05-54 5,555, 565,575 處理區塊 5 5 0,5 6 0 決定區塊 5 70 策略指令 600 處理 605-610;625-640 處理區塊 615,630 決定區塊 700 電腦系統 705 底盤 7 10 螢幕 7 15 滑鼠 7 20 鍵盤 725 軟碟機 7 3 0 硬碟 7 3 5 主機板 740 系統RAM 745 非揮發性記憶 7 5 0 CPU 755 網路 7 60 遠端電腦
-24 -
Claims (1)
- (1) 1261748 拾、申請專利範圍 1 . 一種偵測並回應系統錯誤之方法,該方法包括下列 »Η ESK . 步驟· 於一處理系統中啓動一保護操作模式; 於該保護操作模式期間,詢問該處理系統以決定是否 已發生一系統錯誤; 若決定該系統錯誤已發生,則根據一故障容限策略回 應該系統錯誤;以及 若決定沒有發生該系統錯誤’則撤銷該保護操作模式 〇 2 .如申請專利範圍第1項之方法,其中,係藉由儲存 於該處理系統之記憶體之一保護區中的一故障回應媒介達 成詢問該處理系統,以決定是否已發生該系統錯誤。 3 .如申請專利範圍第2項之方法,其中,該處理系統 之該保護操作模式包括系統管理模式,以及其中該記憶體 之保護區包括系統管理隨機記憶體。 4 ·如申請專利範圍第!項之方法,其中,該保護操作 模式係回應一硬體中斷而啓動。 5 ·如申請專利範圍第1項之方法,其中,該保護操作 模式係週期性地啓動。 6 ·如申請專利範圍第1項之方法,其中,當該處理系 統接收來自一耦接至該處理系統之伺服器系統之_中斷巧 號,而啓動該保護操作模式。 7.如申請專利範圍第]項之方法’其中,詢問該處理 -25- (2) 1261748 系統包括g旬問包含§亥處理系統之資料的一記憶體位置,以 決定於該處理系統的操作系統運作時間之操作模式期間是 否該資料已依照一預定方式發展。 8 _如申請專利範圍第1項之方法,復包括下列步驟: 若決定已發生該系統錯誤,則傳送一錯誤訊息至與該 處理系統傳輸式耦接之一伺服器系統;以及 自該伺服器系統傳送一策略指令至該處理系統,該策 略指令係由該故障容限策略與該錯誤訊息推及而得。 9 ·如申請專利範圍第8項之方法,其中該策略指令包 括載入一軟體影像之命令、一載入一基本輸入輸出系統影 像之命令、以及一重設命令的其中至少之一。 1 〇.如申請專利範圍第]項之方法,復包括藉由根據該 故障容限策略以及已決定之系統錯誤,執行回復已儲存之 一軟體影像’回復已儲存之一基本輸入輸出影像、以及重 設該處理系統之其中至少之一,以回應已決定之系統錯誤 〇 1 1 . 一種含有命令於其上之機器可讀取之媒體,該等 命令可由一機器讀取執行以實行: 於一處理系統中啓動一保護操作模式; 於該保護操作模式期間,詢問該處理系統以決定是否 已發生一系統錯誤; 若決定該系統錯誤已發生,則根據一故障容限策略回 應該系統錯在:’以及 若決定沒有發生該系統錯誤,則撤銷該保護操作模式 -26 - (3) 1261748 1 2 .如申請專利範圍第1 1項之機器可讀取之媒體’復 包括若已決定沒有發生該系統錯誤時,該機器可讀取之媒 介含有命令以實行保護操作模式之撤銷以及啓動一操作系 統運作時間之操作模式。 1 3。如申請專利範圍第1 2項之機器可讀取之媒體,其 中,該保護操作模式係週期性地啓動。 ! 4 .如申請專利範圍第1 1項之機器可讀取之媒體,其 中,該保護操作模式係回應一中斷訊號而啓動。 1 5 ·如申請專利範圍第1 1項之機器可讀取之媒體,其 中,自該處理系統之記憶體之一保護區中執行一故障回應 媒介,以保護該故障回應媒介於該處理系統之一操作系統 運作時間之操作模式期間,不受到訛誤,藉此達成詢問該 處理系統以及回應該系統錯誤。 i 6 ·如申請專利範圍第1 5項之機器可讀取之媒體,其 中,該保護操作模式包括系統管理模式,以及其中該記億 體之保護區包括系統管理隨機記憶體。 1 7 .如申請專利範圍第】丨項之機器可讀取之媒體,其 中,藉由該故障回應媒介詢問該處理系統包括詢問包含該 處理系統之資料的一記憶體位置,以決定於該處理系統的 操作系統運作時間之操作模式期間,是否該資料已依照一 預定方式發展。 ]8 .如申請專利範圍第1 1項之機器可讀取之媒體,付 包含命令以實行: - 27- (4) 1261748 若決定已發生該系統錯誤,則傳送一 處理系統傳輸式耦接之一伺服器系統;以 自該伺服器系統接收一策略指令,該 故障容限策略與該錯誤訊息之至少一部份 1 9 ·如申請專利範圍第1 8項之機器可 中該策略指令包括載入一軟體影像之命令 輸入輸出系統影像之命令、以及一重設命 -* 〇 20.—種客戶端系統,包括: 一中央處理器(CPU),於一操作系統 操作模式以及一保護操作模式中執行命令 一非揮發性儲存單元,傳輸式耦接至 一故障回應媒介,於該保護操作模式中曲 障回應媒介,該故障回應媒介偵測於〇 S 式發生之系統錯誤,並根據一故障容限策 誤。 2 1 .如申請專利範圍第2 0項之客戶端 該CPU傳輸式耦接之一記憶體單元,該 一保護區,該故障回應媒介載入至該保護 故障回應媒介於0 S運作時間操作模式期丨 2 2 ·如申請專利範圍第2 〇項之客戶端 傳輸連結傳輸式耦]接該CPU至一伺服器 回應媒介偵測到該系統錯誤時,該故障回 輸連結傳送一錯誤訊息至該伺服器系統 錯誤訊息至與該 及 策略指令係由該 所推及而得。 讀取之媒體,其 、一載入一基本 令的其中至少之 (OS)運作時間之 ;以及 該c P U,並儲存 CPU執行該故 運作時間操作模 略回應該系統錯 系統,復包括與 記憶體單元具有 區中,以防止該 荀受到I化誤。 系統,復包括一 系統,當該故障 應媒介透過該傳 -28 - (5) 1261748 2 3 .如申請專利範圍第2 2之客戶端系統,其中該錯誤 訊息係由該故障回應媒介所產生,以回應客戶端系統之一 記憶體位置之詢問,該記憶體位置包含資料’以決定於該 〇 S運作時間操作模式期間是否該資料已依照一預定方式 發展。 2 4 .如申請專利範圍第2 2之客戶端系統’其中該故障 容限策略係儲存於該伺服器系統上,且其中該故障回應媒 介自該伺服器系統接收一策略指令’該策略指令係由該故 障容限策略與該錯誤訊息之至少一部份推及而得。 2 5 .如申請專利範圍第2 4項之客戶端系統,其中該策 略指令包括載入一軟體影像之命令、一載入一基本輸入輸 出系統影像之命令、以及一重設命令的其中至少之一。 2 6 .如申請專利範圍第2 2項之客戶端系統,其中若該 故障回應媒介沒有接收到來自該伺服器系統之策略指令時 ,該故障回應媒介根據該系統錯誤以及該故障容限策略, 執行回復已儲存之一軟體影像,回復已儲存之一基本輸入 輸出影像、以及重設該處理系統之其中至少之一。 2 7 .如申請專利範圍第2 0項之客戶端系統,其中,該 保護操作模式係週期性地啓動。 2 8. —*種伺服益系統’包ί古· 一傳輸連結’輔接至一網路以及接收一錯誤訊息,該 錯誤訊息來自與該網路傳輸式耦接之一客戶端系統; --記憶體單元’儲存一故障容限策略;以及 —中央處理器(C P U ),傳輸式耦接置該傳輸連結以及 >29- (6)1261748 該記憶體單元,該CPU 生係由該接收到之錯誤訊 份推及而得之策略指令, 客戶端系統,以回應該接 2 9 .如申請專利範圍】 略指令包括載入一軟體影 出系統影像之命令、以及 3 0 .如申請專利範圍^ 客戶端系統具有一未處理 該網路傳送一中斷訊號, 訊號啓動於該客戶端系統 客戶端系統透過該網路傳 執行一策略媒介,該策略媒介產 息與該故障容限策略之至少一部 該策略指令透過該網路傳送至該 收到之錯誤訊息。 _ 2 8項之伺服器系統,其中該策 像之命令、一載入一基本輸入輸 一重設命令的其中至少之一。 春2 8項之伺服器系統,其中若該 之系統錯誤時,該策略媒介透過 由該客戶端系統所接收,該中斷 中之一保護操作模式,並引起該 送該錯誤訊號。 -30-
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/387,750 US7318171B2 (en) | 2003-03-12 | 2003-03-12 | Policy-based response to system errors occurring during OS runtime |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200426571A TW200426571A (en) | 2004-12-01 |
TWI261748B true TWI261748B (en) | 2006-09-11 |
Family
ID=32961964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093102834A TWI261748B (en) | 2003-03-12 | 2004-02-06 | Policy-based response to system errors occurring during OS runtime |
Country Status (6)
Country | Link |
---|---|
US (1) | US7318171B2 (zh) |
CN (1) | CN100383748C (zh) |
DE (1) | DE112004000334T5 (zh) |
GB (1) | GB2414318B (zh) |
TW (1) | TWI261748B (zh) |
WO (1) | WO2004081920A2 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7318171B2 (en) | 2003-03-12 | 2008-01-08 | Intel Corporation | Policy-based response to system errors occurring during OS runtime |
JP2005084721A (ja) * | 2003-09-04 | 2005-03-31 | Renesas Technology Corp | マイクロコンピュータ |
US20050138441A1 (en) * | 2003-12-19 | 2005-06-23 | Huffman Amber D. | Power management without interrupt latency |
GB0427942D0 (en) * | 2004-12-21 | 2005-01-26 | Ibm | A diagnostic system |
US7827339B2 (en) | 2005-01-25 | 2010-11-02 | American Megatrends, Inc. | System management interrupt interface wrapper |
JP4641443B2 (ja) * | 2005-03-28 | 2011-03-02 | 富士通株式会社 | ログ情報管理装置、ログ情報管理方法およびログ情報管理プログラム |
KR101123742B1 (ko) * | 2005-12-23 | 2012-03-16 | 삼성전자주식회사 | 사용자 인터페이스와 소프트웨어 간의 신뢰 경로 설정 방법및 장치 |
US20090222926A1 (en) * | 2008-02-28 | 2009-09-03 | Honeywell International Inc. | Software license management system that functions in a disconnected or intermittently connected mode |
CN101247419B (zh) * | 2008-03-26 | 2011-12-07 | 北京航空航天大学 | 一种基于xesb的服务中介层容错方法 |
US8239667B2 (en) * | 2008-11-13 | 2012-08-07 | Intel Corporation | Switching between multiple operating systems (OSes) using sleep state management and sequestered re-baseable memory |
US8195987B2 (en) * | 2009-06-12 | 2012-06-05 | Microsoft Corporation | Hang recovery in software applications |
DE102010028231A1 (de) * | 2010-04-27 | 2011-10-27 | Robert Bosch Gmbh | Speichermodul zur gleichzeitigen Bereitstellung wenigstens eines sicheren und wenigstens eines unsicheren Speicherbereichs |
US9063836B2 (en) * | 2010-07-26 | 2015-06-23 | Intel Corporation | Methods and apparatus to protect segments of memory |
WO2012121714A1 (en) * | 2011-03-09 | 2012-09-13 | Hewlett-Packard Development Company, L.P. | Performing a change process based on a policy |
WO2013101083A1 (en) * | 2011-12-29 | 2013-07-04 | Intel Corporation | An apparatus for hardware accelerated runtime integrity measurement |
CN103853653A (zh) * | 2012-11-30 | 2014-06-11 | 鸿富锦精密工业(深圳)有限公司 | 计算设备测试系统及方法 |
CN104462953B (zh) * | 2013-09-16 | 2018-04-27 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
EP3839742A1 (en) * | 2014-07-09 | 2021-06-23 | Telefonaktiebolaget LM Ericsson (publ) | A method for diagnosing power supply failure in a wireless communication device |
KR20160098929A (ko) * | 2015-02-11 | 2016-08-19 | 한국전자통신연구원 | 시스템 개발을 위한 시스템 가용도 측정장치 및 그 방법 |
US11645156B1 (en) * | 2021-10-29 | 2023-05-09 | Hewlett Packard Enterprise Development Lp | Updating error policy |
US12066908B2 (en) * | 2022-07-29 | 2024-08-20 | Dell Products Lp | System and method for predicting and avoiding hardware failures using classification supervised machine learning |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4703481A (en) * | 1985-08-16 | 1987-10-27 | Hewlett-Packard Company | Method and apparatus for fault recovery within a computing system |
US5317752A (en) | 1989-12-22 | 1994-05-31 | Tandem Computers Incorporated | Fault-tolerant computer system with auto-restart after power-fall |
JP2534392B2 (ja) | 1990-09-21 | 1996-09-11 | 三田工業株式会社 | 画像形成装置のための自己診断および自己修復システム |
US5255379A (en) * | 1990-12-28 | 1993-10-19 | Sun Microsystems, Inc. | Method for automatically transitioning from V86 mode to protected mode in a computer system using an Intel 80386 or 80486 processor |
US5357628A (en) * | 1992-03-25 | 1994-10-18 | Intel Corporation | Computer system having integrated source level debugging functions that provide hardware information using transparent system interrupt |
US6148441A (en) | 1994-04-06 | 2000-11-14 | Dell Usa, L.P. | Method for reprogramming flash ROM in a personal computer implementing an EISA bus system |
US6093213A (en) * | 1995-10-06 | 2000-07-25 | Advanced Micro Devices, Inc. | Flexible implementation of a system management mode (SMM) in a processor |
US5974573A (en) | 1996-01-16 | 1999-10-26 | Dell Usa, L.P. | Method for collecting ECC event-related information during SMM operations |
JP3072048B2 (ja) * | 1996-03-19 | 2000-07-31 | 株式会社東芝 | 計算機システムおよび計算機システムのソフトウェア故障回復方法 |
US6000043A (en) | 1996-06-28 | 1999-12-07 | Intel Corporation | Method and apparatus for management of peripheral devices coupled to a bus |
US6000040A (en) | 1996-10-29 | 1999-12-07 | Compaq Computer Corporation | Method and apparatus for diagnosing fault states in a computer system |
US5978912A (en) * | 1997-03-20 | 1999-11-02 | Phoenix Technologies Limited | Network enhanced BIOS enabling remote management of a computer without a functioning operating system |
US6012154A (en) * | 1997-09-18 | 2000-01-04 | Intel Corporation | Method and apparatus for detecting and recovering from computer system malfunction |
US6173417B1 (en) * | 1998-04-30 | 2001-01-09 | Intel Corporation | Initializing and restarting operating systems |
US6370586B2 (en) * | 1998-10-30 | 2002-04-09 | Intel Corporation | Monitoring of an electronic device with a system management controller |
US6205547B1 (en) * | 1998-11-20 | 2001-03-20 | Intel Corporation | Computer system management apparatus and method |
CN1283029A (zh) * | 1999-07-29 | 2001-02-07 | 神基科技股份有限公司 | 远端系统诊断方法 |
US7120788B2 (en) * | 2002-06-20 | 2006-10-10 | Intel Corporation | Method and system for shutting down and restarting a computer system |
US7318171B2 (en) | 2003-03-12 | 2008-01-08 | Intel Corporation | Policy-based response to system errors occurring during OS runtime |
-
2003
- 2003-03-12 US US10/387,750 patent/US7318171B2/en not_active Expired - Fee Related
-
2004
- 2004-02-04 DE DE112004000334T patent/DE112004000334T5/de not_active Ceased
- 2004-02-04 CN CNB2004800053272A patent/CN100383748C/zh not_active Expired - Fee Related
- 2004-02-04 WO PCT/US2004/003151 patent/WO2004081920A2/en active Application Filing
- 2004-02-04 GB GB0513405A patent/GB2414318B/en not_active Expired - Fee Related
- 2004-02-06 TW TW093102834A patent/TWI261748B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US7318171B2 (en) | 2008-01-08 |
GB2414318A (en) | 2005-11-23 |
GB0513405D0 (en) | 2005-08-03 |
WO2004081920A3 (en) | 2004-12-16 |
DE112004000334T5 (de) | 2006-03-09 |
CN100383748C (zh) | 2008-04-23 |
GB2414318B (en) | 2006-08-09 |
US20040181708A1 (en) | 2004-09-16 |
TW200426571A (en) | 2004-12-01 |
CN1754153A (zh) | 2006-03-29 |
WO2004081920A2 (en) | 2004-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI261748B (en) | Policy-based response to system errors occurring during OS runtime | |
JP4440990B2 (ja) | 機能するオペレーティング・システムなしにコンピュータのリモート管理を可能にするネットワーク機能拡張bios | |
JP4156663B2 (ja) | ネットワーク内でプログラムを監視し、制御する方法および装置 | |
US6697963B1 (en) | Method of updating a system environmental setting | |
US6065053A (en) | System for resetting a server | |
TWI610167B (zh) | 改善平台管理的計算裝置建置方法、保持電腦可執行指令之非暫存媒體及配置為提供強化管理資訊之計算裝置 | |
US6330690B1 (en) | Method of resetting a server | |
US6691225B1 (en) | Method and apparatus for deterministically booting a computer system having redundant components | |
US7788520B2 (en) | Administering a system dump on a redundant node controller in a computer system | |
TWI450103B (zh) | 伺服器之遠端管理系統及方法,及其電腦程式產品 | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US9021317B2 (en) | Reporting and processing computer operation failure alerts | |
WO2006039593A2 (en) | Self-monitoring and updating of firmware over a network | |
US20060242453A1 (en) | System and method for managing hung cluster nodes | |
US20170132102A1 (en) | Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus | |
CN110083491A (zh) | 一种bios初始化方法、装置、设备及存储介质 | |
US7546604B2 (en) | Program reactivation using triggering | |
US20050033952A1 (en) | Dynamic scheduling of diagnostic tests to be performed during a system boot process | |
WO2024119787A1 (zh) | Amd服务器系统安装断电处理方法、装置、设备及介质 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
US11714696B2 (en) | Custom baseboard management controller (BMC) firmware stack watchdog system and method | |
CN115756648A (zh) | 一种双基板管理控制器芯片的主动恢复方法及终端 | |
US8359220B2 (en) | Technical support routing among members of a technical support group | |
CN107704399B (zh) | 一种存储数据的方法和装置 | |
TWI715005B (zh) | 用於監控基板管理控制器之常駐程序的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |