JP6530774B2 - ハードウェア障害回復システム - Google Patents
ハードウェア障害回復システム Download PDFInfo
- Publication number
- JP6530774B2 JP6530774B2 JP2017032791A JP2017032791A JP6530774B2 JP 6530774 B2 JP6530774 B2 JP 6530774B2 JP 2017032791 A JP2017032791 A JP 2017032791A JP 2017032791 A JP2017032791 A JP 2017032791A JP 6530774 B2 JP6530774 B2 JP 6530774B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- sleep state
- system component
- hardware
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
- G06F11/1484—Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4063—Device-to-bus coupling
- G06F13/4068—Electrical coupling
- G06F13/4081—Live connection to bus, e.g. hot-plugging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2289—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by configuration test
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
- G06F11/3062—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45587—Isolation or security of virtual machine instances
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/815—Virtual
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Description
102… バス
104… メモリ
106… 読み取り専用メモリ
108… ランダムアクセスメモリ
110… コントローラ
112… ストレージデバイス
114… 第1モジュール
116… 第2モジュール
118… 第3モジュール
120… 入力装置
122… 出力装置
124… 通信インターフェース
126… センサー
128… キャッシュ
130… プロセッサ
132… フラッシュメモリ
134… ファームウェア
136… ディスプレイ
150… コンピュータシステム
152… チップセット
154… ブリッジ
156… ユーザーインターフェース装置
158… 通信インターフェース
160… プロセッサ
162… ファームウェア
164… 出力装置
166… ストレージデバイス
168… ランダムアクセスメモリ
170… 仮想環境
172… 仮想マシンマネージャー(VMM)
174… バーチャルマシン
176… ホスト
178… リソースプール
180… データセンター
200… システム
202… ハードディスクデバイス
204… 周辺装置
206… メモリ
208… プロセッサ
210… 電源ユニット
212… スリープ状態S4
214… スリープ状態S3
216… スリープモード転換
218… ウェイクアップ転換
220… 作業状態S0
300… スリープ状態表
302… 故障記述
304… 障害回復スリープ状態
306… 遅延レジューム
308… プロセッサ
310… メモリ
312… 電源
314… 周辺装置
316… ストレージデバイス
318… ファン
320… スリープ状態S4
322… スリープ状態S3
324… スリープ状態S1
326… スリープ状態S4の遅延
328… スリープ状態S3の遅延
330… スリープ状態S1の遅延
400… 通信
402… 作業システム
404… ハードウェアコンポーネント
410… ハードウェアの状態の監視
412… RAS特徴
414… エラー報告
416… エラー報告
418… エラー報告
420… スリープ状態要求
422… ウェイクアップ要求
424… AC電源段階
426… DC電源段階
428… パワーオンセルフテスト(POST)
430… スタンバイ
432… レジューム
434… ハードウェアインターフェース
436… RESTful、IPMI
438… RESTful API
500… 故障修復表
502… 特徴カラム
504… 記述カラム
506… 優先格付けカラム
508… 故障検出
510… 緩和計画(例えば、運転時間の延長)
512… 回復特徴
514… OSからエラー通知を得る、故障の重大性、位置と数量を識別する工程
516… 故障のリソースをリソースプールから隔離する、新しいリソースをVMに再度割り当てるとともに、VMを閉鎖して、異なるサーバに転換する工程
518… VMデータをバックアップして、データ損失を防止し、サーバ、または、システムの調子が良くなった後(たとえば、障害回復後)、VMデータを修復する工程
520… 高優先度
522… 任意優先度
602〜612、702〜720、802〜820、902〜918… 工程
Claims (10)
- 方法であって、
システムに関連するハードウェアエラーを検出する工程と、
前記ハードウェアエラーに関連するシステムコンポーネントを識別する工程と、
前記システムの操作システムをトリガーして、前記システムを特定のスリープ状態に置くように、基板管理コントローラによりスリープ状態要求を生成する工程であって、前記システムコンポーネントに関連するコンポーネントのタイプに基づいて、前記特定のスリープ状態が決定され、前記特定のスリープ状態は、前記コンポーネントのタイプが周辺装置であるとき、第一スリープ状態であり、前記コンポーネントのタイプが、プロセッサ、メモリ、または、電源ユニットの一つであるとき、第二スリープ状態である工程と、
前記システムが前記特定のスリープ状態になった後、前記システムの前記操作システムを再起動せずに、前記システムコンポーネントを代替する指示であって、前記システムが、前記システムコンポーネントに関連する前記コンポーネントのタイプに対応する前記特定のスリープ状態である決定に基づいて生成される指示を生成する工程と、
を有することを特徴とする方法。 - さらに、
前記ハードウェアエラーの重大性、前記ハードウェアエラーの誤り件数、および、前記ハードウェアエラーの位置の少なくとも一つを判断する工程であって、前記重大性が、前記ハードウェアエラーが修復できない、または、前記誤り件数がスレショルドを超えることを示すとき、前記スリープ状態要求が生成され、前記特定のスリープ状態が、前記ハードウェアエラーの前記位置に基づく工程と、
前記システムコンポーネントに関連するハードウェア情報を収集して、前記システムコンポーネントのハードウェア配置を判断する工程と、
前記システムコンポーネントの前記ハードウェア配置が、代替システムコンポーネントの対応するハードウェア配置と符合するか判断する工程と、
前記システムの前記操作システムを再起動しない、前記システムで作動する前記システムコンポーネントと関連するアプリケーションを再配置しない、または、前記システムコンポーネントに関連する前記システム内のハードウェア設定を再設定せずに、前記システムコンポーネントを、代替システムコンポーネントで代替する工程と、
サービス割り込みによって、前記システムコンポーネントにより送信されるエラー報告に基づいて、システムファームウェアコンポーネント上の前記基板管理コントローラにより、前記ハードウェアエラーの通知を受信する工程と、を有し、
前記システムコンポーネントは、周辺装置、第二プロセッサ、第二メモリ、または、第二電源ユニットの少なくとも一つを有し、前記周辺装置は、ストレージコンポーネント、周辺装置相互接続コンポーネント、PCIエクスプレスコンポーネント、および、ファンの一つを有し、前記第二スリープ状態は、前記第一スリープ状態より低い電源リソース消耗、および、前記第一スリープ状態より長いレジューム遅延を生じ、
前記システムはホットプラグ設計に基づかず、前記システムにホットアドコンポーネントまたはホットリムーブコンポーネントを使用せずに、前記システムコンポーネントの代替を実行する、
ことを特徴とする請求項1に記載の方法。 - さらに、
前記システムコンポーネントが部品交換で代替された後、前記部品交換が、互換性がある代替であるか否か判断する工程であって、前記互換性がある代替であるか否かを、前記システムコンポーネントと同じタイプか否か、前記システムコンポーネントと同じハードウェア配置であるか否か、前記システムコンポーネントと同じファームウェアまたはソフトウェアドライバ互換性であるか否か、および前記システムコンポーネントと同じリソース要求であるか否かを判断することによって判断する工程を有することを特徴とする請求項1に記載の方法。 - さらに、
前記システムコンポーネントが、代替システムコンポーネントで代替されたことを検出する工程と、
前記代替システムコンポーネントが、互換性があるか否か判断する工程と、を有し、前記判断する工程は、
ハードウェアコンポーネント情報を分析する工程と、
前記代替システムコンポーネントが、前記システムコンポーネントと同じコンポーネントであるか判断する工程であって、前記システムコンポーネントと同じコンポーネントである場合、前記代替システムコンポーネントは互換性があり、前記システムコンポーネントと同じコンポーネントではない場合、前記システムコンポーネントは互換性がない工程とによって判断し、
前記代替システムコンポーネントが、互換性があるとき、前記代替システムコンポーネントで、前記システムコンポーネントを代替することを可能にし、
前記代替システムコンポーネントが、互換性がないとき、前記代替システムコンポーネントで、前記システムコンポーネントを代替することを拒絶することを特徴とする請求項1に記載の方法。 - 前記システムは仮想マシンマネージャーを有し、
前記方法は、さらに、
前記ハードウェアエラーが、前記仮想マシンマネージャーに関連する一つ以上のバーチャルマシンにより用いられるリソースに影響するか判断する工程と、
前記仮想マシンマネージャーに関連するリソースのプールから、前記リソースを隔離する工程と、
新しいリソースを、前記一つ以上のバーチャルマシンに再度割り当てる工程と、を有することを特徴とする請求項1に記載の方法。 - システムであって、
プロセッサ、および、
指令をその中に保存したコンピュータ可読ストレージ媒体を有し、
前記指令が前記プロセッサにより実施されるとき、前記プロセッサが実行する操作は、
前記システムに関連するハードウェアエラーを検出する工程と、
前記ハードウェアエラーに関連するシステムコンポーネントを識別する工程と、
前記システムの操作システムをトリガーして、前記システムを特定のスリープ状態に置くように、スリープ状態要求を生成する工程であって、前記システムコンポーネントに関連するコンポーネントのタイプに基づいて、前記特定のスリープ状態が決定され、前記特定のスリープ状態は、前記コンポーネントのタイプが周辺装置であるとき、第一スリープ状態であり、前記コンポーネントのタイプがプロセッサ、メモリ、または、電源ユニットの一つであるとき、第二スリープ状態である工程と、
前記システムが前記特定のスリープ状態に置かれた後、前記システムの前記操作システムを再起動せずに、前記システムコンポーネントを代替する指示であって、前記システムが、前記システムコンポーネントに関連する前記コンポーネントのタイプに対応する前記特定のスリープ状態である決定に基づいて生成される指示を生成する工程と、
を有することを特徴とするシステム。 - 前記操作は、さらに、
前記ハードウェアエラーの重大性、前記ハードウェアエラーの誤り件数、および、前記ハードウェアエラーの位置の少なくとも一つを判断する工程であって、前記重大性が、前記ハードウェアエラーが修復できない、または、前記誤り件数がスレショルドを超えることを示すとき、前記スリープ状態要求が生成され、前記特定のスリープ状態は、前記ハードウェアエラーの前記位置に基づく工程と、
前記システムコンポーネントに関連するハードウェア情報を収集して、前記システムコンポーネントのハードウェア配置を判断する工程と、
前記システムコンポーネントの前記ハードウェア配置が、代替システムコンポーネントの対応するハードウェア配置に符合するか判断する工程と、
前記システムコンポーネントが部品交換で代替された後、前記部品交換が、前記システムコンポーネントにとって互換性がある代替か否か判断するとともに、前記部品交換が互換性がある代替であると判断されるとき、前記システムコンポーネントが前記部品交換で代替されるようにする工程であって、前記互換性がある代替であるか否かを、前記システムコンポーネントと同じタイプのシステムコンポーネントであるか否か、前記システムコンポーネントと同じハードウェア配置であるか否か、前記システムコンポーネントと同じファームウェアまたはソフトウェアドライバ互換性であるか否か、前記システムコンポーネントと同じリソース要求であるか否かを判断することによって判断する工程と、を有し、
前記第二スリープ状態は、前記第一スリープ状態より低い電力リソース消耗、および、前記第一スリープ状態より長いレジューム遅延を生じることを特徴とする請求項6に記載のシステム。 - 前記操作は、さらに、
前記システムコンポーネントが、代替システムコンポーネントで代替されたか否か検出する工程と、
前記代替システムコンポーネントが、互換性があるか否か判断する工程と、を有し、前記判断する工程は、
ハードウェアコンポーネント情報を分析する工程と、
前記代替システムコンポーネントが、前記システムコンポーネントと同じコンポーネントであるか否か判断する工程であって、前記システムコンポーネントと同じコンポーネントである場合、前記代替システムコンポーネントは互換性があり、前記システムコンポーネントと同じコンポーネントではない場合、前記システムコンポーネントは互換性がない工程とによって判断し、
前記代替システムコンポーネントが、互換性があるとき、前記代替システムコンポーネントで、前記システムコンポーネントを代替することを可能にし、
前記代替システムコンポーネントが、互換性がないとき、前記代替システムコンポーネントで、前記システムコンポーネントを代替することを拒絶することを特徴とする請求項6に記載のシステム。 - 指令をその中に保存したコンピュータ可読ストレージデバイスであって、
前記指令がプロセッサにより実行されるとき、前記プロセッサが実行する操作は、
システムに関連するハードウェアエラーを検出する工程と、
前記ハードウェアエラーに関連するシステムコンポーネントを識別する工程と、
前記システムの操作システムをトリガーして、前記システムを特定のスリープ状態に置くように、スリープ状態要求を生成する工程であって、前記システムコンポーネントに関連するコンポーネントのタイプに基づいて、前記特定のスリープ状態が決定され、前記特定のスリープ状態は、前記コンポーネントのタイプが周辺装置であるとき、第一スリープ状態であり、前記コンポーネントのタイプが、プロセッサ、メモリ、または、電源ユニットの一つであるとき、第二スリープ状態である工程と、
前記システムが、前記特定のスリープ状態になった後、前記システムの前記操作システムを再起動せずに、前記システムコンポーネントを代替する指示であって、前記システムが、前記システムコンポーネントに関連する前記コンポーネントのタイプに対応する前記特定のスリープ状態である決定に基づいて生成される指示を生成する工程と、
を有し、
前記第二スリープ状態が、前記第一スリープ状態より低い電源リソース消耗、および、前記第一スリープ状態より長いレジューム遅延を生じることを特徴とするコンピュータ可読ストレージデバイス。 - 前記操作は、さらに、
前記ハードウェアエラーの重大性、前記ハードウェアエラーの誤り件数、および、前記ハードウェアエラーの位置の少なくとも一つを判断する工程であって、前記重大性が、前記ハードウェアエラーが修復できない、または、前記誤り件数がスレショルドを超えることを示すとき、前記スリープ状態要求が生成され、前記特定のスリープ状態が、前記ハードウェアエラーの前記位置に基づく工程と、
前記システムコンポーネントに関連するハードウェア情報を収集して、前記システムコンポーネントのハードウェア配置を判断する工程と、
前記システムコンポーネントの前記ハードウェア配置が、代替システムコンポーネントの対応するハードウェア配置と符合するか否か判断する工程と、を有し、
前記システムコンポーネントは、周辺装置、第二プロセッサ、第二メモリ、または、第二電源ユニットの少なくとも一つを有し、前記周辺装置は、ストレージコンポーネント、周辺装置相互接続コンポーネント、PCIエクスプレスコンポーネント、および、ファンの一つを有することを特徴とする請求項9のコンピュータ可読ストレージデバイス。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/052,430 US10360114B2 (en) | 2016-02-24 | 2016-02-24 | Hardware recovery systems |
US15/052,430 | 2016-02-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017224272A JP2017224272A (ja) | 2017-12-21 |
JP6530774B2 true JP6530774B2 (ja) | 2019-06-12 |
Family
ID=58191291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017032791A Active JP6530774B2 (ja) | 2016-02-24 | 2017-02-24 | ハードウェア障害回復システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10360114B2 (ja) |
EP (1) | EP3211532B1 (ja) |
JP (1) | JP6530774B2 (ja) |
CN (1) | CN107122321B (ja) |
TW (1) | TWI588649B (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10726001B2 (en) * | 2017-07-31 | 2020-07-28 | Oracle International Corporation | Discovery and management of physical components |
US10445201B2 (en) * | 2017-10-05 | 2019-10-15 | American Megatrends International, Llc | System and method for automated integration and stress testing of hardware and software service in management controller using containerized toolbox |
TWI685751B (zh) * | 2018-04-10 | 2020-02-21 | 神雲科技股份有限公司 | 伺服器裝置的錯誤報告功能的控制方法 |
CN110471814B (zh) * | 2018-05-11 | 2023-11-07 | 佛山市顺德区顺达电脑厂有限公司 | 服务器装置的错误报告功能的控制方法 |
US10761926B2 (en) * | 2018-08-13 | 2020-09-01 | Quanta Computer Inc. | Server hardware fault analysis and recovery |
CN109117335A (zh) * | 2018-08-15 | 2019-01-01 | 浪潮电子信息产业股份有限公司 | 一种硬盘模拟热插拔测试方法、装置、终端及存储介质 |
CN109086089A (zh) * | 2018-08-27 | 2018-12-25 | 郑州云海信息技术有限公司 | 一种硬件配置限定的方法、系统及设备 |
CN111507483A (zh) * | 2019-01-30 | 2020-08-07 | 鸿富锦精密电子(天津)有限公司 | 返修板检测装置、方法及计算机可读存储介质 |
RU2747474C2 (ru) | 2019-03-29 | 2021-05-05 | Акционерное общество "Лаборатория Касперского" | Способ асинхронного выбора совместимых продуктов |
JP7351129B2 (ja) * | 2019-07-26 | 2023-09-27 | 富士通株式会社 | 情報処理装置および情報処理装置の制御プログラム |
US11099838B1 (en) * | 2020-02-26 | 2021-08-24 | Quanta Computer Inc. | Method and system for recovery for custom integrated circuit |
CN111767181B (zh) * | 2020-06-29 | 2021-11-02 | 深圳小马洛可科技有限公司 | 一种led显示屏用大规模集群管理系统 |
US11314577B2 (en) * | 2020-08-03 | 2022-04-26 | Palo Alto Research Center Incorporated | System and method for constructing fault-augmented system model for root cause analysis of faults in manufacturing systems |
US11334447B2 (en) * | 2020-08-27 | 2022-05-17 | Nuvoton Technology Corporation | Integrated circuit facilitating subsequent failure analysis and methods useful in conjunction therewith |
CN114265489B (zh) * | 2020-09-16 | 2023-10-27 | 富联精密电子(天津)有限公司 | 电源故障监测方法、装置、电子设备及存储介质 |
TWI766409B (zh) * | 2020-10-28 | 2022-06-01 | 大陸商上海川源信息科技有限公司 | 資料存取系統 |
CN112466386B (zh) * | 2020-12-07 | 2022-06-21 | 电子科技大学 | 一种面向故障分类的存储器测试系统及方法 |
JP2022093892A (ja) * | 2020-12-14 | 2022-06-24 | トヨタ自動車株式会社 | 車載システム、車載システム制御方法、及び車載システム制御プログラム |
US11366710B1 (en) | 2021-02-23 | 2022-06-21 | Quanta Computer Inc. | Methods and systems for reducing downtime from system management mode in a computer system |
TWI776612B (zh) * | 2021-07-28 | 2022-09-01 | 宇瞻科技股份有限公司 | 儲存裝置及其操作方法 |
US20230102099A1 (en) * | 2021-09-22 | 2023-03-30 | Texas Instruments Incorporated | Techniques for peripheral utilization metrics collection and reporting |
CN115454705A (zh) * | 2022-07-01 | 2022-12-09 | 深圳星云智联科技有限公司 | 故障处理方法、相关装置、计算机设备、介质和程序 |
CN116932303B (zh) * | 2023-09-14 | 2023-12-29 | 合肥康芯威存储技术有限公司 | 一种存储测试设备及其测试方法 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4747041A (en) * | 1983-06-27 | 1988-05-24 | Unisys Corporation | Automatic power control system which automatically activates and deactivates power to selected peripheral devices based upon system requirement |
US5560022A (en) * | 1994-07-19 | 1996-09-24 | Intel Corporation | Power management coordinator system and interface |
US7099934B1 (en) * | 1996-07-23 | 2006-08-29 | Ewing Carrel W | Network-connecting power manager for remote appliances |
US6370657B1 (en) * | 1998-11-19 | 2002-04-09 | Compaq Computer Corporation | Hot processor swap in a multiprocessor personal computer system |
US6363452B1 (en) * | 1999-03-29 | 2002-03-26 | Sun Microsystems, Inc. | Method and apparatus for adding and removing components without powering down computer system |
US6584573B1 (en) * | 1999-08-30 | 2003-06-24 | Intel Corporation | Placing a computer system into a sleeping state |
US6571333B1 (en) * | 1999-11-05 | 2003-05-27 | Intel Corporation | Initializing a memory controller by executing software in second memory to wakeup a system |
EP1229430B1 (en) * | 2001-01-30 | 2018-05-30 | Hewlett-Packard Development Company, L.P. | Power management system and method |
TW594021B (en) * | 2002-04-30 | 2004-06-21 | Via Tech Inc | Main computer board on/off testing device, method and system |
US7100062B2 (en) * | 2003-01-28 | 2006-08-29 | Hewlett-Packard Development Company, L.P. | Power management controller and method |
TWI230328B (en) | 2003-07-17 | 2005-04-01 | High Tech Comp Corp | Method and computer system for reducing occurrence of cold reset |
US7155623B2 (en) * | 2003-12-03 | 2006-12-26 | International Business Machines Corporation | Method and system for power management including local bounding of device group power consumption |
US7254016B1 (en) * | 2004-05-25 | 2007-08-07 | Emc Corporation | Data storage system with improved serviceability features |
US7447934B2 (en) * | 2005-06-27 | 2008-11-04 | International Business Machines Corporation | System and method for using hot plug configuration for PCI error recovery |
US7984219B2 (en) * | 2005-08-08 | 2011-07-19 | Hewlett-Packard Development Company, L.P. | Enhanced CPU RASUM feature in ISS servers |
US20070074067A1 (en) * | 2005-09-29 | 2007-03-29 | Rothman Michael A | Maintaining memory reliability |
CN100538618C (zh) * | 2006-07-18 | 2009-09-09 | 威盛电子股份有限公司 | 高存取效率的接口电路及方法 |
US7934121B2 (en) * | 2006-11-21 | 2011-04-26 | Microsoft Corporation | Transparent replacement of a system processor |
US7877358B2 (en) * | 2006-11-21 | 2011-01-25 | Microsoft Corporation | Replacing system hardware |
US8250382B2 (en) * | 2007-08-22 | 2012-08-21 | International Business Machines Corporation | Power control of servers using advanced configuration and power interface (ACPI) states |
US8082454B2 (en) * | 2007-11-07 | 2011-12-20 | International Business Machines Corporation | Managing power consumption based on historical average |
US20090164820A1 (en) * | 2007-12-24 | 2009-06-25 | Hewlett-Packard Development Company, L.P. | Methods and apparatus for managing power on a computer in the event of a power interruption |
US8024609B2 (en) * | 2009-06-03 | 2011-09-20 | International Business Machines Corporation | Failure analysis based on time-varying failure rates |
TW201209577A (en) * | 2010-08-20 | 2012-03-01 | Hon Hai Prec Ind Co Ltd | Test system and method of restarting the computer |
US9423847B2 (en) * | 2011-12-20 | 2016-08-23 | Advanced Micro Devices, Inc. | Method and apparatus for transitioning a system to an active disconnect state |
TWI482059B (zh) * | 2012-07-06 | 2015-04-21 | Wistron Corp | 具觸控顯示模組的伺服器及其觸控顯示模組 |
US8990479B2 (en) * | 2012-07-30 | 2015-03-24 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Using persistent memory regions within memory devices to collect serial presence detect and performance data |
US9411762B2 (en) * | 2013-03-15 | 2016-08-09 | Intel Corporation | Method and system for platform management messages across peripheral component interconnect express (PCIe) segments |
-
2016
- 2016-02-24 US US15/052,430 patent/US10360114B2/en active Active
- 2016-04-27 TW TW105113043A patent/TWI588649B/zh active
- 2016-05-12 CN CN201610311469.6A patent/CN107122321B/zh active Active
-
2017
- 2017-02-23 EP EP17157699.4A patent/EP3211532B1/en active Active
- 2017-02-24 JP JP2017032791A patent/JP6530774B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
TWI588649B (zh) | 2017-06-21 |
EP3211532A1 (en) | 2017-08-30 |
JP2017224272A (ja) | 2017-12-21 |
EP3211532B1 (en) | 2021-03-31 |
CN107122321A (zh) | 2017-09-01 |
TW201730763A (zh) | 2017-09-01 |
US10360114B2 (en) | 2019-07-23 |
CN107122321B (zh) | 2020-08-07 |
US20170242758A1 (en) | 2017-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6530774B2 (ja) | ハードウェア障害回復システム | |
US8135985B2 (en) | High availability support for virtual machines | |
CN107479721B (zh) | 远程多计算机切换技术的存储装置、系统及方法 | |
US9158628B2 (en) | Bios failover update with service processor having direct serial peripheral interface (SPI) access | |
US8898517B2 (en) | Handling a failed processor of a multiprocessor information handling system | |
US10146606B2 (en) | Method for system debug and firmware update of a headless server | |
US10387261B2 (en) | System and method to capture stored data following system crash | |
US20170090896A1 (en) | Automatic system software installation on boot | |
US8938736B2 (en) | System and method for providing redundancy for management controller | |
US11526411B2 (en) | System and method for improving detection and capture of a host system catastrophic failure | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US7783872B2 (en) | System and method to enable an event timer in a multiple event timer operating environment | |
US20210263868A1 (en) | System and method to reduce host interrupts for non-critical errors | |
US10606677B2 (en) | Method of retrieving debugging data in UEFI and computer system thereof | |
JP6864718B2 (ja) | ハイブリッド電源のシステム及び方法 | |
US20190004818A1 (en) | Method of UEFI Shell for Supporting Power Saving Mode and Computer System thereof | |
WO2018045922A1 (zh) | 一种备电方法及装置 | |
US11126517B2 (en) | Method and system for communication channels to management controller | |
US10712795B2 (en) | Power supply unit fan recovery process | |
US8560868B2 (en) | Reducing subsystem energy costs | |
US20160179626A1 (en) | Computer system, adaptable hibernation control module and control method thereof | |
US11226862B1 (en) | System and method for baseboard management controller boot first resiliency | |
KR101100894B1 (ko) | 임베디드 장치의 오류검출 및 복구방법 | |
TWI554876B (zh) | 節點置換處理方法與使用其之伺服器系統 | |
US20240012651A1 (en) | Enhanced service operating system capabilities through embedded controller system health state tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6530774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |