JP2009015525A - データ処理装置及びその制御方法 - Google Patents

データ処理装置及びその制御方法 Download PDF

Info

Publication number
JP2009015525A
JP2009015525A JP2007175503A JP2007175503A JP2009015525A JP 2009015525 A JP2009015525 A JP 2009015525A JP 2007175503 A JP2007175503 A JP 2007175503A JP 2007175503 A JP2007175503 A JP 2007175503A JP 2009015525 A JP2009015525 A JP 2009015525A
Authority
JP
Japan
Prior art keywords
memory
abnormality
control element
memory module
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007175503A
Other languages
English (en)
Inventor
Hiroteru Tsuchiya
裕輝 土屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2007175503A priority Critical patent/JP2009015525A/ja
Publication of JP2009015525A publication Critical patent/JP2009015525A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • Memory System (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

【課題】 制御要素であるメモリに異常が生じた場合でも、その後の迅速かつ確実な再起動が可能なデータ処理装置及びその制御方法を提供。
【解決手段】 少なくとも1つが制御要素として使用される複数のメモリを搭載する。起動時に、制御要素として使用されるメモリの異常を検出すると、各メモリのうち、異常が検出されたメモリを除く他のメモリを新たな制御要素として設定し、起動を継続する。
【選択図】 図3

Description

本発明は、メモリの異常に対処したデータ処理装置及びその制御方法に関する。
近年、コンピュータを利用したシステムは、交通管制システムや金融システムをはじめ、産業のいたるところに浸透している。そのため、システムを構成する各種コンピュータに故障等が生じた際、システムを停止することなく故障箇所の修復を行えるような、高い信頼性を備えたコンピュータへのニーズが益々高まっている。
このような要求に応えるべく、種々の信頼性向上手段を講じたコンピュータシステムが提案されている。例えば特許文献1に記載の高信頼化(フォールトトレランス:Fault Tolerance)コンピュータシステムでは、プロセッサ及び入出力装置の高信頼化を図るため、特別な周辺回路を用いずに一般に流通している汎用プロセッサを用いて、汎用計算機と共通性が高く、共同開発可能で性能価格性の高い高信頼化コンピュータシステムを実現する手法が提案されている。
特開平9−34809号公報
しかしながら、運用中のシステムが、構成要素である各デバイスの障害による停止でダウンすることが、多大な損失を生むようなものであるとき、例えばメモリモジュールやCPU等のあらゆる構成要素の高信頼化が必要となることは言うまでもない。
本発明はこのような事情に基づいてなされたものであり、その目的は、制御要素であるメモリに異常が生じた場合でも、その後の迅速かつ確実な再起動が可能なデータ処理装置及びその制御方法を提供しようとするものである。
本発明のデータ処理装置は、少なくとも1つが制御要素として使用される複数のメモリと、起動時、前記制御要素として使用されるメモリの異常を検出する検出手段と、前記検出手段で異常が検出されたとき、前記各メモリのうち、異常が検出されたメモリを除く他のメモリを新たな制御要素として設定する制御手段と、を具備したことを特徴とするものである。
かかる手段を講じた本発明によれば、制御要素であるメモリに異常が生じた場合でも、その後の迅速かつ確実な再起動が可能なデータ処理装置及びその制御方法を提供できる。
以下、この発明を実施するための最良の形態について、図面を用いて説明する。
図1は、本実施の形態にかかるデータ処理装置1の要部構成を示すブロック図である。データ処理装置1は、制御の中枢としてCPU2を搭載している。このCPU2に対し、データ受渡しの管理等の情報流通を制御するチップセット3、少なくとも1つが制御要素(いわゆるメインメモリ)として使用されるデータ記憶用の複数のメモリモジュール4a,4b、画像の処理を行う画像処理カード5、拡張ボード等を装着するための複数のPCIスロット6、BIOS−ROM(Basic Input/Output System−Read Only Memory)7、NVRAM(Non Volatile Random Access Memory)12などを、例えばPCIバス等のバスライン8を介して接続している。
チップセット3は、CPU2とバスライン8とを接続するために用いられるノースブリッジ9と、各種コントローラ等の機能を有するサウスブリッジ10とを備えている。画像処理カード5には、情報を出力するためのディスプレイ11が接続されている。ディスプレイ11は、後述の障害が発生したメモリモジュール4a及びその交換要請等を表示する。
ノースブリッジ9は、OS制御によりアプリケーションを起動し、データ処理を実行することができるよう、CPU2に対する各種機器の接続を賄う。BIOS−ROM7には、POST(Power-On Self Test)71と、BIOSドライバ72と、VGA(Video Graphics Array)ドライバ73とが記録されている。POST71は、BIOSがシステム電源投入時に各ハードウェアを初期化する際に実行されるテストプログラムで、異常が検出された場合、その内容をディスプレイ11へ表示したり、又はBeep音の出力等によりユーザーに報知する。VGAドライバ73は、VGAを制御する。
NVRAM12は、SRAM(Static Random Access Memory)に小さな電池を持たせることにより、外部から電源が供給されない間も記憶情報を保持する仕組みを備えている。NVRAM12には、BIOSの設定情報及びエラー発生情報等が記録される。
そして、CPU2は、主要な機能として、次の(1)〜(3)の機能を備えている。
(1)起動時、メモリモジュール4a,4bのうち、制御要素として使用されるいずれか一方のメモリモジュールの異常を検出する検出手段。
(2)上記検出手段で異常が検出されたとき、メモリモジュール4a,4bのうち、異常が検出されたメモリモジュールを除く他のメモリモジュールを新たな制御要素として設定し起動を継続する制御手段。
(3)上記異常が検出されたメモリモジュールをディスプレイ11の表示により報知する報知手段。
図2の流れ図により、基本的な動作について説明する。
まず、データ処理装置1の筐体に設けられた電源投入釦の押下等により、BIOSの制御下にて起動処理を実行する(ST101)。この起動処理では、上記メモリモジュール4a,4bのうち、制御要素として使用される例えばメモリモジュール4aの異常を検出する。異常があれば起動を停止し、異常がなければ起動を継続する。そして起動が完了すると、OSを起動し(ST102)、通常のデータ処理を実行する通常処理に入る(ST103)。この通常処理では、メモリモジュール4aの致命的な障害の発生を監視する(ST104)。障害の発生がなければ(ST104のNO)ユーザーからのデータ処理装置1に対する終了指示を待つ(ST105)。終了指示を受けた場合(ST105のYES)、終了処理を実行する。
メモリモジュール4aに致命的な障害が発生した場合(ST104のYES)、例えば使用可能であるメモリ領域にデータの書込みが不可能となった場合など、システムロックやリブート等を生じてしまう。このとき、BIOSの制御により再起動処理を実行する(ST107)。
図3の流れ図により、再起動処理の具体例について説明する。再起動処理は、上記ST101の起動処理と同じであり、先ずメモリモジュール4aの異常を検出する(ST201)。この異常検出は、メモリモジュール4aの不良箇所を発見し、その不良箇所のメモリアドレスを特定する処理を含んでいる。特定した不良箇所のメモリアドレスは、NVRAM12に記録する。
メモリモジュール4aに異常がない場合(ST202のNO)、そのまま起動を継続し(ST203)、各デバイスの診断及び初期化等を行う。そして、起動の完了後、OSの制御下にて上記ST102〜105の処理を再び実行する。
ただし、上記した致命的な障害の発生に関わる何らかの異常がメモリモジュール4aにある場合には(ST202のYES)、そのメモリモジュール4aを制御対象から切離す(ST204)。この切離しは、例えばメモリモジュール4a及びチップセット3がSPD(Serial Presence Detect)に対応している場合、SPDより取り出される障害の発生したメモリモジュール4aのメモリクロックを無視し、使用不可とすることにより行う。そして、この切離しに伴い、他方のメモリモジュール4bを新たな制御要素として設定する(ST205)。
なお、切離したメモリモジュール4aの識別子をNVRAM12に記録する。この識別子は、複数あるメモリモジュール4a,4bの中から一つを特定するに足るものであれば如何様であってもよい。例えば、本実施形態のようにデータ処理装置1が2つのメモリモジュール4a,4bを搭載可能であるとき、一方のメモリモジュール4aの識別子を“0”、他方のメモリモジュール4bの識別子を“1”として、NVRAM12に記録された変数Xに切離し処理を行った方を記録する。3つ以上のメモリモジュールが搭載可能である場合には、例えば識別子を用いず、NVRAM12にメモリモジュールの搭載可能数分の変数X1,X2,X3,…を記録する。そして“0”を正常(致命的な障害なし)、“1”を異常(致命的な障害有り)として各メモリモジュールの状態を記録する。このようにすれば、いくつかのメモリモジュールに致命的な障害が発生した際においても、それらを上記ST204の処理にて制御対象から切離すことで、残りの正常なメモリモジュールを用いてデータ処理装置1の稼動を継続できる。
メモリモジュール4bを新たな制御要素として設定した後、メモリモジュール4aが異常であることをディスプレイ11の表示によって報知する(ST206)。例えば、メモリモジュール4aのEEPROM(Electronically ERASABLE and Programmable Read Only Memory)に記録された型番をSPDにより読み出し、それを表示する。この表示に際しては、メモリモジュール4aの変換が必要な旨の文字情報もいっしょに表示する。ユーザーは、状況に応じてデータ処理装置1の動作を終了し、メモリモジュール4aを交換するか、又はデータ処理装置1を終了せずに処理を実行するかを決定することができる。
制御要素として新たに設定されたメモリモジュール4bに対しても上記ST201による異常検出が実行されるが、メモリモジュール4bに異常がなければ(ST202のNO)、そのまま起動を継続することとなる(ST203)。
このように、メモリモジュール4aに致命的な障害が発生して、一旦はシステムロックやリブート等の異常現象が発生しても、メモリモジュール4bをメモリモジュール4aに代わる新たな制御要素として設定することにより、迅速かつ確実な再起動が可能となり、業務の停滞を回避することができる。メモリモジュール4aを交換する時期は、ユーザーが最適である時期を選択すればよい。
このような複数のメモリモジュール4a,4bによる起動バックアップ機能を備えた高信頼性システムは、システムダウンによる損害が大きいシステム運用形態に対して特に有効である。例えば、POSシステムにおける商品登録業務が挙げられる。POSシステムにおける商品登録業務においては、システムダウンが発生した際、業務の続行が困難となる場合が多数である。他にも道路交通システムや金融管理システムなど生活の根幹に関わるシステムにも本発明は有効である。
なお、この実施の形態ではデータ処理装置1に2つのメモリモジュール4a,4bを搭載した場合を例に説明したが、2つに限らず、3つ以上でもよい。
この他、前記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全体構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を組合せてもよい。
本実施の形態におけるデータ処理装置の要部構成を示すブロック図。 同データ処理装置の基本的な動作を説明するための流れ図。 同データ処理装置の起動(再起動)処理を説明するための流れ図。
符号の説明
1…データ処理装置、2…CPU、3…チップセット、4a,4b…メモリモジュール、5…画像処理カード、6…PCIスロット、7…BIOS−ROM、8…バスライン、9…ノースブリッジ、10…サウスブリッジ、11…ディスプレイ、12…NVRAM、71…POST、72…BIOSドライバ、73…VGAドライバ

Claims (4)

  1. 少なくとも1つが制御要素として使用される複数のメモリと、
    起動時、前記制御要素として使用されるメモリの異常を検出する検出手段と、
    前記検出手段で異常が検出されたとき、前記各メモリのうち、異常が検出されたメモリを除く他のメモリを新たな制御要素として設定し起動を継続する制御手段と、
    を備えていることを特徴とするデータ処理装置。
  2. 前記異常が検出されたメモリを報知する報知手段、をさらに備えていることを特徴とするデータ処理装置。
  3. 少なくとも1つが制御要素として使用される複数のメモリを備えたデータ処理装置において、
    起動時、前記制御要素として使用されるメモリの異常を検出するステップと、
    前記異常が検出されたとき、前記各メモリのうち、異常が検出されたメモリを除く他のメモリを新たな制御要素として設定し起動を継続するステップと、
    を備えていることを特徴とするデータ処理装置の制御方法。
  4. 前記異常が検出されたメモリを報知するステップ、をさらに備えていることを特徴とするデータ処理装置の制御方法。
JP2007175503A 2007-07-03 2007-07-03 データ処理装置及びその制御方法 Pending JP2009015525A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007175503A JP2009015525A (ja) 2007-07-03 2007-07-03 データ処理装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007175503A JP2009015525A (ja) 2007-07-03 2007-07-03 データ処理装置及びその制御方法

Publications (1)

Publication Number Publication Date
JP2009015525A true JP2009015525A (ja) 2009-01-22

Family

ID=40356366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007175503A Pending JP2009015525A (ja) 2007-07-03 2007-07-03 データ処理装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP2009015525A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182247A1 (ja) * 2020-03-11 2021-09-16 株式会社ソシオネクスト 半導体集積回路装置
JP2021177301A (ja) * 2020-05-07 2021-11-11 株式会社リコー 電子機器および電子機器の制御方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04361344A (ja) * 1991-06-10 1992-12-14 Nec Commun Syst Ltd 記憶回路
JPH09259048A (ja) * 1996-03-25 1997-10-03 Sharp Corp 記憶装置
JP2000187525A (ja) * 1998-10-16 2000-07-04 Samsung Electronics Co Ltd メモリクロック信号を制御するコンピュ―タ―システム及びその方法
JP2003242046A (ja) * 2002-02-14 2003-08-29 Sumitomo Wiring Syst Ltd 情報処理装置、情報処理装置の動作方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04361344A (ja) * 1991-06-10 1992-12-14 Nec Commun Syst Ltd 記憶回路
JPH09259048A (ja) * 1996-03-25 1997-10-03 Sharp Corp 記憶装置
JP2000187525A (ja) * 1998-10-16 2000-07-04 Samsung Electronics Co Ltd メモリクロック信号を制御するコンピュ―タ―システム及びその方法
JP2003242046A (ja) * 2002-02-14 2003-08-29 Sumitomo Wiring Syst Ltd 情報処理装置、情報処理装置の動作方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182247A1 (ja) * 2020-03-11 2021-09-16 株式会社ソシオネクスト 半導体集積回路装置
JP2021177301A (ja) * 2020-05-07 2021-11-11 株式会社リコー 電子機器および電子機器の制御方法
JP7447668B2 (ja) 2020-05-07 2024-03-12 株式会社リコー 電子機器および電子機器の制御方法

Similar Documents

Publication Publication Date Title
US6574748B1 (en) Fast relief swapping of processors in a data processing system
US8667315B2 (en) Synchronization control apparatus, information processing apparatus, and synchronization management method for managing synchronization between a first processor and a second processor
JP4645837B2 (ja) メモリダンプ方法、コンピュータシステム、およびプログラム
KR101018373B1 (ko) 컴퓨터 장치, 프로세서 진단 방법 및 프로세서 진단 제어 프로그램을 저장하는 기억 매체
JP4586750B2 (ja) コンピュータシステムおよび起動監視方法
US20120110378A1 (en) Firmware recovery system and method of baseboard management controller of computing device
US20070174689A1 (en) Computer platform embedded operating system backup switching handling method and system
TW201520895A (zh) Bios自動恢復系統及方法
JP6698467B2 (ja) 電子回路システム及び制御装置の起動方法
CN109614130A (zh) 一种带有试运行、自检查的云广播升级方法及系统
WO2017080225A1 (zh) 数据分区的修复方法、装置及终端
JP2010224847A (ja) 計算機システム及び設定管理方法
CN111722960A (zh) 一种cmos信息异常下的开机方法、系统、设备以及介质
CN114116280A (zh) 交互式bmc自恢复方法、系统、终端及存储介质
JP4886558B2 (ja) 情報処理装置
JP5305473B2 (ja) エラーコード出力装置及びエラーコード出力方法
CN116266150A (zh) 一种业务恢复方法、数据处理单元及相关设备
JP2009015525A (ja) データ処理装置及びその制御方法
JP2009026242A (ja) データ処理装置
CN101464828A (zh) 主机与主机状况的评估方法
JP2006065440A (ja) プロセス管理システム
JP4648097B2 (ja) レジストリ情報の修復方法および情報処理装置
JP4635993B2 (ja) 起動診断方式、起動診断方法およびプログラム
JP2010198314A (ja) 情報管理装置
JP2008191864A (ja) データ処理装置及びその起動方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120124