JP2002073427A - データ処理システム - Google Patents

データ処理システム

Info

Publication number
JP2002073427A
JP2002073427A JP2000262132A JP2000262132A JP2002073427A JP 2002073427 A JP2002073427 A JP 2002073427A JP 2000262132 A JP2000262132 A JP 2000262132A JP 2000262132 A JP2000262132 A JP 2000262132A JP 2002073427 A JP2002073427 A JP 2002073427A
Authority
JP
Japan
Prior art keywords
error
ecc
memory error
processing
bios
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000262132A
Other languages
English (en)
Inventor
Kunimasa Nagayumi
国誠 長弓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2000262132A priority Critical patent/JP2002073427A/ja
Publication of JP2002073427A publication Critical patent/JP2002073427A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Detection And Correction Of Errors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 発生したECCエラー内容を正確に知ること
ができ、システムの信頼性を向上できるデータ処理シス
テムを提供する。 【解決手段】 ECC制御回路がメモリエラー発生を検
出した場合にこれを根拠に周辺制御部25から発生され
たBIOS切替信号を利用して制御権をOSからBIO
Sに切替可能に形成し、自動修復可能な1ビットメモリ
エラー発生の場合はBIOSに付加されたECCメモリ
エラー処理モジュールに当該1ビットメモリエラーのロ
グ処理を実行させかつログ処理実行後に制御権をOSに
戻し切替可能であるとともに、自動修復不能な2ビット
以上のメモリエラー発生の場合には該ECCメモリエラ
ー処理モジュールに当該2ビット以上メモリエラーのロ
グ処理を実行させかつログ処理実行後に制御権をOSに
戻し切替えしてアプリケーションによるデータ処理の遂
行を中止しかつシステムエラー警告メッセージを発行し
た後に、動作停止可能に形成されている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、OS制御権下でア
プリケーションを起動してデータ処理可能かつECCメ
モリに1ビットメモリエラーが発生したことを検出した
場合に当該エラーデータを自動的に修復可能なECC制
御回路を具備するデータ処理システムに関する。
【0002】
【従来の技術】図4において、データ処理システムは、
CPU(例えば、PIII…インテル社の登録商標)1
0,BIOS(Basic Input/Output
System)15P,制御部20P,ECC(Er
ror CorrectingCode)メインメモリ
30,画像処理カード(例えば、AGP2X)40,画
面45,複数のPCIスロット50および外部システム
マネージメント割込信号発生回路1を含み、OS制御権
下で例えばHDDに格納されかつRAMに展開されたア
プリケーションを駆動してデータ処理を遂行することが
できる。
【0003】制御部20Pは、ECC制御回路を含むC
PU・メモリ・画像制御部[例えば、ノースブリッジ
(82443BX)]21Pおよび周辺制御部[例え
ば、サウスブリッジ(82371EB)]25Pから構
成されている。
【0004】すなわち、OS制御権下でアプリケーショ
ンを起動してデータ処理可能で、ECCメモリ(30)
に1ビットメモリエラーが発生したことを検出した場合
に、当該エラーデータを自動的に修復可能なECC制御
回路(21P)を具備する。なお、OSとして採択され
る市販OS[例えば、Windows NT(マイクロ
ソフト社の登録商標)]には、ECCメモリエラーの記
録(ログ)機能がない。
【0005】説明便宜のための動作説明用フロチャート
でソフトウエアのみならずハードウエアの動作をも含む
ものとして表現した図6において、電源On時にBIO
S15Pでシステムエラー信号(SERR#)をPul
seモードに設定(ST20)しておく。ECCメイン
メモリ30に1ビットエラーが発生すると、CPU・メ
モリ・画像制御部21P内のECC制御回路(21P)
は、化けたデータを自動的に修復する。この場合、シス
テムエラー信号(SERR#)は、発生されない。
【0006】しかし、2ビット以上のエラーが発生した
場合(ST21)には、CPU・メモリ・画像制御部
(ECC制御回路)21Pが、システムエラー信号(S
ERR#)を発生する[図5(A)参照]。つまり、周
辺制御部25Pにその旨を知らせる(ST22)。
【0007】すると、周辺制御部25Pは、処理優先度
がシステムマネージメント割込信号(SMI)よりも低
い監視通知割込信号(NMI)を発生[図5(B)参
照]してOSに知らせる(ST23)。かくして、CP
U10は、アプリケーションによるデータ処理[図5
(C)参照]をメモリエラー処理に切替える(ST2
4)。化けた2ビット以上のデータは自動的に修復され
ることはない。そして、メモリエラー処理後に動作を停
止(システムストップ)する。
【0008】なお、外部システムマネージメント割込信
号発生回路1で、外部システムマネージメント割込信号
(EXTSMI#)を利用してシステムマネージメント
割込信号(SMI)を発生させることによりシステムマ
ネージメント関連業務(例えば、省電力モードへの切替
え,復帰)を行う。
【0009】
【発明が解決しようとする課題】ところで、かかるデー
タ処理装置(例えば、パソコン,POS等)で遂行する
データ処理の中には、エラーデータの原因究明やその再
生をする必要性が乏しくかつ早期の再起動を可能にする
方が好ましいとするシステムが存在する一方において、
エラーデータの原因究明およびその再生が必要とされ、
さらに当該エラーの再発生防止が重要なものがある。
【0010】例えば、各種の店舗に配設された商品登録
および登録商品に関する会計処理を含む商品販売データ
処理(POS)システムでは、不特定多人数の顧客を対
象としていることから、エラー発生により一旦消失した
データを再現・再生することは非常に困難である。
【0011】このように、ECC制御回路を具備するデ
ータ処理システムにおいて、致命的なECCエラー障害
の発生する以前に使用者・システム管理者等が素早く対
応できる様に構築できれば、使用者側によるシステムの
信頼性を向上できる筈である。
【0012】本発明の目的は、発生したECCエラー内
容を正確に知ることができ、システムの信頼性を一段と
向上できるデータ処理システムを提供することにある。
【0013】
【課題を解決するための手段】請求項1の発明は、OS
制御権下でアプリケーションを起動してデータ処理可能
かつECCメモリに1ビットメモリエラーが発生したこ
とを検出した場合に当該エラーデータを自動的に修復可
能なECC制御回路を具備するデータ処理システムにお
いて、ECC制御回路がメモリエラー発生を検出した場
合にこれを根拠に周辺制御部から発生されたBIOS切
替信号を利用して制御権を前記OSからBIOSに切替
可能に形成するとともに、1ビットのメモリエラー発生
の場合でかつBIOSへの切替後に当該BIOSに付加
されたECCメモリエラー処理モジュールに当該1ビッ
トメモリエラーをログするログ処理を実行させかつログ
処理実行後に制御権を前記OSに戻し切替可能に形成
し、2ビット以上のメモリエラー発生の場合でかつBI
OSへの切替後に当該BIOSに付加されたECCメモ
リエラー処理モジュールに当該2ビット以上メモリエラ
ーをログするログ処理を実行させかつログ処理実行後に
制御権を前記OSに戻し切替可能に形成するとともに前
記OSで前記アプリケーションによるデータ処理の遂行
を中止しかつシステムエラー警告メッセージを発行して
動作停止可能に形成されたデータ処理システムである。
【0014】かかる発明では、ECC制御回路がメモリ
エラーが発生したことを検出した場合、周辺制御部は、
例えばECC制御回路から出力されたシステムエラー信
号を根拠にBIOS切替信号を発生する。かくして、発
生されたBIOS切替信号を利用して、制御権をOSか
らBIOSに切替える。
【0015】ここに、1ビットのメモリエラー発生の場
合は、BIOSへの切替後に当該BIOSに付加された
ECCメモリエラー処理モジュールが、当該1ビットメ
モリエラーをログする。つまり、1ビットメモリエラー
データを自動的に修復できるが後にエラー発生状況(発
生箇所,発生内容等)を把握可能とするためにログ処理
を実行するわけである。そして、このログ処理実行後に
制御権をOSに戻し切替えする。データ処理の遂行中止
かつシステムエラー警告メッセージ発行や動作停止は行
わない。
【0016】一方、2ビット以上のメモリエラーが発生
したことを検出した場合には、BIOSへの切替後に当
該BIOSに付加されたECCメモリエラー処理モジュ
ールが、当該2ビット以上のメモリエラーをログする。
当該エラーデータの自動修復はされない。
【0017】そして、このメモリエラーのログ処理実行
後に制御権をOSに戻し切替えして、アプリケーション
によるデータ処理の遂行を中止しかつシステムエラー警
告メッセージを発行してから、動作を停止(システムス
トップ)させる。
【0018】したがって、発生にしたがってログされた
ECCエラー内容を正確に知ることができるから、致命
的なECCエラー障害の発生する以前に使用者・システ
ム管理者等が素早く対応できかつ、システムの信頼性を
一段と向上できる。
【0019】また、請求項2の発明は、前記データ処理
が商品登録および登録商品に関する会計処理を含む商品
販売データ処理とされているデータ処理システムであ
る。
【0020】かかる発明では、OSはアプリケーション
(商品販売データ処理プログラム)に従い商品登録およ
び登録商品に関する会計処理を含む商品販売データ処理
を実行する。したがって、請求項1の発明の場合と同様
な作用効果を奏することができることに加え、さらに不
特定多人数の顧客を対象としているデータのエラー再発
生を未然に防止できるから、店舗等における安定した運
用を保障でき、信頼性を一段と高められる。
【0021】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して説明する。
【0022】本データ処理システムは、図1に示す如
く、基本的構成[10,20(P),3040,50
等]が従来例の場合(図4)の場合と同様とされている
が、さらにECC制御回路(21)がメモリエラー発生
を検出した場合にこれを根拠に周辺制御部25から発生
されたBIOS切替信号(SMI)を利用して制御権を
OS(10)からBIOS15に切替可能に形成し、自
動修復可能な1ビットメモリエラー発生の場合はBIO
Sに付加されたECCメモリエラー処理モジュール(1
5)に当該1ビットメモリエラーのログ処理を実行させ
かつログ処理実行後に制御権をOS(10)に戻し切替
可能であるとともに、自動修復不能な2ビット以上のメ
モリエラー発生の場合には該ECCメモリエラー処理モ
ジュール(15)に当該2ビット以上メモリエラーのロ
グ処理を実行させかつログ処理実行後に制御権をOS
(10)に戻し切替してアプリケーションによるデータ
処理の遂行を中止しかつシステムエラー警告メッセージ
を発行してから動作を停止させることができるように形
成されている。
【0023】なお、従来例の場合(図1)と共通する部
分については同一の符号を付し、それらの説明について
は簡略化または省略する。
【0024】すなわち、SMI発生回路(5,7→2
5)とBIOS15内に実装されたソフトECCメモリ
エラー処理モジュール(15)とを設け、1ビットエラ
ー検出でログを採り、2以上のビットエラーの場合には
ビットエラー検出でログを採りかつ動作停止(データ処
理の遂行中止およびシステムエラー警告メッセージ発行
を含む。)するように構築してある。
【0025】図1において、制御部20の一部を構成し
かつECC制御回路を含むCPU・メモリ・画像制御部
[例えば、ノースブリッジ(82443BX)]21
は、1ビットメモリエラーが発生したことを検出した場
合に、当該エラーデータを自動的に修復可能であるとと
もにシステムエラー信号(BX_SERR#)を出力
[図2(A)を参照]する。
【0026】このシステムエラー信号(BX_SERR
#)は、2ビットメモリエラーが発生したことを検出し
た場合[図2(A)を参照]にも発生される。
【0027】SMI発生回路の一部を構成するAND回
路(システムマネージメント割込信号発生回路)5は、
このシステムエラー信号(BX_SERR#)が入力さ
れた場合でかつ外部システムマネージメント割込信号発
生回路1から外部システムマネージメント割込信号(E
XTSMI#…External System Ma
nagement Interrupt)が発生されて
いる場合に、周辺制御部25へ外部システムマネージメ
ント割込信号(EXTSMI#)を出力する。
【0028】SMI発生回路の他の一部を構成するシス
テムエラー信号タイミング発生回路7は、BOIS(E
CCメモリエラー処理モジュール)15が2ビット以上
のエラーログ処理終了後に発生されるソフト制御可能な
IOピンを利用してシステムエラー信号(SERR#…
System Error)を出力[図2(C)〜
(E)を参照]する。
【0029】かくして、周辺制御部25は、SMI発生
回路としても働いて監視通知割込信号(NMI)を発生
[図2(F)参照]することによりOSに知らせ、制御
権[図2(F),(C)を参照]をBIOS15からC
PU10に切り替える。OSは、アプリケーションによ
るデータ処理をメモリエラー処理に切替える。その後に
動作を停止(システムストップ)する。
【0030】かかる実施形態では、電源On時(直後)
に、BIOS15は、システムエラー信号(BX_SE
RR#)をLevelモードに設定(図3のST10)
して、OS(この実施形態では、Windows N
T)を立上げる。OSは、メインメモリ(10)に常駐
される。
【0031】ECC制御回路(21)は、メモリエラー
発生を検出した場合(ST11)には、システムエラー
信号(BX_SERR#)をレベルローにする。周辺制
御部25は、ローであるシステムエラー信号(BX_S
ERR#)を根拠としてAND回路5から出力されたレ
ベルローの外部システムマネージメント割込信号(EX
TSMI)によって、BIOS切替信号であるシステム
マネージメント割込信号(SMI…System Ma
nagement Interrupt)を発生する
(ST12)。
【0032】かくして、発生されたBIOS切替信号
(SMI)を利用して、制御権をOSからBIOS15
のECCメモリエラー処理(ログ取り)ソフトモジュー
ルに強制的に移転させる(ST13)。
【0033】ここに、BIOS15のECCメモリエラ
ー処理モジュール(SMIソフトモジュール)は、EC
C制御回路(21)内部のECCメモリエラーステータ
スによって、1ビットエラーあるいは2ビット以上のエ
ラーを判別する。
【0034】すなわち、1ビットのメモリエラー発生の
場合は、BIOS15への切替後に当該BIOSに付加
されたECCメモリエラー処理モジュールが、当該1ビ
ットメモリエラーをカウントしつつログ処理(ST1
4)する。つまり、1ビットメモリエラーデータを自動
的に修復できるが、その後にエラー発生状況(発生箇
所,発生内容等)を把握可能とするためにログ処理を実
行するわけである。
【0035】このログ処理処理後に、適当な処理(例え
ば、アラームLEDの点灯等)してから、CPU制御権
をOSやアプリケーションに返す。戻し切替を行う[図
2(C)を参照]。
【0036】一方、2ビット以上のメモリエラー発生の
場合には、BIOS15への切替後に当該BIOSに付
加されたECCメモリエラー処理モジュールが、当該2
ビット以上のメモリエラーカウントしつつログ処理(S
T14)する。当該エラーデータは、自動的に修復され
ることはない。
【0037】そして、このログ処理処理後に、適当な処
理(例えば、アラームLEDの点灯等)をしてから、次
いで、周辺制御部25の入力ピンソフト制御可能なIO
ピンでシステムエラー信号SERR#→監視通知割込信
号NMI(Non MaskInterrupt)を発
生させてから、CPU制御権をOSに返す。
【0038】OSは、周辺制御部25から監視通知割込
信号(NMI…Non MaskInterrupt)
を受けると、アプリケーションによるデータ処理の遂行
を中止しかつシステムエラー警告メッセージを発行(画
面45に表示)してから動作停止させる(ST14)。
【0039】したがって、発生にしたがってログされた
ECCエラー内容を正確に知ることができるから、致命
的なECCエラー障害の発生する以前に使用者・システ
ム管理者等が素早く対応できかつ、システムの信頼性を
一段と向上できる。
【0040】また、商品販売データ処理装置(例えば、
電子キャッシュレジスタ等)のHDDに格納されかつメ
インメモリに常駐されたOSが、アプリケーション(商
品販売データ処理プログラム)に従い商品登録および登
録商品に関する会計処理を含む商品販売データ処理を実
行するので、不特定多人数の顧客を対象としているデー
タのエラー再発生を未然に防止できるから、店舗等にお
ける安定した運用を保障でき、信頼性を一段と高められ
る。
【0041】
【発明の効果】請求項1の発明によれば、ECC制御回
路がメモリエラー発生を検出した場合にこれを根拠に周
辺制御部から発生されたBIOS切替信号を利用して制
御権をOSからBIOSに切替可能、1ビットのメモリ
エラー発生の場合はBIOSに付加されたECCメモリ
エラー処理モジュールに当該1ビットメモリエラーのロ
グ処理を実行させかつログ処理実行後に制御権をOSに
戻し切替可能に形成し、2ビット以上のメモリエラー発
生の場合にはECCメモリエラー処理モジュールに当該
2ビット以上メモリエラーのログ処理を実行させかつロ
グ処理実行後に制御権をOSに戻し切替えてアプリケー
ションによるデータ処理の遂行を中止しかつシステムエ
ラー警告メッセージを発行してから動作を停止するよう
に形成されたデータ処理システムであるから、発生にし
たがってログされたECCエラー内容を正確に知ること
ができる。よって、致命的なECCエラー障害の発生す
る以前に使用者・システム管理者等が素早く対応できか
つ、システムの信頼性を一段と向上できる。
【0042】また、請求項2の発明によれば、データ処
理が商品登録および登録商品に関する会計処理を含む商
品販売データ処理とされているので、請求項1の発明の
場合と同様な効果を奏することができることに加え、さ
らに不特定多人数の顧客を対象としているデータのエラ
ー再生を未然に防止できるから、店舗等における安定し
た運用を保障でき、信頼性を一段と高められる。
【図面の簡単な説明】
【図1】本発明の実施形態を示すブロック図である。
【図2】同じく、動作を説明するためのタイムチャート
である。
【図3】同じく、動作を説明するためのフローチャート
である。
【図4】従来例を説明するためのブロック図である。
【図5】同じく、動作を説明するためのタイムチャート
である。
【図6】同じく、動作を説明するためのフローチャート
である。
【符号の説明】
1 外部システムマネージメント割込信号発生回路 5 AND回路 7 システムエラータイミング信号発生回路 10 CPU(OS) 15 BIOS(ECCメモリエラー処理モジュール) 20 制御部 21 CPU・メモリ・画像制御部(ECC制御回路) 25 周辺制御部 30 ECCメインメモリ(ECCメモリ) 40 画像処理カード 45 画面 50 PCIスロット SERR# システムエラー信号 SMI システムマネージメント割込信号(BIOS切
替信号) NMI 監視通知割込信号 EXTSMI# 外部システムマネージメント割込信号

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 OS制御権下でアプリケーションを起動
    してデータ処理可能かつECCメモリに1ビットメモリ
    エラーが発生したことを検出した場合に当該エラーデー
    タを自動的に修復可能なECC制御回路を具備するデー
    タ処理システムにおいて、 前記ECC制御回路がメモリエラー発生を検出した場合
    にこれを根拠に周辺制御部から発生されたBIOS切替
    信号を利用して制御権を前記OSからBIOSに切替可
    能に形成するとともに、 1ビットのメモリエラー発生の場合でかつBIOSへの
    切替後に当該BIOSに付加されたECCメモリエラー
    処理モジュールに当該1ビットメモリエラーをログする
    ログ処理を実行させかつログ処理実行後に制御権を前記
    OSに戻し切替可能に形成し、 2ビット以上のメモリエラー発生の場合でかつBIOS
    への切替後に当該BIOSに付加されたECCメモリエ
    ラー処理モジュールに当該2ビット以上メモリエラーを
    ログするログ処理を実行させかつログ処理実行後に制御
    権を前記OSに戻し切替可能に形成するとともに前記O
    Sで前記アプリケーションによるデータ処理の遂行を中
    止しかつシステムエラー警告メッセージを発行して動作
    停止可能に形成した、データ処理システム。
  2. 【請求項2】 前記データ処理が商品登録および登録商
    品に関する会計処理を含む商品販売データ処理である請
    求項1記載のデータ処理システム。
JP2000262132A 2000-08-31 2000-08-31 データ処理システム Pending JP2002073427A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000262132A JP2002073427A (ja) 2000-08-31 2000-08-31 データ処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000262132A JP2002073427A (ja) 2000-08-31 2000-08-31 データ処理システム

Publications (1)

Publication Number Publication Date
JP2002073427A true JP2002073427A (ja) 2002-03-12

Family

ID=18749854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000262132A Pending JP2002073427A (ja) 2000-08-31 2000-08-31 データ処理システム

Country Status (1)

Country Link
JP (1) JP2002073427A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093257A (ja) * 2007-10-04 2009-04-30 Sony Corp 電子機器およびログ出力方法
JP2012146167A (ja) * 2011-01-13 2012-08-02 Nec Corp メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009093257A (ja) * 2007-10-04 2009-04-30 Sony Corp 電子機器およびログ出力方法
US8463754B2 (en) 2007-10-04 2013-06-11 Sony Corporation Electronic equipment and log output method
JP2012146167A (ja) * 2011-01-13 2012-08-02 Nec Corp メモリエラーパターン記録システム、メモリモジュール、及びメモリエラーパターン記録方法

Similar Documents

Publication Publication Date Title
US20040034816A1 (en) Computer failure recovery and notification system
US7447934B2 (en) System and method for using hot plug configuration for PCI error recovery
US8843785B2 (en) Collecting debug data in a secure chip implementation
US11604711B2 (en) Error recovery method and apparatus
US20040172578A1 (en) Method and system of operating system recovery
US20120110378A1 (en) Firmware recovery system and method of baseboard management controller of computing device
TWI362588B (en) Monitor apparatus, a monitoring method thereof and computer apparatus therewith
US7672247B2 (en) Evaluating data processing system health using an I/O device
TWI685735B (zh) 在電腦系統開機自我檢測的早期階段顯示bios訊息的方法
CN112970002A (zh) 用于可配置错误处理的系统
US8819483B2 (en) Computing device with redundant, dissimilar operating systems
JP2002251300A (ja) 障害監視方法及び装置
US7430683B2 (en) Method and apparatus for enabling run-time recovery of a failed platform
WO2000051000A1 (fr) Systeme informatique et procede pour gerer les perturbations affectant un systeme informatique
US8392751B2 (en) System and method for recovery from uncorrectable bus errors in a teamed NIC configuration
US6463492B1 (en) Technique to automatically notify an operating system level application of a system management event
JP2002073427A (ja) データ処理システム
US20170344360A1 (en) Protecting firmware flashing from power operations
JP2004302731A (ja) 情報処理装置および障害診断方法
KR100687616B1 (ko) 프로세서의 장애 감지 복구 장치 및 그 방법
JP2002182951A (ja) 情報処理装置のメンテナンス方法および情報処理装置
JPH103403A (ja) 計算機システムおよびデバッグ方法
JP3055249B2 (ja) プロセッサのデバッグ方式
CN111045899A (zh) 在计算机系统开机自检的早期显示bios信息的方法
TWI226531B (en) Computer debugging device and method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060214