JP2013127820A - 制御装置 - Google Patents

制御装置 Download PDF

Info

Publication number
JP2013127820A
JP2013127820A JP2013062374A JP2013062374A JP2013127820A JP 2013127820 A JP2013127820 A JP 2013127820A JP 2013062374 A JP2013062374 A JP 2013062374A JP 2013062374 A JP2013062374 A JP 2013062374A JP 2013127820 A JP2013127820 A JP 2013127820A
Authority
JP
Japan
Prior art keywords
error
permanent failure
control device
data
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013062374A
Other languages
English (en)
Inventor
Nobuaki Yoshida
順陽 吉田
Kenji Shigihara
研二 鴫原
Takayuki Nitta
能之 新田
Yuichi Sato
優一 佐藤
Takashi Omagari
貴志 尾曲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2013062374A priority Critical patent/JP2013127820A/ja
Publication of JP2013127820A publication Critical patent/JP2013127820A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1417Boot up procedures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/38Response verification devices
    • G11C29/42Response verification devices using error correcting codes [ECC] or parity check
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/76Masking faults in memories by using spares or by reconfiguring using address translation or modifications
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C2029/0407Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals on power on
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C2029/0411Online error correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

【課題】ECCメモリの永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる制御装置を提供する。
【解決手段】制御装置は、ECCメモリ12の修正可能エラーを検出する修正可能エラー検出手段15と、ECCメモリ12のデータ読み出し時に誤り訂正があった場合に該当アドレスに正しいデータを記憶した後に再度同アドレスからデータを読み出しこの時に誤り訂正があった場合は該当するアドレスの永久故障として通知する永久故障判定手段16と、制御動作を行う動作処理手段14と、を備える。
【選択図】図5

Description

本発明は、誤りを自動的に訂正する機能を有したECC(Error Check and Correct)メモリを用いた制御装置に関する。
発電プラントなどの制御装置において、CPU(中央処理装置)が直接読み書きする制御データを格納するためのメインメモリ(主記憶装置)にECCメモリが利用されている。ECCメモリは、データをメモリに記憶する際に、本来のデータとは別に誤り訂正符号ECCを付加してメモリに記憶することにより、誤り訂正または誤り検出できるようにしたメモリである。
通常はデータnに対応する誤り訂正符号をmとすると、(n&m)が、あるハミング距離を持った符号語となるように一意的な誤り訂正符号生成式m=f(n)を求め、nの代わりに{n&f(n)}を、つまり符号語としてメモリに記憶することでECCメモリを実現する。
通常は誤りの数が増えるに従って、誤り訂正可能な状態から、誤り検出可能かつ誤り訂正不可能な状態となり、さらには誤修正したり誤り検出も不可能な状態となる。例えば、ハミング距離4の符号語に1bitの誤りを含む場合、誤りを含む前の値から1の距離移動したこととなり符号語ではなくなる。符号語ではなくなるため誤りを含むと判定することができ、また、その値から最も近い符号語は1つしか存在せず、その値が誤りを含む前の符号語と判断できるため、これを正しい値として用いることで修正したこととなる。
ハミング距離4の符号語に2bitの誤りを含む場合、同様に符号語ではなくなるため誤りを検出することはできるが、その値から最も近い符号語は1つとは限らないため修正は不可能となる。ハミング距離4の符号語に3bitの誤りを含む場合、同様に符号語ではなくなるため誤りを検出することはできるが、その値から最も近い符号語は誤りを含む前の符号語とは限らないため誤修正する可能性がある。ハミング距離4の符号語に4bitの誤りを含む場合、誤りを含んでいても符号語となってしまう可能性があるため、誤りを検出できない可能性がある。つまりハミング距離が4の符号語は1bit誤り修正可能、2bit誤り検出可能となる。これらのことからECCメモリの誤り訂正(検出)能力は生成される符号語のハミング距離に依存すると言える。
ECCメモリを用いた装置では、誤りの数が訂正可能な範囲にある場合、ECCメモリの誤り訂正機能により、データ読み出し時に訂正されたデータが読めるが、メモリに記憶されている誤りは通常は修正されることはなくそのままとなる。
そこで、メモリ制御回路に関し、読出データに誤りが検出されたときは、直ちに訂正したデータを書き込み、メモリの信頼性の向上を図ったものがある(例えば、特許文献1参照)。これは、メモリに記憶されている誤りがソフトエラー(一過性故障)である場合、再度データを記憶する(上書きする)ことで誤り修正することができるので、再度データを記憶することにより、正しいデータと正しいデータから新たに生成された誤り訂正符号が記憶され、結果的にデータを修正するものである。特許文献1のものを用いたり、制御装置の動作により自然に行われる単純なデータの更新等により、ECCメモリを用いた制御装置におけるソフトエラーによる誤りは増え続ける可能性は低い。
特開平6−52065号公報
しかし、一方で、永久故障による誤りは当然ながら修正されず累積するという問題がある。このような状態で運転を続けた結果、メモリに記憶された誤りの数がECCの修正能力を超えてしまい、予兆ないまま修正不可能となることがある。現状のECCメモリはこのような特質を持っている。
ここで、問題なのは修正不可能となるタイミングが予期できないことにある。もし修正不可能となるタイミングが予期することが可能となれば、適切なタイミングで制御装置を停止して保全することが可能となる。たとえば、制御装置の制御対象であるプラントなどの停止時などに制御装置を停止して保全すればよい。しかし、修正不可能となるタイミングが予期できなければ、プラント等を予定外の時期に突然停止せざるをえなくなってそのプラント等に大きな被害をもたらす可能性がある。
つまり、ECCメモリは単なる装置の延命手段となっているに過ぎない。修正不可能となるタイミングを予期することは不可能としても、データ読み出し時にECCメモリの修正機能が働き、メモリに記憶された誤りが存在したことを通知する機能がある制御装置に関しては、通知がある度に適切なタイミングで装置を停止して保全することは可能とも考えられる。
しかし、それがソフトエラーによるものであった場合は、前述した通りデータ更新等によりメモリに記憶された誤りはなくなってしまっていることがほとんどのため、その都度、制御装置を停止することは非常に効率が悪く、そのようなことは行われていないのが現実である。また、その通知がソフトエラーによるものなのか、永久故障によるものなのかの判断も難しい。
そこで、メモリに記憶された誤りが永久故障によるものであることを確実に検出する機能が非常に重要となる。永久故障の存在を知ることができれば、突然修正不可能な状態となりプラント等に大きな被害をもたらす前に、適切なタイミングで制御装置を停止して保全することが可能となるからである。
本発明の目的は、ECCメモリの永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる制御装置を提供することである。
本発明の制御装置の一つの態様は、ECCメモリの修正可能エラーを検出する修正可能エラー検出手段と、ECCメモリのデータ読み出し時に誤り訂正があった場合に該当アドレスに正しいデータを記憶した後に再度同アドレスからデータを読み出しこの時に誤り訂正があった場合は該当するアドレスの永久故障として通知する永久故障判定手段と、制御動作を行う動作処理手段と、を備えたことを特徴とする。
本発明の制御装置の他の一つの態様は、ECCメモリの修正可能エラーを検出する修正可能エラー検出手段と、ECCメモリのデータ読み出し時に誤り訂正があった場合に該当アドレスを記憶しておき再度同じアドレスで誤り訂正があった場合は該当するアドレスの永久故障として通知する永久故障判定手段と、制御動作を行う動作処理手段と、を備えたことを特徴とする。
本発明によれば、ECCメモリの永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
本発明の第1の実施の形態に係わる制御装置の構成図。 本発明の第1の実施の形態に係わる制御装置の処理内容を示す一例のフローチャート。 本発明の第1の実施の形態に係わる制御装置の処理内容を示す他の一例のフローチャート。 本発明の第1の実施の形態に係わる制御装置の処理内容を示す別の他の一例のフローチャート。 本発明の第2の実施の形態に係わる制御装置の構成図。 本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容の一例を示すフローチャート。 本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容の他の一例を示すフローチャート。 本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容のさらに他の一例を示すフローチャート。 本発明の第3の実施の形態に係わる制御装置の構成図。 本発明の第3の実施の形態に係わる制御装置の永久故障判定手段及び系切替手段の処理内容の一例を示すフローチャート。 本発明の第3の実施の形態に係わる制御装置の永久故障判定手段及び系切替手段の処理内容の他の一例を示すフローチャート。 本発明の第3の実施の形態に係わる制御装置の永久故障判定手段の処理内容のさらに他の一例を示すフローチャート。 本発明の第4の実施の形態に係わる制御装置の構成図。 本発明の第4の実施の形態に係わる制御装置のメモリ修正回数出力手段の処理内容の一例を示すフローチャート。 本発明の第5の実施の形態に係わる制御装置の構成図。 本発明の第5の実施の形態に係わる制御装置のログ手段の処理内容の一例を示すフローチャート。
図1は本発明の第1の実施の形態に係わる制御装置の構成図である。ここで、制御装置は、たとえば、発電プラントなどのプラントを制御する制御装置であり、制御データを格納するためにECCメモリ12が利用される。メモリ診断手段11は、制御装置のECCメモリ12を診断するものであり、制御装置の電源投入のときに電源投入ステータスをセットしてECCメモリ12を診断する。再起動手段13はメモリ診断手段11の診断結果に基づき制御装置に再起動を掛けるものである。また、動作処理手段14はECCメモリ12を使用して制御装置の制御動作を行うものである。
図2は、本発明の第1の実施の形態に係わる制御装置の処理内容を示す一例のフローチャートである。まず、制御装置の電源が投入されると(S1)、電源投入ステータスをセットし(S2)、システムを起動する(S3)。そして、メモリ診断手段11はECCメモリを診断し(S4)、修正不可能エラーを検出したか否かを判定する(S5)。修正不可能エラーを検出した場合はステップS3に戻り制御装置を再起動する。従って、修正不可能エラーが発生している場合には、ステップS3〜S5の処理が繰り返され結果として通常動作に進まない。適切な動作ができない状態で通常動作を進めるのは危険であるが、通常動作に進めないようにすることができる。
ステップS5の判定で、修正不可能エラーでない場合は修正可能エラーを検出したか否かを判定する(S6)。修正可能エラーを検出しないときは、電源投入ステータスをリセットし(S7)、動作処理手段14は通常動作を行う(S8)。一方、ステップS6の判定で、修正可能エラーを検出したときは、電源投入ステータス中か否かを判定し(S9)、電源投入ステータス中であるときはステップS3に戻り制御装置を再起動する。
このように、ECCメモリ12を用いた制御装置において、電源投入による起動時にメモリ診断を行い、データ読み出し時に誤り訂正があった場合は再起動を行う(S6、S9)。メモリ診断手段11でのメモリ診断は、永久故障を検出すべき全メモリエリアに対してデータを書き込み、その値を読み出すことにより行う。実際にはこれに加えて修正不可能な誤りを検出した場合も再起動する(S5)。誤りの修正が不可能であると言うことは適切な動作をすることも不可能である可能性があるためである。
再起動はソフトリセットによるものとなるため、電源等投入時に必ずセットされる電源投入ステータスを設け、システム起動時に、この電源投入ステータスをセットするようにする。この電源投入ステータスがセットされているときは、ソフトリセットによる起動でも電源投入による起動と判断することとする。
ソフトエラーによる誤り訂正があった場合、再起動後の誤りはなくなり、通常動作(S8)へと移行するが、永久故障による誤り訂正があった場合は、再起動後も誤り訂正して再度再起動するため、結果的に永久故障がある装置は通常動作(S8)へ移行できず、起動しなくなる。
この一例によれば、ECCメモリ12に永久故障が存在するとシステムが起動しなくなるため、ECCメモリ12の永久故障の存在を知ることができ、永久故障が累積して、予兆ないまま修正不可能となることを避けることができる。
なお、図2のフローで、修正不可能エラーを検出するステップ(S5)を省略することもできる。
図3は、本発明の第1の実施の形態に係わる制御装置の処理内容を示す他の一例のフローチャートである。この他の一例は、図2に示した一例に対し、電源投入ステータスリセット後に生じたソフトリセットによる再起動時もメモリ診断を行い、誤り訂正があった場合は再起動を行うようにしたものであり、電源投入ステータスリセット後に生じたソフトリセット時の誤り訂正による連続再起動回数を制限し、制限を越えた場合は、その旨の通知だけを行い通常動作(S8)に移るようにしたものである。図2と同一ステップには同一符号を付し重複する説明は省略する。
図3に示すように、ステップS6の判定で、修正可能エラーを検出しないときは、電源投入ステータスをリセットするとともに再起動回数をクリアし(S10)、動作処理手段14は通常動作を行う(S8)。一方、ステップS6の判定で、修正可能エラーを検出したときは、電源投入ステータス中かどうかを判定し(S11)、電源投入ステータス中であるときは、ステップS3に戻り制御装置を再起動する。ステップS11の判定で、電源投入ステータス中でないときは再起動回数が設定回数以下か否かを判定し(S13)、再起動回数が設定回数以下であるときは再起動回数をカウントアップし(S12)、ステップS3に戻り制御装置を再起動する。ステップS13の判定で再起動回数が設定回数以下でないときは永久故障通知を出力し(S14)、電源投入ステータスをリセットするとともに再起動回数をクリアし(S10)、動作処理手段14は通常動作を行う(S8)。
ここで、ステップS13における「設定回数」はたとえば1回であって、その場合は、初めての再起動のときに限って再起動回数のカウントアップ(S12)があり、2回目以降の再起動のときは永久故障通知(S14)がなされる。
このように、電源投入ステータスリセット後に生じたソフトリセットによる起動時もメモリ診断を行い、誤り訂正があった場合は再起動を行う。ただし電源投入ステータスリセット後に生じたソフトリセット時は誤り訂正による連続再起動回数を制限し、制限を越えた場合は、その旨の通知だけを行い通常動作に移る。
この一例によれば、電源投入後のシステム動作中にもシステムを止めることなく永久故障の存在を知ることができるため、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
図4は、本発明の第1の実施の形態に係わる制御装置の処理内容を示す別の他の一例のフローチャートである。この別の他の一例は、図3に示した他の一例に対し、再起動回数を制限するのは永久故障を検出した要素が多重化されていない場合のみとしたものである。図3と同一ステップには同一符号を付し重複する説明は省略する。
図4に示すように、ステップS6の判定で、修正可能エラーを検出しないときは、電源投入ステータスをリセットするとともに再起動回数をクリアし(S10)、動作処理手段14は通常動作を行う(S8)。一方、ステップS6の判定で、修正可能エラーを検出したときは、修正可能エラーを検出した要素が多重化されているかどうかを判定し(S15)、多重化されているときはステップS3に戻り制御装置を再起動する。このように、修正可能エラーを検出した要素が多重化されているときは、直接再起動を掛ける。この場合、永久故障が存在するこのECCメモリの系の起動が阻止される。それに応じて、永久故障が存在しないECCメモリの系に動作が移行し、それによって制御装置としては通常動作を行うことができる。
この一例によれば、多重化システムではECCメモリの永久故障が存在する系の起動を阻止することができるため、メモリの永久故障が存在する系を保全することができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。また、他系故障して1重で動作時は永久故障が存在しても、システムを止めることなく稼働率を上げることができる。
図5は本発明の第2の実施の形態に係わる制御装置の構成図である。動作処理手段14はECCメモリ12を使用して制御動作を行うものであり、修正可能エラー検出手段15はECCメモリ12の修正可能エラーを検出するものである。永久故障判定手段16は、ECCメモリ12のデータ読み出し時に、誤り訂正があった場合に該当アドレスに正しいデータを記憶した後に再度同アドレスからデータを読み出し、このときに誤り訂正があった場合は該当するアドレスの永久故障として通知するものである。
図6は本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容の一例を示すフローチャートである。修正可能エラー検出手段15により修正可能エラーが検出されると(S21)、該当アドレスに修正されたデータを記憶し(S22)、該当アドレスからデータを読み出す(S23)。このときに誤り訂正があったかどうか、つまり修正可能エラー検出があるかどうかを判定し(S24)、修正可能エラー検出があった場合は、該当するアドレスの永久故障として通知する(S25)。
このように、ECCメモリ12を用いた制御装置において、データ読み出し時に誤り訂正があった場合、該当アドレスに正しいデータを記憶した後、再度同アドレスからデータを読み出し、この時に誤り訂正があった場合は、該当するアドレスの永久故障として通知する。これにより、ECCメモリ12の永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
図7は本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容の他の一例を示すフローチャートである。修正可能エラー検出手段15により修正可能エラーが検出されると(S31)、当該アドレスのデータは修正されたことがあるかどうかを判定し(S32)、修正されたことがない場合には修正アドレスを記憶する(S33)。修正されたことがある場合には永久故障通知を行う(S34)。
このように、ECCメモリ12を用いた制御装置において、データ読み出し時に誤り訂正があった場合、該当アドレスを記憶しておき、再度同じアドレスで誤り訂正があった場合は、該当するアドレスの永久故障として通知する。これにより、ECCメモリ12の永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
この図7の処理では、修正可能エラー検出時のメモリへのアクセス動作が少ないため、ハードウェアで実現することが容易であり、ハードウェアで実現することによりソフトウェアに負荷をかけることなく実現できる。ただし、頻繁にデータの書き込みが行われないメモリエリアではエラー検出精度が劣る。
図8は、本発明の第2の実施の形態に係わる制御装置の永久故障判定手段の処理内容のさらに他の一例を示すフローチャートである。この例の場合は、修正可能エラー検出手段15により修正可能エラーが検出されると(S31)、図6の処理と同様に、該当アドレスに修正されたデータを記憶する(S22)。その後の処理は、図7におけるステップS32以下の処理と同様である。
この図8の処理によれば、ハードウェアで実現することが容易であり、ハードウェアで実現することによりソフトウェアに負荷をかけることなく実現できる。
図9は本発明の第3の実施の形態に係わる制御装置の構成図である。この第3の実施の形態は、図5に示した第2の実施の形態に対し、系切替手段17を追加して設けたものである。図5に示した第2の実施の形態と同一要素には同一符号を付し重複する説明は省略する。
系切替手段17は、永久故障判定手段16により永久故障を検出した要素が多重化されており、かつその要素が常用系である場合には待機系に系切替するものである。
図10は本発明の第3の実施の形態に係わる制御装置の永久故障判定手段16及び系切替手段17の処理内容の一例を示すフローチャートである。修正可能エラー検出手段15により修正可能エラーが検出されると(S21)、該当アドレスに修正されたデータを記憶し(S22)、該当アドレスからデータを読み出す(S22)。このときに誤り訂正があったかどうか、つまり修正可能エラー検出があるかどうかを判定し(S24)、修正可能エラー検出があった場合は、該当するアドレスの永久故障として通知する(S25)。そして、永久故障を検出した要素が多重化されており、かつその要素が常用系であるか否かを判定し(S26)、そうであるときは待機系に系切替を行う(S27)。
図11は本発明の第3の実施の形態に係わる制御装置の永久故障判定手段16及び系切替手段17の処理内容の他の一例を示すフローチャートである。修正可能エラー検出手段15により修正可能エラーが検出されると(S31)、当該アドレスのデータは修正されたことがあるかどうかを判定し(S32)、修正されたことがない場合には修正アドレスを記憶する(S33)。修正されたことがある場合には永久故障通知を行う(S34)。そして、永久故障を検出した要素が多重化されており、かつその要素が常用系であるか否かを判定し(S35)、そうであるときは待機系に系切替を行う(S36)。
このように、系切替手段17は、永久故障を検出した要素が多重化されていて、かつ常用系の場合は系切替する。これにより、ECCメモリ12の永久故障が存在する系を保全することができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。また、他系故障して1重で動作時は永久故障検出時は通知のみ行うため、システムを止めることなく稼働率を上げることができる。
この図11の処理では、図7の処理と同様に、修可能エラー検出時のメモリへのアクセス動作が比較的少ないため、ハードウェアで実現することが容易であり、ハードウェアで実現することによりソフトウェアに負荷をかけることなく実現できる。
図12は、本発明の第3の実施の形態に係わる制御装置の永久故障判定手段の処理内容のさらに他の一例を示すフローチャートである。この例では、修正可能エラー検出手段15により修正可能エラーが検出されると(S31)、図10の処理と同様に、該当アドレスに修正されたデータを記憶する(S22)。その後の処理は、図11におけるステップS32以下の処理と同様である。
この図12の処理によれば、ハードウェアで実現することが容易であり、ハードウェアで実現することによりソフトウェアに負荷をかけることなく実現できる。
図13は本発明の第4の実施の形態に係わる制御装置の構成図である。この第4の実施の形態は、図5に示した第2の実施の形態に対し、永久故障判定手段16に代えて、メモリ修正回数出力手段18を設けたものである。メモリ修正回数出力手段18は、ECCメモリ12のデータ読み出し時に誤り訂正があった場合に修正回数をカウントアップしカウント値を出力する。
図14は本発明の第4の実施の形態に係わる制御装置のメモリ修正回数出力手段18の処理内容の一例を示すフローチャートである。修正可能エラー検出手段15で修正可能エラーが検出されると(S41)、メモリ修正回数をカウンタでカウントアップする(S42)。そして、メモリ修正カウンタ通知を行う(S43)。このように、ECCメモリ12を用いた制御装置において、データ読み出し時に誤り訂正があった場合にカウンタでカウントアップし、カウンタ値を通知する。
ECCメモリ12で修正可能な永久故障が発生すると、当該箇所が読み出されるたびにカウンタがカウントアップするため、永久故障が発生した時点から、カウンタがカウントアップされる間隔は永久故障が発生する以前よりも短くなることが考えられるため、この機能により、ECCメモリ12の永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
図15は本発明の第5の実施の形態に係わる制御装置の構成図である。この第5の実施の形態は、図5に示した第2の実施の形態に対し、永久故障判定手段16に代えて、ログ手段19を設けたものである。ログ手段19は、ECCメモリ12のデータ読み出し時に誤り訂正があった場合に訂正した旨を時系列でログをする。図16は本発明の第5の実施の形態に係わる制御装置のログ手段19の処理内容の一例を示すフローチャートである。修正可能エラー検出手段15で修正可能エラーが検出されると(S51)、ログ手段19は修正可能エラーをログする(S52)。
これにより、ECCメモリ12を用いた制御装置において、データ読み出し時に誤り訂正があった場合、訂正した旨を時系列でログをする。永久故障が発生すると、該当箇所が読み出されるたびにログされるため、永久故障が発生した時点から、ログされる間隔は永久故障が発生する以前よりも短くなることが考えられる。したがって、このログを定期的に回収することにより、ECCメモリ12の永久故障の存在を知ることができ、永久故障が累積して予兆ないまま修正不可能となることを避けることができる。
11…メモリ診断手段、12…ECCメモリ、13…再起動手段、14…動作処理手段、15…修正可能エラー検出手段、16…永久故障判定手段、17…系切替手段、18…メモリ修正回数出力手段、19…ログ手段

Claims (4)

  1. ECCメモリの修正可能エラーを検出する修正可能エラー検出手段と、
    ECCメモリのデータ読み出し時に誤り訂正があった場合に該当アドレスに正しいデータを記憶した後に再度同アドレスからデータを読み出しこの時に誤り訂正があった場合は該当するアドレスの永久故障として通知する永久故障判定手段と、
    制御動作を行う動作処理手段と、
    を備えたことを特徴とする制御装置。
  2. ECCメモリの修正可能エラーを検出する修正可能エラー検出手段と、
    ECCメモリのデータ読み出し時に誤り訂正があった場合に該当アドレスを記憶しておき再度同じアドレスで誤り訂正があった場合は該当するアドレスの永久故障として通知する永久故障判定手段と、
    制御動作を行う動作処理手段と、
    を備えたことを特徴とする制御装置。
  3. 前記永久故障判定手段は、ECCメモリのデータ読み出し時に誤り訂正があった場合に、該当アドレスに正しいデータを記憶するとともに該当アドレスを記憶しておき再度同じアドレスで誤り訂正があった場合は該当するアドレスの永久故障として通知すること、を特徴とする請求項2に記載の制御装置。
  4. 前記永久故障判定手段により永久故障を検出した要素が多重化されており、かつ常用系である場合には、待機系に系切替する系切替手段を備えたことを特徴とする請求項1ないし請求項3のいずれか一項に記載の制御装置。
JP2013062374A 2007-12-14 2013-03-25 制御装置 Pending JP2013127820A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013062374A JP2013127820A (ja) 2007-12-14 2013-03-25 制御装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007322839 2007-12-14
JP2007322839 2007-12-14
JP2013062374A JP2013127820A (ja) 2007-12-14 2013-03-25 制御装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009546135A Division JP5269810B2 (ja) 2007-12-14 2008-12-10 制御装置

Publications (1)

Publication Number Publication Date
JP2013127820A true JP2013127820A (ja) 2013-06-27

Family

ID=40795268

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009546135A Active JP5269810B2 (ja) 2007-12-14 2008-12-10 制御装置
JP2013062374A Pending JP2013127820A (ja) 2007-12-14 2013-03-25 制御装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009546135A Active JP5269810B2 (ja) 2007-12-14 2008-12-10 制御装置

Country Status (3)

Country Link
US (1) US8145951B2 (ja)
JP (2) JP5269810B2 (ja)
WO (1) WO2009078145A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5872982B2 (ja) * 2012-08-10 2016-03-01 日立オートモティブシステムズ株式会社 車両用制御装置
JP6044316B2 (ja) * 2012-12-12 2016-12-14 株式会社デンソー 車載電子制御装置
US10191802B2 (en) * 2015-09-04 2019-01-29 Oracle International Corporation Extract-transform-load diagnostics

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176599A (en) * 1981-04-21 1982-10-29 Nec Corp Error report circuit
JPS61125651A (ja) * 1984-11-21 1986-06-13 Fujitsu Ltd エラ−報告処理方式
JPS62120557A (ja) * 1985-11-21 1987-06-01 Nec Corp 記憶システム
JPS6448153A (en) * 1987-08-19 1989-02-22 Yokogawa Electric Corp Memory controller
JPS6465650A (en) * 1987-09-04 1989-03-10 Hitachi Ltd Error detecting device for storage device
JPH0325798A (ja) * 1989-06-23 1991-02-04 Ricoh Co Ltd Eepromを使用した記憶装置
JPH04115338A (ja) * 1990-09-06 1992-04-16 Fujitsu Ltd 交替メモリ方式
JPH0571950U (ja) * 1992-02-27 1993-09-28 横河電機株式会社 定周期メモリ検査装置
JPH08314811A (ja) * 1995-05-22 1996-11-29 Mitsubishi Electric Corp メモリインタフェース装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823397A (ja) * 1981-07-31 1983-02-12 Nec Corp 記憶装置
US5077737A (en) * 1989-08-18 1991-12-31 Micron Technology, Inc. Method and apparatus for storing digital data in off-specification dynamic random access memory devices
JPH0652065A (ja) 1992-08-03 1994-02-25 Fujitsu Ltd メモリ制御回路
JPH06175934A (ja) * 1992-12-01 1994-06-24 Oki Electric Ind Co Ltd 1ビットエラー処理方式
JPH06175394A (ja) * 1992-12-09 1994-06-24 Konica Corp カラートナー
JPH10133899A (ja) 1996-10-31 1998-05-22 Fanuc Ltd 訂正不可能なエラーの予測方法および予測装置
US6038680A (en) * 1996-12-11 2000-03-14 Compaq Computer Corporation Failover memory for a computer system
JP2000132462A (ja) * 1998-10-27 2000-05-12 Hitachi Ltd プログラム自己修復方式
JP4950886B2 (ja) * 2005-07-15 2012-06-13 パナソニック株式会社 不揮発性記憶装置、メモリコントローラ及び不良領域検出方法
US8032816B2 (en) * 2007-06-01 2011-10-04 International Business Machines Corporation Apparatus and method for distinguishing temporary and permanent errors in memory modules
US7971124B2 (en) * 2007-06-01 2011-06-28 International Business Machines Corporation Apparatus and method for distinguishing single bit errors in memory modules
WO2010083109A1 (en) * 2009-01-14 2010-07-22 Marvell World Trade Ltd. Method and apparatus for determining a location of a defect on a storage medium

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57176599A (en) * 1981-04-21 1982-10-29 Nec Corp Error report circuit
JPS61125651A (ja) * 1984-11-21 1986-06-13 Fujitsu Ltd エラ−報告処理方式
JPS62120557A (ja) * 1985-11-21 1987-06-01 Nec Corp 記憶システム
JPS6448153A (en) * 1987-08-19 1989-02-22 Yokogawa Electric Corp Memory controller
JPS6465650A (en) * 1987-09-04 1989-03-10 Hitachi Ltd Error detecting device for storage device
JPH0325798A (ja) * 1989-06-23 1991-02-04 Ricoh Co Ltd Eepromを使用した記憶装置
JPH04115338A (ja) * 1990-09-06 1992-04-16 Fujitsu Ltd 交替メモリ方式
JPH0571950U (ja) * 1992-02-27 1993-09-28 横河電機株式会社 定周期メモリ検査装置
JPH08314811A (ja) * 1995-05-22 1996-11-29 Mitsubishi Electric Corp メモリインタフェース装置

Also Published As

Publication number Publication date
US8145951B2 (en) 2012-03-27
WO2009078145A1 (ja) 2009-06-25
US20100251019A1 (en) 2010-09-30
JP5269810B2 (ja) 2013-08-21
JPWO2009078145A1 (ja) 2011-04-28

Similar Documents

Publication Publication Date Title
US8667372B2 (en) Memory controller and method of controlling memory
US20040168101A1 (en) Redundant memory system and memory controller used therefor
US20120137168A1 (en) Method for protecting data in damaged memory cells by dynamically switching memory mode
US9990245B2 (en) Electronic device having fault monitoring for a memory and associated methods
EP2715541B1 (en) Mram field disturb detection and recovery
JP5269810B2 (ja) 制御装置
JP4917604B2 (ja) 記憶装置構成およびその駆動方法
US20220336037A1 (en) Dynamic error monitor and repair
JP2010049780A (ja) Ecc回路、半導体記憶装置、メモリシステム
JP4877396B2 (ja) メモリ障害処理システム、および、メモリ障害処理方法
JP5813450B2 (ja) 電子制御装置
US20100268988A1 (en) Secure flash memory using error correcting code circuitry
CN102479119A (zh) 动态切换存储器模式以保护受损记忆胞数据的方法
JP2008027284A (ja) 障害処理システム、障害処理方法、障害処理装置およびプログラム
JP3985017B2 (ja) ディジタル保護リレーの制御装置
KR20210110201A (ko) 동적 에러 모니터 및 복구
JP5770557B2 (ja) 情報更生装置、メモリ制御システム、情報更生方法およびコンピュータプログラム
JP7283784B2 (ja) メモリ障害検出装置、検出プログラム、および検出方法
JP2009169681A (ja) 制御装置
JP2007025777A (ja) データ誤り検出・訂正方法及びデータ誤り検出・訂正機能付きメモリ装置
JP2005234855A (ja) 情報処理装置
KR20240067763A (ko) Ecc정보를 이용한 메모리상태 모니터링 장치 및 그 방법
JPH0365743A (ja) 主記憶装置の故障発見方法
JPS6356751A (ja) メモリパトロ−ル制御方式
JP2008015893A (ja) 障害自動復旧装置および障害自動復旧方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140106

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20140110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140520