JP4723265B2 - エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置 - Google Patents

エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置 Download PDF

Info

Publication number
JP4723265B2
JP4723265B2 JP2005076403A JP2005076403A JP4723265B2 JP 4723265 B2 JP4723265 B2 JP 4723265B2 JP 2005076403 A JP2005076403 A JP 2005076403A JP 2005076403 A JP2005076403 A JP 2005076403A JP 4723265 B2 JP4723265 B2 JP 4723265B2
Authority
JP
Japan
Prior art keywords
data
data processing
partial
error detection
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005076403A
Other languages
English (en)
Other versions
JP2006260139A (ja
Inventor
育史 本田
賢司 鈴木
孝 小口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005076403A priority Critical patent/JP4723265B2/ja
Priority to EP05253847.7A priority patent/EP1703396B1/en
Priority to KR1020050058650A priority patent/KR100717572B1/ko
Priority to CNB2005100840255A priority patent/CN100394390C/zh
Priority to US11/237,765 priority patent/US7543220B2/en
Publication of JP2006260139A publication Critical patent/JP2006260139A/ja
Application granted granted Critical
Publication of JP4723265B2 publication Critical patent/JP4723265B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • G06F11/1044Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Detection And Correction Of Errors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

本発明は、エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置に関し、特に、データ転送やデータ蓄積における誤り訂正符号(ECC)を用いたデータエラーの検出および訂正等に適用して有効な技術に関する。
たとえば、情報処理システムでは、ECCを用いることで、情報転送路であるバスや、情報を記憶するメモリにおけるデータエラーの検出および訂正を行うことが知られている。
ECCにおけるエラーチェック単位を一つのECC処理装置にて処理させる場合には、エラーチェック単位のデータサイズに合わせてECC処理装置のピン数を増やすか、データそのものを折りたたんで転送する必要がある。
しかし、データサイズに合わせてECC処理装置のピン数を増やすことは、ECC処理装置の製造コストの増大を招く。またデータの折りたたみ転送は、ピンあるいはデータ伝送路の1ビット故障が複数ビットエラーとなり、エラー修復ができなくなるという信頼性上の問題を生じる。
このため、エラーチェック単位を複数のECC処理装置に分担させることが考えられる。その場合、エラーチェック単位を分担して処理する個々のECC処理装置で部分的なエラーチェックを行い、より上位の処理装置(上位のコントローラやCPU)によってエラーチェック単位の最終的なエラーチェック及び訂正を行う方式を採用することが考えられる。あるいは、特許文献1または特許文献2のようにエラーチェック単位を分担する複数のECC処理装置の間で部分シンドロームの交換を行いエラーチェック単位の真のシンドロームを生成する方法が知られている。
すなわち、特許文献1の技術では、外部から入力される符号語の一部から部分シンドロームを生成して外部に出力する手段と、外部から入力される部分シンドロームと内部で生成された部分シンドロームから符号語のシンドロームを生成する手段と、生成されたシンドロームをデコードして符号語の一部の誤り訂正を行う手段とを備えた誤り検出・訂正回路が開示されている。
また、特許文献2には、多ビットデータを複数に分割して得られる複数のブロック毎にECCを生成する場合において、複数ブロックの各々を分担するECC回路を、外部制御信号のみによって、上位ビットブロックと下位ビットブロックのいずれにも対応可能とすることで、全く同一構成の複数のECC回路にて多ビットデータの分担処理を可能にしようとする技術が開示されている。
しかし、上位の処理装置にデータ処理を行わせる場合には、エラーチェック単位を分担する個々のECC処理装置において高度なデータ処理(たとえばデータの部分マージ処理等のようなエラーチェック後にしか行えないようなデータ処理)が扱えなくなる。同様に、単純な部分シンドローム交換だけでは、上述のような高度なデータ処理が行えないという問題があった。
特開平4−023048号公報 特開平11−232129号公報
本発明の目的は、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、個々の処理装置において、データのマージ処理を必要とするような高度なデータ処理を可能にすることにある。
本発明の他の目的は、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、個々の処理装置において、検出されたエラーの種別等に応じた多様なエラー検出訂正処理を可能にすることにある。
本発明の他の目的は、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、ECCのエラーチェック単位のデータを一つのデータ処理装置で処理する場合と同等のエラー検出訂正能力を実現することにある。
本発明の第1の観点は、データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含み、前記情報交換路を介して個々の前記データ処理装置が分担する前記データの一部に関する部分シンドロームを交換することで真のシンドロームを生成するエラー検出訂正装置の制御方法であって、
個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換するエラー検出訂正装置の制御方法を提供する。
本発明の第2の観点は、データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含み、前記情報交換路を介して個々の前記データ処理装置が分担する前記データの一部に関する部分シンドロームを交換することで真のシンドロームを生成するエラー検出訂正装置であって、
個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換する情報交換手段を備えたエラー検出訂正装置を提供する。
本発明の第3の観点は、記憶装置と、前記記憶装置にアクセスするアクセス装置と、前記記憶装置と前記アクセス装置とを接続するデータ転送路と、前記データ転送路に介在するエラー検出訂正装置と、を含む情報処理システムであって、
前記エラー検出訂正装置は、
データ転送路におけるエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、
複数の前記データ処理装置の間に設けられた情報交換路と、
個々の前記データ処理装置が分担する前記データの一部に関する部分シンドローム、および個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して複数の前記データ処理装置の間で交換する情報交換手段と、
を備えた情報処理システムを提供する。
本発明の第4の観点は、データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含むエラー検出訂正装置の制御プログラムであって、
個々の前記データ処理装置が分担する前記データの一部に関する部分シンドローム、および個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換する工程を個々の前記データ処理装置に実行させるエラー検出訂正装置の制御プログラムを提供する。
本発明の第5の観点は、データ通信路に介在するエラー検出訂正装置に含まれ、エラー訂正符号単位のデータの送受信を分担するデータ処理装置であって、
自装置が分担する前記データの一部に関する部分シンドローム、および自装置が分担した前記データの一部に関する書き換え情報を、他のデータ処理装置との間で交換する情報交換手段を備えたデータ処理装置を提供する。
上記した本発明によれば、エラーチェック単位を分担して処理する複数のデータ処理装置を含むエラー検出訂正装置において、複数のデータ処理装置の間で部分シンドロームに限定されないエラー訂正情報を交換することで、個々のデータ処理装置における部分データマージ処理等の高度なデータ処理が可能となる。
たとえば、メモリコントローラ等のECC保護されたデータを扱うデータ処理装置において、ECCのエラーチェック単位のデータが複数のデータ処理装置にまたがって処理される場合でも、メモリアクセスにおけるリードモディファイライト(部分データマージ)等の高度なデータ処理が可能になる。
また、複数のデータ処理装置間で部分シンドローム以外のエラー訂正情報を交換することで、検出されたエラーの種別に応じた多様なエラー検出訂正処理を行うことができる。また、単一のデータ処理装置でエラーチェック単位を取り扱う場合と同等なエラー検出・訂正能力を実現することができる。
また、本発明の第6の観点は、データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、前記複数のデータ処理装置の間に設けられた情報交換路とを有するエラー検出訂正装置の制御方法において、
前記データ処理装置で、
自身が分担する部分データに関する部分シンドロームを生成し、
生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するエラー検出訂正装置の制御方法を提供する。
本発明の第7の観点は、エラーの検出及び訂正を行うエラー検出訂正装置において、
データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、
前記複数のデータ処理装置の間に設けられた情報交換路とを有し、
前記データ処理装置のそれぞれは、
自身が分担する部分データに関する部分シンドロームを生成し、
生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えたエラー検出訂正装置を提供する。
本発明の第8の観点は、記憶装置と、前記記憶装置にアクセスするアクセス装置と、前記記憶装置と前記アクセス装置とを接続するデータ転送路と、前記データ転送路に介在するエラー検出訂正装置と、を含む情報処理システムであって、
前記エラー検出訂正装置は、
データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、
前記複数のデータ処理装置の間に設けられた情報交換路とを有し、
前記データ処理装置のそれぞれは、
自身が分担する部分データに関する部分シンドロームを生成し、
生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えた情報処理システムを提供する。
本発明の第9の観点は、データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、前記複数のデータ処理装置の間に設けられた情報交換路とを有するエラー検出訂正装置の制御プログラムであって、
前記データ処理装置に、
自身が分担する部分データに関する部分シンドロームを生成する機能と、
生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換する機能と、
自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成する機能と、
生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行う機能と、
行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換する機能とを実現させるエラー検出訂正装置の制御プログラムを提供する。
本発明の第10の観点は、データ通信路に介在するエラー検出訂正装置に含まれ、エラー訂正符号単位の部分データの送受信を分担するデータ処理装置であって、
自身が分担する部分データに関する部分シンドロームを生成し、
生成した部分シンドロームを、情報交換路を介して他のデータ処理装置と交換し、
自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えたデータ処理装置を提供する。
本発明によれば、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、個々の処理装置において、データのマージ処理を必要とするような高度なデータ処理を行うことができる。
また、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、個々の処理装置において、検出されたエラーの種別に応じた多様なエラー検出訂正処理を行うことができる。
また、ECCのエラーチェック単位のデータを複数の処理装置にて分担して処理するエラー検出訂正技術において、ECCのエラーチェック単位のデータを一つのデータ処理装置で処理する場合と同等のエラー検出訂正能力を実現することができる。
以下、図面を参照しながら、本発明の実施の形態について詳細に説明する。
図1は、本発明の一実施の形態であるエラー検出訂正装置の作用の一例を示す概念図であり、図2は、本発明の一実施の形態であるエラー検出訂正装置の作用の変形例を示す概念図である。
図3は、本発明の一実施の形態であるエラー検出訂正装置の一例であるメモリアクセス制御装置を構成するデータ処理装置の構成の一例を示すブロック図である。図4は、本発明の一実施の形態である情報処理システムの構成の一例を示す概念図である。
まず、図4を参照して、本実施の形態の情報処理システムの構成について説明する。本実施の形態の情報処理システムは、複数の情報処理装置10と、バススイッチ20(GDX)と、一つまたは複数の入出力機器30(FLI)を含んでいる。
バススイッチ20は、これらの情報処理装置10および入出力機器30の間における情報転送経路の接続の切替を行う。
個々の情報処理装置10は、CPU11、システムバス11a、入出力制御装置12(FLN)、メモリ装置13(DIMM)、メモリアクセス制御装置14(エラー検出訂正装置)、上位側バス15、メモリバス16、下位側バス17を含んでいる。
CPU11は、メモリ装置13に格納されたプログラムやデータにアクセスすることで情報処理を行う。
入出力制御装置12は、CPU11と、メモリ装置13、他の情報処理装置10および入出力機器30等との間における情報の授受を制御する。
メモリ装置13には、CPU11が実行するプログラムやデータが格納される。本実施の形態の場合、メモリアクセス制御装置14はエラー検出訂正装置として機能する。すなわち、メモリアクセス制御装置14は、メモリバス16、上位側バス15、下位側バス17を介してメモリ装置13に対してリード/ライトされるデータのECCを用いたエラー検出訂正を行う。
すなわち、上位側バス15、メモリバス16、下位側バス17を転送されるデータは、後述のようにECCによって保護されている。
このメモリアクセス制御装置14は、各々が、図3に例示されるような構成を備えた複数のデータ処理装置40で構成されている。
すなわち、個々のデータ処理装置40は、メモリアクセス制御論理41、ライトバッファ42、リードバッファ43、情報交換バッファ44を含んでいる。これらの複数のデータ処理装置40は、情報交換バス50(情報交換路)を介して相互に接続されている。
ライトバッファ42には、CPU11、他の情報処理装置10、入出力機器30等からメモリ装置13に書き込まれるライトデータが一時的に格納される。
リードバッファ43には、メモリ装置13から読み出されたリードデータが格納される。
メモリアクセス制御論理41は、以下のような機能を実現するための制御論理(制御プログラム)を、ソフトウェア、ファームウェア、あるいはハードウェアとして備えている。
すなわち、メモリアクセス制御論理41は、情報交換バス50を介して他のデータ処理装置40と各種の情報を交換することで、上位側バス15や下位側バス17のデータ幅のリード/ライトデータECC処理を、他のデータ処理装置40と分担して処理する機能を備えている。
メモリアクセス制御論理41は、自装置内の書き換え情報を、情報交換バス50を使用して他のデータ処理装置40と送りあうことにより、上位側バス15、メモリバス16、下位側バス17におけるECCのエラーチェック単位のデータに対する部分書き換え時にもチェックビットの変換とエラーチェック/訂正を可能とする機能を備えている。
メモリアクセス制御論理41は、ECCのエラーチェック単位のデータに対する部分書き換え情報のパターンに応じて情報交換バス50を使用するケースと使用しないケースで動作を選択する機能を備えている。
メモリアクセス制御論理41は、エラー訂正時における部分書き換え情報ではなく、部分書き換え後のデータに対して、他のデータ処理装置40が分担するデータを全て0とみなしたチェックビットを付け替え(更新)を行い、情報交換バス50を使用してのデータ処理装置40と交換する機能を備えている。
メモリアクセス制御論理41は、情報交換バス50を使用して、自装置で検出された特定のエラーパターンの検出情報を他のデータ処理装置40と交換し、エラー訂正動作を変更する機能を備えている。
メモリアクセス制御論理41は、部分シンドロームに同期確認信号を付加するとともに、情報交換バス50自体にECC保護を付加して、当該情報交換バス50を使用して他のデータ処理装置40と交換し、部分シンドロームの使用タイミングに誤りがないかを自装置および他のデータ処理装置40において検出することにより、誤った部分シンドロームの使用による誤訂正を防止する機能を備えている。
メモリアクセス制御論理41は、情報交換バス50を使用して他のデータ処理装置40と交換される部分シンドロームのデータ長を可変に制御する機能を備えている。
メモリアクセス制御論理41は、情報交換バス50を使用した部分シンドロームの交換によって訂正したデータを、入出力制御装置12等に送出するだけでなく、訂正動作を行わずデータのみを先に送出して、検出したエラー通知を後追いで通知する機能を備えている。
メモリアクセス制御装置14を構成するデータ処理装置40についてさらに具体的に例示する。まず、複数のデータ処理装置40(LDX)の間における情報交換バス50を用いた部分シンドロームの交換について説明する。
たとえば、CPU11における128バイトのキャッシュラインの転送レイテンシーを最小とするため、128バイトデータを4つのLDX/DIMMに分割し、FLN−LDX間/FLN−GDX間の上位側バス15/下位側バス17を最大限利用する。このため、16バイトECCが2つのLDXに跨るので、基本的にはエラーチェックを行わず、S4EC−D4ED(Single 4bit block Error Correction - Double 4bit block Error Detection)コードのままLDXから他のFLN、FLI等のデバイスへデータを転送する。
図5に32SMP基本構成でメモリECC(16バイトのS4EC−D4ED)で保護対象となるバスを示す。
ECCの生成及びチェック&コレクトは基本的にFLN(入出力制御装置12)/FLI(入出力機器30)で行うが、エラー個所の特定と、DIMM(メモリ装置13)のパトロール(後述)及びリードモディファイライト等のパーシャルライト時のデータ移動をLDX内で完結させる目的で、LDXでもチェック&コレクトを行う。このため、隣り合うLDX間にシンドローム交換のためのバスとして情報交換バス50を設ける。後述のように、この情報交換バス50は、たとえば、データ転送方向が互いに逆な、二つのBus#0およびBus#1の2つのバスからなる。
メモリアクセス制御装置14を構成する個々のデータ処理装置40(LDX)におけるメモリアクセス制御論理41によるエラー制御について説明する。
複数のLDXで構成されるメモリアクセス制御装置14は、メモリ装置13へのアクセスにおいて、メモリリード、メモリライト、パーシャルライト(リードモディファイライト)、パトロール(定期的な動作監視処理)の各動作を行う。
上述の各動作時におけるLDXのエラー制御を以下に示す。概要は以下の通りである。
(1)エラー個所特定のため、LDXでもECCチェックを行う。このため、ECCチェック単位を跨るLDX同士でシンドローム交換を行う。
(2)リード時はメモリレイテンシ重視のためECCチェックはディレイドチェックとする。すなわち、メモリ装置13から読み出されたデータを、FLN/FLIに送出した後にECCチェックを実行し、エラーが検出された場合に、FLN/FLIに対して後からエラー報告を行う。
部分シンドローム交換を伴うECCチェックでは、シンドロームの交換は、情報交換バス50を用いて行う。この情報交換バス50は、縮退運転時のデータ転送バスとしても用いられる。情報交換バス50における転送プロトコルについては後述する。
図6に示されるように、ECCエラーチェック単位のデータ幅(たとえば16バイト)を分担する複数のデータ処理装置40(LDX#0/#1)では、自装置で検出された部分シンドロームを情報交換バス50を介して相手側に送信する。すなわち、相手側のLDXが分担する8バイトのデータは全て“0”としてシンドロームを生成して相手側に送る。データにエラーがない場合は、LDX同士で送り合うシンドロームの値は同じである。
LDX内のECCチェックにおいて、エラーを検出した場合、LDXのメモリアクセス制御論理41はリプライバス15bを通じて上位のFLNに対してエラーの報告を行う。
このエラー報告は、4つのメモリ動作(メモリリード、メモリライト、パーシャルライト、パトロール)の各々毎に3タイプ(SBE:シングルブロックエラー(訂正可能)、DBE:ダブルブロックエラー(訂正不能)、不正データ(PoisonedData)検出)のエラーに分けて表す。
通常、エラーの報告はECCチェック単位を跨るLDXの組(図5の例では、LDX#0/#1またはLDX#2/#3)からは同じ内容が報告される。ただし、縮退運転時のメモリライト時など、片側LDXのみからの報告もあり得る。
エラーの報告は、ECCチェック単位を跨るLDXの組、またはLDX単独で行われるため、全LDXの同期動作を妨げないサイクルで処理する。すなわち、同じくリプライバス15bを使用するメモリライトコンプリート通知が常に優先される。後述するスクラブライト(ScrubWrite)要求においても同様である。ScrubWrite時のECCチェックのエラー報告は行わない。
図7Aは、本実施の形態における情報交換バス50の構成の一例を示す概念図である。情報交換バス50は、Bus#0およびBus#1からなる。Bus#0およびBus#1の各々は、図7Bに例示されるビット幅(ピン数)の各信号で構成されている。
このように、情報交換バス50を構成するBus#0およびBus#1のいずれにおいても、転送データは21ビットデータECC(SEC−DED)で保護される。
そして、本実施の形態では、この情報交換バス50を用いて、(1)DIMMのリード、パトロールおよびライト、パーシャルライト時の16バイトのECCチェックのシンドローム交換、および書き換え情報の交換、(2)LDX#0と#1、およびLDX#2と#3の同期チェック、(3)縮退運転時のデータ転送、が行われる。
図8は、情報交換バス50を介してLDXの間で授受される情報パケットの識別情報の設定例を示す説明図である。図9、図10、図11、図12は、各種パケットのフォーマット例を示す概念図である。
図9は、シンドローム交換のためのシンドローム交換パケット51の構成例を示している。シンドローム交換パケット51は、ID部51a、予約部51b、エラー種別情報51c、およびシンドローム値51dからなる。ID部51aには、図8の「シンドローム交換」に対応した“100”が設定される。エラー種別情報51cには、不正データであったか否かの情報ビットがセットされる。
なお、このエラー種別情報51cがセットされた場合、シンドローム値51dには、シンドローム値の代わりに、エラー種別を示す情報を格納して、対応するLDXの間で相互に送りあい、個々のLDXにおけるエラー訂正動作を切り替えることもできる。
図10は、書き換え情報交換のための書き換え情報交換パケット52の構成例を示している。書き換え情報交換パケット52は、ID部52a、予約部52b、動作変更フラグ52cおよび書き換え情報52dからなる。
ID部52aには、図8の「書き換え情報交換」に対応した“101”が設定される。書き換え情報52dには、当該書き換え情報交換パケット52の送信元のLDXで得られた、エラー訂正後のデータが格納される。動作変更フラグ52cには、特定エラーパターンを検出したことをLDX同士が通知しあって、当該特定エラーパターンを検出した場合の動作を変更するために用いる。
図11は、同期チェック用の同期チェックパケット53の構成例を示している。同期チェックパケット53は、ID部53aおよび同期識別情報53bからなる。
ID部53aには、図8の「同期チェック」に対応した“001”が設定される。同期識別情報53bには、LDX間の同期制御用のSync−IDが設定される。
同期チェックは、全てのLDXの同期をチェックするものではなく、ECCデータ単位を相互に分担するLDX#0と#1、およびLDX#2と#3の対の間での同期を制御する。
図12は、縮退運転時データパケット54の構成例を示している。縮退運転時データパケット54は、ID部54a、転送データ54bからなる。ID部54aには、図8における「縮退運転データ転送」に対応する“111”が設定される。転送データ54bには、縮退運転時の転送データが格納される。
図13は、個々のLDXにおけるエラーチェック制御の一覧を示す説明図である。リード(read)、ライト(write)、パーシャルライト(P−write)、パトロール(Patrol)の各動作におけるエラーチェック動作が示されている。
以下、図1、図2、および図14、図15、図16、図17を参照して、本実施の形態の情報処理装置10、メモリアクセス制御装置14、および情報処理システムの作用の一例について説明する。
図14は、通常稼働時におけるメモリ装置13(DIMM)からのリード動作を示している。個々のLDXにおいて、メモリアクセス制御論理41は、メモリ装置13から読み出したデータを入出力制御装置12に転送するとともに、情報交換バス50を介して部分シンドローム値を交換することで、読み出したデータに対して分担してECCチェックを実行する。この時、入出力制御装置12へのデータ転送を優先し、読み出したデータにエラーが検出された場合には、後から入出力制御装置12に対してリプライバス15bを使用してエラー報告を行う。メモリ装置13から入出力機器30へのデータリードも同様である。
また、メモリ装置13からのリードデータに関するECCチェックでエラーが検出された場合には、メモリアクセス制御論理41は、リプライバス15bを介して、入出力制御装置12に対してScrub Write要求を行い、入出力制御装置12からアドレスバス15aを介して指示されたアドレスの記憶領域に対して、メモリ装置13内の記憶データを部分的に修復するスクラブライト(Scrub Write)を実行する。
図15は、メモリ装置13に対するライト動作におけるLDXの動作を示している。
入出力制御装置12から上位側バス15を介して到来するライトデータを複数のLDXで分担してECCチェックおよびコレクトを実行し、個々のLDXの内部のメモリアクセス制御論理41は、エラーが検出された場合には訂正してメモリ装置13にライトするとともに、リプライバス15bを介して入出力制御装置12にエラー報告を行う。入出力機器30からメモリ装置13へのデータのライト処理も同様である。
図16は、メモリ装置13に対するパーシャルライト(リードモディファイライト)におけるLDXの動作を示している。
各LDXは、FLNまたはGDXからライトデータを受け取った後、シンドロームを交換し合ってECCチェックおよびコレクトを行い、エラーが検出された場合は、リプライバス15bを介してFLNへエラーを報告する。
一方、DIMMから読み出したリードデータについても、シンドロームを交換し合ってECCチェックおよびコレクトを行い、エラーが検出された場合は、リプライバス15bを介してFLNへエラーを報告する。
また、ライトデータおよびリードデータに関する訂正結果は、情報交換バス50を介して、書き換え情報として交換し合う。
DIMMへのデータの書き込みは、ECCチェックおよびコレクトがなされたライトデータ及びDIMMから読み出したデータをECCチェックビットを含めてマージし、DIMMに書き込む。ECCチェックの結果、DBE(ダブルブロックエラー)またはPoisonedDataが検出された場合はPoisonedDataをDIMMに書き込む。
このように、リードモディファイライトでは、本実施の形態では、ECCチェックおよびコレクトを分担する二つのLDXの間で、リードデータおよびライトデータに関する二つの部分シンドロームの他に、リードデータの修正結果、およびライトデータの修正結果を反映した自装置内の書き換え情報を、情報交換バス50を介して交換する。この書き換え情報の交換には、上述の書き換え情報交換パケット52を用いる。
図17は、パトロールにおけるLDXの動作を示している。DIMMからデータを読み出した後、各LDXは、情報交換バス50を介してシンドロームを交換し合ってECCチェックを行い、エラーが検出された場合は、リプライバス15bを介してFLNへエラーを報告する。
ECCチェックの結果、エラーが検出された場合は、リプライバス15bを介して、FLNへScrubWriteを要求し、DIMMのエラー訂正を行う。
図1を参照して、上述のリードモディファイライトの動作を、より詳細に説明する。
まず、ECCチェックを分担する2つのデータ処理装置40(たとえば、LDX#0、#1)がデータ通信路(上位側バス15または下位側バス17)から同時にライトデータを受信する。
同一タイミングでLDX(#0)が受信するデータ(A0〜A3)と、LDX(#1)が受信するデータ(B0〜B3)が、1つのECC単位を構成する。LDX(#0)と(#1)は、お互いに部分シンドロームSD−A0、SD−B0を送り合い、真のシンドロームSD−AB0を生成しエラー訂正動作を行う。さらに同様にリードデータに対しても同じ動作を行いエラー訂正動作を行う。ライト動作とリード動作の順序はどちらが先であってもよい。
その後、データの書き換え情報(エラー訂正動作で変化した部分)をLDX(#0)と(#1)で送りあい、データのマージ動作ならびにチェックビットの再構築を行う。
また、本実施の形態の場合には、上述の書き換え情報交換パケット52の動作変更フラグ52cを用いることで、特定のエラーパターンの検出時に個々のLDXにおいてECCエラー検出時の動作を変更できる。このことを、図2を参照して説明する。この図2では、LDX(#0)と(#1)のペアについて説明する。
LDX(#0)と(#1)は、情報交換バス50を介してシンドロームを交換しあうが、図2の例では、特定エラーパターンの検出を行った場合には、情報交換バス50を使用して、書き換え情報交換パケット52の動作変更フラグ52cにて、当該特定エラーパターンの検出情報をLDX同士が交換することで、エラー訂正動作を抑止する場合を例示している。この場合、書き換え情報52dには、エラーとなった特定のデータパターンが格納される。
LDXにおける、このような制御動作はエラーマーキング、つまりエラーを検出もしくはエラーを埋め込んだ装置が特定のデータパターンでかつECCエラーとなるデータをやりとりすることにより、エラー発生箇所の特定、またはプログラムの流れを制御する方式を採用した情報処理システムにおいて有用である。
また、LDX同士で誤ったシンドロームを交換して正しいデータを誤訂正するのを防止するため、同期チェックパケット53を用いて同期信号を任意のタイミングでシンドロームデータに付加してエラーチェックを行えるようにしている。
以上説明したように、本実施の形態では、メモリアクセス制御装置14を構成する複数のデータ処理装置40内において、シンドロームの交換の他に、エラー訂正後のデータである書き替え情報を交換してエラーチェックを行うため、たとえば、データのマージ処理を伴うリードモディファイライト(パーシャルライト)等の高度の処理機能を個々のデータ処理装置40内で行わせることができる。
また、複数のデータ処理装置40にてECCチェック単位のデータを分担してECCチェックを行うことで、ECCチェック単位のデータを折りたたまないで処理するので、ピン故障でも1ビットエラーしか発生せず、エラーに強い通信が行える。
ECCチェック単位のデータを複数のデータ処理装置40にて分担して処理するので、データ処理装置40における入出力信号のピン数を抑えられ、データ処理装置40を含むメモリアクセス制御装置14の製造コストの低減が可能になる。
データ処理装置40の間では、シンドロームおよび必要最低限の情報のみ交換するので、データ処理装置40の間のバス幅を小さくできる。
この結果、たとえば、複数のデータ処理装置40で構成されるメモリアクセス制御装置14等のように、ECCで保護されたデータを扱う装置において、ECCチェックの単位が複数のデータ処理装置40にまたがっている場合でも、単一のデータ処理装置で処理する場合と比較してエラー検出/訂正能力が同等なECCチェックを実現できる。
特に、リードモディファイライト(部分データマージ)等の高度なデータ処理においても、単一のデータ処理装置にて処理する場合と同等なエラー検出/訂正能力を実現することができる。
なお、本発明は、上述の実施の形態に例示した構成に限らず、その趣旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
(付記1)
データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含み、前記情報交換路を介して個々の前記データ処理装置が分担する前記データの一部に関する部分シンドロームを交換することで真のシンドロームを生成するエラー検出訂正装置の制御方法であって、
個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換することを特徴とするエラー検出訂正装置の制御方法。
(付記2)
付記1記載のエラー検出訂正装置の制御方法において、
前記書き換え情報のパターンの種別に応じて、前記情報交換路を介した前記書き換え情報の交換の有無を制御することを特徴とするエラー検出訂正装置の制御方法。
(付記3)
付記1記載のエラー検出訂正装置の制御方法において、
個々の前記データ処理装置では、当該データ処理装置が分担した前記データの一部に対して部分書き換え処理を実行した後、当該データの他の前記データ処理装置が分担する部分を全て0と見なしてチェックビットの更新を実行し、
更新後の当該チェックビットを前記情報交換路を介して他の前記データ処理装置と交換することを特徴とするエラー検出訂正装置の制御方法。
(付記4)
付記1記載のエラー検出訂正装置の制御方法において、
個々の前記データ処理装置で検出された特定のエラーパターンを前記情報交換路を介して交換することを特徴とするエラー検出訂正装置の制御方法。
(付記5)
付記1記載のエラー検出訂正装置の制御方法において、
前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止することを特徴とするエラー検出訂正装置の制御方法。
(付記6)
付記1記載のエラー検出訂正装置の制御方法において、
前記部分シンドロームのデータ長を可変に制御することを特徴とするエラー検出訂正装置の制御方法。
(付記7)
付記1記載のエラー検出訂正装置の制御方法において、
個々の前記データ処理装置は、前記データに対して、前記部分シンドロームの交換によるエラー訂正を実行せず、当該データをそのまま転送先装置に送出し、当該データに関するエラー検出情報を後追いで前記転送先装置に通知することを特徴とするエラー検出訂正装置の制御方法。
(付記8)
データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含み、前記情報交換路を介して個々の前記データ処理装置が分担する前記データの一部に関する部分シンドロームを交換することで真のシンドロームを生成するエラー検出訂正装置であって、
個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換する情報交換手段を備えたことを特徴とするエラー検出訂正装置。
(付記9)
付記8記載のエラー検出訂正装置において、前記情報交換手段は、前記書き換え情報のパターンの種別に応じて、前記情報交換路を介した前記書き換え情報の交換の有無を制御することを特徴とするエラー検出訂正装置。
(付記10)
付記8記載のエラー検出訂正装置において、
個々の前記データ処理装置では、当該データ処理装置が分担した前記データの一部に対して部分書き換え処理を実行した後、当該データの他の前記データ処理装置が分担する部分を全て0と見なしてチェックビットの更新を実行し、
前記情報交換手段は、更新後の当該チェックビットを前記情報交換路を介して他の前記データ処理装置と交換することを特徴とするエラー検出訂正装置。
(付記11)
付記8記載のエラー検出訂正装置において、
前記情報交換手段は、個々の前記データ処理装置で検出された特定のエラーパターンを前記情報交換路を介して交換することを特徴とするエラー検出訂正装置。
(付記12)
付記8記載のエラー検出訂正装置において、
前記情報交換手段は、前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止することを特徴とするエラー検出訂正装置。
(付記13)
付記8記載のエラー検出訂正装置において、
前記情報交換手段は、前記部分シンドロームのデータ長を可変に制御することを特徴とするエラー検出訂正装置。
(付記14)
付記8記載のエラー検出訂正装置において、
個々の前記データ処理装置は、前記データに対して、前記部分シンドロームの交換によるエラー訂正を実行せず、当該データをそのまま転送先装置に送出し、当該データに関するエラー検出情報を後追いで前記転送先装置に通知する機能を備えたことを特徴とするエラー検出訂正装置。
(付記15)
記憶装置と、前記記憶装置にアクセスするアクセス装置と、前記記憶装置と前記アクセス装置とを接続するデータ転送路と、前記データ転送路に介在するエラー検出訂正装置と、を含む情報処理システムであって、
前記エラー検出訂正装置は、
データ転送路におけるエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、
複数の前記データ処理装置の間に設けられた情報交換路と、
個々の前記データ処理装置が分担する前記データの一部に関する部分シンドローム、および個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して複数の前記データ処理装置の間で交換する情報交換手段と、
を備えたことを特徴とする情報処理システム。
(付記16)
付記15記載の情報処理システムにおいて、
前記情報交換手段は、さらに、
前記書き換え情報のパターンの種別に応じて、前記情報交換路を介した前記書き換え情報の交換の有無を制御する機能、
個々の前記データ処理装置が分担した前記データの一部に対して部分書き換え処理を実行した後、当該データの他の前記データ処理装置が分担する部分を全て0と見なしてチェックビットの更新を実行し、更新後の当該チェックビットを前記情報交換路を介して他の前記データ処理装置と交換する機能、
個々の前記データ処理装置で検出された特定のエラーパターンを前記情報交換路を介して交換する機能、
前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止する機能、
の少なくとも一つの機能を備えたことを特徴とする情報処理システム。
(付記17)
データ通信路に介在してエラー訂正符号単位のデータの送受信を分担する複数のデータ処理装置と、複数の前記データ処理装置の間に設けられた情報交換路とを含むエラー検出訂正装置の制御プログラムであって、
個々の前記データ処理装置が分担する前記データの一部に関する部分シンドローム、および個々の前記データ処理装置が分担した前記データの一部に関する書き換え情報を、前記情報交換路を介して他の前記データ処理装置との間で交換する工程を個々の前記データ処理装置に実行させることを特徴とするエラー検出訂正装置の制御プログラム。
(付記18)
付記17記載のエラー検出訂正装置の制御プログラムにおいて、
前記書き換え情報のパターンの種別に応じて、前記情報交換路を介した前記書き換え情報の交換の有無を制御する機能、
個々の前記データ処理装置が分担した前記データの一部に対して部分書き換え処理を実行した後、当該データの他の前記データ処理装置が分担する部分を全て0と見なしてチェックビットの更新を実行し、更新後の当該チェックビットを前記情報交換路を介して他の前記データ処理装置と交換する機能、
個々の前記データ処理装置で検出された特定のエラーパターンを前記情報交換路を介して交換する機能、
前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止する機能、
の少なくとも一つの機能を、さらに前記データ処理装置に実現させることを特徴とするエラー検出訂正装置の制御プログラム。
(付記19)
データ通信路に介在するエラー検出訂正装置に含まれ、エラー訂正符号単位のデータの送受信を分担するデータ処理装置であって、
自装置が分担する前記データの一部に関する部分シンドローム、および自装置が分担した前記データの一部に関する書き換え情報を、他のデータ処理装置との間で交換する情報交換手段を備えたことを特徴とするデータ処理装置。
本発明の一実施の形態であるエラー検出訂正装置の作用の一例を示す概念図である。 本発明の一実施の形態であるエラー検出訂正装置の作用の変形例を示す概念図である。 本発明の一実施の形態であるエラー検出訂正装置の一例であるメモリアクセス制御装置を構成するデータ処理装置の構成の一例を示すブロック図である。 本発明の一実施の形態である情報処理システムの構成の一例を示す概念図である。 本発明の一実施の形態である情報処理システムの構成の一例を、より具体的に示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置の動作を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間の情報交換バスの構成例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間の情報交換バスの信号仕様例を示す説明図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間で授受される情報パケットの識別情報の設定例を示す説明図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間で授受されるシンドローム交換パケットのフォーマット例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間で授受される書き換え情報交換パケットのフォーマット例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間で授受される同期チェックパケットのフォーマット例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置間で授受される縮退運転時データパケットのフォーマット例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置におけるエラーチェック制御の一覧を示す説明図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置のメモリリード動作の一例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置のメモリライト動作の一例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置のパーシャルライト動作の一例を示す概念図である。 本発明の一実施の形態であるメモリアクセス制御装置を構成する複数のデータ処理装置のパトロール動作の一例を示す概念図である。
符号の説明
10 情報処理装置
11 CPU
11a システムバス
12 入出力制御装置
13 メモリ装置
14 メモリアクセス制御装置
15 上位側バス
15a アドレスバス
15b リプライバス
16 メモリバス
17 下位側バス
20 バススイッチ
30 入出力機器
40 データ処理装置
41 メモリアクセス制御論理
42 ライトバッファ
43 リードバッファ
44 情報交換バッファ
50 情報交換バス
51 シンドローム交換パケット
51a ID部
51b 予約部
51c エラー種別情報
51d シンドローム値
52 書き換え情報交換パケット
52a ID部
52b 予約部
52c 動作変更フラグ
52d 書き換え情報
53 同期チェックパケット
53a ID部
53b 同期識別情報
54 縮退運転時データパケット
54a ID部
54b 転送データ

Claims (10)

  1. データ通信路に介在してエラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、前記複数のデータ処理装置の間に設けられた情報交換路とを有するエラー検出訂正装置の制御方法において
    前記データ処理装置で、
    自身が分担する部分データに関する部分シンドロームを生成し、
    生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
    自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
    生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
    行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換することを特徴とするエラー検出訂正装置の制御方法。
  2. 請求項1記載のエラー検出訂正装置の制御方法において、
    前記データ処理装置は、自身が分担する部分データのエラーを訂正した場合、エラーが訂正された自身が分担する部分データを、前記情報交換路を介して他のデータ処理装置に送ることを特徴とするエラー検出訂正装置の制御方法。
  3. 請求項記載のエラー検出訂正装置の制御方法において、
    前記データ処理装置は、他のデータ処理装置から前記情報交換路を介して、当該他のデータ処理装置がエラーを訂正した部分データを受け取った後、当該部分データを用いてチェックビットの付け替えを行うことを特徴とするエラー検出訂正装置の制御方法。
  4. 請求項1記載のエラー検出訂正装置の制御方法において、
    個々のデータ処理装置で特定のパターンを持つデータを検出した場合、検出した特定パターンを持つデータを、前記交換路を介して他のデータ処理装置と交換して、エラー検出時の動作を変更することを特徴とするエラー検出訂正装置の制御方法。
  5. エラーの検出及び訂正を行うエラー検出訂正装置において、
    データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、
    前記複数のデータ処理装置の間に設けられた情報交換路とを有し、
    前記データ処理装置のそれぞれは、
    自身が分担する部分データに関する部分シンドロームを生成し、
    生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
    自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
    生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
    行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えたことを特徴とするエラー検出訂正装置。
  6. 記憶装置と、前記記憶装置にアクセスするアクセス装置と、前記記憶装置と前記アクセス装置とを接続するデータ転送路と、前記データ転送路に介在するエラー検出訂正装置と、を含む情報処理システムであって、
    前記エラー検出訂正装置は、
    データ通信路に介在して、エラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、
    前記複数のデータ処理装置の間に設けられた情報交換路とを有し、
    前記データ処理装置のそれぞれは、
    自身が分担する部分データに関する部分シンドロームを生成し、
    生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換し、
    自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
    生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
    行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えたことを特徴とする情報処理システム。
  7. 請求項6記載の情報処理システムにおいて、
    前記制御部は、さらに
    々の前記データ処理装置が、自身が分担した部分データのエラー訂正を行った後、他の前記データ処理装置が分担する部分データを全て0と見なしてチェックビットの更新を実行し、更新後のチェックビットを前記情報交換路を介して他の前記データ処理装置と交換する機能、
    個々の前記データ処理装置で検出された特定のデータパターンを前記情報交換路を介して交換する機能、
    前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止する機能、
    の少なくとも一つの機能を備えたことを特徴とする情報処理システム。
  8. データ通信路に介在してエラー訂正符号単位の部分データの送受信をそれぞれ分担する複数のデータ処理装置と、前記複数のデータ処理装置の間に設けられた情報交換路とを有するエラー検出
    訂正装置の制御プログラムであって、
    前記データ処理装置に、
    自身が分担する部分データに関する部分シンドロームを生成する機能と、
    生成した部分シンドロームを、前記情報交換路を介して他のデータ処理装置と交換する機能と、
    自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成する機能と、
    生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行う機能と、
    行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換する機能とを実現させることを特徴とするエラー検出訂正装置の制御プログラム。
  9. 請求項8記載のエラー検出訂正装置の制御プログラムにおいて
    々の前記データ処理装置が、自身が分担した部分データのエラー訂正を行った後、他の前記データ処理装置が分担する部分データを全て0と見なしてチェックビットの更新を実行し、更新後のチェックビットを前記情報交換路を介して他の前記データ処理装置と交換する機能、
    個々の前記データ処理装置で検出された特定のデータパターンを前記情報交換路を介して交換する機能、
    前記情報交換路にエラー訂正符号を付加して当該情報交換路を伝送される情報を保護するとともに、前記部分シンドロームに同期確認信号を付加し、前記部分シンドロームの使用タイミングの誤りを抑止する機能、
    の少なくとも一つの機能を、さらに前記データ処理装置に実現させることを特徴とするエラー検出訂正装置の制御プログラム。
  10. データ通信路に介在するエラー検出訂正装置に含まれ、エラー訂正符号単位の部分データの送受信を分担するデータ処理装置であって、
    自身が分担する部分データに関する部分シンドロームを生成し、
    生成した部分シンドロームを、情報交換路を介して他のデータ処理装置と交換し、
    自身が生成した部分シンドロームと、前記情報交換路を介して受信した部分シンドロームとから真のシンドロームを生成し、
    生成した真のシンドロームに基づいて、自身が分担する部分データのエラー検出及び部分データのエラー訂正を行い、
    行ったエラー検出及びエラー訂正結果を、前記情報交換路を介して他のデータ処理装置と交換するように動作する制御部を備えたことを特徴とするデータ処理装置。
JP2005076403A 2005-03-17 2005-03-17 エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置 Active JP4723265B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2005076403A JP4723265B2 (ja) 2005-03-17 2005-03-17 エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置
EP05253847.7A EP1703396B1 (en) 2005-03-17 2005-06-21 Error detection & correction
KR1020050058650A KR100717572B1 (ko) 2005-03-17 2005-06-30 에러 검출 정정 장치의 제어 방법, 에러 검출 정정 장치,정보 처리 시스템, 에러 검출 정정 장치의 제어 프로그램,데이터 처리 장치
CNB2005100840255A CN100394390C (zh) 2005-03-17 2005-07-15 差错检测和校正装置及其控制方法
US11/237,765 US7543220B2 (en) 2005-03-17 2005-09-29 Control method for error detection & correction apparatus, error detection & correction apparatus, and computer-readable storage medium storing control program for error detection & correction apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005076403A JP4723265B2 (ja) 2005-03-17 2005-03-17 エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置

Publications (2)

Publication Number Publication Date
JP2006260139A JP2006260139A (ja) 2006-09-28
JP4723265B2 true JP4723265B2 (ja) 2011-07-13

Family

ID=36636166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005076403A Active JP4723265B2 (ja) 2005-03-17 2005-03-17 エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置

Country Status (5)

Country Link
US (1) US7543220B2 (ja)
EP (1) EP1703396B1 (ja)
JP (1) JP4723265B2 (ja)
KR (1) KR100717572B1 (ja)
CN (1) CN100394390C (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100458718C (zh) * 2006-12-29 2009-02-04 福昭科技(深圳)有限公司 一种闪存存储装置及其数据读取和写入方法
US8438452B2 (en) * 2008-12-29 2013-05-07 Intel Corporation Poison bit error checking code scheme
US8848465B2 (en) 2011-07-06 2014-09-30 Samsung Electronics Co., Ltd. Memory devices including selective RWW and RMW decoding
CN103729523B (zh) * 2014-01-22 2017-01-25 中国人民解放军国防科学技术大学 一种面向参数化系统的自动验证方法
JP6090489B1 (ja) * 2016-03-01 2017-03-08 日本電気株式会社 エラー検知装置、記憶装置およびエラー訂正方法
US11334457B1 (en) 2019-06-27 2022-05-17 Samsung Electronics Co., Ltd. Semiconductor memory device and memory system including the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423048A (ja) * 1990-05-17 1992-01-27 Hitachi Ltd 誤り検出・訂正用集積回路、誤り検出・訂正回路、および、データ処理装置
JPH04312147A (ja) * 1991-04-11 1992-11-04 Nec Gumma Ltd 主記憶装置
JPH07129477A (ja) * 1993-11-05 1995-05-19 Oki Electric Ind Co Ltd エラー検出訂正装置
JPH10289164A (ja) * 1997-04-16 1998-10-27 Mitsubishi Electric Corp メモリ制御方法およびメモリ制御装置
JPH11232129A (ja) * 1998-02-09 1999-08-27 Nec Eng Ltd チェックビット生成回路及びエラー訂正回路並びにそれ等を使用したecc制御回路

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57152599A (en) 1981-03-17 1982-09-20 Fujitsu Ltd Error correcting device
US4736376A (en) * 1985-10-25 1988-04-05 Sequoia Systems, Inc. Self-checking error correcting encoder/decoder
US5157669A (en) * 1988-10-14 1992-10-20 Advanced Micro Devices, Inc. Comparison of an estimated CRC syndrome to a generated CRC syndrome in an ECC/CRC system to detect uncorrectable errors
US5331645A (en) * 1990-01-17 1994-07-19 Integrated Device Technology, Inc. Expandable digital error detection and correction device
GB2289779B (en) * 1994-05-24 1999-04-28 Intel Corp Method and apparatus for automatically scrubbing ECC errors in memory via hardware
US5768294A (en) * 1995-12-11 1998-06-16 International Business Machines Corporation Memory implemented error detection and correction code capable of detecting errors in fetching data from a wrong address
US5841795A (en) * 1996-02-12 1998-11-24 Compaq Computer Corporation Error correction codes
US7028248B2 (en) * 2001-02-28 2006-04-11 International Business Machines Corporation Multi-cycle symbol level error correction and memory system
US6996766B2 (en) * 2002-06-28 2006-02-07 Sun Microsystems, Inc. Error detection/correction code which detects and corrects a first failing component and optionally a second failing component
US6853602B2 (en) * 2003-05-09 2005-02-08 Taiwan Semiconductor Manufacturing Company, Ltd. Hiding error detecting/correcting latency in dynamic random access memory (DRAM)
TWI227395B (en) * 2003-06-02 2005-02-01 Genesys Logic Inc Method for parallel processing of memory data and error correction code and related device thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423048A (ja) * 1990-05-17 1992-01-27 Hitachi Ltd 誤り検出・訂正用集積回路、誤り検出・訂正回路、および、データ処理装置
JPH04312147A (ja) * 1991-04-11 1992-11-04 Nec Gumma Ltd 主記憶装置
JPH07129477A (ja) * 1993-11-05 1995-05-19 Oki Electric Ind Co Ltd エラー検出訂正装置
JPH10289164A (ja) * 1997-04-16 1998-10-27 Mitsubishi Electric Corp メモリ制御方法およびメモリ制御装置
JPH11232129A (ja) * 1998-02-09 1999-08-27 Nec Eng Ltd チェックビット生成回路及びエラー訂正回路並びにそれ等を使用したecc制御回路

Also Published As

Publication number Publication date
KR20060101140A (ko) 2006-09-22
KR100717572B1 (ko) 2007-05-15
EP1703396B1 (en) 2018-10-31
CN1834931A (zh) 2006-09-20
CN100394390C (zh) 2008-06-11
US7543220B2 (en) 2009-06-02
EP1703396A2 (en) 2006-09-20
US20060236213A1 (en) 2006-10-19
EP1703396A3 (en) 2011-08-10
JP2006260139A (ja) 2006-09-28

Similar Documents

Publication Publication Date Title
US11108499B2 (en) System and method for transferring data and a data check field
JP4723265B2 (ja) エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置
JP3839215B2 (ja) 誤り検出・訂正方法、計算機システムの主記憶制御装置、及び計算機システム
US7624324B2 (en) File control system and file control device
US8566672B2 (en) Selective checkbit modification for error correction
KR102378466B1 (ko) 메모리 장치 및 모듈
US7480847B2 (en) Error correction code transformation technique
US9191030B2 (en) Memory controller, data storage device, and memory controlling method
US20120017135A1 (en) Combined Single Error Correction/Device Kill Detection Code
KR101425704B1 (ko) 비트 포이즈닝 장치, 방법, 시스템 및 제품
KR20190132238A (ko) 메모리 시스템 및 메모리 시스템의 동작 방법
CN105023616A (zh) 一种基于汉明码存取数据的方法及集成随机存取存储器
US6601217B1 (en) System and method for error correction in an electronic communication
KR20190132237A (ko) 메모리 시스템 및 메모리 시스템의 동작 방법
US20140006880A1 (en) Apparatus and control method
JP2016059012A (ja) 受信装置、送信装置およびデータ転送システム
JP5145860B2 (ja) メモリ二重化システム及び情報処理装置
CN109840158B (zh) 一种操作存储器的方法
JP4563834B2 (ja) データ通信システム
JP5544099B2 (ja) コントローラ通信方法およびコントローラ通信装置
JP5325032B2 (ja) 多重系システムの高信頼性制御装置
US11809272B2 (en) Error correction code offload for a serially-attached memory device
JP6389499B2 (ja) 誤り訂正前に不揮発性固体装置からデータを送信するシステムおよび方法
JP2016194839A (ja) 制御装置および通信インタフェース回路
JPH04162161A (ja) 記憶制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110405

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110407

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140415

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4723265

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150