JP2006285602A - メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体 - Google Patents

メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体 Download PDF

Info

Publication number
JP2006285602A
JP2006285602A JP2005104236A JP2005104236A JP2006285602A JP 2006285602 A JP2006285602 A JP 2006285602A JP 2005104236 A JP2005104236 A JP 2005104236A JP 2005104236 A JP2005104236 A JP 2005104236A JP 2006285602 A JP2006285602 A JP 2006285602A
Authority
JP
Japan
Prior art keywords
memory
memory bus
data
failure
transferred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005104236A
Other languages
English (en)
Inventor
Yutaka Matsuzawa
裕 松澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005104236A priority Critical patent/JP2006285602A/ja
Publication of JP2006285602A publication Critical patent/JP2006285602A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

【課題】 メモリバスなどに故障があっても、安定した動作を行い、故障に対する高い信頼性を確保する。
【解決手段】 メモリバスの故障状況を確認する故障診断部102及び故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行う転送制御部101を有するメモリ制御用LSI100と、メモリバスの故障状況を認識し、前記割り付けを行うバッファIC202を有するメモリモジュール200(1)、(2)、…よりなるメモリシステムを構築した。
【選択図】 図1

Description

本発明は、情報処理機器などに搭載されており、所定のコマンド、データを転送する機能を有するメモリシステムなどに関するものである。
情報処理機器のハードウェアにおいては、チップセットとメインメモリとの間でなされるデータ転送が非常に高速で行うために、転送するデータをパケット化し、チップセットとメインメモリを1対1で接続したシリアル転送方式がとられている。図4は、従来の情報処理機器におけるシリアル転送方式を示す図面である。冗長構成で組まれており、チップセットとして代表的なメモリモジュール200(1)、(2)、…に対し、それらを制御するメインメモリとして代表的なメモリ制御用LSI100がある。複数のメモリバス300を以って、メモリ制御用LSI100及びメモリモジュール200(1)、(2)、…をデイジーチェーン接続することにより、所定データなどをシリアル転送している。従って、メモリバス300はシリアルインターフェースとして機能する。また、各メモリモジュール200(1)、(2)、…はデータを記憶するメモリIC201を有している。また、シリアル転送されたデータ、つまりシリアルデータをパラレル変換して、そのパラレル変換したデータをメモリIC201に転送するバッファIC202を有している。
しかし、このシリアル転送方式において以下の問題点がある。第1に、メモリバス300の一つ、又は、バッファIC202の一つが故障した場合、データ転送が不可能になる点である。例えば、図4に示す故障ライン400があって、「×」を印した箇所で断線したなどといった故障があった場合、メモリ制御用LSI100から出力されたデータはメモリモジュール200(1)には転送されるが、他のメモリモジュール200(2)、(3)、…に転送することはできない。シリアル転送方式を採る前はメモリバス300の一つが故障してもメモリモジュールは周知のエラー訂正手段を行うことでデータ転送を継続することは可能であった。しかし、このような手段はこのシリアル転送方式においては適用され得ない。
第2に、デイジーチェーンで接続する構成をとるため、複数のメモリモジュール200(1)、(2)、…のうち中間のメモリモジュールに故障が発生すると、その後のメモリモジュールに対してはデータ転送が不可能となり、結果的に、メモリシステム全体が動作不可能となってしまう点である。シリアル転送方式を採る前はメモリ制御用LSI100及びメモリモジュール200(1)、(2)、…は、いわゆる1対多接続であった。中間のメモリモジュールに故障があっても、当該故障はそのメモリモジュール内で閉じることから、メモリシステム全体に影響を与えることは無く、十分な信頼性があった。従って、デイジーチェーンのようにメモリ制御用LSI100及びメモリモジュール200(1)、(2)、…を1対1で接続することにより、非常に高速なデータ転送をなし得る代わりに、上記故障に対する信頼性が劣ってしまう。
特許文献1にはバス・サイクルのサイクル数を変更する技術が開示されている。また、特許文献2には通信条件に応じてパラレル転送とシリアル転送を切り替える技術が開示されている。しかし、このような技術はメモリバスの故障を考慮したものではない。従って、当該故障を判定する機能を備えておらず、このような技術を利用しても上記問題点を解消するには至らない。
特開平01−306939号公報 特開平10−171750号公報
上記事情を鑑みて、本発明が解決しようとする課題は、メモリバスなどに故障があっても、安定した動作を行い、故障に対する高い信頼性を確保するメモリシステムなどを提供することにある。
上記課題を解決するための本発明の態様は、メモリバスの故障状況に基づいて、故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行うことを特徴とするメモリシステムに関するものである。具体的には、このメモリシステムは、前記故障状況を確認する手段及び前記割り付けを行う手段を有するメインメモリと、前記故障状況を認識する手段及び前記割り付けを行う手段を有するメモリモジュールを有していることを特徴とする。
本発明の他の態様は、上記メモリシステムを搭載した情報処理機器に関するものである。
また、本発明の他の態様は、メモリバスの故障状況を確認し、故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行い、前記割り付けに従い、前記パケットデータを転送することを特徴とするデータ転送方法に関するものである。
また、本発明の他の態様は、コンピュータに、メモリバスの故障状況を確認する処理と、故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行う処理と、前記割り付けに従い、前記パケットデータを転送する処理を実行させることを特徴とするプログラムに関するものである。
また、本発明の他の態様は、上記プログラムを記録した記録媒体に関するものである。
本発明により、メモリバスに故障があっても、そのメモリバスを使用しないようにするため、安定した動作を継続し、故障に対する高い信頼性を確保することができる。
以下、本発明のメモリシステムを実施するための最良の形態を、このメモリシステムを搭載した情報処理機器として説明する。その際には、本明細書と同時に提出する図面を適宜参照することにする。
図1は、本形態の情報処理機器におけるシリアル転送方式を示す図面である。冗長構成で組まれているメモリモジュール200(1)、(2)、…に対し、それらを制御するメモリ制御用LSI100がある。複数のデータ線L1、L2、…より構成されるメモリバス300を以って、メモリ制御用LSI100及びメモリモジュール200(1)、(2)、…をデイジーチェーン接続する。これにより、所定のコマンド、クロック、データ(特に、パケット化されたもの)などの転送によるシリアル転送方式を採るメモリシステムが形成されている。
メモリ制御用LSI100は転送制御部101及び故障診断回路102を有して構成されている。
転送制御部101はメモリバス300を介してパケットデータなどを各メモリモジュール200(1)、(2)、…へ転送する制御を行う機能を有する。また、メモリバスが故障していた場合にはそのメモリバスを介してシリアル転送を行うことのないようにパケットの変更を行う機能を有する。例えば、図1に示すように、「×」と印した箇所が断線などで故障しているデータ線L1が故障ライン400であって、このデータ線L1でデータの転送を行えない場合には他のデータ線L0、L2、L3、…を介して転送する。そして、データ線L1で転送するように割り付けられていたパケットはデータ線L0、L2、L3、…に割り付けるように変更する。
故障診断部102はメモリバス300の故障状況を確認する機能を有する。メモリバス300とは別に各メモリモジュール200(1)、(2)、…のバッファIC202と専用ラインを組んで接続されている。故障状況の確認は一定間隔で行い、常時把握できるようにしている。具体的には、故障診断部102より上記専用ラインを介してバッファIC202に所定の要求信号を一定間隔で送信している。もし、バッファIC202がその要求信号を受信していれば、対応する応答信号を故障診断部102に送信する。故障診断部102がその応答信号を受信することによりメモリバス300の故障は無いものと確認することができる。あるメモリモジュールのバッファIC202より応答信号を受信できなければ、そのメモリモジュールのバッファIC202を通過するデータ線近傍において故障が生じているものと確認することができる。故障診断部102が故障を確認した場合には転送制御部101にパケットの変更を要求し、故障したデータ線を使用してデータの転送を行わないようにさせる。また、各メモリモジュール200(1)、(2)、…のバッファIC202に対し、故障があった旨の通知するための故障通知情報を送信する。
各メモリモジュール200(1)、(2)、…はメモリIC201及びバッファIC202を有して構成されている。
メモリIC201はバッファIC202より受信したデータを記憶する記憶素子である。
バッファIC202はメモリバス300を介して転送されたデータを各メモリモジュール200(1)、(2)、…にて受信する機能を有する素子である。転送されたデータはシリアルデータであって、シリアルパラレル変換することにより、パラレル化したデータをメモリIC201に記憶させる機能も有する。故障診断部102より送信される要求信号、故障通知情報を受信し、応答信号を故障診断部102に送信する機能も有する。故障通知情報を受信することによりメモリバス300に故障があった旨を認識することができ、転送制御部101にてなされたパケットの変更に対応するべく、転送されたシリアルデータに係るパケットの変更を行う。
なお、本形態の情報処理機器には、当該情報処理機器を構成する各部(メモリ制御用LSI100、メモリモジュール200(1)、(2)、…を含む。)の動作処理を統括的に制御する、いわば、中央処理制御を行うCPU(Central Processing Unit)と、当該CPUがその制御を行うために読み出すプログラムを記録するROM(Read Only Memory)を有している。
メモリバス300に故障があった場合に、転送制御部101、バッファIC202が行うパケットの変更の様子を、図2を参照して説明する。図2はデータパケットの割り付けを表したテーブル(a)〜(c)である。
(a)に示すように、メモリバス300において故障が生じていない場合、全てのデータ線を使用してパケットのシリアル転送を行っている。図を見ればわかるように、データ線L0においては、T0のタイミングでアドレスA0が、T1のタイミングでライトデータDW0が、T2のタイミングでライトデータDW4が転送されている。他のデータ線も同様である。
ここで、データ線L1において故障が発生したものとする。すると、(b)に示すように、データ線L1を介して転送されるアドレスA1、ライトデータDW1、ライトデータDW5が転送されない状態になる。故障診断部102はこのような状態を故障通知情報として各メモリモジュール200(1)、(2)、…に送信する。
その後、(c)に示すように、転送制御部101、バッファIC202はパケットの再割付を行うようにして変更する。アドレスA1、ライトデータDW1、ライトデータDW5をデータ線L0、L2、L3の何れかへ割り付けている。その割り付けに伴い、他のデータも適当なクロックタイミングTxに転送されるように割り付けても良い。結果的に、データ線L1には何れのパケットも割り付けられないようになる。
メモリ制御用LSI100においてメモリバス300に故障があることを確認してからパケットの変更を行うまでの動作処理は以下に説明するようになる。図4を参照しつつその説明を行う。
まず、メモリ制御用LSI100はシリアル転送における通常のパケットのリード/ライト処理を行っている(S01)。このリード/ライト処理が終了すれば(S02でYES)、シリアル転送自体を終了することになるが、まだ継続するのであれば(S02でNO)、一定間隔で行う故障状況の確認を故障診断部102にて実行する(S03)。
メモリ制御用LSI100において、メモリバス300の故障に由来する不正なパケットが与えられることが無ければ(S03でYES)、故障が生じていないものと判断してS01の処理へ続くが、不正なパケットが与えられると(S03でNO)、バス診断モードへ切り替わる(S04)。
バス診断モードでは、故障診断部102が故障したデータ線を特定し、転送制御部101にパケットの変更を要求する。転送制御部101は故障したデータ線にパケットを割り付けないようにして変更する。その後、故障診断部102が上記故障があった旨を各メモリモジュール200(1)、(2)、…に通知すべく故障通知情報を送信する(S05)。
バッファIC202においてパケットの変更を行い、当該変更に基づくリード/ライト処理を継続する(S01)。
本形態を実施することにより、以下の効果を奏する。すなわち、故障したデータ線を特定し、パケットの割り付けを変更してそのデータ線を使用しないシリアル転送へ切り替えるため、処理を継続することができ、高い信頼性を確保することができる。
なお、上述した形態は本発明を実施するための最良のものであるが、これに限定する趣旨ではない。従って、本発明の要旨を変更しない範囲において種々変形することが可能である。
例えば、故障診断部102はメモリ制御用LSI100に設けられていたが、バッファIC202に設ける形態であっても良い。これは、バッファIC202がメモリバス300の故障状況を確認することになることを意味する。
また、上記形態では、故障したデータ線が1本である例を示したが、複数本のデータ線が故障した場合であってもパケットの変更方法は同様である。すなわち、故障した複数のデータ線を使用しないようにパケットの再割付を行うようにする。
本形態の情報処理機器におけるシリアル転送方式を示す図面である。 データパケットの割り付けを表したテーブルである。(a)は正常時のテーブルである。(b)は故障時のテーブルである。(c)は訂正時のテーブルである。説明の便宜上、メモリバス300を構成するデータ線はL0〜L3の4本とする。また、メモリバス300を介してシリアル転送されるパケットはアドレス(Ax)、ライトコマンド(W)、ライトデータ(DWx)の3種とする。これらのパケットはクロックタイミング(Tx)によるタイミングの下、転送制御部101より送出されるものとする。 本形態のデータパケットの変更に関する動作を表すフローチャートである。 従来の情報処理機器におけるシリアル転送方式を示す図面である。
符号の説明
100 メモリ制御用LSI
101 転送制御部
102 故障診断部
200(1)、(2)、… メモリモジュール
201 メモリIC
202 バッファIC
300 メモリバス
400 故障ライン

Claims (6)

  1. メモリバスの故障状況に基づいて、故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行うことを特徴とするメモリシステム。
  2. 前記故障状況を確認する手段及び前記割り付けを行う手段を有するメインメモリと、
    前記故障状況を認識する手段及び前記割り付けを行う手段を有するメモリモジュールを有していることを特徴とする請求項1に記載のメモリシステム。
  3. 請求項1または2に記載のメモリシステムを搭載した情報処理機器。
  4. メモリバスの故障状況を確認し、
    故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行い、
    前記割り付けに従い、前記パケットデータを転送することを特徴とするデータ転送方法。
  5. コンピュータに、
    メモリバスの故障状況を確認する処理と、
    故障したメモリバス以外のメモリバスに対し転送するパケットデータの割り付けを行う処理と、
    前記割り付けに従い、前記パケットデータを転送する処理を実行させることを特徴とするプログラム。
  6. 請求項5に記載のプログラムを記録した記録媒体。
JP2005104236A 2005-03-31 2005-03-31 メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体 Pending JP2006285602A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005104236A JP2006285602A (ja) 2005-03-31 2005-03-31 メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005104236A JP2006285602A (ja) 2005-03-31 2005-03-31 メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体

Publications (1)

Publication Number Publication Date
JP2006285602A true JP2006285602A (ja) 2006-10-19

Family

ID=37407470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005104236A Pending JP2006285602A (ja) 2005-03-31 2005-03-31 メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP2006285602A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224855A (ja) * 2009-03-24 2010-10-07 Nec Corp メモリ制御システム、メモリ制御方法、メモリ制御手段およびメモリ制御手段における制御方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05250317A (ja) * 1992-03-06 1993-09-28 Fuji Xerox Co Ltd データ転送方式
JPH06161912A (ja) * 1992-11-19 1994-06-10 Nec Eng Ltd データバス制御方式
JPH06332825A (ja) * 1993-05-26 1994-12-02 Nec Corp 自動障害検出システム
JPH07177164A (ja) * 1993-12-20 1995-07-14 Fujitsu Ltd フレーム通信装置
JPH07244634A (ja) * 1994-03-03 1995-09-19 Hitachi Ltd 外部記憶制御装置およびバス切り替え制御方法
JPH07302253A (ja) * 1987-03-13 1995-11-14 Texas Instr Inc <Ti> 複数のオンチップメモリバスを備えたデータ処理装置
JPH09282243A (ja) * 1996-04-10 1997-10-31 Nec Corp バス縮退に対処できるメモリ接続制御装置
JPH10154083A (ja) * 1996-11-22 1998-06-09 Hitachi Ltd プラッタ保守を可能とするコントローラ
JP2003203008A (ja) * 1990-04-18 2003-07-18 Rambus Inc 半導体メモリ装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07302253A (ja) * 1987-03-13 1995-11-14 Texas Instr Inc <Ti> 複数のオンチップメモリバスを備えたデータ処理装置
JP2003203008A (ja) * 1990-04-18 2003-07-18 Rambus Inc 半導体メモリ装置
JPH05250317A (ja) * 1992-03-06 1993-09-28 Fuji Xerox Co Ltd データ転送方式
JPH06161912A (ja) * 1992-11-19 1994-06-10 Nec Eng Ltd データバス制御方式
JPH06332825A (ja) * 1993-05-26 1994-12-02 Nec Corp 自動障害検出システム
JPH07177164A (ja) * 1993-12-20 1995-07-14 Fujitsu Ltd フレーム通信装置
JPH07244634A (ja) * 1994-03-03 1995-09-19 Hitachi Ltd 外部記憶制御装置およびバス切り替え制御方法
JPH09282243A (ja) * 1996-04-10 1997-10-31 Nec Corp バス縮退に対処できるメモリ接続制御装置
JPH10154083A (ja) * 1996-11-22 1998-06-09 Hitachi Ltd プラッタ保守を可能とするコントローラ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010224855A (ja) * 2009-03-24 2010-10-07 Nec Corp メモリ制御システム、メモリ制御方法、メモリ制御手段およびメモリ制御手段における制御方法

Similar Documents

Publication Publication Date Title
US11042442B2 (en) Control plane method and apparatus for providing erasure code protection across multiple storage devices
US7296129B2 (en) System, method and storage medium for providing a serialized memory interface with a bus repeater
JP3807250B2 (ja) クラスタシステム、コンピュータ及びプログラム
WO2007112166A2 (en) System and method for re-routing signals between memory system components
US20070168712A1 (en) Method and apparatus for lockstep processing on a fixed-latency interconnect
KR20190134480A (ko) 제1 클록 도메인과 제2 클록 도메인 사이에서 송신된 주요 신호의 에러 체크
US7568054B2 (en) Duplicate synchronization system and method of operating duplicate synchronization system
JP2011070655A (ja) 情報処理装置、メモリダンプシステムおよびメモリダンプ方法
CN105373345A (zh) 存储器设备和模块
US20050015529A1 (en) Duplexing system and method using serial-parallel bus matching
JP2008046996A (ja) データ処理装置、モード管理装置、及びモード管理方法
TW202122997A (zh) 控制器
JP2006285602A (ja) メモリシステム、情報処理機器、データ転送方法、プログラム、記録媒体
JP6134720B2 (ja) 接続方法
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
WO2022125467A1 (en) Tags for request packets on a network communication link
JP6394727B1 (ja) 制御装置、制御方法、及び、フォールトトレラント装置
US8639967B2 (en) Controlling apparatus, method for controlling apparatus and information processing apparatus
JP5556086B2 (ja) 二重化システム、及び、二重化方法
US10235045B2 (en) Storage system and control apparatus
JP4399792B2 (ja) 二重化プロセッサシステム
JP6464704B2 (ja) フォールトトレラントシステム、稼働系装置、待機系装置、フェイルオーバー方法、および、フェイルオーバープログラム
JP2014186500A (ja) I2cバス通信用デバイス、i2cバス通信システム、及びi2cバス通信方法
RU2810634C2 (ru) Способ повышения надежности систем хранения данных и соответствующее устройство
CN107819618A (zh) 一种小卫星表决式通信异常诊断方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110308