JP4853083B2 - コンピュータシステム、データ正常性確認方法、及び、プログラム - Google Patents

コンピュータシステム、データ正常性確認方法、及び、プログラム Download PDF

Info

Publication number
JP4853083B2
JP4853083B2 JP2006096327A JP2006096327A JP4853083B2 JP 4853083 B2 JP4853083 B2 JP 4853083B2 JP 2006096327 A JP2006096327 A JP 2006096327A JP 2006096327 A JP2006096327 A JP 2006096327A JP 4853083 B2 JP4853083 B2 JP 4853083B2
Authority
JP
Japan
Prior art keywords
data
disk device
stored
cache
confirmed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006096327A
Other languages
English (en)
Other versions
JP2007272493A (ja
Inventor
環 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006096327A priority Critical patent/JP4853083B2/ja
Publication of JP2007272493A publication Critical patent/JP2007272493A/ja
Application granted granted Critical
Publication of JP4853083B2 publication Critical patent/JP4853083B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、コンピュータシステム、並びに、そのデータの正常性確認方法、及びプログラムに関し、更に詳しくは、コンピュータシステムのディスク装置内に格納されたデータの正常性を確認する技術に関する。
サーバなどのコンピュータシステムでは、定期的に或いは必要に応じて、ディスク装置内に格納されたデータに破壊が生じていないかなど、データの正常性を確認している。ディスク装置内に格納されたデータが、圧縮データである場合には、CRCなどの手法によりそのデータの正常性確認が行われる。また、データが、バックアップファイルなどの場合には、CRCなどの手法の他に、現用データファイルとの照合によっても、その正常性が確認できる。データ正常性の確認手法は、例えば特許文献1に記載されている。
特開平10−254785号公報
ところで、近年のコンピュータシステムでは、外部から受信したデータや、コンピュータシステム内で作成されたデータは、ディスク装置内に格納されると同時に、キャッシュメモリにも格納されるのが通例となっている。日常的に起動及び停止が行われるコンピュータシステムでは、このキャッシュデータは、その停止のたびに消去される。しかし、例えばサーバ/クライアントシステムでサーバとして利用されるコンピュータシステムでは、キャッシュデータは、そのキャッシュメモリの容量やコンピュータシステムの動作頻度によっては、比較的長期にわたって残されることがある。このようなコンピュータシステムでは、以下のような問題が生じる。
図4は、この事情を説明するために、各処理ステップ及びデータの流れを模式的に示すブロック図である。同図において、サーバ10では、データを更新するデータ更新イベントが発生すると(ステップ1)、サーバ10は、メインメモリを構成するDIMMメモリ11上のデータを、内蔵するキャッシュメモリに格納した上で(ステップ2)、North-Bridge12に搭載されたメモリコントローラの処理により、I/O-Bridge13及びSCSIインターフェイス14を経由してディスク装置15内にデータを書き込む処理を行う。このとき、I/O-Bridge13の処理でデータ破壊が生じることがあり(ステップ3)、その場合には異常データが生成され(ステップ4)、ディスク装置内には異常データが格納される。この場合、キャッシュメモリに格納されたデータと、ディスク装置15に格納されたデータとの間に不整合が生じる。
その後、キャッシュメモリに格納されたデータが消去される前に、例えば定期的な正常性確認イベントが発生することがある。この正常性確認処理が、バックアップデータの正常性確認であるとすると、この正常性確認は例えばCRCエラー訂正を利用した誤り訂正という態様で行われる。コンピュータは、DIMMメモリ11内のキャッシュメモリに必要なデータが格納されていることを検出すると、ディスク装置15に格納されたバックアップデータに代えて、キャッシュメモリに格納されたバックアップデータで正常性確認を行う。この正常性確認では、異常データは発見されずに、“正常性確認OK”として終了する(ステップ5)。
その後、現用データファイルに異常が発見され、バックアップデータが必要になり、その時点でキャッシュデータが消去されていると、ディスク装置15からバックアップデータが読み出される。しかし、ディスク装置15に格納されているバックアップデータは、その書込みの時点で既に異常データとなっているため、例えばそのCRCエラー訂正で異常データであると判定される。このような場合には、現用データファイル及びバックアップファイルの双方が利用できず、正常なデータが存在しないため、大きなトラブルに発展する。
上記のように、従来のサーバ10におけるデータ正常性確認では、キャッシュデータを明示的にクリアすることなく、データ正常性確認を行っているため、ディスク装置15に生成/更新されたデータの正常性確認ではなく、DIMMメモリ上11のキャッシュデータの正常性確認が行われることがある。このため、I/O Bridge13などを経由する際にデータ破壊やデータ化けが発生した時には、ディスク装置15上のデータが異常であっても、DIMMメモリ上11のキャッシュデータは正常であるため、異常を検出することが出来ないという問題が潜在していた。
上記に鑑み、本発明は、キャッシュメモリを有するコンピュータシステムにおける正常性確認の際に、正しい手順でデータの正常性確認処理を行うことにより、正常性確認が正しく行われるコンピュータシステム、そのコンピュータシステムで実行されるデータ正常性確認方法、及び、プログラムを提供することを目的とする。
上記目的を達成するために、本発明の第1の観点に係るコンピュータシステムは、キャッシュメモリを備えるコンピュータシステムであって、
ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするキャッシュクリア部と、
前記キャッシュクリア部によるキャッシュデータのクリア後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するデータ読出し部と、
前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別する正常性確認処理部とを備えることを特徴とする。
また、本発明の第2の観点に係るデータ正常性確認方法は、キャッシュメモリを備えるコンピュータにおけるデータが破損しているか否かを判別するデータ正常性確認方法であって、
前記コンピュータが、ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするステップと、
前記コンピュータが、前記クリアステップ後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するステップと、
前記コンピュータが、前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別するステップとを有することを特徴とする。
更に、本発明の第3の観点に係るプログラムは、キャッシュメモリを備えるコンピュータに、
ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするステップと、
前記クリアステップ後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するステップと、
前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別するステップとを実行させることを特徴とする。
本発明のコンピュータシステム、データ正常性確認方法、及び、プログラムによると、ディスク装置に格納されたデータに異常があれば、その異常が検出されるので、従来技術で生じた不具合が生ずることはなく、正常性確認が正しく行われる。
正常性確認の対象データは、バックアップファイルであってもよく、或いは、他のいかなるデータであってもよい。また、正常性確認の対象データを格納するディスク装置は、コンピュータシステム内のディスク装置であってもよく、或いは、システム外のディスク装置であっても良い。
以下、図面を参照し、本発明の実施形態について詳細に説明する。図1は、本発明の一実施形態に係るコンピュータシステムで実行されるデータ保存処理を模式的に示すブロック図である。同図において、コンピュータシステム(サーバ)10は、メモリモジュール(DIMMメモリ)11、North-Bridge12、I/O-Bridge13、SCSIインターフェイス14、ディスク装置15を備えており、サーバとして一般的な構成を有する。
サーバ10は、データ更新イベントが発生すると(ステップ1)、DIMMメモリ11にあるデータを、DIMMメモリ11に内蔵されるキャッシュメモリに格納する(ステップ2)。次いで、サーバ10は、DIMMメモリ11上のデータをディスク装置15に格納する(ステップ3)。このデータ格納は、North-Bridge12に搭載されたメモリコントローラにより、I/O-Bridge13及びSCSIインターフェイス14を介してディスク装置15に書き込まれることで実行される。
図2は、図1で書き込まれたデータの正常性確認を行う際の処理を図1と同様に模式図で示している。正常性確認処理は、例えば定期的に発生する、CRCエラー訂正を指定する正常性確認イベントの発生で始まる(ステップ1)。正常性確認イベントは、専用のアプリケーションにより、例えばシステムコールを利用して、確認対象のデータに応じて定期的に発行される。サーバ10は、正常性確認イベントが発生すると、まず、キャッシュクリア処理部により、キャッシュメモリ内のデータを自動的にクリアする(ステップ2)。キャッシュクリア手順としては、例えばLINUIX/UNIX(登録商標)におけるシステムコールioctlなどのデバイス制御システムコールを使用し、ディスク装置15上に定義されたブロックデバイス単位でキャッシュデータをクリアする。
サーバ10は、次いでディスク装置15から必要なデータを読み出し、通常の正常性確認処理を行う。つまり、DIMMメモリ上11にキャッシュデータが存在しないため、正常性確認対象のデータは、データ読出し処理部により、ディスク装置15からSCSIインターフェイス14、I/O-Bridge13、及び、North-Bridge12を経由して読み出され、DIMMメモリ11上に新しくキャッシュされる(ステップ3)。サーバ10は、正常性確認処理部により、ディスク装置15上のデータに対する正常性確認を行う(ステップ4)。データ正常性確認の方法としては、CRCエラー訂正、パリティエラー訂正、エラー訂正サムなどによる方法が考えられる。なお、上記各処理部は、サーバ10内の記憶装置に記憶されたプログラムにより構成される。
以上のように、本発明に係るデータ正常性確認方法は、I/O-Bridge13などで生ずるおそれがあるデータ化けなどによるディスク装置15上のデータ異常を検出するために用いられる。この場合、サーバ10における各種データ生成処理で生成されたデータの正常性確認を実施することで、メモリーモジュール(DIMMメモリ)11からディスク装置15へのデータ転送時に発生するデータ化けを検出し、システム内に異常データが存在することを自動的に検出する。
上記実施形態では、サーバ10においては、致命的となり得るデータ異常発生を、自動的に早期検出することが可能になる。これにより、サーバ10が、提供するサービスに大きな影響を与えるような障害を抱えているにも拘わらず、その障害が検出できないという従来の問題点が解決される。特に、バックアップデータなどにデータ異常が発生した場合には、バックアップデータを実際に必要とする機会に遭遇した時に初めて異常が検出されるものであり、本発明の必要性は十分に高い。
特に、バックアップデータが必要な場合は、現用データに何らかの異常を抱えているケースが想定され、このような場合には、バックアップデータが破壊されていると、サービスを保証するためのデータがシステム内の何れにも存在しない状態になり、サービスへの影響が特に大きい。このため、本発明は、バックアップデータの正常性確認に特に有効である。
なお、図1及び2を参照した説明では、サーバ内のディスク装置15上へのデータ書き込みを例にしたが、外付けのディスク装置へのデータ正常性確認にも本発明を適用可能である。この例を、図3に示す。同図は、本発明に係るデータ正常性確認方法が、SCSIインターフェイス16を介して接続される外付けディスク装置17に格納されるデータにも適用可能である旨を示している。図3に示す構成は、外付けディスク装置17に格納されるデータについて、データ正常性確認処理が行われる以外には、図1及び図2を参照して説明した処理と同様な処理が行われる旨を示している。
以上、本発明をその好適な実施態様に基づいて説明したが、本発明のコンピュータシステム、データ正常性確認方法及びプログラムは、上記実施態様の構成にのみ限定されるものではなく、上記実施態様の構成から種々の修正及び変更を施したものも、本発明の範囲に含まれる。
本発明の一実施形態に係るサーバにおけるデータ保存処理を模式的に示すブロック図。 図1のサーバにおけるデータ正常性確認処理を模式的に示すブロック図。 本発明の変形例に係るサーバにおけるデータ正常性確認処理を示すブロック図。 従来のサーバにおけるデータ正常性確認処理を模式的に示すブロック図。
符号の説明
10:サーバ
11:DIMMメモリ
12:North-Bridge
13:I/O-Bridge
14、16:SCSIインターフェイス
15、17:ディスク装置

Claims (5)

  1. キャッシュメモリを備えるコンピュータシステムであって、
    ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするキャッシュクリア部と、
    前記キャッシュクリア部によるキャッシュデータのクリア後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するデータ読出し部と、
    前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別する正常性確認処理部とを備えることを特徴とするコンピュータシステム。
  2. 前記確認対象のデータがバックアップファイルである、請求項1に記載のコンピュータシステム。
  3. 前記ディスク装置がコンピュータシステム外に配設される外部記憶装置である、請求項1又は2に記載のコンピュータシステム。
  4. キャッシュメモリを備えるコンピュータにおけるデータが破損しているか否かを判別するデータ正常性確認方法であって、
    前記コンピュータが、ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするステップと、
    前記コンピュータが、前記クリアステップ後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するステップと、
    前記コンピュータが、前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別するステップとを有することを特徴とするデータ正常性確認方法。
  5. キャッシュメモリを備えるコンピュータに、
    ディスク装置に格納されている確認対象データが破損しているか否かを判別するときに、前記確認対象のデータに対応するキャッシュデータをクリアするステップと、
    前記クリアステップ後に、前記確認対象のデータを前記ディスク装置から読み出して前記キャッシュメモリに記憶するステップと、
    前記キャッシュメモリに記憶された前記確認対象のデータが破損しているか否かを判別することにより、前記ディスク装置に格納されている前記確認対象のデータが破損しているか否かを判別するステップとを実行させることを特徴とするプログラム。
JP2006096327A 2006-03-31 2006-03-31 コンピュータシステム、データ正常性確認方法、及び、プログラム Expired - Fee Related JP4853083B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006096327A JP4853083B2 (ja) 2006-03-31 2006-03-31 コンピュータシステム、データ正常性確認方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006096327A JP4853083B2 (ja) 2006-03-31 2006-03-31 コンピュータシステム、データ正常性確認方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2007272493A JP2007272493A (ja) 2007-10-18
JP4853083B2 true JP4853083B2 (ja) 2012-01-11

Family

ID=38675244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006096327A Expired - Fee Related JP4853083B2 (ja) 2006-03-31 2006-03-31 コンピュータシステム、データ正常性確認方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP4853083B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023085619A1 (ko) * 2021-11-15 2023-05-19 삼성전자주식회사 데이터베이스를 복구하는 전자 장치 및 그 동작 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04171550A (ja) * 1990-11-06 1992-06-18 Shikoku Nippon Denki Software Kk キャッシュメモリ
JPH0541050A (ja) * 1991-08-02 1993-02-19 Hitachi Electron Eng Co Ltd 位置決めサーボ情報の検証方法
JP2005258633A (ja) * 2004-03-10 2005-09-22 Hitachi Ltd ディスクアレイシステム及びハードディスクドライブの障害予測方法

Also Published As

Publication number Publication date
JP2007272493A (ja) 2007-10-18

Similar Documents

Publication Publication Date Title
JP4523639B2 (ja) ファームウェアによるメモリエラーアドレス管理
US8140940B2 (en) Method and apparatus for controlling memory
JP5183542B2 (ja) 計算機システム及び設定管理方法
US20150052385A1 (en) Implementing enhanced data caching and takeover of non-owned storage devices in dual storage device controller configuration with data in write cache
US7020805B2 (en) Efficient mechanisms for detecting phantom write errors
JP2014032516A (ja) ストレージ装置、制御装置およびデータ保護方法
JP4917604B2 (ja) 記憶装置構成およびその駆動方法
US7308601B2 (en) Program, method and apparatus for disk array control
JP4853083B2 (ja) コンピュータシステム、データ正常性確認方法、及び、プログラム
US20100169572A1 (en) Data storage method, apparatus and system for interrupted write recovery
US20120210067A1 (en) Mirroring device and mirroring recovery method
JP2007115162A (ja) データの二重保存方法
CN106599046B (zh) 分布式文件系统的写入方法及装置
JP4848533B2 (ja) ディスクアレイ装置、ディスクアレイ制御方法およびプログラム
WO2024113685A1 (zh) 一种raid阵列的数据恢复方法及相关装置
CN113448760B (zh) 一种硬盘异常状态的恢复方法、系统、设备以及介质
KR100922409B1 (ko) 정보 처리 장치 및 메모리 이상 감시 방법
JP2009086980A (ja) ロギングシステム
JP2007183808A (ja) 磁気ディスク装置
JP2007011839A (ja) メモリ管理方法及びメモリ管理システム
JP2005234855A (ja) 情報処理装置
JP2023104466A (ja) 車載電子制御装置、及びメモリ制御方法
JPS63178355A (ja) 制御プログラムフアイル破壊救済方式
CN115543595A (zh) 一种内存故障处理方法、装置、设备及可读存储介质
CN117744086A (zh) 一种写漏洞处理方法及电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110927

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111010

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4853083

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees