JP2007219846A - 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム - Google Patents

半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム Download PDF

Info

Publication number
JP2007219846A
JP2007219846A JP2006039796A JP2006039796A JP2007219846A JP 2007219846 A JP2007219846 A JP 2007219846A JP 2006039796 A JP2006039796 A JP 2006039796A JP 2006039796 A JP2006039796 A JP 2006039796A JP 2007219846 A JP2007219846 A JP 2007219846A
Authority
JP
Japan
Prior art keywords
disk device
semiconductor disk
abnormality
monitoring
semiconductor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006039796A
Other languages
English (en)
Inventor
Yoshihide Sato
嘉秀 佐藤
Takeshi Kamimura
健 上村
Norihiko Kuroishi
範彦 黒石
Seiji Suzuki
星児 鈴木
Shinobu Koseki
忍 小関
Masaru Kijima
勝 木島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006039796A priority Critical patent/JP2007219846A/ja
Publication of JP2007219846A publication Critical patent/JP2007219846A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】半導体ディスク装置内の異常発生による半導体ディスク装置やシステムの停止時間を最小限にすることができる半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システムを提供する。
【解決手段】この半導体ディスク装置1Aは、電源ユニット18や冷却ファンユニット19の駆動状況を内部モニタ14Aで監視し、その監視結果を常時不揮発性のEEPROM20に記録する。それらの箇所に異常が発生したことによりシステムが停止した場合には、記録された監視結果に基づいて故障原因を把握できるため、修理のために要する半導体ディスク装置1Aやシステムの停止時間を短縮することができる。
【選択図】図1

Description

本発明は、半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システムに関し、特に、異常発生の原因究明が容易となる半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システムに関する。
サーバなどのホストに接続して用いられる半導体ディスク装置においては、システム構成要素として、半導体メモリ、メモリコントローラ、外部インターフェース(I/F)の主要機能部の他に、電源ユニット、冷却ファン、バックアップ用ハードディスクドライブ(HDD)、無停電電源装置(UPS)等が付加されている。
半導体ディスク装置には、データエラーを起こさないという機器への高い信頼性が求められ、電源電圧変動、冷却ファンの停止、機器内部温度上昇、データ転送動作の異常等によって、処理データにエラーを発生させないようにしなければならない。これらのシステム要素において、冷却ファン停止や電源電圧変動の異常や故障が発生した時には、予め設けた内部動作モニタ機能によって検出される。
装置の異常或いは故障時に行われるデータのバックアップは、保存の為に不揮発性メモリに転送される必要があり、半導体ディスクとしてフラッシュEEPROMを使用している場合には、故障時点での保持或いはその一部に管理データを記録される方法、或いは、HDDを内蔵している場合には、HDDに転送されて記録される。
上述のような異常発生時にデータエラーの発生を防止するためには、様々な方法の考案及び実用化がされつつある(例えば、特許文献1参照。)。
上述した特許文献1に記載のデータ保護方法は、電力異常を検出した時点で直ちに予備電源から揮発性メモリ等に電力を供給し、電力が所定時間内に回復しない場合に揮発性メモリから不揮発性メモリへ転送している。
特開平5−204779号公報(段落[0025]、図1)
しかし、従来のデータ保護方法では、検出する異常が電力異常に限られているため、装置の温度上昇などを原因とするトラブルには対応していない。また、トラブル発生時におけるログ記録も行っていないため、トラブル発生時の状況を即座に解析することもできない。
したがって、半導体ディスク装置内の異常発生による半導体ディスク装置やシステムの停止時間を最小限にすることができる半導体ディスク装置の異常監視・記録方法、プログラム、および半導体ディスク装置を提供することを目的とする。
本発明の一態様は、上記目的を達成するため、以下の半導体ディスク装置の異常監視・記録方法、プログラム、および半導体ディスク装置を提供する。
[1]半導体ディスク装置内の状態を監視する監視ステップと、前記監視結果から半導体ディスク装置内の異常を検出する検出ステップと、前記異常を検出したとき、その異常検出結果を記録する記録ステップとを含むことを特徴とする半導体ディスク装置の異常監視・記録方法。
上記構成の半導体ディスク装置の異常監視・記録方法によれば、半導体ディスク装置内で異常が発生した場合に、異常が検出され、その異常検出結果が記録されるので、異常発生の原因究明が容易となり、半導体ディスク装置やシステムの停止時間を最小限にすることができる。
[2]前記記録ステップは、前記監視ステップによる監視結果を連続的に記録し、前記異常を検出したとき、前記監視結果の記録を停止するものである前記[1]に記載の半導体ディスク装置の異常監視・記録方法。この構成によれば、記録停止の直前の監視結果を調べることにより、異常発生の原因を究明することが可能となる。
[3]前記記録ステップは、前記異常検出結果を不揮発性メモリに記録するものである前記[1]に記載の半導体ディスク装置の異常監視・記録方法。この構成によれば、電源が遮断されても、不揮発性メモリの記録内容が保持される。
[4]前記監視ステップは、電源電圧変動、および冷却ファン停止または装置内温度上昇を監視対象とするものである前記[1]に記載の半導体ディスク装置の異常監視・記録方法。この構成によれば、電源異常のみならず、温度異常についても検出することができる。
[5]前記検出ステップは、前記異常を検出したとき、半導体ディスク装置の駆動停止、半導体ディスク装置内の半導体メモリへのデータの書込み動作の中断等の処理を行う処理ステップを含むことを特徴とする前記[1]に記載の半導体ディスク装置の異常監視・記録方法。この構成によれば、データエラーの発生を抑制することができる。
[6]前記[1]乃至[5]のいずれか1に記載の半導体ディスク装置の異常監視・記録方法の各ステップをコンピュータに実行させるためのプログラム。
上記構成のプログラムによれば、半導体ディスク装置内で異常が発生した場合に、異常が検出され、その異常検出結果が記録されるので、異常発生の原因究明が容易となり、半導体ディスク装置やシステムの停止時間を最小限にすることができる。また、ステップの変更、追加、削除を簡単に行うことができる。
[7] データが書き込まれる半導体メモリと、本装置内の状態を監視するとともに、前記監視結果から本装置内の異常を検出する監視部と、前記監視部が異常を検出したとき、その異常検出結果が記録される異常検出結果記録部とを備えたことを特徴とする半導体ディスク装置。
上記構成の半導体ディスク装置によれば、半導体ディスク装置内で異常が発生した場合に、異常が検出され、その異常検出結果が記録されるので、異常発生の原因究明が容易となり、半導体ディスク装置やシステムの停止時間を最小限にすることができる。
[8]前記異常検出結果記録部は、不揮発性メモリであることを特徴とする前記[7]に記載の半導体ディスク装置。この構成によれば、電源が遮断されても、不揮発性メモリの記録内容が保持される。
[9]前記監視部は、電源電圧変動、および冷却ファン停止または装置内温度上昇を監視対象とするものである前記[7]に記載の半導体ディスク装置。この構成によれば、電源異常のみならず、温度異常についても検出することができる。
[10]前記異常検出結果記録部は、前記監視部に接続された不揮発性メモリであることを特徴とする前記[7]に記載の半導体ディスク装置。
[11]前記監視部は、前記監視部のみの制御を行う監視用CPUによって制御されることを特徴とする前記[10]に記載の半導体ディスク装置。この構成によれば、異常が発生した場合にそれを直ちに記録することが可能となる。
[12]前記監視部が異常を検出したとき、本装置の駆動停止、前記半導体メモリへの書込み動作の中断等の処理を行う制御手段を備えたことを特徴とする前記[7]に記載の半導体ディスク装置。この構成によれば、データエラーの発生を抑制することができる。
[13]前記制御手段は、前記半導体メモリを制御する揮発性のFPGA(Field Programmable Gate Array)を備え、前記異常検出結果記録部は、前記FPGA内に設けられたブロックRAMであることを特徴とする前記[12]に記載の半導体ディスク装置。この構成によれば、半導体ディスク装置がFPGAを備えていれば、異常検出結果を記録するために、EEPROM等のメモリを新たに設ける必要がない。
[14]前記異常検出結果記録部は、前記FPGAに接続され、前記FPGA用のプログラムを記憶する不揮発性のプログラムメモリであり、前記制御手段は、前記異常検出結果をブロックRAMに記録した後、前記異常検出結果を所定のタイミングで前記プログラムメモリに転送することを特徴とする前記[13]に記載の半導体ディスク装置。この構成によれば、半導体ディスク装置がFPGAとプログラムメモリを備えていれば、異常検出結果を記録するために、EEPROM等のメモリを新たに設ける必要がない。
[15]前記半導体メモリは、光バスを介してデータが書き込まれることを特徴とする前記[7]に記載の半導体ディスク装置。この構成によれば、耐ノイズ性が向上し、高速データ転送が可能となる。
[16]ホスト装置に接続された半導体ディスク装置と、前記ホスト装置に直接あるいはネットワークを介して接続された記憶装置とを有する記憶システムにおいて、前記半導体ディスク装置は、本装置内の状態を監視するとともに、前記監視結果から本装置内の異常を検出する監視部と、前記監視部が異常を検出したとき、その異常検出結果を前記記憶装置に記憶させる制御手段とを備えたことを特徴とする記憶システム。
上記構成の記憶システムによれば、半導体ディスク装置内で異常が発生した場合に、異常が検出され、その異常検出結果が半導体ディスク装置以外の記憶装置に記録されるので、異常発生の原因究明が容易となり、半導体ディスク装置やシステムの停止時間を最小限にすることができる。
[17]前記半導体ディスク装置は、揮発性メモリを備え、前記記憶装置は、不揮発性メモリを備え、前記制御手段は、前記異常検出結果を前記揮発性メモリに記録した後、前記揮発性メモリに記録した前記異常検出結果を所定のタイミングで前記不揮発性メモリに転送することを特徴とする前記[16]に記載の記憶システム。この構成によれば、半導体ディスク装置が異常検出結果を記録するメモリとして、不揮発性メモリを備えていない場合でも、外部の不揮発性メモリを利用することができる。
本発明によれば、異常検出結果が記録されるので、半導体ディスク装置内の異常発生による半導体ディスク装置やシステムの停止時間を最小限にすることができる。
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る記憶システムの構成を示すブロック図である。この記憶システム100は、ホスト2を有し、このホスト2に、半導体ディスク装置1Aおよび外部ストレージ3を直接接続し、ネットワーク5を経由でネットワークストレージ4を接続して構成されている。
ホスト2は、例えば、サーバ、パーソナルコンピュータ(PC)、ワークステーション(WS)等であり、データ処理やデータの保存を行う。
外部ストレージ3及びネットワークストレージ4は、共にデータを格納するものであるが、外部ストレージ3は、ホスト2にローカルに直接接続されているため、ホスト2専用のストレージであるのに対し、ネットワークストレージ4は、ネットワーク5に接続する機器間で共有されるストレージである。
半導体ディスク装置1Aは、インターフェース部11A、メモリコントローラ16A、半導体メモリ17、電源ユニット18、冷却ファンユニット19及びEEPROM20からなる。
インターフェース部11Aは、外部インターフェース(I/F)12、内部制御回路13、内部モニタ14A及びログ書き込み部15からなる。
外部I/F12は、ホスト2と接続することにより半導体メモリ17に格納されるデータの入出力を行う。
内部制御回路13は、内部モニタ14Aやメモリコントローラ16Aからの異常状態情報を受けて、半導体ディスク装置1Aや記憶システム100の停止等の判断を行って実行する。
内部モニタ14Aは、電源ユニット18から供給される電源電圧や冷却ファンユニット19の停止、各部の温度上昇などに対する異常検出機能を有する。
ログ書き込み部15は、内部モニタ14Aによる監視結果をEEPROM20に対して書き込みを行う。
メモリコントローラ16Aは、インターフェース部11及び半導体メモリ17と接続しており、半導体メモリ17に対するリード/ライト制御及び外部I/F12との通信を行う。
半導体メモリ17は、インターフェース部11を介してホスト2から受信したデータ等の格納を行う。
電源ユニット18は、図示しないAC電源と接続し、半導体ディスク装置1Aの各構成部に電源を供給する。
冷却ファンユニット19は、半導体ディスク装置1Aの各構成部のうち、駆動により発熱するものの冷却を行うために空冷を行う。
EEPROM20は、内部モニタ14Aによる各構成部の異常検出の監視結果を常時記録する。
(第1の実施の形態の動作)
次に、第1の実施の形態に係る記憶システム100の動作について説明する。半導体ディスク装置1Aのメモリコントローラ16Aは、ホスト2からインターフェース部11Aの外部I/F12を介してデータを受信すると、そのデータを半導体メモリ17に格納する。また、メモリコントローラ16Aは、ホスト2から外部I/F12を介してデータの送信要求があると、該当するデータを半導体メモリ17から読み出し、外部I/F12を介してホスト2に送信する。
半導体ディスク装置1Aの駆動時には、電源ユニット18から各構成部に電力が供給される。また、各構成部は駆動により発熱するため、これを放置すると機能低下や機能停止等を起こす可能性があるため、冷却ファンユニット19が各構成部の冷却を行っている。
半導体ディスク装置1Aは、ホスト2との間でデータの格納および読み出しを行うため、その駆動には高度の信頼性が求められる。従って、データの破損や消滅を回避する必要があり、データの書き込みおよび読み出し、ホスト2との通信時におけるトラブルを避ける必要がある。
トラブルの原因として主として想定されるものは、電圧異常や、装置内温度の変化等である。電源ユニット18に異常が生ずると、各構成部に供給される電圧が変動したり、電力供給が停止するなどの事態が生じ、データの破損や消滅が生じるおそれがある。また、冷却ファンユニット19に異常が生ずると、発熱した各構成部の冷却を行うことができず、高熱により各構成部が機能低下又は機能停止を起こし、データの破損や消滅が生じるおそれがある。
そこで、内部モニタ14Aにおいて、電源ユニット18及び冷却ファンユニット19の駆動状況を常時監視しており、ログ書き込み部15は、内部モニタ14Aによる監視結果をログとして、異常の有無にかかわらず、常にEEPROM20に格納している。なお、EEPROM20は、その記憶容量により、監視結果を連続して一定時間以上記録することができないため、その都度最も古いデータから消去し、新たなデータが書き込まれる。
内部モニタ14が、上記の如き異常を検出した場合には、その異常検出結果を内部制御回路13に通知する。内部制御回路13は、その異常検出結果に応じて、半導体メモリ17へのデータ書き込みの中止や、半導体メモリ17内のデータの退避、半導体ディスク装置1A自体の駆動の停止等、適切な処理を行うことにより、データの破壊や消滅を防止する。
半導体ディスク装置1Aの駆動が停止すると、EEPROM20への新たな監視結果の書き込みはなされないので、異常発生時の監視結果のデータは消去されることなく保存されている。そのため、ユーザは、半導体ディスク装置1Aの停止原因となった異常がどの構成部のトラブルによって生じたかについて、EEPROM20に格納されたデータより知ることができる。
(第1の実施の形態の効果)
上述した第1の実施の形態によれば、内部モニタ14Aによる電源ユニット18及び冷却ファンユニット19の監視結果が常に不揮発性のEEPROM20に格納され、異常発生時にはその直前の監視結果が保存されるので、トラブルの原因究明が容易となる。また、トラブルの原因究明が容易となることで、修理等による復旧に要する時間が短縮されるので、システム停止時間の短縮が可能となる。
[第2の実施の形態]
図2は、本発明の第2の実施の形態に係る記憶システムの構成を示すブロック図である。この記憶システム100は、第1の実施の形態と同様に、ホスト2を有し、このホスト2に、半導体ディスク装置1Bおよび外部ストレージ3を直接接続し、ネットワーク5を経由でネットワークストレージ4を接続して構成されている。
図2に示す半導体ディスク装置1Bは、図1に示す半導体ディスク装置1Aと比較して、メモリコントローラとしてFPGA(Field Programmable Gate Array)16Bを利用している点、ログ書き込み部15及びEEPROM20を備えていない点、並びにPROM21を備える点において異なり、その他の点は共通する。
半導体ディスク装置1Bは、インターフェース部11B、FPGA16B、半導体メモリ17、電源ユニット18、冷却ファンユニット19及びPROM21からなる。インターフェース部11Bは、更に外部インターフェース(I/F)12、内部制御回路13及び内部モニタ14Aからなる。
FPGA16Bは、インターフェース部11B及び半導体メモリ17と接続しており、図1におけるメモリコントローラ16Aと同様に、半導体メモリ17に対するリード/ライト制御及び外部I/F12との通信を行う。
また、FPGA16Bは、論理セルブロック161、ブロックRAM162及びI/O163,164より構成されている。論理セルブロック161は、FPGA16Bにおけるプログラムを実行するための論理回路部である。ブロックRAM162は、プログラムの実行に際し、変数やデータの一時的な格納を行うためのメモリ回路部である。また、I/O163,164は、それぞれインターフェース部11B及び半導体メモリ17との間におけるデータの送受信を行うものである。
PROM21は、FPGA16と接続されており、FPGA16の内部回路を構成するためのデータを格納する。
(第2の実施の形態の動作)
次に、第2の実施の形態の記憶システム100の動作について説明する。半導体ディスク装置1BのFPGA16Bは、ホスト2からインタフェース11Bの外部I/F12を介してデータを受信すると、そのデータを半導体メモリ17に格納する。また、FPGA16Bは、ホスト2から外部I/F12を介してデータの送信要求があると、該当するデータを半導体メモリ17から読み出し、外部I/F12を介してホスト2に送信する。
半導体ディスク装置1Bの駆動時には、電源ユニット18から各構成部に電力が供給される。また、各構成部は駆動により発熱するため、これを放置すると機能低下や機能停止等を起こす可能性があるため、冷却ファンユニット19が各構成部の冷却を行っている。
半導体ディスク装置1Bは、特にデータ書き込み中等のトラブルを避ける必要があり、トラブルの原因として主として想定される電圧異常や、装置内温度の変化等を防止する必要があるので、内部モニタ14Aにおいて、電源ユニット18及び冷却ファンユニット19の駆動状況を常時監視している。
内部モニタ14による監視結果は、異常の有無にかかわらず、常にFPGA16Bに送信され、ブロックRAM162にログとして記録される。なお、ブロックRAM162の記憶容量には制限があり、更にはFPGA16Bの駆動のためには一定容量の空き領域を確保する必要があるので、一定時間以上の監視結果を記録することができない。従って、その都度最も古いデータから消去し、新たなデータが書き込まれることになる。
内部モニタ14Aが、上記の如き異常を検出した場合には、その異常検出結果を内部制御回路13に通知する。内部制御回路13は、その異常検出結果に応じて、半導体メモリ17へのデータ書き込みの中止や、半導体メモリ17内のデータの退避、半導体ディスク装置1B自体の駆動の停止等、適切な処理を行うことにより、データの破壊や消滅を防止する。
半導体ディスク装置1Bの駆動が停止すると、ブロックRAM162は揮発性の記憶装置であるので、このままでは書き込まれたログが消去されてしまうことになる。そこで、半導体ディスク装置1Bの停止前に、外部I/F11を介して、ホスト2に接続された外部ストレージ3又はネットワークストレージ4に当該ログを転送する。これにより異常発生時の監視結果のデータは消去されることなく保存することができ、ユーザは半導体ディスク装置1Bの停止原因となった異常がどの構成部のトラブルによって生じたかについて、外部ストレージ3又はネットワークストレージ4に格納されたログデータより知ることができる。
(第2の実施の形態の効果)
上述した第2の実施の形態によれば、内部モニタ14Aによる電源ユニット18及び冷却ファンユニット19の監視結果が常にブロックRAM162に格納され、異常発生時にはそのログが外部ストレージ3等に保存されるので、トラブルの原因究明が容易となる。また、トラブルの原因究明が容易となることで、修理等による復旧に要する時間が短縮されるので、システム停止時間の短縮が可能となる。さらに、EEPROM等の新たな構成部を必要としないので、FPGAを備える半導体ディスク装置であれば、既存の構成のままログを保存することが可能となる。
[第3の実施の形態]
次に、本発明の第3の実施の形態に係る記憶システムについて説明する。本実施の形態は、半導体ディスク装置1BのFPGA16Bのみが第2の実施の形態と異なり、他は第2の実施の形態と同様に構成されている。記憶システム100および半導体ディスク装置1Bの構成図は、図2と同様であるので、図示を省略する。
本実施の形態のFPGA16Bは、半導体ディスク装置1Bの停止前に、ブロックRAM162に書き込まれているログをPROM21に転送するように構成されている。
(第3の実施の形態の動作)
次に、第3の実施の形態に係る記憶システム100の動作について説明する。第2の実施の形態と同様に、半導体ディスク装置1Bは、内部モニタ14Aにおいて、電源ユニット18及び冷却ファンユニット19の駆動状況の監視を行う。そして、内部モニタ14Aによる監視結果については、異常の有無にかかわらず、常にFPGA16Bに送信され、ブロックRAM162にログが記録される。
内部モニタ14Aが、異常を検出した場合には、その異常検出結果を内部制御回路13に通知し、内部制御回路13は、その異常検出結果に応じて、半導体メモリ17へのデータ書き込みの中止や、半導体メモリ17内のデータの退避、半導体ディスク装置1B自体の駆動の停止等、適切な処理を行うことにより、データの破壊や消滅を防止する。
半導体ディスク装置1Bの駆動が停止すると、ブロックRAM162は揮発性の記憶装置であるので、このままでは書き込まれたログが消去されてしまうことになる。そこで、半導体ディスク装置1Bの停止前に、FPGA16Bに接続されたPROM21に当該ログを転送する。これにより異常発生時の監視結果のデータは消去されることなく保存することができ、ユーザは半導体ディスク装置1Bの停止原因となった異常がどの構成部のトラブルによって生じたかについて、PROM21に格納されたログデータより知ることができる。
(第3の実施の形態の効果)
上述した第3の実施の形態によれば、内部モニタ14Aによる電源ユニット18及び冷却ファンユニット19の監視結果が常にブロックRAM162に格納され、異常発生時にはその直前の監視結果が不揮発性のPROM21に保存されるので、トラブルの原因究明が容易となる。また、トラブルの原因究明が容易となることで、修理等による復旧に要する時間が短縮されるので、システム停止時間の短縮が可能となる。さらに、EEPROM等の新たな構成部を必要としないので、FPGAを備える半導体ディスク装置であれば、既存の構成のままログを保存することが可能となる。
[第4の実施の形態]
図3は、本発明の第4の実施の形態に係る記憶システムの構成を示すブロック図である。
本実施の形態の半導体ディスク装置1Cは、図1に示す半導体ディスク装置1Aと比較して、ログ書き込み部15及びEEPROM20を備えていない点、温度センサ22を備える点、及びネットワーク5上に他の半導体ディスク装置1Dが接続されている点において異なり、その他の点は共通する。
他の半導体ディスク装置1Dとして、例えば、図1に示す半導体ディスク装置1Aと同様にEEPROM20を備えたものを用いることができる。なお、他の半導体ディスク装置として、半導体ディスク装置1Bを用い、監視結果をPROM21に記憶するようにしてもよい。
半導体ディスク装置1Cは、第1の実施の形態と同様に、ホスト2と接続されており、ホスト2は、更に外部ストレージ3をローカルに接続し、ネットワークストレージ4をネットワーク5経由で接続している。
半導体ディスク装置1Cは、インターフェース部11B、メモリコントローラ16A、半導体メモリ17、電源ユニット18、冷却ファンユニット19及び温度センサ22からなる。インターフェース部11Bは、外部インターフェース(I/F)12、内部制御回路13及び内部モニタ14Aからなる。温度センサ22は半導体ディスク装置1Cの各構成部の温度を計測する。
(第4の実施の形態の動作)
次に、第4の実施の形態に係る記憶システム100の動作について説明する。半導体ディスク装置1Dのメモリコントローラ16Aは、ホスト2からインターフェース11Bの外部I/F12を介してデータを受信すると、そのデータを半導体メモリ17に格納する。また、メモリコントローラ16Aは、ホスト2から外部I/F12を介してデータの送信要求があると、該当するデータを半導体メモリ17から読み出し、外部I/F12を介してホスト2に送信する。
半導体ディスク装置1Cの駆動時には、電源ユニット18から各構成部に電力が供給される。また、各構成部は駆動により発熱するため、これを放置すると機能低下や機能停止等を起こす可能性があるため、冷却ファンユニット19が各構成部の冷却を行っている。更に、各構成部の発熱状況を監視するため、温度センサ22が、各構成部の温度を測定している。
半導体ディスク装置1Cは、特にデータ書き込み中等のトラブルを避ける必要があり、トラブルの原因として主として想定される電圧異常や、機器内温度の変化等を防止する必要があるので、内部モニタ14Aにおいて、電源ユニット18、冷却ファンユニット19の駆動状況及び温度センサ22による温度の測定結果の監視を行っている。
内部モニタ14Aによる監視結果は、適宜外部I/F12を介してホスト2へ送信され、更にネットワーク5を介して接続された他の半導体ディスク装置1Dへ送信され、半導体ディスク装置1D内のEEPROM20に記憶される。
内部モニタ14Aが、上記の如き異常を検出した場合には、異常検出結果を内部制御回路13に送信する。内部制御回路13は、その異常検出結果に応じて、半導体メモリ17へのデータ書き込みの中止や、半導体メモリ17内のデータの退避、半導体ディスク装置1C自体の駆動の停止等、適切な処理を行うことにより、データの破壊や消滅を防止する。
半導体ディスク装置1Cの駆動が停止すると、新たな監視結果の書き込みはなされないので、異常発生時の監視結果のデータは消去されることなく保存されている。そのため、ユーザは、半導体ディスク装置1Cの停止原因となった異常がどの構成部のトラブルによって生じたかについて、半導体ディスク装置1DのEEPROM20に格納されたデータより知ることができる。
(第4の実施の形態の効果)
上述した第4の実施の形態によれば、内部モニタ14Aによる電源ユニット18及び冷却ファンユニット19の監視結果が常に半導体ディスク装置1Dの不揮発性のEEPROM20に格納され、異常発生時にはその直前の監視結果が保存されるので、トラブルの原因究明が容易となる。また、トラブルの原因究明が容易となることで、修理等による復旧に要する時間が短縮されるので、システム停止時間の短縮が可能となる。
[第5の実施の形態]
図4は、本発明の第5の実施の形態に係る記憶システムの構成を示すブロック図である。本実施の形態の半導体ディスク装置1Eは、図1に示す半導体ディスク装置1Aと比較して、異常監視専用のCPU23を備え、内部モニタ14Bがインターフェース部11Cから独立してCPU23と接続しており、EEPROM20が内部モニタ14Bと接続されている点において異なり、その他の点は共通する。
半導体ディスク装置1Eは、第1の実施の形態と同様に、ホスト2と接続されており、ホスト2は、更に外部ストレージ3をローカルに接続し、ネットワークストレージ4をネットワーク5経由で接続している。
半導体ディスク装置1Eは、インターフェース部11C、内部モニタ14B、メモリコントローラ16A、半導体メモリ17、電源ユニット18、冷却ファンユニット19、EEPROM20及びCPU23からなる。インターフェース部11Bは、外部インターフェース(I/F)12及び内部制御回路13からなる。
CPU23は、内部制御回路13からは独立して、電源ユニット18及び冷却ファンユニット19の異常監視のみの制御を行う。監視結果に異常が見られた場合には、インターフェース部11に対して通信を行うことができる。
内部モニタ14Bは、CPU23の制御により、電源ユニット18から供給される電源電圧や冷却ファンユニット19の停止、各部の温度上昇などに対する異常検出を行う。その結果は、EEPROM20に常時記録すると共に、異常を検出した場合にはその結果がCPU23に送信される。
(第5の実施の形態の動作)
次に、第5の実施の形態の記憶システム100の動作について説明する。外半導体ディスク装置1Eのメモリコントローラ16Aは、ホスト2からインターフェース部11CのI/F12を介してデータを受信すると、そのデータを半導体メモリ17に格納する。また、メモリコントローラ16Aは、ホスト2からI/F12を介してデータの送信要求があると、該当するデータを半導体メモリ17から読み出し、外部I/F12を介してホスト2に送信する。
半導体ディスク装置1Eの駆動時には、電源ユニット18から各構成部に電力が供給される。また、各構成部は駆動により発熱するため、これを放置すると機能低下や機能停止等を起こす可能性があるため、冷却ファンユニット19が各構成部の冷却を行っている。
半導体ディスク装置1Eは、特にデータ書き込み中等のトラブルを避ける必要があり、トラブルの原因として主として想定される電圧異常や、機器内温度の変化等を防止する必要があるので、内部モニタ14Bにおいて、電源ユニット18及び冷却ファンユニット19の駆動状況の監視を行っている。
内部モニタ14Bによる監視結果は、異常の有無にかかわらず、常にEEPROM20にログとして記録される。なお、EEPROM20の記憶容量には制限があるので、一定時間以上の監視結果を記録することができない。従って、その都度最も古いデータから消去し、新たなデータが書き込まれることになる。
内部モニタ14Bが、上記の如き異常を検出した場合には、異常検出結果をCPU23に通知する。当該異常検出結果を受信したCPU23は、更に内部制御回路13にそれを通知する。内部制御回路13は、その異常検出結果に応じて、半導体メモリ17へのデータ書き込みの中止や、半導体メモリ17内のデータの退避、半導体ディスク装置1E自体の駆動の停止等、適切な処理を行うことにより、データの破壊や消滅を防止する。
半導体ディスク装置1Eの駆動が停止すると、EEPROM20への新たな監視結果の書き込みはなされないので、以上発生時の監視結果のデータは消去されることなく保存されている。そのため、ユーザは、半導体ディスク装置1Eの停止原因となった異常がどの構成部のトラブルによって生じたかについて、EEPROM20に格納されたデータより知ることができることになる。
(第5の実施の形態の効果)
上述した第5の実施の形態によれば、内部モニタ14Bによる電源ユニット18及び冷却ファンユニット19の監視結果が常に不揮発性のEEPROM20に格納され、異常発生時にはその直前の監視結果が保存されるので、トラブルの原因究明が容易となる。また、異常監視用のCPU23が半導体ディスク装置1E本体の制御部から独立して設けられているので、本体制御部に異常が生じた際にもログの保存に影響を及びにくくすることができる。また、トラブルの原因究明が容易となることで、修理等による復旧に要する時間が短縮されるので、システム停止時間の短縮が可能となる。
[第6の実施の形態]
図5は、本発明の第6の実施の形態に係る半導体ディスク装置の構成の一部を示すブロック図である。本実施の形態の半導体ディスク装置1Fは、図1に示す半導体ディスク装置1Aと比較して、メモリコントローラ16Aと半導体メモリ17(17a〜17d)との間が光バスによって接続されている点を除き、同一の構成をしている。図5においてはメモリコントローラ16Aと半導体メモリ17(17a〜17d)との間の接続部分のみを記載し、その他の部分は省略する。
半導体メモリ17(17a〜17d)は、前後に光/電気変換部(O/E)171(171a〜171d)、および電気/光変換部(E/O)172(172a〜172d)を設けている。メモリコントローラ16Aと半導体メモリ17のO/E171との間には、電気/光変換部(E/O)24および光分岐部25が設けられ、メモリコントローラ16Aと半導体メモリ17のE/O172との間には、光合成部26及び光/電気変換部(O/E)27が設けられている。なお、メモリコントローラ16Aと半導体メモリ17との間の接続の光バスは、いずれか一方を電気的に伝送する方法でも可能である。
光分岐部25は、例えば、入射側に1本の光ファイバを配置し、出射側に4本の光ファイバを配置し、入射側の光ファイバと出射側の光ファイバ間をシート状の光導波路によって光学的に結合し、光分岐を行う構成を用いることができる。
光合波部26は、例えば、入射側に4本の光ファイバを配置し、出射側に1本の光ファイバを配置し、入射側の光ファイバと出射側の光ファイバ間をシート状の光導波路によって光学的に結合し、光合波を行う構成を用いることができる。
(第6の実施の形態の動作)
上記のように構成された第6の実施の形態において、メモリコントローラ16Aから半導体メモリ17へ送信されるデータは、電気信号としてE/O24へ送信される。E/O24において当該電気信号が光信号へと変換され、光分岐部25へ送られる。光分岐部25では、E/O24からの光信号が半導体メモリ17の数に対応して分岐され、O/E171にて電気信号に変換された後、対応する半導体メモリ17にデータが格納される。
一方、半導体メモリ17からメモリコントローラ16Aへ送信されるデータは、E/O172にて光信号に変換された後、光合成部26へ送信される。光合成部26では、複数の光信号を合成してO/E27に出力する。O/E27は、出力された光信号を電気信号に変換した後、メモリコントローラ16Aに送信する。
(第6の実施の形態の効果)
上述した第6の実施の形態によれば、第1の実施の形態と同様にデータ転送過程の一部に故障が生じた場合にその箇所の特定が容易となり、その結果をログとして記録することができるので、修理に要する時間を短縮し、システム停止時間を削減することが可能となる。また、耐ノイズ性が向上し、高速データ転送が可能となる。
なお、本実施の形態は、図2以降で示すいずれの半導体ディスク装置にも適用可能である。また、図5においては半導体メモリ17の数は4個とされているが、本発明の実施の形態の一例に過ぎず、半導体メモリ17の数に制限はない。
なお、本発明は、上記各実施の形態に限定されず、その要旨を変更しない範囲内で種々変形実施が可能である。また、上記各実施の形態の構成要素を発明の要旨を変更しない範囲内で任意に組み合わせることができる。
本発明の第1の実施の形態に係る記憶システムの構成を示すブロック図である。 本発明の第2の実施の形態に係る記憶システムの構成を示すブロック図である。 本発明の第4の実施の形態に係る記憶システムの構成を示すブロック図である。 本発明の第5の実施の形態に係る記憶システムの構成を示すブロック図である。 本発明の第6の実施の形態に係る記憶システムの構成の一部を示すブロック図である。
符号の説明
1A〜1F、半導体ディスク装置 2、ホスト 3、外部ストレージ
4、ネットワークストレージ 5、ネットワーク 11A〜11C、インターフェース部
12、外部I/F 13、内部制御回路 14A〜14B、内部モニタ
15、ログ書込み部 16A、メモリコントローラ 16B、FPGA
17、17a〜17d、半導体メモリ 18、電源ユニット 19、冷却ファンユニット
20、EEPROM 21、PROM 22、温度センサ 23、CPU
24、E/O 25、光分岐部 26、光合成部 27、O/E 100、記憶システム
161、論理セルブロック 162、ブロックRAM
163、164、I/O 171、171a〜171d、光/電気変換部(O/E)
172、172a〜172d 電気/光変換部(E/O)

Claims (17)

  1. 半導体ディスク装置内の状態を監視する監視ステップと、
    前記監視結果から半導体ディスク装置内の異常を検出する検出ステップと、
    前記異常を検出したとき、その異常検出結果を記録する記録ステップとを含むことを特徴とする半導体ディスク装置の異常監視・記録方法。
  2. 前記記録ステップは、前記監視ステップによる監視結果を連続的に記録し、前記異常を検出したとき、前記監視結果の記録を停止するものである請求項1に記載の半導体ディスク装置の異常監視・記録方法。
  3. 前記記録ステップは、前記異常検出結果を不揮発性メモリに記録するものである請求項1に記載の半導体ディスク装置の異常監視・記録方法。
  4. 前記監視ステップは、電源電圧変動、および冷却ファン停止または装置内温度上昇を監視対象とするものである請求項1に記載の半導体ディスク装置の異常監視・記録方法。
  5. 前記検出ステップは、前記異常を検出したとき、半導体ディスク装置の駆動停止、半導体ディスク装置内の半導体メモリへのデータの書込み動作の中断等の処理を行う処理ステップを含むことを特徴とする請求項1に記載の半導体ディスク装置の異常監視・記録方法。
  6. 請求項1乃至5のいずれか1項に記載の半導体ディスク装置の異常監視・記録方法の各ステップをコンピュータに実行させるためのプログラム。
  7. データが書き込まれる半導体メモリと、
    本装置内の状態を監視するとともに、前記監視結果から本装置内の異常を検出する監視部と、
    前記監視部が異常を検出したとき、その異常検出結果が記録される異常検出結果記録部とを備えたことを特徴とする半導体ディスク装置。
  8. 前記異常検出結果記録部は、不揮発性メモリであることを特徴とする請求項7に記載の半導体ディスク装置。
  9. 前記監視部は、電源電圧変動、および冷却ファン停止または装置内温度上昇を監視対象とするものである請求項7に記載の半導体ディスク装置。
  10. 前記異常検出結果記録部は、前記監視部に接続された不揮発性メモリであることを特徴とする請求項7に記載の半導体ディスク装置。
  11. 前記監視部は、前記監視部のみの制御を行う監視用CPUによって制御されることを特徴とする請求項10に記載の半導体ディスク装置。
  12. 前記監視部が異常を検出したとき、本装置の駆動停止、前記半導体メモリへの書込み動作の中断等の処理を行う制御手段を備えたことを特徴とする請求項7に記載の半導体ディスク装置。
  13. 前記制御手段は、前記半導体メモリを制御する揮発性のFPGA(Field Programmable Gate Array)を備え、
    前記異常検出結果記録部は、前記FPGA内に設けられたブロックRAMであることを特徴とする請求項12に記載の半導体ディスク装置。
  14. 前記異常検出結果記録部は、前記FPGAに接続され、前記FPGA用のプログラムを記憶する不揮発性のプログラムメモリであり、
    前記制御手段は、前記異常検出結果をブロックRAMに記録した後、前記異常検出結果を所定のタイミングで前記プログラムメモリに転送することを特徴とする請求項13に記載の半導体ディスク装置。
  15. 前記半導体メモリは、光バスを介してデータが書き込まれることを特徴とする請求項7に記載の半導体ディスク装置。
  16. ホスト装置に接続された半導体ディスク装置と、前記ホスト装置に直接あるいはネットワークを介して接続された記憶装置とを有する記憶システムにおいて、
    前記半導体ディスク装置は、本装置内の状態を監視するとともに、前記監視結果から本装置内の異常を検出する監視部と、前記監視部が異常を検出したとき、その異常検出結果を前記記憶装置に記憶させる制御手段とを備えたことを特徴とする記憶システム。
  17. 前記半導体ディスク装置は、揮発性メモリを備え、
    前記記憶装置は、不揮発性メモリを備え、
    前記制御手段は、前記異常検出結果を前記揮発性メモリに記録した後、前記揮発性メモリに記録した前記異常検出結果を所定のタイミングで前記不揮発性メモリに転送することを特徴とする請求項16に記載の記憶システム。
JP2006039796A 2006-02-16 2006-02-16 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム Pending JP2007219846A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006039796A JP2007219846A (ja) 2006-02-16 2006-02-16 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006039796A JP2007219846A (ja) 2006-02-16 2006-02-16 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム

Publications (1)

Publication Number Publication Date
JP2007219846A true JP2007219846A (ja) 2007-08-30

Family

ID=38497082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006039796A Pending JP2007219846A (ja) 2006-02-16 2006-02-16 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム

Country Status (1)

Country Link
JP (1) JP2007219846A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289106A (ja) * 2008-05-30 2009-12-10 Fujitsu Ltd 半導体集積回路及びその制御方法、並びに情報処理装置
JP5659289B1 (ja) * 2013-12-27 2015-01-28 株式会社東芝 ストレージシステム
JP2020135259A (ja) * 2019-02-18 2020-08-31 Necプラットフォームズ株式会社 電子基板および監視方法
US12045468B2 (en) 2021-11-12 2024-07-23 Samsung Electronics Co., Ltd. Storage devices configured to obtain data of external devices for debugging

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269255A (ja) * 1986-05-16 1987-11-21 Fujitsu Ltd 半導体記憶装置
JPH04106629A (ja) * 1990-08-28 1992-04-08 Toshiba Corp 計算機の異常解析システム
JPH055633A (ja) * 1991-06-27 1993-01-14 Toto Ltd 異常情報記録装置
JPH11160202A (ja) * 1997-11-27 1999-06-18 Nissan Motor Co Ltd 車両用データ収集装置
JP2005004869A (ja) * 2003-06-11 2005-01-06 Adtex:Kk 記録装置、記録データ管理方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62269255A (ja) * 1986-05-16 1987-11-21 Fujitsu Ltd 半導体記憶装置
JPH04106629A (ja) * 1990-08-28 1992-04-08 Toshiba Corp 計算機の異常解析システム
JPH055633A (ja) * 1991-06-27 1993-01-14 Toto Ltd 異常情報記録装置
JPH11160202A (ja) * 1997-11-27 1999-06-18 Nissan Motor Co Ltd 車両用データ収集装置
JP2005004869A (ja) * 2003-06-11 2005-01-06 Adtex:Kk 記録装置、記録データ管理方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009289106A (ja) * 2008-05-30 2009-12-10 Fujitsu Ltd 半導体集積回路及びその制御方法、並びに情報処理装置
JP5659289B1 (ja) * 2013-12-27 2015-01-28 株式会社東芝 ストレージシステム
WO2015098138A1 (ja) * 2013-12-27 2015-07-02 株式会社東芝 ストレージシステム
US9891841B2 (en) 2013-12-27 2018-02-13 Toshiba Memory Corporation Storage system including a plurality of memory nodes connected through first and second groups of interfaces
JP2020135259A (ja) * 2019-02-18 2020-08-31 Necプラットフォームズ株式会社 電子基板および監視方法
JP7002486B2 (ja) 2019-02-18 2022-01-20 Necプラットフォームズ株式会社 電子基板および監視方法
US12045468B2 (en) 2021-11-12 2024-07-23 Samsung Electronics Co., Ltd. Storage devices configured to obtain data of external devices for debugging

Similar Documents

Publication Publication Date Title
US7131013B2 (en) Power supply control system and storage device for holding data just prior to the occurence of an error
US7870338B2 (en) Flushing cached data upon power interruption
JP3161189B2 (ja) 記憶システム
US7234023B2 (en) Disk array system and fault-tolerant control method for the same
CN106326061B (zh) 高速缓存数据处理方法及设备
US7412628B2 (en) Storage system and disconnecting method of a faulty storage device
JP2004038290A (ja) 情報処理システムおよび同システムで用いられるディスク制御方法
US9111052B2 (en) Control system for controlling electronic circuit, and signal relaying apparatus
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
US7032128B2 (en) Method for managing computer, apparatus for managing computer, and computer readable medium storing program for managing computer
US8117391B2 (en) Storage system and data management method
JP2007219846A (ja) 半導体ディスク装置の異常監視・記録方法、プログラム、半導体ディスク装置、および記憶システム
JP2016212506A (ja) 情報処理システム、制御装置および制御プログラム
JP2008203957A (ja) Nasシステム
JP5534021B2 (ja) ストレージ装置、制御部およびストレージ装置制御方法
JP2008225567A (ja) 情報処理システム
CN102043735B (zh) 外接存储设备及其掉电保护方法
US20100162082A1 (en) Control device, storage apparatus and controlling method
JP5011159B2 (ja) システム監視回路を備えた計算機
JP3661665B2 (ja) パッケージの閉塞方法
JP2008146448A (ja) 半導体ディスク装置
JP3602962B2 (ja) 伝送装置
JPH0934805A (ja) 半導体ディスク装置
JP3376853B2 (ja) パッケージの閉塞方法
KR100270263B1 (ko) 시스템 오류 발생시에도 동작가능한 에러 로깅 회로

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110720

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120321