JP2007304919A - メモリモジュール保守用装置 - Google Patents
メモリモジュール保守用装置 Download PDFInfo
- Publication number
- JP2007304919A JP2007304919A JP2006133357A JP2006133357A JP2007304919A JP 2007304919 A JP2007304919 A JP 2007304919A JP 2006133357 A JP2006133357 A JP 2006133357A JP 2006133357 A JP2006133357 A JP 2006133357A JP 2007304919 A JP2007304919 A JP 2007304919A
- Authority
- JP
- Japan
- Prior art keywords
- memory module
- error
- temperature
- memory
- maintenance device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015654 memory Effects 0.000 title claims abstract description 175
- 238000012423 maintenance Methods 0.000 title claims abstract description 52
- 238000001514 detection method Methods 0.000 claims abstract description 44
- 230000006870 function Effects 0.000 claims abstract description 20
- 238000001816 cooling Methods 0.000 claims abstract description 17
- 230000017525 heat dissipation Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 description 8
- 239000000758 substrate Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000004519 grease Substances 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 229910001285 shape-memory alloy Inorganic materials 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- Memory System (AREA)
- For Increasing The Reliability Of Semiconductor Memories (AREA)
Abstract
【課題】 コネクタでメモリモジュールと接続され、メモリモジュールのメモリエラーを検出表示する機能と温度を制御する機能とを備えたメモリモジュール保守用装置を提供する。
【解決手段】 メモリモジュール保守用装置8は、メモリモジュール1と接続するためのコネクタ13、エラー検出回路9、温度制御回路11を備え、メモリモジュール1から入力された信号に基づいて、エラー検出回路9はエラーを検出し、検出したエラーをエラー表示器10に表示させるとともに、温度制御回路11は、設定された温度とメモリモジュール1の温度とを比較し、この比較結果を温度表示器12に色で表示させ、比較結果に従い、メモリモジュール1を冷却する冷却装置の動作を制御する制御信号を出力する。
【選択図】 図3
【解決手段】 メモリモジュール保守用装置8は、メモリモジュール1と接続するためのコネクタ13、エラー検出回路9、温度制御回路11を備え、メモリモジュール1から入力された信号に基づいて、エラー検出回路9はエラーを検出し、検出したエラーをエラー表示器10に表示させるとともに、温度制御回路11は、設定された温度とメモリモジュール1の温度とを比較し、この比較結果を温度表示器12に色で表示させ、比較結果に従い、メモリモジュール1を冷却する冷却装置の動作を制御する制御信号を出力する。
【選択図】 図3
Description
コネクタでメモリモジュールと接続され、メモリモジュールのメモリエラーを検出表示する機能と検出温度を表示する機能と温度温度を制御する機能とを備えたメモリモジュール保守用装置に関する。
最近のコンピュータには、複数本のメモリモジュールが実装されることが多くなり、その本数も増加の傾向にある。
メモリモジュールに実装されたメモリチップにメモリエラーが発生したり、温度上昇によって破損したりすると、コンピュータの動作が不安定になるので、このような事態を予防したり(特許文献1)、問題のあるメモリモジュールを素早く交換したりすることが大事である。
メモリモジュールに実装されたメモリチップにメモリエラーが発生したり、温度上昇によって破損したりすると、コンピュータの動作が不安定になるので、このような事態を予防したり(特許文献1)、問題のあるメモリモジュールを素早く交換したりすることが大事である。
メモリエラーが検出できたとしても、実装されているメモリモジュールが複数あると、どのメモリモジュールに問題があるのか判別できない。
そのため、問題のあるメモリモジュールを特定するには、マザーボードなどから一本ずつメモリモジュールを取り出して、単独で検査を行う方法、あるいは、各メモリモジュールを正常であることが保証されているメモリモジュールと交換し、これにより問題が解消したか否かを確認する方法などが一般的である。
そのため、問題のあるメモリモジュールを特定するには、マザーボードなどから一本ずつメモリモジュールを取り出して、単独で検査を行う方法、あるいは、各メモリモジュールを正常であることが保証されているメモリモジュールと交換し、これにより問題が解消したか否かを確認する方法などが一般的である。
また、メモリモジュール上のメモリチップは、その集積度の高さなどから発熱量が大きく、システムの稼動が長時間になるにつれ、その温度が上昇する。メモリチップは、電子部品であるため熱に弱く、高温になると、その動作が不安定になったり、最悪の場合は壊れたりする。最近のように高速大容量なメモリが使われるようになると、CPUよりもメモリの温度管理の方が、システムの安定のために一層重要であるとさえ言われている。したがって、メモリチップは、所定の温度以下に維持されなくてはならず、放熱は不可欠である。この放熱の方法として代表的なのは、冷却ファンを取り付けて空気を流通させることである。
エラーの発生したメモリモジュールを特定するための上記のような方法は、多大な労力と時間を必要とする。そのうえ、時間と労力を投入して検査をしても、再現性のある結果が得られるとは限らない。
1枚のボードに搭載されるメモリモジュールの本数が増加する傾向にあるが、システム稼動中、これらのメモリモジュールの発熱量にはバラつきがある。効率よく確実に冷却するには、きめ細かい制御が望ましい。そのためには、各メモリモジュールの温度が検出できることが前提である。
本発明は、以上のような問題点に鑑みてなされたものであり、第1に、エラーが発生したメモリモジュールを簡単に特定することを課題とし、第2に、メモリモジュールの温度を検出し、温度に応じて冷却手段の動作を制御することを課題とした。
また、温度に対応して稼動する冷却手段だけでなく、メモリの高速大容量化を考慮し、メモリモジュールの発熱を逃がすための他の手段を併用することも課題とした。
さらに、エラー発生の可能性が高いメモリモジュールを適宜エラー検出対象とするため、メモリモジュールに着脱自在に取り付けられるエラー検出装置の提供も課題とした。
さらに、エラー発生の可能性が高いメモリモジュールを適宜エラー検出対象とするため、メモリモジュールに着脱自在に取り付けられるエラー検出装置の提供も課題とした。
上記の目的を実現するために、本発明のメモリモジュール保守用装置は、メモリモジュールからの信号が入力されるコネクタを備え、前記信号に基づいて前記メモリモジュールのエラーを検出するエラー検出回路および前記メモリモジュールの温度を制御する温度制御回路の少なくとも1つを備えていることを特徴とする。
エラー検出方法としては、ECC(Error Correcting Code)あるいはパリティチェックの少なくとも1つを利用してもよい。また、前記エラー検出回路がメモリエラーを検出した時にエラーを表示するエラー表示器を備えていてもよい。
温度制御回路は、設定された温度を保持する機能、前記メモリモジュールの温度を検出する機能、及び前記の設定された温度と検出した温度とを比較する機能を備えているとよい。また、温度制御回路の比較結果に基づいて、温度範囲を色で表示したり、前記メモリモジュールを冷却する冷却装置の動作を制御する制御信号を出力したりしてもよい。
ここで、「メモリモジュール」とは、1個以上のメモリチップを基板にまとめて実装したものをいい、SIMM、SIP、DIMMなどと呼ばれるさまざまな種類がある。
エラー検出方法としては、ECC(Error Correcting Code)あるいはパリティチェックの少なくとも1つを利用してもよい。また、前記エラー検出回路がメモリエラーを検出した時にエラーを表示するエラー表示器を備えていてもよい。
温度制御回路は、設定された温度を保持する機能、前記メモリモジュールの温度を検出する機能、及び前記の設定された温度と検出した温度とを比較する機能を備えているとよい。また、温度制御回路の比較結果に基づいて、温度範囲を色で表示したり、前記メモリモジュールを冷却する冷却装置の動作を制御する制御信号を出力したりしてもよい。
ここで、「メモリモジュール」とは、1個以上のメモリチップを基板にまとめて実装したものをいい、SIMM、SIP、DIMMなどと呼ばれるさまざまな種類がある。
これにより、メモリモジュール毎にエラーの検出ができる。そのため、複数のメモリモジュールを搭載しているボードでは、エラーが発生したメモリモジュールがどれか特定できるので、交換等の迅速な対応が可能となる。加えて、メモリメーカに、エラーの発生したメモリモジュールとエラー情報とを提供できるので、メモリメーカにとって問題の解析が容易になる。
また、メモリモジュール毎にメモリチップの温度を監視し、適正な温度以下に維持するように制御できるので、発熱によってメモリチップの寿命が短縮することを防止でき、かつ、システムの温度設計が容易になる。そのため、システムの信頼性が向上する。
また、メモリモジュール毎にメモリチップの温度を監視し、適正な温度以下に維持するように制御できるので、発熱によってメモリチップの寿命が短縮することを防止でき、かつ、システムの温度設計が容易になる。そのため、システムの信頼性が向上する。
また、上記の目的を実現するために、本発明のメモリモジュール保守用装置は、1個のメモリモジュールを自在に着脱することを特徴とする。
これにより、本発明のメモリモジュール保守用装置をエラー発生の可能性の高いメモリモジュールのみに装着したり、この装置を1個だけ用意し、メモリモジュール毎に順に装着したりして、エラー検出を行うことができる。
これにより、本発明のメモリモジュール保守用装置をエラー発生の可能性の高いメモリモジュールのみに装着したり、この装置を1個だけ用意し、メモリモジュール毎に順に装着したりして、エラー検出を行うことができる。
また、上記の目的を実現するために、装着されたメモリモジュールと一体となって、その外側に放熱構造を取り付けるようにしてもよい。また、前記放熱構造は、放熱フィンを備えてもよい。
これにより、熱伝導によってメモリモジュールとメモリモジュール保守用装置の両者に発生した熱を逃がすことができる。温度制御回路によって制御される冷却手段のみならず、この放熱構造も併用することで、メモリチップの温度上昇を抑制できる。
これにより、熱伝導によってメモリモジュールとメモリモジュール保守用装置の両者に発生した熱を逃がすことができる。温度制御回路によって制御される冷却手段のみならず、この放熱構造も併用することで、メモリチップの温度上昇を抑制できる。
さらに、上記の目的を実現するために、本発明のメモリモジュール保守用装置は、メモリモジュールとの接続コネクタを複数個備える構造としてもよい。
これにより、1つのメモリモジュール保守用装置が、複数のメモリモジュールを装着できるので、複数のメモリモジュールのエラー検出、温度制御が同時にできる。
これにより、1つのメモリモジュール保守用装置が、複数のメモリモジュールを装着できるので、複数のメモリモジュールのエラー検出、温度制御が同時にできる。
本発明のメモリモジュール保守用装置に対し、信号を出力するためのコネクタを備えるメモリモジュールも上記の目的を実現するものである。また、前記コネクタの端子であって、未使用なものは、グランドに接続させたり、エラー信号を接続させたりするようにしてもよい。
これにより、メモリモジュール側のコネクタと、メモリモジュール保守用装置側のコネクタとを接続させることで、メモリモジュールのエラー検出と表示、温度制御が行える。
また、未使用端子をグランド端子とすることで、メモリモジュール側で発生した熱を、メモリモジュール保守用装置側へ逃がすことができる。
あるいは、エラー信号を接続することでシステム側のメモリコントローラにメモリ異常信号をフィードバックできる。
コネクタの空き端子に、メモリエラー信号或いは検出温度信号を出すこと及び(図1の4)のメモりモジュールのメモリコントローラと接続する空き端子にも同じ信号を出すことができる。
また、未使用端子をグランド端子とすることで、メモリモジュール側で発生した熱を、メモリモジュール保守用装置側へ逃がすことができる。
あるいは、エラー信号を接続することでシステム側のメモリコントローラにメモリ異常信号をフィードバックできる。
コネクタの空き端子に、メモリエラー信号或いは検出温度信号を出すこと及び(図1の4)のメモりモジュールのメモリコントローラと接続する空き端子にも同じ信号を出すことができる。
各メモリモジュールの基板に新たに設けたコネクタに、エラー検出機能およびエラー表示機能を有する装置を接続できるようにしたので、エラーの発生したメモリモジュールが容易に特定できる。そのため、マザーボードから当該メモリモジュールを正常なものに交換する等の対応により、システムの迅速な復旧が可能になる。
また、この装置には、温度制御機能を持たせることによって、メモリモジュール毎に適切に温度の管理を行うことができる。そのため、実装されたメモリチップが高温のため壊れたり、高温となった結果、エラーを生じさせたりすることを抑制できる。
さらに、この装置と、これに接続するメモリモジュールの両者に放熱構造を取り付けたり、コネクタの未使用ピンをグランドに接続させたりすることによって、メモリチップなどの発熱部品の熱を逃がすことができる。
また、この装置には、温度制御機能を持たせることによって、メモリモジュール毎に適切に温度の管理を行うことができる。そのため、実装されたメモリチップが高温のため壊れたり、高温となった結果、エラーを生じさせたりすることを抑制できる。
さらに、この装置と、これに接続するメモリモジュールの両者に放熱構造を取り付けたり、コネクタの未使用ピンをグランドに接続させたりすることによって、メモリチップなどの発熱部品の熱を逃がすことができる。
図1〜図3に従い、本発明の第1の実施形態について説明する。
図1は、本実施形態のメモリモジュール保守用装置(以下、「保守用装置」という)と接続されることによって、エラー検出と温度制御の対象となるメモリモジュールの構成例である。
図1は、本実施形態のメモリモジュール保守用装置(以下、「保守用装置」という)と接続されることによって、エラー検出と温度制御の対象となるメモリモジュールの構成例である。
メモリモジュール1は、従来のメモリモジュールと同様に、基板2、メモリチップ3、CPUなどに信号を送る端子4を備え、図示しないチップコンデンサなども備える。図1では、メモリチップは2個のみ実装されているが、8の倍数個のメモリチップを持つものが多い。また、基板2の片面だけでなく、両面にもメモリチップが実装されているものであってもよい。
メモリモジュール1は、上記の構成要素以外に、温度センサ5を備える。図1の例では、温度センサ5は、メモリチップやレジスタード バッファーやPLL3毎に設ける。しかし、基板2の適当な箇所に1個以上設けてもよい。メモリモジュール1の温度が的確に検出できるならば、温度センサの位置や個数は特に限定しない。
メモリモジュール1は、図3に示す保守用装置8に信号を出力するための端子を含む接続コネクタ6も備える。接続コネクタ6の端子7は、保守用装置8にエラー検出に必要な信号S1を出力する端子7a、温度を示す信号S2を出力する端子7b、それ以外の未使用端子7c(図1では、黒丸で表わしている)に分類される。ここで、未使用端子7cは、なるべくグランドに接続させる、つまり、グランド端子とすることが好ましい。保守用装置8側に、グランド端子7cを介してメモリモジュール1側で発生した熱を逃がすことができるからである。なお、図1において、破線の矢印は、信号が流れる方向を示す。
接続コネクタ6のタイプは、エッジコネクタでも、他のタイプでもよい。また、基板2に接続コネクタ6を設ける位置は、図1のように基板2の端(図2のAの位置)でも、図2の位置Bあるいは位置Dのように基板2の側端でも、図2の位置Cのように基板2の中でもよい。コネクタ6の位置は、保守用装置8の形状やメモリチップ2の配置などのデザイン面に依存する。
次に、図3に従い、保守用装置8の構成例について説明する。
保守用装置8は、エラー検出回路9、エラー表示器10、温度検出回路11、温度表示器12を備える。エラー検出回路9と温度検出回路11は、ICチップ化してもよい。
また、メモリモジュール1のコネクタ6の端子7と接続するコネクタ13を備え、端子7a、7bからの信号S1、S2を受け取り、エラー検出回路9、温度検出回路11の入力信号とする。図3において、破線の矢印は、各信号が流れる方向を示す。
保守用装置8は、エラー検出回路9、エラー表示器10、温度検出回路11、温度表示器12を備える。エラー検出回路9と温度検出回路11は、ICチップ化してもよい。
また、メモリモジュール1のコネクタ6の端子7と接続するコネクタ13を備え、端子7a、7bからの信号S1、S2を受け取り、エラー検出回路9、温度検出回路11の入力信号とする。図3において、破線の矢印は、各信号が流れる方向を示す。
続いて、保守用装置8のエラー検出機能について説明する。
エラー検出回路9は、信号S1を入力情報として、パリティチェックあるいはECCを利用してエラー検出を行う。パリティチェックとは、メモリから読み出したデータのパリティビットを参照してエラーが生じているか否かを判定するものであるが、このパリティチェックでは、エラーの検出はできても訂正まではできない。一方、ECCを利用すると、メモリから読み出したデータに1ビットのエラーが検出されれば、自動訂正を行って、訂正後のデータをコネクタ13とコネクタ6の対応する端子を介して、該当するメモリに書き出すことができる。2ビット以上のエラーは、自動訂正はできないが、検出することはできる。
エラー検出回路9は、ECCとパリティチェックのいずれか一方、あるいは両方を利用する。
エラー検出回路9は、信号S1を入力情報として、パリティチェックあるいはECCを利用してエラー検出を行う。パリティチェックとは、メモリから読み出したデータのパリティビットを参照してエラーが生じているか否かを判定するものであるが、このパリティチェックでは、エラーの検出はできても訂正まではできない。一方、ECCを利用すると、メモリから読み出したデータに1ビットのエラーが検出されれば、自動訂正を行って、訂正後のデータをコネクタ13とコネクタ6の対応する端子を介して、該当するメモリに書き出すことができる。2ビット以上のエラーは、自動訂正はできないが、検出することはできる。
エラー検出回路9は、ECCとパリティチェックのいずれか一方、あるいは両方を利用する。
エラー検出回路9の構成は、メモリモジュール毎に、エラーを検出する回路を設ければ、どのメモリモジュールに異常があるか容易に特定できる。エラーが検出されると、メモリモジュール毎交換したり、動作を停止させたりするので、メモリモジュール全体として異常の有無が判明することが、何よりも重要だからである。また、一括してエラーを検出する構成とした場合、エラー発生時のメモリアドレスを保存できるように設計すれば、そのメモリアドレスから、どのメモリチップに問題があるか、見当がつく。そのため、メモリのメーカにとって、調査対象となるメモリチップを絞り込むことができるので、エラー原因の究明がより迅速かつ的確にできるようになる。
エラー検出回路9は、検出結果を表す信号S3をエラー表示器10に送信する。図3のエラー表示器10は、例えば、LEDを備え、エラーが検出されていない間は、消灯しているが、エラーが検出されると、点灯するようにすれば、エラーが検出されたことが直ちにわかる。ただし、この表示方式に限らず、一目でエラーの有無がわかるような表示の仕方であれば、どのようなものでもよい。
例えば、エラーを検出していない間は、0(ゼロ)を表示させ、エラーが検出されたときは、そのときのメモリアドレスを表示させるようなものであってもよい。
また、エラー検出回路9を、個々のメモリチップ3毎に、エラーを検出するような設計とした場合は、エラー表示器10には、エラーが検出されたメモリチップ3の通し番号を表示してもよい。あるいは、エラー表示器10に、メモリチップ3の個数分のLEDを設け、エラーが検出されたメモリチップ3に対応するものを点滅させてもよい。
さらに、エラー検出は、視覚的に通知するものに限らず、圧電素子などを用いて音声で警告を発してもよい。音声による通知は、図4に示す放熱構造14を使用する場合などに便利である。なお、放熱構造14については、後に詳しく説明する。
例えば、エラーを検出していない間は、0(ゼロ)を表示させ、エラーが検出されたときは、そのときのメモリアドレスを表示させるようなものであってもよい。
また、エラー検出回路9を、個々のメモリチップ3毎に、エラーを検出するような設計とした場合は、エラー表示器10には、エラーが検出されたメモリチップ3の通し番号を表示してもよい。あるいは、エラー表示器10に、メモリチップ3の個数分のLEDを設け、エラーが検出されたメモリチップ3に対応するものを点滅させてもよい。
さらに、エラー検出は、視覚的に通知するものに限らず、圧電素子などを用いて音声で警告を発してもよい。音声による通知は、図4に示す放熱構造14を使用する場合などに便利である。なお、放熱構造14については、後に詳しく説明する。
次は、保守用装置8の温度検出機能について説明する。
温度検出回路11は、メモリモジュール1からの信号S2を入力情報として、温度センサ5が検出した温度を取得する。また、温度検出回路11には、メモリモジュール1の適正な温度として設定された値を記憶する機能をもたせる。当該メモリモジュール1が安定した動作を保つための、適正な温度はあらかじめ予想できるので、この温度を設定すればよい。
温度検出回路11は、メモリモジュール1からの信号S2を入力情報として、温度センサ5が検出した温度を取得する。また、温度検出回路11には、メモリモジュール1の適正な温度として設定された値を記憶する機能をもたせる。当該メモリモジュール1が安定した動作を保つための、適正な温度はあらかじめ予想できるので、この温度を設定すればよい。
温度検出回路11は、この設定温度と、温度センサ5によって検出された温度とを比較し、その結果を表す信号S4を温度表示器12に送信し、結果を表示させる。例えば、温度表示器12には、色の異なるLEDを備え、温度が安全な範囲にあれば、緑色のLEDを点灯させ、設定温度以下であっても、設定温度との差が小さいときは、黄色のLEDを点灯させ、設定温度を超えたときは赤色のLEDを点灯させるといった方法がある。なお、視覚的に表示するものに限らず、設定温度を超えたときは、警告音を発生させてもよい。
また、温度検出回路11は、設定温度との比較結果に応じて、図示しない冷却装置に対して制御信号を送信できる。この制御信号は、停止していた冷却装置の作動開始を指示するものであってもよく、ファンタイプの冷却装置であれば、風を送る方向や風の強さを指示するものであってもよい。また、設定温度以下の状態が継続しているときは、冷却装置の停止などを指示してもよい。
また、温度検出回路11は、設定温度との比較結果に応じて、図示しない冷却装置に対して制御信号を送信できる。この制御信号は、停止していた冷却装置の作動開始を指示するものであってもよく、ファンタイプの冷却装置であれば、風を送る方向や風の強さを指示するものであってもよい。また、設定温度以下の状態が継続しているときは、冷却装置の停止などを指示してもよい。
次に、図4、図5を参照しながら、メモリモジュール1及び保守用装置8に取り付ける放熱構造14について説明する。
通常、マザーボード上には、マザーボード全体、あるいは複数のメモリモジュールを冷却するための冷却装置が設けられている。しかし、高速大容量のメモリモジュールの場合は、それだけでは不十分なこともある。そのため、メモリチップ3の表面から熱を逃がすような放熱のための構造を併用することが好ましい。
通常、マザーボード上には、マザーボード全体、あるいは複数のメモリモジュールを冷却するための冷却装置が設けられている。しかし、高速大容量のメモリモジュールの場合は、それだけでは不十分なこともある。そのため、メモリチップ3の表面から熱を逃がすような放熱のための構造を併用することが好ましい。
図1に示したように、メモリモジュール1のコネクタ6の未使用な端子7cはなるべくグランドに接続するようにした。したがって、グランド端子7cと、保守用装置8のコネクタ13を介して、保守用装置8側にメモリモジュール1の熱が伝わり、保守用装置8の温度も上昇する。そのため、図4に示すように、メモリモジュール1及び保守用装置8の両者にかぶさるような放熱構造14が効果的である。
放熱構造14は、アルミ製等の放熱フィン15と、メモリチップなどに内側の面で接触するヒートシンク16とからなる。ヒートシンク16の内側のメモリチップ3などと接触する部分には、銅シート17(図4の斜線を付した部分)を設け、熱伝導性を良くする。さらに、銅シート17のメモリチップ3との接触面にはシリコングリス(図示せず)を塗ることで、熱伝導性をさらに高めるとよい。
このような放熱構造14を、図4の矢印R1で示すように、互いに接続されたメモリモジュール1及び保守用装置8の両者に被せることによって、伝導による熱の移動によってメモリチップなどの発熱部品の温度を下げることができる。この放熱構造14には、放熱フィン15も設けられているので、表面積が増加し、放熱効率が向上する。
放熱構造14は、アルミ製等の放熱フィン15と、メモリチップなどに内側の面で接触するヒートシンク16とからなる。ヒートシンク16の内側のメモリチップ3などと接触する部分には、銅シート17(図4の斜線を付した部分)を設け、熱伝導性を良くする。さらに、銅シート17のメモリチップ3との接触面にはシリコングリス(図示せず)を塗ることで、熱伝導性をさらに高めるとよい。
このような放熱構造14を、図4の矢印R1で示すように、互いに接続されたメモリモジュール1及び保守用装置8の両者に被せることによって、伝導による熱の移動によってメモリチップなどの発熱部品の温度を下げることができる。この放熱構造14には、放熱フィン15も設けられているので、表面積が増加し、放熱効率が向上する。
図4、図5に示すように、放熱構造14のヒートシンク16は、背の低い発熱部品18と接する箇所19では、接触性を確保するために湾曲させる。このように、いずれの発熱部品の表面にも接触するので、バランスよく熱をとることができ、熱が特定の発熱部品に集中しない。
なお、ヒートシンク16には、形状記憶合金を使用し、メモリチップなどの発熱体に接触する部分の接触性を良くするようにしてもよい。
なお、ヒートシンク16には、形状記憶合金を使用し、メモリチップなどの発熱体に接触する部分の接触性を良くするようにしてもよい。
以上の第1の実施形態の保守用装置8には、1個のメモリモジュール1が装着される。1個の保守用装置8は、コネクタ13を、メモリモジュール1のコネクタ6と接続したり、コネクタ6から取り外したりすることでメモリモジュール1と自在に着脱できる。
そのため、システム内の全部のメモリモジュール1に、それぞれ保守用装置8を装着してエラー検出や温度制御を行うといった用途以外に、問題のありそうなメモリモジュール、例えば、新規に購入した拡張メモリにのみ保守用装置8を装着して初期不良の有無をチェックするといった使用法も考えられる。あるいは、システムの動作が不安定なとき、1個の保守用装置8を、各メモリモジュール1に順繰りに装着していって、エラーが検出されるメモリモジュール1を特定するといった使用法もある。
そのため、システム内の全部のメモリモジュール1に、それぞれ保守用装置8を装着してエラー検出や温度制御を行うといった用途以外に、問題のありそうなメモリモジュール、例えば、新規に購入した拡張メモリにのみ保守用装置8を装着して初期不良の有無をチェックするといった使用法も考えられる。あるいは、システムの動作が不安定なとき、1個の保守用装置8を、各メモリモジュール1に順繰りに装着していって、エラーが検出されるメモリモジュール1を特定するといった使用法もある。
以下、図6に従い、第2の実施形態について説明する。
第1の実施形態では、メモリモジュール1毎に保守用装置8を装着していたのに対し、第2の実施形態の保守用装置101は、接続コネクタ102を複数個持ち、最大でコネクタ102の個数分だけのメモリモジュール1を同時に装着できる。
保守用装置101には、マザーボード上で隣接するメモリモジュールのソケットの間隔と等しい間隔で、複数のコネクタ102を設けておくとよい。マザーボード上にメモリモジュールが連続して実装されたり、ひとつおきのソケットに実装されたり、といった異なるピッチに対応できるからである。
なお、破線の矢印R2,R3は、保守用装置101のコネクタと、装着するメモリモジュールのコネクタとの対応を示すものである。
第1の実施形態では、メモリモジュール1毎に保守用装置8を装着していたのに対し、第2の実施形態の保守用装置101は、接続コネクタ102を複数個持ち、最大でコネクタ102の個数分だけのメモリモジュール1を同時に装着できる。
保守用装置101には、マザーボード上で隣接するメモリモジュールのソケットの間隔と等しい間隔で、複数のコネクタ102を設けておくとよい。マザーボード上にメモリモジュールが連続して実装されたり、ひとつおきのソケットに実装されたり、といった異なるピッチに対応できるからである。
なお、破線の矢印R2,R3は、保守用装置101のコネクタと、装着するメモリモジュールのコネクタとの対応を示すものである。
保守用装置101は、エラー検出回路103、温度制御回路104、エラー表示器105、温度表示器106を備える。
エラー検出回路103は、装着している複数のメモリモジュール1からのエラー検出に必要な信号を入力情報として、メモリエラーの検出処理を行う。エラーが検出されたとき、エラー表示器105が、各メモリモジュール1に対応して設けられたLEDを点灯したり、問題のあるメモリモジュール番号を表示したりする。
エラー検出回路103は、装着している複数のメモリモジュール1からのエラー検出に必要な信号を入力情報として、メモリエラーの検出処理を行う。エラーが検出されたとき、エラー表示器105が、各メモリモジュール1に対応して設けられたLEDを点灯したり、問題のあるメモリモジュール番号を表示したりする。
温度制御回路104は、温度表示器106に、メモリモジュール毎の設定温度との比較結果を表示させてもよいが、最も温度の高いメモリモジュール1について設定温度との比較結果を表示させてもよい。また、温度検出回路104は、一つでも設定温度を超えるメモリモジュールが検出されたときは、図示しない冷却装置に制御信号を送信するとよい。維持すべき設定温度を超えるようなメモリモジュールが一つでもあると、システム全体に影響が及ぶからである。
以上の実施形態では、一つの保守用装置8、101がエラー検出機能と温度制御機能の両方を備えていた。しかし、システムの用途や設置場所といった諸条件、あるいは製造コストなどを考慮し、いずれか一方の機能のみ備えてもよい。
要は、前記のように開示された実施の形態はすべての点で例示であって、制限的なものではない。したがって、種々の変形が可能である。しかし、その変形が特許請求の範囲に記載された技術思想に基づくものである限り、その変形は本発明の技術的範囲に含まれる。
メモリモジュールの信頼性を高めることで、パソコンやワークステーションなどの各種コンピュータの安定した動作を確保できる。
1 メモリモジュール
6 コネクタ
7 コネクタ6の端子
8 (第1の実施形態の)メモリモジュール保守用装置
9 エラー検出回路
10 エラー表示器
11 温度制御回路
12 温度表示器
13 コネクタ
14 放熱構造
15 放熱フィン
101 (第2の実施形態の)メモリモジュール保守用装置
102 コネクタ
103 エラー検出回路
104 温度制御回路
105 エラー表示器
106 温度表示器
6 コネクタ
7 コネクタ6の端子
8 (第1の実施形態の)メモリモジュール保守用装置
9 エラー検出回路
10 エラー表示器
11 温度制御回路
12 温度表示器
13 コネクタ
14 放熱構造
15 放熱フィン
101 (第2の実施形態の)メモリモジュール保守用装置
102 コネクタ
103 エラー検出回路
104 温度制御回路
105 エラー表示器
106 温度表示器
Claims (13)
- メモリモジュールからの信号が入力されるコネクタを備え、前記信号に基づいて前記メモリモジュールのエラーを検出するエラー検出回路および前記メモリモジュールの温度を制御する温度制御回路の少なくとも1つを備えていることを特徴とするメモリモジュール保守用装置。
- 前記エラー検出回路は、ECC(Error Correcting Code)あるいはパリティチェックの少なくとも1つの利用によりメモリエラーを検出することを特徴とする請求項1に記載のメモリモジュール保守用装置。
- 前記エラー検出回路がメモリエラーを検出した時にエラーを表示するエラー表示器を備えていることを特徴とする請求項1または2のいずれかに記載のメモリモジュール保守用装置。
- 前記温度制御回路は、設定された温度を保持する機能、前記メモリモジュールの温度を検出する機能、及び前記の設定された温度と検出した温度とを比較する機能を備えていることを特徴とする請求項1に記載のメモリモジュール保守用装置。
- 前記温度制御回路の比較結果に基づいて、温度範囲を色で表示する温度表示器を備えていることを特徴とする請求項4に記載のメモリモジュール保守用装置。
- 前記温度制御回路の比較結果に基づいて、前記メモリモジュールを冷却する冷却装置の動作を制御する制御信号を出力することを特徴とする請求項4または5のいずれかに記載のメモリモジュール保守用装置。
- 請求項1〜6のいずれか1に記載のメモリモジュール保守用装置であって、1個のメモリモジュールを自在に着脱することを特徴とするメモリモジュール保守用装置。
- 装着されたメモリモジュールと一体となって、その外側に放熱構造を取り付けることができることを特徴とする請求項7に記載のメモリモジュール保守用装置。
- 前記放熱構造は、放熱フィンを備えることを特徴とする請求項8に記載のメモリモジュール保守用装置。
- 請求項1〜6のいずれか1に記載のメモリモジュール保守用装置であって、メモリモジュールとの接続コネクタを複数個備えることを特徴とするメモリモジュール保守用装置。
- 請求項1〜10のいずれか1に記載のメモリモジュール保守用装置に対し、信号を出力するためのコネクタを備えることを特徴とするメモリモジュール。
- 前記コネクタの端子の内の未使用なものは、グランドに接続させ、またはエラー信号を接続させることを特徴とする請求項11に記載のメモリモジュール。
- 前記コネクタの空き端子に、メモリエラー信号或いは検出温度信号を出すこと及び、メモりモジュールのメモリコントローラと接続する空き端子にも同じ信号を出すことを特徴とする請求項11に記載のメモリモジュール。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006133357A JP2007304919A (ja) | 2006-05-12 | 2006-05-12 | メモリモジュール保守用装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006133357A JP2007304919A (ja) | 2006-05-12 | 2006-05-12 | メモリモジュール保守用装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007304919A true JP2007304919A (ja) | 2007-11-22 |
Family
ID=38838787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006133357A Pending JP2007304919A (ja) | 2006-05-12 | 2006-05-12 | メモリモジュール保守用装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007304919A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010537264A (ja) * | 2007-08-17 | 2010-12-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | プログラマブル診断メモリ・モジュール |
JP2012122748A (ja) * | 2010-12-06 | 2012-06-28 | Nec Corp | 情報処理装置及びその作動方法 |
JP2012155760A (ja) * | 2012-05-11 | 2012-08-16 | Toshiba Corp | 記憶装置及び情報処理装置 |
-
2006
- 2006-05-12 JP JP2006133357A patent/JP2007304919A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010537264A (ja) * | 2007-08-17 | 2010-12-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | プログラマブル診断メモリ・モジュール |
JP2012122748A (ja) * | 2010-12-06 | 2012-06-28 | Nec Corp | 情報処理装置及びその作動方法 |
JP2012155760A (ja) * | 2012-05-11 | 2012-08-16 | Toshiba Corp | 記憶装置及び情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018107754A1 (zh) | 一种板卡、一种主板和一种温度监控系统及方法 | |
US7988063B1 (en) | Method for controlling cooling in a data storage system | |
CN106415434B (zh) | 热隔离技术 | |
US7573282B2 (en) | Ball grid array connection monitoring system and method | |
US20170161136A1 (en) | System state detection method and system and server | |
TW201327151A (zh) | 伺服器系統 | |
WO2006127448A2 (en) | Thermal monitoring and response apparatus and method for computer unit | |
JP5662092B2 (ja) | 電子部品及び検査システム | |
JP2007257062A (ja) | メモリエラー検出機能、メモリチップの温度検出機能を備えたメモリモジュール | |
CN102724846A (zh) | 散热控制方法及散热控制装置 | |
CN104564764A (zh) | 服务器系统 | |
JP2007304919A (ja) | メモリモジュール保守用装置 | |
US8373959B2 (en) | Detecting and preventing overheating in power connectors | |
US9820405B1 (en) | Optimized server design using dense DIMM spacing, wide heatsink, improved routing channels, and improved air delivery to rear devices | |
TWI697004B (zh) | 電源品質檢測系統及電源品質檢測模組 | |
JP4427596B1 (ja) | ヒートシンクの取り付け構造および電子機器 | |
TW201430323A (zh) | 溫度偵測系統 | |
JP2017045877A (ja) | 部品の脱落検出が可能なプリント基板および脱落検出回路 | |
CN107687869A (zh) | 用于监测电气设备的腐蚀环境的方法和装置 | |
US11880251B2 (en) | Self-powered indicator | |
TWM541686U (zh) | 電子裝置 | |
TWI397812B (zh) | 測試板 | |
TWI662417B (zh) | 切換卡以及伺服器 | |
JP2004355421A (ja) | Cpu冷却機構異常の検出 | |
US20070074897A1 (en) | Thermal event detection on printed wire boards |