JP3864664B2 - OS startup method for multiple computers sharing storage - Google Patents
OS startup method for multiple computers sharing storage Download PDFInfo
- Publication number
- JP3864664B2 JP3864664B2 JP2000067150A JP2000067150A JP3864664B2 JP 3864664 B2 JP3864664 B2 JP 3864664B2 JP 2000067150 A JP2000067150 A JP 2000067150A JP 2000067150 A JP2000067150 A JP 2000067150A JP 3864664 B2 JP3864664 B2 JP 3864664B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- control program
- startup
- status
- computers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Power Sources (AREA)
- Multi Processors (AREA)
- Stored Programmes (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、ストレージを共用する複数計算機のOS起動の方法に関し、特に、OS起動時に複数計算機のストレージ集中アクセスによる性能低下を防止する方法に関する。
【0002】
【従来の技術】
複数の計算機を用いた計算機システムとして、複数の計算機と、複数の計算機を管理するサーバと、複数の計算機が共用するストレージを備えた計算機システムが知られている。図17の例を用いて説明する。
【0003】
同図において、200x(200a=200n)は計算機、100は計算機200xが共用するストレージ、1001は計算機200xがダウンロードするOS、400は計算機を設置してある場所とは物理的に離れた場所にあるサーバ、500はサーバ400とストレージ100を接続する接続インターフェース、600x(600a=600n)は複数の計算機200xとサーバ400が通信するためのLAN(Local Area Network)である。
【0004】
計算機200xがパワーオンすると、まず、計算機200x はLAN 600x経由でサーバ400にアクセスする。次に、ストレージ100にあるOS 1001をダウンロードし、起動を開始する。複数の計算機 200xがパワーオンすると、パワーオンした全ての計算機 200xがOS 1001をダウンロードしようとするため、サーバ 400やストレージ 100への負荷が増大することになる。
【0005】
【発明が解決しようとする課題】
(課題)
上記従来技術では、複数の計算機を同時に起動しようとすると、サーバやストレージにアクセスが集中することになり、OS起動のような負荷のかかる処理の場合、処理性能が低下し、OS起動に多大な時間がかかるという課題がある。同時に起動する計算機数が多いほどOS起動時間は長大化し、多台数の計算機を使用する場合、業務に支障を来すことになる。
【0006】
それぞれの操作者が電源投入時間をずらして起動すればストレージへのアクセス集中は回避できるが、他の操作者がいつ電源を入れるかを把握し、他の計算機の起動を待ち、常に電源投入時間を考慮しながら計算機に電源を投入しなけらばならないという課題がある。電源投入は計算機を使用するたびに行なわなければならず、操作者はその都度余計な手間がかかるという課題がある。
【0007】
(目的)
本発明の目的は、ストレージを共用する計算機システムにおいて、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能な方法を提供し、かつ、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散する方法を提供することにより、ストレージへのアクセス集中による性能低下を防止し、OS起動時間を短縮することである。
【0008】
【課題を解決するための手段】
上記の目的を達成するために、複数の計算機と、複数の計算機をパワーオンするための管理コンソールと、複数の計算機と管理コンソールが共用するストレージを備えた計算機システムを構築する。
【0009】
本発明の第一の手段では、管理コンソールは複数の計算機の電源を遠隔地から制御するためのリモートパワー制御プログラムと、計算機グループを管理するための管理テーブルを備える。
【0010】
計算機は、遠隔地から電源制御をすることができるリモートパワーオン制御手段を備える。
【0011】
リモートパワー制御プログラムは、管理テーブルで定義された計算機グループにしたがって計算機グループ毎に時間差をつけてパワーオンすることにより、ストレージへのアクセスの時間的分散を可能とする。
【0012】
本発明の第二の手段では、複数の計算機及び管理コンソールは、ファイバチャネル等の接続インターフェースによりストレージに接続する。
【0013】
管理コンソールは複数の計算機の電源を遠隔地から制御するためのリモートパワー制御プログラムを備える。
【0014】
計算機は、遠隔地から電源制御をすることができるリモートパワーオン制御手段と、OSの起動を制御し、計算機の起動状況を伝えるブートアップ制御プログラムを備える。
【0015】
ストレージは、複数の計算機のそれぞれ専用の論理ユニットと、すべての計算機が使用することができ、計算機の起動状況を記録する通信論理ユニットと、これらの論理ユニットを定義・作成するLU定義プログラムとを備える。
【0016】
ブートアップ制御プログラムが通信論理ユニットを参照し、計算機数を制御することで、ストレージへのアクセス分散を可能にし、計算機のOS起動を実行する。
【0017】
また、本発明の第三の手段は、前記第二の手段において、ストレージに配置された通信論理ユニットのかわりに、管理コンソールに計算機の起動を制御する計算機起動制御プログラムを備え、集中型起動制御を行なうことを特徴とする。
【0018】
【発明の実施の形態】
(第一実施形態)
従来の技術ではサーバを用いたシステム構成がとられていたが、本実施形態では、運用管理や性能の面で優れているサーバレス型のシステム構成とする。この場合も従来技術で述べたような複数計算機の起動時にストレージへのアクセス集中が起こるという課題は同様である。なお、もちろん本発明はこの構成に限定されるものではない。
【0019】
図1は本実施形態の計算機システムの構成図である。同図において、2x(2a=2n)は計算機、1はすべての計算機2が共用するストレージ、4は計算機システムを管理するための管理コンソール、3はすべての計算機2xとストレージ1と管理コンソール4を相互に接続するファイバチャネル接続手段、5x(5a=5n)はファイバチャネルである。7はストレージ1と管理コンソール 4が通信するための通信手段、6x(6a=6n)は複数の計算機2xと管理コンソール4が通信するためのLAN(Local Area Network)である。
【0020】
以下、計算機としてはPC(Personal Computer)等のクライアント用計算機を想定し説明するが、サーバや、ワークステーション等のその他の計算機にも応用可能である。また、計算機とストレージを接続するためのインタフェース(以下I/Fと略記する)は、その接続距離と速度の面で最適であるファイバチャネルを想定するが、SCSI(Small Computer System Interface)、USB(Universal Serial Bus)、IEEE1394、等、様々なI/Fに適用可能である。
【0021】
図2は計算機2xの構成図である。21はこの計算機2のユーザが情報を入力したり出力したりするための入出力装置、22は計算機の全体の制御を行う中央制御手段、25はファイバチャネルの接続、制御を行うために計算機2に搭載したファイバチャネルボード、24はLAN6x用いた通信を行うためのLANボード、23は中央制御手段22が各種制御を実行するために必要なプログラムやデータを格納するためのメモリである。
【0022】
ファイバチャネルボード25において、250はファイバチャネルの制御を行うファイバチャネルコントローラ、251はファイバチャネルコントローラが制御をするために必要なプログラムやデータや、中央制御手段22がファイバチャネルコントローラ250を制御するために必要なプログラムやデータを格納するためのメモリである。メモリ251において、2511はファイバチャネル5xに接続した計算機2xの外部のストレージ1からOSを起動するめにファイバチャネルコントローラ250を制御するために中央制御手段22が実行するブートアップ制御プログラムである。2512はファイバチャネルコントローラ250を一意に識別するために設けた世界で唯一な名称の情報であるWWN(World Wide Name)である。ここで、本実施形態ではファイバチャネルボード25が計算機2xに搭載されているとしたが、本ボードに搭載するファイバチャネルコントローラ250、およびメモリ251を計算機2xに該ボード25を用いずに直接実装することも可能であり、この場合も本発明の作用、効果は全く同一である。
【0023】
26は計算機2xのメイン電源スイッチである。
【0024】
図3はストレージ1の構成図である。11はストレージの全体制御を司る中央制御手段、15はファイバチャネル5dへの接続とその制御を行うファイバチャネルコントローラ、12は中央制御手段11がストレージ1の内部制御を行うためのプログラムやデータを格納するためのメモリ、16は管理コンソール4との間の通信を行うための通信手段、13x(13a=13n)と14は論理ユニット(LU:Logical Unit)である。
【0025】
ここで論理ユニットLUとは、論理ボリュームとも呼ばれるストレージ1内部に設けた仮想的なボリュームのことであり、計算機とストレージを接続するI/Fの一つのプロトコルであるSCSI(Small Computer System Interface)の仕様において定義された名称である。以下、論理ボリュームのことを単にLUと呼ぶことにする。またLUを識別するための番号のことをLUN(Logical Unit Number)と呼ぶ。
【0026】
論理ユニット13xは計算機2x専用のLUであり計算機#x用ローカルLUである。ローカルLU13xには各計算機2x専用のOS 131xが格納される。一方、論理ユニット14はすべての計算機2xと管理コンソール4のいずれもがアクセス可能な共用LUである。
【0027】
メモリ12において、121は複数のLUを定義したり作成したりするために中央制御手段11が実行するLU定義プログラム、122は各計算機2xが複数のLUのそれぞれに対するアクセス禁止/許可や、LUの属性や、上位計算機から認識されるLUNである仮想LUNとストレージ内部でLUを管理するために付加した内部LUNのそれぞれの対応関係を中央制御手段11が管理するためのLUN管理テーブル、123はLUN管理テーブル122の情報に従い各計算機2xからの各LUへのアクセスを制限/許可する制御を行い、許可した場合には当該LUに対するリード・ライトアクセスの制御を中央制御手段11が実行するためのアクセス制御プログラムである。
【0028】
LUについて説明する。LUはストレージの上位計算機から見たときの論理的なボリュームである。上位計算機は1つのLUを1台の論理的なディスク装置として認識する。
【0029】
ストレージ1は内部に複数のLUを定義し、構築することができる。これを内部LUと呼ぶことにする。ストレージ1では内部LUを管理するため0から始まる整数でシリアル番号付けする。この番号を内部LUNと呼ぶ。
【0030】
一方、本発明の計算機システムのように複数の計算機2xが1台のストレージ1を共用する場合、計算機2xそれぞれに専用のLUを割り当てる。一般にPC等の上位計算機はOSブート時に接続するストレージをサーチしてLUを検出するが、サーチ方法にいくつかの制約がある場合がある。それは、
(a) LUNは0から順にサーチする
(b) LUNは連続番号で存在することを仮定し、ある番号が存在しない場合以降のサーチは行わない
の2点である。これはサーチ時間を短縮するための工夫である。本発明の計算機2もこのような特性をもつ計算機2xであると仮定する。このような場合、もし、内部LUNをそのまま上位計算機に割り当てるとすると、内部LUN=0以外のLUを割り当てられた計算機はこのLUを検出できないことになってしまう。そこで、すべての計算機に対し、0から始まり、かつ連続番号でLUNを割り当てることが望ましい。そこで、本発明においては、ストレージ1は各計算機2xごとにその計算機2xが使用する内部LUををすべて0から始まる連続したLUNになるよう再定義することで上記の課題を解決する。このように各計算機2xから認識されるLUを仮想LU、その番号を仮想LUNと呼び、内部LUおよび内部LUNと区別する。これらの内部LUN、仮想LUNとの対応関係は、ストレージ1が備えるLUN管理テーブル122で管理する。
【0031】
ストレージ1が備えるLUN管理テーブル122の一例を図4に示す。LUN管理テーブル122には、ポート番号と、Target IDと、仮想LUNと、内部LUNと、WWNと、S_IDと、属性を格納する。
【0032】
ポート番号は、ストレージ1が備えるファイバチャネル接続ポートの番号を格納する。本実施形態ではポート数は1個を仮定し、一律0を格納する。
【0033】
TargetIDは、計算機2xとの接続I/Fにおいて、ストレージ1に割り当てる識別 IDのことである。本実施形態のように計算機2xとストレージ1の接続I/Fがファイバチャネルの場合には各ポート毎に唯一のD_ID(Destination ID)を備えるが、ポート番号の項があるので省略してもよいし、ファイバチャネルの初期化時に決定したD_IDを格納しても良い。SCSIの場合には同一ポートに複数のIDを備えることができるので、そのときの各LUNの属するTarget IDを格納する。本実施形態ではファイバチャネルを仮定しているので、Target IDの欄は未使用とし、一律0を格納する。
【0034】
仮想LUNと内部LUNは、計算機2xに割り当てた内部LUNと各計算機2xから認識される仮想LUNとの対応関係を示す。たとえば、内部LUN0は仮想LUN0として、また内部LUN2も仮想LUN0として定義する。両者はともに仮想LUN0として定義されているが、それぞれ使用できる計算機2xが異なる。
【0035】
WWNは、各計算機2xのファイバチャネルコントローラ250を特定する情報であるWorld Wide Nameを格納する。ファイバチャネルのポートとポートの接続関係を確立するポートログイン処理の際に、各計算機2xのWWN 2512がストレージ1に通知される。
【0036】
S_IDは、ファイバチャネルのフレームヘッダに格納されるID情報であり、フレームを作成したソース(イニシエータ)を識別するIDである。S_IDは、ファイバチャネルの初期化の際に、動的に割り当てられる。先に述べたWWNは初期化の際に交換された各ファイバチャネルポートにより一意に設定される値であるが、WWNとS_IDの関連づけを行うことで、フレーム毎にWWNを調べなくてもS_IDのみ検査することで計算機2xが特定できるようになっている。
【0037】
属性は、各LUの所有属性を示す。「専用」は1台の計算機2x専用のLUであることを示す。「共用」は複数の計算機2xが共用するLUであることを示す。
【0038】
ここで、図3のストレージ1の構成図と図4のLUN管理テーブル122の対応関係について説明する。計算機2aがWWN=WWNa、S_ID=S_IDa、計算機2bがWWN=WWNb、S_ID=S_IDb、計算機2nがWWN=WWNn、S_ID=S_IDn、管理コンソール4がWWN=WWNz、S_ID=S_IDzとすると、図3の計算機2a用ローカルLU13aは内部LUN=0、仮想LUN=0、計算機2b用ローカルLU13bは内部LUN=1、仮想LUN=0、計算機2n用ローカルLU13nは内部LUN=n、仮想LUN=0、計算機2a、2b、・・・、2nの共用LU14は内部LUN=k、仮想LUN=1とマッピングする。また、共用LU14は管理コンソール4でも共用するので、WWN=WWNz、S_ID=S_IDzに対応する内部LUN=kは仮想LUN=0としてマッピングする。なお、ここで管理コンソール4はストレージ1に専用のローカルLUを所持していないので、共用LU14を仮想LUN=0としてマッピングしている。
【0039】
管理コンソール4を操作する作業者は、管理コンソール4の入出力装置41からLUを定義し、作成する指示を送ることができる。この指示は、通信手段47によりストレージ1に発行される。ストレージ1の通信手段16はこの指示を受信し中央制御手段11に報告する。中央制御手段11はLU定義プログラム121を起動し、指示に従いLUを作成する。そして、定義されたLUのアクセス制御情報として、ポート番号と、Target IDと、仮想LUNと、内部LUNと、WWNと、S_IDと、属性をLUN管理テーブル122に格納する。この作業をすべての計算機2xに対して割り当てるLUの回数繰り返すことで上記LUN管理テーブル122の通りLUを作成できる。
【0040】
図5は管理コンソール4の構成図である。41は管理者が管理コンソール4を操作するための入出力装置、42は管理コンソール4全体の制御を司る中央制御手段、43は中央制御手段41が実行するプログラムやデータを格納するためのメモリ、45はファイバチャネル5eへの接続、制御を行うファイバチャネルボード、44はLAN6dを用いた通信を行うためのLANボード、46は管理コンソール4のOSやプログラムを格納するディスク装置、47はストレージとの間の通信を行う通信手段である。
【0041】
メモリ43において、431は計算機2xの電源を制御するリモートパワー制御プログラム、4311は計算機グループを管理する管理テーブルである。図6に該テーブル4311の構成を示す。該テーブル4311は、各計算機のグループ番号が記載される。同じグループに属する計算機は同時に起動することになり、1グループあたりの計算機数は、ストレージの性能等によって決定する。
【0042】
同図は同時起動数を3としたときの例である。なお、該テーブル4311は一度作成しておけば、計算機構成の変更やストレージの処理性能の変更等がなければ、次回からもそのまま使用することができる。
【0043】
次に計算機の起動作業の詳細動作について説明する。
【0044】
(1)管理テーブル作成
管理コンソール4を操作する作業者は、起動する複数計算機をいくつかのグループに分割し、入出力装置41から各計算機のグループ番号を管理テーブル4311に登録する。起動しない計算機についてはグループ番号を0とする。
【0045】
(2)計算機のパワーオン
リモートパワー制御プログラム431は、管理テーブル4311にしたがって、グループ番号1から順に各グループ毎に一定間隔でリモートパワーオンパケット900の作成・送信を行い、計算機 2xの起動を行なう。リモートパワーオンパケット900の送出間隔は、好ましくは計算機の起動時間と略同一とする。該パケット900は、計算機2xをパワーオンするためのパケットであり、その構成を図7に示す。該パケット900は、ヘッダ901とデータ部902からなる。データ部902は、同期部9021とリモートパワーオンする計算機2xのMACアドレス9022をn回連続したもので構成される。
【0046】
リモートパワー制御プログラム431はLANボード44を制御し同ボード44から該パケット900を計算機2xに送信する。
【0047】
計算機2xのLANボード24上にあるリモートパワーオン制御手段241は、該パケット900を受信する。同手段241は、該パケット900のデータ部902にあるMACアドレス9021を検出する。同手段241は、検出されたMACアドレス9021とLANボード24のMACアドレスとを比較し、同一であった場合はメイン電源スイッチ26を制御し、計算機2xをパワーオンする。パワーオンした計算機2xはストレージ1のローカルLU13xにある各計算機2x専用のOS 131xを読み込み、起動する。
【0048】
このようにして、計算機2xは、グループ毎に時間差をつけて順次起動していくので、ストレージへのアクセス集中の防止が可能となる。
【0049】
本実施形態によれば、計算機グループ毎に計算機の起動が行われ、常に一定数の計算機が起動するので、ストレージへのアクセスを時間的に分散することができ、過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0050】
(第二実施形態)
第一実施形態では、管理コンソールによる遠隔からの計画的なパワーオンの場合には有効であるが、操作者による直接のパワーオンの場合には対応できないという課題が残る。したがって管理コンソールによるパワーオンと操作者によるパワーオンの両方が混在する環境においては、ストレージへアクセスが集中する可能性がある。パワーオンの方法が混在する環境においても対応できるように、パワーオンの方法にはよらないアクセス集中防止策が必要である。本実施形態は、パワーオンの方法にはよらずにストレージへのアクセス集中を防止し、複数計算機の起動を行なうことができる。ここでは、遠隔からの計算機のパワーオンはLAN経由であることを想定し、説明する。
【0051】
図8は本実施形態の計算機システムの構成図である。第一実施形態との相違点は、ストレージ 1に新たに通信LU 17を備えたことである。通信LU 17はすべての計算機2xと管理コンソール4のいずれもがアクセス可能であり、計算機の起動状況を通信するためのLUである。通信LU17には計算機ステータステーブル171を格納する。該テーブル171は計算機2xの起動状況を表すテーブルである。
【0052】
図9に該テーブル171の構成を示す。該テーブル171には排他制御を行なうためのフラグブロックと計算機2x用のブロックがあり、それぞれ該テーブル171内のアドレスを一意に決めておく。フラグブロックのステータス1はいずれかの計算機2xがテーブルにアクセス中であることを表し、ステータス0はテーブルにアクセス中の計算機がいないことを表す。計算機2x用ブロックのステータス1はその計算機がOS起動中であることを表し、ステータス0は未起動、ステータス2は起動が終了したことを表す。計算機2xのブートアップ制御プログラム2511がファイルシステムを使用したファイルリード/ライトではなく、直接LUの論理ブロックをリード/ライトするRAW I/Oコマンドによりアクセスする。また、管理コンソール4は、この計算機ステータステーブル171をRAW I/Oでリードし、適当なタイミングでポーリングすることで各計算機2xの状況を逐次知ることができる。
【0053】
ブートアップ制御プログラム2511はファイバチャネル5xに接続した計算機2xの外部のストレージ1からOSを起動したり、通信LU117と通信するために用いられる。同プログラム2511は、フラッシュメモリ等を用いることにより、計算機2によって書き換え可能とすることもできる。
【0054】
次に計算機の起動作業の詳細動作について図10のフローチャートを用いながら説明する。
【0055】
(a) 計算機のパワーオン
管理コンソール4のリモートパワー制御プログラム431による遠隔からのパワーオンや、操作者による直接のパワーオン等によって、計算機2xがパワーオンする(図10のステップ701)。
【0056】
(b) ブートアップ制御プログラム始動
計算機2xはパワーオンするとファイバチャネルボード25のメモリ251にあるブートアップ制御プログラム2511を始動する(ステップ702)。
【0057】
(c) ブートアップ制御プログラムが計算機ステータステーブルを参照
ブートアップ制御プログラム2511は、ストレージ1の通信LU17にある計算機ステータステーブル171を参照する。
【0058】
該プログラム2511は、まずフラグブロックにアクセスし、アクセス中の計算機がいないか調べる。アクセス中の計算機がいなければフラグブロックを1に書き換え、計算機2x用のブロックを参照する。他の計算機がアクセス中であれば、アクセス終了まで待機する(ステップ703)。
【0059】
(d) 起動中の計算機数が閾値以下である
ブートアップ制御プログラム2511は、計算機ステータステーブル171の計算機2x用ブロックのステータス1の合計数によって起動中の計算機数を知ることができる。閾値はストレージの性能等によってあらかじめ決定された値であり、同時起動可能な計算機数を表す(ステップ704)。
【0060】
(e) 待機状態を画面表示
起動中の計算機数が閾値より多い場合は、フラグブロックのステータスを0に書き換え、一旦アクセスを終了し、他の計算機がOSの起動を終了して、起動中の計算機数が閾値以下になるまでブートアップ制御プログラム2511は待機する。その際、該プログラム2511は待機状態であることを操作者に伝えるため、入出力装置21の画面上に待機状態であることを表示する。該プログラム2511は一定時間経過した後、再び計算機ステータステーブル171にアクセスする(ステップ709)。
【0061】
(f) ブートアップ制御プログラムは自計算機のステータスを1に書き換える
起動中の計算機数が閾値以下であれば、ブートアップ制御プログラム2511は、次の処理に進む。起動中であることを表すため、該プログラム2511は、計算機ステータステーブル171の自計算機のステータスを1に書き換え、フラグブロックのステータスを0に戻し、該テーブル171へのアクセスを終了する(ステップ705)。
【0062】
(g) ブートアップ制御プログラムはOS起動開始
ブートアップ制御プログラム2511は、ストレージ1の計算機専用ローカルLU 13xにあるOS 131xの起動を開始する(ステップ706)。
【0063】
(h) OS起動完了後、ブートアップ制御プログラムは自計算機のステータスを0に書きかえる。
【0064】
OS 131xの起動が完了したことを表すため、ブートアップ制御プログラム2511は、計算機ステータステーブル171の自計算機のステータスを0に書き換える(ステップ707)。
【0065】
以上で計算機の起動動作が終了する。複数の計算機2xが同時に起動動作を実行した場合、閾値までは同時にOS 131xの起動処理が行なわれるが、閾値を超えた場合は、起動中の計算機2xがOS 131xの起動を完了し、計算機ステータステーブル171のステータスを書き換えるまで、他の計算機2xは待機することになる。これによって、ある一定数以上の計算機が同時にOS起動処理を行なうことがなくなり、ストレージ1への過剰なアクセス集中を抑制することができる。したがって、ストレージ1の性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0066】
本実施形態によれば、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散することができ、ストレージを共用する計算機システムにおいて、ストレージへの過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0067】
また、パワーオンの方法によらず適用可能であるので、遠隔からのパワーオンや直接のパワーオンが混在する環境においても有効である。
【0068】
また、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能となり、管理コストや人件費の削減につながる。
【0069】
(実施形態3)
本実施形態においても管理コンソールによる遠隔からの計算機のパワーオンだけでなく、操作者による直接のパワーオンの場合にも適用可能であり、パワーオンの方法にはよらずにストレージへのアクセスを分散した計算機の起動が可能である。ここでは、遠隔操作によるファイバチャネル経由での計算機のパワーオンを想定し、説明する。
【0070】
図11は本実施形態の計算機システムの構成図である。第二実施形態との相違点は、図8のLAN 6が存在していないことと通信LU 17に配置されていた計算機ステータステーブル171を管理コンソール4に配置し、新規に計算機起動制御プログラム432を配置したことであり、その他は同一である。
【0071】
図12は本実施形態の管理コンソールの構成図である。第二実施形態との相違点は、LANボードが存在しないことと、新規に計算機起動制御プログラム432を設け、ディスク装置46に計算機ステータステーブル171を格納したことである。計算機起動制御プログラム432は、OS起動処理をする計算機数を制御するためのプログラムである。計算機ステータステーブル171は図9に示すものと同一であり、計算機の起動状況を表すテーブルである。第二実施形態ではブートアップ制御プログラム2511が直接参照し、リード/ライトを行なったが、本実施形態では、ブートアップ制御プログラム2511は計算機起動制御プログラム432に通知し、計算機起動制御プログラム432がリード/ライトを行なう。
【0072】
図13は本実施形態の計算機2xの構成図である。第二実施形態の計算機2xとの相違点は、LANボードが存在しないことと、ファイバチャネルボード上にリモートパワーオン制御手段2501と待機電源2502が存在していることである。
【0073】
待機電源2502は計算機2xに設けたものであり、計算機2xのメイン電源がオフの状態でも、この待機電源2502だけはオンになっているように構成する。
【0074】
リモートパワーオン制御手段2501は、ファイバチャネルコントローラ250の内部に設けたものであり、待機電源2502に接続している。よって、たとえ計算機2xのメイン電源がオフの状態でも、ファイバチャネルコントローラ250が動作するよう制御することができる。そこで、ファイバチャネル5経由で到着するフレーム(パケット)を受信することができる。
【0075】
次に計算機の起動作業の詳細動作について図14のフローチャートを用いながら説明する。
【0076】
(a) 計算機のパワーオン
ファイバチャネルによるリモートパワーオン制御について説明する。図15は、ファイバチャネルを用いたリモートパワーオンフレーム950の一実施形態である。9501はSOF(Start of Frame)であり、フレームの先頭を示す。9502はフレームヘッダであり、フレームの送信ノードの情報やフレームの種別等の情報を格納する。9502aはブロードキャスト識別子であり、このフレームがブロードキャストフレームとして、同一ファイバチャネルに接続するすべてのノードに対し同時に発行されるフレームであることを示す。9503はペイロードでありこのフレームの転送データの実態である。9503x(xはa=n)はWWNであり、リモートパワーオンを実施する計算機2xのファイバチャネルコントローラ250のWWN 2512を格納する。9504はCRC(Cyclic Redundancy Code)であり、フレームのビット化けを検出するためのデータ保証コードである。9505はEOF(End Of Frame)であり、フレームの末尾であることを示す。
【0077】
次にファイバチャネルを用いたリモートパワーオン制御の動作を説明する。管理コンソール4のリモートパワー制御プログラム4311は、リモートパワーオンフレーム950を作成する。このときリモートパワーオンの対象となる少なくとも1台以上の計算機2xのWWNをフレーム950のペイロード9503に格納する。そして、ファイバチャネルボード45を制御してブロードキャストで同フレーム950を送信する。
【0078】
ここで、各計算機2xはすべて停止していると仮定する。計算機2x本体は停止しているものの、ファイバチャネルコントローラ250は、待機電源2502で動作しており、ファイバチャネル5により到着するフレームを待ち受けている。ここで、上記のリモートパワーオンフレーム950を受信したとすると、同コントローラ250のリモートパワーオン制御手段2501はこのフレーム950のフレームヘッダ9502を検査し、ブロードキャストフレームであることを確認する。次に、同コントローラ250のWWN2512が同フレーム950のペイロード9503に格納されているかどうか検査する。もし、格納されていれば同手段2501はメイン電源スイッチ26を制御することで電源オンにして、計算機2xを起動する。もし、格納されていなければ、このフレーム950を無視し再び待ち受け状態になる。
【0079】
ここで、リモートパワーオンフレーム950のペイロード9503に格納したWWNは、第一実施形態に記載のLANによるリモートパワーオンパケットと同様に同一のWWNを繰り返し何回か格納しても構わない。
【0080】
以上のように、LANがなくてもファイバチャネル5を用いてリモートパワーオン制御が可能になる。
【0081】
上記においては、ファイバチャネルのブロードキャストフレームを用いパワーオン制御を行う方法を説明したが、もしファイバチャネルコントローラがIPプロトコルに対応しているならば、図7に示すリモートパワーオンパケットを用いる方法もある。この場合も上記と構成、動作は同様である。しかし、パケットをそのまま使用できるので、リモートパワー制御プログラムをそのまま適用できる。
【0082】
このようにして、複数計算機2xをパワーオンする(図14のステップ801)。
【0083】
(b) ブートアップ制御プログラム始動
計算機2xはパワーオンするとファイバチャネルボード25のメモリ251にあるブートアップ制御プログラム2511を始動する(ステップ802)。
【0084】
(c) ブートアップ制御プログラムは管理コンソールの計算機起動制御プログラムに通知し、起動許可を待つ
ブートアップ制御プログラム2511は、起動開始であることを管理コンソール4の計算機起動制御プログラム432に通知するため、起動制御フレーム960を送出する。起動制御フレーム960は、ブートアップ制御プログラム2511が計算機2xの起動開始・終了を計算機起動制御プログラム432に通知したり、計算機起動制御プログラム432がブートアップ制御プログラム2511に起動許可を与えるために用いられるフレームである。図16に起動制御フレーム960の構成を示す。リモートパワーオンフレーム950との相違点は起動識別子96032が存在することである。計算機起動制御プログラム432は、WWN 96031によって計算機を特定し、起動識別子96032によってその計算機が起動開始か起動終了かを知ることができる(ステップ803)。
【0085】
(d) 計算機起動制御プログラムは、計算機ステータステーブルを参照
通知を受けた計算機起動制御プログラム432は、起動中の計算機数を知るために、ディスク装置46にある計算機ステータステーブル171を参照する。該テーブル171は図9に示すものと同一であり、計算機2xの起動状況を表すテーブルである。なお、本実施形態では該テーブル171を参照できるのは管理コンソールだけであり、排他制御が不要であるため、フラグブロックは使用しない(ステップ804)。
【0086】
(e) 起動中の計算機数が閾値以下である
計算機起動制御プログラム432は、計算機ステータステーブル171のステータス1の数によって起動中の計算機数を知ることができる。起動中の計算機数が閾値より多い場合は、他の計算機から起動終了通知が来て、起動中の計算機数が閾値以下になるまでブートアップ制御プログラム2511を待機させる。このとき、計算機起動制御プログラム432は、ブートアップ制御プログラム2511に待機命令を伝えるため起動制御フレーム960を送出する。起動中の計算機数が閾値以下であれば、計算機起動制御プログラム432は、次の処理に進む(ステップ805)。
【0087】
(f) 待機状態を画面表示
起動制御フレーム960が送出されると、ブートアップ制御プログラム2511はWWN 96031によって自分宛のフレームかどうかを判断し、起動制御識別子96032によって待機命令を受けたことを知ることができる。待機命令を受けた該プログラム2511は、待機状態であることを操作者に伝えるため、入出力装置21の画面上に待機状態であることを表示する。該プログラム2511は一定時間経過した後、再び管理コンソール4の計算機起動制御プログラム432に起動開始の起動制御フレーム960を送出する(ステップ812)。
【0088】
(g) 計算機起動制御プログラムは通知を受けた計算機のステータスを1に書き換える
起動中の計算機数が閾値以下であれば、計算機起動制御プログラム432は、次の処理に進む。通知を受けた計算機が起動中であることを表すため、該プログラム432は、計算機ステータステーブル171の通知を受けた計算機のステータスを1に書き換える(ステップ806)。
【0089】
(h) 計算機起動制御プログラムは、ブートアップ制御プログラムに起動許可を与える
計算機起動制御プログラム432は、ブートアップ制御プログラム2511に起動許可を与えるため起動制御フレーム960を送出する。待機していたブートアップ制御プログラム2511はWWN 96031によって自分宛のフレームかどうかを判断し、起動制御識別子96032によって起動許可を受けたことを知ることができる(ステップ807)。
【0090】
(i) 起動許可を受けたブートアップ制御プログラムはOS起動開始
起動許可を受けたブートアップ制御プログラム2511は、ストレージ1の計算機専用ローカルLU13xにあるOS 131xの起動を開始する(ステップ808)。
【0091】
(j) OS起動完了後、ブートアップ制御プログラムは計算機起動制御プログラムに起動完了通知
ブートアップ制御プログラム2511は、計算機起動制御プログラム432に、OS 131xの起動が完了したことを通知するため、起動制御フレーム960を送出する(ステップ809)。
【0092】
(k) 計算機起動制御プログラムは通知を受けた計算機のステータスを0に書きかえる
OS 131xの起動が完了したことを表すため、計算機起動制御プログラム432は、計算機ステータステーブル171の通知を受けた計算機のステータスを0に書き換える(ステップ810)。
【0093】
以上で計算機の起動動作が終了する。複数の計算機2xが同時に起動動作を実行した場合、閾値までは同時にOS 131xの起動処理が行なわれるが、閾値を超えた場合は、起動中の計算機2xがOS 131xの起動を完了し、管理コンソールに起動終了を通知するまで、他の計算機2xは待機することになる。これによって、ある一定数以上の計算機が同時にOS起動処理を行なうことがなくなり、ストレージ1への過剰なアクセス集中を抑制することができる。したがって、ストレージ1の性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。第二実施形態が、各計算機による分散型起動数制御方式であったのに対し、本実施形態は、管理コンソールによる集中型起動数制御方式といえる。
【0094】
以上の通り、本実施形態によれば、OS起動状況を確認するために複数の計算機と管理コンソールの間に必要な通信と、リモートパワーオン制御をLANを用いずにファイバチャネル経由で行うことができるので、LANそのものを削除することができる。これにより、上記第二実施形態と同一の効果に加え、さらに、LANの設備コストやメンテナンスコストを低減でき、さらに低コスト化を実現することができるという効果がある。
【0095】
また、本実施形態によれば、管理コンソールと通信して起動制御を行なうため、さらにストレージへの負荷を低減できるという効果がある。さらに、起動制御を集中化することにより、計算機の管理・起動状況の把握が容易になるという効果がある。
【0096】
【発明の効果】
本発明によれば、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散することができるので、ストレージを共用する計算機システムにおいて、ストレージへの過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができるという効果がある。また、本発明によれば、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能となり、管理コストや人件費の削減につながるという効果がある。
【0097】
さらに本発明によれば、LANを用いずにファイバチャネルだけで起動作業を実行できるので、システム導入時のLANとファイバチャネルの2種類のケーブルを敷設することにより発生する導入コストや、維持管理のための運用コストを低減することができるという効果がある。
【図面の簡単な説明】
【図1】第1実施形態の計算機システムの構成図。
【図2】第1実施形態の計算機の構成図。
【図3】第1実施形態のストレージの構成図。
【図4】第1実施形態のストレージのLUN管理テーブルの構成図。
【図5】第1実施形態の管理コンソールの構成図。
【図6】第1実施形態の管理テーブルの構成図。
【図7】第1実施形態のリモートパワーオンパケットの構成図。
【図8】第2実施形態の計算機システムの構成図。
【図9】第2実施形態の計算機ステータステーブルの構成図。
【図10】第2実施形態の計算機の起動動作のフローチャート。
【図11】第3実施形態の計算機システムの構成図。
【図12】第3実施形態の管理コンソールの構成図。
【図13】第3実施形態の計算機の構成図。
【図14】第3実施形態の計算機の起動動作のフローチャート。
【図15】第3実施形態のファイバチャネルのリモートパワーオンフレームの構成図。
【図16】第3実施形態の起動制御フレームの構成図。
【図17】従来技術の計算機システムの構成図。
【符号の説明】
1…ストレージ、11…中央制御手段、12…メモリ、13…計算機専用ローカルLU、14…共用LU、15…ファイバチャネルコントローラ、16…通信手段、17…通信LU、121…LU定義プログラム、122…LUN管理テーブル、123…アクセス制御プログラム、131…OS、171…計算機ステータステーブル、2…計算機、21…入出力装置、22…中央制御手段、23…メモリ、24…LANボード、241…リモートパワーオン制御手段、25…ファイバチャネルボード、250…ファイバチャネルコントローラ、2501…リモートパワーオン制御手段、2502…待機電源、251…メモリ、2511…ブートアップ制御プログラム、2512…WWN、26…メイン電源スイッチ、3…ファイバチャネル接続装置、4…管理コンソール、41…入出力装置、42…中央制御手段、43…メモリ、431…リモートパワー制御プログラム、4311…管理テーブル、432…計算機起動制御プログラム、44…LANボード、45…ファイバチャネルボード、46…ディスク装置、47…通信手段、5…ファイバチャネル、6…LAN、7…通信I/F、900…リモートパワーオンパケット、950…リモートパワーオンフレーム、960…起動制御フレーム、100…ストレージ、1001…OS、200…計算機、400…サーバ、500…接続インターフェース、600…LAN。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a method for starting up an OS of a plurality of computers sharing a storage, and more particularly to a method of preventing performance degradation due to centralized storage access of a plurality of computers when the OS is started up.
[0002]
[Prior art]
As a computer system using a plurality of computers, a computer system including a plurality of computers, a server that manages the plurality of computers, and a storage shared by the plurality of computers is known. This will be described with reference to the example of FIG.
[0003]
In the figure, 200x (200a = 200n) is a computer, 100 is a storage shared by the
[0004]
When the computer 200x is powered on, first, the computer 200x accesses the
[0005]
[Problems to be solved by the invention]
(Task)
In the above prior art, if multiple computers are started at the same time, access will be concentrated on the server and storage, and in the case of processing that requires a load such as OS startup, the processing performance will be reduced and the OS startup will be significant. There is a problem that it takes time. The more computers that start up at the same time, the longer the OS start-up time becomes. If a large number of computers are used, the business will be hindered.
[0006]
If each operator starts up with different power-on times, concentration of access to the storage can be avoided, but it is possible to know when other operators turn on the power, wait for other computers to start up, and always turn on the power. There is a problem that the computer must be turned on while considering the above. The power must be turned on every time the computer is used, and there is a problem that the operator takes extra time each time.
[0007]
(the purpose)
An object of the present invention is to provide a method in which an administrator or an operator can start a plurality of computers without spending new labor and time for starting the computers in a computer system sharing a storage, and the plurality of computers By providing a method to distribute the load on the storage temporally at the time of OS startup, it is possible to prevent performance degradation due to concentration of access to the storage and shorten the OS startup time.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, a computer system including a plurality of computers, a management console for powering on the plurality of computers, and a storage shared by the plurality of computers and the management console is constructed.
[0009]
In the first means of the present invention, the management console includes a remote power control program for controlling the power sources of a plurality of computers from a remote location, and a management table for managing computer groups.
[0010]
The computer includes remote power-on control means that can control power from a remote location.
[0011]
The remote power control program enables time distribution of access to the storage by powering on the computer groups with a time difference according to the computer groups defined in the management table.
[0012]
In the second means of the present invention, the plurality of computers and the management console are connected to the storage through a connection interface such as a fiber channel.
[0013]
The management console includes a remote power control program for controlling the power sources of a plurality of computers from a remote location.
[0014]
The computer includes remote power-on control means that can control power from a remote location, and a boot-up control program that controls the startup of the OS and transmits the startup status of the computer.
[0015]
The storage includes a logical unit dedicated to each of a plurality of computers, a communication logical unit that can be used by all computers, records the startup status of the computer, and an LU definition program that defines and creates these logical units. Prepare.
[0016]
The boot-up control program refers to the communication logic unit and controls the number of computers, thereby enabling distributed access to the storage and starting up the OS of the computer.
[0017]
According to a third means of the present invention, in the second means, instead of the communication logic unit arranged in the storage, the management console has a computer activation control program for controlling the activation of the computer, and the centralized activation control. It is characterized by performing.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
(First embodiment)
In the prior art, a system configuration using a server has been taken, but in this embodiment, a serverless system configuration that is excellent in terms of operation management and performance is adopted. In this case as well, the problem of concentration of access to the storage at the time of starting up a plurality of computers as described in the prior art is the same. Of course, the present invention is not limited to this configuration.
[0019]
FIG. 1 is a configuration diagram of a computer system according to this embodiment. In the figure, 2x (2a = 2n) is the computer, 1 is the storage shared by all the
[0020]
In the following description, the computer is assumed to be a client computer such as a PC (Personal Computer), but the present invention can also be applied to other computers such as servers and workstations. The interface for connecting the computer to the storage (hereinafter abbreviated as I / F) is assumed to be a fiber channel that is optimal in terms of the connection distance and speed, but SCSI (Small Computer System Interface), USB ( It can be applied to various I / Fs such as Universal Serial Bus) and IEEE1394.
[0021]
FIG. 2 is a configuration diagram of the computer 2x. 21 is an input / output device for the user of the
[0022]
In the
[0023]
26 is a main power switch of the
[0024]
FIG. 3 is a configuration diagram of the
[0025]
Here, the logical unit LU is a virtual volume provided inside the
[0026]
The logical unit 13x is a LU dedicated to the
[0027]
In the
[0028]
Explain LU. An LU is a logical volume as seen from the host computer of storage. The host computer recognizes one LU as one logical disk device.
[0029]
The
[0030]
On the other hand, when a plurality of
(a) Search LUNs in order from 0
(b) Assuming that LUNs exist with consecutive numbers, if there is no number, no further search is performed.
These are two points. This is a device for shortening the search time. It is assumed that the
[0031]
An example of the LUN management table 122 provided in the
[0032]
The port number stores the number of the Fiber Channel connection port provided in the
[0033]
TargetID is an identification ID assigned to the
[0034]
The virtual LUN and the internal LUN indicate a correspondence relationship between the internal LUN assigned to the
[0035]
The WWN stores a World Wide Name that is information for identifying the
[0036]
S_ID is ID information stored in the Fiber Channel frame header, and is an ID for identifying the source (initiator) that created the frame. The S_ID is dynamically assigned when the Fiber Channel is initialized. The WWN mentioned above is a value uniquely set by each Fiber Channel port exchanged at the time of initialization. By associating the WWN with the S_ID, only the S_ID is required without checking the WWN for each frame. By checking, the
[0037]
The attribute indicates the ownership attribute of each LU. “Dedicated” indicates that the LU is dedicated to one
[0038]
Here, the correspondence between the configuration diagram of the
[0039]
An operator who operates the
[0040]
FIG. 5 is a configuration diagram of the
[0041]
In the
[0042]
This figure is an example when the number of simultaneous activations is three. Once the table 4311 is created, it can be used as it is from the next time if there is no change in the computer configuration or storage processing performance.
[0043]
Next, the detailed operation of the computer startup work will be described.
[0044]
(1) Management table creation
An operator who operates the
[0045]
(2) Computer power on
The remote
[0046]
The remote
[0047]
The remote power-on control means 241 on the
[0048]
In this way, since the
[0049]
According to this embodiment, computers are activated for each computer group, and a certain number of computers are always activated, so that access to the storage can be distributed over time and excessive access concentration is suppressed. Can do. Therefore, it is possible to prevent the storage performance from degrading, and to shorten the OS startup time in the entire system.
[0050]
(Second embodiment)
In the first embodiment, although effective in the case of planned power-on from a remote location by the management console, there remains a problem that it cannot be handled in the case of direct power-on by the operator. Therefore, in an environment where both power-on by the management console and power-on by the operator are mixed, access to the storage may be concentrated. An access concentration prevention measure that does not depend on the power-on method is necessary so that it can cope with an environment where the power-on method is mixed. This embodiment can prevent concentration of access to the storage regardless of the power-on method, and can start a plurality of computers. Here, it is assumed that the computer is powered on remotely via a LAN.
[0051]
FIG. 8 is a configuration diagram of the computer system of this embodiment. The difference from the first embodiment is that the
[0052]
FIG. 9 shows the configuration of the table 171. The table 171 has a flag block for performing exclusive control and a block for the
[0053]
The boot-up
[0054]
Next, the detailed operation of the computer startup operation will be described with reference to the flowchart of FIG.
[0055]
(a) Computer power on
The
[0056]
(b) Bootup control program start
When the
[0057]
(c) Bootup control program refers to the computer status table
The
[0058]
The
[0059]
(d) The number of running computers is below the threshold
The boot-up
[0060]
(e) Display standby status on screen
If the number of running computers is greater than the threshold, rewrite the status of the flag block to 0, once access is terminated, until the other computers finish booting the OS and the number of running computers falls below the threshold The
[0061]
(f) The bootup control program rewrites its own computer status to 1.
If the number of running computers is less than or equal to the threshold value, the
[0062]
(g) Boot-up control program starts OS startup
The
[0063]
(h) After completing OS startup, the bootup control program rewrites the status of its own computer to 0.
[0064]
In order to indicate that the activation of the OS 131x is completed, the
[0065]
This completes the startup operation of the computer. When
[0066]
According to the present embodiment, when the OS of a plurality of computers is started, the load on the storage can be distributed over time, and excessive access concentration to the storage can be suppressed in the computer system sharing the storage. Therefore, it is possible to prevent the storage performance from degrading, and to shorten the OS startup time in the entire system.
[0067]
Further, since it can be applied regardless of the power-on method, it is also effective in an environment where remote power-on and direct power-on are mixed.
[0068]
In addition, the administrator or the operator can start up a plurality of computers without spending new labor and time for starting up the computers, leading to reduction in management costs and labor costs.
[0069]
(Embodiment 3)
This embodiment can be applied not only to remote computer power-on by the management console but also to direct power-on by the operator, and distributes access to the storage regardless of the power-on method. Can be started. Here, a description will be given assuming that the computer is powered on via a fiber channel by remote control.
[0070]
FIG. 11 is a configuration diagram of the computer system of this embodiment. The difference from the second embodiment is that the LAN 6 in FIG. 8 does not exist and the computer status table 171 arranged in the communication LU 17 is arranged in the
[0071]
FIG. 12 is a configuration diagram of the management console of this embodiment. The difference from the second embodiment is that there is no LAN board, a computer
[0072]
FIG. 13 is a configuration diagram of the
[0073]
The
[0074]
The remote power-on control means 2501 is provided inside the
[0075]
Next, the detailed operation of the computer startup operation will be described with reference to the flowchart of FIG.
[0076]
(a) Computer power on
The remote power-on control using the fiber channel will be described. FIG. 15 is an embodiment of a remote power-on
[0077]
Next, the operation of remote power-on control using a fiber channel will be described. The remote
[0078]
Here, it is assumed that all the
[0079]
Here, as the WWN stored in the
[0080]
As described above, remote power-on control can be performed using the
[0081]
In the above, the method of performing power-on control using a Fiber Channel broadcast frame has been described. However, if the Fiber Channel controller supports the IP protocol, there is also a method of using the remote power-on packet shown in FIG. . In this case, the configuration and operation are the same as above. However, since the packet can be used as it is, the remote power control program can be applied as it is.
[0082]
In this way, the plurality of
[0083]
(b) Bootup control program start
When the
[0084]
(c) The bootup control program notifies the computer startup control program of the management console and waits for startup permission
The boot-up
[0085]
(d) Refer to the computer status table for the computer startup control program
The computer
[0086]
(e) The number of running computers is below the threshold
The computer
[0087]
(f) Screen display of standby status
When the
[0088]
(g) The computer startup control program rewrites the status of the computer that received the notification to 1.
If the number of activated computers is equal to or less than the threshold value, the computer
[0089]
(h) The computer startup control program gives startup permission to the bootup control program
The computer
[0090]
(i) Boot-up control program that has received start permission starts OS start
The
[0091]
(j) After completing OS startup, the bootup control program notifies the computer startup control program of startup completion.
The boot-up
[0092]
(k) The computer startup control program rewrites the status of the notified computer to 0
In order to indicate that the activation of the OS 131x has been completed, the computer
[0093]
This completes the startup operation of the computer. When
[0094]
As described above, according to the present embodiment, it is possible to perform communication necessary between a plurality of computers and a management console in order to check the OS startup status and remote power-on control via a fiber channel without using a LAN. Yes, you can delete the LAN itself. Thereby, in addition to the same effect as the second embodiment, there is an effect that the LAN equipment cost and the maintenance cost can be further reduced, and further cost reduction can be realized.
[0095]
Further, according to the present embodiment, since the activation control is performed by communicating with the management console, there is an effect that the load on the storage can be further reduced. Furthermore, by centralizing the start control, there is an effect that it becomes easy to grasp the management / start state of the computer.
[0096]
【The invention's effect】
According to the present invention, when the OS of a plurality of computers is activated, the load on the storage can be temporally distributed, so that excessive access concentration to the storage can be suppressed in the computer system sharing the storage. Therefore, the storage performance can be prevented from being lowered, and the OS startup time in the entire system can be shortened. Further, according to the present invention, an administrator or an operator can start up a plurality of computers without spending new labor and time for starting up the computers, leading to an effect of reducing management costs and labor costs.
[0097]
Furthermore, according to the present invention, since the start-up operation can be performed only by the fiber channel without using the LAN, the introduction cost generated by laying two types of cables of the LAN and the fiber channel at the time of system introduction, and maintenance management Therefore, there is an effect that the operation cost can be reduced.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a computer system according to a first embodiment.
FIG. 2 is a configuration diagram of a computer according to the first embodiment.
FIG. 3 is a configuration diagram of a storage according to the first embodiment.
FIG. 4 is a configuration diagram of a storage LUN management table according to the first embodiment;
FIG. 5 is a configuration diagram of a management console according to the first embodiment.
FIG. 6 is a configuration diagram of a management table according to the first embodiment.
FIG. 7 is a configuration diagram of a remote power-on packet according to the first embodiment.
FIG. 8 is a configuration diagram of a computer system according to a second embodiment.
FIG. 9 is a configuration diagram of a computer status table according to the second embodiment.
FIG. 10 is a flowchart of the startup operation of the computer according to the second embodiment.
FIG. 11 is a configuration diagram of a computer system according to a third embodiment.
FIG. 12 is a configuration diagram of a management console according to the third embodiment.
FIG. 13 is a configuration diagram of a computer according to a third embodiment.
FIG. 14 is a flowchart of the startup operation of the computer according to the third embodiment.
FIG. 15 is a configuration diagram of a fiber channel remote power-on frame according to a third embodiment;
FIG. 16 is a configuration diagram of an activation control frame according to the third embodiment.
FIG. 17 is a configuration diagram of a conventional computer system.
[Explanation of symbols]
DESCRIPTION OF
Claims (8)
ストレージは、各々の計算機専用に設けたローカル論理ボリュームと、全ての計算機がアクセス可能な通信論理ボリュームを備え、
通信論理ボリュームは、全ての計算機の起動状況を記録する計算機ステータステーブルを備え、
計算機は、OSの起動を制御し計算機の起動状況を伝えるブートアップ制御プログラムを備え、
計算機ステータステーブルは、ブートアップ制御プログラムによって各々の計算機の起動状況が記載され、ブートアップ制御プログラムは、起動中の計算機数を知るために計算機ステータステーブルを参照し、その起動状況によって計算機のOS起動開始のタイミングを制御することで、ストレージへのアクセス分散を可能にし、計算機のOS起動を実行することを特徴とする計算機システム。In a computer system in which at least two or more computers and all the computers are connected to a storage that is directly accessible via a storage interface,
The storage has a local logical volume dedicated to each computer and a communication logical volume accessible to all computers.
The communication logical volume has a computer status table that records the startup status of all computers.
The computer has a boot-up control program that controls the startup of the OS and communicates the startup status of the computer.
The computer status table describes the startup status of each computer by the boot-up control program. The boot-up control program refers to the computer status table to know the number of computers that are running, and the OS startup of the computer depends on the startup status. A computer system that distributes access to storage by controlling the start timing and executes the OS startup of the computer.
前記計算機がパワーオンし、前記ブートアップ制御プログラムを始動するステップと、
前記ブートアップ制御プログラムが前記通信論理ボリュームの計算機ステータステーブルにアクセスし、全計算機の起動状況を参照するステップと、
前記ブートアップ制御プログラムが、前記計算機ステータステーブルの各々の計算機の専用領域に起動状況を記載するステップとを備えたことを特徴とする計算機の起動の方法。In the computer system according to claim 1 ,
Powering on the computer and starting the bootup control program;
The bootup control program accessing the computer status table of the communication logical volume and referring to the startup status of all computers;
The bootup control program includes a step of writing a boot status in a dedicated area of each computer in the computer status table.
ストレージは、全ての計算機とコンソールがそれぞれアクセス可能な通信論理ボリュームと呼ぶ共用論理ボリュームを備え、
通信論理ボリュームは、各々の計算機専用に、その計算機だけが書き込み可能であると定めた専用論理領域を備え、
前記専用論理領域は、各々の計算機の起動状況を記載するものであり、前記計算機が各計算機の前記専用論理領域を適当なタイミングでリードすることにより、各計算機における起動状況を認識することを特徴とする通信の方法。In the computer system according to claim 1 ,
The storage has a shared logical volume called a communication logical volume that can be accessed by all computers and consoles.
The communication logical volume is dedicated to each computer and has a dedicated logical area that is defined as writable only by that computer.
The dedicated logical area describes the activation status of each computer, and the computer recognizes the activation status of each computer by reading the dedicated logical area of each computer at an appropriate timing. Communication method.
計算機は、OSの起動を制御し計算機の起動状況を伝えるブートアップ制御プログラムを備え、
コンソールは、計算機の起動を制御する計算機起動制御プログラムと計算機の起動状況を記録する計算機ステータステーブルを備え、
ブートアップ制御プログラムは計算機起動制御プログラムに起動状況を通信し、計算機起動制御プログラムは、計算機ステータステーブルを参照し、計算機の起動数を制御するためにブートアップ制御プログラムに通信することで、ストレージへのアクセスの時間的分散を可能にし、計算機のOS起動を実行することを特徴とする計算機システム。In the computer system further comprising a console in the configuration of the computer system according to claim 1 ,
The computer has a boot-up control program that controls the startup of the OS and communicates the startup status of the computer.
The console has a computer startup control program that controls the startup of the computer and a computer status table that records the startup status of the computer.
The boot-up control program communicates the startup status to the computer startup control program, and the computer startup control program refers to the computer status table and communicates with the boot-up control program to control the number of startups of the computer. A computer system characterized by enabling time distribution of access and executing OS startup of computers.
前記計算機がパワーオンし、前記ブートアップ制御プログラムを始動するステップと、前記ブートアップ制御プログラムが前記計算機起動制御プログラムに起動状況を通知するステップと、前記計算機起動制御プログラムが前記計算機ステータステーブルを参照するステップと、前記計算機起動制御プログラムが前記計算機ステータステーブルを書き換えるステップと、前記計算機起動制御プログラムが前記ブートアップ制御プログラムに通知するステップを備えたことを特徴とする計算機の起動の方法。The computer system according to claim 4, wherein
The computer is powered on and the bootup control program is started; the bootup control program notifies the computer startup control program of the startup status; and the computer startup control program refers to the computer status table And a step of rewriting the computer status table by the computer activation control program, and a step of notifying the bootup control program by the computer activation control program.
前記コンソールおよび計算機が接続するためのインタフェースはファイバチャネルであり、
前記コンソールおよび計算機はファイバチャネルを制御する手段を備え、
前記コンソールおよび計算機が備えるファイバチャネルを制御する手段は、ブロードキャスト可能なメッセージフレームで、その内部に、少なくとも1台以上の計算機に実装したファイバチャネルを制御する手段を特定するための識別子であるWorld Wide Nameと、前記計算機の起動状況や前記コンソールが発行する制御情報を特定するための起動制御識別子を格納したメッセージフレームを送信可能であり、
前記ファイバチャネルを制御する手段は、前記コンソールおよび計算機が発行したブロードキャストのメッセージフレームに、当該ファイバチャネルを制御する手段を特定するための識別子であるWorld Wide Nameが格納されていることを確認した時には、前記起動制御識別子の内容に従って起動制御を実行することを特徴とする計算機とコンソールの通信の方法。The computer system according to claim 4, wherein
The interface for connecting the console and the computer is Fiber Channel,
Said console and computer comprise means for controlling the fiber channel;
The means for controlling the fiber channel included in the console and the computer is a message frame that can be broadcast, and is an identifier for specifying the means for controlling the fiber channel mounted in at least one computer inside the message frame. Name, and a message frame storing a startup control identifier for specifying the startup status of the computer and control information issued by the console can be transmitted,
When the means for controlling the Fiber Channel confirms that a World Wide Name that is an identifier for identifying the means for controlling the Fiber Channel is stored in the broadcast message frame issued by the console and the computer. A method of communication between a computer and a console, characterized in that activation control is executed according to the contents of the activation control identifier.
前記ブートアップ制御プログラムは、起動数制御により待機中の状態であることを前記計算機の操作者に伝えるために、前記計算機の出力装置にその旨を表示することを特徴とする計算機の起動の方法。In the computer system according to claims 1 and 4 ,
In order to inform the operator of the computer that the boot-up control program is in a standby state by controlling the number of activations, the computer startup method displays the fact on the computer output device. .
前記計算機が備えるブートアップ制御プログラムは電源起動時に実行されるプログラムであり、
前記計算機の起動数を制御し、前記計算機によって書き換え可能であるブートアップ制御プログラムを備えたことを特徴とする計算機システム。In the computer system according to claims 1 and 4 ,
The bootup control program provided in the computer is a program executed when the power is turned on,
A computer system comprising a boot-up control program that controls the number of startups of the computer and is rewritable by the computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000067150A JP3864664B2 (en) | 2000-03-07 | 2000-03-07 | OS startup method for multiple computers sharing storage |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000067150A JP3864664B2 (en) | 2000-03-07 | 2000-03-07 | OS startup method for multiple computers sharing storage |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001249908A JP2001249908A (en) | 2001-09-14 |
JP3864664B2 true JP3864664B2 (en) | 2007-01-10 |
Family
ID=18586389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000067150A Expired - Fee Related JP3864664B2 (en) | 2000-03-07 | 2000-03-07 | OS startup method for multiple computers sharing storage |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3864664B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141054A (en) | 2001-11-07 | 2003-05-16 | Hitachi Ltd | Storage management computer |
JP4329412B2 (en) * | 2003-06-02 | 2009-09-09 | 株式会社日立製作所 | File server system |
JPWO2006001051A1 (en) * | 2004-06-24 | 2008-04-17 | 富士通株式会社 | Multiprocessor device and control method thereof |
US8201004B2 (en) | 2006-09-14 | 2012-06-12 | Texas Instruments Incorporated | Entry/exit control to/from a low power state in a complex multi level memory system |
US9614853B2 (en) * | 2015-01-20 | 2017-04-04 | Enzoo, Inc. | Session security splitting and application profiler |
JP6874590B2 (en) | 2017-08-14 | 2021-05-19 | 富士通株式会社 | Information processing system, management device, control method of information processing system |
JP7163791B2 (en) | 2019-01-24 | 2022-11-01 | 富士通株式会社 | Parallel processing device, node startup method, node startup program |
-
2000
- 2000-03-07 JP JP2000067150A patent/JP3864664B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001249908A (en) | 2001-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5272709B2 (en) | Address assignment method, computer, physical machine, program, and system | |
US6912627B2 (en) | Method of creating a storage area & storage device | |
US6810462B2 (en) | Storage system and method using interface control devices of different types | |
US8190717B2 (en) | Method of booting an operating system | |
JP4568574B2 (en) | Storage device introduction method, program, and management computer | |
US6775830B1 (en) | Computer system and a program install method thereof | |
JP3918394B2 (en) | Data migration method | |
US6633962B1 (en) | Method, system, program, and data structures for restricting host access to a storage space | |
US7412544B2 (en) | Reconfigurable USB I/O device persona | |
US20060155837A1 (en) | Diskless computer operation management system | |
JP2003030053A (en) | Storage subsystem having security function for each logical unit | |
JP2004220450A (en) | Storage device, its introduction method and its introduction program | |
JP2005202495A (en) | Data transfer method | |
KR20080037647A (en) | Method and system for managing virtual instances of a physical port attached to a network | |
US7185341B2 (en) | System and method for sharing PCI bus devices | |
US7568069B2 (en) | Method for creating a large-scale storage array system out of multiple mid-range storage arrays | |
US20020144024A1 (en) | Method and system for assigning peripheral devices to logical ports of a network peripheral server | |
JP2001075853A (en) | Computer system, and computer and storage device used for the computer system | |
JP3864664B2 (en) | OS startup method for multiple computers sharing storage | |
JP3809548B2 (en) | Computer system and program installation method | |
US20140317247A1 (en) | Computer system, method for starting a server computer, server computer, management station, and use | |
JP2006155640A (en) | Access setting method | |
JP2005322254A (en) | Computer system, computer used for this computer system, and storage device | |
JP3861920B2 (en) | Computer system and program installation method | |
KR20000035025A (en) | Data processing system and method for remotely accessing a client computer system's indivisual initialization settings while the client is powered off |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060620 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060925 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091013 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101013 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111013 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121013 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121013 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131013 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |