JP3864664B2 - OS startup method for multiple computers sharing storage - Google Patents

OS startup method for multiple computers sharing storage Download PDF

Info

Publication number
JP3864664B2
JP3864664B2 JP2000067150A JP2000067150A JP3864664B2 JP 3864664 B2 JP3864664 B2 JP 3864664B2 JP 2000067150 A JP2000067150 A JP 2000067150A JP 2000067150 A JP2000067150 A JP 2000067150A JP 3864664 B2 JP3864664 B2 JP 3864664B2
Authority
JP
Japan
Prior art keywords
computer
control program
startup
status
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000067150A
Other languages
Japanese (ja)
Other versions
JP2001249908A (en
Inventor
陽一 水野
直人 松並
秀樹 神牧
純 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000067150A priority Critical patent/JP3864664B2/en
Publication of JP2001249908A publication Critical patent/JP2001249908A/en
Application granted granted Critical
Publication of JP3864664B2 publication Critical patent/JP3864664B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)
  • Multi Processors (AREA)
  • Stored Programmes (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ストレージを共用する複数計算機のOS起動の方法に関し、特に、OS起動時に複数計算機のストレージ集中アクセスによる性能低下を防止する方法に関する。
【0002】
【従来の技術】
複数の計算機を用いた計算機システムとして、複数の計算機と、複数の計算機を管理するサーバと、複数の計算機が共用するストレージを備えた計算機システムが知られている。図17の例を用いて説明する。
【0003】
同図において、200x(200a=200n)は計算機、100は計算機200xが共用するストレージ、1001は計算機200xがダウンロードするOS、400は計算機を設置してある場所とは物理的に離れた場所にあるサーバ、500はサーバ400とストレージ100を接続する接続インターフェース、600x(600a=600n)は複数の計算機200xとサーバ400が通信するためのLAN(Local Area Network)である。
【0004】
計算機200xがパワーオンすると、まず、計算機200x はLAN 600x経由でサーバ400にアクセスする。次に、ストレージ100にあるOS 1001をダウンロードし、起動を開始する。複数の計算機 200xがパワーオンすると、パワーオンした全ての計算機 200xがOS 1001をダウンロードしようとするため、サーバ 400やストレージ 100への負荷が増大することになる。
【0005】
【発明が解決しようとする課題】
(課題)
上記従来技術では、複数の計算機を同時に起動しようとすると、サーバやストレージにアクセスが集中することになり、OS起動のような負荷のかかる処理の場合、処理性能が低下し、OS起動に多大な時間がかかるという課題がある。同時に起動する計算機数が多いほどOS起動時間は長大化し、多台数の計算機を使用する場合、業務に支障を来すことになる。
【0006】
それぞれの操作者が電源投入時間をずらして起動すればストレージへのアクセス集中は回避できるが、他の操作者がいつ電源を入れるかを把握し、他の計算機の起動を待ち、常に電源投入時間を考慮しながら計算機に電源を投入しなけらばならないという課題がある。電源投入は計算機を使用するたびに行なわなければならず、操作者はその都度余計な手間がかかるという課題がある。
【0007】
(目的)
本発明の目的は、ストレージを共用する計算機システムにおいて、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能な方法を提供し、かつ、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散する方法を提供することにより、ストレージへのアクセス集中による性能低下を防止し、OS起動時間を短縮することである。
【0008】
【課題を解決するための手段】
上記の目的を達成するために、複数の計算機と、複数の計算機をパワーオンするための管理コンソールと、複数の計算機と管理コンソールが共用するストレージを備えた計算機システムを構築する。
【0009】
本発明の第一の手段では、管理コンソールは複数の計算機の電源を遠隔地から制御するためのリモートパワー制御プログラムと、計算機グループを管理するための管理テーブルを備える。
【0010】
計算機は、遠隔地から電源制御をすることができるリモートパワーオン制御手段を備える。
【0011】
リモートパワー制御プログラムは、管理テーブルで定義された計算機グループにしたがって計算機グループ毎に時間差をつけてパワーオンすることにより、ストレージへのアクセスの時間的分散を可能とする。
【0012】
本発明の第二の手段では、複数の計算機及び管理コンソールは、ファイバチャネル等の接続インターフェースによりストレージに接続する。
【0013】
管理コンソールは複数の計算機の電源を遠隔地から制御するためのリモートパワー制御プログラムを備える。
【0014】
計算機は、遠隔地から電源制御をすることができるリモートパワーオン制御手段と、OSの起動を制御し、計算機の起動状況を伝えるブートアップ制御プログラムを備える。
【0015】
ストレージは、複数の計算機のそれぞれ専用の論理ユニットと、すべての計算機が使用することができ、計算機の起動状況を記録する通信論理ユニットと、これらの論理ユニットを定義・作成するLU定義プログラムとを備える。
【0016】
ブートアップ制御プログラムが通信論理ユニットを参照し、計算機数を制御することで、ストレージへのアクセス分散を可能にし、計算機のOS起動を実行する。
【0017】
また、本発明の第三の手段は、前記第二の手段において、ストレージに配置された通信論理ユニットのかわりに、管理コンソールに計算機の起動を制御する計算機起動制御プログラムを備え、集中型起動制御を行なうことを特徴とする。
【0018】
【発明の実施の形態】
(第一実施形態)
従来の技術ではサーバを用いたシステム構成がとられていたが、本実施形態では、運用管理や性能の面で優れているサーバレス型のシステム構成とする。この場合も従来技術で述べたような複数計算機の起動時にストレージへのアクセス集中が起こるという課題は同様である。なお、もちろん本発明はこの構成に限定されるものではない。
【0019】
図1は本実施形態の計算機システムの構成図である。同図において、2x(2a=2n)は計算機、1はすべての計算機2が共用するストレージ、4は計算機システムを管理するための管理コンソール、3はすべての計算機2xとストレージ1と管理コンソール4を相互に接続するファイバチャネル接続手段、5x(5a=5n)はファイバチャネルである。7はストレージ1と管理コンソール 4が通信するための通信手段、6x(6a=6n)は複数の計算機2xと管理コンソール4が通信するためのLAN(Local Area Network)である。
【0020】
以下、計算機としてはPC(Personal Computer)等のクライアント用計算機を想定し説明するが、サーバや、ワークステーション等のその他の計算機にも応用可能である。また、計算機とストレージを接続するためのインタフェース(以下I/Fと略記する)は、その接続距離と速度の面で最適であるファイバチャネルを想定するが、SCSI(Small Computer System Interface)、USB(Universal Serial Bus)、IEEE1394、等、様々なI/Fに適用可能である。
【0021】
図2は計算機2xの構成図である。21はこの計算機2のユーザが情報を入力したり出力したりするための入出力装置、22は計算機の全体の制御を行う中央制御手段、25はファイバチャネルの接続、制御を行うために計算機2に搭載したファイバチャネルボード、24はLAN6x用いた通信を行うためのLANボード、23は中央制御手段22が各種制御を実行するために必要なプログラムやデータを格納するためのメモリである。
【0022】
ファイバチャネルボード25において、250はファイバチャネルの制御を行うファイバチャネルコントローラ、251はファイバチャネルコントローラが制御をするために必要なプログラムやデータや、中央制御手段22がファイバチャネルコントローラ250を制御するために必要なプログラムやデータを格納するためのメモリである。メモリ251において、2511はファイバチャネル5xに接続した計算機2xの外部のストレージ1からOSを起動するめにファイバチャネルコントローラ250を制御するために中央制御手段22が実行するブートアップ制御プログラムである。2512はファイバチャネルコントローラ250を一意に識別するために設けた世界で唯一な名称の情報であるWWN(World Wide Name)である。ここで、本実施形態ではファイバチャネルボード25が計算機2xに搭載されているとしたが、本ボードに搭載するファイバチャネルコントローラ250、およびメモリ251を計算機2xに該ボード25を用いずに直接実装することも可能であり、この場合も本発明の作用、効果は全く同一である。
【0023】
26は計算機2xのメイン電源スイッチである。
【0024】
図3はストレージ1の構成図である。11はストレージの全体制御を司る中央制御手段、15はファイバチャネル5dへの接続とその制御を行うファイバチャネルコントローラ、12は中央制御手段11がストレージ1の内部制御を行うためのプログラムやデータを格納するためのメモリ、16は管理コンソール4との間の通信を行うための通信手段、13x(13a=13n)と14は論理ユニット(LU:Logical Unit)である。
【0025】
ここで論理ユニットLUとは、論理ボリュームとも呼ばれるストレージ1内部に設けた仮想的なボリュームのことであり、計算機とストレージを接続するI/Fの一つのプロトコルであるSCSI(Small Computer System Interface)の仕様において定義された名称である。以下、論理ボリュームのことを単にLUと呼ぶことにする。またLUを識別するための番号のことをLUN(Logical Unit Number)と呼ぶ。
【0026】
論理ユニット13xは計算機2x専用のLUであり計算機#x用ローカルLUである。ローカルLU13xには各計算機2x専用のOS 131xが格納される。一方、論理ユニット14はすべての計算機2xと管理コンソール4のいずれもがアクセス可能な共用LUである。
【0027】
メモリ12において、121は複数のLUを定義したり作成したりするために中央制御手段11が実行するLU定義プログラム、122は各計算機2xが複数のLUのそれぞれに対するアクセス禁止/許可や、LUの属性や、上位計算機から認識されるLUNである仮想LUNとストレージ内部でLUを管理するために付加した内部LUNのそれぞれの対応関係を中央制御手段11が管理するためのLUN管理テーブル、123はLUN管理テーブル122の情報に従い各計算機2xからの各LUへのアクセスを制限/許可する制御を行い、許可した場合には当該LUに対するリード・ライトアクセスの制御を中央制御手段11が実行するためのアクセス制御プログラムである。
【0028】
LUについて説明する。LUはストレージの上位計算機から見たときの論理的なボリュームである。上位計算機は1つのLUを1台の論理的なディスク装置として認識する。
【0029】
ストレージ1は内部に複数のLUを定義し、構築することができる。これを内部LUと呼ぶことにする。ストレージ1では内部LUを管理するため0から始まる整数でシリアル番号付けする。この番号を内部LUNと呼ぶ。
【0030】
一方、本発明の計算機システムのように複数の計算機2xが1台のストレージ1を共用する場合、計算機2xそれぞれに専用のLUを割り当てる。一般にPC等の上位計算機はOSブート時に接続するストレージをサーチしてLUを検出するが、サーチ方法にいくつかの制約がある場合がある。それは、
(a) LUNは0から順にサーチする
(b) LUNは連続番号で存在することを仮定し、ある番号が存在しない場合以降のサーチは行わない
の2点である。これはサーチ時間を短縮するための工夫である。本発明の計算機2もこのような特性をもつ計算機2xであると仮定する。このような場合、もし、内部LUNをそのまま上位計算機に割り当てるとすると、内部LUN=0以外のLUを割り当てられた計算機はこのLUを検出できないことになってしまう。そこで、すべての計算機に対し、0から始まり、かつ連続番号でLUNを割り当てることが望ましい。そこで、本発明においては、ストレージ1は各計算機2xごとにその計算機2xが使用する内部LUををすべて0から始まる連続したLUNになるよう再定義することで上記の課題を解決する。このように各計算機2xから認識されるLUを仮想LU、その番号を仮想LUNと呼び、内部LUおよび内部LUNと区別する。これらの内部LUN、仮想LUNとの対応関係は、ストレージ1が備えるLUN管理テーブル122で管理する。
【0031】
ストレージ1が備えるLUN管理テーブル122の一例を図4に示す。LUN管理テーブル122には、ポート番号と、Target IDと、仮想LUNと、内部LUNと、WWNと、S_IDと、属性を格納する。
【0032】
ポート番号は、ストレージ1が備えるファイバチャネル接続ポートの番号を格納する。本実施形態ではポート数は1個を仮定し、一律0を格納する。
【0033】
TargetIDは、計算機2xとの接続I/Fにおいて、ストレージ1に割り当てる識別 IDのことである。本実施形態のように計算機2xとストレージ1の接続I/Fがファイバチャネルの場合には各ポート毎に唯一のD_ID(Destination ID)を備えるが、ポート番号の項があるので省略してもよいし、ファイバチャネルの初期化時に決定したD_IDを格納しても良い。SCSIの場合には同一ポートに複数のIDを備えることができるので、そのときの各LUNの属するTarget IDを格納する。本実施形態ではファイバチャネルを仮定しているので、Target IDの欄は未使用とし、一律0を格納する。
【0034】
仮想LUNと内部LUNは、計算機2xに割り当てた内部LUNと各計算機2xから認識される仮想LUNとの対応関係を示す。たとえば、内部LUN0は仮想LUN0として、また内部LUN2も仮想LUN0として定義する。両者はともに仮想LUN0として定義されているが、それぞれ使用できる計算機2xが異なる。
【0035】
WWNは、各計算機2xのファイバチャネルコントローラ250を特定する情報であるWorld Wide Nameを格納する。ファイバチャネルのポートとポートの接続関係を確立するポートログイン処理の際に、各計算機2xのWWN 2512がストレージ1に通知される。
【0036】
S_IDは、ファイバチャネルのフレームヘッダに格納されるID情報であり、フレームを作成したソース(イニシエータ)を識別するIDである。S_IDは、ファイバチャネルの初期化の際に、動的に割り当てられる。先に述べたWWNは初期化の際に交換された各ファイバチャネルポートにより一意に設定される値であるが、WWNとS_IDの関連づけを行うことで、フレーム毎にWWNを調べなくてもS_IDのみ検査することで計算機2xが特定できるようになっている。
【0037】
属性は、各LUの所有属性を示す。「専用」は1台の計算機2x専用のLUであることを示す。「共用」は複数の計算機2xが共用するLUであることを示す。
【0038】
ここで、図3のストレージ1の構成図と図4のLUN管理テーブル122の対応関係について説明する。計算機2aがWWN=WWNa、S_ID=S_IDa、計算機2bがWWN=WWNb、S_ID=S_IDb、計算機2nがWWN=WWNn、S_ID=S_IDn、管理コンソール4がWWN=WWNz、S_ID=S_IDzとすると、図3の計算機2a用ローカルLU13aは内部LUN=0、仮想LUN=0、計算機2b用ローカルLU13bは内部LUN=1、仮想LUN=0、計算機2n用ローカルLU13nは内部LUN=n、仮想LUN=0、計算機2a、2b、・・・、2nの共用LU14は内部LUN=k、仮想LUN=1とマッピングする。また、共用LU14は管理コンソール4でも共用するので、WWN=WWNz、S_ID=S_IDzに対応する内部LUN=kは仮想LUN=0としてマッピングする。なお、ここで管理コンソール4はストレージ1に専用のローカルLUを所持していないので、共用LU14を仮想LUN=0としてマッピングしている。
【0039】
管理コンソール4を操作する作業者は、管理コンソール4の入出力装置41からLUを定義し、作成する指示を送ることができる。この指示は、通信手段47によりストレージ1に発行される。ストレージ1の通信手段16はこの指示を受信し中央制御手段11に報告する。中央制御手段11はLU定義プログラム121を起動し、指示に従いLUを作成する。そして、定義されたLUのアクセス制御情報として、ポート番号と、Target IDと、仮想LUNと、内部LUNと、WWNと、S_IDと、属性をLUN管理テーブル122に格納する。この作業をすべての計算機2xに対して割り当てるLUの回数繰り返すことで上記LUN管理テーブル122の通りLUを作成できる。
【0040】
図5は管理コンソール4の構成図である。41は管理者が管理コンソール4を操作するための入出力装置、42は管理コンソール4全体の制御を司る中央制御手段、43は中央制御手段41が実行するプログラムやデータを格納するためのメモリ、45はファイバチャネル5eへの接続、制御を行うファイバチャネルボード、44はLAN6dを用いた通信を行うためのLANボード、46は管理コンソール4のOSやプログラムを格納するディスク装置、47はストレージとの間の通信を行う通信手段である。
【0041】
メモリ43において、431は計算機2xの電源を制御するリモートパワー制御プログラム、4311は計算機グループを管理する管理テーブルである。図6に該テーブル4311の構成を示す。該テーブル4311は、各計算機のグループ番号が記載される。同じグループに属する計算機は同時に起動することになり、1グループあたりの計算機数は、ストレージの性能等によって決定する。
【0042】
同図は同時起動数を3としたときの例である。なお、該テーブル4311は一度作成しておけば、計算機構成の変更やストレージの処理性能の変更等がなければ、次回からもそのまま使用することができる。
【0043】
次に計算機の起動作業の詳細動作について説明する。
【0044】
(1)管理テーブル作成
管理コンソール4を操作する作業者は、起動する複数計算機をいくつかのグループに分割し、入出力装置41から各計算機のグループ番号を管理テーブル4311に登録する。起動しない計算機についてはグループ番号を0とする。
【0045】
(2)計算機のパワーオン
リモートパワー制御プログラム431は、管理テーブル4311にしたがって、グループ番号1から順に各グループ毎に一定間隔でリモートパワーオンパケット900の作成・送信を行い、計算機 2xの起動を行なう。リモートパワーオンパケット900の送出間隔は、好ましくは計算機の起動時間と略同一とする。該パケット900は、計算機2xをパワーオンするためのパケットであり、その構成を図7に示す。該パケット900は、ヘッダ901とデータ部902からなる。データ部902は、同期部9021とリモートパワーオンする計算機2xのMACアドレス9022をn回連続したもので構成される。
【0046】
リモートパワー制御プログラム431はLANボード44を制御し同ボード44から該パケット900を計算機2xに送信する。
【0047】
計算機2xのLANボード24上にあるリモートパワーオン制御手段241は、該パケット900を受信する。同手段241は、該パケット900のデータ部902にあるMACアドレス9021を検出する。同手段241は、検出されたMACアドレス9021とLANボード24のMACアドレスとを比較し、同一であった場合はメイン電源スイッチ26を制御し、計算機2xをパワーオンする。パワーオンした計算機2xはストレージ1のローカルLU13xにある各計算機2x専用のOS 131xを読み込み、起動する。
【0048】
このようにして、計算機2xは、グループ毎に時間差をつけて順次起動していくので、ストレージへのアクセス集中の防止が可能となる。
【0049】
本実施形態によれば、計算機グループ毎に計算機の起動が行われ、常に一定数の計算機が起動するので、ストレージへのアクセスを時間的に分散することができ、過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0050】
(第二実施形態)
第一実施形態では、管理コンソールによる遠隔からの計画的なパワーオンの場合には有効であるが、操作者による直接のパワーオンの場合には対応できないという課題が残る。したがって管理コンソールによるパワーオンと操作者によるパワーオンの両方が混在する環境においては、ストレージへアクセスが集中する可能性がある。パワーオンの方法が混在する環境においても対応できるように、パワーオンの方法にはよらないアクセス集中防止策が必要である。本実施形態は、パワーオンの方法にはよらずにストレージへのアクセス集中を防止し、複数計算機の起動を行なうことができる。ここでは、遠隔からの計算機のパワーオンはLAN経由であることを想定し、説明する。
【0051】
図8は本実施形態の計算機システムの構成図である。第一実施形態との相違点は、ストレージ 1に新たに通信LU 17を備えたことである。通信LU 17はすべての計算機2xと管理コンソール4のいずれもがアクセス可能であり、計算機の起動状況を通信するためのLUである。通信LU17には計算機ステータステーブル171を格納する。該テーブル171は計算機2xの起動状況を表すテーブルである。
【0052】
図9に該テーブル171の構成を示す。該テーブル171には排他制御を行なうためのフラグブロックと計算機2x用のブロックがあり、それぞれ該テーブル171内のアドレスを一意に決めておく。フラグブロックのステータス1はいずれかの計算機2xがテーブルにアクセス中であることを表し、ステータス0はテーブルにアクセス中の計算機がいないことを表す。計算機2x用ブロックのステータス1はその計算機がOS起動中であることを表し、ステータス0は未起動、ステータス2は起動が終了したことを表す。計算機2xのブートアップ制御プログラム2511がファイルシステムを使用したファイルリード/ライトではなく、直接LUの論理ブロックをリード/ライトするRAW I/Oコマンドによりアクセスする。また、管理コンソール4は、この計算機ステータステーブル171をRAW I/Oでリードし、適当なタイミングでポーリングすることで各計算機2xの状況を逐次知ることができる。
【0053】
ブートアップ制御プログラム2511はファイバチャネル5xに接続した計算機2xの外部のストレージ1からOSを起動したり、通信LU117と通信するために用いられる。同プログラム2511は、フラッシュメモリ等を用いることにより、計算機2によって書き換え可能とすることもできる。
【0054】
次に計算機の起動作業の詳細動作について図10のフローチャートを用いながら説明する。
【0055】
(a) 計算機のパワーオン
管理コンソール4のリモートパワー制御プログラム431による遠隔からのパワーオンや、操作者による直接のパワーオン等によって、計算機2xがパワーオンする(図10のステップ701)。
【0056】
(b) ブートアップ制御プログラム始動
計算機2xはパワーオンするとファイバチャネルボード25のメモリ251にあるブートアップ制御プログラム2511を始動する(ステップ702)。
【0057】
(c) ブートアップ制御プログラムが計算機ステータステーブルを参照
ブートアップ制御プログラム2511は、ストレージ1の通信LU17にある計算機ステータステーブル171を参照する。
【0058】
該プログラム2511は、まずフラグブロックにアクセスし、アクセス中の計算機がいないか調べる。アクセス中の計算機がいなければフラグブロックを1に書き換え、計算機2x用のブロックを参照する。他の計算機がアクセス中であれば、アクセス終了まで待機する(ステップ703)。
【0059】
(d) 起動中の計算機数が閾値以下である
ブートアップ制御プログラム2511は、計算機ステータステーブル171の計算機2x用ブロックのステータス1の合計数によって起動中の計算機数を知ることができる。閾値はストレージの性能等によってあらかじめ決定された値であり、同時起動可能な計算機数を表す(ステップ704)。
【0060】
(e) 待機状態を画面表示
起動中の計算機数が閾値より多い場合は、フラグブロックのステータスを0に書き換え、一旦アクセスを終了し、他の計算機がOSの起動を終了して、起動中の計算機数が閾値以下になるまでブートアップ制御プログラム2511は待機する。その際、該プログラム2511は待機状態であることを操作者に伝えるため、入出力装置21の画面上に待機状態であることを表示する。該プログラム2511は一定時間経過した後、再び計算機ステータステーブル171にアクセスする(ステップ709)。
【0061】
(f) ブートアップ制御プログラムは自計算機のステータスを1に書き換える
起動中の計算機数が閾値以下であれば、ブートアップ制御プログラム2511は、次の処理に進む。起動中であることを表すため、該プログラム2511は、計算機ステータステーブル171の自計算機のステータスを1に書き換え、フラグブロックのステータスを0に戻し、該テーブル171へのアクセスを終了する(ステップ705)。
【0062】
(g) ブートアップ制御プログラムはOS起動開始
ブートアップ制御プログラム2511は、ストレージ1の計算機専用ローカルLU 13xにあるOS 131xの起動を開始する(ステップ706)。
【0063】
(h) OS起動完了後、ブートアップ制御プログラムは自計算機のステータスを0に書きかえる。
【0064】
OS 131xの起動が完了したことを表すため、ブートアップ制御プログラム2511は、計算機ステータステーブル171の自計算機のステータスを0に書き換える(ステップ707)。
【0065】
以上で計算機の起動動作が終了する。複数の計算機2xが同時に起動動作を実行した場合、閾値までは同時にOS 131xの起動処理が行なわれるが、閾値を超えた場合は、起動中の計算機2xがOS 131xの起動を完了し、計算機ステータステーブル171のステータスを書き換えるまで、他の計算機2xは待機することになる。これによって、ある一定数以上の計算機が同時にOS起動処理を行なうことがなくなり、ストレージ1への過剰なアクセス集中を抑制することができる。したがって、ストレージ1の性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0066】
本実施形態によれば、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散することができ、ストレージを共用する計算機システムにおいて、ストレージへの過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。
【0067】
また、パワーオンの方法によらず適用可能であるので、遠隔からのパワーオンや直接のパワーオンが混在する環境においても有効である。
【0068】
また、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能となり、管理コストや人件費の削減につながる。
【0069】
(実施形態3)
本実施形態においても管理コンソールによる遠隔からの計算機のパワーオンだけでなく、操作者による直接のパワーオンの場合にも適用可能であり、パワーオンの方法にはよらずにストレージへのアクセスを分散した計算機の起動が可能である。ここでは、遠隔操作によるファイバチャネル経由での計算機のパワーオンを想定し、説明する。
【0070】
図11は本実施形態の計算機システムの構成図である。第二実施形態との相違点は、図8のLAN 6が存在していないことと通信LU 17に配置されていた計算機ステータステーブル171を管理コンソール4に配置し、新規に計算機起動制御プログラム432を配置したことであり、その他は同一である。
【0071】
図12は本実施形態の管理コンソールの構成図である。第二実施形態との相違点は、LANボードが存在しないことと、新規に計算機起動制御プログラム432を設け、ディスク装置46に計算機ステータステーブル171を格納したことである。計算機起動制御プログラム432は、OS起動処理をする計算機数を制御するためのプログラムである。計算機ステータステーブル171は図9に示すものと同一であり、計算機の起動状況を表すテーブルである。第二実施形態ではブートアップ制御プログラム2511が直接参照し、リード/ライトを行なったが、本実施形態では、ブートアップ制御プログラム2511は計算機起動制御プログラム432に通知し、計算機起動制御プログラム432がリード/ライトを行なう。
【0072】
図13は本実施形態の計算機2xの構成図である。第二実施形態の計算機2xとの相違点は、LANボードが存在しないことと、ファイバチャネルボード上にリモートパワーオン制御手段2501と待機電源2502が存在していることである。
【0073】
待機電源2502は計算機2xに設けたものであり、計算機2xのメイン電源がオフの状態でも、この待機電源2502だけはオンになっているように構成する。
【0074】
リモートパワーオン制御手段2501は、ファイバチャネルコントローラ250の内部に設けたものであり、待機電源2502に接続している。よって、たとえ計算機2xのメイン電源がオフの状態でも、ファイバチャネルコントローラ250が動作するよう制御することができる。そこで、ファイバチャネル5経由で到着するフレーム(パケット)を受信することができる。
【0075】
次に計算機の起動作業の詳細動作について図14のフローチャートを用いながら説明する。
【0076】
(a) 計算機のパワーオン
ファイバチャネルによるリモートパワーオン制御について説明する。図15は、ファイバチャネルを用いたリモートパワーオンフレーム950の一実施形態である。9501はSOF(Start of Frame)であり、フレームの先頭を示す。9502はフレームヘッダであり、フレームの送信ノードの情報やフレームの種別等の情報を格納する。9502aはブロードキャスト識別子であり、このフレームがブロードキャストフレームとして、同一ファイバチャネルに接続するすべてのノードに対し同時に発行されるフレームであることを示す。9503はペイロードでありこのフレームの転送データの実態である。9503x(xはa=n)はWWNであり、リモートパワーオンを実施する計算機2xのファイバチャネルコントローラ250のWWN 2512を格納する。9504はCRC(Cyclic Redundancy Code)であり、フレームのビット化けを検出するためのデータ保証コードである。9505はEOF(End Of Frame)であり、フレームの末尾であることを示す。
【0077】
次にファイバチャネルを用いたリモートパワーオン制御の動作を説明する。管理コンソール4のリモートパワー制御プログラム4311は、リモートパワーオンフレーム950を作成する。このときリモートパワーオンの対象となる少なくとも1台以上の計算機2xのWWNをフレーム950のペイロード9503に格納する。そして、ファイバチャネルボード45を制御してブロードキャストで同フレーム950を送信する。
【0078】
ここで、各計算機2xはすべて停止していると仮定する。計算機2x本体は停止しているものの、ファイバチャネルコントローラ250は、待機電源2502で動作しており、ファイバチャネル5により到着するフレームを待ち受けている。ここで、上記のリモートパワーオンフレーム950を受信したとすると、同コントローラ250のリモートパワーオン制御手段2501はこのフレーム950のフレームヘッダ9502を検査し、ブロードキャストフレームであることを確認する。次に、同コントローラ250のWWN2512が同フレーム950のペイロード9503に格納されているかどうか検査する。もし、格納されていれば同手段2501はメイン電源スイッチ26を制御することで電源オンにして、計算機2xを起動する。もし、格納されていなければ、このフレーム950を無視し再び待ち受け状態になる。
【0079】
ここで、リモートパワーオンフレーム950のペイロード9503に格納したWWNは、第一実施形態に記載のLANによるリモートパワーオンパケットと同様に同一のWWNを繰り返し何回か格納しても構わない。
【0080】
以上のように、LANがなくてもファイバチャネル5を用いてリモートパワーオン制御が可能になる。
【0081】
上記においては、ファイバチャネルのブロードキャストフレームを用いパワーオン制御を行う方法を説明したが、もしファイバチャネルコントローラがIPプロトコルに対応しているならば、図7に示すリモートパワーオンパケットを用いる方法もある。この場合も上記と構成、動作は同様である。しかし、パケットをそのまま使用できるので、リモートパワー制御プログラムをそのまま適用できる。
【0082】
このようにして、複数計算機2xをパワーオンする(図14のステップ801)。
【0083】
(b) ブートアップ制御プログラム始動
計算機2xはパワーオンするとファイバチャネルボード25のメモリ251にあるブートアップ制御プログラム2511を始動する(ステップ802)。
【0084】
(c) ブートアップ制御プログラムは管理コンソールの計算機起動制御プログラムに通知し、起動許可を待つ
ブートアップ制御プログラム2511は、起動開始であることを管理コンソール4の計算機起動制御プログラム432に通知するため、起動制御フレーム960を送出する。起動制御フレーム960は、ブートアップ制御プログラム2511が計算機2xの起動開始・終了を計算機起動制御プログラム432に通知したり、計算機起動制御プログラム432がブートアップ制御プログラム2511に起動許可を与えるために用いられるフレームである。図16に起動制御フレーム960の構成を示す。リモートパワーオンフレーム950との相違点は起動識別子96032が存在することである。計算機起動制御プログラム432は、WWN 96031によって計算機を特定し、起動識別子96032によってその計算機が起動開始か起動終了かを知ることができる(ステップ803)。
【0085】
(d) 計算機起動制御プログラムは、計算機ステータステーブルを参照
通知を受けた計算機起動制御プログラム432は、起動中の計算機数を知るために、ディスク装置46にある計算機ステータステーブル171を参照する。該テーブル171は図9に示すものと同一であり、計算機2xの起動状況を表すテーブルである。なお、本実施形態では該テーブル171を参照できるのは管理コンソールだけであり、排他制御が不要であるため、フラグブロックは使用しない(ステップ804)。
【0086】
(e) 起動中の計算機数が閾値以下である
計算機起動制御プログラム432は、計算機ステータステーブル171のステータス1の数によって起動中の計算機数を知ることができる。起動中の計算機数が閾値より多い場合は、他の計算機から起動終了通知が来て、起動中の計算機数が閾値以下になるまでブートアップ制御プログラム2511を待機させる。このとき、計算機起動制御プログラム432は、ブートアップ制御プログラム2511に待機命令を伝えるため起動制御フレーム960を送出する。起動中の計算機数が閾値以下であれば、計算機起動制御プログラム432は、次の処理に進む(ステップ805)。
【0087】
(f) 待機状態を画面表示
起動制御フレーム960が送出されると、ブートアップ制御プログラム2511はWWN 96031によって自分宛のフレームかどうかを判断し、起動制御識別子96032によって待機命令を受けたことを知ることができる。待機命令を受けた該プログラム2511は、待機状態であることを操作者に伝えるため、入出力装置21の画面上に待機状態であることを表示する。該プログラム2511は一定時間経過した後、再び管理コンソール4の計算機起動制御プログラム432に起動開始の起動制御フレーム960を送出する(ステップ812)。
【0088】
(g) 計算機起動制御プログラムは通知を受けた計算機のステータスを1に書き換える
起動中の計算機数が閾値以下であれば、計算機起動制御プログラム432は、次の処理に進む。通知を受けた計算機が起動中であることを表すため、該プログラム432は、計算機ステータステーブル171の通知を受けた計算機のステータスを1に書き換える(ステップ806)。
【0089】
(h) 計算機起動制御プログラムは、ブートアップ制御プログラムに起動許可を与える
計算機起動制御プログラム432は、ブートアップ制御プログラム2511に起動許可を与えるため起動制御フレーム960を送出する。待機していたブートアップ制御プログラム2511はWWN 96031によって自分宛のフレームかどうかを判断し、起動制御識別子96032によって起動許可を受けたことを知ることができる(ステップ807)。
【0090】
(i) 起動許可を受けたブートアップ制御プログラムはOS起動開始
起動許可を受けたブートアップ制御プログラム2511は、ストレージ1の計算機専用ローカルLU13xにあるOS 131xの起動を開始する(ステップ808)。
【0091】
(j) OS起動完了後、ブートアップ制御プログラムは計算機起動制御プログラムに起動完了通知
ブートアップ制御プログラム2511は、計算機起動制御プログラム432に、OS 131xの起動が完了したことを通知するため、起動制御フレーム960を送出する(ステップ809)。
【0092】
(k) 計算機起動制御プログラムは通知を受けた計算機のステータスを0に書きかえる
OS 131xの起動が完了したことを表すため、計算機起動制御プログラム432は、計算機ステータステーブル171の通知を受けた計算機のステータスを0に書き換える(ステップ810)。
【0093】
以上で計算機の起動動作が終了する。複数の計算機2xが同時に起動動作を実行した場合、閾値までは同時にOS 131xの起動処理が行なわれるが、閾値を超えた場合は、起動中の計算機2xがOS 131xの起動を完了し、管理コンソールに起動終了を通知するまで、他の計算機2xは待機することになる。これによって、ある一定数以上の計算機が同時にOS起動処理を行なうことがなくなり、ストレージ1への過剰なアクセス集中を抑制することができる。したがって、ストレージ1の性能低下を防止することができ、システム全体でのOS起動時間を短縮することができる。第二実施形態が、各計算機による分散型起動数制御方式であったのに対し、本実施形態は、管理コンソールによる集中型起動数制御方式といえる。
【0094】
以上の通り、本実施形態によれば、OS起動状況を確認するために複数の計算機と管理コンソールの間に必要な通信と、リモートパワーオン制御をLANを用いずにファイバチャネル経由で行うことができるので、LANそのものを削除することができる。これにより、上記第二実施形態と同一の効果に加え、さらに、LANの設備コストやメンテナンスコストを低減でき、さらに低コスト化を実現することができるという効果がある。
【0095】
また、本実施形態によれば、管理コンソールと通信して起動制御を行なうため、さらにストレージへの負荷を低減できるという効果がある。さらに、起動制御を集中化することにより、計算機の管理・起動状況の把握が容易になるという効果がある。
【0096】
【発明の効果】
本発明によれば、複数計算機のOS起動時に、ストレージへの負荷を時間的に分散することができるので、ストレージを共用する計算機システムにおいて、ストレージへの過剰なアクセス集中を抑制することができる。したがって、ストレージの性能低下を防止することができ、システム全体でのOS起動時間を短縮することができるという効果がある。また、本発明によれば、管理者または操作者が、計算機の起動に関する新たな手間や時間を費やすことなく複数計算機の起動が可能となり、管理コストや人件費の削減につながるという効果がある。
【0097】
さらに本発明によれば、LANを用いずにファイバチャネルだけで起動作業を実行できるので、システム導入時のLANとファイバチャネルの2種類のケーブルを敷設することにより発生する導入コストや、維持管理のための運用コストを低減することができるという効果がある。
【図面の簡単な説明】
【図1】第1実施形態の計算機システムの構成図。
【図2】第1実施形態の計算機の構成図。
【図3】第1実施形態のストレージの構成図。
【図4】第1実施形態のストレージのLUN管理テーブルの構成図。
【図5】第1実施形態の管理コンソールの構成図。
【図6】第1実施形態の管理テーブルの構成図。
【図7】第1実施形態のリモートパワーオンパケットの構成図。
【図8】第2実施形態の計算機システムの構成図。
【図9】第2実施形態の計算機ステータステーブルの構成図。
【図10】第2実施形態の計算機の起動動作のフローチャート。
【図11】第3実施形態の計算機システムの構成図。
【図12】第3実施形態の管理コンソールの構成図。
【図13】第3実施形態の計算機の構成図。
【図14】第3実施形態の計算機の起動動作のフローチャート。
【図15】第3実施形態のファイバチャネルのリモートパワーオンフレームの構成図。
【図16】第3実施形態の起動制御フレームの構成図。
【図17】従来技術の計算機システムの構成図。
【符号の説明】
1…ストレージ、11…中央制御手段、12…メモリ、13…計算機専用ローカルLU、14…共用LU、15…ファイバチャネルコントローラ、16…通信手段、17…通信LU、121…LU定義プログラム、122…LUN管理テーブル、123…アクセス制御プログラム、131…OS、171…計算機ステータステーブル、2…計算機、21…入出力装置、22…中央制御手段、23…メモリ、24…LANボード、241…リモートパワーオン制御手段、25…ファイバチャネルボード、250…ファイバチャネルコントローラ、2501…リモートパワーオン制御手段、2502…待機電源、251…メモリ、2511…ブートアップ制御プログラム、2512…WWN、26…メイン電源スイッチ、3…ファイバチャネル接続装置、4…管理コンソール、41…入出力装置、42…中央制御手段、43…メモリ、431…リモートパワー制御プログラム、4311…管理テーブル、432…計算機起動制御プログラム、44…LANボード、45…ファイバチャネルボード、46…ディスク装置、47…通信手段、5…ファイバチャネル、6…LAN、7…通信I/F、900…リモートパワーオンパケット、950…リモートパワーオンフレーム、960…起動制御フレーム、100…ストレージ、1001…OS、200…計算機、400…サーバ、500…接続インターフェース、600…LAN。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a method for starting up an OS of a plurality of computers sharing a storage, and more particularly to a method of preventing performance degradation due to centralized storage access of a plurality of computers when the OS is started up.
[0002]
[Prior art]
As a computer system using a plurality of computers, a computer system including a plurality of computers, a server that manages the plurality of computers, and a storage shared by the plurality of computers is known. This will be described with reference to the example of FIG.
[0003]
In the figure, 200x (200a = 200n) is a computer, 100 is a storage shared by the computer 200x, 1001 is an OS downloaded by the computer 200x, and 400 is physically separated from the place where the computer is installed. A server, 500 is a connection interface for connecting the server 400 and the storage 100, and 600x (600a = 600n) is a LAN (Local Area Network) for communication between the plurality of computers 200x and the server 400.
[0004]
When the computer 200x is powered on, first, the computer 200x accesses the server 400 via the LAN 600x. Next, the OS 1001 in the storage 100 is downloaded, and activation is started. When a plurality of computers 200x are powered on, all the computers 200x that are powered on try to download the OS 1001, so the load on the server 400 and the storage 100 increases.
[0005]
[Problems to be solved by the invention]
(Task)
In the above prior art, if multiple computers are started at the same time, access will be concentrated on the server and storage, and in the case of processing that requires a load such as OS startup, the processing performance will be reduced and the OS startup will be significant. There is a problem that it takes time. The more computers that start up at the same time, the longer the OS start-up time becomes. If a large number of computers are used, the business will be hindered.
[0006]
If each operator starts up with different power-on times, concentration of access to the storage can be avoided, but it is possible to know when other operators turn on the power, wait for other computers to start up, and always turn on the power. There is a problem that the computer must be turned on while considering the above. The power must be turned on every time the computer is used, and there is a problem that the operator takes extra time each time.
[0007]
(the purpose)
An object of the present invention is to provide a method in which an administrator or an operator can start a plurality of computers without spending new labor and time for starting the computers in a computer system sharing a storage, and the plurality of computers By providing a method to distribute the load on the storage temporally at the time of OS startup, it is possible to prevent performance degradation due to concentration of access to the storage and shorten the OS startup time.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, a computer system including a plurality of computers, a management console for powering on the plurality of computers, and a storage shared by the plurality of computers and the management console is constructed.
[0009]
In the first means of the present invention, the management console includes a remote power control program for controlling the power sources of a plurality of computers from a remote location, and a management table for managing computer groups.
[0010]
The computer includes remote power-on control means that can control power from a remote location.
[0011]
The remote power control program enables time distribution of access to the storage by powering on the computer groups with a time difference according to the computer groups defined in the management table.
[0012]
In the second means of the present invention, the plurality of computers and the management console are connected to the storage through a connection interface such as a fiber channel.
[0013]
The management console includes a remote power control program for controlling the power sources of a plurality of computers from a remote location.
[0014]
The computer includes remote power-on control means that can control power from a remote location, and a boot-up control program that controls the startup of the OS and transmits the startup status of the computer.
[0015]
The storage includes a logical unit dedicated to each of a plurality of computers, a communication logical unit that can be used by all computers, records the startup status of the computer, and an LU definition program that defines and creates these logical units. Prepare.
[0016]
The boot-up control program refers to the communication logic unit and controls the number of computers, thereby enabling distributed access to the storage and starting up the OS of the computer.
[0017]
According to a third means of the present invention, in the second means, instead of the communication logic unit arranged in the storage, the management console has a computer activation control program for controlling the activation of the computer, and the centralized activation control. It is characterized by performing.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
(First embodiment)
In the prior art, a system configuration using a server has been taken, but in this embodiment, a serverless system configuration that is excellent in terms of operation management and performance is adopted. In this case as well, the problem of concentration of access to the storage at the time of starting up a plurality of computers as described in the prior art is the same. Of course, the present invention is not limited to this configuration.
[0019]
FIG. 1 is a configuration diagram of a computer system according to this embodiment. In the figure, 2x (2a = 2n) is the computer, 1 is the storage shared by all the computers 2, 4 is the management console for managing the computer system, 3 is all the computers 2x, storage 1 and management console 4 The fiber channel connection means 5x (5a = 5n) for mutual connection is a fiber channel. 7 is a communication means for communication between the storage 1 and the management console 4, and 6x (6a = 6n) is a LAN (Local Area Network) for communication between the plurality of computers 2x and the management console 4.
[0020]
In the following description, the computer is assumed to be a client computer such as a PC (Personal Computer), but the present invention can also be applied to other computers such as servers and workstations. The interface for connecting the computer to the storage (hereinafter abbreviated as I / F) is assumed to be a fiber channel that is optimal in terms of the connection distance and speed, but SCSI (Small Computer System Interface), USB ( It can be applied to various I / Fs such as Universal Serial Bus) and IEEE1394.
[0021]
FIG. 2 is a configuration diagram of the computer 2x. 21 is an input / output device for the user of the computer 2 to input and output information, 22 is a central control means for controlling the entire computer, 25 is a computer 2 for connecting and controlling the fiber channel A fiber channel board 24, a LAN board 24 for performing communication using LAN 6x, and a memory 23 for storing programs and data necessary for the central control means 22 to execute various controls.
[0022]
In the Fiber Channel board 25, 250 is a Fiber Channel controller for controlling the Fiber Channel, 251 is a program and data necessary for the Fiber Channel controller to control, and the central control means 22 is for the Fiber Channel controller 250 to be controlled. A memory for storing necessary programs and data. In the memory 251, 2511 is a boot-up control program executed by the central control means 22 to control the fiber channel controller 250 in order to start the OS from the storage 1 external to the computer 2x connected to the fiber channel 5x. Reference numeral 2512 denotes a WWN (World Wide Name) which is information unique to the world provided for uniquely identifying the Fiber Channel controller 250. In this embodiment, the Fiber Channel board 25 is mounted on the computer 2x. However, the Fiber Channel controller 250 and the memory 251 mounted on the board are directly mounted on the computer 2x without using the board 25. In this case, the function and effect of the present invention are exactly the same.
[0023]
26 is a main power switch of the computer 2x.
[0024]
FIG. 3 is a configuration diagram of the storage 1. 11 is a central control means that controls the entire storage, 15 is a fiber channel controller that connects to and controls the fiber channel 5d, and 12 stores programs and data for the central control means 11 to perform internal control of the storage 1. 16 is a communication means for performing communication with the management console 4, and 13x (13a = 13n) and 14 are logical units (LU).
[0025]
Here, the logical unit LU is a virtual volume provided inside the storage 1, also called a logical volume, and is a SCSI (Small Computer System Interface) of one of the I / F protocols that connect the computer and the storage. It is a name defined in the specification. Hereinafter, the logical volume is simply referred to as LU. A number for identifying an LU is called a LUN (Logical Unit Number).
[0026]
The logical unit 13x is a LU dedicated to the computer 2x and a local LU for the computer #x. The local LU 13x stores an OS 131x dedicated to each computer 2x. On the other hand, the logical unit 14 is a shared LU that can be accessed by all the computers 2x and the management console 4.
[0027]
In the memory 12, 121 is an LU definition program executed by the central control means 11 in order to define and create a plurality of LUs, 122 is an access prohibition / permission for each of the plurality of LUs by each computer 2x, LUN management table for the central control means 11 to manage the attribute and the corresponding relationship between the virtual LUN that is a LUN recognized by the host computer and the internal LUN added to manage the LU within the storage, 123 is the LUN Access for restricting / permitting access to each LU from each computer 2x according to the information in the management table 122, and when permitted, access for the central control means 11 to execute read / write access control for the LU It is a control program.
[0028]
Explain LU. An LU is a logical volume as seen from the host computer of storage. The host computer recognizes one LU as one logical disk device.
[0029]
The storage 1 can be constructed by defining a plurality of LUs inside. This is called an internal LU. In storage 1, serial numbers are assigned with integers starting from 0 to manage internal LUs. This number is called an internal LUN.
[0030]
On the other hand, when a plurality of computers 2x share one storage 1 as in the computer system of the present invention, a dedicated LU is assigned to each computer 2x. Generally, a host computer such as a PC searches a storage to be connected at the time of OS booting to detect an LU, but there are cases where there are some restrictions on the search method. that is,
(a) Search LUNs in order from 0
(b) Assuming that LUNs exist with consecutive numbers, if there is no number, no further search is performed.
These are two points. This is a device for shortening the search time. It is assumed that the computer 2 of the present invention is also a computer 2x having such characteristics. In such a case, if an internal LUN is directly assigned to a host computer, a computer to which an LU other than internal LUN = 0 is assigned cannot detect this LU. Therefore, it is desirable to assign LUNs to all computers starting from 0 and using a serial number. Therefore, in the present invention, the storage 1 solves the above-mentioned problem by redefining the internal LU used by the computer 2x for each computer 2x so as to be all continuous LUNs starting from 0. In this way, an LU recognized from each computer 2x is called a virtual LU, and its number is called a virtual LUN, and is distinguished from an internal LU and an internal LUN. The correspondence relationship between these internal LUNs and virtual LUNs is managed by the LUN management table 122 provided in the storage 1.
[0031]
An example of the LUN management table 122 provided in the storage 1 is shown in FIG. The LUN management table 122 stores port numbers, Target IDs, virtual LUNs, internal LUNs, WWNs, S_IDs, and attributes.
[0032]
The port number stores the number of the Fiber Channel connection port provided in the storage 1. In this embodiment, it is assumed that the number of ports is one, and 0 is stored uniformly.
[0033]
TargetID is an identification ID assigned to the storage 1 in the connection I / F with the computer 2x. When the connection I / F between the computer 2x and the storage 1 is a fiber channel as in this embodiment, each port has a unique D_ID (Destination ID), but may be omitted because there is a port number term. However, the D_ID determined at the time of initializing the fiber channel may be stored. In the case of SCSI, since the same port can have a plurality of IDs, the Target ID to which each LUN belongs at that time is stored. In this embodiment, since a fiber channel is assumed, the Target ID column is unused and 0 is stored uniformly.
[0034]
The virtual LUN and the internal LUN indicate a correspondence relationship between the internal LUN assigned to the computer 2x and the virtual LUN recognized from each computer 2x. For example, internal LUN0 is defined as virtual LUN0, and internal LUN2 is also defined as virtual LUN0. Both are defined as virtual LUN0, but the computers 2x that can be used are different.
[0035]
The WWN stores a World Wide Name that is information for identifying the fiber channel controller 250 of each computer 2x. The storage device 1 is notified of the WWN 2512 of each computer 2x during the port login process for establishing the connection relationship between the Fiber Channel ports.
[0036]
S_ID is ID information stored in the Fiber Channel frame header, and is an ID for identifying the source (initiator) that created the frame. The S_ID is dynamically assigned when the Fiber Channel is initialized. The WWN mentioned above is a value uniquely set by each Fiber Channel port exchanged at the time of initialization. By associating the WWN with the S_ID, only the S_ID is required without checking the WWN for each frame. By checking, the computer 2x can be identified.
[0037]
The attribute indicates the ownership attribute of each LU. “Dedicated” indicates that the LU is dedicated to one computer 2x. “Shared” indicates that the LU is shared by a plurality of computers 2x.
[0038]
Here, the correspondence between the configuration diagram of the storage 1 in FIG. 3 and the LUN management table 122 in FIG. 4 will be described. If the computer 2a is WWN = WWNa, S_ID = S_IDa, the computer 2b is WWN = WWNb, S_ID = S_IDb, the computer 2n is WWN = WWNn, S_ID = S_IDn, and the management console 4 is WWN = WWNz, S_ID = S_IDz, Local LUN 13a for computer 2a is internal LUN = 0, virtual LUN = 0, local LU 13b for computer 2b is internal LUN = 1, virtual LUN = 0, local LU 13n for computer 2n is internal LUN = n, virtual LUN = 0, computer 2a , 2b,..., 2n are mapped to internal LUN = k and virtual LUN = 1. Since the shared LU 14 is also shared by the management console 4, the internal LUN = k corresponding to WWN = WWNz and S_ID = S_IDz is mapped as virtual LUN = 0. Here, since the management console 4 does not have a dedicated local LU in the storage 1, the shared LU 14 is mapped as virtual LUN = 0.
[0039]
An operator who operates the management console 4 can send an instruction to define and create an LU from the input / output device 41 of the management console 4. This instruction is issued to the storage 1 by the communication means 47. The communication means 16 of the storage 1 receives this instruction and reports it to the central control means 11. The central control means 11 activates the LU definition program 121 and creates an LU according to the instruction. Then, the port number, Target ID, virtual LUN, internal LUN, WWN, S_ID, and attribute are stored in the LUN management table 122 as access control information for the defined LU. By repeating this operation as many times as the number of LUs assigned to all the computers 2x, LUs can be created as described in the LUN management table 122.
[0040]
FIG. 5 is a configuration diagram of the management console 4. 41 is an input / output device for an administrator to operate the management console 4, 42 is a central control means for controlling the entire management console 4, 43 is a memory for storing programs and data executed by the central control means 41, 45 is a Fiber Channel board for connection to and control of Fiber Channel 5e, 44 is a LAN board for communication using LAN 6d, 46 is a disk device for storing the OS and programs of the management console 4, and 47 is a storage device It is a communication means which performs communication between.
[0041]
In the memory 43, 431 is a remote power control program for controlling the power supply of the computer 2x, and 4311 is a management table for managing computer groups. FIG. 6 shows the configuration of the table 4311. The table 4311 describes the group number of each computer. Computers belonging to the same group are started simultaneously, and the number of computers per group is determined by the storage performance and the like.
[0042]
This figure is an example when the number of simultaneous activations is three. Once the table 4311 is created, it can be used as it is from the next time if there is no change in the computer configuration or storage processing performance.
[0043]
Next, the detailed operation of the computer startup work will be described.
[0044]
(1) Management table creation
An operator who operates the management console 4 divides a plurality of computers to be activated into several groups, and registers the group number of each computer in the management table 4311 from the input / output device 41. The group number is set to 0 for computers that do not start.
[0045]
(2) Computer power on
The remote power control program 431 creates and transmits a remote power-on packet 900 for each group in order from the group number 1 according to the management table 4311 and starts the computer 2x. The transmission interval of the remote power-on packet 900 is preferably substantially the same as the startup time of the computer. The packet 900 is a packet for powering on the computer 2x, and its configuration is shown in FIG. The packet 900 includes a header 901 and a data part 902. The data unit 902 is composed of a synchronization unit 9021 and a MAC address 9022 of the computer 2x to be remotely powered on, which are continued n times.
[0046]
The remote power control program 431 controls the LAN board 44 and transmits the packet 900 from the board 44 to the computer 2x.
[0047]
The remote power-on control means 241 on the LAN board 24 of the computer 2x receives the packet 900. The means 241 detects the MAC address 9021 in the data part 902 of the packet 900. The means 241 compares the detected MAC address 9021 and the MAC address of the LAN board 24, and if they are the same, controls the main power switch 26 to power on the computer 2x. The powered-on computer 2x reads the OS 131x dedicated to each computer 2x in the local LU 13x of the storage 1 and starts it.
[0048]
In this way, since the computer 2x is sequentially activated with a time difference for each group, it is possible to prevent concentration of access to the storage.
[0049]
According to this embodiment, computers are activated for each computer group, and a certain number of computers are always activated, so that access to the storage can be distributed over time and excessive access concentration is suppressed. Can do. Therefore, it is possible to prevent the storage performance from degrading, and to shorten the OS startup time in the entire system.
[0050]
(Second embodiment)
In the first embodiment, although effective in the case of planned power-on from a remote location by the management console, there remains a problem that it cannot be handled in the case of direct power-on by the operator. Therefore, in an environment where both power-on by the management console and power-on by the operator are mixed, access to the storage may be concentrated. An access concentration prevention measure that does not depend on the power-on method is necessary so that it can cope with an environment where the power-on method is mixed. This embodiment can prevent concentration of access to the storage regardless of the power-on method, and can start a plurality of computers. Here, it is assumed that the computer is powered on remotely via a LAN.
[0051]
FIG. 8 is a configuration diagram of the computer system of this embodiment. The difference from the first embodiment is that the storage 1 is newly provided with a communication LU 17. The communication LU 17 can be accessed by all the computers 2x and the management console 4, and is an LU for communicating the activation status of the computers. The communication LU 17 stores a computer status table 171. The table 171 is a table representing the activation status of the computer 2x.
[0052]
FIG. 9 shows the configuration of the table 171. The table 171 has a flag block for performing exclusive control and a block for the computer 2x, and each address in the table 171 is uniquely determined. The status 1 of the flag block indicates that any computer 2x is accessing the table, and the status 0 indicates that no computer is accessing the table. The status 1 of the block for the computer 2x indicates that the computer is being activated, status 0 indicates that the computer has not been activated, and status 2 indicates that the activation has been completed. The bootup control program 2511 of the computer 2x is accessed by a RAW I / O command that directly reads / writes the logical block of the LU, not the file read / write using the file system. Further, the management console 4 can sequentially know the status of each computer 2x by reading this computer status table 171 with RAW I / O and polling at an appropriate timing.
[0053]
The boot-up control program 2511 is used for starting up the OS from the storage 1 external to the computer 2x connected to the fiber channel 5x and communicating with the communication LU 117. The program 2511 can be rewritten by the computer 2 by using a flash memory or the like.
[0054]
Next, the detailed operation of the computer startup operation will be described with reference to the flowchart of FIG.
[0055]
(a) Computer power on
The computer 2x is powered on by remote power on by the remote power control program 431 of the management console 4 or direct power on by the operator (step 701 in FIG. 10).
[0056]
(b) Bootup control program start
When the computer 2x is powered on, it starts the bootup control program 2511 in the memory 251 of the fiber channel board 25 (step 702).
[0057]
(c) Bootup control program refers to the computer status table
The bootup control program 2511 refers to the computer status table 171 in the communication LU 17 of the storage 1.
[0058]
The program 2511 first accesses the flag block and checks whether there is any computer being accessed. If no computer is being accessed, the flag block is rewritten to 1 and the block for computer 2x is referenced. If another computer is accessing, it waits until the access is completed (step 703).
[0059]
(d) The number of running computers is below the threshold
The boot-up control program 2511 can know the number of running computers from the total number of statuses 1 of the computer 2x blocks in the computer status table 171. The threshold is a value determined in advance according to storage performance and the like, and represents the number of computers that can be started simultaneously (step 704).
[0060]
(e) Display standby status on screen
If the number of running computers is greater than the threshold, rewrite the status of the flag block to 0, once access is terminated, until the other computers finish booting the OS and the number of running computers falls below the threshold The bootup control program 2511 waits. At this time, the program 2511 displays the standby state on the screen of the input / output device 21 in order to inform the operator that it is in the standby state. The program 2511 accesses the computer status table 171 again after a predetermined time (step 709).
[0061]
(f) The bootup control program rewrites its own computer status to 1.
If the number of running computers is less than or equal to the threshold value, the bootup control program 2511 proceeds to the next process. The program 2511 rewrites the status of its own computer in the computer status table 171 to 1 to return the status of the flag block to 0, and terminates access to the table 171 to indicate that it is being started (step 705). .
[0062]
(g) Boot-up control program starts OS startup
The bootup control program 2511 starts to start the OS 131x in the computer dedicated local LU 13x of the storage 1 (step 706).
[0063]
(h) After completing OS startup, the bootup control program rewrites the status of its own computer to 0.
[0064]
In order to indicate that the activation of the OS 131x is completed, the bootup control program 2511 rewrites the status of the own computer in the computer status table 171 to 0 (step 707).
[0065]
This completes the startup operation of the computer. When multiple computers 2x perform startup operations simultaneously, startup processing of OS 131x is performed simultaneously up to the threshold, but when the threshold is exceeded, the running computer 2x completes startup of OS 131x and the computer status The other computer 2x waits until the status of the table 171 is rewritten. As a result, a certain number of computers or more do not simultaneously perform OS startup processing, and excessive access concentration to the storage 1 can be suppressed. Therefore, it is possible to prevent the performance of the storage 1 from being deteriorated, and to shorten the OS startup time in the entire system.
[0066]
According to the present embodiment, when the OS of a plurality of computers is started, the load on the storage can be distributed over time, and excessive access concentration to the storage can be suppressed in the computer system sharing the storage. Therefore, it is possible to prevent the storage performance from degrading, and to shorten the OS startup time in the entire system.
[0067]
Further, since it can be applied regardless of the power-on method, it is also effective in an environment where remote power-on and direct power-on are mixed.
[0068]
In addition, the administrator or the operator can start up a plurality of computers without spending new labor and time for starting up the computers, leading to reduction in management costs and labor costs.
[0069]
(Embodiment 3)
This embodiment can be applied not only to remote computer power-on by the management console but also to direct power-on by the operator, and distributes access to the storage regardless of the power-on method. Can be started. Here, a description will be given assuming that the computer is powered on via a fiber channel by remote control.
[0070]
FIG. 11 is a configuration diagram of the computer system of this embodiment. The difference from the second embodiment is that the LAN 6 in FIG. 8 does not exist and the computer status table 171 arranged in the communication LU 17 is arranged in the management console 4, and a new computer activation control program 432 is installed. The other is the same.
[0071]
FIG. 12 is a configuration diagram of the management console of this embodiment. The difference from the second embodiment is that there is no LAN board, a computer activation control program 432 is newly provided, and a computer status table 171 is stored in the disk device 46. The computer activation control program 432 is a program for controlling the number of computers that perform OS activation processing. The computer status table 171 is the same as that shown in FIG. 9, and is a table representing the startup status of the computer. In the second embodiment, the bootup control program 2511 directly refers to and performs read / write. However, in this embodiment, the bootup control program 2511 notifies the computer startup control program 432, and the computer startup control program 432 reads. / Write.
[0072]
FIG. 13 is a configuration diagram of the computer 2x of the present embodiment. The difference from the computer 2x of the second embodiment is that there is no LAN board and that a remote power-on control means 2501 and a standby power supply 2502 are present on the fiber channel board.
[0073]
The standby power source 2502 is provided in the computer 2x, and is configured such that only the standby power source 2502 is on even when the main power source of the computer 2x is off.
[0074]
The remote power-on control means 2501 is provided inside the fiber channel controller 250 and is connected to the standby power source 2502. Therefore, it is possible to control the fiber channel controller 250 to operate even when the main power source of the computer 2x is off. Therefore, a frame (packet) arriving via the fiber channel 5 can be received.
[0075]
Next, the detailed operation of the computer startup operation will be described with reference to the flowchart of FIG.
[0076]
(a) Computer power on
The remote power-on control using the fiber channel will be described. FIG. 15 is an embodiment of a remote power-on frame 950 using fiber channel. Reference numeral 9501 denotes SOF (Start of Frame), which indicates the beginning of the frame. Reference numeral 9502 denotes a frame header, which stores information such as a frame transmission node information and a frame type. 9502a is a broadcast identifier, which indicates that this frame is a frame issued simultaneously to all nodes connected to the same fiber channel as a broadcast frame. 9503 is a payload, which is the actual state of the transfer data of this frame. 9503x (x is a = n) is a WWN, and stores the WWN 2512 of the fiber channel controller 250 of the computer 2x that performs remote power-on. Reference numeral 9504 denotes a CRC (Cyclic Redundancy Code), which is a data guarantee code for detecting a garbled frame. Reference numeral 9505 denotes EOF (End Of Frame), which indicates the end of the frame.
[0077]
Next, the operation of remote power-on control using a fiber channel will be described. The remote power control program 4311 of the management console 4 creates a remote power on frame 950. At this time, the WWN of at least one computer 2x to be remotely powered on is stored in the payload 9503 of the frame 950. Then, the fiber channel board 45 is controlled to transmit the frame 950 by broadcast.
[0078]
Here, it is assumed that all the computers 2x are stopped. Although the computer 2x main body is stopped, the fiber channel controller 250 is operated by the standby power source 2502 and is waiting for a frame arriving by the fiber channel 5. Here, assuming that the remote power-on frame 950 is received, the remote power-on control means 2501 of the controller 250 checks the frame header 9502 of the frame 950 to confirm that it is a broadcast frame. Next, it is checked whether the WWN 2512 of the controller 250 is stored in the payload 9503 of the frame 950. If stored, the same means 2501 controls the main power switch 26 to turn on the power and start the computer 2x. If it is not stored, the frame 950 is ignored and the standby state is entered again.
[0079]
Here, as the WWN stored in the payload 9503 of the remote power-on frame 950, the same WWN may be stored several times in the same manner as the remote power-on packet by LAN described in the first embodiment.
[0080]
As described above, remote power-on control can be performed using the fiber channel 5 without a LAN.
[0081]
In the above, the method of performing power-on control using a Fiber Channel broadcast frame has been described. However, if the Fiber Channel controller supports the IP protocol, there is also a method of using the remote power-on packet shown in FIG. . In this case, the configuration and operation are the same as above. However, since the packet can be used as it is, the remote power control program can be applied as it is.
[0082]
In this way, the plurality of computers 2x are powered on (step 801 in FIG. 14).
[0083]
(b) Bootup control program start
When the computer 2x is powered on, it starts the bootup control program 2511 in the memory 251 of the fiber channel board 25 (step 802).
[0084]
(c) The bootup control program notifies the computer startup control program of the management console and waits for startup permission
The boot-up control program 2511 sends an activation control frame 960 to notify the computer activation control program 432 of the management console 4 that the activation has started. The startup control frame 960 is used by the bootup control program 2511 to notify the computer startup control program 432 of the start / end of startup of the computer 2x, or the computer startup control program 432 gives startup permission to the bootup control program 2511. It is a frame. FIG. 16 shows the configuration of the activation control frame 960. The difference from the remote power-on frame 950 is that an activation identifier 96032 exists. The computer activation control program 432 can identify the computer by the WWN 96031 and know whether the computer is activated or deactivated by the activation identifier 96032 (step 803).
[0085]
(d) Refer to the computer status table for the computer startup control program
The computer activation control program 432 that has received the notification refers to the computer status table 171 in the disk device 46 in order to know the number of computers being activated. The table 171 is the same as that shown in FIG. 9, and is a table representing the activation status of the computer 2x. In this embodiment, the table 171 can be referred to only by the management console, and exclusive control is not required, so no flag block is used (step 804).
[0086]
(e) The number of running computers is below the threshold
The computer activation control program 432 can know the number of activated computers based on the number of statuses 1 in the computer status table 171. When the number of activated computers is greater than the threshold, a startup completion notification is received from another computer, and the bootup control program 2511 is made to wait until the number of activated computers is equal to or less than the threshold. At this time, the computer activation control program 432 sends an activation control frame 960 to transmit a standby command to the bootup control program 2511. If the number of activated computers is less than or equal to the threshold value, the computer activation control program 432 proceeds to the next process (step 805).
[0087]
(f) Screen display of standby status
When the activation control frame 960 is transmitted, the bootup control program 2511 determines whether the frame is addressed to itself by the WWN 96031 and can know that the standby command has been received by the activation control identifier 96032. The program 2511 that has received the standby command displays the standby state on the screen of the input / output device 21 in order to inform the operator that it is in the standby state. After a predetermined time has elapsed, the program 2511 again sends the start control frame 960 to the computer start control program 432 of the management console 4 (step 812).
[0088]
(g) The computer startup control program rewrites the status of the computer that received the notification to 1.
If the number of activated computers is equal to or less than the threshold value, the computer activation control program 432 proceeds to the next process. In order to indicate that the computer that has received the notification is being activated, the program 432 rewrites the status of the computer that has received the notification in the computer status table 171 to 1 (step 806).
[0089]
(h) The computer startup control program gives startup permission to the bootup control program
The computer activation control program 432 sends an activation control frame 960 to give activation permission to the bootup control program 2511. The bootup control program 2511 that has been waiting determines whether the frame is addressed to itself by WWN 96031, and can know that the activation has been permitted by the activation control identifier 96032 (step 807).
[0090]
(i) Boot-up control program that has received start permission starts OS start
The bootup control program 2511 that has received the start permission starts to start the OS 131x in the computer-dedicated local LU 13x of the storage 1 (step 808).
[0091]
(j) After completing OS startup, the bootup control program notifies the computer startup control program of startup completion.
The boot-up control program 2511 sends an activation control frame 960 to notify the computer activation control program 432 that the activation of the OS 131x has been completed (step 809).
[0092]
(k) The computer startup control program rewrites the status of the notified computer to 0
In order to indicate that the activation of the OS 131x has been completed, the computer activation control program 432 rewrites the status of the computer that has received the notification in the computer status table 171 to 0 (step 810).
[0093]
This completes the startup operation of the computer. When multiple computers 2x execute startup operations simultaneously, startup processing of OS 131x is performed simultaneously up to the threshold, but when the threshold is exceeded, the running computer 2x completes startup of OS 131x and the management console The other computer 2x waits until the activation end is notified. As a result, a certain number of computers or more do not simultaneously perform OS startup processing, and excessive access concentration to the storage 1 can be suppressed. Therefore, it is possible to prevent the performance of the storage 1 from being deteriorated, and to shorten the OS startup time in the entire system. While the second embodiment is a distributed activation number control method using each computer, this embodiment can be said to be a centralized activation number control method using a management console.
[0094]
As described above, according to the present embodiment, it is possible to perform communication necessary between a plurality of computers and a management console in order to check the OS startup status and remote power-on control via a fiber channel without using a LAN. Yes, you can delete the LAN itself. Thereby, in addition to the same effect as the second embodiment, there is an effect that the LAN equipment cost and the maintenance cost can be further reduced, and further cost reduction can be realized.
[0095]
Further, according to the present embodiment, since the activation control is performed by communicating with the management console, there is an effect that the load on the storage can be further reduced. Furthermore, by centralizing the start control, there is an effect that it becomes easy to grasp the management / start state of the computer.
[0096]
【The invention's effect】
According to the present invention, when the OS of a plurality of computers is activated, the load on the storage can be temporally distributed, so that excessive access concentration to the storage can be suppressed in the computer system sharing the storage. Therefore, the storage performance can be prevented from being lowered, and the OS startup time in the entire system can be shortened. Further, according to the present invention, an administrator or an operator can start up a plurality of computers without spending new labor and time for starting up the computers, leading to an effect of reducing management costs and labor costs.
[0097]
Furthermore, according to the present invention, since the start-up operation can be performed only by the fiber channel without using the LAN, the introduction cost generated by laying two types of cables of the LAN and the fiber channel at the time of system introduction, and maintenance management Therefore, there is an effect that the operation cost can be reduced.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a computer system according to a first embodiment.
FIG. 2 is a configuration diagram of a computer according to the first embodiment.
FIG. 3 is a configuration diagram of a storage according to the first embodiment.
FIG. 4 is a configuration diagram of a storage LUN management table according to the first embodiment;
FIG. 5 is a configuration diagram of a management console according to the first embodiment.
FIG. 6 is a configuration diagram of a management table according to the first embodiment.
FIG. 7 is a configuration diagram of a remote power-on packet according to the first embodiment.
FIG. 8 is a configuration diagram of a computer system according to a second embodiment.
FIG. 9 is a configuration diagram of a computer status table according to the second embodiment.
FIG. 10 is a flowchart of the startup operation of the computer according to the second embodiment.
FIG. 11 is a configuration diagram of a computer system according to a third embodiment.
FIG. 12 is a configuration diagram of a management console according to the third embodiment.
FIG. 13 is a configuration diagram of a computer according to a third embodiment.
FIG. 14 is a flowchart of the startup operation of the computer according to the third embodiment.
FIG. 15 is a configuration diagram of a fiber channel remote power-on frame according to a third embodiment;
FIG. 16 is a configuration diagram of an activation control frame according to the third embodiment.
FIG. 17 is a configuration diagram of a conventional computer system.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Storage, 11 ... Central control means, 12 ... Memory, 13 ... Computer local LU, 14 ... Shared LU, 15 ... Fiber channel controller, 16 ... Communication means, 17 ... Communication LU, 121 ... LU definition program, 122 ... LUN management table, 123 ... Access control program, 131 ... OS, 171 ... Computer status table, 2 ... Computer, 21 ... I / O device, 22 ... Central control means, 23 ... Memory, 24 ... LAN board, 241 ... Remote power on Control means, 25 ... Fiber channel board, 250 ... Fiber channel controller, 2501 ... Remote power-on control means, 2502 ... Standby power supply, 251 ... Memory, 2511 ... Boot-up control program, 2512 ... WWN, 26 ... Main power switch, 3 ... Fiber channel connection device, 4 ... Management console, 41 ... I / O device, 42 ... Central control means, 43 ... Memory, 431 ... Remote power control program, 4311 ... Management table 432 ... Computer startup control program, 44 ... LAN board, 45 ... Fiber channel board, 46 ... Disk device, 47 ... Communication means, 5 ... Fiber channel, 6 ... LAN, 7 ... Communication I / F, 900 ... Remote power On-packet, 950 ... Remote power-on frame, 960 ... Start-up control frame, 100 ... Storage, 1001 ... OS, 200 ... Computer, 400 ... Server, 500 ... Connection interface, 600 ... LAN.

Claims (8)

少なくとも2台以上の複数の計算機と、前記全ての計算機が、ストレージ用インタフェースを介して直接アクセス可能なストレージと接続している計算機システムにおいて、
ストレージは、各々の計算機専用に設けたローカル論理ボリュームと、全ての計算機がアクセス可能な通信論理ボリュームを備え、
通信論理ボリュームは、全ての計算機の起動状況を記録する計算機ステータステーブルを備え、
計算機は、OSの起動を制御し計算機の起動状況を伝えるブートアップ制御プログラムを備え、
計算機ステータステーブルは、ブートアップ制御プログラムによって各々の計算機の起動状況が記載され、ブートアップ制御プログラムは、起動中の計算機数を知るために計算機ステータステーブルを参照し、その起動状況によって計算機のOS起動開始のタイミングを制御することで、ストレージへのアクセス分散を可能にし、計算機のOS起動を実行することを特徴とする計算機システム。
In a computer system in which at least two or more computers and all the computers are connected to a storage that is directly accessible via a storage interface,
The storage has a local logical volume dedicated to each computer and a communication logical volume accessible to all computers.
The communication logical volume has a computer status table that records the startup status of all computers.
The computer has a boot-up control program that controls the startup of the OS and communicates the startup status of the computer.
The computer status table describes the startup status of each computer by the boot-up control program. The boot-up control program refers to the computer status table to know the number of computers that are running, and the OS startup of the computer depends on the startup status. A computer system that distributes access to storage by controlling the start timing and executes the OS startup of the computer.
前記請求項記載の計算機システムにおいて、
前記計算機がパワーオンし、前記ブートアップ制御プログラムを始動するステップと、
前記ブートアップ制御プログラムが前記通信論理ボリュームの計算機ステータステーブルにアクセスし、全計算機の起動状況を参照するステップと、
前記ブートアップ制御プログラムが、前記計算機ステータステーブルの各々の計算機の専用領域に起動状況を記載するステップとを備えたことを特徴とする計算機の起動の方法。
In the computer system according to claim 1 ,
Powering on the computer and starting the bootup control program;
The bootup control program accessing the computer status table of the communication logical volume and referring to the startup status of all computers;
The bootup control program includes a step of writing a boot status in a dedicated area of each computer in the computer status table.
前記請求項記載の計算機システムにおいて、
ストレージは、全ての計算機とコンソールがそれぞれアクセス可能な通信論理ボリュームと呼ぶ共用論理ボリュームを備え、
通信論理ボリュームは、各々の計算機専用に、その計算機だけが書き込み可能であると定めた専用論理領域を備え、
前記専用論理領域は、各々の計算機の起動状況を記載するものであり、前記計算機が各計算機の前記専用論理領域を適当なタイミングでリードすることにより、各計算機における起動状況を認識することを特徴とする通信の方法。
In the computer system according to claim 1 ,
The storage has a shared logical volume called a communication logical volume that can be accessed by all computers and consoles.
The communication logical volume is dedicated to each computer and has a dedicated logical area that is defined as writable only by that computer.
The dedicated logical area describes the activation status of each computer, and the computer recognizes the activation status of each computer by reading the dedicated logical area of each computer at an appropriate timing. Communication method.
前記請求項記載の計算機システムの構成に、さらにコンソールを備えた計算機システムにおいて、
計算機は、OSの起動を制御し計算機の起動状況を伝えるブートアップ制御プログラムを備え、
コンソールは、計算機の起動を制御する計算機起動制御プログラムと計算機の起動状況を記録する計算機ステータステーブルを備え、
ブートアップ制御プログラムは計算機起動制御プログラムに起動状況を通信し、計算機起動制御プログラムは、計算機ステータステーブルを参照し、計算機の起動数を制御するためにブートアップ制御プログラムに通信することで、ストレージへのアクセスの時間的分散を可能にし、計算機のOS起動を実行することを特徴とする計算機システム。
In the computer system further comprising a console in the configuration of the computer system according to claim 1 ,
The computer has a boot-up control program that controls the startup of the OS and communicates the startup status of the computer.
The console has a computer startup control program that controls the startup of the computer and a computer status table that records the startup status of the computer.
The boot-up control program communicates the startup status to the computer startup control program, and the computer startup control program refers to the computer status table and communicates with the boot-up control program to control the number of startups of the computer. A computer system characterized by enabling time distribution of access and executing OS startup of computers.
前記請求項記載の計算機システムにおいて、
前記計算機がパワーオンし、前記ブートアップ制御プログラムを始動するステップと、前記ブートアップ制御プログラムが前記計算機起動制御プログラムに起動状況を通知するステップと、前記計算機起動制御プログラムが前記計算機ステータステーブルを参照するステップと、前記計算機起動制御プログラムが前記計算機ステータステーブルを書き換えるステップと、前記計算機起動制御プログラムが前記ブートアップ制御プログラムに通知するステップを備えたことを特徴とする計算機の起動の方法。
The computer system according to claim 4, wherein
The computer is powered on and the bootup control program is started; the bootup control program notifies the computer startup control program of the startup status; and the computer startup control program refers to the computer status table And a step of rewriting the computer status table by the computer activation control program, and a step of notifying the bootup control program by the computer activation control program.
前記請求項記載の計算機システムにおいて、
前記コンソールおよび計算機が接続するためのインタフェースはファイバチャネルであり、
前記コンソールおよび計算機はファイバチャネルを制御する手段を備え、
前記コンソールおよび計算機が備えるファイバチャネルを制御する手段は、ブロードキャスト可能なメッセージフレームで、その内部に、少なくとも1台以上の計算機に実装したファイバチャネルを制御する手段を特定するための識別子であるWorld Wide Nameと、前記計算機の起動状況や前記コンソールが発行する制御情報を特定するための起動制御識別子を格納したメッセージフレームを送信可能であり、
前記ファイバチャネルを制御する手段は、前記コンソールおよび計算機が発行したブロードキャストのメッセージフレームに、当該ファイバチャネルを制御する手段を特定するための識別子であるWorld Wide Nameが格納されていることを確認した時には、前記起動制御識別子の内容に従って起動制御を実行することを特徴とする計算機とコンソールの通信の方法。
The computer system according to claim 4, wherein
The interface for connecting the console and the computer is Fiber Channel,
Said console and computer comprise means for controlling the fiber channel;
The means for controlling the fiber channel included in the console and the computer is a message frame that can be broadcast, and is an identifier for specifying the means for controlling the fiber channel mounted in at least one computer inside the message frame. Name, and a message frame storing a startup control identifier for specifying the startup status of the computer and control information issued by the console can be transmitted,
When the means for controlling the Fiber Channel confirms that a World Wide Name that is an identifier for identifying the means for controlling the Fiber Channel is stored in the broadcast message frame issued by the console and the computer. A method of communication between a computer and a console, characterized in that activation control is executed according to the contents of the activation control identifier.
前記請求項および記載の計算機システムにおいて、
前記ブートアップ制御プログラムは、起動数制御により待機中の状態であることを前記計算機の操作者に伝えるために、前記計算機の出力装置にその旨を表示することを特徴とする計算機の起動の方法。
In the computer system according to claims 1 and 4 ,
In order to inform the operator of the computer that the boot-up control program is in a standby state by controlling the number of activations, the computer startup method displays the fact on the computer output device. .
前記請求項および記載の計算機システムにおいて、
前記計算機が備えるブートアップ制御プログラムは電源起動時に実行されるプログラムであり、
前記計算機の起動数を制御し、前記計算機によって書き換え可能であるブートアップ制御プログラムを備えたことを特徴とする計算機システム。
In the computer system according to claims 1 and 4 ,
The bootup control program provided in the computer is a program executed when the power is turned on,
A computer system comprising a boot-up control program that controls the number of startups of the computer and is rewritable by the computer.
JP2000067150A 2000-03-07 2000-03-07 OS startup method for multiple computers sharing storage Expired - Fee Related JP3864664B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000067150A JP3864664B2 (en) 2000-03-07 2000-03-07 OS startup method for multiple computers sharing storage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000067150A JP3864664B2 (en) 2000-03-07 2000-03-07 OS startup method for multiple computers sharing storage

Publications (2)

Publication Number Publication Date
JP2001249908A JP2001249908A (en) 2001-09-14
JP3864664B2 true JP3864664B2 (en) 2007-01-10

Family

ID=18586389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000067150A Expired - Fee Related JP3864664B2 (en) 2000-03-07 2000-03-07 OS startup method for multiple computers sharing storage

Country Status (1)

Country Link
JP (1) JP3864664B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003141054A (en) 2001-11-07 2003-05-16 Hitachi Ltd Storage management computer
JP4329412B2 (en) * 2003-06-02 2009-09-09 株式会社日立製作所 File server system
JPWO2006001051A1 (en) * 2004-06-24 2008-04-17 富士通株式会社 Multiprocessor device and control method thereof
US8201004B2 (en) 2006-09-14 2012-06-12 Texas Instruments Incorporated Entry/exit control to/from a low power state in a complex multi level memory system
US9614853B2 (en) * 2015-01-20 2017-04-04 Enzoo, Inc. Session security splitting and application profiler
JP6874590B2 (en) 2017-08-14 2021-05-19 富士通株式会社 Information processing system, management device, control method of information processing system
JP7163791B2 (en) 2019-01-24 2022-11-01 富士通株式会社 Parallel processing device, node startup method, node startup program

Also Published As

Publication number Publication date
JP2001249908A (en) 2001-09-14

Similar Documents

Publication Publication Date Title
JP5272709B2 (en) Address assignment method, computer, physical machine, program, and system
US6912627B2 (en) Method of creating a storage area & storage device
US6810462B2 (en) Storage system and method using interface control devices of different types
US8190717B2 (en) Method of booting an operating system
JP4568574B2 (en) Storage device introduction method, program, and management computer
US6775830B1 (en) Computer system and a program install method thereof
JP3918394B2 (en) Data migration method
US6633962B1 (en) Method, system, program, and data structures for restricting host access to a storage space
US7412544B2 (en) Reconfigurable USB I/O device persona
US20060155837A1 (en) Diskless computer operation management system
JP2003030053A (en) Storage subsystem having security function for each logical unit
JP2004220450A (en) Storage device, its introduction method and its introduction program
JP2005202495A (en) Data transfer method
KR20080037647A (en) Method and system for managing virtual instances of a physical port attached to a network
US7185341B2 (en) System and method for sharing PCI bus devices
US7568069B2 (en) Method for creating a large-scale storage array system out of multiple mid-range storage arrays
US20020144024A1 (en) Method and system for assigning peripheral devices to logical ports of a network peripheral server
JP2001075853A (en) Computer system, and computer and storage device used for the computer system
JP3864664B2 (en) OS startup method for multiple computers sharing storage
JP3809548B2 (en) Computer system and program installation method
US20140317247A1 (en) Computer system, method for starting a server computer, server computer, management station, and use
JP2006155640A (en) Access setting method
JP2005322254A (en) Computer system, computer used for this computer system, and storage device
JP3861920B2 (en) Computer system and program installation method
KR20000035025A (en) Data processing system and method for remotely accessing a client computer system's indivisual initialization settings while the client is powered off

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060925

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111013

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121013

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131013

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees