JP2004157925A - Information processing system and method - Google Patents

Information processing system and method Download PDF

Info

Publication number
JP2004157925A
JP2004157925A JP2002325227A JP2002325227A JP2004157925A JP 2004157925 A JP2004157925 A JP 2004157925A JP 2002325227 A JP2002325227 A JP 2002325227A JP 2002325227 A JP2002325227 A JP 2002325227A JP 2004157925 A JP2004157925 A JP 2004157925A
Authority
JP
Japan
Prior art keywords
subdirectory
information processing
access
storage unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002325227A
Other languages
Japanese (ja)
Inventor
Kenichi Kihara
健一 木原
Toshiaki Hirata
平田  俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002325227A priority Critical patent/JP2004157925A/en
Publication of JP2004157925A publication Critical patent/JP2004157925A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To optimize disk access to a partial area within a logical volume which a host device uses. <P>SOLUTION: An access tendency investigating part 2113 investigates the tendency of access at subdirectory units managed by a file system 21121. A changing operation determining part 2114 causes a subdirectory division performing part 2115 to carry out a process for newly securing a fast logical volume dedicated for a heavily accessed subdirectory and for transferring contents of the subdirectory into a logical volume. Thereafter, the changing operation determining part causes a subdirectory coupling performing part 2116 to carry out a process for incorporating the contents into the original logical volume (the logical volume allocated to the other subdirectory that is the host of the subdirectory) after access to the subdirectory decreases, and then opening the logical volume used by the subdirectory. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理システム及び情報処理方法に係り、特に、ホストコンピュータとストレージ装置とが接続され、ホストコンピュータからストレージ装置のディスク領域を利用する環境において、ホストコンピュータ側から利用するディスク領域の割り当て内容を最適化することを可能にした情報処理システム及び情報処理方法に関する。
【0002】
【従来の技術】
情報処理システムにおけるストレージ装置の論理ボリュームの動的な確保、開放を行い、論理ボリュームに特徴付けを行う従来技術として、例えば、特許文献1に記載された技術が知られている。
【0003】
特許文献1に記載された技術は、ホストコンピュータ(以下、ホスト装置という)、管理用ホスト装置、ストレージ装置の三種類の装置が通信回線によって接続されて情報処理システムを構成し、相互に処理の指示やデータの送受信等を行うことが可能とされている。そして、ホスト装置は、ストレージ装置に対して直接データの読み書きを行うほか、管理用ホストに対して論理ボリューム(デバイス)の追加・削除の要求を発行する。なお、論理ボリュームの追加要求の内容には、デバイスの数や容量、種類(冗長構成の種類など)等の情報を含む。管理用ホスト装置は、ホスト装置から発行された要求に基づいて、ストレージ装置に対してデバイスの追加・削除の指示を行う。ストレージ装置は、ホスト装置からのデータ読み書き要求に応えるほか、管理用ホスト装置からの指示に従って、ボリュームの追加(確保)や削除(開放)を行う。
【0004】
前述したような従来技術によるシステムは、管理用ホストがストレージ装置の管理用の窓口として存在しており、機能的に見れば、管理用ホストがトレージ装置の一部に位置付けられると考えられる。このように、前述した従来技術は、ホストコンピュータから(管理用ホストを経由して)ストレージ装置上に論理ボリューム(デバイス)を動的に確保・開放することができる。
【0005】
前述した特許文献1には、論理ボリューム(デバイス)の種類として、冗長構成の違い(RAID1(Redundant Arrays of Inexpensive Disks 1)やRAID5(同5))等が紹介されているが、そのほかに、物理ドライブの速度も論理ボリュームの特性を決める際の要因となる。そして、処理速度の異なる物理ドライブを1つのストレージ装置内で利用し、利用する物理ドライブの速度の違いによって論理ボリュームの性能をグループ分けして使用することがある。
【0006】
特許文献2記載には、I/Oレスポンス値(物理ドライブの応答速度)の異なる複数の物理ドライブが1つのストレージ装置内で使用されており、使用する物理ドライブの速度の違いによって、高速にアクセスできる論理ボリューム(群)と低速な論理ボリューム(群)とに使い分けるという技術が開示されている。
【0007】
論理ボリュームの特性を決めるその他の要因として、物理ドライブ上のデータの並べ方もある。特許文献3には、物理ドライブ(物理ディスク)上のデータの並びを連続的にすることによって、物理ドライブ及びその物理ドライブを利用する論理ボリュームのシーケンシャルアクセス性能を向上させる技術について開示されている。
【0008】
前述したように、冗長構成の種類や使用する物理ドライブの速度、物理ドライブ上のデータの並びの形態等によって、論理ボリュームの特性(アクセス性能など)が変わってくる。言い換えると、前記特許文献2に記載されているように、冗長構成の種類等の要因を利用してストレージ装置内の論理ボリュームに特徴を付けを行うことが可能である。
【0009】
なお、実際に論理ボリュームを利用する場合、作成された論理ボリューム(ボリューム)は、特許文献4に記載されているように、ホスト側のファイルシステム上の特定のパス(ディレクトリ)に対応付けられて使用される。例えば、論理ボリューム1は「/」(ルートディレクトリ)に、論理ボリューム2は「/etc」にといった形で、任意の(サブ)ディレクトリに論理ボリュームが対応付けられる。この論理ボリュームを特定のディレクトリに対応付けることをマウントと呼んでおり、その逆の操作に当たる対応付けの解除をアンマウントまたはマウントの解除と呼んでいる。
【0010】
本発明は、論理ボリュームに特徴を付けられることを応用したものであり、アクセス傾向に基づいて論理ボリュームの構成変更を行う仕組みを持つ。その点で本発明に最も近いと考えられる従来技術が前記特許文献3に記載されたシステムである。この従来技術のシステムは、ストレージ装置が速度(アクセス性能)の異なる複数の物理ドライブを持ち、搭載されている物理ドライブの速度の違いを踏まえた上で、論理ボリューム(論理ディスク装置)に対するアクセス傾向を調査し、アクセス頻度の高い論理ボリュームにはより高速な物理ドライブが割り当てられるように、論理ボリュームが利用する物理ドライブを入れ替えるというものである。この入れ替え処理について若干補足すると、この入れ替えは、アクセス頻度が高い割に速度の遅い物理ドライブが使われている論理ボリュームと、アクセス頻度が低い割に速度の速い物理ドライブが使われている論理ボリュームとの間で物理ドライブの内容を入れ替えた後、論理ボリュームと物理ドライブとの対応関係を切り替えることにより行われる。この働きによってアクセス頻度の高い論理ボリュームがより高速な物理ドライブを利用するように調整され、ストレージ装置全体の利用効率を高めることができ、あるいは、論理ボリュームに対する応答速度の向上を図ることができる。
【0011】
【特許文献1】
特開2001−142648号公報
【0012】
【特許文献2】
特開平10−320126号公報
【0013】
【特許文献3】
特開平9−274544号公報
【0014】
【特許文献4】
特開平5−143419号公報
【0015】
【発明が解決しようとする課題】
前述した特許文献3に記載の従来技術は、あくまでも論理ボリューム単位の最適化を行うものであり、特定の論理ボリュームに対するアクセス傾向を調べ、その結果に基づいて論理ボリュームの設定を最適化するというものである。そのため、この従来技術は、特定の論理ボリューム内にアクセス傾向が異なる部分領域が混在している場合、個々の部分領域の利用特性に合わせた最適化を行うことができず、論理ボリューム全体で1つの最適化手段を選択するしかないという問題点を有している。
【0016】
本発明の目的は、前述した従来技術の問題点を解決し、論理ボリューム内の部分領域に対するディスクアクセスの最適化を可能にする手段を有する情報処理システム及び情報処理方法を提供することにある。
【0017】
【課題を解決するための手段】
本発明によれば前記目的は、情報処理装置と情報を記憶する手段を持つ記憶装置とが情報伝達手段によって接続されて構成され、前記記憶装置内の記憶手段の一部または全部を指す論理的記憶単位を、前記情報処理装置の記憶構造の一部を構成するサブディレクトリに対応付けることが可能な情報処理システムにおいて、前記情報処理装置が、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量が多いサブディレクトリをより高速なアクセスが可能な論理的記憶単位に移す手段を備えることにより達成される。
【0018】
また、前述目的は、前記情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量の多い複数のサブディレクトリが複数あり、それらの複数のサブディレクトリの上位に位置付けられるサブディレクトリがある場合、前記より高速なアクセスが可能な論理的記憶単位に移される対象を、前記情報処理装置によるアクセス量が多い前記サブディレクトリの上位に位置付けられるサブディレクトリとする手段を備えることにより達成される。
【0019】
本発明は、前述した手段を備えることにより、特定の論理ボリュームに対応付けられたファイル・システム上の領域の一部分(部分領域)を、適宜独立した論理ボリュームとして切り出すことにより、論理ボリュームに対応づけられたファイル・システム上の一部領域に対して個別にディスクアクセスの最適化の設定を行うことが可能となる。
【0020】
すなわち、本発明によれば、アクセス傾向に違いが出る可能性のあるサブディレクトリ単位に論理ボリュームを割り当てることが可能となり、その論理ボリュームにアクセス傾向に応じた設定が可能であるり、これにより、サブディレクトリ単位にアクセス傾向に応じた設定の最適化をおこなうことが可能となる。
【0021】
【発明の実施の形態】
以下、本発明による情報処理システム及び情報処理方法の実施形態を図面により詳細に説明する。以下での実施形態の説明は、ハードウェア構成、機能構成、処理内容、拡張機能の4項目に分けて順に行う。
【0022】
1.ハードウェア構成
図2は本発明の一実施形態による情報処理システムのハードウェア構成を示すブロック図である。図2において、21はホスト装置、22は通信線、23はストレージ装置、2101はCPU、2102、2302はメモリ、2103はストレージI/F、2104はディスプレイ、2105はキーボード、2301はコントローラ、2303はホストI/F、2304はディスク装置(群)である。
【0023】
本発明の実施形態による情報処理システムは、図2に示すように、ホスト装置21とストレージ装置23とが通信線22により接続されて構成される。ホスト装置21は、システム全体の制御を行うCPU2101と、処理途中のデータ等を格納するメモリ2102と、ストレージ装置23との間の通信インタフェースであるストレージI/F2103と、処理経過等を表示するディスプレイ2104と、処理の指示等を行うキーボード2105とを備えて構成されている。また、ストレージ装置23は、ストレージ装置23の制御を行うコントローラ2301と、処理途中のデータ等を格納するメモリ2302と、ホスト装置21が利用するデータを格納したディスク装置(群)2304と、ホスト装置21との間の通信インタフェースであるホストI/F2303とを備えて構成される。
【0024】
前述において、ホスト装置21は、処理の主体であり、通信線22を通してストレージ装置23に対してデータの書き込みや読み出しなどを指示する。一方、ストレージ装置23は、データ記憶の主体であり、ホスト装置21からの指示に基づいてディスク装置(群)2304に対するデータの書き込みや、ディスク装置(群)2304からのデータの読み出し等を行う。
【0025】
2.機能構成
図1は本発明の一実施形態による情報処理システムの機能構成を示すブロック図である。図1において、2111はAP、2112はOS、2113はアクセス傾向の調査部、2114は変更操作の決定部、2115はサブディレクトリ分割の実行部、2116はサブディレクトリ結合の実行部、21121はファイルシステム、21122はデバイスドライバ、2311は論理ボリューム群、2312は論物変換部、2313は物理ドライブ群、2314はボリューム割当管理部、23111、23112は論理ボリューム、23131、23132は物理ドライブであり、他の符号は図2の場合と同一である。なお、図1には、ホスト装置21、ストレージ装置23のそれぞれが持つ機能のうち、本発明に関連するもののみ記載している。
【0026】
図1に示す本発明の実施形態による情報処理システムの機能構成において、AP2111は、ホスト装置側で実行される1つ以上のプログラムであり、OS2112の機能を利用してストレージ装置23に対してデータの書き込みや読み出しを行う。OS(Operating System)は、ホスト装置21の動作を司る土台である。本発明に関して言えば、ストレージ装置23をAP2111側から手軽に扱えるようにする機能を提供する。ファイルシステム21121は、オペレーティングシステム2112に含まれる機能であり、デバイスドライバ21122を介してストレージ装置23側の記憶領域(論理ボリューム23111)をホスト側の特定の記憶領域(ファイルパス)に対応付ける役目を持つ。デバイスドライバ21122は、ストレージ装置23との連絡役を果たすものであり、ストレージ装置23の種類に応じたものが使用される。
【0027】
図1に示すホスト装置21内で二重の枠で囲まれた機能は、本発明を特徴づけるものである。アクセス傾向の調査部2113は、ファイルシステム内の構造(ディレクトリ構造)の各部のアクセス傾向を調べる機能を提供する。変更操作の決定部2114は、アクセス傾向の調査部2113で調べた調査の結果に基づいて、ディレクトリの分割・結合の判断を下す機能を提供する。サブディレクトリ分割の実行部2115は、ディレクトリ構造の一部を現在格納されているボリュームとは別のボリュームに分離する機能を提供する。サブディレクトリ結合の実行2116は、分離されている状態にあるディレクトリ構造の一部をそのディレクトリ構造の一部が所属する親ディレクトリが格納されているボリュームに移す機能を提供する。これら本発明を特徴づける機能の処理内容詳細については後述する。
【0028】
ストレージ装置23は、ホスト装置21側からの要求により適宜論理ボリュームを追加・削除することが可能なものであり、前述の特許文献3等により説明されているものと同様であるので、ここでは、その概要を簡単に説明する。
【0029】
ストレージ装置23は、論理ボリューム群2311、物理ドライブ群2313、を含んで構成されている。論理ボリューム23111は、物理ドライブ23131の内容をホスト側から扱いやすい単位に分割したものであり、ホスト側からデータを読み書きする際に、論理ボリューム23111に対してこれらの読み書きのアクセスを行う。一般に、論理ボリューム23111は、複数作成されて複数の論理ボリュームで論理ボリューム群2311が構成される。
【0030】
論物変換部2312は、論理ボリューム23111と物理ドライブ23131との対応関係を示し、これらの間の変換を行うものである。ホスト装置21側から論理ボリューム23111に対してデータの読み書きを行うと、実際には、それに対応する物理ドライブ23131にデータの読み書きが行われることになる。論理ボリューム23111と物理ドライブ23131との対応関係を管理・制御するのが論物変換2312の役割である。物理ドライブ23131は、最終的なデータの格納場所であり、ハードディスクドライブ装置や半導体記憶装置等により構成されてよい。
【0031】
ボリューム割当管理部2314は、ストレージ装置23の論理ボリューム2311を管理する機能を有し、ホスト装置21側からの指示により、適宜論理ボリューム23112を追加・削除する機能を持つ。すなわち、ボリューム割当管理部2314は、ホスト21側からボリューム追加の指示があれば、論理ボリューム23112を作成し、あるいは、未割り当て状態の論理ボリュームを割り当て、論理ボリューム23111に割り付けられていない物理ドライブの領域の中から必要量の領域を新しい論理ボリューム23112に割り付け、新しいボリューム23112が正しく物理ドライブを指すように論物変換部2312の設定を行う。また、ホスト21側からボリューム削除の指示があれば、削除対象の論理ボリューム23112が指す物理ドライブの領域を未使用の扱いにし、論理ボリューム23112を論物変換2312の処理対象から外す。
【0032】
3.処理内容
本発明の基本となる処理手順は、サブディレクトリ毎のアクセス傾向を調査し、調査結果を評価した上で適宜サブディレクトリの分割や結合を行うというものである。処理項目は大きく分けて4つある。すなわち、アクセス傾向の調査、変更操作の決定、サブディレクトリ分割の実行、サブディレクトリ結合の実行の4つである。これらの項目は、一連の手順として実行される。以下、前記4つの項目について順に説明する。なお、本発明の実施形態での具体的な処理手順は図3のフローに示すの通りであるが、その詳細は後述する。
【0033】
3.1 アクセス傾向の調査
本発明では、前述したように、サブディレクトリ単位にアクセス傾向を調べる必要があるが、その際に問題となるのは、どのようなアクセス傾向を調べるのか、その傾向をどのように測るのか、どの範囲を調べるのか、結果をどうまとめるかの4点である。以下、順にこれらについて説明する。
【0034】
(1)アクセス傾向の種類
本発明で調査するアクセス傾向は、論理ボリュームの最適化に関係するものを取り上げる。例えば、アクセス頻度(アクセス量)の多い・少ない、読み出し・書き込みの多い・少ない、シーケンシャルアクセスの多い・少ない、ランダムアクセスの多い・少ない等である。
【0035】
調査項目のうち最も重要なものがアクセス頻度(特定の領域に対する読み書きの総量)の高い・低いである。アクセス頻度が高いサブディレクトリは、ストレージ装置23に対するアクセス効率向上の必要性が高いと考えられ、別ボリューム化(後述)の有力候補となる。アクセス頻度が高い領域に対する最適化手段として、より高速な物理ドライブ23131を選択したり、処理速度の速い冗長構成を選択したり、その領域に対するストレージ装置23側のキャッシュをより多目に配分したり等の方策を取ることができる。アクセス頻度の高い領域をより高速にアクセスできるようにし、そうでない領域はそれなりの性能に留めれば、ストレージ装置23全体のディスクアクセスの効率化を図ることができる。
【0036】
アクセス頻度以外の前述した項目については、論理ボリュームに関する設定の最適化または論理ボリューム群の最適な選択に関係する。これらは、前述の特許文献3等に記載されているように、論理ボリュームの冗長構成等の違いによって、アクセス傾向への対応に得意・不得意がある。例えば、RAIDと呼ばれるディスクの冗長構成には幾つかの種類があり、RAID1と呼ばれる構成は、RAID5と呼ばれる構成よりもデータの書き込み速度に優れていると言われている。そのため、論理ボリュームの冗長構成を決める際に、RAID1とRAID5とのいずれかを選択可能で、かつ、データの書き込みが多いと見込まれる場合、RAID1を選択する等の最適化を行うことが可能となる。すなわち、書き込み量の多少を把握することによってRAID1とRAID5とのいずれを選択した方が良いかを合理的に判断することができる。
【0037】
(2)アクセス傾向の調べ方
サブディレクトリのアクセス傾向を調べる方法としては、例えば、OS2112が提供しているファイル入出力関連のシステムコールの呼び出し状況を監視するという方法を用いることができる。OS2112は、ファイルのオープンやクローズ、ファイルへのデータ書き込みやデータ読み出し等のファイルに対する基本操作を行うための呼び出し窓口であるシステムコールを、AP2111側から自由に利用できる形で提供している。AP2111側から行われるファイル入出力操作は、基本的に全てシステムコールを経由することになるため、システムコールの呼び出し内容をチェックすることによって、どの(サブディレクトリ内の)ファイルにどれくらいのデータの書き込み・読み込みが発生しているのかを把握することができる。なお、システムコールの内容をチェックする仕組みは、ファイル入出力関連システムコールの入り口部分に埋め込ませれば(割り込ませる形で実装すれば)よい。
【0038】
サブディレクトリのアクセス傾向を調べる別の方法として、AP2111が作成するログ情報を元にする方法を使用することもできる。AP2111の中にはAP2111が処理した内容を記録に残す機能を有するものがある。例えば、Webサーバの中には、いつどのファイルを何バイト送信したかを記録に残す機能を持っているものがあり、この記録を元にすれば、どのサブディレクトリ内のファイル(データ)が何バイト読み込まれたかの概算を算出することができる。すなわち、AP2111が作成するログを参照することによって、AP211による各サブディレクトリへのアクセスの傾向(読み込み総バイト数)を測ることができる。
【0039】
(3)調査範囲
本発明の実施形態での調査対象は、「調査可能な全サブディレクトリ」が基本となる。例えば、前記システムコールの監視による調査を行った場合、システムコール経由でアクセスされた全サブディレクトリ(サブディレクトリ内のファイルへのアクセスを含む)が調査対象となる。
【0040】
全サブディレクトリのアクセス傾向(調査結果)を処理するに際し、サブディレクトリの数が膨大で処理負担が気になる場合、調査範囲を限定する機能を(アクセス傾向調査機能に)持たせてもよい。本発明の実施形態によれば、サブディレクトリの個数に比例したアクセス数記憶領域と、アクセス数の集計処理(合計の計算や並び替えなど)が必要になる。サブディレクトリの個数が膨大となると、これらの記憶領域及び処理負担も膨大となる。調査対象数を絞れば必要とする記憶領域や処理負担を削減することができる。
【0041】
調査対象を限定するための方法としては、例えば、調査対象をディレクトリ構造の上位層に限定すればよい。すなわち、ルートディレクトリからのレベル数を設定できるようにし、そのレベル数を上回るサブディレクトリ(そのレベルより下位のサブディレクトリ)へのアクセスを、その上位に位置するサブディレクトリのアクセスとして扱うようにすればよい。例えば、「ルートディレクトリから三段階降りたサブディレクトリまで」と設定した場合、サブディレクトリ/bin/prog1/data は、独立した調査項目として扱われるが、その下位のサブディレクトリ/bin/prog1/data/2002や /bin/prog1/data/2001/12は、単体の集計項目として扱われず、/bin/prog1/data/2002及び/bin/prog1/data/2001/12へのアクセスの内容は、その上位のサブディレクトリである/bin/prog1/dataへのアクセスに加算(集約)される。
【0042】
その他、調査対象を任意に設定できるようにしてもよい。例えば、調査対象をサブディレクトリ「/bin」以下に限定する等である。
【0043】
なお、本発明の実施形態での処理は、アクセス傾向の調査範囲と分割可能位置の範囲とが直結するため、限定を強めると分割可能範囲も狭まってしまうので注意が必要である。例えば、前述の例において、サブディレクトリ/bin/prog1/data/2002や/bin /prog1/data/2001/12は、独立した項目として扱われない(調査結果に単体の項目として登場しない)ため、それらのサブディレクトリは、調査以降の処理で扱われず、分割位置の選択肢から外れることになる。
【0044】
(4)調査結果のまとめ方
図4はアクセス傾向の調査結果のまとめ方を説明するアクセス統計情報の例を説明する図であり、次に、図4を参照して、アクセス傾向の調査結果のまとめ方について説明する。
【0045】
前述したように、アクセス傾向の項目は、総アクセス量、読み書き量、ランダムアクセス量、シーケンシャルアクセス量等である。これらの項目は、シーケンシャル、ランダムのそれぞれについての読み書き量でまとめることができる。図4に示すアクセス統計情報401の例は、シーケンシャル、ランダムのそれぞれについての読み込み量、書き込み量でまとめたものである。読み書き量の単位は、最小記録単位、例えば、512バイトの記録ブロック(セクター)へのアクセス回数等とすればよい。例えば、記録ブロックの先頭から、連続した2048(512×4)バイトのデータを書き込んだらシーケンシャル書き込み4回などと計算すればよい。あるいは、先頭の記録ブロックに対する書き込みが他の記録ブロックからの移動を伴うものとして、ランダム書き込み1回とシーケンシャル書き込み3回としてもよい。
【0046】
3.2 変更操作の決定
変更操作の決定処理は本発明の核となる部分であり、アクセス傾向の調査結果に基づいてサブディレクトリの分割状態を変更する操作を決定するものである。
【0047】
図3は変更操作の決定を中心とした本発明の実施形態の処理手順を説明するフローチャートであり、以下、図3に示すフローを参照して、変更操作の決定について説明する。
【0048】
(1)アクセス傾向の集計
図3のステップ311でのアクセス傾向の調査の処理内容は、前述した通りであり、その処理を実行することにより、図4により説明したアクセス統計情報401を得ることができる。変更操作の決定処理は、図3のステップ321の統計情報を集計する処理から始まる。
【0049】
最初に集計の意義について説明する。ステップ321での調査結果の集計の処理の要点は、最適化に結び付けられる傾向を、アクセス量の計測結果から捉えるということである。その意味では、アクセス量の多い個所(サブディレクトリ)を見つけることが分析処理の第1のステップとなる。なぜなら、本発明の実施形態が、アクセス量が多い領域を特定して、その領域を独立させて、最適化を施すものであるからである。すなわち、アクセス量の多さが分析処理における最重要項目である。そして、アクセス量に次ぐ評価項目は書き込み量である。
【0050】
前述で説明したように、冗長構成の種類によって書き込みの得意・不得意がある。その特性を利用することによって「書き込み量が少ないからRAID1構成でも性能上、問題が出にくい」等の判断を行うことができる。その他、シーケンシャルアクセスの多さへの対応として、物理ドライブ上のデータの並びを工夫することについても従来技術の欄で説明した通りである。
【0051】
以下、調査結果の例としての図4に示すの内容を用い、集計項目としてアクセス量(総アクセス量)と書き込み量とを取り上げて説明する。
【0052】
図4に示す集計対象であるアクセス統計情報401の例には、統計値としてシーケンシャル、ランダムのそれぞれについて、読み込み量と書き込み量とが含まれている。それらの項目から総アクセス量と書き込み量とを算出する。総アクセス量は、シーケンシャルアクセス(読み・書き)とランダムアクセス(読み・書き)との合計で、書き込み量は、シーケンシャル書き込み量とランダム書き込み量とを加算することにより算出することができる。
【0053】
一方、サブディレクトリの中には分割や結合をするべきでないものもある。例えば、OS2112自身が利用する等の理由でサブディレクトリを分割すると動作上不都合が生じるものが考えられる。また、近い将来アクセス量の変化が見込まれるため、予め人の意思に基づいてサブディレクトリを結合・分割しておきたいケースも考えられる。
【0054】
特定のサブディレクトリについては分割や結合を施したくないという要求に対応するため、本発明の実施形態は、処理の適用除外とするサブディレクトリを定義することができるようにしておくことができる。
【0055】
図5は分割や結合をするべきでないサブディレクトリを定義した適用除外パス情報402の例を示す図である。この図4に示す適用除外パス情報402おいて、「パス名4021」は、適用除外対象のサブディレクトリ名を示しており、「下位にも適用4022」は、除外の適用を下位のサブディレクトリにも適用するか否かを指定するものである。例えば、図5に示す例における1行目の指定は、ルートディレクトリ「/」 が、分割・結合の除外対象となっているが、このルートディレクトリの下位にあるサブディレクトリは除外対象となっていないことを示している。それに対して、サブディレクトリ/etcや/sysは、その下位のサブディレクトリも適用除外となっており、例えば、サブディレクトリ/etcの下位にサブディレクトリ/etc/cfg等と言う名のサブディレクトリがあった場合にそのサブディレクトリも適用除外となる。
【0056】
また、別の適用除外項目として、分割対象サブディレクトリのサイズの下限を設定するようにすることも考えられる。論理ボリュームを作成すると、ストレージ装置23側のリソースを消費するため、あまり小さなサイズの論理ボリュームを作成することが望ましくない場合がある。それに対応するため、サイズの下限を設定し、そのサイズを下回るサイズのサブディレクトリを分割対象から除外してもよい。
【0057】
さらに、別の適用除外項目として、分割数の上限を設定するようにすることが考えられる。ストレージ装置23側の論理ボリューム作成数に限りがある等の理由で、多数の論理ボリュームを作ることは控えた方が良い場合がある。このため、例えば、サブディレクトリの分割数を最大5つまでとする等分割数の上限を加える機能を備えてもよい。
【0058】
前述したように、本発明は、様々な適用除外の方法を適用することができるが、本発明の実施形態では、便宜上、適用除外を図5に示した適用除外パス情報402に示されている適用除外に絞って以下の説明を進める。
【0059】
図6は図4に示すアクセス統計情報401に対して、前述した集計及び適用除外の処理を行い集計表4031としてまとめた例を示す図である。図6に示す集計表4031の例は、図4に示す調査結果をサブディレクトリ毎の総アクセス量と書き込み量とに集計し、図5に示す除外対象分のサブディレクトリの情報を取り除いている。さらに、サブディレクトリは、総アクセス量で並び替えられている。このため、集計表のリストの上位に位置するサブディレクトリが分割候補となる。
【0060】
(2)サブディレクトリの代表化
次に、図3のステップ322の処理により、集計表4031の内容に、さらにサブディレクトリの代表化を行う。この処理は、省略してもよい。サブディレクトリの代表化とは、1つの親ディレクトリの下に子(にあたる)サブディレクトリが複数あり、子サブディレクトリの多くが同じようなアクセス傾向を示す場合に、親ディレクトリにそれらの子サブディレクトリを代表させるというものである。これは、サブディレクトリの分割数を必要以上に増やさないことを目的に行う補助的な処理である。
【0061】
代表化機能に関する処理は、例えば次のように行われる。すなわち、共通の親ディレクトリを持つ子サブディレクトリのアクセス傾向を比較し、その類似性が高い場合、アクセスの計測結果を親サブディレクトリの計測結果として計上する。このとき、サブディレクトリ間のアクセス傾向類似性判断の方法が問題となるが、それについては、アクセス量の多さの程度や書き込み・読み出しの比率、そして、同じ親を持つ子サブディレクトリの総数とその中で同じ傾向を示す子サブディレクトリの数の割合等に関してしきい値を定め、そのしきい値に基づいて判断させるようにすればよい。もちろん、代表化されたサブディレクトリをさらに代表化させるようにすることもできる。
【0062】
代表化の例について説明する。いま、代表化の条件を、同一の親を持つ子サブディレクトリが複数あり、かつ、特定の子サブディレクトリのアクセス量が子サブディレクトリ全体のアクセス量の70%を越えず(特定の子サブディレクトリにアクセスが偏らず)、子サブディレクトリ全体のアクセス量が 100,000を越える場合という内容に設定したとする。その条件を、図6に示す集計表の内容に適用したとすると、サブディレクトリ/bin/prog2/data1と/bin/prog2/data2との2つのサブディレクトリが条件に合致し、サブディレクトリ/bin/prog2に、それらの子サブディレクトリを代表させることとなる。
【0063】
図7は図6に示す集計表に対して代表化を行って作成した集計表の例を示す図である。前述したような代表化を行った結果、図7に示すように、サブディレクトリ/bin/prog2/data2と/bin/prog2/data1との統計値がサブディレクトリ/bin/prog2に集約(合計)され、/bin/prog2/data2と/bin/prog2/data1との2つのサブディレクトリは集計表から取り除かれる。
【0064】
なお、代表化機能は計測結果に対する補正的な位置付けであり、それ以降に行われる分割対象の選択処理には影響を与えない。
【0065】
(3)サブディレクトリ分割案の作成
前述した代表化の処理り終了後(代表化処理を省略した場合には集計後)、図3のステップ323の処理によりサブディレクトリ分割案を作成する。以下、図7に示す集計表の内容を元に具体的な処理内容について説明する。
【0066】
サブディレクトリを分割するか否かの判断は、総アクセス量が設定されたしきい値を越えているか否かにより判断すればよい。例えば、総アクセス量のしきい値を 200,000と設定しておいたとすると、図7に示す例では、サブディレクトリ/bin/prog1/work、/bin/prog3/contents2、/bin/prog2 の3つのサブディレクトリが分割対象となる。なお、しきい値は、事前に定数を設定しておく形の他に、相対的なシェアで設定してもよく、例えば、全サブディレクトリの総アクセス量の合計値の20%を越える総アクセス量をしきい値とする等と設定してもよい。
【0067】
総アクセス量の評価に続いて書き込み量の評価を行う。本発明の実施形態では書き込み量の多いサブディレクトリには、書き込み速度が早いRAID1を割り当て、書き込み量の少ないサブディレクトリには、読み込み速度ではRAID1に対して遜色のないRAID5を割り当てることにする。書き込み量の多い・少ないを判断する際にも、総アクセス量の評価時と同様に、しきい値を用いればよい。しきい値は、定数を用いたり、総アクセス量に対する割合等で指定できるようにしたりすればよい。いま、仮に、書き込み量のしきい値に 150,000という定数を設定したとすると、図7に示す例では、サブディレクトリ/bin/prog1/workと/bin/prog2とは書き込み量が多く、/bin/prog3/contents2は書き込み量が少ない等と判断することができる。そして、その判断の結果を受けて前者をRAID1構成とし、後者をRAID5構成とすればよい。そして、前述したような選択内容を分割予定リストとしてまとめればよい。
【0068】
図8は前述したような評価に基づいて図7に示す集計表から選択したサブディレクトリのリストによる分割予定リスト404の例を示す図である。
【0069】
本発明の実施形態では、物理ドライブの速度として、高速と低速との二者から選択することが可能であるとする。また、分割対象のサブディレクトリは、総アクセス量が多いことが前提となるため、物理ドライブの速度は全て高速を選択するようにしている。この結果、図7に示す集計表404の内容の場合、サブディレクトリ/bin/prog1/work、/bin/prog3/contents2、/bin/prog2 の3つのサブディレクトリが図8に示すようにリストアップされ、それらの全てに高速の物理ドライブを割り当て、サブディレクトリ/bin/prog1/work、/bin/prog2 がRAID1構成に、/bin/prog3/contents2がRAID5構成にされるという分割予定リストが作成される。
【0070】
(4)分割・結合リストの作成
さて、前述の処理で作成された分割予定リスト404は、あくまでも本発明による処理の実施後の分割のあり方を示しているに過ぎず、実際には現状の分割状態を踏まえた移行処理が必要になる。例えば、分割予定リスト404に含まれているサブディレクトリがすでに分割済みであった場合、改めて分割を行う必要はなく、また、その逆に、すでに分割済みであっても現状のアクセス傾向から考えて分割状態を元に戻す、すなわち結合した方がよい場合もある。
【0071】
従って、前述した図3のステップ323の処理での分割案の作成の次に行うべき処理は、図3のステップ324での処理により、移行に伴う分割・結合の操作リスト(表)を作成することである。分割・結合操作表は、現状の構成と分割予定リストとの差分を取ることにより作成すればよい。
【0072】
図9は現状の構成の例を示すパス−論理ボリューム対応情報を示す図であり、現状の構成が図9に示すようなものであるとして、分割・結合操作表を作成する処理内容を具体的に説明する。
【0073】
若干余談になるが、本発明の実施形態は、アクセスが集中するサブディレクトリを高速な論理ボリュームに切り出すという処理方法を取っているため、親ディレクトリの論理ボリュームが元々高速に設定されていると、一部を切り出して高速な論理ボリュームに移す意味が無くなる(減少する)。そのため、本発明の実施形態では、図9に示しているように、ルートディレクトリ等の親ディレクトリには、低速な論理ボリュームを割り当てるようにしている。
【0074】
図9に示す現状の構成表4051には、除外対象のサブディレクトリ(図5参照)も含まれているが、それを除外した残りの部分40511に含まれているサブディレクトリ/bin/prog1/work、/bin/prog2/data1、/bin/prog3/contents1 の3つの分割済みサブディレクトリが本発明の実施形態で処理を行う対象となる。
【0075】
分割・結合操作表の作成の処理は、まず、現状の分割済みサブディレクトリ40511と分割予定リスト404の内容との間で共通項を見つけることから開始される。もし、共通しているものがあれば、そのサブディレクトリについては改めて分割する必要が無いため分割予定から外す。図8、図9に示す例の場合、サブディレクトリ/bin/prog1/work が共通しているため、このサブディレクトリを分割予定リストから外せばよい。次に、分割予定リスト404にあって現状の構成4051には無いサブディレクトリを探し、もしあれば、そのサブディレクトリを分割対象とする。図8、図9の例では、サブディレクトリ/bin/prog2と/bin/prog3/contents2とが分割対象に相当する。さらに、現状の構成4051にはあるが分割予定リスト404には無いサブディレクトリを探し、もしあればそのサブディレクトリを結合(分割状態から元の状態に戻す)候補とする。図8、図9に示す例では、/bin/prog2/data1と/bin/prog3/contents1とがそれに相当し、結合候補となる。そして、前述したような処理を行った結果を分割・結合操作表としてまとめればよい。
【0076】
図10は前述したような処理により図8、図9に示す内容から作成された分割・結合操作表406の例を示す図である。
【0077】
なお、分割予定リスト404に入っていないサブディレクトリは、直ちに結合に移すのではなく、結合に若干の猶予を持たせてもよい。その理由を以下説明する。分割予定リスト404に入れるサブディレクトリを決める際、総アクセス量が特定のしきい値(本発明の実施形態では 200,000と設定した)を上回ることを条件とした。そのため、当該サブディレクトリへの総アクセス量がしきい値近辺を上下するような状況であった場合、本発明の実施形態による処理を行う度に分割・結合が繰り返されるケースが考えられる。分割時や結合時には、サブディレクトリの内容の移動や、ボリュームの確保・解放等の比較的負荷の大きい処理を必要とするため、むやみに分割・結合が行われることは望ましくない。このような分割・結合の多発を抑制するためには、分割と結合とのしきい値を別の値に設定する方法を取ればよい。例えば、分割のしきい値を 200,000と設定したら結合のしきい値を 100,000等と設定する。そうした場合、一度総アクセス量が 200,000を越えたら分割を実行するが、それ以後総アクセス量が 100,000を下回るまでは結合が行われないため、分割・結合の多発を抑制することができる。
【0078】
分割・結合操作表406の作成が終了したら分割と結合との実行に移る。図3に示すフローで説明すると、次に、分割・結合操作表406に結合操作があるか否かを判定し(ステップ325)、あれば結合を実行する(ステップ33)。続いて、分割・結合操作表406に分割操作があるか否かを判定し(ステップ326)、あれば分割を実行する(ステップ35)。分割・結合処理の詳細については以下で説明する。
【0079】
3.3 結合処理
図12は図3に示すフローのステップ33での結合の実行の詳細な処理手順を説明するフローチャートであり、次に、これについて説明する。このフローによる処理は、分割・結合操作表406内に含まれる結合対象サブディレクトリの全てを結合するものである。
【0080】
(1)最初に、分割・結合操作表406内に含まれる結合対象のサブディレクトリの中の先頭を選択する。例えば、図10に示す分割・結合操作表406の例の場合、サブディレクトリ/bin/prog2/data1を選択する(ステップ331)。
【0081】
(2)そして、次に、そのサブディレクトリに対して結合処理を行う。この処理の詳細は、図13を参照して後述する(ステップ34)。
【0082】
(3)ステップ34の処理で、選択したサブディレクトリの結合が終了したら、次の結合対象を分割・結合操作表406から探し、次の結合対象サブディレクトリの有無を判定し、が無ければ処理を終了する(ステップ332)。
【0083】
(4)ステップ332の判定で、次の結合対象サブディレクトリがあった場合、次の結合対象サブディレクトリを選択し、ステップ34の処理に戻って、そのサブディレクトリについての結合処理を行う(ステップ333)。
【0084】
図13は図12に示すフローのステップ34でのサブディレクトリを結合する処理の詳細を説明するフローチャート、図11は既存の分割済みサブディレクトリがあるか否かを示すパス−論理ボリューム対応情報の例を示す図、図14はマウント定義情報の例を示す図、図15はマウント定義情報と論理ボリュームとを対応付けるデバイス定義情報の例を示す図であり、次に、図13に示すフローを参照して、特定のサブディレクトリに対する結合処理について説明する。なお、図11、図14、図15に示す情報は、このフローの処理の中で参照される情報である。
【0085】
(1)処理が開始されると、最初に、選択されたサブディレクトリの下位にあたるサブディレクトリの中ですでに分割済みのサブディレクトリがあるか否かをチェックし、分割済みのサブディレクトリがあれば、そのサブディレクトリのマウントを解除する。マウントを解除するのは、選択されたサブディレクトリの分割処理中に分割済みのサブディレクトリが誤動作することを避ける等のためである(ステップ341、342)。
【0086】
なお、前述において、既存の分割済みサブディレクトリがあるか否かは図11に示す情報を参照することにより判断することができる。また、マウントの定義情報には、図14に示すようにデバイス名、サブディレクトリ名(パス名)等を含んでいる。マウントの解除は、マウント定義情報の内容からマウント解除したい行を削除してOS2112を再起動するか、コマンドラインから直接マウント解除のコマンドを実行する等により行うことができる。
【0087】
(2)ステップ342の処理後、または、ステップ341のチェックで、選択されたサブディレクトリの下位に分割済みのサブディレクトリがなかった場合、次に、戻し位置(同じ親ディレクトリの下)に既存のサブディレクトリと重複しない名前で仮のサブディレクトリを作る。例えば、結合対象サブディレクトリが/bin/prog2/data1であれば、/bin/prog2/data1_temp 等という名前のサブディレクトリを作ればよい(ステップ343)。
【0088】
(3)続いて、仮のサブディレクトリ内に結合対象サブディレクトリの内容を、下位に当たるサブディレクトリの内容を含めてコピーする。前述した例の場合、サブディレクトリ/bin/prog2/data1の内容を/bin/prog2/data1_temp にコピーする(ステップ344)。
【0089】
なお、前述のステップ344の処理で内容をコピーする前に結合先の空き容量を確認し、結合対象サブディレクトリの内容を結合先にコピーしきれない(容量が不足する)場合、結合処理をキャンセルしてもよく、また、キャンセルする代わりに自動的にボリュームを拡張するようにしてもよい。
【0090】
(4)次に、結合対象の論理ボリュームをアンマウント、すなわち、マウントの解除を行い、不要になった結合対象の論理ボリュームを削除する(ステップ345、346)。
【0091】
前述した論理ボリュームの削除は、ストレージ装置23の種類に応じたコマンドが提供されている場合、そのコマンドを実行する等により行うことができる。そして、マウント定義情報407と論理ボリュームとを対応付けるため、例えば、図15に示すようなデバイス定義情報408を持って管理すればよい。デバイス定義情報408には、論理ボリュームを識別するための代表名であるデバイス名と、その論理ボリュームの所在を示す情報であるコントローラの番号(ストレージI/F2103の番号)、ターゲット番号(ストレージ装置23の識別番号)及び論理ユニット番号(ストレージ装置23内の記録単位番号)等とを含んで構成されている。
【0092】
(5)そして、前述のステップ343の処理で作成した仮のサブディレクトリ名を、正規の名前(結合対象のサブディレクトリ名)に改名する。前述した例の場合、サブディレクトリ/bin/prog2/data1_tempを /bin/prog2/data1に改名する(ステップ347)。
【0093】
(6)最後に、ステップ342の処理でマウント解除したサブディレクトリがあるか否かを判定し、もしあれば、解除したサブディレクトリを再マウントして、図12のステップ332の処理に移行する(ステップ348、349)。
【0094】
3.4 分割処理
図16は図3に示すフローのステップ35での分割の実行の詳細な処理手順を説明するフローチャートであり、次に、これについて説明する。このフローによる処理は、分割・結合操作表406内に含まれる分割対象サブディレクトリの全てを分割するものである。
【0095】
図16に示すフローによる分割処理の手順は、分割・結合操作表406の中から分割対象となっているサブディレクトリを1つずつ選択し、ステップ36の処理で分割処理手順を実行するものであり、図12により説明した結合処理手順と同様な処理であるため、その説明を省略する。
【0096】
図17は図16に示すフローのステップ36でのサブディレクトリを分割する処理の詳細を説明するフローチャートであり、次に、図17に示すフローを参照して、特定のサブディレクトリに対する分割処理について説明する。
【0097】
(1)処理が開始されると、最初に、選択されたサブディレクトリの下位に位置するサブディレクトリの中ですでに分割済みのサブディレクトリがあるか否かを調べ、もし、分割済みのサブディレクトリがあれば、そのサブディレクトリのマウントを解除する。マウントを解除するのは、結合処理の場合と同様に、移行処理過程における誤動作を避ける等のためである。なお、マウントの解除(及びマウント)については、結合処理の場合と同様に、マウント定義情報407の書き換え等により対応すればよい(ステップ361、362)。
【0098】
(2)次に、分割・結合操作表で規定されている特性(表に登録されている物理ドライブ速度及び冗長構成の種類)に合った、新しい論理ボリュームを確保する。新しい論理ボリュームの確保は、ストレージ装置23の種類に応じたコマンドを実行する等により行うことができる。なお、新しい論理ボリュームが追加されると、追加された論理ボリュームに関する情報が図15に示すデバイス定義情報408に登録される(ステップ363)。
【0099】
(3)次に、新しい論理ボリュームを仮の名前のサブディレクトリにマウントする。仮の名前は、分割対象のサブディレクトリ名にちなんだ名前にしてもよく、例えば、サブディレクトリ/bin/prog2を分割する場合、サブディレクトリ/etc/temp(一時保管用サブディレクトリ)の下に続けて、/etc/temp/bin/prog2 等とする(ステップ364)。
【0100】
(4)そして、次に、分割対象サブディレクトリの内容を、下位のサブディレクトリの内容を含めて仮の名前のサブディレクトリ(新しい論理ボリュームの領域)にコピーする。前述した例の場合、サブディレクトリ/bin/prog2の内容をサブディレクトリ/etc/temp/bin/prog2 にコピーする(ステップ365)。
【0101】
(5)続いて、仮のサブディレクトリにマウントしていた新しい論理ボリュームのマウントを解除(アンマウント)し、その後、新しい論理ボリュームを正規の位置(分割対象のサブディレクトリの位置)にマウントする。前述した例の場合で言えば、サブディレクトリ/bin/prog2に新しい論理ボリュームをマウントする(ステップ366、367)。
【0102】
(6)最後に、ステップ362の処理でマウント解除したサブディレクトリがあるか否かをチェックしし、もしあれば、解除したサブディレクトリのマウントを復元して、図16のステップ352の処理に移行する(ステップ368、369)。
【0103】
4.拡張機能
次に、本発明の拡張機能であるマルチホスト対応のシステム及び操作用GUI(Graphical User Interface)について順に説明する。
【0104】
(1)マルチホスト対応
マルチホスト対応とは、複数のホスト装置21のサブディレクトリ分割状態を総合的に最適化することである。以下にその内容について説明する。
【0105】
SAN(Storage Area Network)が用いられるシステムでは、1またはそれ以上のストレージ装置23が複数のホスト装置21から利用される。このようなシステムは、ストレージ装置23の限られたディスク資源を複数のホスト装置21が共有する形になるため、ストレージ装置23が持つディスク資源をより有効に配分することが課題となる。
【0106】
そこで、本発明をストレージ装置23を共有する複数のホスト装置21に対して横断的に適用する。具体的には、ストレージ装置23を利用する複数のホスト装置21に、それぞれ自ホスト装置21内のサブディレクトリ毎のアクセス傾向を調べさせ、その調査結果を複数のホスト装置21から集計し、複数のホスト装置21内のアクセス傾向から総合的に判断してサブディレクトリの分割・変更操作を行うようにする。そのことにより、複数のホスト装置21がストレージ装置23に接続されて構成されているシステム全体のバランスに配慮した形で、ディスク利用の全体の最適化を図ることが可能となる。
【0107】
図18は本発明の他の実施形態による情報処理システムの機能構成を示すブロック図、図19は複数ホスト対応の分析表の例を示す図である。図18に示す本発明の他の実施形態は、複数のホスト装置21からの調査結果に基づいてサブディレクトリの分割状態の最適化を図るシステムの例であり、図1により説明したシステムの発展形であるため、図1からの拡張部分を中心に説明する。図18において、25は分割・結合マネージャ、251は調査結果の受信部、252は変更操作の決定部、253は操作指示の送信部、21141は調査結果等の送信部、21142は操作指示の受信部であり、他の符号は図1の場合と同一である。
【0108】
図18に示す本発明の他の実施形態のシステムの図1に示すシステムに対して最も大きく変わった点は、アクセス傾向の情報を処理するアクセス傾向情報処理装置である分割・結合マネージャ25が追加された点である。分割・結合マネージャ25は、ホスト装置21との通信手段を持ち、複数のホスト装置からアクセス傾向の情報を調査結果の受信部251で受け取り、変更操作の決定部252が、複数のホストから得られたアクセス傾向の情報を総合的に(複数ホスト横並びで)判断して変更操作の決定を行い、操作指示の送信部252が、変更操作が必要なホスト装置21に対してサブディレクトリの分割や結合を指示するように構成される。見方を変えると、図18に示すシステムは、図1により説明した本発明の実施形態の場合の1台のホスト装置21内に閉じていたアクセス傾向の調査から分割・結合の実行までの手順の一部を、分割・統合マネージャ25が受け持つ形になっている。分割・統合マネージャ25の機能は、図1の変更操作の決定部2114とほぼ同様であるが、複数ホストに対応している点で異なる。そのため、分析表などにホストを識別するためのホスト名が加えられる。図19に複数ホスト対応の分析表の例を示しているが、この例は、図6に示す対応表に対してホスト名4071の欄を加えたものである。
【0109】
図18に示すシステムにおけるホスト装置21の図1に示すシステムに対する変更点は、図1のシステムの変更操作の決定部2114を無くし、その代わりに、調査結果等の送信部21141と操作指示の受信部21142とを付け加えた点である。調査結果等の送信部21141は、アクセス傾向の調査結果(図4に示す統計情報401またはそれに対して集計処理が施された図6に示す分析表4031)や、図5に示す適用除外パス情報402、図9に示すパス−論理ボリューム対応情報4051等の「変更操作の決定」に必要な情報を分割・結合マネージャ25に送信する。また、操作指示の受信部21142は、分割・統合マネージャ25からサブディレクトリ分割の実行指示やサブディレクトリ結合の実行指示を受け取り、その内容に従って、サブディレクトリ分割の実行部2115、サブディレクトリ結合の実行部2116に、サブディレクトリの分割処理や結合処理を実行させる。
【0110】
ストレージ装置23は、図1に示すものから特に変更の必要はない。また、ホスト装置21とストレージ装置23との間の関係についても図1に示すシステムの場合と同様である。
【0111】
なお、図18に示すシステムは、マルチホスト対応用という趣旨で説明したが、単一のホスト用として使用することもできる。
【0112】
(2)GUI
前述までに説明した本発明の各実施形態によるシステムは、ボリュームの分割状態を自動的に調整することを志向しているが、本発明は、処理の途中を人に知らせたり、人手によって処理内容の変更等を指示したりすることを可能にする仕組みを持たせることができる。
【0113】
図20はサブディレクトリの代表化及びサブディレクトリの分割に関して、人手によって処理内容の確認・指示を行う機能(画面)の例を示す図である。図20に示す画面の例は、図3示したフローにおけるステップ322、323、324に相当する部分の処理内容を表示・変更することを想定したものである。
【0114】
図20の画面の主な機能は、サブディレクトリの代表化の確認・変更、及び、サブディレクトリの分割状態の表示と変更である。サブディレクトリの代表化の状態は、サブディレクトリ名の左に表示している四角で囲まれたプラスまたは四角で囲まれたマイナスの記号で示している(612)。この記号のプラスは代表化されていることを示し、マイナスは代表化されていないことを示している。図20に示す例では、/bin/prog2というサブディレクトリの左がプラスの表示になっており、サブディレクトリ/bin/prog2が代表化されていることを示す。この記号をマウスなどのポインティングデバイス等で選択することによって代表化する・しないの状態(プラスとマイナス)を切り替えることができる。なお、画面を開いた直後等の初期状態では、本発明の実施形態での処理によって代表化要と判断した部分のみ代表化されている状態にすればよい。
【0115】
一方、サブディレクトリの分割の指定は、サブディレクトリ名の左隣の枠内に四角で表示されている部分(611)のチェックの有無によって分割するか・否かを示している。チェック表示があれば、同一行のサブディレクトリは分割を実行することを示す。図20に示す例では、/bin/prog1/workと/bin/prog2 との二つのサブディレクトリが分割されることを示す。なお、代表化の場合と同様に、初期状態では、本発明の実施形態のシステムが決定した分割位置にチェックが入れられている状態にすればよい。また、「初期状態に戻す」ボタン613を押すことによって、分割や代表化の設定を初期状態に戻すようにしておけば、操作を行う人が試行錯誤で状態を変更させても一度の操作で初期状態に戻すことができ便利である。
【0116】
図21はサブディレクトリの結合内容の報告及び人手による結合する・しないの指示を与えられる画面例を示す図である。図21に示す画面の例は、図3に示したフローにおけるステップ325での分割・結合リストの作成の処理に対応するものである。
【0117】
図21に示す画面上には、現在分割状態にあるサブディレクトリと使用している物理ドライブの速度、冗長構成、そしてアクセス傾向に関する統計値とが表示されている。それぞれのサブディレクトリを結合するか否かは、「結合」の欄の四角(621)にチェックが入っているかどうかで確認することができる。チェックされていれば結合することを示す。図21に示す例では、/bin/prog3/contents1というサブディレクトリが結合対象となっていることを示している。この四角をポインティングデバイスなどで選択することによって、チェックを入れる・入れない(結合する・しない)を切り替えられるようにすればよい。初期状態では、図20に示した画面例の場合と同様に、本発明の実施形態による処理によって結合要と判断した項目にチェックが入れられているようにしておく仕組みにすればよい。さらに、「初期状態に戻す」ボタン622を用意し、そのボタンを押すことにより、チェック項目を初期状態に戻せるようにしておくと使い勝手の良い画面となる。
【0118】
前述した本発明の実施形態による各処理は、処理プログラムとして構成することができ、この処理プログラムは、HD、DAT、FD、MO、DVD−ROM、CD−ROM等の記録媒体に格納して提供することができる。
【0119】
前述した本発明の実施形態によれば、システム側の働きで、アクセスが集中するサブディレクトリを検出し、アクセスが集中するサブディレクトリの内容を高速な論理ボリュームに移すことができる。すなわち、本発明の実施形態によれば、高速化が必要な一部領域に対してのみ高速にアクセスできるよう論理ボリュームの割り当てを設定することによって、ストレージ装置23のディスクアクセスの効率の向上を図ることができる。
【0120】
また、前述した本発明の実施形態によれば、アクセス傾向の調査対象をサブディレクトリ単位とすることにより、高速化の必要性が高い領域(アクセスが集中する領域)を、ごく狭い範囲にまで絞り込むことができ、これにより、論理ボリューム単位にアクセス傾向を調べる場合と比べ、より効率の良い最適化を行うことが可能になる。
【0121】
【発明の効果】
以上説明したように本発明によれば、論理ボリューム内の部分領域に対するディスクアクセスの最適化を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態による情報処理システムの機能構成を示すブロック図である。
【図2】本発明の一実施形態による情報処理システムのハードウェア構成を示すブロック図である。
【図3】変更操作の決定を中心とした本発明の実施形態の処理手順を説明するフローチャートである。
【図4】アクセス傾向の調査結果のまとめ方を説明するアクセス統計情報の例を説明する図である。
【図5】分割や結合をするべきでないサブディレクトリを定義した適用除外パス情報の例を示す図である。
【図6】図4に示すアクセス統計情報に対して、集計及び適用除外の処理を行い集計表としてまとめた例を示す図である。
【図7】図6に示す集計表に対して代表化を行って作成した集計表の例を示す図である。
【図8】図7に示す集計表から選択したサブディレクトリのリストによる分割予定リストの例を示す図である。
【図9】現状の構成の例を示すパス−論理ボリューム対応情報を示す図である。
【図10】図8、図9に示す内容から作成された分割・結合操作表の例を示す図である。
【図11】既存の分割済みサブディレクトリがあるか否かを示すパス−論理ボリューム対応情報の例を示す図である。
【図12】図3に示すフローのステップ33での結合の実行の詳細な処理手順を説明するフローチャートである。
【図13】図12に示すフローのステップ34でのサブディレクトリを結合する処理の詳細を説明するフローチャートである。
【図14】マウント定義情報の例を示す図である。
【図15】マウント定義情報と論理ボリュームとを対応付けるデバイス定義情報の例を示す図である。
【図16】図3に示すフローのステップ35での分割の実行の詳細な処理手順を説明するフローチャートである。
【図17】図16に示すフローのステップ36でのサブディレクトリを分割する処理の詳細を説明するフローチャートである。
【図18】本発明の他の実施形態による情報処理システムの機能構成を示すブロック図である。
【図19】複数ホスト対応の分析表の例を示す図である。
【図20】サブディレクトリの代表化及びサブディレクトリの分割に関して、人手によって処理内容の確認・指示を行う機能(画面)の例を示す図である。
【図21】サブディレクトリの結合内容の報告及び人手による結合する・しないの指示を与えられる画面例を示す図である。
【符号の説明】
21 ホスト装置
22 通信線
23 ストレージ装置
2101 CPU
2102、2302 メモリ
2103 ストレージI/F
2104 ディスプレイ
2105 キーボード
2111 AP
2112 OS
21121 ファイルシステム
21122 デバイスドライバ
2113 アクセス傾向の調査部
2114 変更操作の決定部
21141 調査結果等の送信部
21142 操作指示の受信部
2115 サブディレクトリ分割の実行部
2116 サブディレクトリ結合の実行部
2301 コントローラ
2303 ホストI/F
2304 ディスク装置(群)
2311 論理ボリューム群
23111、23112 論理ボリューム
2312 論物変換部
2313 物理ドライブ群
23131、23132 物理ドライブ
2314 ボリューム割当管理部
251 調査結果の受信部
252 変更操作の決定部
253 操作指示の送信部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an information processing system and an information processing method, and in particular, in an environment in which a host computer and a storage device are connected and the host computer uses the disk space of the storage device, allocation of a disk area to be used from the host computer side The present invention relates to an information processing system and an information processing method capable of optimizing contents.
[0002]
[Prior art]
As a conventional technique for dynamically securing and releasing a logical volume of a storage device in an information processing system and characterizing the logical volume, for example, a technique described in Patent Literature 1 is known.
[0003]
According to the technology described in Patent Document 1, three types of devices, that is, a host computer (hereinafter, referred to as a host device), a management host device, and a storage device are connected by a communication line to configure an information processing system. It is possible to transmit and receive instructions and data. The host device directly reads and writes data from and to the storage device, and issues a request for addition / deletion of a logical volume (device) to the management host. The content of the logical volume addition request includes information such as the number, capacity, and type (type of redundant configuration) of the devices. The management host device instructs the storage device to add or delete a device based on the request issued from the host device. The storage device responds to data read / write requests from the host device, and adds (secures) or deletes (releases) volumes according to instructions from the management host device.
[0004]
In the system according to the related art as described above, the management host exists as a window for management of the storage device, and from a functional viewpoint, the management host is considered to be positioned as a part of the storage device. As described above, according to the above-described conventional technology, a logical volume (device) can be dynamically secured and released from a host computer (via a management host) on a storage device.
[0005]
Patent Document 1 mentioned above introduces, as types of logical volumes (devices), differences in redundant configuration (RAID 1 (Redundant Arrays of Inexpensive Disks 1) and RAID 5 (5)). Drive speed is also a factor in determining the characteristics of a logical volume. In some cases, physical drives having different processing speeds are used in one storage device, and the performance of logical volumes is divided into groups according to the speeds of the physical drives to be used.
[0006]
Patent Document 2 describes that a plurality of physical drives having different I / O response values (response speeds of physical drives) are used in one storage device, and high-speed access is performed depending on a difference in the speed of the physical drive used. There is disclosed a technique of selectively using a logical volume (group) that can be used and a low-speed logical volume (group).
[0007]
Another factor that determines the characteristics of a logical volume is how to arrange data on a physical drive. Patent Literature 3 discloses a technique for improving the sequential access performance of a physical drive and a logical volume using the physical drive by making the arrangement of data on a physical drive (physical disk) continuous.
[0008]
As described above, the characteristics (access performance and the like) of the logical volume vary depending on the type of the redundant configuration, the speed of the physical drive to be used, the arrangement of data on the physical drive, and the like. In other words, as described in Patent Document 2, it is possible to characterize a logical volume in a storage device using factors such as the type of a redundant configuration.
[0009]
When a logical volume is actually used, the created logical volume (volume) is associated with a specific path (directory) on the host-side file system as described in Patent Document 4. used. For example, the logical volume 1 is associated with an arbitrary (sub) directory, such as “/” (root directory), and the logical volume 2 is associated with “/ etc”. Associating this logical volume with a specific directory is called mounting, and canceling the association, which is the reverse operation, is called unmounting or unmounting.
[0010]
The present invention is an application of applying a feature to a logical volume, and has a mechanism for changing the configuration of a logical volume based on an access tendency. In this respect, a conventional technique that is considered to be closest to the present invention is the system described in Patent Document 3. In this prior art system, a storage device has a plurality of physical drives with different speeds (access performance), and the access tendency to a logical volume (logical disk device) is determined based on the difference in the speed of the mounted physical drive. Is investigated, and the physical drive used by the logical volume is replaced so that a higher-speed physical drive is allocated to the logical volume with higher access frequency. To make up for this swapping process a little, this swapping is performed for a logical volume that uses a low-speed physical drive for a high access frequency and a logical volume that uses a high-speed physical drive for a low access frequency. After the contents of the physical drive are exchanged between the logical drive and the physical drive, the correspondence between the logical volume and the physical drive is switched. By this function, the logical volume with a high access frequency is adjusted to use a higher-speed physical drive, so that the utilization efficiency of the entire storage device can be improved or the response speed to the logical volume can be improved.
[0011]
[Patent Document 1]
JP 2001-142648 A
[0012]
[Patent Document 2]
JP-A-10-320126
[0013]
[Patent Document 3]
JP-A-9-274544
[0014]
[Patent Document 4]
JP-A-5-143419
[0015]
[Problems to be solved by the invention]
The prior art described in Patent Document 3 described above only optimizes a logical volume unit, examines the access tendency to a specific logical volume, and optimizes the logical volume setting based on the result. It is. Therefore, according to this conventional technique, when partial areas having different access tendencies coexist in a specific logical volume, optimization cannot be performed in accordance with the use characteristics of each partial area, and the entire logical volume cannot be optimized. There is a problem that there is no choice but to select one optimization means.
[0016]
SUMMARY OF THE INVENTION It is an object of the present invention to provide an information processing system and an information processing method having a means for solving the above-mentioned problems of the prior art and optimizing disk access to a partial area in a logical volume.
[0017]
[Means for Solving the Problems]
According to the present invention, the object is to provide an information processing apparatus and a storage device having a means for storing information, which are connected by an information transmitting means, and to indicate a part or all of the storage means in the storage device. In an information processing system capable of associating a storage unit with a subdirectory that constitutes a part of a storage structure of the information processing apparatus, the information processing apparatus may access the storage area in the subdirectory by its own information processing apparatus. This is achieved by providing means for moving a large amount of sub-directory to a logical storage unit that can be accessed at a higher speed.
[0018]
Further, the above object is achieved when the information processing apparatus has a plurality of subdirectories with a large access amount to a storage area in the subdirectory, and there is a subdirectory positioned above the plurality of subdirectories. This is achieved by providing means for setting a target to be moved to a logical storage unit capable of high-speed access to a subdirectory positioned above the subdirectory having a large access amount by the information processing apparatus.
[0019]
According to the present invention, by providing the above-described means, a part (partial area) of an area on the file system associated with a specific logical volume is cut out as an independent logical volume as appropriate, thereby associating the logical volume with the logical volume. It is possible to individually set the optimization of disk access for a partial area on the specified file system.
[0020]
That is, according to the present invention, it is possible to assign a logical volume to a subdirectory unit where there is a possibility that the access tendency may differ, and it is possible to set a logical volume according to the access tendency, It is possible to optimize settings according to the access tendency for each subdirectory.
[0021]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of an information processing system and an information processing method according to the present invention will be described in detail with reference to the drawings. The following description of the embodiments will be made in order of four items, namely, hardware configuration, functional configuration, processing content, and extended function.
[0022]
1. Hardware configuration
FIG. 2 is a block diagram illustrating a hardware configuration of the information processing system according to the embodiment of the present invention. In FIG. 2, 21 is a host device, 22 is a communication line, 23 is a storage device, 2101 is a CPU, 2102 and 2302 are memory, 2103 is a storage I / F, 2104 is a display, 2105 is a keyboard, 2301 is a controller, and 2303 is a controller. The host I / F 2304 is a disk device (group).
[0023]
The information processing system according to the embodiment of the present invention is configured by connecting a host device 21 and a storage device 23 via a communication line 22, as shown in FIG. The host device 21 includes a CPU 2101 that controls the entire system, a memory 2102 that stores data and the like during processing, a storage I / F 2103 that is a communication interface with the storage device 23, and a display that displays processing progress and the like. 2104 and a keyboard 2105 for giving processing instructions and the like. The storage device 23 includes a controller 2301 for controlling the storage device 23, a memory 2302 for storing data being processed, a disk device (group) 2304 for storing data used by the host device 21, And a host I / F 2303 which is a communication interface between the host I / F 21 and the host I / F 21.
[0024]
In the above description, the host device 21 is a subject of the processing, and instructs the storage device 23 to write or read data through the communication line 22. On the other hand, the storage device 23 is a main body of data storage, and writes data to the disk device (group) 2304 and reads data from the disk device (group) 2304 based on an instruction from the host device 21.
[0025]
2. Functional configuration
FIG. 1 is a block diagram showing a functional configuration of an information processing system according to an embodiment of the present invention. In FIG. 1, reference numeral 2111 denotes an AP, 2112 denotes an OS, 2113 denotes an access tendency investigation unit, 2114 denotes a change operation determination unit, 2115 denotes a subdirectory division execution unit, 2116 denotes a subdirectory combination execution unit, and 21121 denotes a file system. , 21122 is a device driver, 2311 is a logical volume group, 2312 is a logical-to-physical conversion unit, 2313 is a physical drive group, 2314 is a volume allocation management unit, 23111 and 23112 are logical volumes, 23131 and 23132 are physical drives, and The reference numerals are the same as those in FIG. FIG. 1 shows only functions related to the present invention among the functions of the host device 21 and the storage device 23.
[0026]
In the functional configuration of the information processing system according to the embodiment of the present invention illustrated in FIG. 1, the AP 2111 is one or more programs executed on the host device side, and transmits data to the storage device 23 using the function of the OS 2112. Write and read. An OS (Operating System) is a base that controls the operation of the host device 21. According to the present invention, a function is provided that allows the storage device 23 to be easily handled from the AP 2111 side. The file system 21121 is a function included in the operating system 2112 and has a role of associating a storage area (logical volume 23111) on the storage device 23 side with a specific storage area (file path) on the host side via the device driver 21122. . The device driver 21122 plays a role of communicating with the storage device 23, and a device driver corresponding to the type of the storage device 23 is used.
[0027]
The functions surrounded by double frames in the host device 21 shown in FIG. 1 characterize the present invention. The access tendency checking unit 2113 provides a function of checking the access tendency of each part of the structure (directory structure) in the file system. The change operation determining unit 2114 provides a function of determining whether to divide or join a directory based on the result of the search performed by the access tendency checking unit 2113. The execution unit 2115 of the sub-directory division provides a function of separating a part of the directory structure into a volume different from the currently stored volume. Executing subdirectory join 2116 provides a function of transferring a part of a directory structure in a separated state to a volume storing a parent directory to which a part of the directory structure belongs. Details of the processing contents of the functions characterizing the present invention will be described later.
[0028]
The storage device 23 can add and delete logical volumes as appropriate according to a request from the host device 21 side, and is the same as that described in Patent Document 3 and the like. The outline is briefly described.
[0029]
The storage device 23 includes a logical volume group 2311 and a physical drive group 2313. The logical volume 23111 divides the contents of the physical drive 23131 into units that can be easily handled by the host, and performs read / write access to the logical volume 23111 when reading / writing data from the host. Generally, a plurality of logical volumes 23111 are created, and a logical volume group 2311 is configured by a plurality of logical volumes.
[0030]
The logical-physical conversion unit 2312 indicates the correspondence between the logical volume 23111 and the physical drive 23131, and performs conversion between them. When data is read from or written to the logical volume 23111 from the host device 21, the data is actually read from or written to the corresponding physical drive 23131. The role of the logical-physical conversion 2312 is to manage and control the correspondence between the logical volume 23111 and the physical drive 23131. The physical drive 23131 is a final data storage location, and may be configured by a hard disk drive, a semiconductor storage device, or the like.
[0031]
The volume allocation management unit 2314 has a function of managing the logical volume 2311 of the storage device 23, and has a function of appropriately adding / deleting the logical volume 23112 according to an instruction from the host device 21 side. That is, if there is an instruction to add a volume from the host 21 side, the volume allocation management unit 2314 creates the logical volume 23112 or allocates an unallocated logical volume, and assigns a logical volume 23111 to a physical drive not allocated to the logical volume 23111. A necessary amount of the area is allocated to the new logical volume 23112, and the logical-physical conversion unit 2312 is set so that the new volume 23112 correctly points to the physical drive. Also, if there is a volume deletion instruction from the host 21, the area of the physical drive indicated by the logical volume 23112 to be deleted is treated as unused, and the logical volume 23112 is excluded from the logical-physical conversion 2312.
[0032]
3. Processing content
The basic processing procedure of the present invention is to investigate the access tendency of each subdirectory, evaluate the result of the investigation, and appropriately divide or combine the subdirectories. There are four main processing items. That is, there are four types: investigation of access tendency, determination of a change operation, execution of subdirectory division, and execution of subdirectory combination. These items are executed as a series of procedures. Hereinafter, the four items will be described in order. Note that the specific processing procedure in the embodiment of the present invention is as shown in the flow of FIG. 3, and the details will be described later.
[0033]
3.1 Survey of access trends
According to the present invention, as described above, it is necessary to check the access tendency in units of sub-directories. At this time, the problem is what kind of access tendency to check, how to measure the tendency, There are four points: whether to check the range or how to summarize the results. Hereinafter, these will be described in order.
[0034]
(1) Types of access trends
The access trends investigated in the present invention take up those related to the optimization of logical volumes. For example, access frequency (access amount) is high / low, read / write is high / low, sequential access is high / low, random access is high / low, etc.
[0035]
The most important of the survey items are the high and low access frequencies (total amount of reading and writing for a specific area). A subdirectory with a high access frequency is considered to have a high necessity for improving the access efficiency to the storage device 23, and is a strong candidate for a separate volume (described later). As an optimizing means for an area having a high access frequency, a higher-speed physical drive 23131 is selected, a redundant configuration having a higher processing speed is selected, and a cache of the storage device 23 for the area is distributed more. And other measures can be taken. If an area with a high access frequency can be accessed at a higher speed, and an area other than the access frequency is maintained at a certain level of performance, the efficiency of disk access of the entire storage device 23 can be improved.
[0036]
The above-mentioned items other than the access frequency relate to the optimization of the setting regarding the logical volume or the optimal selection of the logical volume group. As described in the above-mentioned Patent Document 3 and the like, there are good and bad points in responding to the access tendency due to differences in the logical volume redundant configuration and the like. For example, there are several types of redundant configurations of disks called RAID, and it is said that a configuration called RAID1 is superior to a configuration called RAID5 in data writing speed. Therefore, when deciding the redundant configuration of the logical volume, it is possible to select either RAID1 or RAID5, and if it is anticipated that data writing is likely to be large, it is possible to perform optimization such as selecting RAID1. Become. That is, it is possible to rationally determine which of RAID 1 and RAID 5 should be selected by grasping the amount of write amount.
[0037]
(2) How to check access trends
As a method of checking the access tendency of the subdirectory, for example, a method of monitoring the call status of a file input / output related system call provided by the OS 2112 can be used. The OS 2112 provides a system call, which is a call window for performing basic operations on a file, such as opening and closing a file, writing data to a file, and reading data, in a form that can be freely used from the AP 2111 side. Since all file input / output operations performed by the AP 2111 basically go through a system call, by checking the contents of the system call, how much data is written to which file (in the subdirectory) and how much data is written -It is possible to know whether reading has occurred. The mechanism for checking the contents of the system call may be embedded in the entrance of the file input / output-related system call (implemented in the form of being interrupted).
[0038]
As another method of checking the access tendency of the subdirectory, a method based on log information created by the AP 2111 can be used. Some APs 2111 have a function of recording the contents processed by the AP 2111 in a record. For example, some Web servers have a function of recording when and what file is transmitted and how many bytes are transmitted. Based on this record, the file (data) in which subdirectory is It is possible to calculate an estimate of whether bytes have been read. That is, by referring to the log created by the AP 2111, the tendency of the AP 211 to access each subdirectory (total number of bytes read) can be measured.
[0039]
(3) Survey scope
The search target in the embodiment of the present invention is basically “all subdirectories that can be searched”. For example, when an inspection is performed by monitoring the system call, all subdirectories accessed through the system call (including access to files in the subdirectory) are to be inspected.
[0040]
When processing access trends (survey results) of all subdirectories, if the number of subdirectories is enormous and the processing load is a concern, a function for limiting the scope of investigation (the access trend investigation function) may be provided. According to the embodiment of the present invention, the number-of-accesses storage area proportional to the number of sub-directories and the process of counting the number of accesses (calculation of total, rearrangement, etc.) are required. When the number of subdirectories becomes enormous, these storage areas and processing load also become enormous. If the number of investigation targets is reduced, the required storage area and processing load can be reduced.
[0041]
As a method for limiting the search target, for example, the search target may be limited to an upper layer of the directory structure. In other words, the number of levels from the root directory can be set, and accesses to subdirectories exceeding the number of levels (subdirectories lower than that level) are treated as accesses to subdirectories located above it. Good. For example, if “from the root directory to the subdirectory three levels down” is set, the subdirectory / bin / prog1 / data is treated as an independent survey item, but the subdirectory / bin / prog1 / data / 2002 and / bin / prog1 / data / 2001/12 are not treated as a single tally item, and the contents of access to / bin / prog1 / data / 2002 and / bin / prog1 / data / 2001/12 are higher. Is added (aggregated) to the access to the subdirectory / bin / prog1 / data.
[0042]
In addition, you may enable it to set an investigation object arbitrarily. For example, the search target is limited to the sub-directory “/ bin” or less.
[0043]
In the processing according to the embodiment of the present invention, the investigation range of the access tendency and the range of the dividable position are directly connected. Therefore, it should be noted that if the limitation is strengthened, the dividable range is narrowed. For example, in the above example, the subdirectories / bin / prog1 / data / 2002 and / bin / prog1 / data / 2001/12 are not treated as independent items (they do not appear as a single item in the survey result). Those subdirectories will not be handled in the processing after the investigation, and will be excluded from the options of the division position.
[0044]
(4) How to summarize the survey results
FIG. 4 is a diagram for explaining an example of access statistical information for explaining how to summarize the survey results of the access tendency. Next, referring to FIG. 4, a method for compiling the survey results for the access tendency will be described.
[0045]
As described above, the items of the access tendency include the total access amount, the read / write amount, the random access amount, the sequential access amount, and the like. These items can be summarized by the amount of reading and writing for each of sequential and random. The example of the access statistical information 401 shown in FIG. 4 is a summary of the read amount and the write amount for each of sequential and random. The unit of the read / write amount may be the minimum recording unit, for example, the number of accesses to a 512-byte recording block (sector). For example, when 2048 (512 × 4) bytes of continuous data are written from the beginning of a recording block, sequential writing may be performed four times. Alternatively, assuming that writing to the first recording block involves movement from another recording block, random writing may be performed once and sequential writing may be performed three times.
[0046]
3.2 Determination of change operation
The change operation determination processing is a core part of the present invention, and determines an operation for changing the subdirectory division state based on the access tendency research result.
[0047]
FIG. 3 is a flowchart for explaining the processing procedure of the embodiment of the present invention centering on the determination of the change operation. Hereinafter, the determination of the change operation will be described with reference to the flow shown in FIG.
[0048]
(1) Tabulation of access trends
The contents of the process of investigating the access tendency in step 311 in FIG. 3 are as described above, and by performing the process, the access statistical information 401 described with reference to FIG. 4 can be obtained. The change operation determination process starts with the process of totalizing the statistical information in step 321 in FIG.
[0049]
First, the significance of tallying will be described. The point of the process of totalizing the survey results in step 321 is to grasp the tendency linked to optimization from the measurement result of the access amount. In that sense, finding the location (subdirectory) where the amount of access is large is the first step of the analysis process. This is because the embodiment of the present invention specifies an area with a large amount of access and performs optimization independently of the area. That is, the large amount of access is the most important item in the analysis processing. The evaluation item next to the access amount is the writing amount.
[0050]
As described above, depending on the type of the redundant configuration, there is a strong point or a weak point in writing. By utilizing the characteristics, it is possible to make a judgment such as “there is little problem in performance even with the RAID1 configuration because the writing amount is small”. In addition, as described in the section of the related art, the arrangement of the data on the physical drive is devised to cope with the large number of sequential accesses.
[0051]
Hereinafter, using the contents shown in FIG. 4 as an example of the survey result, the access amount (total access amount) and the write amount will be described as the aggregation items.
[0052]
The example of the access statistical information 401 to be tabulated shown in FIG. 4 includes the read amount and the write amount for each of the sequential and random statistics. The total access amount and the write amount are calculated from those items. The total access amount is the sum of the sequential access (read / write) and the random access (read / write), and the write amount can be calculated by adding the sequential write amount and the random write amount.
[0053]
On the other hand, some subdirectories should not be split or merged. For example, if the sub-directory is divided for the reason of being used by the OS 2112 itself, there may be a problem in operation. In addition, since the amount of access is expected to change in the near future, it may be necessary to combine and divide subdirectories in advance based on human intentions.
[0054]
In order to respond to a request that a particular subdirectory should not be split or combined, embodiments of the present invention may allow for the definition of subdirectories to be exempt from processing.
[0055]
FIG. 5 is a diagram illustrating an example of the application exclusion path information 402 that defines subdirectories that should not be divided or combined. In the application exclusion path information 402 shown in FIG. 4, “path name 4021” indicates the name of the subdirectory to be excluded, and “application to lower order 4022” indicates the application of exclusion to the lower subdirectory. Is also specified. For example, in the specification on the first line in the example shown in FIG. 5, the root directory "/" is excluded from division / combination, but subdirectories below this root directory are not excluded. It is shown that. On the other hand, the subdirectories / etc and / sys are also exempted from subdirectories below them. For example, there is a subdirectory named subdirectory / etc / cfg under the subdirectory / etc. In that case, the subdirectory is also excluded.
[0056]
Further, as another application exclusion item, a lower limit of the size of the division target subdirectory may be set. Creating a logical volume consumes resources on the storage device 23 side, so it may not be desirable to create a logical volume of an extremely small size. To cope with this, a lower limit of the size may be set, and subdirectories with a size smaller than that size may be excluded from division targets.
[0057]
Further, it is conceivable to set an upper limit of the number of divisions as another application exclusion item. It may be better to refrain from creating a large number of logical volumes because the number of logical volumes created on the storage device 23 is limited. For this reason, for example, a function may be provided for adding an upper limit to the number of equally divided sub-directories up to a maximum of five.
[0058]
As described above, the present invention can apply various methods of application exclusion. In the embodiment of the present invention, application exclusion is indicated in the application exclusion path information 402 shown in FIG. 5 for convenience. The following description focuses on exemptions.
[0059]
FIG. 6 is a diagram illustrating an example in which the above-described aggregation and exclusion processing is performed on the access statistical information 401 illustrated in FIG. In the example of the tabulation table 4031 shown in FIG. 6, the investigation results shown in FIG. 4 are totaled into the total access amount and the write amount for each subdirectory, and the information of the subdirectories for the exclusion target shown in FIG. 5 is removed. Further, the sub directories are sorted by the total access amount. For this reason, the subdirectory located at the top of the list of the tabulation table is a division candidate.
[0060]
(2) Subdirectory representation
Next, by the processing of step 322 in FIG. 3, the contents of the tally table 4031 are further represented by subdirectories. This processing may be omitted. Sub-directory representativeization means that if there are multiple child (equivalent) sub-directories under one parent directory, and many of the child sub-directories show a similar access tendency, those child sub-directories are added to the parent directory. It is to be represented. This is an auxiliary process performed for the purpose of not increasing the number of subdirectory divisions more than necessary.
[0061]
Processing related to the representative function is performed, for example, as follows. That is, the access tendency of the child sub-directories having a common parent directory is compared, and if the similarity is high, the measurement result of the access is counted as the measurement result of the parent sub-directory. At this time, the method of judging the access tendency similarity between the subdirectories is a problem. However, the degree of the access amount, the ratio of writing / reading, and the total number of child subdirectories having the same parent are considered. Among them, a threshold value may be determined for the ratio of the number of child subdirectories showing the same tendency, and the determination may be made based on the threshold value. Of course, the representative sub-directory can be further represented.
[0062]
An example of the representative will be described. Now, the condition of the representative is that a plurality of child subdirectories having the same parent are present, and the access amount of a specific child subdirectory does not exceed 70% of the access amount of the entire child subdirectory (specific child subdirectory). It is assumed that the content is set so that the access amount of the entire child subdirectory exceeds 100,000. Assuming that the condition is applied to the contents of the tabulation table shown in FIG. 6, two subdirectories, ie, subdirectories / bin / prog2 / data1 and / bin / prog2 / data2, satisfy the condition, and subdirectory / bin / prog2 will represent those child subdirectories.
[0063]
FIG. 7 is a diagram illustrating an example of a tabulation table created by representativeizing the tabulation table illustrated in FIG. As a result of the above-described representative, as shown in FIG. 7, the statistical values of the subdirectories / bin / prog2 / data2 and / bin / prog2 / data1 are aggregated (totaled) in the subdirectory / bin / prog2. , / Bin / prog2 / data2 and / bin / prog2 / data1 are removed from the summary table.
[0064]
Note that the representative function is a correction position with respect to the measurement result, and does not affect the division target selection processing performed thereafter.
[0065]
(3) Creation of subdirectory split plan
After the above-described representative processing is completed (after the totalization when the representative processing is omitted), a subdirectory division plan is created by the processing of step 323 in FIG. Hereinafter, specific processing contents will be described based on the contents of the tally table shown in FIG.
[0066]
The determination as to whether to divide the subdirectory may be made based on whether the total access amount exceeds a set threshold. For example, assuming that the threshold value of the total access amount is set to 200,000, in the example shown in FIG. 7, the sub directories / bin / prog1 / work, / bin / prog3 / contents2, and / bin / prog2 Three subdirectories are to be divided. Note that the threshold value may be set by a relative share, in addition to a form in which a constant is set in advance. For example, the total access amount exceeding 20% of the total access amount of all subdirectories may be set. The amount may be set as a threshold value.
[0067]
Following the evaluation of the total access amount, the write amount is evaluated. In the embodiment of the present invention, RAID1 with a high writing speed is assigned to a subdirectory with a large writing amount, and RAID5 with a reading speed comparable to RAID1 is assigned to a subdirectory with a small writing amount. When determining whether the write amount is large or small, a threshold value may be used as in the case of evaluating the total access amount. The threshold value may be a constant or may be specified as a ratio to the total access amount. Now, assuming that a constant of 150,000 is set for the threshold value of the write amount, in the example shown in FIG. 7, the sub directories / bin / prog1 / work and / bin / prog2 have a large write amount, bin / prog3 / contents2 can be determined to have a small write amount. Then, based on the result of the determination, the former may be configured as a RAID 1 configuration, and the latter may be configured as a RAID 5 configuration. Then, the above-described selection contents may be put together as a division schedule list.
[0068]
FIG. 8 is a diagram showing an example of a division schedule list 404 based on a list of subdirectories selected from the tabulation table shown in FIG. 7 based on the above-described evaluation.
[0069]
In the embodiment of the present invention, it is assumed that the speed of the physical drive can be selected from high speed and low speed. In addition, since it is premised that the subdirectory to be divided has a large total access amount, all the physical drives are set to high speed. As a result, in the case of the contents of the summary table 404 shown in FIG. 7, three subdirectories of the subdirectories / bin / prog1 / work, / bin / prog3 / contents2, and / bin / prog2 are listed up as shown in FIG. A high-speed physical drive is assigned to all of them, and a divided schedule list is created in which the subdirectories / bin / prog1 / work and / bin / prog2 have a RAID1 configuration and / bin / prog3 / contents2 has a RAID5 configuration. .
[0070]
(4) Creating a split / join list
By the way, the division schedule list 404 created in the above-described processing merely shows the way of division after the execution of the processing according to the present invention, and actually requires a transition processing based on the current division state. Become. For example, if the sub-directory included in the division schedule list 404 has already been divided, there is no need to perform another division, and conversely, even if it has already been divided, considering the current access tendency, In some cases, it is better to restore the divided state, that is, combine them.
[0071]
Therefore, in the process to be performed next to the creation of the division plan in the process of step 323 in FIG. 3 described above, an operation list (table) of division / combination accompanying the migration is created by the process in step 324 in FIG. That is. The division / combination operation table may be created by taking the difference between the current configuration and the division schedule list.
[0072]
FIG. 9 is a diagram showing path-logical volume correspondence information showing an example of the current configuration. It is assumed that the current configuration is as shown in FIG. Will be described.
[0073]
As a side note, since the embodiment of the present invention adopts a processing method of cutting out a subdirectory where access is concentrated into a high-speed logical volume, if the logical volume of the parent directory is originally set to high speed, There is no point (decrease) in extracting a part and transferring it to a high-speed logical volume. Therefore, in the embodiment of the present invention, as shown in FIG. 9, a low-speed logical volume is allocated to a parent directory such as a root directory.
[0074]
The current configuration table 4051 shown in FIG. 9 includes a subdirectory to be excluded (see FIG. 5), but a subdirectory / bin / prog1 / work included in the remaining portion 40511 excluding the subdirectory. , / Bin / prog2 / data1, and / bin / prog3 / contents1 to be processed in the embodiment of the present invention.
[0075]
The process of creating the split / join operation table is started by first finding a common term between the current split subdirectory 40511 and the contents of the split schedule list 404. If there is a common one, the subdirectory is excluded from the scheduled division because there is no need to divide it again. In the example shown in FIGS. 8 and 9, since the subdirectory / bin / prog1 / work is common, the subdirectory may be removed from the division schedule list. Next, a subdirectory in the division schedule list 404 that is not in the current configuration 4051 is searched, and if there is, the subdirectory is set as a division target. In the examples of FIGS. 8 and 9, the sub directories / bin / prog2 and / bin / prog3 / contents2 correspond to the division targets. Further, a sub-directory which is present in the current configuration 4051 but not in the division schedule list 404 is searched, and if there is, the sub-directory is a candidate for joining (returning from the divided state to the original state). In the examples shown in FIGS. 8 and 9, / bin / prog2 / data1 and / bin / prog3 / contents1 correspond to them, and are binding candidates. Then, the result of performing the above-described processing may be summarized as a division / combination operation table.
[0076]
FIG. 10 is a diagram showing an example of the division / combination operation table 406 created from the contents shown in FIGS. 8 and 9 by the processing described above.
[0077]
Note that subdirectories that are not included in the division schedule list 404 may not be immediately transferred to the connection but may be given some time for the connection. The reason will be described below. In deciding the sub-directory to be included in the division schedule list 404, the condition is that the total access amount exceeds a specific threshold value (200,000 is set in the embodiment of the present invention). Therefore, in a situation where the total access amount to the subdirectory fluctuates near the threshold, a case where division / combination is repeated every time the processing according to the embodiment of the present invention is performed may be considered. At the time of division or combination, it is necessary to perform processing with a relatively large load, such as moving the contents of the subdirectory and securing / releasing a volume, so it is not desirable to perform division / combination unnecessarily. In order to suppress such frequent occurrence of division / combination, a method of setting the threshold value of division / combination to another value may be adopted. For example, if the division threshold is set to 200,000, the combination threshold is set to 100,000. In such a case, once the total access amount exceeds 200,000, the division is executed. However, since the connection is not performed until the total access amount falls below 100,000, it is possible to suppress the occurrence of the large number of division / connection. it can.
[0078]
When the creation of the division / combination operation table 406 is completed, the process proceeds to execution of division and combination. Referring to the flow shown in FIG. 3, next, it is determined whether or not there is a combining operation in the division / combining operation table 406 (step 325), and if there is, the combining is executed (step 33). Subsequently, it is determined whether or not there is a division operation in the division / combination operation table 406 (step 326), and if there is, division is performed (step 35). Details of the division / combination processing will be described below.
[0079]
3.3 Join processing
FIG. 12 is a flowchart for explaining the detailed processing procedure of executing the combination in step 33 of the flow shown in FIG. 3, which will be described next. The processing according to this flow is to join all the joining target subdirectories included in the division / joining operation table 406.
[0080]
(1) First, the top of the subdirectories to be combined included in the division / combination operation table 406 is selected. For example, in the case of the division / combination operation table 406 shown in FIG. 10, the subdirectory / bin / prog2 / data1 is selected (step 331).
[0081]
(2) Then, a joining process is performed on the subdirectory. Details of this processing will be described later with reference to FIG. 13 (step 34).
[0082]
(3) In the process of step 34, when the joining of the selected subdirectories is completed, the next joining target is searched from the division / joining operation table 406, and the presence or absence of the next joining target subdirectory is determined. The process ends (step 332).
[0083]
(4) If it is determined in step 332 that there is a next subdirectory to be combined, the next subdirectory to be combined is selected, and the process returns to step 34 to perform the combining process for the subdirectory (step 333). ).
[0084]
FIG. 13 is a flowchart for explaining the details of the process of joining subdirectories in step 34 of the flow shown in FIG. 12, and FIG. 11 is an example of path-logical volume correspondence information indicating whether there is an existing divided subdirectory. FIG. 14 is a diagram showing an example of mount definition information, and FIG. 15 is a diagram showing an example of device definition information for associating mount definition information with a logical volume. Next, refer to the flow shown in FIG. Next, the combining process for a specific subdirectory will be described. The information shown in FIGS. 11, 14 and 15 is information referred to in the processing of this flow.
[0085]
(1) When the process is started, first, it is checked whether or not there is a sub-directory already divided among sub-directories below the selected sub-directory. , Unmount that subdirectory. The reason why the mounting is released is to avoid malfunction of the divided sub-directory during the division of the selected sub-directory (steps 341 and 342).
[0086]
In the above, whether or not there is an existing divided subdirectory can be determined by referring to the information shown in FIG. The mount definition information includes a device name, a subdirectory name (path name), and the like, as shown in FIG. Unmounting can be performed by deleting the line to be unmounted from the contents of the mount definition information and restarting the OS 2112, or by directly executing the unmounting command from the command line.
[0087]
(2) After the processing in step 342 or in the check in step 341, if there is no sub-directory already divided under the selected sub-directory, then an existing sub-directory is located at the return position (under the same parent directory). Create a temporary subdirectory with a name that does not duplicate the subdirectory. For example, if the subdirectory to be combined is / bin / prog2 / data1, a subdirectory named / bin / prog2 / data1_temp may be created (step 343).
[0088]
(3) Then, the contents of the sub-directory to be combined are copied into the temporary sub-directory, including the contents of the lower-level sub-directory. In the case of the above-described example, the contents of the subdirectory / bin / prog2 / data1 are copied to / bin / prog2 / data1_temp (step 344).
[0089]
Before the contents are copied in the processing of the above-mentioned step 344, the free space of the connection destination is checked, and if the contents of the connection target subdirectory cannot be completely copied to the connection destination (the capacity is insufficient), the connection processing is canceled. Alternatively, the volume may be automatically expanded instead of canceling.
[0090]
(4) Next, the logical volume to be combined is unmounted, that is, the mount is released, and the unnecessary logical volume to be combined is deleted (steps 345 and 346).
[0091]
When a command corresponding to the type of the storage device 23 is provided, the deletion of the logical volume described above can be performed by executing the command. Then, in order to associate the mount definition information 407 with the logical volume, for example, the management may be performed with the device definition information 408 as shown in FIG. The device definition information 408 includes a device name as a representative name for identifying a logical volume, a controller number (the number of the storage I / F 2103) as information indicating the location of the logical volume, and a target number (the storage device 23). ) And a logical unit number (recording unit number in the storage device 23).
[0092]
(5) Then, the temporary subdirectory name created in the process of step 343 is renamed to a regular name (name of a subdirectory to be combined). In the case of the above-described example, the subdirectory / bin / prog2 / data1_temp is renamed to / bin / prog2 / data1 (step 347).
[0093]
(6) Finally, it is determined whether there is a subdirectory that has been unmounted in the process of step 342, and if so, the unmounted subdirectory is remounted, and the process proceeds to the process of step 332 in FIG. 12 ( Steps 348, 349).
[0094]
3.4 Division processing
FIG. 16 is a flowchart for explaining the detailed processing procedure of the execution of the division in step 35 of the flow shown in FIG. 3, and this will be described next. The processing according to this flow is to divide all of the division target subdirectories included in the division / combination operation table 406.
[0095]
The procedure of the division processing by the flow shown in FIG. 16 is to select the sub directories to be divided one by one from the division / combination operation table 406 and execute the division processing procedure in the processing of step 36. Since the processing is similar to the combining procedure described with reference to FIG. 12, the description thereof will be omitted.
[0096]
FIG. 17 is a flowchart illustrating the details of the process of dividing a subdirectory in step 36 of the flow shown in FIG. 16. Next, the division process for a specific subdirectory will be described with reference to the flow shown in FIG. 17. I do.
[0097]
(1) When the process is started, first, it is checked whether or not there is a sub-directory already divided among sub-directories located below the selected sub-directory. If there is, unmount that subdirectory. The reason why the mount is released is to avoid a malfunction in the migration process, as in the case of the combining process. The release of the mount (and the mount) may be dealt with by rewriting the mount definition information 407 as in the case of the combining process (steps 361 and 362).
[0098]
(2) Next, a new logical volume that matches the characteristics (the physical drive speed and the type of the redundant configuration registered in the table) specified in the split / join operation table is secured. A new logical volume can be secured by executing a command corresponding to the type of the storage device 23, or the like. When a new logical volume is added, information on the added logical volume is registered in the device definition information 408 shown in FIG. 15 (step 363).
[0099]
(3) Next, the new logical volume is mounted on a subdirectory with a temporary name. The temporary name may be a name after the name of the subdirectory to be divided. For example, when the subdirectory / bin / prog2 is divided, the subdirectory is followed by the subdirectory / etc / temp (temporary storage subdirectory). Then, it is set to / etc / temp / bin / prog2 or the like (step 364).
[0100]
(4) Then, the contents of the subdirectory to be divided, including the contents of the lower subdirectories, are copied to a subdirectory with a temporary name (a new logical volume area). In the case of the above-described example, the contents of the subdirectory / bin / prog2 are copied to the subdirectory / etc / temp / bin / prog2 (step 365).
[0101]
(5) Then, unmount (unmount) the new logical volume mounted on the temporary subdirectory, and then mount the new logical volume at a regular position (position of the subdirectory to be divided). In the case of the above-described example, a new logical volume is mounted on the subdirectory / bin / prog2 (steps 366 and 367).
[0102]
(6) Finally, it is checked whether or not there is a subdirectory that has been unmounted in the process of step 362, and if so, the mount of the unmounted subdirectory is restored, and the process proceeds to the process of step 352 in FIG. (Steps 368, 369).
[0103]
4. Extension
Next, a multi-host compatible system and an operation GUI (Graphical User Interface), which are extended functions of the present invention, will be described in order.
[0104]
(1) Multi host support
Multi-host compatibility means that sub-directory division states of a plurality of host devices 21 are comprehensively optimized. The details will be described below.
[0105]
In a system using a SAN (Storage Area Network), one or more storage devices 23 are used by a plurality of host devices 21. In such a system, the limited disk resources of the storage device 23 are shared by a plurality of host devices 21. Therefore, the problem is to allocate the disk resources of the storage device 23 more effectively.
[0106]
Therefore, the present invention is applied to a plurality of host devices 21 sharing the storage device 23. Specifically, a plurality of host devices 21 using the storage device 23 are made to check the access tendency of each subdirectory in the host device 21, and the check results are totaled from the plurality of host devices 21, The operation of dividing / changing the sub-directory is performed by comprehensively judging from the access tendency in the host device 21. As a result, it is possible to optimize the overall use of disks in consideration of the balance of the entire system in which a plurality of host devices 21 are connected to the storage device 23.
[0107]
FIG. 18 is a block diagram illustrating a functional configuration of an information processing system according to another embodiment of the present invention, and FIG. 19 is a diagram illustrating an example of an analysis table corresponding to a plurality of hosts. Another embodiment of the present invention shown in FIG. 18 is an example of a system for optimizing the division state of a sub-directory based on a result of a survey from a plurality of host devices 21, and is an extension of the system described with reference to FIG. Therefore, the description will focus on the extended part from FIG. In FIG. 18, 25 is a division / combination manager, 251 is a receiving unit of the investigation result, 252 is a determining unit of the change operation, 253 is a transmitting unit of the operation instruction, 21141 is a transmitting unit of the investigation result, and 21142 is the receiving of the operation instruction And other reference numerals are the same as those in FIG.
[0108]
The most significant difference between the system shown in FIG. 18 and the system shown in FIG. 1 in the system shown in FIG. 1 is that a division / combination manager 25, which is an access tendency information processing apparatus for processing access tendency information, is added. It is a point that was done. The division / combination manager 25 has a communication means with the host device 21, receives access tendency information from a plurality of host devices at a survey result receiving unit 251, and obtains a change operation determining unit 252 from a plurality of hosts. The information on the access tendency is comprehensively determined (in parallel with a plurality of hosts) and a change operation is determined, and the operation instruction transmitting unit 252 divides or joins the sub-directory to the host device 21 requiring the change operation. Is configured to indicate. From a different point of view, the system shown in FIG. 18 is a system of the procedure from the investigation of the access tendency closed in one host device 21 to the execution of the division / combination in the embodiment of the present invention described with reference to FIG. A part is in the form of the division / integration manager 25. The function of the division / integration manager 25 is almost the same as that of the change operation determination unit 2114 in FIG. 1, but differs in that it supports a plurality of hosts. Therefore, a host name for identifying the host is added to an analysis table or the like. FIG. 19 shows an example of the analysis table corresponding to a plurality of hosts. In this example, a column of the host name 4071 is added to the correspondence table shown in FIG.
[0109]
The difference between the host device 21 in the system shown in FIG. 18 and the system shown in FIG. 1 is that the determination unit 2114 for the change operation of the system in FIG. 1 is eliminated, and instead, the transmission unit 21141 for receiving the investigation result and the reception of the operation instruction are received. This is the point that the part 21142 is added. The transmission unit 21141 of the survey result and the like transmits the survey result of the access tendency (the statistical information 401 shown in FIG. 4 or the analysis table 4031 shown in FIG. 6 obtained by performing a tallying process on the statistical information 401) and the application exclusion path information shown in FIG. 402, information necessary for “decision of change operation” such as the path-logical volume correspondence information 4051 shown in FIG. The operation instruction receiving unit 21142 receives a subdirectory division execution instruction and a subdirectory combination execution instruction from the division / integration manager 25, and executes the subdirectory division execution unit 2115 and the subdirectory combination execution unit according to the contents. 2116 causes the sub-directory to be divided or combined.
[0110]
The storage device 23 does not need to be particularly changed from that shown in FIG. The relationship between the host device 21 and the storage device 23 is the same as in the system shown in FIG.
[0111]
Although the system shown in FIG. 18 has been described for the purpose of supporting multiple hosts, it may be used for a single host.
[0112]
(2) GUI
Although the system according to each embodiment of the present invention described above aims at automatically adjusting the division state of the volume, the present invention informs a person in the middle of the processing or manually executes the processing contents. A mechanism can be provided that enables the user to instruct a change or the like.
[0113]
FIG. 20 is a diagram illustrating an example of a function (screen) for manually confirming and instructing the processing contents regarding subdirectory representative and subdirectory division. The example of the screen shown in FIG. 20 is based on the assumption that the processing content of a portion corresponding to steps 322, 323, and 324 in the flow shown in FIG. 3 is displayed and changed.
[0114]
The main functions of the screen in FIG. 20 are confirmation / change of sub-directory representativeness, and display and change of the sub-directory division state. The representative state of the subdirectory is indicated by a plus sign surrounded by a square or a minus sign surrounded by a square displayed to the left of the subdirectory name (612). The plus sign of this symbol indicates that it is represented, and the minus sign indicates that it is not. In the example shown in FIG. 20, the left side of the subdirectory / bin / prog2 has a plus sign, indicating that the subdirectory / bin / prog2 is represented. By selecting this symbol with a pointing device such as a mouse or the like, it is possible to switch between representative and non-representative states (plus and minus). In the initial state immediately after the screen is opened or the like, only the part determined to be representative by the processing according to the embodiment of the present invention may be in a state where it is representative.
[0115]
On the other hand, the designation of the division of the subdirectory indicates whether or not the division is performed depending on whether or not the portion (611) indicated by the square in the frame on the left of the subdirectory name is checked. If there is a check display, it indicates that a subdirectory on the same line is to be divided. The example shown in FIG. 20 shows that two subdirectories, / bin / prog1 / work and / bin / prog2, are divided. As in the case of the representative, in the initial state, the state may be such that the division position determined by the system of the embodiment of the present invention is checked. In addition, if the setting of division or representative is returned to the initial state by pressing the “return to initial state” button 613, even if the operator changes the state by trial and error, the operation can be performed by one operation. This is convenient because it can be returned to the initial state.
[0116]
FIG. 21 is a diagram showing an example of a screen on which a report of the combined contents of the subdirectories and an instruction to manually combine or not to combine are given. The example of the screen shown in FIG. 21 corresponds to the process of creating the division / combination list in step 325 in the flow shown in FIG.
[0117]
On the screen shown in FIG. 21, the currently divided sub-directory, the speed of the physical drive being used, the redundant configuration, and the statistical value relating to the access tendency are displayed. Whether or not to combine the respective subdirectories can be confirmed by checking whether or not the box (621) in the column of "merge" is checked. If it is checked, it indicates to join. The example shown in FIG. 21 indicates that the subdirectory / bin / prog3 / contents1 is to be combined. By selecting this square with a pointing device or the like, it is only necessary to be able to switch between checking and not checking (combining or not). In the initial state, as in the case of the screen example shown in FIG. 20, it is sufficient that a check is put on an item that has been determined to be required to be combined by the processing according to the embodiment of the present invention. Further, if a “return to initial state” button 622 is prepared and the check item can be returned to the initial state by pressing the button, a screen that is easy to use is obtained.
[0118]
Each processing according to the above-described embodiment of the present invention can be configured as a processing program, and the processing program is provided by being stored in a recording medium such as an HD, a DAT, an FD, an MO, a DVD-ROM, and a CD-ROM. can do.
[0119]
According to the above-described embodiment of the present invention, it is possible to detect the sub-directory where the access is concentrated and move the contents of the sub-directory where the access is concentrated to a high-speed logical volume by the operation of the system. That is, according to the embodiment of the present invention, the efficiency of the disk access of the storage device 23 is improved by setting the assignment of the logical volume so that the high-speed access can be made only to a part of the area requiring the high speed. be able to.
[0120]
Further, according to the above-described embodiment of the present invention, an area for which high speed is necessary (an area where access is concentrated) is narrowed down to a very narrow area by making an access tendency investigation target in units of sub directories. This makes it possible to perform more efficient optimization as compared with the case where the access tendency is checked in units of logical volumes.
[0121]
【The invention's effect】
As described above, according to the present invention, it is possible to optimize disk access to a partial area in a logical volume.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a functional configuration of an information processing system according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a hardware configuration of an information processing system according to an embodiment of the present invention.
FIG. 3 is a flowchart illustrating a processing procedure according to an embodiment of the present invention, centering on determination of a change operation.
FIG. 4 is a diagram illustrating an example of access statistical information for explaining how to summarize the survey results of access trends;
FIG. 5 is a diagram illustrating an example of application exclusion path information that defines a subdirectory that should not be split or combined;
6 is a diagram showing an example in which the access statistical information shown in FIG. 4 is tabulated and excluded from application and compiled as a tabulation table.
FIG. 7 is a diagram illustrating an example of a tabulation table created by representativeizing the tabulation table illustrated in FIG. 6;
8 is a diagram showing an example of a division schedule list based on a list of subdirectories selected from the tabulation table shown in FIG. 7;
FIG. 9 is a diagram showing path-logical volume correspondence information showing an example of the current configuration.
FIG. 10 is a diagram showing an example of a split / join operation table created from the contents shown in FIGS. 8 and 9;
FIG. 11 is a diagram showing an example of path-logical volume correspondence information indicating whether there is an existing divided subdirectory.
FIG. 12 is a flowchart illustrating a detailed processing procedure of executing combination in step 33 of the flow shown in FIG. 3;
FIG. 13 is a flowchart illustrating details of a process of combining subdirectories in step of the flow shown in FIG. 12;
FIG. 14 is a diagram illustrating an example of mount definition information.
FIG. 15 is a diagram illustrating an example of device definition information that associates mount definition information with a logical volume.
FIG. 16 is a flowchart illustrating a detailed processing procedure of executing division in step 35 of the flow shown in FIG. 3;
FIG. 17 is a flowchart illustrating details of a process of dividing a subdirectory in step 36 of the flow shown in FIG.
FIG. 18 is a block diagram showing a functional configuration of an information processing system according to another embodiment of the present invention.
FIG. 19 is a diagram showing an example of an analysis table corresponding to a plurality of hosts.
FIG. 20 is a diagram illustrating an example of a function (screen) for manually confirming and instructing the processing content regarding subdirectory representative and subdirectory division.
FIG. 21 is a diagram showing an example of a screen on which a report of the contents of combination of subdirectories and an instruction to manually combine or not to combine are given.
[Explanation of symbols]
21 Host device
22 Communication line
23 Storage device
2101 CPU
2102, 2302 memory
2103 Storage I / F
2104 display
2105 Keyboard
2111 AP
2112 OS
21121 File system
21122 Device Driver
2113 Access Trend Survey Department
2114 Change operation determination unit
21141 Transmission section for survey results, etc.
21142 Operation instruction receiving unit
2115 Execution unit of subdirectory division
2116 Execution part of subdirectory combination
2301 Controller
2303 Host I / F
2304 Disk unit (group)
2311 Logical volume group
23111, 23112 Logical volume
2312 Logical-physical conversion unit
2313 Physical Drive Group
23131, 23132 Physical drive
2314 Volume allocation management unit
251 Receiving part of survey result
252 change operation determination unit
253 Operation instruction transmission unit

Claims (14)

情報処理装置と情報を記憶する手段を持つ記憶装置とが情報伝達手段によって接続されて構成され、前記記憶装置内の記憶手段の一部または全部を指す論理的記憶単位を、前記情報処理装置の記憶構造の一部を構成するサブディレクトリに対応付けることが可能な情報処理システムにおいて、
前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量が多いサブディレクトリをより高速なアクセスが可能な論理的記憶単位に移す手段を備えることを特徴とする情報処理システム。
An information processing device and a storage device having a unit for storing information are connected to each other by an information transmission unit, and a logical storage unit indicating a part or all of the storage unit in the storage device is defined as a logical storage unit of the information processing device. In an information processing system capable of being associated with a subdirectory constituting a part of a storage structure,
The information processing apparatus further comprises means for transferring a subdirectory having a large amount of access to a storage area in the subdirectory by the information processing apparatus to a logical storage unit capable of accessing at a higher speed. .
前記情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量の多い複数のサブディレクトリが複数あり、それらの複数のサブディレクトリの上位に位置付けられるサブディレクトリがある場合、前記より高速なアクセスが可能な論理的記憶単位に移される対象を、前記情報処理装置によるアクセス量が多い前記サブディレクトリの上位に位置付けられるサブディレクトリとする手段を備えることを特徴とする請求項1記載の情報処理システム。In the case where there are a plurality of subdirectories with a large access amount to the storage area in the subdirectory by the information processing device, and there is a subdirectory positioned above the plurality of subdirectories, the higher-speed access is possible. 2. The information processing system according to claim 1, further comprising means for setting a target to be moved to a logical storage unit as a subdirectory positioned above the subdirectory having a large access amount by the information processing apparatus. 情報処理装置と情報を記憶する手段を持つ記憶装置とが情報伝達手段によって接続されて構成され、前記記憶装置内の記憶手段の一部または全部を指す論理的記憶単位を、前記情報処理装置の記憶構造の一部を構成するサブディレクトリに対応付けることが可能な情報処理システムにおいて、
前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対する書き込み量が多いサブディレクトリをより高速な書き込みが可能な論理的記憶単位に移す手段を備えることを特徴とする情報処理システム。
An information processing device and a storage device having a unit for storing information are connected to each other by an information transmission unit, and a logical storage unit indicating a part or all of the storage unit in the storage device is defined as a logical storage unit of the information processing device. In an information processing system capable of being associated with a subdirectory constituting a part of a storage structure,
The information processing system according to claim 1, wherein the information processing apparatus includes means for transferring a subdirectory, which has a large amount of writing to a storage area in the subdirectory by the information processing apparatus, to a logical storage unit capable of writing at a higher speed. .
前記前記サブディレクトリ内の記憶領域に対するアクセスがシーケンシャルアクセスであることを特徴とする請求項1記載の情報処理システム。2. The information processing system according to claim 1, wherein the access to the storage area in the subdirectory is a sequential access. 前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量が多いサブディレクトリをより高速なアクセスが可能な論理的記憶単位に移した後、アクセス量が少なくなったとき、該当するサブディレクトリを元の論理的記憶単位に戻す手段を備えることを特徴とする請求項1記載の情報処理システム。The information processing apparatus, after moving the sub-directory with a large amount of access to the storage area in the sub-directory by its own information processing device to a logical storage unit that allows faster access, when the amount of access is reduced, 2. The information processing system according to claim 1, further comprising means for returning the corresponding subdirectory to the original logical storage unit. 情報処理装置と情報を記憶する手段を持つ記憶装置とが情報伝達手段によって接続されて構成され、前記記憶装置内の記憶手段の一部または全部を指す論理的記憶単位を、前記情報処理装置の記憶構造の一部を構成するサブディレクトリに対応付けることが可能な情報処理システムにおいて、
前記情報処理装置から情報伝達手段によって接続されたアクセス傾向の情報を処理するアクセス傾向情報処理装置を備え、該アクセス傾向情報処理装置は、前記情報処理装置から前記サブディレクトリのアクセス傾向情報を受け取る手段と、受け取った前記アクセス傾向情報に基づいて前記サブディレクトリと前記論理的記憶単位との対応付けの状態を変更する判断を行う手段とを備えたことを特徴とする情報処理システム。
An information processing device and a storage device having a unit for storing information are connected to each other by an information transmission unit, and a logical storage unit indicating a part or all of the storage unit in the storage device is defined as a logical storage unit of the information processing device. In an information processing system capable of being associated with a subdirectory constituting a part of a storage structure,
An access tendency information processing apparatus for processing access tendency information connected by information transmission means from the information processing apparatus, wherein the access tendency information processing apparatus receives the access tendency information of the subdirectory from the information processing apparatus An information processing system comprising: means for determining, based on the received access tendency information, a change in a state of association between the sub-directory and the logical storage unit.
前記情報処理装置は、自情報処理装置による前記サブディレクトリに対するアクセス状況を出力する手段と、前記サブディレクトリが現在格納されている論理的記憶単位とは異なる論理的記憶単位に移す対象となる前記サブディレクトリを指示する手段とを備えることを特徴とする請求項1記載の情報処理システム。The information processing apparatus includes means for outputting an access status of the information processing apparatus to the sub-directory, and a sub-target to be moved to a logical storage unit different from a logical storage unit in which the sub directory is currently stored. 2. The information processing system according to claim 1, further comprising means for designating a directory. 前記情報処理装置は、前記論理的記憶単位に対応付けられている前記サブディレクトリのアクセス状況を出力する手段を備えることを特徴とする請求項1記載の情報処理システム。The information processing system according to claim 1, wherein the information processing device includes a unit that outputs an access status of the subdirectory associated with the logical storage unit. 前記情報処理装置は、論理的記憶単位と前記サブディレクトリとの対応付けの解除を指示する手段を備えることを特徴とする請求項1記載の情報処理システム。The information processing system according to claim 1, wherein the information processing device includes a unit that instructs cancellation of association between a logical storage unit and the subdirectory. 前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス傾向に基づいて、前記サブディレクトリと前記論理的記憶単位との対応付けの状態を変更する手段を備えることを特徴とする請求項1記載の情報処理システム。The information processing apparatus further includes means for changing a state of association between the subdirectory and the logical storage unit based on an access tendency of the information processing apparatus to a storage area in the subdirectory. The information processing system according to claim 1, wherein: 情報処理装置と情報を記憶する手段を持つ記憶装置とが情報伝達手段によって接続されており、前記記憶装置内の記憶手段の一部または全部を指す論理的記憶単位を、前記情報処理装置の記憶構造の一部を構成するサブディレクトリに対応付けることが可能な情報処理方法において、
前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量が多いサブディレクトリをより高速なアクセスが可能な論理的記憶単位に移すことを特徴とする情報処理方法。
An information processing device and a storage device having a unit for storing information are connected by an information transmission unit, and a logical storage unit indicating a part or all of the storage unit in the storage device is stored in the storage device of the information processing device. In an information processing method capable of being associated with a subdirectory constituting a part of the structure,
The information processing method according to claim 1, wherein the information processing apparatus transfers a subdirectory having a large amount of access to a storage area in the subdirectory by the information processing apparatus to a logical storage unit that can be accessed at a higher speed.
前記情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量の多い複数のサブディレクトリが複数あり、それらの複数のサブディレクトリの上位に位置付けられるサブディレクトリがある場合、前記より高速なアクセスが可能な論理的記憶単位に移される対象を、前記情報処理装置によるアクセス量が多い前記サブディレクトリの上位に位置付けられるサブディレクトリとすることを特徴とする請求項11記載の情報処理方法。In the case where there are a plurality of subdirectories with a large access amount to the storage area in the subdirectory by the information processing device, and there is a subdirectory positioned above the plurality of subdirectories, the higher-speed access is possible. 12. The information processing method according to claim 11, wherein a target to be moved to a logical storage unit is a subdirectory positioned above the subdirectory that has a large access amount by the information processing apparatus. 前記情報処理装置は、自情報処理装置による前記サブディレクトリ内の記憶領域に対するアクセス量が多いサブディレクトリをより高速なアクセスが可能な論理的記憶単位に移した後、アクセス量が少なくなったとき、該当するサブディレクトリを元の論理的記憶単位に戻すことことを特徴とする請求項11記載の情報処理方法。The information processing apparatus, after moving the sub-directory with a large amount of access to the storage area in the sub-directory by its own information processing device to a logical storage unit that allows faster access, when the amount of access is reduced, 12. The information processing method according to claim 11, wherein the subdirectory is returned to the original logical storage unit. サブディレクトリ内の記憶領域に対するアクセス傾向を調査する処理プログラムと、調査結果を集計する処理プログラムと、集計結果に基づいてサブディレクトリの代表化を行う処理プログラムと、サブディレクトリを他の論理的記憶単位に移すか否かを示すサブディレクトリ分割案を作成する処理プログラムと、サブディレクトリを他の論理的記憶単位に移す分割の操作及びサブディレクトリを元の論理的記憶単位に戻す結合の操作を決定する処理プログラムと、決定された操作に基づいて結合の実行を行うプログラム及び分割の実行を行う処理プログラムとを有することを特徴とするプログラム。A processing program for investigating the access tendency to the storage area in the subdirectory, a processing program for totalizing the investigation results, a processing program for representing the subdirectories based on the totalization results, and a subdirectory as another logical storage unit A processing program for creating a subdirectory division plan indicating whether or not to move the subdirectory to another logical storage unit, and a merge operation for returning the subdirectory to the original logical storage unit are determined. A program characterized by comprising a processing program, a program for executing a combination based on a determined operation, and a processing program for executing a division.
JP2002325227A 2002-11-08 2002-11-08 Information processing system and method Pending JP2004157925A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002325227A JP2004157925A (en) 2002-11-08 2002-11-08 Information processing system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002325227A JP2004157925A (en) 2002-11-08 2002-11-08 Information processing system and method

Publications (1)

Publication Number Publication Date
JP2004157925A true JP2004157925A (en) 2004-06-03

Family

ID=32804521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002325227A Pending JP2004157925A (en) 2002-11-08 2002-11-08 Information processing system and method

Country Status (1)

Country Link
JP (1) JP2004157925A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006120056A (en) * 2004-10-25 2006-05-11 Hewlett-Packard Development Co Lp Database system and method thereof
JP2007241593A (en) * 2006-03-08 2007-09-20 Hitachi Ltd Method of optimizing assignment of storage area, and management computer for achieving the same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006120056A (en) * 2004-10-25 2006-05-11 Hewlett-Packard Development Co Lp Database system and method thereof
JP2007241593A (en) * 2006-03-08 2007-09-20 Hitachi Ltd Method of optimizing assignment of storage area, and management computer for achieving the same

Similar Documents

Publication Publication Date Title
JP4749255B2 (en) Storage system control device having multiple types of storage devices
US8122116B2 (en) Storage management method and management server
JP4690765B2 (en) Storage management system, storage management server, data relocation control method, and data relocation control program
EP2399190B1 (en) Storage system and method for operating storage system
US8433848B1 (en) Analysis tool for a multi-tier storage environment
US7506101B2 (en) Data migration method and system
US7680984B2 (en) Storage system and control method for managing use of physical storage areas
US8271991B2 (en) Method of analyzing performance in a storage system
US7761677B2 (en) Clustered storage system and its control method
US8161262B2 (en) Storage area dynamic assignment method
US8639899B2 (en) Storage apparatus and control method for redundant data management within tiers
US9274941B1 (en) Facilitating data migration between tiers
US8326939B2 (en) Storage system that transfers system information elements
US20090228669A1 (en) Storage Device Optimization Using File Characteristics
US20070283091A1 (en) Method, computer and computer system for monitoring performance
US8527700B2 (en) Computer and method for managing storage apparatus
JP2006268398A (en) Computer system, and data managing method and program
JP2011070345A (en) Computer system, management device for the same and management method for the same
JP6867578B2 (en) Storage controller, storage system, storage control method and storage control program
JP2011013800A (en) Control part and control method for storage device
JP2008299559A (en) Storage system and data transfer method for storage system
JP2004157925A (en) Information processing system and method
US8370589B1 (en) System and method for re-use of writeable PPIs
WO2016027370A1 (en) Archive control system and method