WO2011065071A1 - データ配置方法及びデータ管理システム - Google Patents

データ配置方法及びデータ管理システム Download PDF

Info

Publication number
WO2011065071A1
WO2011065071A1 PCT/JP2010/063562 JP2010063562W WO2011065071A1 WO 2011065071 A1 WO2011065071 A1 WO 2011065071A1 JP 2010063562 W JP2010063562 W JP 2010063562W WO 2011065071 A1 WO2011065071 A1 WO 2011065071A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
storage devices
logical storage
information
logical
Prior art date
Application number
PCT/JP2010/063562
Other languages
English (en)
French (fr)
Inventor
晴介 徳田
一智 牛嶋
晃 清水
美智子 田中
真二 藤原
信男 河村
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to US13/389,893 priority Critical patent/US9298394B2/en
Publication of WO2011065071A1 publication Critical patent/WO2011065071A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/064Management of blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Abstract

 本発明の一実施形態は、複数の物理記憶装置から構成される複数の論理記憶装置を提供するストレージシステムに接続された計算機が、前記複数の論理記憶装置を統合して構築した論理記憶領域にデータを配置する方法であって、前記計算機が、前記複数の論理記憶装置を用いて前記論理記憶領域を構築する指示または構築済みの論理記憶領域に対して再構築する指示を受け付けるステップと、前記計算機が、前記受け付けた前記指示に含まれる複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報を取得するステップと、前記取得した複数の物理記憶装置に関する情報に基づき、前記論理記憶領域へのデータの配置位置を決定するステップを含む。

Description

データ配置方法及びデータ管理システム
 本発明はデータ配置方法及びデータ管理システムに関し、特に、計算機がストレージシステムにデータを配置する技術に関する。
 企業活動において、大量に生じる業務データの活用は不可欠になっている。そのため、大量の業務データをデータベース(以下、「DB」)に蓄積し、蓄積されたデータを多次元的に解析するシステムが広く普及している。
 上記データの解析処理において、データベース管理システム(以下、「DBMS」)は、問合せを受け付け、DBを格納するストレージシステムに大量のデータ読出し要求を発行する。
 ストレージシステムから複数の記憶領域がDBMSを実行する計算機に提供される場合、大量のデータ読出し要求を効率的に処理するための従来技術の一つとして複数の記憶領域をまとめて提供する記憶領域統合技術が知られている。
 記憶領域統合技術とは、DBMSなどのアプリケーションプログラム(以下、「AP」)もしくはオペレーティングシステム(以下、「OS」)がストレージシステムから提供される記憶領域を統合する。そして、統合した記憶領域にDBを均等にストライピングして分散配置することで、複数の記憶領域を均等に利用可能とする技術である(例えば、非特許文献1参考)。
AJ Lewis著 「LVM HOWTO」 http://ibiblio.org/pub/Linux/docs/HOWTO/other-formats/pdf/LVM-HOWTO.pdf
 上記従来のストレージシステムでは、物理的な記憶装置を直接計算機に提供するのではなく、物理的な記憶装置を組み合わせた論理的な記憶領域を仮想的に提供する機能が一般的に用いられている。
 具体的なストレージシステムの仮想化機能として、システム内の複数の物理記憶装置を組み合わせて冗長化及び高速化を実現するRAID(Redundant Array of Independent Disks)機能が広く採用されている。
 RAID機能を用いたストレージ仮想化機能が一般的に利用される中で、物理記憶装置の組合せ構成が異なる複数の論理的な記憶領域を計算機に提供するケースは実運用上頻繁に起こりうる。
 このとき、上記記憶領域統合技術では、APやOSが認識する複数の論理的な記憶領域にデータを均等に分散配置する。そのため本従来技術では、上記のような物理記憶装置の組合せ構成が異なる複数の論理的な記憶領域を提供された場合、格納されたデータ全域へのアクセス要求において、全ての物理記憶装置の性能を均等に利用できず、大量のデータ読出し要求を効率的に処理できないという問題が生じていた。
 例えば、ストレージシステムにおいて4つの物理記憶装置で論理的な記憶領域である論理記憶装置Aを構成し、3つの物理記憶装置で論理記憶装置Bを構成し、上記従来の記憶領域統合技術で論理記憶装置Aと論理記憶装置Bを統合して論理記憶領域Xとして計算機に提供する場合、上記従来技術では、計算機が読み書きするデータの量を論理記憶装置Aと論理記憶装置Bへ均等に配分する。論理記憶領域Xを構成する物理記憶装置の性能が均一とし、論理記憶装置Aと論理記憶装置Bが上記RAID機能(例えばパリティを分散配置するRAID5)により構成された場合、論理記憶装置Aの読み書きの性能は、論理記憶装置Bを上回る。そして、上記従来技術の論理記憶領域Xでは、上記従来技術は、論理記憶領装置Aと論理記憶領装置Bで等しいデータ量の読み書きを行う。このため、論理記憶装置Bの読み書きの性能が妨げとなり、論理記憶装置Aが読み書きの性能を十分に発揮することができない、という問題があった。
 本願発明は上記問題点に鑑みてなされたもので、ストレージシステムの仮想化機能を利用することで、物理的な記憶装置の組合せが異なる複数の論理的な記憶領域を計算機に提供する場合において、論理的な記憶領域を構成する物理的な記憶装置を均等に利用可能とするデータ配置方法を提供することを目的とする。
 本発明は、複数の物理記憶装置から構成される複数の論理記憶装置を提供するストレージシステムに接続された計算機が、前記複数の論理記憶装置を統合して構築した論理記憶領域にデータを配置する方法であって、前記計算機が、前記複数の論理記憶装置を用いて前記論理記憶領域を構築する指示または構築済みの論理記憶領域に対して再構築する指示を受け付けるステップと、前記計算機が、前記受け付けた前記指示に含まれる複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報を取得するステップと、前記計算機が、前記取得した複数の物理記憶装置に関する情報に基づき、前記論理記憶領域へのデータの配置位置を決定するステップと、を含む。
 したがって、本発明の一実施形態によれば、ストレージシステムから物理的な記憶装置の組合せ構成が異なる複数の論理的な記憶領域が計算機に提供されても、物理的な記憶装置の構成情報に応じた論理的な記憶領域へのデータの配置位置を決定し、当該配置位置によって物理的記憶装置を均等に利用できる。これにより、全ての物理的記憶装置の入出力処理性能を引き出すことで大量のデータ読出し処理の効率化を図ることができる。
本発明の実施の形態の情報処理システムのハードウェア構成及び論理的構成を示すブロック図である。 本発明の実施の形態の情報処理システムのハードウェア構成及び論理的構成を示すブロック図である。 ストレージシステムがホスト計算機に提供する論理的な記憶領域と物理的な記憶装置の関係を示すブロック図である。 ホスト計算機のデータ管理部が論理記憶領域を構築する処理の手順を示すフローチャートである。 ストレージシステムの物理記憶装置情報の一例を示す説明図である。 DBMSのデータ管理部が管理するデータ配置管理情報の一例を示す説明図である。 データベース管理端末のDBMS管理部がコンソールに出力するGUIの一例を示す画面イメージである。 本発明の実施の形態においてホスト計算機のデータ管理部が既に構築された論理記憶領域を、再構築する処理の手順を示すフローチャートである。 DBMSのデータ管理部が管理するデータ配置管理情報の他の例を示す説明図である。
 以下、本発明の一実施形態を添付図面に基づいて説明する。
<情報処理システムの構成>
 図1A及び図1Bは、本発明の実施の形態の情報処理システムのハードウェア構成及び論理的構成を示すブロック図である。まずハードウェア構成について説明する。
 図1A及び図1Bの情報処理システムは、ホスト計算機1、ストレージシステム2、ストレージ管理端末3、ストレージエリアネットワーク(以下、SANとする)4、ネットワーク(管理ネットワーク)5及びデータベース管理端末6を備える。
 ホスト計算機1は、パーソナルコンピュータ、ワークステーション、メインフレームなどの計算機である。ホスト計算機1では、その計算機の種類に応じたオペレーティングシステム(以下、「OS」)100と、業務データを蓄積し管理するデータベース管理システム(以下、「DBMS」)200、及びDBMS200に問合せを発行するアプリケーションプログラム(以下、「AP」)300が動作する。OS100、DBMS200及びAP300については後述する。
 ホスト計算機1は、プロセッサ12、メモリ11、ローカル記憶装置13、ホストバスアダプタ15、及びネットワークアダプタ14を備える。
 プロセッサ12は、OS100、DBMS200、及びAP300などのプログラムを実行する。メモリ11は、プロセッサ12によって実行されるプログラム、及びプログラムが使用するデータを一時的に格納する。ローカル記憶装置13は、AP300やDBMS200などのプログラム、及びプログラムが使用するデータを格納する記憶媒体として機能する。ホストバスアダプタ15は、SAN4とホスト計算機1とを接続するインターフェースである。ネットワークアダプタ14は、ネットワーク5とホスト計算機1とを接続するインターフェースである。
 なお、ホスト計算機1は、冗長性確保のため、プロセッサ12などの構成を複数備えていてもよい。また、ホスト計算機1は図示しない入力装置と表示装置を備える。
 ストレージシステム2は、ディスク装置などの単体の記憶装置、又は、ディスクアレイなどのように複数の記憶装置を備えるシステムである。また、ストレージシステム2は、ホスト計算機1が使用するデータ及びプログラムを格納する。そして、ホスト計算機1からの入出力(以下、「I/O」)処理要求を受信し、I/O処理要求に対応した処理を実行し、処理結果をホスト計算機1に送信する。
 ストレージシステム2は、制御装置20、接続インターフェース21、及び物理記憶装置22a~22eを備える。なお、以下の説明において、物理記憶装置22a~22eの総称を、物理記憶装置22とする。
 物理記憶装置22は、ホスト計算機1によって使用されるデータ及びプログラムを格納する。物理記憶装置22は、不揮発性の記憶媒体であって、例えば磁気ディスクと磁気ヘッドを有するハードディスクドライブで構成される。接続インターフェース21は例えばローカルバスで構成されて、物理記憶装置22と制御装置20とを相互に接続する。
 制御装置20は、ホスト計算機1からのI/O処理要求の処理及び物理記憶装置22の制御を実行する。制御装置20は、プロセッサ26、メモリ27、物理記憶装置アダプタ23、ネットワークアダプタ24及びネットワークアダプタ25を備える。
 プロセッサ26は、所定の制御プログラムを実行する。メモリ27は、プロセッサ26によって実行されるプログラムや、プログラムの実行に必要な情報、ストレージシステム2の設定情報及び構成情報を格納する。更にメモリ27は、ストレージシステム2にホスト計算機1から入力されるデータ、ストレージシステム2からホスト計算機1に転送されるデータ、又は、ストレージシステム2内で入出力されるデータを一時的に格納する。なお、メモリ27は、不揮発性メモリとキャッシュメモリとから構成されてもよく、プログラムや構成情報を不揮発性メモリに格納し、入出力されるデータをキャッシュメモリに一時的に格納してもよい。
 物理記憶装置アダプタ23は、接続インターフェース21を介して物理記憶装置22に接続する。ネットワークアダプタ25は、ストレージシステム2とSAN4とを接続する。ネットワークアダプタ24は、ストレージシステム2とネットワーク5とを接続する。
 なお、ストレージシステム2は、制御装置20を複数備えていてもよい。また、ストレージシステム2は、冗長性を確保するために、メモリ27、物理記憶装置アダプタ23、及び接続インターフェース21などのシステム内の各構成を2重化した冗長構成を有していてもよい。
 ストレージ管理端末3は、ストレージシステム2内の構成の管理を行う計算機である。ストレージシステム2の管理者は、ストレージシステム2の構成を管理する際にストレージ管理端末3に設定情報を入力する。ストレージ管理端末3は、ネットワーク5を介してストレージシステム2に管理者が入力した内容を送信する。
 ストレージ管理端末3は、ホスト計算機1と同様、プロセッサ30、メモリ31、及びネットワークアダプタ32を備える。ストレージ管理端末3は、図示していないが、ローカル記憶装置を備えてもよい。また、ストレージ管理端末3は入力装置と表示装置を含むコンソール33を備える。
 データベース管理端末6は、ホスト計算機1で実行されるDBMS200の管理を行う計算機である。DBMS200の管理者は、ホスト計算機1のDBMS200を管理する場合にデータベース管理端末6に設定情報を入力する。データベース管理端末6は、ネットワーク5を介してホスト計算機1に管理者が入力した内容を送信する。
 データベース管理端末6は、ホスト計算機1と同様、プロセッサ60、メモリ61、及びネットワークアダプタ62を備える。データベース管理端末6は、図示していないが、ローカル記憶装置を備えてもよい。また、データベース管理端末6は入力装置と表示装置を含むコンソール63を備える。
 SAN4は、ホスト計算機1とストレージシステム2とを接続し、ホスト計算機1からストレージシステム2にI/Oの処理要求などを伝送するために使用される。SAN4には、光ファイバ及び銅線などが用いられる。また、SAN4では、ファイバチャネル、SCSI(Small Computer System Interface)、TCP/IP(Transmission Control Protocol/Internet Protocol)などの通信プロトコルが使用される。
 ネットワーク5は、情報処理システムの管理ネットワークとして機能し、ホスト計算機1、ストレージシステム2、ストレージ管理端末3及びデータベース管理端末6を接続する。ネットワーク5は、ストレージシステム2、ホスト計算機1及びストレージ管理端末3及びデータベース管理端末6の間で、ストレージシステム2の構成情報、及びホスト計算機1のDBMS200の管理情報を通信するために使用される。ネットワーク5に使用されるケーブル及び通信プロトコルは、SAN4と同一であっても良いし、あるいはSAN4と異なっていてもよい。
<情報処理システムのストレージシステム2の論理構成>
 図1A及び図1Bの情報処理システムの論理的構成について説明する。図1Aに示すように、ストレージシステム2の制御装置20は、ストレージシステム2の処理を制御するために、デバイス管理部28及びコマンド処理部29を構成するプログラムをメモリ27に格納する。制御装置20は、これらのプログラムをプロセッサ26で実行することによって、以下に説明する処理を制御する。
 デバイス管理部28を構成するプログラムは、物理記憶装置22及びホスト計算機1に提供する論理的な記憶領域である論理記憶装置280a、280bを管理するために制御装置20により実行される。なお、以下では論理記憶装置280a、280bの総称を論理記憶装置280とする。
 制御装置20は、デバイス管理部28を実行して、複数の物理記憶装置22(図2のメモリ27上では点線で表示)を組み合わせ、RAID(Redundant Array of Independent Disks)グループを構成する。ストレージシステム2は、RAIDグループを構成することによって、データを複数の物理記憶装置22に分散して格納するストライピング技術でI/O処理時間を短縮化し、2台以上の物理記憶装置の同じ位置にあるデータのパリティを作成しそのパリティを別の物理記憶装置に格納するパリティ記録技術でデータの信頼性を向上することができる。なお、RAIDグループの構成は、1台の物理記憶装置22の内容を別の物理記憶装置22に同時にコピーするミラーリング構成であってもよい。
 制御装置20は、デバイス管理部28を実行して、ホスト計算機1に対して、一つのRAIDグループを構成する複数の物理記憶装置22によって作成される記憶空間から、一つの論理的な記憶領域を論理記憶装置280として提供する。
 図2は、ストレージシステム2がホスト計算機1に提供する論理的な記憶領域と物理的な記憶領域の関係を示すブロック図である。図2の例では、物理記憶装置22a、22b、22cから構成されるRAIDグループから論理的な記憶領域として論理記憶装置a(280a)を、物理記憶装置22d、22eから構成されるRAIDグループから論理記憶装置280bをホスト計算機1に対して提供する。
 制御装置20は、デバイス管理部28を実行して、論理記憶装置280の物理記憶装置22に関する情報である物理記憶装置情報281を管理する。物理記憶装置情報281の詳細は、図4を参照して後述する。
 制御装置20は、デバイス管理部28を実行して、ホスト計算機1やストレージ管理端末3からの要求に対応する。例えば、ストレージ管理端末3からの要求に応じて、デバイス管理部28は、論理記憶装置280の定義や設定、物理記憶装置情報281の送信などを実行する。
 制御装置20は、I/O処理を実行するために、デバイス管理部28のプログラムを実行する。デバイス管理部28は、I/O処理要求が指定する論理記憶装置280のアドレスに対応する物理記憶装置22のアドレスを、物理記憶装置情報281に基づいて計算する。そして制御装置20は、当該計算結果に基づいて物理記憶装置22にアクセスする。
 また制御装置20は、ホスト計算機1からのI/O処理要求を、ネットワークアダプタ24を経由して受信すると、コマンド処理部29のプログラムを実行する。
 コマンド処理部29は、ホスト計算機1から受信したI/O処理要求がデータの書込み処理要求の場合、ホスト計算機1から転送されるデータをメモリ27又は物理記憶装置22の所定の領域に書き込む処理などを実行する。
 コマンド処理部29は、ホスト計算機1からデータの読出し処理要求を受信した場合には、読出し処理要求に対応するデータを、メモリ27又は物理記憶装置22の所定の領域から読み出してホスト計算機1に転送する処理などを実行する。
 制御装置20は、ホスト計算機1からのデータの読出し又は書込み以外の処理要求を受信した場合にもコマンド処理部29を動作させ、要求された処理を実行する。例えば、ホスト計算機1やストレージ管理端末3からのSCSIのInquiryコマンド(デバイスサーチを指示するコマンド)などである。
 ストレージシステム2は、ホスト計算機1に提供する論理記憶装置280を含むRAIDグループの構成を動的に変更することができる。RAIDグループの動的構成変更の例は、2台の物理記憶装置で構成しているRAIDグループを、1台の物理記憶装置を追加して3台の物理記憶装置で構成し直す。RAIDグループの動的構成変更は、ホスト計算機1に意識されることなく、バックグラウンドで処理される。
 制御装置20は、RAIDグループの構成を動的に変更する場合に、コマンド処理部29及びデバイス管理部28のプログラムを実行して、変更に伴うデータの移動処理を行う。
 制御装置20は、コマンド処理部29を実行して、移動元の物理記憶装置22のデータをメモリ27に読み出し、読み出したデータを移動先の物理記憶装置22に書き込む。また制御装置20は、デバイス管理部28を実行して、RAIDグループの構成変更に伴う物理記憶装置情報281の変更を適用する。なお、制御装置20は、RAIDグループの動的構成変更に伴うデータの移動中にも、移動対象を含む全てのデータについてI/O処理要求を受け付けることができる。
<情報処理システムのホスト計算機1、ストレージ管理端末3、データベース管理端末6のソフトウェア構成>
 図1Aに示すように、ホスト計算機1は、OS100と、業務データを蓄積し、蓄積した業務データを管理するDBMS200、及びDBMS200に問合せを発行するAP300の各種プログラム及びプログラムの実行に必要な情報をメモリ11やローカル記憶装置13に有する。なお、AP300は、DBMS200が稼動するホスト計算機1ではなく、ネットワーク5に接続される別の計算機で実行されても良い。その場合、DBMS200は、AP300からの問合せをネットワーク5経由で受け付ける。
 OS100は、メモリ11やローカル記憶装置13の管理など、計算機全体を制御する。またホスト計算機1のOS100は、図2に示すように、ストレージシステム2から提供される2つの論理記憶装置280a、280bの存在を論理記憶装置280a'、280b'として認識する。なお、論理記憶装置280a'、280b'の総称は論理記憶装置280'と記載する。本実施形態では、ホスト計算機1のDBMS200またはOS100が認識する論理記憶装置280'と、ストレージシステム2が提供する論理記憶装置280は同一のものである。
 DBMS200は、業務データのデータベース(以下、「DB」)をストレージシステム2に格納し、管理する。DBは、ホスト計算機1で認識される論理記憶装置280a'、280b'を介して物理記憶装置22に格納されており、複数の表や索引などから構成される。
 DBMS200は、図1Aで示すように、データ管理部210、物理記憶装置情報取得部220、問合せ処理部230から構成される。
 データ管理部210は、OS100が認識する論理記憶装置280a'、280b'を統合して論理記憶領域2800として管理する。DBMS200は、論理記憶領域2800にDBを格納する。データ管理部210は、データ配置管理情報2100を構築して論理記憶領域2800を管理する。データ配置管理情報2100は、論理記憶領域2800を構成する複数の論理記憶装置280a'、280b'に分散して配置(格納)するデータの比率を有する。データ配置管理情報2100の詳細は、図5にて後述する。
 物理記憶装置情報取得部220は、データ管理部210の指示を受けて、論理記憶装置280a'、280b'を構成するストレージシステム2の物理記憶装置22に関する情報である物理記憶装置情報281をストレージシステム2、または、後述する物理記憶装置情報311をストレージ管理端末3から取得し、物理記憶装置情報221として保持する。また物理記憶装置情報取得部220は、専用のインターフェースを提供し、データベース管理端末6等から情報を取得する。
 問合せ処理部230は、AP300から問合せを受け付け、受け付けた問合せに応じた複数のデータベース処理を実行し、実行結果をAP300に返す。問合せ処理部230は、データベース処理の実行中において、DBからデータの読出しが必要になれば、データ読出し要求をOS100を介してストレージシステム2に発行する。
 DBMS200は、メモリ11やローカル記憶装置13の一部を利用して、データを一時的に格納するデータベースバッファ(以下、「DBバッファ」)を構築することもできる。また、データ配置管理情報2100を有するデータ管理部210、及び物理記憶装置情報取得部220は、DBMS200内ではなくOS100内で動作してもよい。
 図4は、ストレージシステム2の物理記憶装置情報281の一例を示す説明図である。なお、ストレージ管理端末3の物理記憶装置情報311はストレージシステム2の物理記憶装置情報281と同一であり、DBMS200の物理記憶装置情報221はストレージシステム2の物理記憶装置情報281から後述する論理記憶装置番号402を除いたテーブルと同一であるので、重複した説明は省略する。
 物理記憶装置情報281の列はそれぞれ、ストレージシステム2がホスト計算機1に提供する論理記憶装置の番号を格納するホスト論理記憶装置番号401、ストレージシステム2が内部的に管理する識別子として論理記憶装置の番号を格納する論理記憶装置番号402、論理記憶装置番号に対応する論理記憶装置の記憶容量を格納する論理記憶装置容量403、論理記憶装置のRAIDグループ識別子を格納するRAIDグループ番号404、論理記憶装置のRAIDレベル(種類)を格納するRAIDレベル405、RAIDグループを構成する複数の物理記憶装置22の識別子を格納する物理記憶装置番号406、各物理記憶装置22の種別を格納する物理記憶装置種別407である。
 ホスト論理記憶装置番号401は、ストレージシステム2のデバイス管理部28がホスト計算機1に提供する論理記憶装置に対して付与した識別子である。DBMS200およびOS100はストレージシステム2から提供された論理記憶装置をホスト論理記憶装置番号401で識別する。論理記憶装置番号402~物理記憶装置種別407は、ストレージシステム2のデバイス管理部28で設定された論理記憶装置280及び物理記憶装置22の情報である。
 論理記憶装置番号402は、ストレージシステム2で設定された論理記憶装置の識別子である。論理記憶装置容量403は、ストレージシステム2がホスト計算機1に提供する論理記憶装置の容量を示す。
 RAIDグループ番号404とRAIDレベル405は、論理記憶装置のRAID構成に関する情報で、ストレージシステム2で管理する。RAIDレベル405は、例えば、0、10、5、6等のRAIDの種別を格納する。物理記憶装置番号406は、ストレージシステム2で管理されRAIDグループを構成する複数の物理記憶装置22の識別子を格納する。
 物理記憶装置種別407は、RAIDグループ番号404を構成する複数の物理記憶装置22の種別を格納するもので、種別としては、例えば、FC、SATA、SAS等のインターフェースの種類を格納する。
 上記の他、ストレージシステム2のデバイス管理部28で管理可能な情報を物理記憶装置情報221に含めても良く、例えば、物理記憶装置22のシークタイムや回転速度などを性能情報として格納しても良い。
 上述のように、ストレージシステム2のデバイス管理部28が管理する物理記憶装置情報281を、ホスト計算機1のDBMS200の物理記憶装置情報221またはストレージ管理端末3の物理記憶装置情報311に転送しておくことで、ストレージシステム2を利用するホスト計算機1から論理記憶装置280(280')がどのようなRAID構成で、どのような物理記憶装置22を備えているかを把握することができるのである。
 図5は、DBMS200のデータ管理部210が管理するデータ配置管理情報2100の一例を示す説明図である。
 データ配置管理情報2100の列はそれぞれ、DBMS200(またはOS100)が管理する論理記憶領域の名称を格納する論理記憶領域名2101、DBMS200(またはOS100)が管理する論理記憶領域の識別子を格納する論理記憶領域番号2102、論理記憶領域の容量を格納する論理記憶領域容量2103、論理記憶領域を構成する論理記憶装置の識別子を格納するホスト論理記憶装置番号2104、データ管理部210が論理記憶装置に配分するデータの比率を格納するデータ配置比率2105、データ管理部210が論理記憶装置に配分するデータの単位(ストライプサイズ)を格納するストライプサイズ2106である。
 論理記憶領域2800は、複数の論理記憶装置280から構成されており、データ配置管理情報2100のホスト論理記憶装置番号2104は、図4に示したホスト論理記憶装置番号401で特定されるホスト論理記憶装置のうち、当該論理記憶領域2800を構成するホスト論理記憶装置の番号401が格納される。
 データ配置比率2105は、データ管理部210で設定されたもので、ホスト論理記憶装置番号2104で特定された論理記憶装置において読み書きする(配置する)データの比率が格納される。図示のように、ホスト論理記憶装置番号2104に「101」と「102」が格納されており、データ配置比率2105が「3:2」の場合、ホスト論理記憶装置番号2104=「101」の論理記憶装置に「3」(3/5)、ホスト論理記憶装置番号2104=「102」の論理記憶装置に「2」(2/5)の比率でデータが配置されることを意味する。また、ストライプサイズ2106もデータ管理部210で設定された値である。
 図1Bに戻って、ストレージ管理端末3は、ストレージ管理部310のプログラム及びプログラムの実行に必要な情報をメモリ31やローカル記憶装置(図示省略)に格納する。ストレージ管理端末3は、図示していないが、計算機を制御するOSを有してもよい。
 ストレージ管理部310は、ストレージシステム2の構成を管理する。また、ストレージ管理部310は、ストレージシステム2の論理記憶装置280を構成する物理記憶装置22に関する情報である物理記憶装置情報311をストレージシステム2から取得して格納する。物理記憶装置情報311は、ストレージシステム2のデバイス管理部28にある物理記憶装置情報281と同じである。ストレージ管理部310は、定期的に又は物理記憶装置情報281が更新されたときに物理記憶装置情報311を更新し、ストレージシステム2と同情報の同期を取る。
 次に、データベース管理端末6は、DBMS管理部610を管理するプログラム及びプログラムの実行に必要な情報をメモリ61やローカル記憶装置(図示省略)に格納する。データベース管理端末6は、図示していないが、計算機を制御するOSを有してもよい。
 DBMS管理部610は、ホスト計算機1のDBMS200を管理する。例えば、DBMS管理部610は、ホスト計算機1のDBMS200が業務データの読み書きを行う論理記憶領域2800の構成を決定し、ホスト計算機1のDBMS200に指示することで、DBMS200を管理する。
 このため、DBMS管理部610は、後述するように図6に示すようなGUI(Graphical User Interface)をコンソール63の表示装置に出力し、管理者からの入力を受け付ける。DBMS管理部610は、コンソール63の入力装置から、複数の論理記憶装置280a'、280b'により論理記憶領域2800を構築する指示、もしくは構築済みの論理記憶領域2800を再構築する指示を受け付ける。そして、受け付けた論理記憶領域2800の構築指示または再構築指示をホスト計算機1のDBMS200に送る。
 図6は、データベース管理端末6のDBMS管理部610がコンソール63に出力するGUIの一例を示す画面イメージである。図6の画面は、論理記憶領域を構築するためのユーザインターフェースであり、DBMS200がデータベース管理端末6に提供する。なお、DBMS200は表示装置を備えたホスト計算機1やその他の計算機に図6のGUIを提供することができる。なお、DBMS200は、コマンドラインの形で同等のインターフェースを提供することも可能である。
 ホスト計算機1のDBMS200を管理するデータベース(DB)管理者は、データベース管理端末6で本画面を用いて、DBMS200に物理記憶装置情報を取得させて論理記憶領域を構築させることができる。
 図6において、ウィンドウ64には、データ管理部210に構築させる論理記憶領域の諸元を格納するフィールド641~643と、物理記憶装置情報の取得先を選択するチェックボックス645~647と、論理記憶領域2800の構築(または再構築)開始を指示する構築実行ボタン648を主体に構成される。
 フィールド641は、データ管理部210に構築させる論理記憶領域2800の名称を格納する。フィールド642は論理記憶領域2800の容量を格納する。フィールド643は論理記憶領域2800に割り当てる論理記憶装置280'の識別子(番号)を格納する。論理記憶装置280'の識別子は、図4に示した物理記憶装置情報281のホスト論理記憶装置番号401から選択されても良い。
 次に、管理者が物理記憶装置情報の取得先を選択するチェックボックス645を選択した場合には、ストレージシステム2の物理記憶装置情報281から物理記憶装置の情報を取得することを示す。チェックボックス646を選択した場合には、ストレージ管理端末3の物理記憶装置情報331から物理記憶装置の情報を取得することを示す。チェックボックス647を選択した場合には、後述するようコンソール63からフィールド6471~6475へ入力した値を物理記憶装置の情報として用いることを示す。
 管理者は、チェックボックス645、646の何れかを選択した場合には、複数の論理記憶装置280'へストライピングによって配置するデータの比率であるデータ配置比率を決定するための基準をチェックボックス6461~6464の何れか1つにより選択する。
 管理者がチェックボックス6461を選択した場合には、1つの論理記憶装置280'を構成する物理記憶装置22の数を基準にしてデータ配置比率を決定することを示す。チェックボックス6462を選択した場合には、論理記憶装置280'のRAIDの情報(RAIDのレベル等)を基準にしてデータ配置比率を決定することを示す。チェックボックス6463を選択した場合には、論理記憶装置280'を構成する物理記憶装置22の性能情報(インターフェースの種類などスループットに影響を与える情報)を基準にしてデータ配置比率を決定することを示す。チェックボックス6464を選択した場合には、論理記憶装置280'の容量を基準にしてデータ配置比率を決定することを示す。
 管理者がチェックボックス647を選択した場合には、フィールド6471~6475に論理記憶装置280'の情報を入力することが要求される。
 フィールド6471は、論理記憶装置280'を構成する物理記憶装置22の数を格納する。フィールド6472は、論理記憶装置280'のRAIDグループの識別番号を格納する。なお、管理者は、RAIDグループの識別番号の入力において図4の物理記憶装置情報281のRAIDグループ番号404を参照することができる。フィールド6473は、RAIDのレベルを格納する。RAIDの入力において、管理者は、図4に示した物理記憶装置情報281のRAIDレベル405の値を参照することができる。
 フィールド6474は、物理記憶装置22の種別を格納する。物理記憶装置22の入力において、管理者は、図4の物理記憶装置情報281の物理記憶装置種別407の値を参照することができる。フィールド6475は、論理記憶装置280'の容量を格納する。論理記憶装置280'の容量の入力において、管理者は、図4の物理記憶装置情報281の論理記憶装置容量403を参照することができる。
 そして、論理記憶領域2800の諸元及びチェックボックス645~647に対応する情報を設定した後に、管理者が構築実行ボタン648をクリックすると、データベース管理端末6が論理記憶領域2800の構築指示をホスト計算機1へ送信する。なお、構築指示は、ウィンドウ64で入力されたチェックボックスやフィールドの値を含む。この構築指示に基づいて、ホスト計算機1のDBMS200は論理記憶領域2800を構築する。
 本実施形態は、物理記憶装置の数、RAIDグループ情報(識別情報、RAIDレベル)、性能情報(物理記憶装置種別)が指定(取得もしくは入力)された場合、物理記憶装置の性能を最大限に引き出せるようにデータを配置する。一方、ホスト記憶装置の容量が指定(取得もしくは入力)された場合、ホスト記憶装置ごとの容量に応じたデータ配置を行う。
<処理の概要>
 以上が本発明の実施の形態の構成である。以下、本発明の実施の形態の処理について説明する。ホスト計算機1のデータ管理部210は、データベース管理端末6から論理記憶領域2800を構築する指示、もしくは構築済みの論理記憶領域2800を再構築する指示を受信すると、物理記憶装置情報取得部220に対して物理記憶装置情報221を更新する指令を出力する。物理記憶装置情報取得部220はストレージ管理端末3またはストレージシステム2に対して物理記憶装置情報の送信指示を出す。
 本実施形態では、論理記憶領域2800を構築する指示又は論理記憶領域2800を再構築する指示が、データベース管理端末6から送信される場合について述べる。しかし、データベース管理端末6以外の計算機が論理記憶領域2800の構築指示または再構築の指示を送信しても良いし、ホスト計算機1の図示しないコンソールから受け付けても良い。また、DBMS200の物理記憶装置情報取得部220は、所定の周期でストレージ管理端末3の物理記憶装置情報311やストレージシステム2の物理記憶装置情報281を取得して、物理記憶装置情報221を更新してもよい。
 物理記憶装置情報取得部220は、ストレージシステム2、ストレージ管理端末3又は専用インターフェースにより物理記憶装置情報281(または311)を取得し、メモリ11内の物理記憶装置情報221を更新する。
 データ管理部210は、物理記憶装置情報取得部220が取得した物理記憶装置情報221に基づき、論理記憶領域2800を構築する複数の論理記憶装置280a'、280b'にストライピングして配置するデータの比率をデータ配置比率として後述するように決定する。データ管理部210は、決定したデータ配置比率に関してデータ配置管理情報2100を更新し、データ配置管理情報2100に基づき論理記憶領域2800を定義する。
 例えば、図2の場合、ホスト計算機1がストレージシステム2から得られる物理記憶装置情報は、論理記憶装置280a'を構成する物理記憶装置22は3つ(22a,22b,22c)、論理記憶装置280b'を構成する物理記憶装置22は2つ(22d、22e)、という情報である。
 データ管理部210は、相異なる物理記憶装置22にデータを均等に配置する場合、論理記憶装置280a'と280b'に分散して配置するデータの比率(データ配置比率)を物理記憶装置22の数に比例して3:2と決定し、その比率をデータ配置管理情報2100のデータ配置比率2105に設定する。データ配置比率は、複数の論理記憶装置280'にデータを配分する際のデータ量の比率を示す。
 そしてデータ管理部210は、問合せ処理部230から受け付けたデータを所定のサイズ(例えば、ストライプサイズ)を有する複数の管理単位に分割し、データ配置比率に応じて論理記憶装置280a'と280b'にデータを分配する。
 つまり、データ管理部210は、問い合わせ処理部230から受け付けたデータを所定の管理単位に分割し、例えば、管理単位「1」~「5」(「1」~「n」は論理記憶領域2800のデータ管理単位)に分割し、データ配置管理情報2100が示す3:2のデータ配置比率に従って、「1」、「3」、「5」を論理記憶装置280a'に格納し「2」、「4」を論理記憶装置280b'に格納することで、データを分散して配置する。
 データ管理部210は、続く「6」~「10」のデータについても同様の比率で複数の論理記憶装置280にストライピングしたデータの配置を行う。なお、データ管理部210で扱う管理単位は、論理記憶装置280'に対する読み書きのデータブロックのデータ量と異なっていてもよいし同一であってもよい。
 これにより、物理記憶装置22の組合せや構成が異なる複数の論理記憶装置280を統合して論理記憶領域2800を構築する場合において、DBMS200は、物理記憶装置情報221に応じたデータ配置比率によってストレージシステム2の物理的記憶装置22を均等に利用でき、全ての物理記憶装置22の入出力処理性能を最大限引き出すことが可能となる。
<処理の詳細>
 以下、本発明の実施の形態の処理の詳細を説明する。図3は、本発明の実施の形態においてホスト計算機1のデータ管理部210が論理記憶領域2800を構築する処理の手順を示すフローチャートである。この処理は、データ管理部210がデータベース管理端末6から論理記憶領域2800の構築指示を受信したときに実行される。なお、再構築指示の場合については図7に後述する。
 まず、ステップS1では、データ管理部210がデータベース管理端末6から論理記憶領域2800の構築指示を受信する。この構築指示には、上記図6のGUIで受け付けた情報が含まれる。なお、論理記憶領域2800の構築指示又は再構築指示は、ホスト計算機1のコンソール(図示省略)から受け付けても良い。
 ステップS2では、データ管理部210が、物理記憶装置情報取得部220に物理記憶装置情報221の更新を指令する。物理記憶装置情報取得部220は、当該指令に基づいて構築指示に含まれる論理記憶装置280'の構成要素である物理記憶装置22に関する物理記憶装置情報281又は311をストレージシステム2又はストレージ管理端末3から取得し、メモリ11上の物理記憶装置情報221を更新する。
 ステップS3では、データ管理部210が、構築指示に複数の論理記憶装置280'が含まれる場合には、各論理記憶装置280'を構成する物理記憶装置22の物理的な構成が同一であるか否かを判定する。
 この判定は、図6のGUIでデータベース管理端末6が受け付けた物理的構成の判定基準に基づく。物理的構成の判定基準は、図6のチェックボックス6461~6464のいずれかひとつである。チェックボックス6461~6464は、それぞれ、複数の物理記憶装置22に関する情報における異なる項目を示している。
 本実施形態は、チェックボックス6461が選択されている場合には、論理記憶装置280を構成する物理記憶装置22の数を物理的な構成の判定基準として使用する。チェックボックス6462が選択されている場合には、論理記憶装置280を構成するRAIDグループ(又はRAIDレベル)を物理的な構成の判定基準として使用する。
 チェックボックス6463が選択されている場合には、論理記憶装置280を構成する物理記憶装置22の性能情報を物理的な構成の判定基準として使用する。チェックボックス6464が選択されている場合には、論理記憶装置280の容量を物理的な構成の判定基準として使用する。物理記憶装置22の性能情報としては、図4の物理記憶装置種別407に格納されたインターフェースの種類(FC、SCSI、SATA、SAS)を用いるが、この他、物理記憶装置22のシーク時間、回転数、容量を性能情報として用いてもよい。
 複数の論理記憶装置280'の物理的構成が同一でないという判定結果の場合には、ステップS4へ進む。一方、それらが同一であるとの判定結果であれば、ステップS5の処理に進む。
 ステップS4では、データ管理部210は、これから構築する論理記憶領域2800が、物理的構成が異なる複数の論理記憶装置280'を統合することをデータベース管理端末6に警告する。データベース管理端末6では、ホスト計算機1のデータ管理部210からの上記警告(通知)をコンソール63に表示する。このとき、DB管理者などがコンソール63から論理記憶領域2800の構築を中止する指令をホスト計算機1に送信してもよく、データ管理部210は、中止の指令を受信した場合には、当該論理記憶領域2800の構築を終了することができる。
 ステップS5では、図6のGUIで入力された構築指示に含まれる物理的構成の基準に基づいて、データ管理部210は、複数の論理記憶装置280'へストライピングして配置するデータの比率であるデータ配置比率を決定する。データ配置比率は、物理的構成の基準の違いに応じて次のように決定される。
 論理記憶装置280'を構成する物理記憶装置22の物理的な構成に応じたデータ配置比率の決定は、例えば、次の(1)~(4)を用いることができる。
(1)物理記憶装置22の数でデータ配置比率を決定する場合
 論理記憶装置280を構成する物理記憶装置22の数を、データ配置比率を基準として使用する。例えば、論理記憶装置A、B、Cの各物理記憶装置22の数が異なり、論理記憶装置Aの物理記憶装置22の数が4、論理記憶装置Bの物理記憶装置22の数が3、論理記憶装置Cの物理記憶装置22の数が2の場合、データ管理部210は、データ配置比率を、4:3:2と決定する。
 つまり、論理記憶領域2800を構成する物理記憶装置22の総数をn、論理記憶装置280'内の物理記憶装置22の数をxとすると、当該論理記憶装置280への配分比率はx/nで表される。
(2)論理記憶装置のRAIDレベルでデータ配置比率を決定する場合
 論理記憶装置はRAID構成を有している。データ管理部210は、ホスト計算機1からからアクセス可能な物理記憶装置22の数を取得し、当該数とRAIDレベルに応じてデータ配置比率を決定する。例えば、論理記憶装置AがRAID5で物理記憶装置22の数が3、論理記憶装置BがRAID1で物理記憶装置22の数が2、論理記憶装置CがRAID0で物理記憶装置22の数が2の場合、RAID1のミラーリング用物理記憶装置はホスト計算機1からアクセスできないので該物理記憶装置を除外した物理記憶装置22の数でデータ配置比率を決定すると、3:1:2となる。
 つまり、論理記憶領域2800を構成する論理記憶装置280'内でホスト計算機1からアクセス可能な物理記憶装置22の総数をnとし、論理記憶装置280'内でホスト計算機1からアクセス可能な物理記憶装置22の数をxとすると、当該論理記憶装置280への配分比率はx/nで表される。
(3)物理記憶装置の性能情報でデータ配置比率を決定する場合
 物理記憶装置22の性能情報でデータ配置比率を決定する場合では、データ管理部210は、物理記憶装置種別407でデータ配置比率を決定する。例えば、物理記憶装置種別407がFCであれば3、SASであれば2、SATAであれば2のように、物理記憶装置種別407の転送速度(理論値)に応じてデータ配置比率を決定する。
 すなわち、データ管理部210は、物理記憶装置種別407毎に予め値xを設定しておく。論理記憶領域2800を構成する論理記憶装置280毎の値xの総和をXとすると、各論理記憶装置280'のデータ配置比率は、x/Xである。
(4)論理記憶装置の容量でデータ配置比率を決定する場合
 論理記憶装置の容量でデータ配置比率を決定する場合では、データ管理部210は、各論理記憶装置の容量に応じてデータ配置比率を決定し、各論理記憶装置の容量を無駄なく使う。例えば、論理記憶装置Aが2TB、論理記憶装置Bが1TB、論理記憶装置Cが500GBの場合、容量比で決定されたデータ配置比率は、4:2:1である。
 つまり、論理記憶領域2800を構成する論理記憶装置280'の容量の総和がXであり、各論理記憶装置280'の容量がYであるとすると、各論理記憶装置280'のデータ配置比率は、Y/Xで表される。
 つまり、ステップS5は、問合せ処理部230から受け付ける書き込みデータを、データ配置比率に応じていずれの論理記憶装置280'に格納するかを決定する処理であり、データの配置位置を決定する処理である。
 ステップS6で、データ管理部210は、図6で入力された情報と上記ステップS5で決定したデータ配置比率を、データ配置管理情報2100に格納する。
 具体的には、データ管理部210は、図6のGUIの論理記憶領域名641に入力された名称を図5のデータ配置管理情報2100の論理記憶領域名2101に設定し、論理記憶装置番号643で指定された論理記憶装置をデータ配置管理情報2100のホスト論理記憶装置番号2104に設定し、論理記憶装置容量642で指定された容量をデータ配置管理情報2100の論理記憶装置容量2103に設定し、上記ステップS5で決定したデータ配置比率をデータ配置管理情報2100のデータ配置比率2105に設定し、データ配置管理情報2100のストライプサイズ2106に予め設定した値を格納し、新たな論理記憶領域2800を構築する。
 ステップS7では、データ管理部210は、更新されたデータ配置管理情報2100に基づいて、複数の論理記憶装置280'から構成された論理記憶領域2800を定義し、問い合わせ処理部230に提供する。
 以上の処理が完了すると、データ管理部210は、問合せ処理部230から論理記憶領域2800への書き込み要求又は読み出し要求があると、論理記憶領域2800を構成する複数の論理記憶装置280'に対して、物理記憶装置22の構成や組み合わせに応じたデータ配置比率2105に従って、データの書き込み又は読み出しを実行する。
 以上のように、DB管理者がデータベース管理端末6から指示した論理記憶領域2800がホスト計算機1に構築され、物理記憶装置22の物理的構成や組み合わせに応じてデータ配置比率2105がDBMS200のデータ管理部210で決定される。
 DBMS200の問合せ処理部230が論理記憶領域2800に書き込みを要求した場合、データ管理部210は問合せ処理部230から受け付けたデータを所定の管理単位で分割し、分割したデータをデータ配置比率2105に応じて論理記憶装置280a'、280b'にそれぞれ書き込む。
 例えば、図2で示したように、論理記憶装置280a'が3台の物理記憶装置22a、22b、22cで構成されて、論理記憶装置280b'が2台の物理記憶装置22d、2
2eで構成され、図6のGUIでチェックボックス6461の「物理記憶装置の数」が選択された場合、データ管理部210は、物理記憶装置22a~22dの数に応じて3:2のデータ配置比率を決定し、データ配置管理情報2100に設定する。
 データ管理部210は問い合わせ処理部230から書き込みデータを受け付けると、受け付けたデータを所定の管理単位(本実施形態ではストライプサイズ)で分割し、例えば、図2のようにデータを「1」~「5」の管理単位(以下、ストライプとする)に分割する。そして、データ管理部210は、「1」~「5」の分割されたデータを、データ配置比率2105に応じてラウンドロビンにより論理記憶装置280a'と論理記憶装置280b'に割り当てる。
 この結果、物理記憶装置22の数が3の論理記憶装置280a'には、「1」、「3」、「5」のデータが割り当てられ、物理記憶装置22の数が2の論理記憶装置280b'には、「2」、「4」のデータが割り当てられ、それぞれの論理記憶装置280'に書き込まれる。各論理記憶装置280'では、データは、複数の物理記憶装置22へ並列的に書き込みが行われる。なお、読み出し処理は上述の逆であり、論理記憶装置280'はストライプサイズ単位で複数の物理記憶装置22から並列的に読み出す。
 一方、前記従来技術は、論理記憶装置280a'、280b'を構成する物理記憶装置22の物理的な構成を参照することはなく、これら2つの論理記憶装置280a'、2870b'へ均等にデータを配分する。このため、前記従来技術では、3つの物理記憶装置22で構成された論理記憶装置280a'への読み書きの速度に比して、2つの物理記憶装置22で構成された論理記憶装置280b'への読み書きの速度が遅い。このため、論理記憶領域2800の読み書きの性能において、速度の遅い論理記憶装置280b'がボトルネックとなって、論理記憶装置280a'の物理記憶装置22の性能は余剰となる。
 一方、本発明は、論理記憶装置280'を構成する物理記憶装置22の物理的な構成に応じて論理記憶装置280'毎のデータ配置比率2105を決定するので、論理記憶装置280'毎の読み書きの速度を均等にすることが可能となって、論理記憶領域2800の読み書きの性能を最大にすることができる。
 このように、本発明を適用したデータ管理部210は、ストレージシステムの仮想化機能を利用して物理的な構成が異なる複数の論理記憶装置280で構築した論理記憶領域2800を計算機に提供する際に、物理記憶装置22の性能を最大限利用できるように複数の論理記憶装置280へのデータ配置比率を設定することができ、各物理記憶装置22の性能を無駄なく利用することができる。
 図7は、本発明の実施の形態において、ホスト計算機1のデータ管理部210が、既に構築された論理記憶領域2800を再構築する処理の手順を示すフローチャートである。この処理フローのステップS11において、データ管理部210は、次のイベントのいずれかひとつが発生したときに、そのイベントを再構築の指示として受け付け、既に構築された論理記憶領域2800の再構築を開始する。
 第1のイベントは、データベース管理端末6からの、論理記憶領域2800へ論理記憶装置280を追加する指令である。DBMS200が、データベース管理端末6から、既存の論理記憶領域2800に対して新たな論理記憶装置280を追加する指令を受信した場合には、データ管理部210はステップS12以降の処理を実行する。
 第2のイベントは、データベース管理端末6からの、論理記憶領域2800から論理記憶装置280を削除する指令である。DBMS200が、データベース管理端末6から、既存の論理記憶領域2800から論理記憶装置280を削除する指令を受信した場合には、データ管理部210がステップS12以降の処理を実行する。
 第3のイベントは、データベース管理端末6からの、論理記憶領域2800の容量を変更する指令である。DBMS200が、データベース管理端末6から、既存の論理記憶領域2800について容量を変更する指令を受信した場合には、データ管理部210がステップS12以降の処理を実行する。
 第4のイベントは、ストレージシステム2又はストレージ管理端末3からの、論理記憶装置280の構成が変更されたことを示す通知である。DBMS200又はDBMS管理部610が、ストレージシステム2又はストレージ管理端末3から、既存の論理記憶領域2800を構成する論理記憶装置280'の構成が変更されたことを示す通知を受信した場合には、データ管理部210がステップS12以降の処理を実行する。
 第5のイベントは、DBMS200が所定の周期でデータ管理部210を起動してステップS12以降の処理の開始を指令するイベントである。DBMS200は、所定の期間が経過する度に、図7のステップS12以降の処理をデータ管理部210に実行させて、論理記憶領域2800が使用中の論理記憶装置280を構成する物理記憶装置22の追加や削除などの変更を監視する。
 ステップS12において、データ管理部210が上記第5のイベントで起動したか否かを判定する。第5のイベント(所定期間が経過)でデータ管理部210が起動されたと判定した場合には、データ管理部210は、ステップS15、S16で、論理記憶領域2800を構成する論理記憶装置280'の構成の変化を監視する。
 ステップS15では、データ管理部210は、物理記憶装置情報取得部220に対して、ストレージシステム2又はストレージ管理端末3から物理記憶装置情報281又は311を取得するように指令する。なお、物理記憶装置情報取得部220は、ストレージシステム2又はストレージ管理端末3のうち予め設定した一方から、物理記憶装置情報を取得すればよい。
 ステップS16では、データ管理部210は、物理記憶装置情報取得部220がストレージシステム2又はストレージ管理端末3から取得した物理記憶装置情報281又は331と物理記憶装置情報221とを比較して、物理記憶装置22の物理的な構成情報が同一であるか否かを判定する。物理記憶装置情報281又は331と物理記憶装置情報221とが同一の場合、データ管理部210は論理記憶装置280'を構成する物理記憶装置22に変更はないと判定して処理を終了する。
 一方、取得した物理記憶装置情報とDBMS200が保持している物理記憶装置情報221が同一でない場合は、論理記憶装置280'を構成する物理記憶装置22の物理的な構成に変更が生じているため、データ管理部210はステップS17へ進む。
 次に、上記ステップS12の判定で、発生したイベントが第5のイベント以外の場合には、データ管理部210は、ステップS13で、発生したイベントが第1のイベント(論理記憶領域2800への論理記憶装置280の追加)であるか否かを判定する。発生したイベントが第1のイベントの場合には、データ管理部210はステップS14に進んで追加する論理記憶装置280を構成する物理記憶装置22の情報を取得してから、ステップS17に進む。一方、発生したイベントが第1のイベントではない場合(第2~第4のイベント発生の場合)、データ管理部210はそのままステップS17に進む。
 次にステップS17では、データ管理部210は、物理記憶装置情報221を参照して、既に構築済みの論理記憶領域2800に含まれる論理記憶装置280'を構成する物理記憶装置22に関する情報を取得する。
 ここで、発生したイベントが第1のイベントの場合、データ管理部210は、論理記憶領域2800に追加される論理記憶装置を構成する物理記憶装置の種別と、既存の論理記憶領域2800の論理記憶装置280'を構成する物理記憶装置22の種別が異なる場合には、追加される論理記憶装置の物理的な構成が既存の論理記憶装置と異なる旨の警告(通知)をデータベース管理端末6あるいは他の端末に出力しても良い。これにより、管理者が過誤によって物理的な構成が異なる論理記憶装置を組み合わせて論理記憶領域2800を構成するのを防ぐことができる。
 さらに、データ管理部210は、物理的な構成が既存の論理記憶装置と異なる旨の警告(通知)をデータベース管理端末6に出力した後に、現在実行中の論理記憶領域2800の構築(又は再構築)を中止する指令を、データベース管理端末6から受け付けても良い。データ管理部210は、論理記憶領域2800の構築中止指令を受け付けた場合には、処理を中止する。
 ステップS18では、データ管理部210は、前記図3のステップS5と同様に、論理記憶領域2800を構成する複数の論理記憶装置280'の物理的な構成に基づいて、データ配置比率を演算する。データ配置比率を決定するための物理記憶装置22の基準は、前記ステップS5で説明した(1)~(4)と同様であり、データ管理部210は、これらの基準のいずれかひとつからデータ配置比率を求める。
 次に、ステップS19では、前記図3のステップS6と同様に、データ管理部210は、再構築の指示で指定された情報と上記ステップS18で決定したデータ配置比率をデータ配置管理情報2100に格納して更新する。
 ステップS20では、前記図3のステップS7と同様に、データ管理部210は、更新されたデータ配置管理情報2100に基づいて、複数の論理記憶装置280'から構成された論理記憶領域2800を再構築(再定義)して、問い合わせ処理部230に提供する。
 そして、新たに追加された論理記憶装置280'や削除された論理記憶装置280'のために新たに求めたデータ配置比率2105に従って、データの再配置を実行する。例えば、図2の例において、論理記憶装置280bに物理記憶装置が1つ加わった場合、データ配置比率は3:2から1:1に更新される。データ管理部210は、新たな比率となるように、論理記憶装置280a'および論理記憶装置280b' のデータを、対応する論理記憶装置280'に移動する。
 以上の処理が完了すると、データ管理部210は、問合せ処理部230から論理記憶領域2800への書き込み要求または読み出し要求があると、再構築された論理記憶領域2800を構成する複数の論理記憶装置280'に対して、物理記憶装置22の構成や組み合わせに応じたデータ配置比率で、データの書き込み又は読み出しを実行する。
 以上のように、論理記憶領域2800の再構築においても、物理記憶装置22の物理的構成や組み合わせに応じてデータ配置比率2105がDBMS200のデータ管理部210で決定される。これにより、論理記憶装置280毎の読み書きの速度を均等にすることができ、論理記憶領域2800の読み書きの性能を最大にすることができる。
 なお、上述の例において、DBMS200が、データ配置比率を決定して論理記憶装置280にデータを配分するデータ管理部210を有しているが、データ管理部210をホスト計算機1のOS100内に設けるようにしても良い。
 また、上記好ましい構成例は、DBMS200の問合せ処理部230に提供する論理記憶領域2800を、ホスト計算機1のOS100が認識する複数の論理記憶装置280'から構築する。本実施形態はこれに限定されるものではなく、ホスト計算機1が認識するストレージシステム2の複数の論理記憶装置280から論理記憶空間を構築し、この論理記憶空間内に論理記憶領域2800を構築し、上述のように物理記憶装置22の物理的な構成に応じてデータ配置比率を決定し、データを分散して配置(記憶)してもよい。
 また、ソフトウェアによるRAID5、6をホスト計算機1で行う場合では、ストレージシステム2に配置するデータに加え、パリティもデータ配置比率に基づいて分散して記憶するようにしてもよい。
 また、上記構成において、図8で示すようにデータ配置管理情報2100のストライプサイズ2106はホスト論理記憶装置毎の複数のストライプサイズを格納し、データ管理部210が論理記憶装置280毎に異なるストライプサイズでアクセスして実質的なデータ配置比率の管理を行ってもよい。
 以上、本発明を添付の図面を参照して詳細に説明したが、本発明はこのような具体的構成に限定されるものではなく、添付した請求の範囲の趣旨内における様々な変更及び同等の構成を含むものである。
 以上のように、本発明は複数の論理記憶装置を備えたストレージシステムを利用する計算機システムとデータの分散配置方法に適用できる。

Claims (15)

  1.  複数の物理記憶装置から構成される複数の論理記憶装置を提供するストレージシステムに接続された計算機が、前記複数の論理記憶装置を統合して構築した論理記憶領域にデータを配置する方法であって、
     前記計算機が、前記複数の論理記憶装置を用いて前記論理記憶領域を構築する指示又は構築済みの論理記憶領域を再構築する指示を受け付けるステップと、
     前記計算機が、前記受け付けた前記指示に含まれる複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報を取得するステップと、
     前記計算機が、前記取得した複数の物理記憶装置に関する情報に基づき、前記論理記憶領域へのデータの配置位置を決定するステップと、
    を含むことを特徴とするデータ配置方法。
  2.  請求項1に記載のデータ配置方法であって、
     前記複数の論理記憶装置それぞれを構成する複数の物理記憶装置に関する情報は、
     前記論理記憶装置を構成する物理記憶装置の数、前記論理記憶装置を構成する複数の物理記憶装置に関するRAID構成情報、前記論理記憶装置を構成する複数の物理記憶装置の性能情報及び前記論理記憶装置の容量のうちの少なくとも1つであることを特徴とするデータ配置方法。
  3.  請求項1に記載のデータ配置方法であって、
     前記計算機が、前記決定されたデータの配置位置へデータを配置するステップをさらに含み、
     前記データの配置位置を決定するステップは、
     前記取得した複数の物理記憶装置に関する情報に基づき、前記論理記憶領域を構成する前記複数の論理記憶装置にストライピングして配置するデータの比率を決定するステップと、
     前記決定したデータの配置比率を管理するデータ配置管理情報を構築または更新するステップと、を含み、
     前記データを配置するステップは、
     前記データ配置管理情報に基づいて前記論理記憶領域にデータを配置するステップを含むことを特徴とするデータ配置方法。
  4.  請求項1に記載のデータ配置方法であって、
     前記情報を取得するステップは、
     前記計算機が、前記複数の物理記憶装置に関する情報の取得要求を前記ストレージシステムに送信するステップと、
     前記ストレージシステムが、前記計算機から前記複数の物理記憶装置に関する情報の取得要求を受け付けるステップと、
     前記ストレージシステムが、前記取得要求に従い、前記計算機に前記複数の物理記憶装置に関する情報を送信するステップと、
    を含むことを特徴とするデータ配置方法。
  5.  請求項1に記載のデータ配置方法であって、
     前記情報を取得するステップは、
     前記計算機が、前記物理記憶装置に関する情報の取得要求を、前記計算機と前記ストレージシステムとに接続され、前記複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報を有する第2の計算機へ送信するステップと、
     前記第2の計算機が、前記計算機から前記複数の物理記憶装置に関する情報の取得要求を受け付けるステップと、
     前記第2の計算機が、前記取得要求に従い、前記計算機に前記複数の物理記憶装置に関する情報を送信するステップと、
    を含むことを特徴とするデータ配置方法。
  6.  請求項1に記載のデータ配置方法であって、
     前記計算機は、前記複数の論理記憶装置それぞれを構成する複数の物理記憶装置に関する情報の入力を受け付けるインターフェースを提供し、
     前記情報を取得するステップは、
     前記インターフェースで受け付けた入力に基づいて、前記複数の物理記憶装置に関する情報を取得するステップ、
    を含むことを特徴とするデータ配置方法。
  7.  請求項2に記載のデータ配置方法であって、
     前記計算機は、前記複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報の一部を指定する入力を受け付けるインターフェースを提供し、
     前記情報を取得するステップは、
     前記インターフェースで受け付けた入力に基づいて、前記複数の物理記憶装置に関する情報を選択的に取得するステップ、を含み、
     前記データの配置位置を決定するステップは、
     前記選択的に取得した前記複数の物理記憶装置に関する情報に基づき、前記論理記憶領域にデータの配置位置を決定することを特徴とするデータ配置方法。
  8.  請求項1に記載のデータ配置方法であって、
     前記指示を受け付けるステップは、前記構築済みの論理記憶領域に新たな論理記憶装置を追加する指令、前記構築済みの論理記憶領域に含まれる特定の論理記憶装置を取り除く指令、前記構築済みの論理記憶領域の容量を変更する指令、前記構築済みの論理記憶領域に含まれる論理記憶装置を構成する複数の物理記憶装置に関する動的な構成変更の通知、及び、所定の期間の経過、の何れかのイベントが発生した場合に、そのイベントを前記構築済みの論理記憶領域を再構築する指示として受け付けることを特徴とするデータ配置方法。
  9.  請求項1に記載のデータ配置方法であって、
     前記データの配置位置を決定するステップは、
     前記受け付けた指示に含まれる前記複数の論理記憶装置を構成する複数の物理記憶装置が同一の構成であるか否かを判定し、同一の構成でない場合には警告を出力することを特徴とするデータ配置方法。
  10.  複数の物理記憶装置から構成される複数の論理記憶装置を提供するストレージシステムと、
     前記複数の論理記憶装置を統合して論理記憶領域を構築し、前記論理記憶領域にデータを配置する論理記憶領域管理部、及び、前記複数の論理記憶装置それぞれを構成する複数の物理記憶装置に関する情報を取得する物理記憶装置情報取得部、を有し、前記ストレージシステムに接続された計算機と、
    を含むデータ管理システムであって、
     前記論理記憶領域管理部は、複数の論理記憶装置を用いて論理記憶領域を構築する指示又は構築済みの論理記憶領域を再構築する指示を受け付けたときに、前記物理記憶装置情報取得部が取得した複数の物理記憶装置に関する情報に基づき、前記論理記憶領域へのデータの配置位置を決定することを特徴とするデータ管理システム。
  11.  請求項10に記載のデータ管理システムであって、
     前記複数の論理記憶装置それぞれを構成する複数の物理記憶装置に関する情報は、
     前記論理記憶装置を構成する複数の物理記憶装置の数、前記論理記憶装置を構成する複数の物理記憶装置に関するRAID構成情報、前記論理記憶装置を構成する複数の物理記憶装置の性能情報及び前記論理記憶装置の容量、のうちの少なくとも1つであることを特徴とするデータ管理システム。
  12.  請求項10に記載のデータ管理システムであって、
     前記論理記憶領域管理部は、
     前記物理記憶装置情報取得部が取得した複数の物理記憶装置に関する情報に基づき、前記複数の論理記憶装置にストライピングして配置するデータの比率を決定し、
     前記決定したデータの配置比率を管理するデータ配置管理情報を構築または更新し、
     前記データ配置管理情報に則して前記論理記憶領域にデータを配置することを特徴とするデータ管理システム。
  13.  請求項10に記載のデータ管理システムであって、
     前記ストレージシステムは、前記計算機に提供する複数の論理記憶装置を構成する複数の物理記憶装置に関する情報と、前記計算機からの要求を受け付けて前記要求に応じた処理を行う制御部と、を備え、
     前記物理記憶装置情報取得部は、前記指示に含まれる複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報の取得要求を前記ストレージシステムに対して送信し、
     前記制御部は、前記取得要求を受け付けて、前記取得要求に則した前記複数の物理記憶装置に関する情報を前記計算機に対して送信することを特徴とするデータ管理システム。
  14.  請求項10に記載のデータ管理システムであって、
     前記計算機と前記ストレージシステムとに接続され、前記ストレージシステムにより提供される複数の論理記憶装置を構成する複数の物理記憶装置に関する情報を有する第2の計算機をさらに備え、
     前記計算機の前記物理記憶装置情報取得部が、前記指示に含まれる複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報の取得要求を前記第2の計算機に対して送信し、
     前記第2の計算機が、前記取得要求を受け付けて、前記取得要求に則した前記複数の物理記憶装置に関する情報を前記計算機に対して送信することを特徴とするデータ管理システム。
  15.  請求項10に記載のデータ管理システムであって、
     前記物理記憶装置情報取得部は、
     前記複数の論理記憶装置のそれぞれを構成する複数の物理記憶装置に関する情報の入力を受け付けるインターフェースを提供し、
     前記インターフェースで受け付けた入力に基づいて、前記複数の物理記憶装置に関する情報を取得することを特徴とするデータ管理システム。
PCT/JP2010/063562 2009-11-30 2010-08-10 データ配置方法及びデータ管理システム WO2011065071A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US13/389,893 US9298394B2 (en) 2009-11-30 2010-08-10 Data arrangement method and data management system for improving performance using a logical storage volume

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009271647A JP5021018B2 (ja) 2009-11-30 2009-11-30 データ配置方法及びデータ管理システム
JP2009-271647 2009-11-30

Publications (1)

Publication Number Publication Date
WO2011065071A1 true WO2011065071A1 (ja) 2011-06-03

Family

ID=44066173

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/063562 WO2011065071A1 (ja) 2009-11-30 2010-08-10 データ配置方法及びデータ管理システム

Country Status (3)

Country Link
US (1) US9298394B2 (ja)
JP (1) JP5021018B2 (ja)
WO (1) WO2011065071A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5521794B2 (ja) * 2010-06-03 2014-06-18 株式会社バッファロー 記憶装置及びその制御プログラム
US20120265932A1 (en) * 2011-04-13 2012-10-18 Jibbe Mahmoud K Method to increase the flexibility of configuration and/or i/o performance on a drive array by creation of raid volume in a heterogeneous mode
JP6142599B2 (ja) * 2013-03-18 2017-06-07 富士通株式会社 ストレージシステム、ストレージ装置および制御プログラム
JP6269530B2 (ja) * 2015-02-26 2018-01-31 日本電気株式会社 記憶システム、記憶方法、及び、プログラム
JP6686602B2 (ja) * 2016-03-24 2020-04-22 富士通株式会社 制御方法、制御プログラムおよび制御装置
KR20200053204A (ko) * 2018-11-08 2020-05-18 삼성전자주식회사 저장 장치, 저장 장치의 동작 방법 및 저장 장치를 제어하는 호스트의 동작 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282637A (ja) * 1998-02-27 1999-10-15 Aiwa Co Ltd Raidデ―タ記憶システムの再構成方法
JP2008165620A (ja) * 2006-12-28 2008-07-17 Hitachi Ltd ストレージ装置構成管理方法、管理計算機及び計算機システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3266351B2 (ja) * 1993-01-20 2002-03-18 株式会社日立製作所 データベース管理システムおよび問合せの処理方法
US5809224A (en) * 1995-10-13 1998-09-15 Compaq Computer Corporation On-line disk array reconfiguration
US6311251B1 (en) * 1998-11-23 2001-10-30 Storage Technology Corporation System for optimizing data storage in a RAID system
US7000069B2 (en) * 1999-04-05 2006-02-14 Hewlett-Packard Development Company, L.P. Apparatus and method for providing very large virtual storage volumes using redundant arrays of disks
JP2005056077A (ja) * 2003-08-01 2005-03-03 Hitachi Ltd データベース制御方法
US7302522B2 (en) * 2004-12-27 2007-11-27 Lsi Corporation Optimizing I/O performance in a RAID subsystem using an adaptive maximum request size for a logical drive
JP5154200B2 (ja) 2007-11-09 2013-02-27 株式会社日立製作所 データ読出し方法、データ管理システム及びストレージシステム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11282637A (ja) * 1998-02-27 1999-10-15 Aiwa Co Ltd Raidデ―タ記憶システムの再構成方法
JP2008165620A (ja) * 2006-12-28 2008-07-17 Hitachi Ltd ストレージ装置構成管理方法、管理計算機及び計算機システム

Also Published As

Publication number Publication date
JP2011113470A (ja) 2011-06-09
US9298394B2 (en) 2016-03-29
JP5021018B2 (ja) 2012-09-05
US20120151138A1 (en) 2012-06-14

Similar Documents

Publication Publication Date Title
US8433848B1 (en) Analysis tool for a multi-tier storage environment
US9495409B1 (en) Techniques for performing data validation
JP4391265B2 (ja) ストレージサブシステムおよび性能チューニング方法
US8347028B2 (en) Performance separation optimization according to protocol usage status and storage system performance
JP5478107B2 (ja) 仮想ストレージ装置を管理する管理サーバ装置及び仮想ストレージ装置の管理方法
US8117387B2 (en) Storage system and method of managing a storage system using a management apparatus
US8572346B2 (en) Storage system and method for efficiently utilizing storage capacity within a storage system
US9009404B2 (en) Viewing compression and migration status
JP5021018B2 (ja) データ配置方法及びデータ管理システム
US8972656B1 (en) Managing accesses to active-active mapped logical volumes
US8972657B1 (en) Managing active—active mapped logical volumes
US20130042062A1 (en) Firmware management of storage class memory
US10884622B2 (en) Storage area network having fabric-attached storage drives, SAN agent-executing client devices, and SAN manager that manages logical volume without handling data transfer between client computing device and storage drive that provides drive volume of the logical volume
US8423713B2 (en) Cluster type storage system and method of controlling the same
US10466901B1 (en) Interactive tiering preferences map
US9569569B1 (en) Data storage system modeling
US11644951B2 (en) Dynamic dashboard of user interface displaying primary object and related objects
JP5000234B2 (ja) 制御装置
US11755224B2 (en) Storing data in slices of different sizes within different storage tiers
US9158828B1 (en) Techniques using associated object properties
JP4837495B2 (ja) 記憶システム及びデータ管理移行方法
US10235053B1 (en) Method and system for using host driver for flexible allocation fast-sideways data movements
US10203874B1 (en) Managing time scheduled data placement in data storage systems
US11226836B2 (en) Dynamic restructuring of user interface based on usage data
Dufrasne et al. IBM DS8880 Architecture and Implementation (Release 8.51)

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10832918

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 13389893

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10832918

Country of ref document: EP

Kind code of ref document: A1