JP2006099542A - データアーカイブシステム、データ検索方法及び管理サーバ - Google Patents

データアーカイブシステム、データ検索方法及び管理サーバ Download PDF

Info

Publication number
JP2006099542A
JP2006099542A JP2004286331A JP2004286331A JP2006099542A JP 2006099542 A JP2006099542 A JP 2006099542A JP 2004286331 A JP2004286331 A JP 2004286331A JP 2004286331 A JP2004286331 A JP 2004286331A JP 2006099542 A JP2006099542 A JP 2006099542A
Authority
JP
Japan
Prior art keywords
search
data
server
archive
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004286331A
Other languages
English (en)
Inventor
Daiki Nakatsuka
大樹 中塚
Kenta Shiga
賢太 志賀
Mitsuru Ubusawa
満 生澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004286331A priority Critical patent/JP2006099542A/ja
Priority to US10/995,414 priority patent/US20060074918A1/en
Publication of JP2006099542A publication Critical patent/JP2006099542A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment

Abstract

【課題】データアーカイブシステムにおいて、検索タスクの処理時間を短縮する。
【解決手段】データを記憶する複数のボリュームを有するストレージ装置と、所望のデータの検索を要求する検索タスクを処理する複数の検索サーバと、CPUと、インタフェースと、メモリを有し、前記検索サーバを管理する管理サーバと、を備えるデータアーカイブシステムにおいて、前記管理サーバは、前記ボリュームに記憶されているデータを管理するテーブルを有し、前記検索サーバの負荷情報を取得し、該負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択し、前記テーブルに基づいて、前記検索タスクで要求するデータが記憶されている前記ボリュームを特定し、選択した前記検索サーバに、該ボリュームを通知し、該検索サーバは、該ボリュームに対して前記検索タスクを処理することを特徴とする。
【選択図】図1

Description

本発明は、ストレージにデータを記憶するデータアーカイブシステムに関し、特に、ストレージから所望のデータを検索する技術に関する。
近年、米国では、不正な企業会計や、電子カルテからのプライバシーの流出を防止するため、様々な規制がされている。新たに定められた法規制は、例えば、SEC Rule 17a−4(米証券取引委員会規則17条a−4)である。この法規制では、保存される電子記録文書に対して、改ざん防止策を備えることや、法的機関の要請に従いただちに情報を提供する義務等を規定している。この流れを受け、蓄積されたデータから所望のデータを検索できるデータアーカイブシステムが必要とされている。
データアーカイブシステムは、大量のデータが格納される。法的機関の要請に従いただちに情報を提供するためには、データアーカイブシステムは、高速な検索手段が必要となる。なお、高速な検索手段は、検索タスクの負荷を分散することによって実現できる。
従来、検索タスクの負荷を分散する方法として、検索処理を行うサーバを複数用意し、それらのサーバを負荷分散装置で束ねる技術が知られている(例えば、非特許文献1参照。)。この負荷分散装置は、受け取った複数の検索タスクを、別の検索サーバに振り分ける。
"HA8000−ie/Loadflowbal 製品カタログ(第1頁)"、(株)日立製作所、<URL: http://www.hitachi.co.jp/Prod/comp/OSD/pc/ha/prod/catalog/ielf0307.pdf>
しかしながら、従来の負荷分散装置は、複数の検索タスクを複数の検索サーバで処理する技術であり、一つの検索タスクを複数の検索サーバで処理することは考慮されていない。
本発明は、一つの検索タスクを複数のサーバで分散して処理する技術の提供を目的とする。
本発明は、データを記憶する複数のボリュームを有するストレージ装置と、所望のデータの検索を要求する検索タスクを処理する複数の検索サーバと、CPUと、インタフェースと、メモリを有し、前記検索サーバを管理する管理サーバと、を備えるデータアーカイブシステムにおいて、前記管理サーバは、前記ボリュームに記憶されているデータを管理するテーブルを有し、前記検索サーバの負荷情報を取得し、該負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択し、前記テーブルに基づいて、前記検索タスクで要求するデータが記憶されている前記ボリュームを特定し、選択した前記検索サーバに、該ボリュームを通知し、該検索サーバは、該ボリュームに対して前記検索タスクを処理することを特徴とする。
一つの検索タスクを複数の検索サーバで並列的に処理をすることによって、検索タスクの処理時間を短縮できる。
以下、本発明の実施の形態を図面を参照して説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態のデータアーカイブシステムのブロック図である。
まず、本発明の概要を説明する。
本発明の実施の形態のデータアーカイブシステムは、データを格納する複数のボリュームを有するストレージ104と、ストレージ104に格納されているデータを検索する検索タスクを処理する複数の検索サーバ102a、102bと、検索サーバ102a等を管理する検索タスク管理サーバ105と、を備える。検索タスク管理サーバ105は、前記ボリュームに格納されているデータを管理する管理テーブル127、128、130を保持している。また、検索タスク管理サーバ105は、各検索サーバ102a、102bの負荷情報を取得し、CPU負荷管理テーブル127に記録する。そして、取得した負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択する。また、検索タスク管理サーバ105は、アーカイブデータ管理テーブル130に基づいて、検索タスクによる検索対象データが格納されているボリュームを特定する。そして、選択された検索サーバ102に、特定されたボリュームを通知する。選択された検索サーバ102は、通知されたボリュームに対して、検索タスクを処理する。
さらに、本発明の実施の形態のデータアーカイブシステムは、ボリュームにデータを格納するアーカイブサーバ103を備える。このアーカイブサーバ103は、ボリュームに格納されるデータのデータ名、データ特性及び該データを格納したボリュームのデータ格納ターゲットをアーカイブ管理データ格納テーブル130に格納する。
次に、図1に従って、本発明の第1の実施の形態のデータアーカイブシステムの構成を説明する。
本実施の形態のデータアーカイブシステムは、検索クライアント101、検索サーバ1(102a)、検索サーバ2(102b)、アーカイブサーバ103、ストレージ104、検索タスク管理サーバ105、ストレージ管理サーバ106、LAN107、SAN(Storage Area Network)108及び管理用ネットワーク109から構成される。
検索クライアント101、検索サーバ1(102a)、検索サーバ2(102b)及び検索タスク管理サーバ105は、LAN107で相互に接続される。また、検索サーバ1(102a)、検索サーバ2(102b)、アーカイブサーバ103及びストレージ104は、SAN108で相互に接続される。また、アーカイブサーバ103、ストレージ管理サーバ106及び検索タスク管理サーバ105は、管理用ネットワーク109で相互に接続される。
LAN107は、例えば、イーサネット(登録商標)で構築されたネットワークであり、IPパケットを転送する。
SAN108は、例えば、IP−SNAやFC−SANである。IP−SANは、イーサネットで構築されたSANであり、iSCSIプロトコルが用いられる。FC−SANは、ファイバチャネルで構築されたSANであり、ファイバチャネルプロトコルが用いられる。
管理用ネットワーク109は、例えば、イーサネットで構築されたネットワークであり、IPパケットを転送する。管理用ネットワーク109は、管理情報を当該システムの機器間で送受信するために用いられる。
なお、第1の実施の形態のデータアーカイブシステムにおいて、LAN107及び管理用ネットワーク109は、それぞれ独立したネットワークとしているが、一つのネットワークを共用する構成としてもよい。
検索クライアント101は、検索タスクを発行する計算機である。検索タスクとは、所望のデータの検索要求であり、アーカイブデータ名及び検索条件から構成される。アーカイブデータ名は、検索するアーカイブデータを特定する名称である。検索条件は、例えば、「2003年以降に作成されたデータから検索する」のような、検索するデータを限定する条件である。検索クライアント101は、LAN107を介して、検索タスクを検索タスク管理サーバ105へ送信する。なお、一つの検索クライアント101を図示しているが、複数設けられてもよい。
検索タスク管理サーバ105は、CPU122、メモリ123及びインタフェース124、125を有する計算機である。メモリ123には、検索タスク分散プログラム126、CPU負荷管理テーブル127、検索タスク管理テーブル128、CPU負荷監視プログラム129及びアーカイブデータ管理テーブル130が記憶される。なお、検索タスク分散プログラム126及びCPU負荷監視プログラム129は、可搬記憶媒体やネットワーク等を介して、メモリ123内に記憶される。
インタフェース124は、LAN107を介して、検索クライアント101、検索サーバ1(102a)及び検索サーバ2(102b)と接続される。インタフェース125は、管理用ネットワーク109を介して、検索サーバ1(102a)、検索サーバ2(102b)、アーカイブサーバ103、ストレージ104及びストレージ管理サーバ106と接続される。
CPU122は、メモリ123内のプログラムを実行することによって、各種処理を行う。
CPU負荷監視プログラム129は、すべての検索サーバ102からCPU使用率を所定のタイミング(例えば、定期的)で収集する。そして、収集したCPU使用率をCPU負荷管理テーブル127へ格納する。なお、CPU負荷監視プログラム129は、SNMP(Simple Network Management Protocol)を用いて、検索サーバ102からCPU使用率を含むMIB(Management Information Base)を収集することによって、CPU使用率を収集する。また、CPU負荷監視プログラム129は、他の方法でCPU使用率を収集してもよい。
SNMPは、IETFによって標準化された公知技術であり、ネットワークに接続した機器を管理するプログラムと、管理される対象の機器との間で、管理情報を通信するプロトコルである(例えば、<URL: http://www.ietf.org/rfc/rfc1157.txt>参照。)。なお、本実施の形態では、機器を管理するプログラムがCPU負荷監視プログラム129であり、管理される対象の機器が検索サーバ102である。
また、MIBは、IETFによって書式を標準化された公知技術であり、SNMPで通信される管理情報である。(例えば、<URL: http://www.ietf.org/rfc/rfc1155.txt>参照。)。
検索タスク分散プログラム126は、CPU負荷管理テーブル127に格納された情報に基づいて、CPU使用率の低い検索サーバ102を選択する。そして、検索タスク分散プログラム126は、選択した検索サーバ102に、検索タスクの処理を要求する。
CPU負荷管理テーブル127は、各検索サーバ102のCPU使用率を示す(図2参照)。アーカイブデータ管理テーブル130は、各アーカイブデータの保存場所を示す(図3参照)。検索タスク管理テーブル128は、各検索タスクの処理内容及び処理情況等を示す(図4参照)。
検索サーバ1(102a)は、CPU110a、メモリ111a及びインタフェース112a、113a、114aを有する計算機である。メモリ111aには、検索プログラム115aが記憶される。なお、検索プログラム115aは、可搬記憶媒体やネットワークを介してメモリ111内に記憶される。
インタフェース112aは、LAN107を介して、検索クライアント101及び検索タスク管理サーバ105と接続される。インタフェース113aは、SAN108を介して、アーカイブサーバ103及びストレージ104と接続される。インタフェース114aは、管理用ネットワーク109を介して、検索タスク管理サーバ105及びストレージ管理サーバ106と接続される。
CPU110aは、メモリ111a内の各種プログラムを実行することによって、各種処理を行う。検索プログラム115aは、検索タスクを処理する。
なお、検索サーバ2(102b)は、検索サーバ1(102a)と同一の構成なので説明は省略する。
検索サーバ102は、2台を図示したが、これより多数であってもよい。本実施の形態のデータアーカイブシステムは、複数の検索サーバ102が一つの検索タスクを並列処理することによって、検索処理を高速化する。つまり、本実施の形態では、複数の検索サーバ102が備わっている。
アーカイブサーバ103は、CPU116、メモリ117及びインタフェース118、119を有する計算機である。メモリ117には、アーカイブプログラム120が記憶される。なお、アーカイブプログラム120は、可搬記憶媒体やネットワークを介してメモリ117内に記憶される。
インタフェース118は、SAN108を介して、検索サーバ102及びストレージ104と接続される。インタフェース119は、管理用ネットワーク109を介して、検索サーバ102及び検索タスク管理サーバ105と接続される。
CPU116は、メモリ117内の各種プログラムを実行することによって、各種処理を行う。アーカイブプログラム120は、アーカイブデータを作成する。そして、作成したアーカイブデータの情報を検索タスク管理サーバ105に通知する。
ここで、アーカイブデータとは、多数のファイルをまとめたデータである。例えば、アーカイブデータは、電子メール、電子カルテ、映像データ又は文書データである。また、アーカイブデータは、Webサーバ又はファイルサーバのアクセスログ等であってもよい。
ストレージ104は、ディスクドライブ群121を有する記憶装置である。ディスクドライブ群121は、一つ以上のディスクドライブを有する。ディスクドライブは、例えば、磁気ディスクドライブ、磁気テープ、DVD又はCDであり、物理的な記憶領域を有する。ストレージ104は、個々のディスクドライブが有する物理的な記憶領域から、論理ユニット(LU)を作成する。LUは、検索サーバ102及びアーカイブサーバ103に提供される論理的な記憶領域である。
ストレージ管理サーバ106は、CPU131、メモリ132、インタフェース133を有する計算機である。メモリ132には、ターゲットアドレス管理テーブル134、ストレージ容量管理テーブル135及びストレージ管理プログラム136が記憶される。なお、ストレージ管理プログラム136は、可搬記憶媒体やネットワークを介してメモリ132内に記憶される。
インタフェース133は、管理用ネットワーク109を介して、検索サーバ102、アーカイブサーバ103、ストレージ104及び検索タスク管理サーバ105と接続される。
CPU131は、メモリ132内の各種プログラムを実行することによって、各種処理を行う。
ストレージ管理プログラム136は、ストレージ104の構成を変更する。ストレージ104の構成変更は、LUを作成又は削除し、更に、ストレージ104に備わるインタフェースのアドレスを設定する。また、ストレージ管理プログラム136は、ストレージ104の構成変更の後に、設定したアドレスをターゲットアドレス管理テーブル134に格納し、ストレージ104の空き容量及び使用済み容量を検索タスク管理サーバ105へ通知する。
他にも、ストレージ管理プログラム136は、アーカイブデータが格納されているLUのアドレスの問い合わせがあると、当該アドレスを検索サーバ102へ通知する。
なお、検索タスク管理サーバ105及びストレージ管理サーバ106は、それぞれ別のハードウェアとしているが、それぞれの機能を備える一台のハードウェアとしてもよい。
図2は、本発明の第1の実施の形態の検索タスク管理サーバ105に記憶されているCPU負荷管理テーブル127の構成図である。
CPU負荷管理テーブル127は、サーバ名201、IPアドレス202及びCPU負荷203から構成される。CPU負荷管理テーブル127は、データアーカイブシステムに備わる検索サーバ102の数のエントリを有する。
サーバ名201は、当該エントリの検索サーバ102の一意な識別子である。IPアドレス202は、当該エントリの検索サーバ102のインタフェース114に割り当てられたIPアドレスである。CPU負荷203は、当該エントリの検索サーバ102のCPU110の使用率である。
サーバ名201及びIPアドレス202は、システム管理者によって入力される。CPU負荷203は、CPU負荷監視プログラム129によって、MIBに含まれるCPUの使用率が格納される。
図3は、本発明の第1の実施の形態の検索タスク管理サーバ105に記憶されているアーカイブデータ管理テーブル130の構成図である。
アーカイブデータ管理テーブル130は、アーカイブデータ名301、データ格納ターゲットアドレス302及びLUN303から構成される。アーカイブデータ管理テーブル130は、アーカイブサーバ103によって作成されたアーカイブデータの数のエントリを有する。
アーカイブデータ名301は、当該エントリのアーカイブデータを一意に識別する名称である。データ格納ターゲットアドレス302は、当該エントリのアーカイブデータを保存したLUに割り当てたターゲットのアドレスである。
ターゲットは、ストレージ104の内部に備えられ、SCSIコマンドを受信する装置である。ターゲットは、論理的な装置であってもよいし、物理的な装置であってもよい。ストレージ104は、内部に複数のターゲットを備えてもよい。
また、ターゲットアドレスとは、ターゲットの一意な識別子である。ターゲットアドレスは、ファイバチャネルプロトコルではWWN(World Wide Name)であり、iSCSIプロトコルではiSCSIネームである。
また、LUに割り当てたターゲットとは、アーカイブサーバ103及び検索サーバ102が、LUにデータを読み書きする際にコマンドを送るターゲットである。例えば、本実施の形態において、データ1は、3つのLUにまたがって格納されており、ターゲットのアドレスが「iqn.2003-01.com.example:Target1」である。検索サーバ102は、データ1を読み出すとき、そのターゲットのアドレス「iqn.2003-01.com.example:Target1」に対して、SCSIコマンドを送信する。
LUは、自身が属するストレージ104のターゲットの一つに割り当てられる。なお、一つのターゲットに複数のLUを割り当ててもよいが、一つのLUを複数のターゲットに割り当てることはできない。これは、SCSIの規約によって定められている。
LUN303は、当該エントリのアーカイブデータを保存したLUの識別子である。なお、LUN303は、各ターゲット内において、LUを識別できる。つまり、同一のLUN303であってもターゲットが異なれば、アーカイブデータの保存場所は異なる。
図4は、本発明の第1の実施の形態の検索タスク管理サーバ105に記憶されている検索タスク管理テーブル128の構成図である。
検索タスク管理テーブル128は、検索タスク名401、処理対象データ402、処理内容403、ターゲットアドレス404、LUN405、検索処理情況406及びタスク割り当てサーバ407から構成される。
検索タスク名401は、当該エントリの検索タスクを識別する名称である。処理対象データ402は、当該エントリの検索タスクの検索対象のアーカイブデータの名称である。処理内容403は、当該エントリの検索タスクの検索対象のアーカイブデータの検索条件である。
ターゲットアドレス404は、当該エントリの検索タスクの検索対象のアーカイブデータを保存したLUに割り当てられたターゲットのアドレスである。
LUN405は、当該エントリの検索タスクの検索対象のアーカイブデータを保存したLUの識別子である。なお、LUN405は、一つの値ごとにエントリが作成される。例えば、タスク1において、処理対象のデータ1は、LUN0、LUN1及びLUN2の3つのLUにまたがって保存されている。そのため、タスク1のLUN405には、3つのエントリが作成される。
検索処理状況406は、当該エントリのLUの検索状況である。検索処理状況406は、当該エントリのLUに対する検索処理が完了していれば「処理済み」が格納され、検索処理中であれば「タスク処理中」が格納され、未処理であれば「未処理」が格納される。
タスク割り当てサーバ407は、現在、当該エントリのLUを検索している検索サーバ102のサーバ名である。つまり、タスク割り当てサーバ407は、処理状況406が「タスク処理中」である場合のみサーバ名が格納され、それ以外の場合にはサーバ名が格納されない。
図5は、本発明の第1の実施の形態のストレージ管理サーバ106に記憶されているターゲットアドレス管理テーブル134の構成図である。
ターゲットアドレス管理テーブル134は、ターゲットアドレス501、IPアドレス502及びポート番号503から構成される。ターゲットアドレス管理テーブル134は、ストレージ104が有するすべてのターゲットの数のエントリを有する。
ターゲットアドレス501は、当該エントリのターゲットのアドレスである。IPアドレス502は、当該エントリのターゲットへアクセスするためのIPアドレスである。ポート番号503は、当該エントリのターゲットへアクセスするTためのCPポート番号である。
検索サーバ102及びアーカイブサーバ103は、ターゲットへiSCSIプロトコルでアクセスする際には、IPアドレス502及びポート番号503を使用する。一方、検索サーバ102及びアーカイブサーバ103は、ターゲットへファイバチャネルプロトコルでアクセスする際には、IPアドレス502及びポート番号503を使用しない。つまり、ターゲットアドレス管理テーブル134は、SAN108が、IP−SANであれば必要だが、FC−SANであれば不要である。
図6は、本発明の第1の実施の形態のストレージ管理サーバ106に記憶されているストレージ容量管理テーブル135の構成図である。
ストレージ容量管理テーブル135は、装置ID601、空き容量602及び使用容量603から構成される。ストレージ容量管理テーブル135は、データアーカイブシステムに備えられるストレージ104の数のエントリを有する。
装置ID601は、当該エントリのストレージ104を一意に識別する識別子である。空き容量602は、当該エントリのストレージ104が保存できるデータの容量である。使用容量603は、当該エントリのストレージ104がデータ保存しているデータの容量である。
次に、本発明の第1の実施の形態のデータアーカイブシステムの処理について説明する。
図7は、本発明の第1の実施の形態のCPU負荷監視プログラム129の処理のフローチャートであり、検索タスク管理サーバ105によって実行される。
まず、CPU負荷管理テーブル127から、検索サーバ102のインタフェース114に割り当てられたIPアドレスを抽出する。次に、抽出したIPアドレスを使って、すべての検索サーバ102からCPU負荷情報を含むMIBを収集する(701)。
そして、、収集したCPU負荷情報によって、CPU負荷管理テーブル127のCPU負荷203を更新する(702)。
検索タスク管理サーバ105は、以上の処理を定期的に実行する。処理を行う間隔は、当該システムの管理者が設定する。この処理は一定間隔で実行してもよいし、必要なときに不定間隔で実行してもよい。
以上のCPU負荷監視処理によって、検索タスク管理サーバ105は、すべての検索サーバ102のCPUの負荷を収集し、監視することができる。
図8は、本発明の第1の実施の形態のアーカイブ処理のフローチャートである。
アーカイブサーバ103は、ユーザからアーカイブ作成要求を受信すると、アーカイブプログラム120を実行する。アーカイブ作成要求は、アーカイブ対象データ及びアーカイブファイル名を含む。
また、アーカイブサーバ103は、ユーザによって作成されたアーカイブ作成スケジュールに基づいて、定期的にアーカイブプログラム120を実行してもよい。アーカイブ作成スケジュールは、例えば、「毎日午前0時に、Webサーバからアクセスログを収集し、アーカイブデータを作成する」などの設定である。
まず、アーカイブサーバ103によってアーカイブプログラム120が実行されると、受け取ったアーカイブ対象データのデータサイズの合計が計算される。次に、アーカイブサーバ103は、ストレージ容量管理テーブル135から、計算した合計データサイズ以上の空き容量を有するストレージ104を検索する(801)。
次に、アーカイブサーバ103は、アーカイブ対象データを格納可能なストレージ104が存在するか否かを判定する(802)。ストレージ104が、アーカイブ対象データの合計データサイズ以上の空き容量を有していれば、このアーカイブデータを格納することができる。
格納可能なストレージ104が存在しないと、アーカイブサーバ103は、管理者へエラーを通知し(807)、アーカイブプログラム120を終了する。
一方、格納可能なストレージ104が存在すると、アーカイブサーバ103は、ステップ801で検索されたストレージ104の中から、最も空き容量が多いストレージ104(対象ストレージ)を選択する。なお、アーカイブサーバ103は、他の方法で対象ストレージ104を選択してもよい。例えば、検索されたストレージ104の中から、このアーカイブデータを格納するに足りる最小の空き容量を有するストレージ104を選択してもよい。
アーカイブサーバ103は、ストレージ管理サーバ106に対し、対象ストレージ104にLUの作成を要求する。作成するLUは、アーカイブ対象データの合計データサイズ分の容量を有する必要がある。
LUの作成を要求されたストレージ管理サーバ106は、対象ストレージ104に対し、LUの作成を要求する。LUの作成の要求には、作成するLUの容量が含まれている。
なお、ストレージ管理サーバ106は、複数のLUを作成する要求をしてもよい。この場合、アーカイブ対象データは、複数のLUにまたがって格納される。例えば、対象ストレージ104のディスクドライブがDVDなどの光学メディアであれば、一つのLUは、一枚のDVDディスクに相当する。光学メディアは、あらかじめ容量が決まっている。そのため、ストレージ管理サーバ106は、アーカイブ対象データのサイズが大きいと、複数のLUの作成を要求する。
例えば、対象ストレージ104が、DVDにデータを格納するストレージの場合を考える。DVDディスクに格納できるデータ量は、最大4.7Gバイトである。アーカイブサーバ103は、アーカイブ対象データの合計データサイズが100Gであると、対象ストレージ104に対して、22個のLUの作成を要求する。
対象ストレージ104は、LUの作成要求があると、指定された容量のLUを作成する(803)。そして、対象ストレージ104は、自身が有するターゲットに、作成したLUを割り当てる。なお、対象ストレージ104は、ターゲットを複数有している場合、任意に選択した一つのターゲットに、作成したLUを割り当てる。
次に、対象ストレージ104は、作成したLUにLUNを割り当てる。さらに、対象ストレージ104は、作成したLUに割り当てたターゲットのアドレス及びLUNを、ストレージ管理サーバ106へ通知する。
ストレージ管理サーバ106は、通知を受けると、ストレージ容量管理テーブル135を更新する。具体的には、ストレージ管理サーバ106は、対象ストレージ104に対応するエントリをストレージ容量管理テーブル135から抽出する。次に、ストレージ管理サーバ106は、抽出したエントリの空き容量602に格納されている値を、ステップ803で作成したLUの容量分増やす。更に、同じエントリの使用容量603に格納されている値を、ステップ803で作成したLUの容量分減らす。
次に、ストレージ管理サーバ106は、アーカイブサーバ103に対して、ステップ803で作成したLUのターゲットアドレス及びLUNを通知する。
アーカイブサーバ103は、通知されたターゲットアドレス及びLUNを使って、作成されたLUへアクセスする。そして、アーカイブサーバ103は、アーカイブ対象データからアーカイブデータを作成し、作成したアーカイブデータをアクセスしたLUに格納する(804)。
ただし、SAN108がIP−SANであると、アーカイブサーバ103は、作成されたLUにアクセスするために、ターゲットのIPアドレス及びTCPポート番号が必要となる。よって、アーカイブサーバ103は、ストレージ管理サーバ106に対し、そのターゲットのアドレスを送信し、IPアドレス及びTCPポート番号を要求する。
ストレージ管理サーバ106は、要求を受けると、受信したターゲットアドレスと一致するエントリをターゲットアドレス管理テーブル134から選択する。ストレージ管理サーバ106は、選択したエントリのIPアドレス502及びポート番号503をアーカイブサーバ103へ送信する。
アーカイブサーバ103は、受信したIPアドレス502及びポート番号503を使って、ターゲットへアクセスする。そして、ステップ803で作成したLUへアクセスする。アーカイブサーバ103は、アーカイブ対象データからアーカイブデータを作成し、作成したアーカイブデータをアクセスしたLUに格納する(804)。
次に、アーカイブサーバ103は、データ格納LUの情報を、検索タスク管理サーバ105に送信する。データ格納LUの情報は、格納されたアーカイブデータのアーカイブデータ名、格納したLUのLUN及び格納したLUを割り当てたターゲットのアドレスである。検索タスク管理サーバ105は、受信したデータ格納LUの情報を、アーカイブデータ管理テーブル130に格納する(805)。具体的には、検索タスク管理サーバ105は、受信したデータ格納LUの情報から、アーカイブデータ名、ターゲットのアドレス及びLUNを抽出する。そして、検索タスク管理サーバ105は、アーカイブデータ管理テーブル130に新たなエントリを作成し、抽出したアーカイブデータ名をアーカイブデータ名301に格納し、抽出したターゲットのアドレスをデータ格納ターゲットアドレス302に格納し、抽出したLUNをLUN303に格納する。
そして、検索タスク管理サーバ105は、格納完了通知をアーカイブサーバ103に送信する。
アーカイブサーバ103は、格納完了通知を受信すると、アーカイブ作成要求を受けたユーザに対し、アーカイブ作成完了通知を送信する(806)。そして、アーカイブサーバ103は、アーカイブ作成完了通知を受信すると、アーカイブプログラム120を終了する。
以上のように、アーカイブサーバ103は、アーカイブ作成要求を受けると、アーカイブデータを作成し、ストレージ104に格納する。
図9は、本発明の第1の実施の形態の検索処理のフローチャートである。
検索クライアント101が検索タスク管理サーバ105に検索タスクを送信すると、データアーカイブシステムは、検索処理を開始する。検索タスクには、検索対象データのアーカイブデータ名及び検索条件が含まれている。
検索タスク管理サーバ105は、検索タスクを受信すると、検索タスクの内容を、検索タスク管理テーブル128に格納する(901)。
具体的には、検索タスク管理サーバ105は、検索タスクのアーカイブデータ名を処理対象データ402に格納し、検索タスクの検索条件を処理内容403に格納する。次に、検索タスク管理サーバ105は、検索タスクを受信した時間などを利用して、検索タスクの名前を命名する。例えば、検索タスク管理サーバ105は、検索タスクを受信した時間を利用して、「タスク−2004/07/01−13:02:11」のように名前を命名する。検索タスク管理サーバ105は、命名した検索タスクの名前を検索タスク名401に格納する。
次に、検索タスク管理サーバ105は、受信した検索タスクのアーカイブデータ名とアーカイブデータ名301とが一致するエントリを、アーカイブデータ管理テーブル130から選択する。検索タスク管理サーバ105は、選択したエントリのデータ格納ターゲットアドレス302及びLUN303からデータを抽出する。そして、検索タスク管理サーバ105は、抽出したデータを検索タスク管理テーブル128に格納する。具体的には、抽出したデータ格納ターゲットアドレスをターゲットアドレス404に格納し、抽出したLUNをLUN405に格納する。なお、検索タスク管理サーバ105は、抽出したLUNの値が複数あるときには、抽出したLUNの数のエントリをLUN405に作成し、一つのエントリに一つの抽出したLUNの値を格納する。
次に、検索タスク管理サーバ105は、「未処理」のステータス情報を検索処理状況406に格納する。なお、検索タスク管理サーバ105は、受信した検索タスクに対応するエントリが複数ある場合には、すべての検索処理状況に「未処理」を格納する。
以上のようにして、検索タスク管理サーバ105は、受信した検索タスクの内容を検索タスク管理テーブル128に格納する。
次に、検索タスク管理サーバ105は、図10で詳細を説明する検索タスク分散処理を行う(902)。
次に、ストレージ管理サーバ106は、図11で詳細を説明する割り当てLU指定処理を行う(903)。なお、割り当てLU指定処理において、ストレージ管理サーバ106は、検索サーバ102にマウント要求を送信する。
検索サーバ102は、マウント要求を受信すると、マウント要求に含まれる情報を用いて、検索対象アーカイブデータが格納されたLUをマウントする。SAN108がFC−SANであると、マウント要求には、ターゲットアドレス及びLUNが含まれる。また、SAN108がIP−SANであると、マウント要求には、ターゲットアドレス、LUN、ターゲットのIPアドレス及びTCPポート番号が含まれる。
ここで、マウントとは、ディスクドライブと計算機との間をソフトウェア的に接続して、計算機がディスクドライブへアクセス可能にすることである。本実施の形態では、計算機が検索サーバ102であり、ディスクドライブがストレージ104である。
検索サーバ102は、マウントが完了すると、マウント完了通知を検索タスク管理サーバ105に送信する(904)。なお、マウント完了通知には、マウントしたLUのターゲットアドレス及びLUNが含まれる。
検索タスク管理サーバ105は、マウント完了通知を受信すると、そのマウント完了通知を送信した検索サーバ102に対し、検索条件を送信する(905)。具体的には、検索タスク管理サーバ105は、マウント完了通知に含まれるターゲットアドレス及びLUNとターゲットアドレス404及びLUN405とが一致するエントリを検索タスク管理テーブル128から選択する。検索タスク管理サーバ105は、選択したエントリの処理内容403を抽出する。そして、検索タスク管理サーバ105は、マウント完了通知を送信した検索サーバ102に対し、抽出した処理内容403を検索条件として送信する。
検索サーバ102は、検索条件を受信すると、検索条件を満たすアーカイブデータをステップ904でマウントされたLUから検索する(906)。
検索サーバ102は、検索が終了したら、検索結果を検索タスク管理サーバ105に送信する(907)。検索結果は、例えば、検索条件を満たすファイルのファイル名である。
検索タスク管理サーバ105は、検索結果を受信すると、検索タスク管理テーブル128を更新する(908)。具体的には、検索タスク管理サーバ105は、検索タスク管理テーブル128のタスク割り当てサーバ407から、検索結果を送信した検索サーバ102のサーバ名を削除する。更に、検索タスク管理サーバ105は、タスク割り当てサーバ407からサーバ名を削除したエントリの検索処理状況406を、「タスク処理中」から「処理済」へ変更する。
次に、検索タスク管理サーバ105は、検索処理が完了していないLUが存在するか否かを判定する(909)。具体的には、検索タスク管理サーバ105は、検索タスク管理テーブル128の検索処理状況406に「未処理」が格納されているか否かを判定する。
未処理のLUが存在すると、ステップ902に戻り、検索処理が繰り返される。
一方、未処理のLUが存在しないと、検索タスク管理サーバ105は、ステップ907で受信した検索結果を、検索クライアント101に送信する(911)。
そして、検索タスク管理サーバ105は、検索結果を送信した検索タスクに対応するエントリを、検索タスク管理テーブル128から削除し(912)、検索処理を終了する。
以上のようにして、本実施の形態のデータアーカイブシステムは、アーカイブデータを迅速且つ効率よく検索することができる。
図10は、本発明の第1の実施の形態の検索タスク分散処理のフローチャートであり、検索タスク管理サーバ105によって実行される。
検索タスク管理サーバ105は、すべての検索サーバ102のCPU負荷203をCPU負荷管理テーブル127から抽出する(1001)。
次に、検索タスク割り当て条件を満たす検索サーバ102を特定する(1002)。ここで、検索タスク割り当て条件とは、当該データアーカイブシステムの管理者が設定したCPU負荷の閾値等である。例えば、検索タスク割り当て条件は、「CPU負荷が50%以下の検索サーバに対して、検索タスクを割り当てる」等である。
次に、検索タスク割り当て条件を満たした検索サーバ102の中から、CPU負荷203が最も小さい検索サーバ102を選択する。なお、選択した検索サーバ102を、タスク割り当て検索サーバ102と呼ぶ。ただし、検索タスク割り当て条件を満たす検索サーバ102が存在しないと、条件を満たす検索サーバ102が現れるまで、ステップ1002の処理で待機する。
次に、タスク割り当て検索サーバ102に検索処理させるLU(処理対象LU)を選択する(1003)。具体的には、検索タスク管理テーブル128から、検索処理状況406が「未処理」のうち最も上段のエントリを選択する。そして、選択したエントリのLUを、処理対象LUとする。
次に、タスク割り当て検索サーバ102のサーバ名、処理対象LUのターゲットアドレス404及び処理対象LUのLUN405を、ストレージ管理サーバ132に通知する(1004)。
次に、検索タスク管理テーブル128を更新する(1005)。具体的には、処理対象LUに対応するエントリを検索タスク管理テーブル128から選択する。タスク割り当て検索サーバ102のサーバ名を、選択したエントリのタスク割り当てサーバ407に格納する。更に、選択したエントリの検索状況406を、「未処理」から「タスク処理中」に変更する。
次に、処理対象LUが他に存在するか否かを判定する(1006)。具体的には、検索タスク管理テーブル128の検索処理状況406に、「未処理」が格納されているエントリがあるか否かを判定する。
処理対象LUが他に存在しないと、検索タスク分散処理を終了する。
一方、処理対象LUが他に存在すると、検索タスク割り当て条件を満たす他の検索サーバ102が存在するか否かを判定する(1007)。
他の検索サーバ102が存在しないと、検索タスク分散処理を終了する。
一方、他の検索サーバ102が存在すると、ステップ1002に戻り、検索タスク分散処理を繰り返す。
なお、この繰り返し処理は、回数が制限されていてもよい。なぜなら、回数が制限されていないと、検索タスク割り当て条件を満たす検索サーバが存在する限り、次々とその検索サーバに処理対象LUが割り当てられる。従って、検索クライアント101が新たな検索タスクを発行した際、以前に発行された検索タスクが終了するまで、検索タスク割り当て条件を満たす検索サーバが存在しないので、新しい検索タスクが実行されなくなるからである。
以上のように、検索タスク管理サーバ105は、CPU負荷管理テーブル127を参照し、CPU負荷の低い検索サーバ102を選択するので、検索サーバ102に検索タスクを効率よく実行させることができる。
図11は、本発明の第1の実施の形態のストレージ管理サーバ106が行う割り当てLU指定処理のフローチャートである。
ストレージ管理サーバ106は、検索タスク分散処理(図10)のステップ1004で検索タスク管理サーバ105から通知を受けると、割り当てLU指定処理を開始する。
まず、ストレージ管理サーバ106は、処理対象のLUにアクセスするターゲットのIPアドレス及びTCPポート番号を、ターゲットアドレス管理テーブル134から抽出する(1101)。具体的には、ストレージ管理サーバ106は、検索タスク分散処理のステップ1004で通知されたターゲットアドレス404とターゲットアドレス501とが一致するエントリを、ターゲットアドレス管理テーブル134から選択する。ストレージ管理サーバ106は、選択したエントリのIPアドレス502及びポート番号503を抽出する。
なお、SAN108がFC−SANである場合、ステップ1101は省略することができる。なぜなら、タスク割り当て検索サーバ102は、ターゲットのターゲットアドレス(WWN)及び処理対象LUのLUNの情報のみで、処理対象LUをマウントできるからである。
次に、ストレージ管理サーバ106は、タスク割り当て検索サーバ102に対して、マウント要求を送信する(1102)。マウント要求には、処理対象LUにアクセスするターゲットのアドレス、IPアドレス、TCPポート番号及び処理対象LUのLUNが含まれる。なお、マウント要求のターゲットアドレスは、検索タスク分散処理で通知されたターゲットアドレス404であり、マウント要求のIPアドレスは、抽出したIPアドレス502であり、マウント要求のTCPポート番号は、抽出したポート番号503であり、マウント要求のLUNは、検索タスク分散処理で通知されたLUN405である。
(第2の実施の形態)
本発明の第2の実施の形態のデータアーカイブシステムは、複数のアーカイブサーバが備わる。更に、異なる機能の検索プログラムが検索サーバに備わる。
また、第2の実施の形態のデータアーカイブシステムは、第1の実施の形態と同一の構成とし、1台のアーカイブサーバ103が複数のアーカイブプログラム120を有する構成としてもよい。第2の実施の形態のデータアーカイブシステムの処理は、後述する点を除き、第1の実施の形態のデータアーカイブシステムと同一なので説明は省略する。
多くのアーカイブプログラム120は、アーカイブデータを作成する際に、元のデータを圧縮する。アーカイブプログラム120の種類によってデータ圧縮方法が異なり、独自の圧縮方法を採用しているアーカイブプログラムもある。また、検索サーバ102は、圧縮方法に対応したアーカイブデータしか検索することはできない。
したがって、複数のアーカイブプログラム120が、異なる圧縮方式でアーカイブデータを作成するデータアーカイブシステムでは、一つの検索サーバ102がすべてのアーカイブデータを検索することはできない。このような場合に、第1の実施の形態のデータアーカイブシステムでは、アーカイブデータを検索できなかった。
この問題に対応するため、第2の実施の形態では、アーカイブデータを作成したアーカイブプログラム名を、アーカイブデータ管理テーブル130に格納する。また、検索タスク管理サーバ105は、検索プログラムの対応情報格納テーブルをメモリ123に記憶する。検索プログラムの対応情報格納テーブルは、検索サーバにがアーカイブプログラム120に対応するか否かを示す。
図12は、本発明の第2の実施の形態の検索タスク管理サーバ105に記憶されているアーカイブデータ管理テーブル130の構成図である。
第2の実施の形態のアーカイブデータ管理テーブル130は、アーカイブデータ名301、作成プログラム304、データ格納ターゲットアドレス302、LUN303から構成される。なお、アーカイブデータ名301、データ格納ターゲットアドレス302及びLUN303は、第1の実施の形態のアーカイブデータ管理テーブル(図3)内の構成と同一であるので、説明は省略する。
作成プログラム304は、当該エントリのアーカイブデータを作成したアーカイブプログラム120のプログラム名である。
また、第2の実施の形態では、アーカイブ処理(図8)のステップ805が異なる。検索タスク管理サーバ105は、データ格納LUの情報と共に、ステップ804でアーカイブデータを作成したアーカイブプログラム120の名称も、アーカイブデータ管理テーブル130に格納する(805)。
図13は、本発明の第2の実施の形態の検索タスク管理サーバ105が記憶する検索プログラムの対応情報格納テーブルの構成図である。
検索プログラムの対応情報格納テーブルは、検索サーバ1301及び対応プログラム1302から構成される。
検索サーバ1301は、当該エントリの検索サーバ102の一意な識別子である。対応プログラム1302は、当該エントリの検索サーバ102が対応するアーカイブプログラム120の名称である。検索プログラムの対応情報格納テーブルは、データアーカイブシステムの管理者によって入力される。
なお、検索プログラムの対応情報格納テーブルは、CPU負荷管理テーブル127に、対応プログラム1302を格納する構成としてもよい。
第2の実施の形態のデータアーカイブシステムでは、検索タスク分散処理(図10)のステップ1002における検索タスク割り当て条件に、作成したアーカイブプログラム120に対応という条件を追加する。
ここで、第2の実施の形態の検索タスク分散処理(図10)のステップ1002の処理について説明する。
検索タスク管理サーバ105は、検索タスク割り当て条件を満たす検索サーバ102を特定する(1002)。
具体的には、まず、検索タスク管理サーバ105は、アーカイブデータ管理テーブル130から、検索するアーカイブデータ120に対応するエントリの作成プログラム304を抽出する。次に、検索タスク管理サーバ105は、検索プログラムの対象情報格納テーブルから、抽出した作成プログラム304と対応プログラム1302とが一致する検索サーバ1301をすべて抽出する。
そして、検索タスク管理サーバ105は、抽出した検索サーバ1301から、その他の検索タスク割り当て条件(例えば、CPU負荷の閾値)を満たすを検索サーバ102を特定する。
以降の処理は、検索タスク分散処理(図10)のステップ1003以降と同一である。
以上のように、第2の実施の形態のデータアーカイブシステムは、異なる種類のアーカイブプログラム120でアーカイブデータを作成しても、アーカイブプログラム120に対応した検索サーバ102を自動的に割り当てることができる。
本発明は、ストレージにデータを格納するデータアーカイブシステムに適用することができ、大量のデータをストレージの複数のLUに跨って格納するシステムに適用すると好適である。
本発明の第1の実施の形態のデータアーカイブシステムのブロック図である。 本発明の第1の実施の形態の検索タスク管理サーバが記憶するCPU負荷管理テーブルの構成図である。 本発明の第1の実施の形態の検索タスク管理サーバが記憶するアーカイブデータ管理テーブルの構成図である。 本発明の第1の実施の形態の検索タスク管理サーバが記憶する検索タスク管理テーブルの構成図である。 本発明の第1の実施の形態のストレージ管理サーバが記憶するターゲットアドレス管理テーブルの構成図である。 本発明の第1の実施の形態のストレージ管理サーバが記憶するストレージ容量管理テーブルの構成図である。 本発明の第1の実施の形態の検索タスク管理サーバがCPU負荷監視プログラムを実行する処理のフローチャートである。 本発明の第1の実施の形態のデータアーカイブシステムが行うアーカイブ処理のフローチャートである。 本発明の第1の実施の形態のデータアーカイブシステムが行う検索処理のフローチャートである。 本発明の第1の実施の形態の検索タスク管理サーバが行う検索タスク分散処理のフローチャートである。 本発明の第1の実施の形態のストレージ管理サーバが行う割り当てLU指定処理のフローチャートである。 本発明の第2の実施の形態の検索タスク管理サーバに記憶されているアーカイブデータ管理テーブルの構成図である。 本発明の第2の実施の形態の検索タスク管理サーバが記憶する検索プログラムの対応情報格納テーブルの構成図である。
符号の説明
101 検索クライアント
102 検索サーバ
103 アーカイブサーバ
104 ストレージ
105 検索タスク管理サーバ
106 ストレージ管理サーバ
107 LAN
108 SAN
109 管理用ネットワーク

Claims (10)

  1. データを格納する複数のボリュームを有するストレージ装置と、
    前記ストレージ装置に格納されているデータを検索する検索タスクを処理する複数の検索サーバと、
    前記検索サーバを管理する管理サーバと、を備えるデータアーカイブシステムにおいて、
    前記管理サーバは、
    前記ボリュームに格納されているデータを管理する管理情報を保持し、
    前記検索サーバの負荷情報を取得し、
    前記取得した負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択し、
    前記管理情報に基づいて、前記検索タスクによる検索対象データが格納されている前記ボリュームを特定し、
    前記選択された検索サーバに、前記特定されたボリュームを通知し、
    前記選択された検索サーバは、前記通知されたボリュームに対して、前記検索タスクを処理することを特徴とするデータアーカイブシステム。
  2. 前記管理サーバは、前記検索対象データが複数の前記ボリュームに跨って格納されている場合は、前記検索対象データが格納されるボリュームに対して、前記検索タスクを処理する前記検索サーバを選択することを特徴とする請求項1に記載のデータアーカイブシステム。
  3. 前記管理情報には、前記ストレージ装置に格納されたデータ名と、該データが格納されたボリュームの情報と、を対応づけて格納されることを特徴とする請求項1に記載のデータアーカイブシステム。
  4. さらに、前記ボリュームにデータを格納し、該データのデータ名及び該データが格納された前記ボリュームの情報を前記管理情報に格納するアーカイブサーバを備えることを特徴とする請求項1に記載のデータアーカイブシステム。
  5. さらに、前記ボリュームにデータを格納し、該データのデータ名、データ特性及び該データを格納した前記ボリュームのアドレス情報を前記管理情報に格納するアーカイブサーバを備え、
    前記管理サーバは、前記負荷情報及び前記管理情報に基づいて、前記検索タスクを処理する前記検索サーバを選択することを特徴とする請求項1に記載のデータアーカイブシステム。
  6. データを格納する複数のボリュームを有するストレージ装置と、
    前記ストレージ装置に格納されているデータを検索する検索タスクを処理する複数の検索サーバと、
    前記検索サーバを管理する管理サーバと、を備えるデータアーカイブシステムにおけるデータ検索方法であって、
    前記管理サーバは、
    前記ボリュームに格納されているデータを管理する管理情報を保持し、
    前記検索サーバの負荷情報を取得し、
    前記取得した負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択し、
    前記管理情報に基づいて、前記検索タスクによる検索対象データが格納されている前記ボリュームを特定し、
    前記選択された検索サーバに、前記特定されたボリュームを通知し、
    前記選択された検索サーバは、前記通知されたボリュームに対して、前記検索タスクを処理することを特徴とするデータ検索方法。
  7. 前記管理サーバは、前記検索対象データが複数の前記ボリュームに跨って格納されている場合は、前記検索対象データが格納されるボリュームに対して、前記検索タスクを処理する前記検索サーバを選択することを特徴とする請求項6に記載のデータ検索方法。
  8. 前記管理情報には、前記ボリュームに格納されるデータのデータ名と、該データを記憶したボリュームの情報と、が対応づけて格納されることを特徴とする請求項6に記載のデータ検索方法。
  9. CPUと、インタフェースと、メモリを備え、
    複数のボリュームを有するストレージ装置に記憶されたデータを検索する検索タスクを処理する複数の検索サーバを管理する管理サーバにおいて、
    前記ボリュームに格納されているデータを管理する管理情報を保持し、
    前記検索サーバの負荷情報を取得し、
    前記取得した負荷情報に基づいて、前記検索タスクを処理する前記検索サーバを選択し、
    前記管理情報に基づいて、前記検索タスクによる検索対象データが格納されている前記ボリュームを特定し、
    前記選択された検索サーバに、前記指定されたボリュームを通知することを特徴とする管理サーバ。
  10. 前記管理サーバは、前記検索対象データが複数の前記ボリュームに跨って格納されている場合は、前記検索対象データが格納されるボリュームに対して、前記検索タスクを処理する前記検索サーバを選択することを特徴とする請求項9に記載の管理サーバ。
JP2004286331A 2004-09-30 2004-09-30 データアーカイブシステム、データ検索方法及び管理サーバ Pending JP2006099542A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004286331A JP2006099542A (ja) 2004-09-30 2004-09-30 データアーカイブシステム、データ検索方法及び管理サーバ
US10/995,414 US20060074918A1 (en) 2004-09-30 2004-11-24 Method and accelerating data search for data archive system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004286331A JP2006099542A (ja) 2004-09-30 2004-09-30 データアーカイブシステム、データ検索方法及び管理サーバ

Publications (1)

Publication Number Publication Date
JP2006099542A true JP2006099542A (ja) 2006-04-13

Family

ID=36126840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004286331A Pending JP2006099542A (ja) 2004-09-30 2004-09-30 データアーカイブシステム、データ検索方法及び管理サーバ

Country Status (2)

Country Link
US (1) US20060074918A1 (ja)
JP (1) JP2006099542A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017163393A1 (ja) * 2016-03-25 2017-09-28 株式会社日立製作所 データ処理システム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840755B2 (en) * 2005-05-24 2010-11-23 Lsi Corporation Methods and systems for automatically identifying a modification to a storage array
US9311398B2 (en) * 2005-11-15 2016-04-12 Ebay Inc. Method and system to process navigation information
JP5463738B2 (ja) * 2008-09-22 2014-04-09 沖電気工業株式会社 無線通信システム、アクセスポイント、コントローラ、ネットワーク管理装置及びアクセスポイントのネットワーク識別子設定方法
JP5582344B2 (ja) * 2010-08-09 2014-09-03 日本電気株式会社 接続管理システム、及びシンクライアントシステムにおける接続管理サーバの連携方法
GB2504738A (en) * 2012-08-08 2014-02-12 Basis Technologies Internat Ltd SAP (RTM) system with partitioning of data in SAP memory into data intervals
GB2504812B (en) * 2012-08-08 2015-06-03 Basis Technologies Internat Ltd Load balancing in a data processing system
US11934678B2 (en) * 2022-07-22 2024-03-19 Hewlett Packard Enterprise Development Lp Data reduction for storage volumes

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728836A (ja) * 1993-06-24 1995-01-31 Hitachi Ltd データベース検索方法及びこの方法を用いたデータベースシステム
JPH09134364A (ja) * 1995-11-08 1997-05-20 Fujitsu Ltd 情報検索システム
JPH10154160A (ja) * 1996-09-25 1998-06-09 Sharp Corp 並列データ検索処理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4310883A (en) * 1978-02-13 1982-01-12 International Business Machines Corporation Method and apparatus for assigning data sets to virtual volumes in a mass store
US5692174A (en) * 1995-10-05 1997-11-25 International Business Machines Corporation Query parallelism in a shared data DBMS system
US6594662B1 (en) * 1998-07-01 2003-07-15 Netshadow, Inc. Method and system for gathering information resident on global computer networks
US6389432B1 (en) * 1999-04-05 2002-05-14 Auspex Systems, Inc. Intelligent virtual volume access
JP2003532195A (ja) * 2000-04-27 2003-10-28 ウエブフイート・インコーポレイテツド 複数の別個のデータベースからサーチ結果を検索する方法およびシステム
US7092977B2 (en) * 2001-08-31 2006-08-15 Arkivio, Inc. Techniques for storing data based upon storage policies

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728836A (ja) * 1993-06-24 1995-01-31 Hitachi Ltd データベース検索方法及びこの方法を用いたデータベースシステム
JPH09134364A (ja) * 1995-11-08 1997-05-20 Fujitsu Ltd 情報検索システム
JPH10154160A (ja) * 1996-09-25 1998-06-09 Sharp Corp 並列データ検索処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017163393A1 (ja) * 2016-03-25 2017-09-28 株式会社日立製作所 データ処理システム
JPWO2017163393A1 (ja) * 2016-03-25 2018-06-28 株式会社日立製作所 データ処理システム

Also Published As

Publication number Publication date
US20060074918A1 (en) 2006-04-06

Similar Documents

Publication Publication Date Title
JP6199452B2 (ja) ストレージ・オブジェクトとして論理ボリュームをエクスポートするデータ・ストレージ・システム
JP6219420B2 (ja) 入力/出力オペレーションのためにオブジェクト・ストレージ・システムを構成すること
US9614912B2 (en) System and method of implementing an object storage infrastructure for cloud-based services
US7680847B2 (en) Method for rebalancing free disk space among network storages virtualized into a single file system view
KR100974149B1 (ko) 네임스페이스에 대한 정보 유지 방법, 시스템 및 컴퓨터 판독가능 저장 매체
JP5933716B2 (ja) オブジェクト・ストレージ・システムにアクセスするコンピュータ・システム
US8078819B2 (en) Arrangements for managing metadata of an integrated logical unit including differing types of storage media
JP4687382B2 (ja) ストレージシステムにおけるウイルスチェック方法
JP4764701B2 (ja) ログ情報を管理する計算機システム及びログ情報の管理方法
US20060095705A1 (en) Systems and methods for data storage management
JP4699768B2 (ja) アクセス負荷を分散するストレージシステム
US20040078465A1 (en) Methods and apparatus for load balancing storage nodes in a distributed stroage area network system
EP1942421A1 (en) Data management system and data management method
US7809739B2 (en) Application configuration in distributed storage systems
JP4285058B2 (ja) ネットワーク管理プログラム、管理計算機及び管理方法
EP2306293A2 (en) Methods and apparatus for managing virtual ports and logical units on storage systems
JP2014531068A (ja) データ・ストレージ・システムおよびデータ・ストレージ・コントロール方法
US20100115223A1 (en) Storage Area Allocation Method and a Management Server
JP2005228278A (ja) 記憶領域の管理方法、管理装置及び管理プログラム
JP2005190057A (ja) ディスクアレイ装置及びディスクアレイ装置のリモートコピー制御方法
JP2006099542A (ja) データアーカイブシステム、データ検索方法及び管理サーバ
US7516133B2 (en) Method and apparatus for file replication with a common format
CN115495431A (zh) 存储访问数据的方法、装置、设备和存储介质
KR20120045239A (ko) 메타 데이터 서버, 서비스 서버, 비대칭 분산 파일 시스템 및 그 운용 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406