JP2001147886A - Device and method for sharing disk time - Google Patents

Device and method for sharing disk time

Info

Publication number
JP2001147886A
JP2001147886A JP32909599A JP32909599A JP2001147886A JP 2001147886 A JP2001147886 A JP 2001147886A JP 32909599 A JP32909599 A JP 32909599A JP 32909599 A JP32909599 A JP 32909599A JP 2001147886 A JP2001147886 A JP 2001147886A
Authority
JP
Japan
Prior art keywords
input
time
output
disk
quantum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP32909599A
Other languages
Japanese (ja)
Other versions
JP4091225B2 (en
Inventor
Yuji Hotta
勇次 堀田
Riichiro Take
理一郎 武
Tadashi Kato
匡史 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP32909599A priority Critical patent/JP4091225B2/en
Publication of JP2001147886A publication Critical patent/JP2001147886A/en
Application granted granted Critical
Publication of JP4091225B2 publication Critical patent/JP4091225B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To automatically adjust the operation condition of time sharing fulfilling requested performance based on an achievement value. SOLUTION: An input and output schedule mechanism 20 defines the rate of a time for allowing each input and output group obtained by grouping the sources of input and output to a disk device 16 to use a disk, and decides an assignment time (quantum) for allowing each input and output group to continuously use the disk device based on the defined time rate, and operates time sharing for allowing the competing input and output groups to use the disk device by sequentially switching the assignment time at the time of receiving a request for the input and output from a plurality of input and output groups to the disk device. A tuning part 52 automatically adjusts the operation condition of the time sharing according to the requested performance and the achievements.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数の入出力に基
づいてディスク装置の使用をスケジューリングするディ
スク・タイムシェアリング装置及び方法に関し、特に、
競合する入出力に対し割当て時間を順番に切替えるよう
にディスク装置の使用をスケジューリングするディスク
・タイムシェアリング装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a disk time sharing apparatus and method for scheduling the use of a disk drive based on a plurality of inputs and outputs.
The present invention relates to a disk time sharing apparatus and a method for scheduling the use of a disk apparatus so as to sequentially change an allocation time for competing input / output.

【0002】[0002]

【従来の技術】従来、ハードディスクドライブ等のディ
スク装置を使用してデータを管理するストレージシステ
ムにあっては、例えばディクス装置をRAID構成の装
置とし、このRAID装置をディスク制御装置の配下に
接続して上位のホストからの入出力を処理したり、直
接、サーバにRAID装置を接続し、サーバOSからの
入出力を処理するようにしている。
2. Description of the Related Art Conventionally, in a storage system that manages data using a disk device such as a hard disk drive, for example, a disk device is a device having a RAID configuration, and this RAID device is connected under a disk control device. To process input / output from a host at a higher level, or directly connect a RAID device to a server to process input / output from a server OS.

【0003】このようなストレージシステムにあって
は、同一のディスク装置に対して、応答時間の保証が要
求されるランダムアクセスと、単位時間当たりの処理量
が重視されるシーケンシャルアクセスを行う必要がある
場合、ランダムアクセスとシーケンシャルアクセスが競
合しないように、時間帯を分けた運用を行っている。例
えば、昼間は、ディスク装置のデータベースに対してラ
ンダムアクセス中心のOLTP業務(On Line Transact
ion Processing)を行い、業務終了後の夜間にデータベ
ースのバックアップを行っている。
In such a storage system, it is necessary to perform random access for which the response time is required to be guaranteed and sequential access in which the processing amount per unit time is emphasized for the same disk device. In this case, operation is performed in different time zones so that random access and sequential access do not conflict with each other. For example, in the daytime, random access-oriented OLTP operations (On Line Transact
ion processing) and back up the database at night after the work is over.

【0004】[0004]

【発明が解決しようとする課題】1.ランダムアクセス
とシーケンシャルアクセスの資源配分 しかしながら、このようなストレージシステムにあって
は、業務の無停止化に伴い、夜間といえどもランダムア
クセス系のOLTP業務を継続する必要が出てきたた
め、ランダムアクセス系のOLTP業務中にシーケンシ
ャルアクセスであるバックアップの実行が必要となって
きている。
[Problems to be Solved by the Invention] However, in such a storage system, it is necessary to continue the random access OLTP business even at night due to the non-stop operation of the storage system. It is necessary to execute a backup that is a sequential access during the OLTP business.

【0005】ランダムアクセスのみの場合は、ある平均
応答時間、例えば30msを満たせる単位時間当りの入出
力回数であるIOPS(Input Output Per Second )、
例えば100IOPSを見積もることができる。シーケンシ
ャルアクセスのみの場合は、例えば20MB/sといっ
たスループットを見積もることができる。
In the case of only random access, IOPS (Input Output Per Second), which is the number of input / output operations per unit time, which can satisfy a certain average response time, for example, 30 ms,
For example, 100 IOPS can be estimated. In the case of only sequential access, a throughput of, for example, 20 MB / s can be estimated.

【0006】ところが、ランダムアクセスとシーケンシ
ャルアクセスを同時に行った場合は、受け付けた入出力
を要求をFIFOを用いたキューで処理するため、ラン
ダムアクセスがディスク装置を使用できる時間およびシ
ーケンシャルアクセスがディスク装置を使用できる時間
を保証する仕組みがない。
However, when random access and sequential access are performed simultaneously, the received I / O is processed in a queue using a FIFO, so that the time required for the random access to use the disk device and the time required for the sequential access to the disk device are reduced. There is no mechanism to guarantee usable time.

【0007】例えば、平均応答時間30msで50IOPS
のランダムアクセスと、5MB/sのシーケンシャルア
クセスが欲しい場合でも、シーケンシャルアクセスが頻
繁に発生するとシーケンシャルアクセスのスループット
は、上がる必要はないのであるが、5MB/sから10
MB/sに上がる。逆にランダムアクセスで平均応答時
間30msを満たすIOPSは、低下させたくはないにもか
かわらず、50IOPSから25IOPSに低下する。 2.論理ボリューム間の資源配分 また従来のストレージシステムは、性能要件の異なるデ
ータは異なるディスク装置に配置することで、それぞれ
の性能特性を引き出している。例えば、小量データのラ
ンダムアクセスで応答時間の保証が要求されるデータ
と、大量データのシーケンシャルアクセスで単位時間当
たりの処理量が重視されるデータは、異なるディスク装
置に配置している。
For example, 50 IOPS with an average response time of 30 ms
Even if random access and 5 MB / s sequential access are desired, if sequential access frequently occurs, the sequential access throughput does not need to be increased, but from 5 MB / s to 10 MB / s.
It goes up to MB / s. Conversely, the IOPS satisfying the average response time of 30 ms by random access decreases from 50 IOPS to 25 IOPS, although it is not desired to reduce it. 2. Resource Allocation Between Logical Volumes In a conventional storage system, data having different performance requirements is allocated to different disk devices to derive their respective performance characteristics. For example, data for which a response time is required to be guaranteed by random access of a small amount of data and data in which a processing amount per unit time is emphasized in a sequential access of a large amount of data are arranged in different disk devices.

【0008】ところが、ディスク装置の大容量化に伴
い、異なる性能要件のデータを同一ディスク装置に配置
するケースが増えてきている。このように異なる性能要
件の論理ボリュームを同一ディスクに配置した場合も同
様の問題が生じる。従来は、受け付けた入出力をFIF
Oでスケジュールして論理ボリューム間のディスク資源
分配を制御する仕組みがない。このため、ある論理ボリ
ュームへの入出力が頻繁に発生すると、他の論理ボリュ
ームへの入出力性能が低下する。
However, with the increase in the capacity of disk devices, the number of cases where data having different performance requirements are arranged on the same disk device has been increasing. Similar problems occur when logical volumes having different performance requirements are arranged on the same disk. Conventionally, input / output
There is no mechanism for controlling disk resource distribution between logical volumes by scheduling in O. Therefore, if input / output to a certain logical volume frequently occurs, input / output performance to another logical volume is reduced.

【0009】例えば、10IOPSを保証して欲しいボリュ
ームAと、50IOPSを保証して欲しいボリュームBを同
一ディスクに配置した場合、ボリュームAへのアクセス
が頻繁に発生するとボリュームAのIOPSは、上がる必要
はないにもかかわらず、10IOPSから20IOPSに上が
る。逆にボリュームBのIOPSは、低下させたくはないに
もかかわらず、50IOPSから40IOPSへと低下する。 3.通常処理とバックアップ/コピー処理間の資源配分 従来のストレージシステムで、同一ディスク装置上に複
数の論理ボリュームが存在し、個々の論理ボリューム単
位でバックアップやコピーを行う場合を考える。従来
は、バックアップ/コピー処理による通常の入出力への
影響を抑えるため、バックアップ/コピー処理のペース
(インターバル)を、バックアップ/コピー処理の実行
時に設定する手法を採っている。
For example, if a volume A for which 10 IOPS is to be guaranteed and a volume B for which 50 IOPS are to be guaranteed are arranged on the same disk, if access to volume A occurs frequently, the IOPS of volume A need not be increased. Despite none, it goes up from 10 IOPS to 20 IOPS. Conversely, the IOPS of volume B drops from 50 IOPS to 40 IOPS, although we do not want to do so. 3. Resource Allocation Between Normal Processing and Backup / Copy Processing In a conventional storage system, a case is considered in which a plurality of logical volumes exist on the same disk device and backup and copy are performed in units of individual logical volumes. Conventionally, in order to suppress the influence of the backup / copy processing on normal input / output, a method of setting the pace (interval) of the backup / copy processing at the time of executing the backup / copy processing is adopted.

【0010】ところが、ボリュームAをコピー中に、ボ
リュームAと同じディスク装置上のボリュームBに対し
てコピーを実行すると、同時に2多重のコピー処理が同
一のディスク装置上で動作するため、通常の入出力への
影響は2倍になる。 4.通常処理とリビルディング間の資源配分 RAID装置では、複数のディスクドライブでデータを
冗長化させることにより、1つのディスクドライブに障
害が発生しても残りのディスクドライブからデータを復
旧することができる。このため、RAID装置では、デ
ィスクドライブに障害が発生しても、通常の入出力を継
続することができる。
However, if copying is performed to volume B on the same disk device as volume A while copying volume A, two multiplex copy processes operate on the same disk device at the same time. The effect on the output is doubled. 4. Resource allocation between normal processing and rebuilding In a RAID device, data is made redundant by a plurality of disk drives, so that even if a failure occurs in one disk drive, data can be recovered from the remaining disk drives. For this reason, the RAID device can continue normal input / output even if a failure occurs in the disk drive.

【0011】また、交換されたディスクドライブに対し
て、残りのディスクドライブからデータの復旧が行われ
る。この復旧処理のことをリビルディング(Rebuilding)
と呼ぶ。リビルディングは、RAID装置を構成するデ
ィスクドライブに対する入出力処理を伴うため、同一の
ディスクドライブを通常の入出力と奪い合うことにな
る。
[0011] Further, data recovery is performed on the replaced disk drive from the remaining disk drives. This recovery process is called Rebuilding
Call. Since the rebuilding involves input / output processing for the disk drives constituting the RAID device, the same disk drive competes with normal input / output.

【0012】このため、リビルディングにより通常の入
出力の性能は低下する。例えば、ミラー構成をとるRA
ID1の場合、リビルディングは、ディスクドライブの
障害により1台になったディスクドライブから交換され
た新しいディスクドライブへデータをコピーする処理で
あり、コピー元のディスクドライブに対しリード入出力
が発生する。このリード入出力が通常の入出力を待たせ
ることになり、通常の入出力の性能が低下する。
For this reason, the normal input / output performance is reduced by the rebuilding. For example, RA with mirror configuration
In the case of ID1, rebuilding is a process of copying data from a single disk drive due to a disk drive failure to a new disk drive that has been replaced, and read input / output occurs to the copy source disk drive. This read input / output causes the normal input / output to wait, and the performance of the normal input / output deteriorates.

【0013】この問題を解消するための従来のアプロー
チは2つある。第1のアプローチは、通常の入出力に影
響を与えないように、十分長いインターバルで、十分小
さいデータをコピーする。この場合、通常の入出力への
影響は小さくすることができるが、リビルディング完了
までの時間が長くなる。例えば9GBのディスクドライ
プで構成するRAID1の場合、10時間前後が必要と
なる。
There are two conventional approaches to solving this problem. The first approach copies sufficiently small data at sufficiently long intervals so as not to affect normal I / O. In this case, the influence on the normal input / output can be reduced, but the time until the completion of the rebuilding becomes longer. For example, in the case of RAID 1 composed of a 9 GB disk drive, about 10 hours are required.

【0014】第2のアプローチは、ディスクドライブが
空いていれば、即ち、通常の入出力でディスクドライブ
を使用していなければ、リビルディングの入出力をスケ
ジュールする。この場合の問題は、リビルディング完了
までの時間が保証できない点にある。これはディスクド
ライブがほとんど空いていないと、リビルディングに長
時間必要になってしまう。 5.最大応答時間保証 ミッションクリティカルな業務では、入出力性能の要件
として平均応答時間の他に最大応答時間が重要となる。
近年のディスク装置は、実行待ち入出力を処理時間が最
短になるように並び替えるリ・オーダリング機能(Re-o
rdering 機能)を持っている。
A second approach schedules rebuilding I / O if the disk drive is free, ie, not using the disk drive for normal I / O. The problem in this case is that the time to complete the rebuild cannot be guaranteed. This can take a long time to rebuild if the disk drive is almost empty. 5. Maximum Response Time Guarantee In mission-critical tasks, the maximum response time is important in addition to the average response time as a requirement for input / output performance.
Recent disk units have a re-ordering function (Re-o
rdering function).

【0015】リ・オーダリング機能は、ディスク装置
が、実行待ち入出力の中からシーク時間と回転待ち時間
の和で定義されるポジショニング時間を最小にする入出
力を、次に実行する入出力として選ぶ機能である。ディ
スク装置に入出力を依頼する際に、リ・オーダリングの
対象として良い旨のタスク指定となるシンプルタスク
(Simple task)をディスク装置に通知する。
In the reordering function, the disk device selects the input / output that minimizes the positioning time defined by the sum of the seek time and the rotation wait time from the input / output to be executed as the next input / output. Function. When requesting an input / output from the disk device, the disk device is notified of a simple task (Simple task) for specifying a task to be reordered.

【0016】ディスク装置はシンプルタスク指定の入出
力の場合は、ポジショニング時間を最小にするような順
番で入出力をスケジュールする。これにより、ランダム
アクセス時の平均処理時間が短縮される。例えば、ラン
ダムアクセスの平均処理時間は、リ・オーダリング機能
を使用することにより、9msから5msに短縮する。
In the case of an input / output designated by a simple task, the disk device schedules the input / output in such an order as to minimize the positioning time. Thereby, the average processing time at the time of random access is reduced. For example, the average processing time of random access is reduced from 9 ms to 5 ms by using the reordering function.

【0017】リ・オーダリング機能は、このようにディ
スク装置のスループットを向上させるが、最大応答時間
が大きくなる問題がある。これは、次の入出力にポジシ
ョニング時間が最小となる入出力を選択するため、ある
入出力が長い間待ちのままでスケジュールされない現象
が発生するためである。
Although the reordering function improves the throughput of the disk device in this way, there is a problem that the maximum response time becomes longer. This is because an input / output for which the positioning time is minimized for the next input / output is selected, so that a phenomenon occurs in which a certain input / output is waited for a long time and is not scheduled.

【0018】この現像を解決するため、ディスク装置
は、リ・オーダリングの対象として良いことを指定する
シンプルタスクの他に、オーダードタクス(Ordered ta
sk)を指定する機能を備えている。オーダードタクスの
指定で入出力を依頼すると、ディスク装置は、それまで
に受け付けていた未だ完了していない入出力を全て完了
させた後、オーダードタスクの入出力をスケジューリン
グする。
In order to solve this development, the disk device requires an ordered task (ordered task) in addition to the simple task for specifying that the reordering can be performed.
sk). When an input / output is requested by specifying the ordered task, the disk device completes all the input / output that has been received and has not been completed, and then schedules the input / output of the ordered task.

【0019】このようにシンプルタクスの間にオーダー
ドタスクを混ぜることにより、入出力の最大応答時間の
延長を抑えることが可能となる。しかし、ランダムアク
スセとシーケンシャルアクセス間、論理ボリューム間、
通常処理とバックアップ/コピー処理やリビルディング
処理間の資源配分を考えた場合、スループット(IOPS)
を向上させるためのシンプルタクスの利用に加え、シン
プルタクスクを使った場合の最大応答時間の保証が課題
となる。
As described above, by mixing the ordered tasks during the simple task, it is possible to suppress the extension of the maximum input / output response time. However, between random access and sequential access, between logical volumes,
When considering resource allocation between normal processing and backup / copy processing or rebuilding processing, throughput (IOPS)
In addition to using simple tasks to improve the performance, guaranteeing the maximum response time when using simple tasks is an issue.

【0020】このような問題を解決するため、本願発明
者にあっては、ディクス装置に種類の異なる複数の入出
力が競合した場合の性能の最低保証を可能とするディス
ク・タイムシェアリング装置及び方法を提案している
(特願平11−218757号)。
In order to solve such a problem, the present inventor has proposed a disk time sharing apparatus and a disk time sharing apparatus which can guarantee the minimum performance when a plurality of different types of input / output compete with each other. A method has been proposed (Japanese Patent Application No. 11-218575).

【0021】このディスク・タイムシェアリング装置
は、1又は複数のディスクドライブを備えたディスク装
置、ディスク装置に入出力要求を発行する入出力要求
部、及びディスク装置への入出力元をグループ化した入
出力グループを形成すると共に各入出力グループがディ
スク装置を使用する時間の比率を定義し、定義された時
間比率に基づき各入出力グループが連続してディスク装
置16を使用できるクォンタムτ1,τ2,τ3(割当
時間)を決定し、複数の入出力グループからディスク装
置に入出力の依頼を受け付けている場合、競合した入出
力グループ間でクォンタムτ1,τ2,τ3を順番に切
り替えてディスク装置を使用するタイムシェアリングを
行う入出力スケジュール機構を備える。
This disk time-sharing device is obtained by grouping a disk device having one or a plurality of disk drives, an input / output request unit for issuing an input / output request to the disk device, and an input / output source to the disk device. An I / O group is formed, and a ratio of time during which each I / O group uses the disk device is defined. Quantum τ1, τ2, at which each I / O group can continuously use the disk device 16 based on the defined time ratio. If τ3 (assigned time) is determined and an I / O request is received from a plurality of I / O groups to the disk device, the disk device is used by sequentially switching the quantum τ1, τ2, τ3 between competing I / O groups. It has an input / output schedule mechanism for performing time sharing.

【0022】具体的には、入出力スケジュール機構は、
シーケンシャルアクセスと判断された入出力はシーケン
シャルアクセス入出力グループに、それ以外の入出力は
ランダムアクセス入出力グループに対応させ、シーケン
シャルアクセスとランダムアクセスでディスク装置のタ
イムシェアリングを行う。
More specifically, the input / output schedule mechanism includes:
The input / output determined to be sequential access corresponds to the sequential access input / output group, and the other inputs / outputs correspond to the random access input / output group, and time sharing of the disk device is performed by sequential access and random access.

【0023】このため、ランダムアクセス要求がどれだ
け多く発生しようとも、シーケンシャルアクセスの入出
力でディスク装置を使用できる時間が保証されているか
ら、シーケンシャルアクセス性能の最低値保証が可能と
なる。また、ランダムアクセスの入出力でディスク装置
を使用できる時間が保証されているから、ランダムアク
セス性能の最低保証が可能となる。
Therefore, no matter how many random access requests occur, the time during which the disk device can be used for sequential access input / output is guaranteed, so that the minimum value of the sequential access performance can be guaranteed. Also, since the time during which the disk device can be used for random access input / output is guaranteed, the minimum random access performance can be guaranteed.

【0024】ところで、システム管理者であるユーザの
要求として、ランダムアクセス入出力の平均レスポンス
時間は例えば30ms以下に抑えたいという要求がある
とする。ここでディスクタイムシェアリングにより、1
回のタイムシェアリングの周期TSをTS=100m
s、ランダムクォンタムとシーケンシャルクォンタムの
時間比率(以下「RS比」という)をRS比=90%
(但し、ランダム側からみた比率RS=R/TSで算出
される)で、タイムシェアリング処理を行っているもの
とする。
By the way, it is assumed that there is a request from a user who is a system administrator to suppress the average response time of random access input / output to, for example, 30 ms or less. Here, due to disk time sharing, 1
Time sharing cycle TS = 100m
s, the ratio of time between random quantum and sequential quantum (hereinafter referred to as “RS ratio”) is RS ratio = 90%
(However, it is assumed that the time sharing process is performed at a ratio RS = R / TS viewed from the random side).

【0025】通常の比較的軽い負荷の状態で、タイムシ
ェアリング周期TSを100msと設定した場合は、平
均レスポンス時間Ave[ms]、最大レスポンス時間
Max[ms]はともに短くなるため、この設定で都合
が良い。しかし、負荷が重くなった場合には、タイムシ
ェアリング周期TS=100msでは処理し切れず、平
均レスポンスAveの悪化を招く。
When the time sharing cycle TS is set to 100 ms under a normal light load condition, the average response time Ave [ms] and the maximum response time Max [ms] are both short. convenient. However, when the load becomes heavy, the processing cannot be completed in the time sharing cycle TS = 100 ms, and the average response Ave is deteriorated.

【0026】そこでタイムシェアリング周期TSを予め
例えば300msのように長い時間に設定することで、
負荷が重くなった場合の平均レスポンスAveの悪化を
抑制できるが、逆に負荷が軽い時のレスポンス時間がT
S=100msの設定に比べて長くなり、素早い応答が
得られない問題がある。
Therefore, by setting the time sharing period TS to a long time such as 300 ms in advance,
The deterioration of the average response Ave when the load becomes heavy can be suppressed, while the response time when the load is light is T
There is a problem that the response becomes longer than the setting of S = 100 ms, and a quick response cannot be obtained.

【0027】本発明は、ユーザの要求性能を満足するタ
イムシェアリングの動作条件を実績値に基づいて自動的
に調整可能なディスク・タイムシェアリング装置及び方
法を提供することを目的とする。
It is an object of the present invention to provide a disk time sharing apparatus and a method capable of automatically adjusting operating conditions of time sharing satisfying performance required by a user based on actual values.

【0028】[0028]

【課題を解決するための手段】図1は本発明の原理説明
図である。まず本発明は、図1(A)のように、ディス
ク装置16、入出力要求部18及び入出力スケジュール
機構20を備えたディスク・タイムシェアリング装置を
対象とする。
FIG. 1 is a diagram illustrating the principle of the present invention. First, the present invention is directed to a disk time sharing device including a disk device 16, an input / output request unit 18, and an input / output schedule mechanism 20, as shown in FIG.

【0029】ここで、ディスク装置16は、1又は複数
のディスクドライブを備え、入出力要求部18は、ディ
スク装置に入出力要求を発行する。更に、入出力スケジ
ュール機構20は、ディスク装置への入出力元をグルー
プ化した入出力グループを形成すると共に各入出力グル
ープがディスクを使用する時間の比率を定義し、定義さ
れた時間比率に基づき各入出力グループが連続してディ
スク装置を使用できる割当時間(クォンタム)を決定
し、複数の入出力グループからディスク装置に入出力の
依頼を受け付けている場合、競合した入出力グループ間
で前記割当時間を順番に切り替えてディスク装置を使用
するタイムシェアリングを行う。
Here, the disk device 16 includes one or a plurality of disk drives, and the input / output request unit 18 issues an input / output request to the disk device. Further, the I / O schedule mechanism 20 forms an I / O group in which I / O sources to the disk device are grouped, defines a ratio of time during which each I / O group uses a disk, and based on the defined time ratio. The allocation time (quantum) during which each I / O group can continuously use the disk device is determined, and when an I / O request is received from a plurality of I / O groups to the disk device, the allocation is performed among the competing I / O groups. Time sharing is performed by switching the time in order and using the disk device.

【0030】このようなディスク・タイムシェアリング
装置につき本発明は、要求性能と実績に応じて前記タイ
ムシェアリングの動作条件を自動的に調整するチューニ
ング部52を設けたことを特徴とする。
The present invention for such a disk time sharing apparatus is characterized in that a tuning unit 52 for automatically adjusting the operating conditions of the time sharing according to required performance and performance is provided.

【0031】このため本発明のディスク・タイムシェア
リング装置は、シミュレーションあるいは実測等により
得られた平均レンスポンス、最大レスポンス、スループ
ット等の実績(統計情報)を保存し、チューニング部に
より負荷の状態と保存した実績を元に、ユーザ要求性能
を満たす最適な調整値を決定し、この調整値に基づいて
タイムシェアリングの動作条件を自動的に調整でき、ユ
ーザの性能要求に適切に対応できる。
For this reason, the disk time sharing apparatus of the present invention stores the results (statistical information) such as the average response, the maximum response, and the throughput obtained by simulation or actual measurement, and stores the load state and the storage by the tuning unit. The optimum adjustment value that satisfies the performance required by the user is determined based on the results of the performance, and the operating condition of time sharing can be automatically adjusted based on the adjustment value, and the performance requirement of the user can be appropriately responded.

【0032】ここで入出力スケジュール機構20は、複
数の入出力グループとして、少なくともランダムアクセ
ス入出力グループとシーケンシャルアクセス入出力グル
ープを形成する。
Here, the input / output scheduling mechanism 20 forms at least a random access input / output group and a sequential access input / output group as a plurality of input / output groups.

【0033】チューニング部52は、図1(B)のよう
に、要求性能設定部56、第1乃至第3基礎データ6
2,64,66、及び動作条件決定部58を備える。要
求性能設定部56は、(1)負荷の状態IOPS(実測
値又は設定値)、(2)ランダムアクセス入出力グルー
プに平均レスポンス時間Ave[ms]と最大レスポン
ス時間Max[ms]、(3)シーケンシャルアクセス
入出力グループのスループットThP[MB/s]、の
各々を要求性能値として設定する。
As shown in FIG. 1B, the tuning unit 52 includes a required performance setting unit 56 and first to third basic data 6.
2, 64, 66, and an operating condition determining unit 58. The required performance setting unit 56 includes (1) load state IOPS (actually measured value or set value), (2) average response time Ave [ms] and maximum response time Max [ms] for the random access input / output group, and (3) Each of the throughputs ThP [MB / s] of the sequential access input / output group is set as a required performance value.

【0034】第1基礎データ62は、ランダムアクセス
の負荷IOPS毎に分けた平均レスポンスAveの実績
値を、タイムシェアリング周期TSと、ランダムアクセ
スとシーケンシャルアクセスの割当時間比率(クォンタ
ム比率)であるRS比率に対応して格納する。
The first basic data 62 represents the actual value of the average response Ave divided for each random access load IOPS, the time sharing period TS, and the RS which is the allocated time ratio (quantum ratio) between random access and sequential access. Store it corresponding to the ratio.

【0035】第2基礎データ64は、ランダムアクセス
の負荷IOPS毎に分けた最大レスポンスMaxの実績
値を、タイムシェアリング周期TSと、ランダムアクセ
スとシーケンシャルアクセスの割当時間比率であるRS
比率に対応して格納する。
The second basic data 64 indicates the actual value of the maximum response Max divided for each random access load IOPS by the time sharing cycle TS and the ratio of the allocated time of the random access to the sequential access RS
Store it corresponding to the ratio.

【0036】第3基礎データ66は、スループットTh
Pの実績値を、タイムシェアリング周期TSと、ランダ
ムアクセスとシーケンシャルアクセスの割当時間比率で
あるRS比率に対応して格納する。
The third basic data 66 includes a throughput Th
The actual value of P is stored in correspondence with the time sharing period TS and the RS ratio, which is the ratio of the allocated time between random access and sequential access.

【0037】更に、動作条件決定部58は、要求性能設
定部で設定した1又は複数の要求性能値を満足するタイ
ムシェリング周期TSと、ランダムアクセスとシーケン
シャルアクセスの割当時間比率(RS比)を、ランダム
負荷と第1乃至第3基礎データの参照で調整値として決
定し、タイムシェアリングの動作条件を自動的に調整す
る。
Further, the operating condition determining unit 58 calculates a time shelling period TS that satisfies one or a plurality of required performance values set by the required performance setting unit, and an allocation time ratio (RS ratio) between random access and sequential access. An adjustment value is determined by referring to the random load and the first to third basic data, and the time sharing operating condition is automatically adjusted.

【0038】チューニング部52は、達成できない要求
性能値がある場合に、要求性能の種別に優先順を付け、
次のいずれかのモードを使用して動作条件を自動調整す
る。 (1)上位の優先度の要求性能を達成できる設定範囲で
は下位の要求性能が達成できない場合に、下位の要求性
能は考慮しないで調整値を決定する第1モード。 (2)上位の優先度の要求性能が達成できる設定範囲で
は下位の要求性能が達成できない場合も、下位の要求性
能を考慮して調整値を決定する第2モード。 (3)上位の優先度の要求性能が達成できる設定範囲で
は下位の要求性能が達成できない場合に、上位の設定範
囲内から下位の性能が最善になる調整値を選択する第3
モード。 (4)上位の優先度の要求性能が達成できる設定範囲で
は下位の要求性能が達成できない場合に、上位の設定範
囲から回の性能が良くなる候補を複数点選択し、全託し
た候補の中から上位の性能が最善になる調整値を選択す
る第4モード。
If there is a required performance value that cannot be achieved, the tuning unit 52 assigns a priority to the type of required performance,
Automatically adjust operating conditions using one of the following modes: (1) A first mode for determining an adjustment value without considering lower required performance when lower required performance cannot be achieved within a setting range capable of achieving higher priority required performance. (2) The second mode in which the adjustment value is determined in consideration of the lower required performance even when the lower required performance cannot be achieved within the setting range where the higher priority required performance can be achieved. (3) When the lower required performance cannot be achieved in the setting range in which the required performance of the higher priority can be achieved, a third adjustment value for selecting the optimum value of the lower performance from the upper setting range is selected.
mode. (4) When the lower required performance cannot be achieved in the setting range in which the required performance of the higher priority can be achieved, a plurality of candidates having better performances are selected from the higher setting range, and the A fourth mode for selecting an adjustment value at which a higher-level performance is best from the above.

【0039】このように要求性能に優先順位を付けて調
整値を決定することで、全ての要求性能を満足しなくと
も、ユーザの重視する優先度の高い要求性能を満足する
ように自動調整され、ユーザの要求を適切に反映でき
る。
As described above, the priority is assigned to the required performance and the adjustment value is determined, so that even if not all the required performances are satisfied, the automatic adjustment is performed so as to satisfy the high-priority required performance emphasized by the user. Therefore, the user's request can be appropriately reflected.

【0040】また本発明は、1又は複数のディスクドラ
イブを備えたディスク装置と、前記ディスク装置に入出
力要求を発行する入出力要求部と、前記入出力に基づい
て前記ディスク装置の使用をスケジューリングする入出
力スケジュール機構とを備えたディスク・タイムシェア
リング方法を提供するものであり、ディクス装置への入
出力元をグループ化した入出力グループを形成すると共
に各入出力グループがディスクを使用する時間の比率を
定義し、定義された時間比率に基づき各入出力グループ
が連続してディスク装置を使用できる割当時間(クォン
タム)を決定し、複数の入出力グループからディスク装
置に入出力の依頼を受け付けている場合、競合した入出
力グループ間で割当時間を順番に切り替えてディスク装
置を使用するタイムシェアリングを行い、更に、要求性
能と実績に応じてタイムシェアリングの動作条件を自動
的に調整することを特徴とする。
Further, the present invention provides a disk device having one or a plurality of disk drives, an input / output request unit for issuing an input / output request to the disk device, and a schedule for using the disk device based on the input / output. A disk time sharing method provided with an I / O schedule mechanism that forms an I / O group in which I / O sources to a disk device are grouped and a time during which each I / O group uses a disk. The I / O group determines the allocation time (quantum) that each I / O group can use the disk device continuously based on the defined time ratio, and accepts I / O requests from multiple I / O groups to the disk device. Time, switch the allocation time between competing I / O groups in order to use disk units. Perform sharing, further characterized by automatically adjusting the operating conditions of the time-sharing in response to the required performance and results.

【0041】尚、この方法につていの詳細は、装置と基
本的に同じになる。
The details of this method are basically the same as those of the apparatus.

【0042】[0042]

【発明の実施の形態】図2は、本発明が適用されるスト
レージシステムのブロック図である。図2において、ス
トレージシステムは、デバイス制御装置12、アレイデ
ィスク装置14、及びディスク装置16で構成される。
デバイス制御装置12に対しては、ホスト10−1〜1
0−nが接続されており、ホスト10−1〜10−nの
アプリケーションにより入出力要求をデバイス制御装置
12に対し行っている。
FIG. 2 is a block diagram of a storage system to which the present invention is applied. In FIG. 2, the storage system includes a device control device 12, an array disk device 14, and a disk device 16.
For the device control device 12, the hosts 10-1 to 10-1
0-n are connected, and input / output requests are sent to the device control device 12 by applications of the hosts 10-1 to 10-n.

【0043】アレイディスク装置14は、デバイス制御
装置12からの入出力要求を受けつけ、ディスク装置1
6に対し受けつけた入出力要求を発行する。本発明のデ
ィスク・タイムシェアリング装置は、アレイディスク装
置14に設けた入出力要求依頼部18及びディスク入出
力スケジュール機構20と、ディスク装置16に設けた
ディスク入出力処理部22及びディスクドライブ24−
1〜24−nで構成される。
The array disk unit 14 receives an input / output request from the device control unit 12 and
Issue the input / output request received for the request. The disk time sharing device of the present invention includes an input / output request requesting unit 18 and a disk input / output schedule mechanism 20 provided in the array disk device 14, a disk input / output processing unit 22 and a disk drive 24-provided in the disk device 16.
1 to 24-n.

【0044】またディスク装置16に設けている複数の
ディスクドライブ24−1〜24−nがRAID構成を
とる場合には、アレイディスク装置14にはRAID制
御機構がさらに設けられることになる。
When a plurality of disk drives 24-1 to 24-n provided in the disk device 16 have a RAID configuration, the array disk device 14 is further provided with a RAID control mechanism.

【0045】更に本発明のディスク・タイムシェアリン
グ装置は、アレイディスク装置14のディスク入出力ス
ケジュール機構20に対しチューニング機構50を設け
ており、チューニング機構50はチューニング部52と
基礎データファイル54を備える。
Further, in the disk time sharing apparatus of the present invention, a tuning mechanism 50 is provided for the disk input / output schedule mechanism 20 of the array disk apparatus 14, and the tuning mechanism 50 includes a tuning unit 52 and a basic data file 54. .

【0046】チューニング部52は、ユーザが希望した
要求性能を満足するように、負荷と基礎データに基づい
てディスク入出力スケジュール機構20におけるタイム
シェアリングの動作条件を自動的に調整する。
The tuning unit 52 automatically adjusts the operating conditions of time sharing in the disk input / output scheduling mechanism 20 based on the load and the basic data so as to satisfy the required performance desired by the user.

【0047】図3は、図2のストレージシステムに適用
された本発明のタイムシェアリング装置の基本的な実施
形態のブロック図であり、RAID構成のディスク装置
を例にとっている。
FIG. 3 is a block diagram of a basic embodiment of the time sharing apparatus of the present invention applied to the storage system of FIG. 2, and exemplifies a disk device having a RAID configuration.

【0048】図3において、アレイディスク装置14
は、入出力要求部18、RAID制御部26、ディスク
入出力スケジュール機構20を備える。またディスク装
置16にはディスク入出力処理部22が設けられ、この
ディスク入出力処理22に対し、例えばRAID1の構
成(ミラーディスク構成)をとる2台のディスクドライ
ブ24−1,24−2が接続されている。
In FIG. 3, the array disk device 14
Includes an input / output request unit 18, a RAID control unit 26, and a disk input / output schedule mechanism 20. The disk device 16 is provided with a disk input / output processing unit 22. Two disk drives 24-1 and 24-2 having a RAID1 configuration (mirror disk configuration) are connected to the disk input / output processing unit 22, for example. Have been.

【0049】このような本発明のディスク・タイムシェ
アリング装置は、入出力要求部18からのディスク装置
16への入出力要求をグループ化して入出力グループを
形成すると共に、各入出力グループがディスク装置16
を使用する時間の比率を定義し、定義された時間比率に
基づき各入出力グループが連続してディスク装置を使用
できるクォンタム(割当時間)を決定し、複数の入出力
グループから依頼を受けつけている場合に競合した入出
力グループ間でクォンタムを順番に切り替えてディスク
装置16を使用するようにスケジューリングする処理を
行う。
The disk time sharing apparatus according to the present invention forms an input / output group by grouping input / output requests from the input / output requesting unit 18 to the disk device 16 and forms a disk group. Device 16
Defines the ratio of time to use, and based on the defined time ratio, determines the quantum (allocation time) in which each I / O group can use the disk device continuously, and accepts requests from multiple I / O groups. In this case, a process is performed in which the quantum is sequentially switched between the conflicting input / output groups and the disk device 16 is used.

【0050】またひとつの入出力グループからのみ入出
力の依頼のある場合は、ひとつの入出力グループからの
入出力に対しディスク装置16を連続して使用可能とす
るスケジューリングを行う。
When there is an input / output request from only one input / output group, scheduling is performed so that the disk device 16 can be continuously used for input / output from one input / output group.

【0051】このような本発明のディスク・タイムシェ
アリング処理を実現する図3の各部の構成及び機能を更
に詳細に説明すると次のようになる。入出力要求部18
は、例えば図2に示した上位のデバイス制御装置12か
らのコマンドに基づきディスク装置16に対する入出力
要求をRAID制御部26を介してディスク入出力スケ
ジュール機構20に発行する。RAID制御部は、依頼
された論理入出力要求を物理入出力要求に変換する処理
を主に行う。
The configuration and function of each unit in FIG. 3 for realizing such a disk time sharing process of the present invention will be described in more detail as follows. Input / output request unit 18
Issues an I / O request to the disk device 16 to the disk I / O schedule mechanism 20 via the RAID control unit 26 based on, for example, a command from the upper device control device 12 shown in FIG. The RAID control unit mainly performs a process of converting the requested logical input / output request into a physical input / output request.

【0052】ディスク入出力スケジュール機構20に
は、ディスク・タイムシェアリング制御情報30−1,
30−2、入出力スケジュール部32、入出力要求受付
部34、及び入出力完了処理部36が設けられる。ディ
スク・タイムシェアリング制御情報30−1,30−2
は、ディスク装置16に設けているディスクドライブ2
4−1,24−2単位に設けられる。
The disk input / output scheduling mechanism 20 includes disk time sharing control information 30-1,
30-2, an input / output schedule unit 32, an input / output request receiving unit 34, and an input / output completion processing unit 36 are provided. Disk time sharing control information 30-1, 30-2
Is the disk drive 2 provided in the disk device 16
4-1 and 24-2 units are provided.

【0053】入出力スケジュール部32は、ディスクド
ライブ24−1,24−2単位に設けられたディスク・
タイムシェアリング制御情報30−1,30−2を参照
及び更新してディスク・タイムシェアリングを行う。
The input / output schedule section 32 includes a disk drive provided for each of the disk drives 24-1 and 24-2.
The disk time sharing is performed by referring to and updating the time sharing control information 30-1 and 30-2.

【0054】ここでディスク・タイムシェアリング制御
情報30−1について説明すると、この実施形態にあっ
ては入出力グループをG1,G2,G3の3つに分けて
定義した場合を例にとっており、入出力グループG1〜
G3に対応してスケジュール待ちグループキュー38−
1,38−2が設けられる。このスケジュール待ちグル
ープキュー38−1〜38−3には、入出力要求受付部
34で受けつけた入出力要求がキューを構成するFIF
Oに格納することで並ぶ。
Here, the disk time sharing control information 30-1 will be described. In this embodiment, a case where the input / output groups are defined as three groups G1, G2 and G3 is taken as an example. Output group G1
Schedule queue group queue 38-corresponding to G3
1, 38-2 are provided. In the schedule waiting group queues 38-1 to 38-3, the I / O requests received by the I / O request receiving unit 34 are assigned to the FIFs constituting the queues.
Lined up by storing in O.

【0055】また入出力グループG1〜G3に対応して
完了待ちグループキュー40−1,40−2,40−3
が設けられる。完了待ちグループキュー40−1,40
−3には、ディスク装置16への入出力依頼が完了し、
ディスク装置16から入出力完了応答を受けていない入
出力要求がキューを構成するFIFOに格納することで
並んでいる。
The completion waiting group queues 40-1, 40-2, 40-3 corresponding to the input / output groups G1 to G3.
Is provided. Completion waiting group queues 40-1 and 40
At -3, the input / output request to the disk device 16 is completed,
The input / output requests that have not received the input / output completion response from the disk device 16 are arranged by being stored in the FIFO constituting the queue.

【0056】更に入出力グループG1〜G3に対応して
グループ用クォンタム42−1,42−2,42−3が
設けられる。このグループ用クォンタム42−1〜42
−3には、入出力グループG1〜G3がディスク装置1
6を使用する時間の比率α1,α2,α3を予め定義
し、この定義された比率α1,α2,α3に基づき、そ
れぞれの入出力グループG1〜G3が連続してディスク
装置を使用できる割当時間となるクォンタムτ1,τ
2,τ3を決定して格納している。
Further, group quanta 42-1, 42-2 and 42-3 are provided corresponding to the input / output groups G1 to G3. Quantum 42-1 to 42 for this group
-3, the input / output groups G1 to G3 are the disk devices 1
6 are defined in advance, and based on the defined ratios α1, α2, α3, the allocation time during which the respective input / output groups G1 to G3 can continuously use the disk device is determined. Quantum τ1, τ
2, τ3 are determined and stored.

【0057】例えば1回のタイムシェアリングを行なう
タイムシェアリング周期をTSとすると、入出力グルー
プG1〜G3のクォンタムτ1〜τ3は次式で定義され
る。
For example, assuming that the time sharing cycle for performing one time sharing is TS, the quantum τ1 to τ3 of the input / output groups G1 to G3 is defined by the following equation.

【0058】τ1=α1・TS τ2=α2・TS τ3=α3・TS このような入出力グループG1〜G3のディスク装置1
6の使用を決めるクォンタムτ1〜τ3の適正値は次の
ようにして決める。まずクォンタムは値を小さくしすぎ
るとディスク装置16の入出力処理時間に近くなり、ポ
ジショニング時間を最小とするように入出力を選択する
リ・オーダリングの効果が小さくなり、全体の入出力性
能が低下する。
Τ1 = α1 · TS τ2 = α2 · TS τ3 = α3 · TS Disk device 1 of such input / output groups G1 to G3
The appropriate value of the quantum τ1 to τ3 that determines the use of No. 6 is determined as follows. First, if the quantum is set too low, the input / output processing time of the disk device 16 will be close to the value, and the reordering effect of selecting the input / output to minimize the positioning time will be reduced, and the overall input / output performance will decrease I do.

【0059】逆にクォンタムの値が大きすぎると、他の
入出力グループに切り替えるクォンタムの待ち時間が延
びることにより、平均入出力処理時間及び最大入出力処
理時間が延びることになる。例えばクォンタムτ1とク
ォンタムτ2をそれぞれ1時間に設定すると、クォンタ
ムτ1の処理中はクォンタムτ2の入出力を実行できな
いため、クォンタムτ2の入出力はクォンタムτ1の終
了を1時間待つことになる。
On the other hand, if the value of the quantum is too large, the waiting time of the quantum for switching to another input / output group increases, so that the average input / output processing time and the maximum input / output processing time increase. For example, if the quantum τ1 and the quantum τ2 are set to one hour, respectively, the input and output of the quantum τ2 cannot be performed during the processing of the quantum τ1, so that the input and output of the quantum τ2 waits for one hour until the quantum τ1 ends.

【0060】本願発明者の実験によれば、入出力の平均
処理時間が数ms〜20msのディスク装置16の場
合、クォンタムの値としては数十ms〜数百msが望ま
しい。
According to the experiment performed by the inventor of the present invention, in the case of the disk device 16 in which the average input / output processing time is several ms to 20 ms, the quantum value is preferably several tens ms to several hundred ms.

【0061】また本発明のディスク・タイムシェアリン
グにあっては、ランダムアクセスの割当時間となるクォ
ンタムヲR、シーケンシャルアクセスの割当時間となる
クォンタムヲSとした場合、両者のクォンタム比率(割
当時間非理知)をRS比と呼びとして次式で定義する。
In the disk time sharing according to the present invention, if the quanta ヲ R, which is the allocation time for random access, and the quanta, ヲ S, which is the allocation time for sequential access, the quantum ratio of the two (allocation time not known). Is defined as the RS ratio by the following equation.

【0062】RS比=R/(R+S)これはランダムア
クセス側から見たクォンタム比率である。そして、この
RS比を調整値として可変設定することで、タイムシェ
アリング周期TS内でのランダムアクセスとシーケンシ
ャルアクセスの割当時間を変更できるようにしている。
RS ratio = R / (R + S) This is a quantum ratio viewed from the random access side. By variably setting the RS ratio as an adjustment value, it is possible to change the allocation time of the random access and the sequential access within the time sharing period TS.

【0063】ここでディスク入出力スケジュール機構2
0でグループ化する入出力としては、例えば次のグルー
プ化がある。
Here, the disk input / output schedule mechanism 2
The input / output grouped by 0 includes, for example, the following grouping.

【0064】(1)ランダムアクセスの入出力グループ (2)シーケンシャルアクセスの入出力グループ (3)論理ボリュームによる入出力グループ (4)コピー/バックアップ処理による入出力グループ (5)RAIDのリ・ビルディング処理による入出力グ
ループ これにの入出力グループの形成は、入出力要求依頼部1
4にシーケンシャルアクセス検出機構45、バックアッ
プ検出機構78及びリビルディング機構84が設けられ
ていることを前提としている。
(1) I / O group for random access (2) I / O group for sequential access (3) I / O group by logical volume (4) I / O group by copy / backup processing (5) RAID rebuilding processing The I / O group is formed by the I / O request requesting unit 1
4 is provided with a sequential access detection mechanism 45, a backup detection mechanism 78, and a rebuilding mechanism 84.

【0065】このため本発明にあっては、例えばランダ
ムアクセス、シーケンシャルアクセス、及びコピー/バ
ックアップ処理、及びリ・ビルディング処理の4つの入
出力グループG1〜G4を形成してタイムシェアリング
周期TSにつき各々にクォンタムを設定してタイムシェ
アリングする。
For this reason, in the present invention, for example, four input / output groups G1 to G4 for random access, sequential access, copy / backup processing, and rebuilding processing are formed, and Quantum is set for time sharing.

【0066】また複数の入出力グループを1つにまとめ
てもよい。例えばランダムアクセスとシーケンシャルア
クセスを1つの入出力グループにまとめ、コピー/バッ
クアップ処理を各々独立のグループとして3グループを
形成してもよい。この場合の同じグループに属するラン
ダムアクセスとシーケンシャルアクセスについては、R
S比を応じた割当時間をもつ。
A plurality of input / output groups may be combined into one. For example, random access and sequential access may be combined into one input / output group, and copy / backup processing may be formed as three independent groups. In this case, for random access and sequential access belonging to the same group, R
It has an allocation time according to the S ratio.

【0067】ディスク・タイムシェアリング制御情報3
0−1には、現クォンタム種別44、現クォンタム開始
時刻46、更に次入出力タスク種別48が設けられる。
この現クォンタム種別44は、ディスク装置16のディ
スクドライブ24−1,24−2毎に設けられ、現在、
ディスクドライブ24−1,24−2を使用している入
出力グループの識別子が設定される。
Disk time sharing control information 3
0-1 is provided with a current quantum type 44, a current quantum start time 46, and a next input / output task type 48.
The current quantum type 44 is provided for each of the disk drives 24-1 and 24-2 of the disk device 16.
The identifier of the input / output group using the disk drives 24-1 and 24-2 is set.

【0068】現クォンタム開始時刻46は、ディスク装
置16のディスクドライブ24−1,24−2毎に設け
られ、現在クォンタム種別44に設定されている現在の
クォンタムが開始した時刻T0 が設定される。更に次入
出力タスク種別48は、ディスク装置16のディスクド
ライブ24−1,24−2毎に設けられ、次のディスク
ドライブに対する入出力依頼をシンプル・タスクとする
かオーダード・タスクとするかが設定される。この次入
出力タスク種別48に設定されるシンプル・タスク又は
オーダード・タスクは、ディスク装置16におけるリ・
オーダリング機能の効果を十分に生かすために行う。
The current quantum start time 46 is provided for each of the disk drives 24-1 and 24-2 of the disk device 16, and the time T0 at which the current quantum set in the current quantum type 44 starts is set. Further, the next input / output task type 48 is provided for each of the disk drives 24-1 and 24-2 of the disk device 16, and determines whether the input / output request for the next disk drive is a simple task or an ordered task. Is set. The simple task or ordered task set in the next input / output task type 48 is
This is performed to make full use of the effect of the ordering function.

【0069】ここでディスク装置16のリ・オーダリン
グ機能は、ディスクドライブ24−1又は24−2のそ
れぞれについて、実行待ちの入出力の中からシーク時間
と回転時間の和で与えられるポジショニング時間を最小
とする入出力を次に実行する入出力として選ぶ機能であ
る。
Here, the reordering function of the disk device 16 minimizes the positioning time given by the sum of the seek time and the rotation time from the input / output waiting for execution for each of the disk drives 24-1 and 24-2. This function selects the input / output to be executed next as the input / output to be executed.

【0070】このようなリ・オーダリング機能を備えた
ディスク装置に入出力を依頼する場合、サンプル・タス
クを指定するとリ・オーダリングの対象としてよいこと
をディスクドライブに通知することになる。このサンプ
ル・タスクを指定した入出力を受けつけたディスクドラ
イブは、ポジショニング時間を最小とするような順番で
入出力をスケジュールする。
When requesting input / output from a disk device having such a reordering function, when a sample task is specified, the disk drive is notified that the reordering may be performed. The disk drive that receives the input / output specifying this sample task schedules the input / output in such an order as to minimize the positioning time.

【0071】しかしながら、リ・オーダリング機能は常
にポジショニング時間が最小となる入出力を選択するた
め、ある入出力が長い間待ちのままスケジュールされな
い現象が発生する。この現象を解消するためディスクド
ライブはシンプル・タスクの他にオーダー・タスクの機
能を備えている。オーダー・タスクを指定して入出力を
依頼すると、ディスクドライブはそれまで受け継いでい
た未だ完了していない入出力を全て完了させた後に、オ
ーダード・タスクの入出力をスケジュールする。このた
めシンプル・タスクの間にオーダード・タスクを混ぜる
ことで、入出力の最大応答時間の延長を押さえることが
可能となる。
However, since the reordering function always selects an input / output with a minimum positioning time, a phenomenon occurs in which a certain input / output is not waited for a long time and is not scheduled. In order to solve this phenomenon, the disk drive has an order task function in addition to the simple task. When an input / output is requested by designating the order task, the disk drive completes all the incomplete inputs / outputs that have been inherited and schedules the input / output of the ordered task. For this reason, by mixing ordered tasks between simple tasks, it is possible to suppress the extension of the maximum input / output response time.

【0072】本発明のディスク・タイムシェアリング処
理にあっては、クォンタムを切り替えた後の最初の入出
力は、オーダード・タスクを指定してディスク装置16
に依頼し、クォンタム切り替え前の未だ完了していない
入出力を完了させた後に次のクォンタムの入出力を実行
する。このためクォンタムに切り替えた後の2つ目以降
の入出力についてはシンプル・タスクを指定する。
In the disk time sharing process of the present invention, the first input / output after quantum switching is performed by specifying an ordered task and using the disk device 16.
To complete the I / O that has not been completed before the quantum switch, and then execute the I / O for the next quantum. For this reason, a simple task is specified for the second and subsequent inputs and outputs after switching to quantum.

【0073】またひとつの入出力グループからの入出力
しかない場合には、その入出力グループのスケジュール
を連続するためにクォンタムをリセットしながら繰り返
すことになる。この場合にあってはクォンタムをリセッ
トした直後の最初の入出力はオーダード・タスクで依頼
し、前のクォンタムで完了してない入出力を総て完了し
た後にリセット後のクォンタムの入出力をスケジュール
する。
If there is only input / output from one input / output group, the input / output group is repeated while resetting the quantum in order to continue the schedule. In this case, the first I / O immediately after resetting the quantum is requested by the ordered task, and the I / O of the reset quantum is scheduled after all the I / O that has not been completed in the previous quantum is completed. I do.

【0074】これによって複数の入出力グループの入出
力が競合する場合、及びひとつの入出力グループのみの
入出力のみを連続させる場合の最大応答時間の延長を防
止することができる。
As a result, it is possible to prevent an increase in the maximum response time when the input / output of a plurality of input / output groups conflicts and when only the input / output of one input / output group is continuous.

【0075】図4は、図3のディスク入出力スケジュー
ル機構20に設けている入出力スケジュール部32によ
るディスク・タイムシェアリングのスケジュールの一例
である。
FIG. 4 shows an example of a disk time sharing schedule by the input / output schedule section 32 provided in the disk input / output schedule mechanism 20 of FIG.

【0076】図4において、3つの入出力グループG1
〜G3について、ディスク・タイムシェアリング制御情
報30−1のスケジュール待ちグループキュー38−1
〜38−3に入出力要求が格納されている競合状態にあ
っては、入出力グループG1〜G3毎に決定されたクォ
ンタム持ち時間τ1,τ2,τ3に従って、グループG
1〜G3の順に各入出力をスケジューリングしてディス
ク装置16に入出力を依頼する。
In FIG. 4, three input / output groups G1
GG3, the schedule waiting group queue 38-1 of the disk time sharing control information 30-1
38-3, the input / output requests are stored in the group G according to the quantum holding times τ1, τ2, τ3 determined for the input / output groups G1 to G3.
The input / output is scheduled in the order of 1 to G3, and the input / output is requested to the disk device 16.

【0077】例えば時刻t0からのクォンタム持ち時間
τ1の間は、入出力グループG1の2つの入出力がスケ
ジュールされる。クォンタム切替えは、入出力完了時点
の時刻が現クォンタム切替え時刻を越えた時点で、次の
入出力グループのクォンタムに切替える。この切替えは
次式で判断する。 (現在クォオンタムの入出力開始時刻)< (現クォンタム開始時刻+クォンタム) (1) 即ち、(1)式を満たせば、現クォンタム種別に対応す
る入出力グループG1の入出力をディスク装置に依頼
し、満たさない場合は、次の入出力グループG2のクォ
ンタムに切替える。
For example, during the quantum holding time τ1 from time t0, two inputs / outputs of the input / output group G1 are scheduled. In the quantum switching, when the time at the time of completion of the input / output exceeds the current quantum switching time, the quantum is switched to the quantum of the next input / output group. This switching is determined by the following equation. (Current quantum input / output start time) <(current quantum start time + quantum) (1) That is, if the expression (1) is satisfied, the input / output of the input / output group G1 corresponding to the current quantum type is requested to the disk device. If not, it switches to the next input / output group G2 quantum.

【0078】次の入出力グループG2のクォンタム持ち
時間τ2の間には、例えば6つの入出力がスケジュール
されている。更に時刻t2でクォンタム持ち時間τ2が
経過すると、入出力グループG3のクォンタム持ち時間
τ3への切り替えが行われ、例えば入出力グループG3
の3つの入出力がスケジュールされる。以下同様にクォ
ンタム持ち時間τ1,τ2,τ3を切り替えて、それぞ
れの入出力グループの入出力をスケジュールする。
During the quantum holding time τ2 of the next input / output group G2, for example, six inputs / outputs are scheduled. Further, when the quantum holding time τ2 elapses at the time t2, the input / output group G3 is switched to the quantum holding time τ3.
Are scheduled. In the same way, the quantum holding times τ1, τ2, τ3 are similarly switched to schedule the input / output of each input / output group.

【0079】図5は、特定の入出力グループの入出力の
みが連続した場合のタイムシェアリング処理の一例であ
る。図5において、時刻t0で入出力グループG1のみ
の入出力が図3のスケジュール待ちグループキュー38
−1に並んでおり、残りの入出力グループG2,G3の
スケジュール待ちキュー38−2,38−3は空であっ
たとする。
FIG. 5 shows an example of the time sharing process when only the input / output of a specific input / output group is continuous. In FIG. 5, at time t0, only the input / output of the input / output group G1 is changed to the schedule waiting group queue 38 of FIG.
-1 and the schedule waiting queues 38-2 and 38-3 of the remaining input / output groups G2 and G3 are assumed to be empty.

【0080】この場合には時刻t0からの入出力グルー
プG1のクォンタム持ち時間τ1で入出力グループG1
の2つの入出力をスケジュールした後、時刻t1でクォ
ンタム持ち時間τ1をリセットすることで次の同じ入出
力グループG1のクォンタムτ持ち時間1をリ・スター
トさせ、例えば3つの入出力をスケジュールする。
In this case, the input / output group G1 has a quantum holding time τ1 of the input / output group G1 from time t0.
After the two input / outputs are scheduled, the quantum holding time τ1 is reset at time t1, thereby restarting the quantum 1 holding time 1 of the next same input / output group G1, and, for example, three inputs / outputs are scheduled.

【0081】このようにひとつの入出力グループの入出
力のみ待ち状態にある時は、そのクォンタムをリセット
することで連続してひとつの入出力グループの入出力を
スケジュールする。
As described above, when only the input / output of one input / output group is in the waiting state, the input / output of one input / output group is continuously scheduled by resetting the quantum.

【0082】更に図5にあっては、時刻t2で3つの入
出力グループG1〜G3の入出力が競合状態となること
で、次のクォンタム持ち時間τ2への切り替えが行われ
る。しかしながら、クォンタム持ち時間τ2において入
出力グループG2の入出力が3つしかなく、クォンタム
持ち時間τ2の途中の時刻t3で3つの入出力要求が途
絶えている。
Further, in FIG. 5, when the inputs and outputs of the three input / output groups G1 to G3 enter a conflicting state at time t2, switching to the next quantum holding time τ2 is performed. However, there are only three inputs / outputs in the input / output group G2 in the quantum holding time τ2, and three input / output requests are interrupted at time t3 in the quantum holding time τ2.

【0083】この場合には、例えば入出力グループG3
に待ち状態の入出力要求があることから、時刻t3でク
ォンタム持ち時間τ3に切り替え、入出力グループG3
の例えば3つの入出力をスケジュールする。
In this case, for example, the input / output group G3
Since there is an I / O request in the waiting state, the time is switched to the quantum holding time τ3 at time t3, and the I / O group G3
For example, schedule three inputs and outputs.

【0084】この図4及び図5に示したディスク・タイ
ムシェアリングのスケジュールにおいて、ディスクドラ
イブに対する入出力の依頼は、クォンタムを切り替えた
直後の入出力はオーダード・タスクで依頼し、2回目以
降の次のクォンタム切替えまでの入出力はシンプル・タ
スクで依頼する。
In the disk time sharing schedule shown in FIGS. 4 and 5, the input / output request to the disk drive is made by an ordered task immediately after the quantum is switched, and the second and subsequent times I / O until the next quantum change is requested by a simple task.

【0085】このようにディスクドライブ24−1,2
4−2のリ・オーダリング機能を生かすためには、クォ
ンタムを切り替えた際に現在ディスクトドライブ24−
1,24−2に依頼している入出力要求が全て完了する
までの時間を予測し、この予測時間が切り替え後のクォ
ンタム以内であれば、切り替え後にクォンタムの入出力
を依頼し、予測時間が切り替え後のクォンタムを越えて
いた場合には、切り替え後の入出力を依頼せずに次のク
ォンタムへの切り替えを待つようにする。
As described above, the disk drives 24-1 and 24-2
In order to take advantage of the re-ordering function of 4-2, when the quantum is switched, the current disk drive 24-
Predict the time until all the input / output requests requested to 1,24-2 are completed, and if the predicted time is within the quantum after switching, request quantum input / output after switching, and estimate the time. If the quantum after the switch is exceeded, the input / output after the switch is not requested, and the switching to the next quantum is waited.

【0086】これはディスク装置16のリ・オーダリン
グの恩恵を受けるためにはディスク入出力スケジュール
機構20において、できるだけ多くの入出力をディスク
装置16に依頼する環境を作るためである。
This is to create an environment in which the disk I / O schedule mechanism 20 requests the disk unit 16 for as much I / O as possible in order to benefit from the reordering of the disk unit 16.

【0087】シンプルタスクを使う場合、ディスク装置
に対して複数の入出力要求を依頼することになる。本発
明のディスクタイムシェリングは、ディスク装置での入
出力処理時間の時分割制御を目的としているので、ディ
スク装置へ入出力要求を依頼する際には、依頼された複
数の要求をディスク装置で処理するのに必要な時間を予
測し、次のクォンタムに切替えた後に切替え後のクォン
タム種別の入出力をディスク装置に投入するか否か判断
する必要がある。
When the simple task is used, a plurality of input / output requests are requested to the disk device. Since the disk time-shelling of the present invention aims at time-sharing control of the input / output processing time in the disk device, when requesting an input / output request to the disk device, a plurality of requested requests are processed by the disk device. It is necessary to predict the time required to perform the switching, and after switching to the next quantum, determine whether or not to input / output the quantum type after switching to the disk device.

【0088】このため、クォンタム切替え時に現在ディ
スクドライブに依頼している要求が次のクォンタム内で
完了して新たな入出力要求が投入できるか否かを判断す
るため残り時間τr を次式で算出する。 τr =T0 +τ−Tw −Tnow (2) 但し、T0 はクォンタム開始時刻(予測値) τはクォンタム割当時間 Tw は未処理I/O処理時間(予測値) Tnow は現在時刻 T0 =Ts +Tw (3) 但し、Ts は切替え前のクォンタム開始時刻 Tw =N×Ta (4) 但し、Nは未処理のI/O数 Ta はアクセス種別毎によるI/Oの平均処理時間 ここで未処理I/0とは、ディスク装置に入出力要求を
投入して完了応答が返っていなものをいう。この未処理
I/Oには、本発明の実施形態の場合、前未処理I/
O、前々未処理I/Oおよび全未処理I/Oがあり、そ
れぞれ直前のクォンタムの未処理I/O、2つ前のクォ
ンタムの未処理I/O、および全てのクォンタムを通じ
た未処理I/Oを意味する。
Therefore, the remaining time τr is calculated by the following equation to determine whether the request currently requested to the disk drive at the time of quantum switching is completed within the next quantum and a new input / output request can be input. I do. τr = T0 + τ−Tw−Tnow (2) where T0 is the quantum start time (predicted value), τ is the quantum allocation time Tw is the unprocessed I / O processing time (predicted value), and Tnow is the current time T0 = Ts + Tw (3) Where Ts is the quantum start time before switching Tw = N × Ta (4) where N is the number of unprocessed I / Os Ta is the average I / O processing time for each access type. Means that an I / O request is input to the disk device and no completion response is returned. In the embodiment of the present invention, the unprocessed I / O includes a pre-processed I / O.
O, there are unprocessed I / Os before and all unprocessed I / Os, respectively, the unprocessed I / O of the immediately preceding quantum, the unprocessed I / O of the previous quantum, and the unprocessed through all quantums. I / O.

【0089】またクォンタム開始時刻T0 も予測値であ
り、前クォンタムの残り時間予測により、現クォンタム
への切替えを判断した際に予測する。この時、ディスク
装置上で前クォンタムの未処理I/Oの処理が全て完了
するのに必要な時間Twを(4)式で予測し、ディスク
装置上での前クォンタムの終了時刻、即ち、現クォンタ
ムの開始時刻T0 を(3)式で予測する。
The quantum start time T0 is also a predicted value, and is predicted when the switching to the current quantum is determined based on the remaining time prediction of the previous quantum. At this time, the time Tw required to complete the processing of all unprocessed I / Os of the previous quantum on the disk device is predicted by equation (4), and the end time of the previous quantum on the disk device, that is, the current time, is calculated. The start time T0 of the quantum is predicted by equation (3).

【0090】(2)式の残り時間Trは、ディスク入出
力スケジュール機構が新たな入出力を受け付けた場合、
またはディスク装置から入出力の完了応答を受けた場合
に算出され、残り時間Tr が Tr >0 あれば、残り時間ありと判断し、現クォンタムの入出力
をディスク装置に投入する。また Tr ≦0 であれば、残り時間なしと判断し、クォンタムを切替え
る。
When the disk input / output scheduler receives a new input / output, the remaining time Tr in the equation (2)
Alternatively, it is calculated when an input / output completion response is received from the disk device. If the remaining time Tr is Tr> 0, it is determined that there is a remaining time, and the current quantum input / output is input to the disk device. If Tr ≦ 0, it is determined that there is no remaining time, and the quantum is switched.

【0091】ここで前記(2)式のの残り時間Tr の算
出に使用するディスクドライブの平均入出力処理時間T
a の算出方法は、例えば直前のn個の入出力処理時間の
平均値とする。この場合nは例えばn=10の有限値で
あってもよし、例えばn=∞つまりシステム始動時から
の総ての入出力についてでもよい。
Here, the average input / output processing time T of the disk drive used for calculating the remaining time Tr in the above equation (2)
The calculation method of a is, for example, an average value of the immediately preceding n input / output processing times. In this case, n may be a finite value of, for example, n = 10, or may be, for example, n = ∞, that is, all inputs and outputs from the start of the system.

【0092】更に入出力処理時間の平均値の算出につい
ては、入出力グループ毎に平均値を算出する方法と、全
ての入出力グループの平均値を算出する方法のいずれか
とすることができる。
Further, the calculation of the average value of the input / output processing time can be either a method of calculating the average value for each input / output group or a method of calculating the average value of all the input / output groups.

【0093】一方、大量データをアクセスする場合、ポ
ジショニング時間がデータ転送時間に比較して短いた
め、アクセスするデータ量とディスクドライブの転送能
力から平均入出力処理時間Ta を予測する。この場合、
ポジショニング時間はリ・オーダリング機能の恩恵をど
の程度受けられるか、即ちその時のディスクドライブで
のリ・オーダリング対象の入出力の数、個々の入出力要
求のアドレスの分散具合などによって違ってくるが、大
量データアクセスの場合、処理時間に占めるポジショニ
ング時間の割合が小さいため、この場合には処理時間を (平均ポジショニング時間)+(データ転送時間) と予測する。
On the other hand, when a large amount of data is accessed, the positioning time is shorter than the data transfer time. Therefore, the average input / output processing time Ta is estimated from the amount of data to be accessed and the transfer capability of the disk drive. in this case,
The positioning time depends on how much the benefit of the reordering function can be obtained, that is, the number of I / Os to be reordered in the disk drive at that time, the distribution of addresses of individual I / O requests, etc. In the case of a large amount of data access, the ratio of the positioning time to the processing time is small. In this case, the processing time is estimated as (average positioning time) + (data transfer time).

【0094】例えば転送速度が20MB/s、平均回転
待ち時間が3ms、平均シーク時間が5msのディスク
ドライブで1MBのデータをアクセスする場合、平均ポ
ジショニング時間が8msに対し、転送時間は52ms
なので、処理時間は両者を加えた60msとする。
For example, when accessing 1 MB of data with a disk drive having a transfer speed of 20 MB / s, an average rotation waiting time of 3 ms, and an average seek time of 5 ms, the transfer time is 52 ms while the average positioning time is 8 ms.
Therefore, the processing time is 60 ms, which is the sum of the two.

【0095】図6は、クォンタム切替え時の残り時間予
測の例であり、シーケンシャル・クォンタムとランダム
・クォンタムを交互に繰り返す場合について、図6
(A)〜(J)と時間が経過する場合の例である。
FIG. 6 shows an example of prediction of the remaining time at the time of quantum switching. FIG. 6 shows a case where sequential quantum and random quantum are alternately repeated.
This is an example in which time elapses from (A) to (J).

【0096】図6(A)(B)は、ランダム・クォンタ
ムからシーケンシャル・クォンタムへの切替え時に、次
のクォンタム開始時刻T0 を予測する例である。ランダ
ム・クォンタムに切替っている現在時刻Tnow で、ラン
ダム・クォンタムの残り時間不足になったとする。この
とき、前クォンタムのシーケンシャルI/Oが1要求、
現クォンタムのランダムI/Oが3要求の完了応答が返
ってきておらず、ディスク装置で処理中である。
FIGS. 6A and 6B show an example of predicting the next quantum start time T0 when switching from random quantum to sequential quantum. It is assumed that the remaining time of the random quantum is insufficient at the current time Tnow at which the random quantum has been switched. At this time, the previous quantum sequential I / O requests 1
The random I / O of the current quantum has not returned a completion response of three requests, and is being processed by the disk device.

【0097】この場合、図6(B)のように、ディスク
装置に投入している処理中I/Oが全て完了するまでの
時間Tw1を(4)式で予測し、(2)式より次のシーケ
ンシャル・クォンタムの開始時刻T0 を決定する。また
クォンタムをシーケンシャル・クォンタムに切替える。
In this case, as shown in FIG. 6B, the time Tw1 until all the processing I / Os input to the disk device are completed is predicted by the equation (4). The start time T0 of the sequential quantum is determined. In addition, the quantum is switched to the sequential quantum.

【0098】図6(C)〜(F)は、残り時間予測で、
残り時間ありと判断する例である。図6(B)でシーケ
ンシャル・クォンタムに切替わった後、ディスク入出力
スケジュール機構がシーケンシャルI/Oを現在時刻T
now で1要求受け付けたとする。この時、ディスク装置
に依頼しているI/O要求で完了応答が返ってきていな
い未処理I/Oとして、ランダムI/Oの1要求があ
る。即、ディスク装置は、前クォンタムのランダムI/
Oの1要求を処理中である。
FIGS. 6C to 6F show remaining time predictions.
This is an example in which it is determined that there is remaining time. After switching to the sequential quantum in FIG. 6B, the disk I / O scheduling mechanism changes the sequential I / O to the current time T.
Assume that one request has been received by now. At this time, there is one random I / O request as an unprocessed I / O for which a completion response has not been returned in the I / O request requested to the disk device. Immediately, the disk device uses the random I / O of the previous quantum.
One request of O is being processed.

【0099】この場合、図6(E)のように、ランダム
I/Oの1要求をディスク装置で完了するまでの時間T
w2を(4)式で予測し、図6(B)で求めたクォンタム
開始時刻T0 を使用して(2)式より残り時間Tr2を図
6(F)のように求める。この場合、Tr2>0であるこ
とから、シーケシンャルI/Oをディスク装置に投入す
ることができる。
In this case, as shown in FIG. 6E, the time T until one request for random I / O is completed by the disk device is obtained.
w2 is predicted by the equation (4), and the remaining time Tr2 is obtained as shown in FIG. 6F from the equation (2) using the quantum start time T0 obtained in FIG. 6B. In this case, since Tr2> 0, the sequential I / O can be input to the disk device.

【0100】図6(G)〜(J)は、残り時間予測で、
残り時間なしと判断する例である。さらに時間が進み、
図6(G)の現在時刻Tnow でディスク入出力スケジュ
ール機構がシーケンシャルI/Oを1要求受け付けたと
する。この時、ディスク装置に依頼しているI/O要求
で完了応答が返ってきていない未処理I/Oとして、の
シーケンシャルI/Oの1要求がある。即、ディスク装
置は、現クォンタムのシーケンシャルI/Oの1要求を
処理中である。
FIGS. 6G to 6J show remaining time predictions.
This is an example in which it is determined that there is no remaining time. Time goes further,
It is assumed that the disk input / output scheduling mechanism has received one sequential I / O request at the current time Tnow in FIG. At this time, there is one sequential I / O request as an unprocessed I / O for which a completion response has not been returned in the I / O request requested to the disk device. Immediately, the disk device is processing one request for the sequential I / O of the current quantum.

【0101】この場合、図6(I)のように、シーケン
シャルI/Oの1要求をディスク装置で完了するまでの
時間Tw3を(4)式で予測し、図6(B)で求めたクォ
ンタム開始時刻T0 を使用して(2)式より残り時間T
r3を図6(J)のように求める。この場合、Tr3<0で
あることから、残り時間なしと判断し、次のランダム・
クォンタムに切替える。
In this case, as shown in FIG. 6 (I), the time Tw3 until one sequential I / O request is completed by the disk device is predicted by equation (4), and the quantum calculated by FIG. 6 (B) is obtained. Using the start time T0, the remaining time T is obtained from equation (2).
r3 is obtained as shown in FIG. In this case, since Tr3 <0, it is determined that there is no remaining time, and the next random
Switch to quantum.

【0102】図7は、図3のディスク入出力スケジュー
ル機構20に設けた入出力スケジュール部32による本
発明のディスクタイム・シェアリング制御処理のフロー
チャートである。
FIG. 7 is a flowchart of the disk time sharing control processing of the present invention by the input / output schedule unit 32 provided in the disk input / output schedule mechanism 20 of FIG.

【0103】この入出力スケジュール部32によるディ
スクタイム・シェアリング制御処理は、入出力要求受付
部34で入出力要求部18より、ある入出力要求を受付
けた際の呼出し、或いは入出力完了処理部36でディス
ク装置16に依頼した入出力に対する完了報告があった
ときからの呼出しを受けて動作する。
The disk time sharing control processing by the input / output schedule unit 32 is performed by the input / output request receiving unit 34 when a certain input / output request is received from the input / output request unit 18 or the input / output completion processing unit. It operates in response to a call from the time when there is a completion report for the input / output requested to the disk device 16 at 36.

【0104】まず図4のスケジュールに示したように、
図3のディスク入出力スケジュール機構20において、
競合した3つの入出力グループ間でクォンタムを順番に
切替えてディスクドライブ24−1のタイムシェアリン
グを行なう場合を説明する。
First, as shown in the schedule of FIG.
In the disk input / output schedule mechanism 20 of FIG.
A case will be described in which the quantum is sequentially switched among the three competing input / output groups to perform time sharing of the disk drive 24-1.

【0105】ステップS1で現クォンタム種別に設定さ
れているクォンタム識別子i=1に対応するスケジュー
ル待ちグループキュー38−1を調べ、待ちの入出力の
有無を判定する。
In step S1, the schedule waiting group queue 38-1 corresponding to the quantum identifier i = 1 set for the current quantum type is checked to determine whether there is a waiting input / output.

【0106】スケジュール待ちグループキュー38−1
に待ちの入出力があれば、ステップS2に進み、前々ク
ォンタムに未完了の入出力があるか否かチェックする。
いま、クォンタム識別子i=1が最初のスケジュールで
あるとすると、前々クォンタムに未完了入出力はないこ
とから、ステップS3に進み、残り時間Tr を(2)式
から予測する。
Schedule waiting group queue 38-1
If there is a waiting input / output, the process proceeds to step S2, and it is checked whether there is an incomplete input / output in the quantum two months before.
Now, assuming that the quantum identifier i = 1 is the first schedule, since there is no incomplete input / output in the quantum two months before, the process proceeds to step S3, and the remaining time Tr is predicted from the equation (2).

【0107】続いてステップS4で残り時間TrがTr
>0か否かチェックし、この条件が成立する場合には残
り時間ありと判断してステップS8に進む。ステップS
4にあっては、現クォンタムのスケジュール待ちグルー
プキュー38−1の先頭の入出力をディスク装置16の
ディスク入出力処理部22を介してディスクドライブ2
4−1に依頼し、次入出力タスク種別情報48のタスク
をシンプルタクスに設定する。
Subsequently, at step S4, the remaining time Tr becomes Tr.
It is checked whether or not> 0, and if this condition is satisfied, it is determined that there is a remaining time, and the routine proceeds to step S8. Step S
4, the first input / output of the current quantum schedule waiting group queue 38-1 is transmitted to the disk drive 2 via the disk input / output processing unit 22 of the disk device 16.
4-1 and set the task of the next input / output task type information 48 to the simple task.

【0108】続いてステップS1に戻り、現クォンタム
のスケジュール待ちグループキュー38−1に待ちの入
出力があるか否かチェックし、待ちがあればステップS
2、S3,S8の処理を繰り返す。このような入出力グ
ループG1のクォンタム持ち時間τ1における入出力の
スケジュールによりステップS3でTr ≦0となり、残
り時間無しが判断されるとステップS5に進み、他の入
出力グループG2,G3のスケジュール待ちグループキ
ュー38−2,38−3に待ちの入出力があるか否かチ
ェックする。
Then, returning to step S1, it is checked whether or not there is a waiting input / output in the schedule waiting group queue 38-1 of the current quantum.
2. The processes of S3 and S8 are repeated. According to the input / output schedule of the input / output group G1 during the quantum holding time τ1, Tr ≦ 0 in step S3, and if it is determined that there is no remaining time, the process proceeds to step S5 to wait for the schedules of the other input / output groups G2, G3. It is checked whether there is a waiting input / output in the group queues 38-2 and 38-3.

【0109】このとき次の入出力グループG2のスケジ
ュール待ちグループキュー38−2に入出力の待ちがあ
るとステップS10に進み、次の入出力グループG2の
クォンタム持ち時間τ2に切替え、次入出力タスク種別
情報48について、次のタスクをオーダードに設定す
る。同時に、クォンタム現在時刻T0 を(3)式から予
測し、予測したT0 を現クォンタム開始時刻に設定す
る。
At this time, if there is an input / output waiting in the schedule waiting group queue 38-2 of the next input / output group G2, the process proceeds to step S10, and the next input / output group G2 is switched to the quantum holding time τ2. For the type information 48, the next task is set to ordered. At the same time, the quantum current time T0 is predicted from equation (3), and the predicted T0 is set as the current quantum start time.

【0110】これにより最初の入出力グループG1のク
ォンタム持ち時間τ1から次の入出力グループG2のク
ォンタム持ち時間τ2への切替えが行われ、再びステッ
プS1に戻り、クォンタム切替えに伴う次の入出力グル
ープG2をステップS2,S3,S4,S8により処理
する。
As a result, the switching from the quantum holding time τ1 of the first input / output group G1 to the quantum holding time τ2 of the next input / output group G2 is performed, and the process returns to step S1 again. G2 is processed by steps S2, S3, S4 and S8.

【0111】この時、ステップS10で次のタスクをオ
ーダードに設定しているため、クォンタム切替え後の最
初の入出力はオーダードの指定でディスクドライブ24
−1に依頼される。依頼が済んだならば次入出力タスク
種別情報48のタスクをシンプルに設定する。
At this time, since the next task is set to ordered in step S10, the first input / output after the quantum switching is performed by designating the ordered disk drive 24.
-1. When the request is completed, the task of the next input / output task type information 48 is simply set.

【0112】次に図5に示したように1つの入出力グル
ープ、例えば入出力グループG1の入出力要求が連続し
た場合の処理を説明する。同じ入出力グループG1の入
出力要求の受付けが連続した場合には、ステップS1〜
S4の処理をクォンタムt1で繰り返して同じ入出力グ
ループの入出力要求をディスクドライブ24−1に依頼
し、この間にステップS4で残り時間無しが判別される
とステップS5に進み、他の入出力グループのスケジュ
ール待ちグループキュー38−2,38−3に待ちの入
出力があるか否かチェックする。
Next, a description will be given of a process when input / output requests of one input / output group, for example, the input / output group G1 are continuous as shown in FIG. If the input / output requests of the same input / output group G1 are continuously received, steps S1 to S1 are executed.
The process of S4 is repeated at the quantum t1 to request an input / output request of the same input / output group to the disk drive 24-1. It is checked whether or not there is a waiting input / output in the schedule waiting group queues 38-2 and 38-3.

【0113】この時、他の入出力グループG2,G3の
スケジュール待ちクループキュー38−2,38−3に
待ちの入出力がなく空であった場合には、ステップS9
に進み、現クォンタム持ち時間τ1をリセットし次のタ
スクをオーダードに設定し、同時に、クォンタム現在時
刻To を予測して現クォンタム開始時刻に設定し、ステ
ップS1に戻る。この場合、現クォンタム種別はそのま
まとする。
At this time, if there is no waiting input / output in the schedule waiting group queues 38-2 and 38-3 of the other input / output groups G2 and G3, the process goes to step S9.
Then, the current quantum holding time τ1 is reset and the next task is set to ordered. At the same time, the current quantum time To is predicted and set to the current quantum start time, and the process returns to step S1. In this case, the current quantum type is left as it is.

【0114】このため現クォンタム持ち時間τ1をリセ
ットした後の次のクォンタムも同じクォンタム持ち時間
τ1となり、入出力グループG1の入出力要求が続いて
いる場合には、同じクォンタムτ1が継続される。
For this reason, the next quantum after resetting the current quantum holding time τ1 has the same quantum holding time τ1, and when the input / output request of the input / output group G1 continues, the same quantum τ1 is continued.

【0115】一方、図5の時刻t2以降に示すように時
刻t0〜t2の間に同一入出力グループG1の入力要求
が連続してクォンタムt1,t2がリセットにより継続
し、時刻t2までに残り2つの入出力グループG2,G
3の入出力要求が受付けられてスケジュール待ちグルー
プキュー38−2,38−3に格納されていると、次の
入出力グループG2のクォンタム持ち時間τ2への切替
えが行われる。
On the other hand, as shown after time t2 in FIG. 5, the input requests of the same input / output group G1 are continuously made between times t0 and t2, and the quantum t1 and t2 are continued by the reset, and the remaining two are left by time t2. I / O groups G2 and G
When the input / output request of No. 3 is received and stored in the schedule waiting group queues 38-2 and 38-3, the next input / output group G2 is switched to the quantum holding time τ2.

【0116】しかしながら、図5の時刻t3のようにク
ォンタム持ち時間τ2の途中で入出力グループG2のス
ケジュール待ちグループキュー38−2が空になってス
テップS1で待ちキュー無しが判別されると、ステップ
S6に進み、他のクォンタムについてスケジュール待ち
グループキュー38−1,38−3に待ちの入出力があ
るか否かチェックする。
However, when the schedule waiting group queue 38-2 of the input / output group G2 becomes empty in the middle of the quantum holding time τ2 as shown at time t3 in FIG. Proceeding to S6, it is checked whether or not there is a waiting input / output in the schedule waiting group queues 38-1 and 38-3 for another quantum.

【0117】この時、他のクォンタムに待ちの入出力が
あればステップS10に進み、全てのクォンタムに未完
了の入出力があるか否かチェックし、無ければステップ
S11に進み、次の入出力グループG3のクォンタム持
ち時間τ3に切替え、次タスクをオーダードに設定し、
更に、クォンタム開始時刻T0 を予測して設定し、ステ
ップS1に戻ることで切替え後の入出力グループG3の
最初の入出力要求をオーダードでディスクドライブ24
−1にステップS1〜S4,S8の処理を通じて依頼す
ることになる。
At this time, if there is a waiting input / output in another quantum, the process proceeds to step S10, and it is checked whether all quantums have an uncompleted input / output. If not, the process proceeds to step S11 and the next input / output is performed. Switch to quantum hold time τ3 of group G3, set next task to ordered,
Further, the quantum start time T0 is predicted and set, and by returning to step S1, the first I / O request of the I / O group G3 after switching is ordered to the disk drive 24.
-1 through the processing of steps S1 to S4 and S8.

【0118】ここで図3でシーケンシャルアクセスとラ
ンダムアクセスについて入出力をグループを形成する場
合には、入出力要求部18にシーケンシャルアクセス検
出機構45を設けている。例えばRAID制御部26に
対する入出力依頼インターフェースに、シーケンシャル
アクセス検出機構45で検出したシーケンシャルアクセ
スの入出力であることを通知するインターフェースを追
加する。
Here, in the case of forming a group of input / output for sequential access and random access in FIG. 3, a sequential access detection mechanism 45 is provided in the input / output request unit 18. For example, an interface for notifying the input / output of the sequential access detected by the sequential access detection mechanism 45 to the input / output request interface to the RAID control unit 26 is added.

【0119】シーケンシャルアクセス検出機構45は、
図2に示した上位のデバイス制御装置12から発行され
た入出力コマンドに含まれるアドレスとデータ長から次
の入出力コマンドのアドレスを認識しており、次の入出
力コマンドのアドレスが予測したアドレスに一致した場
合には、シーケンシャルアクセスを検出し、シーケンシ
ャルアクセスを示すフラグなどの情報をインタフェース
によりRAID制御部26を介してディスク入出力スケ
ジュール機構20の入出力要求受付部34に発行する。
The sequential access detection mechanism 45
The address of the next input / output command is recognized from the address and the data length included in the input / output command issued from the upper device control device 12 shown in FIG. 2, and the address of the next input / output command is predicted. If it is determined that the sequential access is detected, the sequential access is detected, and information such as a flag indicating the sequential access is issued to the input / output request receiving unit 34 of the disk input / output schedule mechanism 20 via the RAID control unit 26 through the interface.

【0120】このため入出力要求受付部34にあって
は、入出力要求部18から受付けた入出力要求につい
て、シーケンシャルアクセスかランダムアクセスかを認
識することができる。
Therefore, the input / output request receiving unit 34 can recognize whether the input / output request received from the input / output request unit 18 is sequential access or random access.

【0121】またコピー/バックアップ処理の入出力グ
ループを形成する場合には、入出力要求部18にバック
アップ機構78を設けている。バックアップ機構78か
らの入出力は、バックアップ入出力を通知するための追
加インターフェースによりRAID制御部26に通知さ
れる。RAID制御部26は、ディスク入出力スケジュ
ール機構20への入出力依頼時に、バックアップの入出
力であることを伝え、コピー処理/バックアップ処理の
入出力グループについてディスクタイムシェアリングを
行う。
When forming an input / output group for copy / backup processing, a backup mechanism 78 is provided in the input / output request unit 18. The input / output from the backup mechanism 78 is notified to the RAID controller 26 by an additional interface for notifying the backup input / output. The RAID control unit 26 informs that it is a backup input / output at the time of the input / output request to the disk input / output schedule mechanism 20, and performs disk time sharing for the input / output group of the copy processing / backup processing.

【0122】更に、リビルディング処理の入出力グルー
プを形成する場合は、入出力要求部18にリビルディン
グ機構84を設けている。リビルディング処理の際に
は、RAID制御部26に対する入出力要求につき、リ
ビルディング処理であることを示すインターフェースを
追加している。RAID制御部26はディスク入出力ス
ケジュール機構20に入出力を依頼する際に、リビルデ
ィング入出力の通知を行ない、リビルディング処理の入
出力グループについてディスクタイムシェアリングを行
う。
Further, when forming an input / output group for the rebuilding process, the input / output request unit 18 is provided with a rebuilding mechanism 84. At the time of the rebuilding process, an interface indicating that the input / output request to the RAID control unit 26 is the rebuilding process is added. When requesting input / output from the disk input / output schedule mechanism 20, the RAID control unit 26 notifies the input / output of the rebuilding input / output and performs disk time sharing for the input / output group of the rebuilding process.

【0123】図8は図2のチューニング機構50の機能
ブロック図である。図8において、チューニング機構5
0は、チューニング部52と基礎データファイル54で
構成されている。チューニング部52には要求性能設定
部56と動作条件決定部58が設けられる。
FIG. 8 is a functional block diagram of the tuning mechanism 50 of FIG. In FIG. 8, the tuning mechanism 5
0 is composed of a tuning unit 52 and a basic data file 54. The tuning unit 52 includes a required performance setting unit 56 and an operation condition determining unit 58.

【0124】要求性能設定部56はユーザによるランダ
ムアクセスの平均レスポンスAveと最大レスポンスM
ax及びシーケンシャルアクセスのスループットThP
を受け付け、更に図2のアレイディスク装置14側のデ
ィスク入出力スケジュール機構20側で観測したランダ
ムアクセスの負荷状態IOPSを入手し、動作条件決定
部58に出力する。尚、ランダムアクセスの負荷状態I
OPSは直接、動作条件決定部58に供給してもよい。
The required performance setting unit 56 calculates the average response Ave and the maximum response M of random access by the user.
ax and sequential access throughput ThP
The random access load state IOPS observed by the disk input / output schedule mechanism 20 of the array disk device 14 shown in FIG. 2 is obtained and output to the operating condition determination unit 58. The load state I of random access
The OPS may be directly supplied to the operation condition determining unit 58.

【0125】動作条件決定部58は、要求性能設定部5
6で設定した要求性能値を満足するタイムシェアリング
周期TSとランダムアクセスとシーケンシャルアクセス
のクォンタム比率のRS比を調整値として決定し、図2
のディスク入出力スケジュール機構20のタイムシェア
リング周期TSと各グループのクォンタムを自動的に調
整する。
The operating condition determining unit 58 is configured to set the required performance setting unit 5
The time sharing period TS that satisfies the required performance value set in 6 and the RS ratio of the quantum ratio of random access and sequential access are determined as adjustment values.
Automatically adjusts the time sharing cycle TS of the disk input / output scheduling mechanism 20 and the quantum of each group.

【0126】基礎データファイル54には、平均レスポ
ンス用の第1基礎データ62、最大レスポンス用の第2
基礎データ64及びスループット用の第3基礎データ6
6が格納されている。
The basic data file 54 includes first basic data 62 for average response and second basic data 62 for maximum response.
Basic data 64 and third basic data 6 for throughput
6 is stored.

【0127】図9は図8の基礎データファイル54に格
納している各基礎データのデータ構造を示す。このデー
タ構造で格納されている基礎データはシミュレーション
あるいは実測値により得られたデータである。
FIG. 9 shows the data structure of each basic data stored in the basic data file 54 of FIG. The basic data stored in this data structure is data obtained by simulation or actual measurement.

【0128】図9(A)は、ランダムアクセスの平均レ
スポンスに関する第1基礎データ62であり、ランダム
アクセスの負荷IOPSごとに分けて、対応する基礎デ
ータを格納している。例えば負荷IOPS=100,1
50について平均レスポンスに関する基礎データを格納
している。
FIG. 9A shows the first basic data 62 relating to the average response of random access, which stores the corresponding basic data for each random access load IOPS. For example, load IOPS = 100,1
For 50, basic data on the average response is stored.

【0129】負荷IOPS=100を例にとると、タイ
ムシェアリング周期TS=100ms,200ms,3
00msとRS比=90%,80%,70%の組合せに
応じた平均レスポンス時間が基礎データとして格納され
ている。同様に負荷IOPS=150についても、3つ
のタイムシェアリング周期TSと3つのRS比の組合せ
に対応して平均レスポンスが格納されている。
Taking the load IOPS = 100 as an example, the time sharing period TS = 100 ms, 200 ms, 3
The average response time corresponding to the combination of 00 ms and RS ratio = 90%, 80%, 70% is stored as basic data. Similarly, for load IOPS = 150, an average response is stored corresponding to a combination of three time sharing periods TS and three RS ratios.

【0130】図9(B)は、ランダムアクセスの最大レ
スポンスに関する第2基礎データ64であり、図9
(A)の平均レスポンスの基礎データ62と同様、ラン
ダムアクセスの負荷IOPS=100,150に分けて
基礎データを格納している。それぞれの基礎データはタ
イムシェアリング周期TS=100ms,200ms,
300msとRS比=90%,80%,70%の組合せ
に対応して、最大レスポンスを基礎データとして格納し
ている。
FIG. 9B shows the second basic data 64 relating to the maximum response of the random access.
Similar to the basic data 62 of the average response in (A), the basic data is stored separately for random access loads IOPS = 100 and 150. Each basic data has a time sharing cycle TS = 100 ms, 200 ms,
The maximum response is stored as basic data corresponding to the combination of 300 ms and RS ratio = 90%, 80%, 70%.

【0131】図9(C)は、シーケンシャルアクセスの
スループットThPに関する第3基礎データ66であ
り、このスループットに関してはランダムアクセスの負
荷IOPSには関わらず、タイムシェアリング周期TS
とRS比の組合せに対応したスループットが基礎データ
として格納されている。
FIG. 9C shows the third basic data 66 related to the sequential access throughput ThP. Regarding this throughput, regardless of the random access load IOPS, the time sharing period TS
And the throughput corresponding to the combination of RS and RS ratio is stored as basic data.

【0132】次に図8の動作条件決定部58によるチュ
ーニング処理を図9の基礎データを例にとって説明する
と次のようになる。まず要求性能設定部56から平均レ
スポンス、最大レスポンス、スループットの順に優先度
が指示されており、このときユーザの要求値が次の値で
あったとする。 ・平均レスポンスAve=40ms以下 ・最大レスポンスMax=80ms以下 ・スループットThP=3.0MB/s以上 また、このときのランダムアクセスの負荷状態の観測値
が100IOPSであったとする。
Next, a description will be given of the tuning processing by the operating condition determining unit 58 in FIG. 8 with reference to the basic data in FIG. 9 as an example. First, it is assumed that the priority is instructed from the required performance setting unit 56 in the order of the average response, the maximum response, and the throughput, and the request value of the user at this time is the following value. -Average response Ave = 40 ms or less-Maximum response Max = 80 ms or less-Throughput ThP = 3.0 MB / s or more Also, assume that the observed value of the random access load state at this time is 100 IOPS.

【0133】図10は、このような要求性能及び優先度
が設定された状態でのチューニング処理の手順を表して
いる。まず最も優先度が高い平均レスポンスに関し、図
9(A)の第1基礎データ62の中の負荷IOPS=1
00のデータを図10の第1基礎データ62Aのように
抽出し、この第1基礎データ62Aの中から平均レスポ
ンスAveが要求性能値である40ms以下となる斜線
の領域を抽出する。
FIG. 10 shows the procedure of the tuning process in a state where such required performance and priority are set. First, regarding the average response having the highest priority, the load IOPS = 1 in the first basic data 62 in FIG.
00 is extracted as the first basic data 62A in FIG. 10, and a hatched area where the average response Ave is equal to or less than the required performance value of 40 ms is extracted from the first basic data 62A.

【0134】次に図9(B)の第2基礎データ64の中
からランダムアクセスの負荷IOPS=100のデータ
を図10の第2基礎データ64Aのように抽出し、ユー
ザが要求した最大レスポンス80ms以下を達成できる
斜線部の領域を獲得する。続いて共通領域検査部71で
第1基礎データ62Aの斜線部と第2基礎データ64A
の斜線部の比較で、平均レスポンスと最大レスポンスの
両方のユーザ要求を達成する第1共通データ68に示す
斜線部の領域を獲得する。
Next, data of random access load IOPS = 100 is extracted from the second basic data 64 of FIG. 9B as the second basic data 64A of FIG. 10, and the maximum response 80 ms requested by the user is 80 ms. Obtain the shaded area where you can achieve: Subsequently, the shaded portion of the first basic data 62A and the second basic data 64A are output by the common area inspection unit 71.
In the comparison of the hatched portions, the area of the hatched portion indicated by the first common data 68 that achieves both the average response and the maximum response user request is obtained.

【0135】次に優先度が最も低い図9(C)のスルー
プットに関する第3基礎データ66について、3.0M
B/s以上とするスループットのユーザ要求を達成でき
る領域を、図10の第3基礎データ66の斜線部に示す
ように獲得する。
Next, with respect to the third basic data 66 relating to the throughput of FIG.
An area in which the user request of the throughput of B / s or more can be achieved is obtained as shown by the shaded portion of the third basic data 66 in FIG.

【0136】最終的に第1共通データ68の平均レスポ
ンスと最大レスポンスのユーザ要求を達成している斜線
部の領域と、第3基礎データ66のスループットのユー
ザ要求を達成している斜線部の領域との比較により、平
均レスポンス、最大レスポンス及びスループットの全て
のユーザ要求を達成できる領域の共通部分を、第2共通
データ70の斜線部のように獲得する。
Finally, the hatched area where the user request of the average response and the maximum response of the first common data 68 is achieved, and the hatched area where the user request of the throughput of the third basic data 66 is achieved As a result, the common portion of the area where all the user requests of the average response, the maximum response, and the throughput can be achieved is obtained as shown by the shaded portion of the second common data 70.

【0137】以上の結果から第2共通データ70の斜線
部の領域に対応するタイムシェアリング周期TS=30
0msとRS比=90%の組合せが、平均レスポンス、
最大レスポンス及びスループットの全てのユーザ要求を
達成できる調整値として決定され、図2のディスク入出
力スケジュール機構20に設定されてタイムシェアリン
グの動作条件を自動的に調整する。
From the above results, the time sharing period TS = 30 corresponding to the shaded area of the second common data 70
The combination of 0 ms and RS ratio = 90% is the average response,
The maximum response and the throughput are determined as adjustment values that can achieve all user requests, and are set in the disk input / output scheduling mechanism 20 in FIG. 2 to automatically adjust the operating conditions of time sharing.

【0138】例えばディスク入出力スケジュール機構2
0において、ランダムアクセスとシーケンシャルアクセ
スの2グループのタイムシェアリングを行っていた場合
には、タイムシェアリング周期TS=300msの設定
と同時にRS比=90%に基づいて、ランダムアクセス
のクォンタムが270ms、シーケンシャルアクセスの
クォンタムが30msに設定される。
For example, disk input / output schedule mechanism 2
0, when time sharing of two groups of random access and sequential access is performed, the quantum of random access is set to 270 ms based on the RS ratio = 90% at the same time as setting the time sharing cycle TS = 300 ms. The quantum of the sequential access is set to 30 ms.

【0139】図11は図8のチューニング処理のフロー
チャートである。まずステップS1でユーザ要求の優先
度の高い方から順に要求性能の基礎データを獲得する。
例えば平均レスポンス、最大レスポンス、スループット
の順に優先度が設定されていた場合には、まず平均レス
ポンスについての基礎データを獲得する。
FIG. 11 is a flowchart of the tuning process of FIG. First, in step S1, the basic data of the required performance is acquired in the order of the priority of the user request.
For example, when the priorities are set in the order of the average response, the maximum response, and the throughput, first, basic data on the average response is obtained.

【0140】続いてステップS2について、ユーザ要求
値を達成できる設定が可能な領域を基礎データについて
獲得する。続いてステップS3でユーザ要求を達成でき
る要求がある場合には、ステップS4に進み、現在処理
している基礎データが最優先の要求性能の項目か否か判
定する。
Subsequently, in step S2, an area in which setting that can achieve the user request value can be set is obtained for the basic data. Subsequently, if there is a request that can satisfy the user request in step S3, the process proceeds to step S4, and it is determined whether or not the basic data currently being processed is an item of the highest priority required performance.

【0141】最優先の要求性能であった場合には、最初
のデータ領域であるために共通領域を判定することがで
きないので、ステップS1に戻り、次の要求性能につい
ての要求達成領域の獲得をステップS1〜S3で行う。
2番目以降の優先度の要求性能であった場合にはステッ
プS5に進み、既に獲得している要求性能の領域を獲得
して新たな共通領域とする。
If the requested performance has the highest priority, the common area cannot be determined because it is the first data area. Therefore, the process returns to step S1 to acquire the requested area for the next required performance. This is performed in steps S1 to S3.
If the requested performance has the second or higher priority, the process proceeds to step S5, and the area of the requested performance that has already been obtained is obtained as a new common area.

【0142】続いてステップS6で共通領域が獲得でき
たか否かチェックし、獲得できればステップS7に進
む。ステップS7にあっては、次のユーザ要求性能の項
目がある場合にはステップS1に戻り、ない場合にはス
テップS8に進む。ステップS8にあっては、最終的に
得られた複数の要求性能の共通領域から最優先の要求性
能の項目が最も良い値をとる組合せを選択する。
Subsequently, it is checked in step S6 whether or not the common area has been obtained. If the common area has been obtained, the flow advances to step S7. In step S7, if there is the next item of the user required performance, the process returns to step S1, and if not, the process proceeds to step S8. In step S8, from the finally obtained common area of the plurality of required performances, a combination in which the item of the highest priority required performance takes the best value is selected.

【0143】ここでステップS8の最善の組合せ選択
で、例えば平均レスポンス、最大レスポンス、スループ
ットの3つの要求性能について全ての要求を満足するタ
イムシェアリング周期TSとRS比の組合せが1または
複数ある場合には問題ないが、下位の要求性能が達成で
きていない場合には、例えば第1モード〜第4モードの
いずれかのモードによる調整値の決定を行う。例えば上
位の平均レスポンス及び最大レスポンスについては要求
性能を満足したが下位のスループットについては要求性
能が達成できない場合には、モード1〜4の処理は次の
ようになる。
Here, in the selection of the best combination in step S8, for example, when there is one or more combinations of the time sharing period TS and the RS ratio that satisfy all of the three required performances of the average response, the maximum response, and the throughput. Although there is no problem in the above, when the lower required performance is not achieved, the adjustment value is determined in any one of the first to fourth modes, for example. For example, if the required performance is satisfied for the upper average response and the maximum response but the required performance cannot be achieved for the lower throughput, the processing in modes 1 to 4 is as follows.

【0144】(1)上位の優先度となる平均レスポンス
と最大レスポンスを達成できる設定範囲で下位のスルー
プットの要求性能が達成できない場合、下位のスループ
ットは考慮しないで調整値を決定する。
(1) When the required performance of the lower throughput cannot be achieved within the setting range in which the average response and the maximum response as the upper priority can be achieved, the adjustment value is determined without considering the lower throughput.

【0145】(2)第2モードは、上位の優先度をもつ
平均レスポンスと最大レスポンスが達成できる設定範囲
では下位のスループットの要求性能が達成できない場合
も、下位のスループットの要求性能を考慮して調整値を
決定する。
(2) In the second mode, even when the required performance of the lower throughput cannot be achieved within the setting range in which the average response and the maximum response having the higher priority can be achieved, the required performance of the lower throughput is considered. Determine the adjustment value.

【0146】(3)第3モードは、上位の優先度をもつ
平均レスポンスと最大レスポンスの要求性能が達成でき
る設定範囲では下位のスループットの要求性能が達成で
きない場合に、上位の平均レスポンスと最大レスポンス
の共通領域の設定範囲内から下位のスループットの性能
が最善になる調整値を選択する。
(3) In the third mode, when the required performance of the lower throughput cannot be achieved within the setting range in which the required performance of the average response and the maximum response having the higher priority can be achieved, the upper average response and the maximum response can be achieved. From the setting range of the common area, the adjustment value that maximizes the performance of the lower throughput is selected.

【0147】(4)第4モードは、上位の優先度をもつ
平均レスポンスと最大レスポンスが達成できる設定範囲
では下位のスループットの要求性能が達成できない場合
に、上位の平均レスポンスと最大レスポンスの共通領域
の設定範囲から下位のスループットの性能が良くなる候
補を複数点選択し、選択した候補の中から上位の平均レ
スポンス及び最大レスポンスが最大になる調整値を選択
する。
(4) In the fourth mode, when the required performance of the lower throughput cannot be achieved within the setting range in which the average response and the maximum response having the higher priority can be achieved, the common area of the upper average response and the maximum response is used. From the set range, a plurality of candidates for which the performance of the lower throughput is improved are selected, and an adjustment value at which the higher average response and the maximum response are maximized is selected from the selected candidates.

【0148】図12は、上位の優先度の要求性能を達成
できる設定範囲で下位の要求性能が達成できない場合の
調整値の決定の具体例を示している。ここでユーザの要
求性能は図9の場合と同様、 ・平均レスポンスAve=40ms以下 ・最大レスポンスMax=80ms以下 ・スループットThP=3.0MB/s以上 である。
FIG. 12 shows a specific example of the adjustment value determination when the lower required performance cannot be achieved within the setting range in which the higher priority required performance can be achieved. Here, the required performance of the user is the same as in the case of FIG. 9:-Average response Ave = 40 ms or less-Maximum response Max = 80 ms or less-Throughput ThP = 3.0 MB / s or more.

【0149】また平均レスポンスの第1基礎データ6
2、最大レスポンスの第2基礎データ64は、図9
(A)(B)と同じデータである。これに対しスループ
ットに関する第3基礎データ66が図9(C)の場合と
若干異なっており、図13の第3基礎データ660とな
っている。相違点はタイムシェアリング周期TS=30
0msとRS比=90%の組合せについて、スループッ
トが2.6MB/sとなっている点である。
The first basic data 6 of the average response
2. The second basic data 64 of the maximum response is shown in FIG.
(A) Same data as (B). On the other hand, the third basic data 66 regarding the throughput is slightly different from the case of FIG. 9C, and is the third basic data 660 of FIG. The difference is that the time sharing period TS = 30
The point is that the throughput is 2.6 MB / s for the combination of 0 ms and RS ratio = 90%.

【0150】この図13のチューニング処理にあって
は、平均レスポンス40ms以下を抽出した第1基礎デ
ータ62Aの斜線部の領域と最大レスポンス80ms以
下を抽出した第2基礎データ64Aの斜線部の領域につ
いての共通領域検査部71による判断で第1共通データ
が得られている点は、図10と同じである。
In the tuning processing shown in FIG. 13, the shaded area of the first basic data 62A extracted from the average response of 40 ms or less and the shaded area of the second basic data 64A extracted from the maximum response of 80 ms or less. The point that the first common data is obtained by the judgment of the common area inspection unit 71 is the same as that of FIG.

【0151】これに対しスループットの第3基礎データ
660についてはユーザ要求のスループットを満足する
領域が斜線部となっており、共通領域検査部72による
第1共通データ68による検出結果としての第2基礎デ
ータ720にあっては、平均レスポンス、最大レスポン
ス及びスループットの全てのユーザ要求を達成できる領
域は獲得できない。
On the other hand, with respect to the third basic data 660 of the throughput, the area satisfying the throughput requested by the user is indicated by oblique lines, and the second basic data as the detection result of the first common data 68 by the common area inspection unit 72 is obtained. In the data 720, an area where all the user requests of the average response, the maximum response, and the throughput can be achieved cannot be obtained.

【0152】このような場合、モード1にあっては下位
のスループットの要求性能は考慮しないことから、第1
共通データ68Aの斜線部の共通領域のいずれか1つを
選択する。また第2モードでは第1共通データ68Aの
中の斜線部の共通領域の選択において、下位のスループ
ットの第3基礎データ660を考慮し、スループットが
最大となる3.6MB/sに対応した共通領域について
のタイムシェアリング周期TS=300msとRS比=
90%の組合せを選択する。
In such a case, since the required performance of the lower throughput is not considered in the mode 1, the first
One of the shaded common areas of the common data 68A is selected. In the second mode, when selecting the shaded common area in the first common data 68A, the third basic data 660 of the lower throughput is taken into consideration, and the common area corresponding to 3.6 MB / s at which the throughput is maximized. Time sharing cycle TS = 300 ms and RS ratio =
Select 90% combination.

【0153】また第3モードの場合は、第1共通データ
68Aの3つの共通領域に対応する下位のスループット
の第3基礎データ660の中の対応する領域の中からス
ループットの改善が最善となる2.6MB/sに対応し
たタイムシェアリング周期TS=300msとRS比=
90%を選択する。この場合にはモード3はモード2の
場合と同じ選択結果となっている。
In the case of the third mode, the improvement of the throughput is the best among the corresponding areas in the third basic data 660 of the lower throughput corresponding to the three common areas of the first common data 68A. Time sharing period TS = 300 ms corresponding to .6 MB / s and RS ratio =
Select 90%. In this case, mode 3 has the same selection result as in mode 2.

【0154】図13は上位の優先度の要求性能を達成で
きる設定範囲では下位の要求性能が達成できない場合の
モード4による調整値の選択処理の説明図である。
FIG. 13 is an explanatory diagram of the adjustment value selection processing in mode 4 when the lower required performance cannot be achieved in the setting range in which the required performance of the higher priority can be achieved.

【0155】図13にあっては、優先度が最も低いスル
ープットの第3基礎データ660におけるタイムシェア
リング周期TS=200ms,300msとRS比=9
0%の組合せに格納しているデータが3.4MB/s、
3.6MB/sと、図12の場合と異なっている。
In FIG. 13, the time sharing periods TS = 200 ms and 300 ms and the RS ratio = 9 in the third basic data 660 of the lowest priority throughput.
The data stored in the 0% combination is 3.4 MB / s,
3.6 MB / s, which is different from the case of FIG.

【0156】また図13の場合のユーザの要求値は ・平均レスポンスAve=40ms以下 ・最大レスポンスMax=80ms以下 ・スループットThP=4.0MB/s以上 と、スループットが図12に対し高めの要求となってい
る。
In the case of FIG. 13, the request values of the user are as follows: average response Ave = 40 ms or less; maximum response Max = 80 ms or less; throughput ThP = 4.0 MB / s or more. Has become.

【0157】このような場合についても、図12と同
様、第2共通データ720には平均レスポンス、最大レ
スポンス及びスループットの全てのユーザ要求を達成で
きる領域は存在しない。この場合、第4モードにあって
は、平均レスポンスと最大レスポンスの共通領域を獲得
した第1共通データ68の3つの斜線部の領域に対応す
るスループットの第3基礎データ660の中から下位の
スループットの性能が良くなる領域の候補を複数点選択
する。
Also in this case, as in FIG. 12, there is no area in the second common data 720 in which all user requests of the average response, the maximum response, and the throughput can be achieved. In this case, in the fourth mode, the lower throughput from the third basic data 660 of the throughput corresponding to the three shaded areas of the first common data 68 that has acquired the common area of the average response and the maximum response. A plurality of points are selected as candidates for a region in which the performance of is improved.

【0158】この場合にはスループット3.4MB/s
と3.6MB/sの2点が選択される。このように選択
した2つの候補の中から上位の平均レスポンス及び最大
レスポンスの性能が最善となる候補を選択する。即ち、
第1基礎データ62Aで平均レスポンスが25ms、第
2基礎データ64Aで最大レスポンスが60msとなる
タイムシェアリング周期TS=200msとRS比90
%の組が選択される。
In this case, the throughput is 3.4 MB / s
And 3.6 MB / s are selected. From the two candidates selected in this way, the candidate having the highest average response and maximum response performance is selected. That is,
The time sharing period TS = 200 ms and the RS ratio 90 at which the average response is 25 ms in the first basic data 62A and the maximum response is 60 ms in the second basic data 64A
A set of% is selected.

【0159】図14は、図8において自動チューニング
を行わない場合のシミュレーション結果の特性図であ
る。
FIG. 14 is a characteristic diagram of a simulation result when automatic tuning is not performed in FIG.

【0160】このシミュレーションにあっては、ランダ
ムアクセス、シーケンシャルアクセス、OPCアクセス
(コピーアクセス)、ECアクセス(エラーアクセス)
の4つの入出力グループについて、それぞれ4つのクォ
ンタムを設定してタイムシェアリングを行っている。ま
たランダムアクセスとシーケンシャルアクセスは同一の
グループに属する。他のOPCアクセスとECアクセス
は全て独立したグループに属する。
In this simulation, random access, sequential access, OPC access (copy access), EC access (error access)
For each of the four input / output groups, four quanta are set for time sharing. Random access and sequential access belong to the same group. All other OPC accesses and EC accesses belong to independent groups.

【0161】またシミュレーションにあっては、シーケ
ンシャル入出力要求が流れないようにしているため、同
じグループに属しているシーケンシャルアクセスのクォ
ンタムは全てランダムアクセスのクォンタムに使用され
る。
In the simulation, since sequential input / output requests are prevented from flowing, all the quanta of sequential access belonging to the same group are used for the quanta of random access.

【0162】各クォンタムの時間比は (ランダム):(シーケンシャル):(OPC):(E
C)=65:5:15:15 となる。ここでシーケンシャルクォンタムについては入
出力要求がないため、実質的には (ランダム):(OPC):(EC)=70:15:1
5 となっている。またタイムシェアリング周期TSは10
0msとしている。更にランダムアクセスは7.5ms
ごとに負荷を20IOPS,100IOPS,220I
OPS,100IOPSとして、この振幅を繰り返して
いる。更に、図15は、図14のシミュレーション開始
時間0〜100ms部分の拡大図である。
The time ratio of each quantum is (random): (sequential): (OPC): (E
C) = 65: 5: 15: 15. Since there is no input / output request for the sequential quantum, (Random) :( OPC) :( EC) = 70: 15: 1
5 The time sharing cycle TS is 10
0 ms. Furthermore, random access is 7.5ms
Load 20 IOPS, 100 IOPS, 220I for each
This amplitude is repeated as OPS, 100 IOPS. FIG. 15 is an enlarged view of the simulation start time 0 to 100 ms in FIG.

【0163】図14,図15の自動チューニングを行っ
ていない場合については、最も高くなる220IOPS
のランダムアクセスの負荷を処理しきれず、最高でもA
部のように200IOPSのランダムアクセスしか処理
することができない。
When the automatic tuning shown in FIGS. 14 and 15 is not performed, the highest 220 IOPS is obtained.
Can't handle the random access load of
It can process only the random access of 200 IOPS like the unit.

【0164】またランダムアクセスの平均レスポンス
(R Ave)は、負荷が高いときはB部のように12
0ms前後であり、最悪の場合はC部のように150m
s強まで悪化する。
When the load is high, the average response (R Ave) of random access is 12
0ms, worst case 150m
Deterioration up to s.

【0165】図16は、本発明による自動チューニング
を行った場合のシミュレーション結果であり、図17に
図16の0〜100ms付近を拡大して示している。
FIG. 16 shows a simulation result when the automatic tuning according to the present invention is performed. FIG. 17 shows an enlarged view of the vicinity of 0 to 100 ms in FIG.

【0166】このシミュレーションにおけるランダムア
クセスの負荷IOPSの与え方は図14の場合と同じで
あり、またタイムシェアリング周期TSと各クォンタム
の時間比は、要求性能は固定であるが負荷IOPSの観
測値により自動的に変動する。また自動チューニングの
設定ではユーザ要求の優先度として、平均レスポンス、
最大レスポンス、スループットの順とすることで、ラン
ダムアクセス優先のチューニングとしている。
The way of giving the random access load IOPS in this simulation is the same as that of FIG. 14. The time sharing period TS and the time ratio of each quantum are such that the required performance is fixed, but the observed value of the load IOPS. Automatically fluctuates due to In the automatic tuning setting, the average response,
By arranging the maximum response and the throughput in this order, tuning for random access is performed.

【0167】この結果、図16,図17の自動チューニ
ングした場合については、A部のように220IOPS
のランダムアクセスの負荷を概ね処理することができて
いる。また負荷IOPSが高いときの平均レスポンスも
B部のように50ms前後であり、最悪でもC部のよう
に60ms強という値に抑えられている。
As a result, in the case of the automatic tuning shown in FIGS.
Can almost handle the random access load. Also, the average response when the load IOPS is high is about 50 ms as in the part B, and is suppressed to a little over 60 ms as in the part C at worst.

【0168】尚、上記の実施形態にあっては、要求性能
として平均レスポンス、最大レスポンス、スループット
を例にとるものであったが、必要に応じて適宜の要求性
能を設定することができる。また優先度をランダムアク
セス優先とすることで平均レスポンス、最大レスポン
ス、スループットの順に設定しているが、逆にシーケン
シャルアクセス優先で優先度をスループット、平均レス
ポンス、最大レスポンスの順に設定するようにしても良
い。
In the above-described embodiment, the average response, the maximum response, and the throughput are taken as examples of the required performance. However, an appropriate required performance can be set as required. Also, the priority is set in the order of the average response, the maximum response, and the throughput by setting the priority to random access. However, the priority may be set in the order of the throughput, the average response, and the maximum response in the sequential access priority. good.

【0169】また本発明は、その目的と利点を含まない
適宜の変形を含み、更に上記の実施形態に示した数値に
よる限定は受けない。
The present invention includes appropriate modifications that do not include the objects and advantages thereof, and are not limited by the numerical values shown in the above embodiments.

【0170】[0170]

【発明の効果】以上説明してきたように本発明によれ
ば、シミュレーションあるいは実測等により得られた負
荷、平均レスポンス、最大レスポンス、スループット等
の実績(統計情報)を基礎データとして保存し、チュー
ニング部により負荷の状態と保存した基礎データによる
実績を基にユーザ要求性能を満たす最適な調整値、例え
ばタイムシェアリング周期とランダムアクセスとシーケ
ンシャルアクセスのクォンタム比率(RS比)を決定
し、この調整値に基づいてタイムシェアリングの動作条
件を自動的に調整することで、ユーザの要求性能に適切
に対応した入出力処理を行うことができる。
As described above, according to the present invention, results (statistical information) such as load, average response, maximum response, and throughput obtained by simulation or actual measurement are stored as basic data, and the tuning unit Based on the load condition and the performance based on the stored basic data, the optimal adjustment value that satisfies the performance required by the user, for example, the time sharing cycle and the quantum ratio (RS ratio) of random access and sequential access is determined. By automatically adjusting the operating conditions of the time sharing based on this, it is possible to perform input / output processing appropriately corresponding to the performance required by the user.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理説明図FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】本発明が適用されるストレージシステムのブロ
ック図
FIG. 2 is a block diagram of a storage system to which the present invention is applied;

【図3】3つの入出力グループを形成する本発明の基本
的な実施形態の機能ブロック図
FIG. 3 is a functional block diagram of a basic embodiment of the present invention forming three input / output groups;

【図4】図3の3つの入出力グループの入出力を対象と
した場合のディスク・タイムシェアリング処理のスケジ
ュール説明図
FIG. 4 is an explanatory diagram of a schedule of a disk time sharing process for input / output of the three input / output groups of FIG. 3;

【図5】1つの入出力グループのみの入出力が連続する
場合のディスク・タイムシェアリング処理のスケジュー
ル説明図
FIG. 5 is a diagram illustrating a schedule of a disk time sharing process when input / output of only one input / output group is continuous.

【図6】クォンタム切替え時の残り時間の予測処理の説
明図
FIG. 6 is an explanatory diagram of a process of estimating a remaining time at the time of quantum switching.

【図7】図3のディスク・タイムシェアリング処理のフ
ローチャート
FIG. 7 is a flowchart of a disk time sharing process of FIG. 3;

【図8】図2のチューニング機構の機能ブロック図FIG. 8 is a functional block diagram of the tuning mechanism of FIG. 2;

【図9】図8の基礎データファイルに基礎データとして
格納する平均レスポンス、最大レスポンス、スループッ
トの実績値の説明図
FIG. 9 is an explanatory diagram of average response, maximum response, and actual throughput values stored as basic data in the basic data file of FIG. 8;

【図10】要求性能の優先度に従って調整値を選択する
図8のチューニング処理の説明図
FIG. 10 is an explanatory diagram of the tuning processing of FIG. 8 for selecting an adjustment value according to the priority of required performance.

【図11】図8のチューニング処理のフローチャートFIG. 11 is a flowchart of a tuning process in FIG. 8;

【図12】下位の要求性能ができない場合のチューニン
グ処理の説明図
FIG. 12 is an explanatory diagram of a tuning process when a lower required performance cannot be achieved;

【図13】下位の要求性能ができない場合の他のチュー
ニング処理の説明図
FIG. 13 is an explanatory diagram of another tuning process when a lower required performance cannot be obtained.

【図14】チューニングを行っていない場合の負荷IO
PS、ランダムアクセスの平均レスポンスと最大レスポ
ンス、コピー処理、エラー処理実行のシミュレーション
結果の特性図
FIG. 14 shows load IO when tuning is not performed.
Characteristic diagram of simulation result of PS, average response and maximum response of random access, copy process, error process execution

【図15】図14の部分拡大図FIG. 15 is a partially enlarged view of FIG. 14;

【図16】チューニングを行った場合の負荷IOPS、
ランダムアクセスの平均レスポンスと最大レスポンス、
コピー処理、エラー処理実行のシミュレーション結果の
特性図
FIG. 16 shows a load IOPS when tuning is performed,
Average and maximum response of random access,
Characteristic diagram of simulation results of execution of copy processing and error processing

【図17】図16の部分拡大図FIG. 17 is a partially enlarged view of FIG. 16;

【符号の説明】[Explanation of symbols]

10−1〜10−m:ホスト 12:デバイス制御装置 14:アレイディスク装置 16:ディスク装置 18:入出力要求部 20:ディスク入出力スケジュール機構 22:ディスク入出力処理部 24−1〜24−n:ディスクドライブ 26:RAID制御部 30−1〜30−4:ディイスタイムシアリング制御情
報 32:入出力スケジュール部 34:入出力受付部 36:入出力完了処理部 38−1〜38−3:スケジュール待ちグループキュー 40−1〜40−3:完了待ちグループキュー 42−1〜42−3:グループ用クォンタム 44:現クォンタム種別情報 45:シーケンシャルアクセス検出機構 46:現クォンタム開始時刻 48:次入出力タスク種別情報 50:チューニング機構 52:チューニング部 54:基礎データファイル 56:要求性能設定部 58:動作条件決定部 62:第1基礎データ 64:第2基礎データ 66:第3基礎データ 78:バックアップ/コピー機構 84:リビルディング機構
10-1 to 10-m: Host 12: Device control device 14: Array disk device 16: Disk device 18: I / O request unit 20: Disk I / O schedule mechanism 22: Disk I / O processing unit 24-1 to 24-n : Disk drive 26: RAID control unit 30-1 to 30-4: Distime shearing control information 32: Input / output schedule unit 34: Input / output reception unit 36: Input / output completion processing unit 38-1 to 38-3: Schedule Waiting group queue 40-1 to 40-3: Completion waiting group queue 42-1 to 42-3: Group quantum 44: Current quantum type information 45: Sequential access detection mechanism 46: Current quantum start time 48: Next input / output task Type information 50: Tuning mechanism 52: Tuning unit 54: Basic data file File 56: Required performance setting unit 58: Operating condition determination unit 62: First basic data 64: Second basic data 66: Third basic data 78: Backup / copy mechanism 84: Rebuilding mechanism

───────────────────────────────────────────────────── フロントページの続き (72)発明者 加藤 匡史 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B014 EB04 GD05 GD17 GD23 GD36 HA01 HA04 HA06 HA08 5B065 CA04 CA11 CA16 CA30 CC08 5B082 CA01 EA07 FA16 GA15 JA04 ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Masafumi Kato 4-1-1, Kamidadanaka, Nakahara-ku, Kawasaki-shi, Kanagawa F-term within Fujitsu Limited (reference) 5B014 EB04 GD05 GD17 GD23 GD36 HA01 HA04 HA06 HA08 5B065 CA04 CA11 CA16 CA30 CC08 5B082 CA01 EA07 FA16 GA15 JA04

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】1又は複数のディスクドライブを備えたデ
ィスク装置と、 前記ディスク装置に入出力要求を発行する入出力要求部
と、 ディスク装置への入出力元をグループ化した入出力グル
ープを形成すると共に各入出力グループがディスクを使
用する時間の比率を定義し、定義された時間比率に基づ
き各入出力グループが連続してディスク装置を使用でき
る割当時間(クォンタム)を決定し、複数の入出力グル
ープからディスク装置に入出力の依頼を受け付けている
場合、競合した入出力グループ間で前記割当時間を順番
に切り替えてディスク装置を使用するタイムシェアリン
グを行う入出力スケジュール機構とを備えたディスク・
タイムシェアリング装置に於いて、 要求性能と実績に応じて前記タイムシェアリングの動作
条件を自動的に調整するチューニング部を設けたことを
特徴とするディスク・タイムシェアリング装置。
1. A disk device having one or a plurality of disk drives, an input / output request unit for issuing an input / output request to the disk device, and an input / output group formed by grouping input / output sources to the disk device At the same time, the ratio of time during which each I / O group uses the disk is defined. Based on the defined time ratio, the allocation time (quantum) at which each I / O group can use the disk device continuously is determined. A disk provided with an input / output scheduling mechanism for performing time sharing using the disk device by sequentially switching the allocation time between competing input / output groups when an input / output request is received from the output group to the disk device;・
A disk time sharing device, characterized in that the time sharing device is provided with a tuning unit for automatically adjusting the time sharing operation condition according to required performance and performance.
【請求項2】請求項1記載のディスク・タイムシェアリ
ング装置に於いて、 前記入出力スケジュール機構は、前記複数の入出力グル
ープとして、少なくともランダムアクセス入出力グルー
プとシーケンシャルアクセス入出力グループを形成し、 前記チューニング部は、 前記ランダムアクセス入出力グループの平均レスポンス
時間と最大レスポンス時間、前記シーケンシャルアクセ
ス入出力グループのスループットの各々を要求性能とし
て設定する要求性能設定部と、 ランダムアクセスの負荷毎に分けた前記平均レスポンス
の実績値を、タイムシェアリング周期と、ランダムアク
セスとシーケンシャルアクセスの割当時間比率に対応し
て格納した第1基礎データと、 ランダムアクセスの負荷毎に分けた前記最大レスポンス
の実績値を、タイムシェアリング周期と、ランダムアク
セスとシーケンシャルアクセスの割当時間比率に対応し
て格納した第2基礎データと、 前記スループットの実績値を、タイムシェアリング周期
と、ランダムアクセスとシーケンシャルアクセスの割当
時間比率に対応して格納した第3基礎データと、 前記要求性能設定部で設定した1又は複数の要求性能値
を満足するタイムシェリング周期と、ランダムアクセス
とシーケンシャルアクセスの割当時間比率を、ランダム
アクセスの負荷状態及び前記第1乃至題3基礎データの
参照で調整値として決定し、前記タイムシェアリングの
動作条件を自動的に調整する動作条件決定部と、を備え
たことを特徴とするディスク・タイムシェアリング装
置。
2. The disk time sharing apparatus according to claim 1, wherein said input / output scheduler forms at least a random access input / output group and a sequential access input / output group as said plurality of input / output groups. A tuning unit configured to set an average response time and a maximum response time of the random access I / O group, and a throughput of the sequential access I / O group as required performance, and a random access load; The first basic data stored in accordance with the time sharing period, the allocated time ratio of random access and sequential access, and the actual value of the average response obtained as described above, and the actual value of the maximum response divided for each load of random access. To Thailand The second basic data stored corresponding to the sharing period and the allocated time ratio between random access and sequential access, and the actual value of the throughput are corresponded to the time sharing period and the allocated time ratio between random access and sequential access. The third basic data stored and stored, a time shelling cycle that satisfies one or a plurality of required performance values set by the required performance setting unit, an allocation time ratio between random access and sequential access, An operating condition determining unit that determines an adjusting value by referring to the first to third basic data and automatically adjusts the operating condition of the time sharing. .
【請求項3】請求項1又は2記載のディスク・タイムシ
ェアリング装置に於いて、前記チューニング部は、達成
できない要求性能値がある場合に、要求性能の種別に優
先順を付け、 上位の優先度の要求性能を達成できる設定範囲では下位
の要求性能が達成できない場合に、下位の要求性能は考
慮しないで調整値を決定する第1モードと、 上位の優先度の要求性能が達成できる設定範囲では下位
の要求性能が達成できない場合も、下位の要求性能を考
慮して調整値を決定する第2モードと、 上位の優先度の要求性能が達成できる設定範囲では下位
の要求性能が達成できない場合に、上位の設定範囲内か
ら下位の性能が最善になる調整値を選択する第3モード
と、 上位の優先度の要求性能が達成できる設定範囲では下位
の要求性能が達成できない場合に、上位の設定範囲から
下位の性能が良くなる候補を複数点選択し、選択した候
補の中から上位の性能が最善になる調整値を選択する第
4モードと、のいずれかのモードを使用して動作条件を
自動調整するこを特徴とするディスク・タイムシェアリ
ング装置。
3. The disk time sharing apparatus according to claim 1, wherein the tuning unit assigns a priority to the type of the required performance when there is a required performance value that cannot be achieved, and If the lower required performance cannot be achieved within the setting range that can achieve the required performance, the first mode determines the adjustment value without considering the lower required performance, and the setting range that can achieve the required performance of the higher priority In the second mode, where the lower required performance cannot be achieved, the adjustment value is determined in consideration of the lower required performance, and when the lower required performance cannot be achieved in the setting range in which the higher priority required performance can be achieved. In addition, a third mode in which an adjustment value at which the lower performance is optimized from the upper setting range is selected, and the lower required performance cannot be achieved in the setting range in which the higher priority required performance can be achieved. And a fourth mode for selecting a plurality of candidates for which the lower performance is better from the upper setting range, and selecting an adjustment value for which the higher performance is best from the selected candidates. A disk time-sharing device characterized by automatically adjusting operating conditions by using a computer.
【請求項4】1又は複数のディスクドライブを備えたデ
ィスク装置と、前記ディスク装置に入出力要求を発行す
る入出力要求部と、前記入出力に基づいて前記ディスク
装置の使用をスケジューリングする入出力スケジュール
機構とを備えたディスク・タイムシェアリング方法に於
いて、 前記ディクス装置への入出力元をグループ化した入出力
グループを形成すると共に各入出力グループがディスク
を使用する時間の比率を定義し、 定義された時間比率に基づき各入出力グループが連続し
てディスク装置を使用できる割当時間(クォンタム)を
決定し、 複数の入出力グループからディスク装置に入出力の依頼
を受け付けている場合、競合した入出力グループ間で前
記割当時間を順番に切り替えてディスク装置を使用する
タイムシェアリングを行い、 更に、要求性能と実績に応じて前記タイムシェアリング
の動作条件を自動的に調整することを特徴とするディス
ク・タイムシェアリング方法。
4. A disk device having one or a plurality of disk drives, an input / output request unit for issuing an input / output request to the disk device, and an input / output for scheduling use of the disk device based on the input / output. In a disk time sharing method having a scheduling mechanism, an I / O group is formed by grouping I / O sources to the disk device, and a ratio of time during which each I / O group uses a disk is defined. If the I / O group determines the allocation time (quantum) for which the I / O group can use the disk device continuously based on the defined time ratio, and if I / O requests are received from multiple I / O groups to the disk device, contention occurs. Time sharing in which disk units are used by sequentially switching the allocation time between There, further, disk time-sharing method characterized by automatically adjusting the operating conditions of the time-sharing in response to the required performance and results.
JP32909599A 1999-11-19 1999-11-19 Disc time sharing apparatus and method Expired - Fee Related JP4091225B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32909599A JP4091225B2 (en) 1999-11-19 1999-11-19 Disc time sharing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32909599A JP4091225B2 (en) 1999-11-19 1999-11-19 Disc time sharing apparatus and method

Publications (2)

Publication Number Publication Date
JP2001147886A true JP2001147886A (en) 2001-05-29
JP4091225B2 JP4091225B2 (en) 2008-05-28

Family

ID=18217565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32909599A Expired - Fee Related JP4091225B2 (en) 1999-11-19 1999-11-19 Disc time sharing apparatus and method

Country Status (1)

Country Link
JP (1) JP4091225B2 (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030053A (en) * 2001-07-13 2003-01-31 Hitachi Ltd Storage subsystem having security function for each logical unit
JP2003067262A (en) * 2001-08-23 2003-03-07 Mitsubishi Electric Corp Data processing system
JP2005275829A (en) * 2004-03-25 2005-10-06 Hitachi Ltd Storage system
JP2006079495A (en) * 2004-09-13 2006-03-23 Hitachi Ltd Storage system and method for setting logical block
JP2008003719A (en) * 2006-06-20 2008-01-10 Hitachi Ltd Storage system and memory control method achieving consistency between power saving and performance
JP2008097312A (en) * 2006-10-11 2008-04-24 Sony Computer Entertainment Inc Multiplexer and information processor
JP2009217818A (en) * 2008-02-12 2009-09-24 Fujitsu Ltd Information processing apparatus, schedule management device, schedule management method, and schedule management program
US7610414B2 (en) 2004-06-17 2009-10-27 Fujitsu Limited Data transfer method and system, input/output request device, and computer-readable recording medium having data transfer program recorded thereon
US7908459B2 (en) 2000-01-14 2011-03-15 Hitachi, Ltd. Security for logical unit in storage subsystem
US8095757B2 (en) 2000-05-24 2012-01-10 Hitachi, Ltd. Method and apparatus for controlling access to storage device
US8275950B2 (en) 1997-05-29 2012-09-25 Hitachi, Ltd. Fiber channel connection storage controller
JP2013210847A (en) * 2012-03-30 2013-10-10 Fujitsu Ltd System, control method, and control program for storage
JP2014010709A (en) * 2012-06-29 2014-01-20 Fujitsu Ltd Storage control device, program thereof and method thereof
US8700587B2 (en) 2000-01-14 2014-04-15 Hitachi, Ltd. Security method and system for storage subsystem

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8583877B2 (en) 1997-05-29 2013-11-12 Hitachi, Ltd. Fiber channel connection storage controller
US8275950B2 (en) 1997-05-29 2012-09-25 Hitachi, Ltd. Fiber channel connection storage controller
US7908459B2 (en) 2000-01-14 2011-03-15 Hitachi, Ltd. Security for logical unit in storage subsystem
US8700587B2 (en) 2000-01-14 2014-04-15 Hitachi, Ltd. Security method and system for storage subsystem
US8195904B2 (en) 2000-05-24 2012-06-05 Hitachi, Ltd. Method and apparatus for controlling access to storage device
US8095757B2 (en) 2000-05-24 2012-01-10 Hitachi, Ltd. Method and apparatus for controlling access to storage device
JP4651230B2 (en) * 2001-07-13 2011-03-16 株式会社日立製作所 Storage system and access control method to logical unit
JP2003030053A (en) * 2001-07-13 2003-01-31 Hitachi Ltd Storage subsystem having security function for each logical unit
JP2003067262A (en) * 2001-08-23 2003-03-07 Mitsubishi Electric Corp Data processing system
US7877560B2 (en) 2004-03-25 2011-01-25 Hitachi, Ltd. Storage system with automated resource allocation
JP2005275829A (en) * 2004-03-25 2005-10-06 Hitachi Ltd Storage system
US7610414B2 (en) 2004-06-17 2009-10-27 Fujitsu Limited Data transfer method and system, input/output request device, and computer-readable recording medium having data transfer program recorded thereon
JP2006079495A (en) * 2004-09-13 2006-03-23 Hitachi Ltd Storage system and method for setting logical block
JP2008003719A (en) * 2006-06-20 2008-01-10 Hitachi Ltd Storage system and memory control method achieving consistency between power saving and performance
JP2008097312A (en) * 2006-10-11 2008-04-24 Sony Computer Entertainment Inc Multiplexer and information processor
JP2009217818A (en) * 2008-02-12 2009-09-24 Fujitsu Ltd Information processing apparatus, schedule management device, schedule management method, and schedule management program
JP2013210847A (en) * 2012-03-30 2013-10-10 Fujitsu Ltd System, control method, and control program for storage
JP2014010709A (en) * 2012-06-29 2014-01-20 Fujitsu Ltd Storage control device, program thereof and method thereof

Also Published As

Publication number Publication date
JP4091225B2 (en) 2008-05-28

Similar Documents

Publication Publication Date Title
US6957433B2 (en) System and method for adaptive performance optimization of data processing systems
JP3440219B2 (en) I / O device and disk time sharing method
JP4921054B2 (en) Load balancing control system and load balancing control method
EP0384635B1 (en) Adaptive job scheduling for multiprocessing systems
JP2001147886A (en) Device and method for sharing disk time
JP4405935B2 (en) Method and apparatus for balancing workload among paths in a multipath computer system
JP4922496B2 (en) Method for giving priority to I / O requests
US7159071B2 (en) Storage system and disk load balance control method thereof
JP3813056B2 (en) Processing channel subsystem pending I / O work queue based on priority
US5864712A (en) Method and apparatus for controlling (N+I) I/O channels with (N) data managers in a homogenous software programmable environment
JP5171602B2 (en) RAID driver, electronic device including the same, and access request arbitration method for RAID
JPH07282013A (en) Distributed processing system
US7089381B2 (en) Multiple storage element command queues
JP2002023962A (en) Disk device and its controlling method
JP4176341B2 (en) Storage controller
JPH09258907A (en) Highly available external storage device having plural storage disk parts
JP3623697B2 (en) Disc time sharing apparatus and method
JP3382176B2 (en) Request processing method and request processing device
US7818478B2 (en) Input/Output completion system for a data processing platform
US20040148606A1 (en) Multi-thread computer
US10824425B2 (en) Selecting destination for processing management instructions based on the processor buffer size and uncompleted management instructions
US9465745B2 (en) Managing access commands by multiple level caching
JP2013210833A (en) Job management device, job management method and program
US10846094B2 (en) Method and system for managing data access in storage system
JPH05158744A (en) Device/memory control system for computer system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120307

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140307

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees