JPH0762832B2 - データプロセッサシステムの性能評価方法 - Google Patents

データプロセッサシステムの性能評価方法

Info

Publication number
JPH0762832B2
JPH0762832B2 JP62218071A JP21807187A JPH0762832B2 JP H0762832 B2 JPH0762832 B2 JP H0762832B2 JP 62218071 A JP62218071 A JP 62218071A JP 21807187 A JP21807187 A JP 21807187A JP H0762832 B2 JPH0762832 B2 JP H0762832B2
Authority
JP
Japan
Prior art keywords
rule
rules
data processor
memory
metrics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62218071A
Other languages
English (en)
Other versions
JPS63126042A (ja
Inventor
アカナイケンパラヤム・ブイ・チャイナスウアミイ
スタンレイ・エイ・ウィルク
ジェームス・エッチ・トーレイ・ジュニア
Original Assignee
ディジタル・イクイップメント・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ディジタル・イクイップメント・コーポレーション filed Critical ディジタル・イクイップメント・コーポレーション
Publication of JPS63126042A publication Critical patent/JPS63126042A/ja
Publication of JPH0762832B2 publication Critical patent/JPH0762832B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S706/00Data processing: artificial intelligence
    • Y10S706/902Application using ai with detail of the ai system
    • Y10S706/911Nonmedical diagnostics
    • Y10S706/916Electronic or computer, internal or network, circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Lubricants (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Saccharide Compounds (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】 (背景技術) 本発明は自動操作によるパーフォーマンス解析(性能解
析)分野に関するもので、特に、エキスパートシステム
を使用するデータプロセッサまたはデータプロセッサネ
ットワークの自動操作形性能解析に関するものである。
普通程度以上の複雑さを有する一般のデータプロセッサ
では、特にこれらのプロセッサを一般のアプリケーショ
ン用として供する場合、そのオペレーティングシステム
はかなり手の入った凝ったものとなる。オペレーティン
グシステムの主要目的の1つは、データプロセッサそれ
自体および当該データプロセッサを含む全体システム双
方のコントロールを保持することである。例えば、オペ
レーティングシステムはシステム内に存在しうるプロセ
ス(すなわち、ユーザー)の数を制御することができ、
また、各プロセスに割当てられるメモリのサイズを制御
することができる。また、前記オペレーティングシステ
ムはディスクのような2次メモリおよび外部装置に対し
入力および出力を制御することもできる。
オペレーティングシステムでは、しばしば、各プロセス
に割当てられる最大作業記憶域のサイズ、プロセスの優
先順位、キャッシメモリ(cache memory)のサイズ、ま
たはメモリの共用域のサイズのようないくつかのパラメ
ータを調整することにより、そのコントロールを実施し
ている。ここで、語句“パラメータ”はオペレーティン
グシステムそれ自体またはユーザーのいずれかにより設
定可能なシステム値を表わすために使用する。このパラ
メータなる語句は、例えばページフォールト(ページ不
在)の数とか、待ちの長さ(queue length)のような測
定可能なシステム値を表わす語句“メトリック(metric
s)”とは異なって使用される。
パラメータの調整はシステムのオペレーションに種々影
響を与える。例えば、1つのプロセスに対する最大のワ
ーキングセットサイズパラメータはそのプロセスがどの
位頻繁にページフォールトを有するかを決定し、また1
つのプロセスが連続して実行(ラン)できる最大時間長
はシステムによるスワッピングの量に影響を与える。
さらに、適切なパラメータの設定はオペレーティングシ
ステムを種々の異なるワークロードに適応させることを
可能にする。例えば、ワークロードが主として大きなバ
ッチイメージ(ただし、語句“イメージ”は“プロセ
ス”またはユーザーにより実行されるプログラムをい
う。)により形成されている場合は、そのオペレーティ
ングシステムは理想的にはそのワークロードが主として
いくつかの小さい相互作用イメージにより形成されてい
る場合の構成とは異なる構成とすることが必要である。
パラメータを設定することによりオペレーティングシス
テムを“チューニング(調整)”させる他の理由は、デ
ータプロセッサシステムの構成またはデータプロセッサ
システムを含むネットワークの構成に適応させるためで
ある。1つのオペレーティングシステムは、例えば、プ
ロセッサシステム内のメモリの量および当該システム内
のI/O装置の数と形式に応じて異なった作動をする必要
がある。
特定のオペレーティングシステムが効率的に実行されて
いるかどうかを決定するためには、例えば、ページン
グ、スワッピングまたはフリーメモリの数、計算可能な
プロセスの数、あるいはディスク利用の程度のようない
くつかのワークロード特性を解析することが必要であ
る。このような解析は、しばしば、解析を実施する特定
のエンジニア個人の主観的標準にもとづいて行われる。
本来はオペレーティングシステムの性能を間違いなく表
示しうるような測定(すなわち、メトリックの値の決
定)を行うことが望ましい。しかし、オペレーティング
システムの効率が容易に測定しうる値ではないことか
ら、これはきわめて難しいことで、評価のために使用さ
れるデータは効率の正確な測定というよりむしろ2次的
または3次的表示にすぎない場合が多い。
多くのオペレーティングシステムはプロセッサおよびそ
のオペレーティングシステムの操作測定を実施するため
のビルトイン(造り付け)プログラムを有する。例え
ば、DEC社(Digital Equipment Corporation)の製造に
係るVAXコンピュータシステム用のオペレーティングシ
ステムのVMSファミリーにおいては予め規定されたオペ
レーティングシステムデータを測定するためにモニタプ
ログラム(Monitor program)を利用しうるようにして
いる。このようなデータには作業記憶域のサイズ、待ち
(queue)の長さ、ディスクI/Oの数などが含まれる。し
かしながら、上記モニタプログラムにより与えられる情
報によっても、オペレーティングシステムの効率を正確
に評価し適当な勧告を行うことは依然として困難であ
る。例えば、測定データからデータプロセシングシステ
ム内に過度のページングがあることを決定した後であっ
ても、有用な提案を与える前に過度のページングの原因
を遮断する必要がある。
このように明確な測定ができないということが、たと
え、マニュアルによりオペレーティングシステムの性能
を改良する方法を提案している場合でも、一般のオペレ
ーティングシステムの場合の問題点であった。例えばVM
Sオペレーティングシステムに関してはそのオペレーテ
ィングシステムの種々の解析方法を提案したマニュアル
がある。このようなマニュアルの1つにVAX/VMSパーフ
ォーマンスマネジメントへのガイド、バージョン4.4,19
86年4月、特に第4章がある。この章には、過度のスワ
ッピングまたはページングのようなチェックすべき状態
を説明した種々のダイヤグラムが含まれる。
しかし、このマニュアルの1つの限界はダイヤグラム内
の要求される解析がしばしば解析を実施するエンジニア
の個人的判断にゆだねられるということである。かくし
て、種々の同じ事実を提供された複数のエンジニアが、
例えば過度のスワッピングがあるかどうかについて異な
る意見を有することが起こりうる。
異なるエンジニアによるオペレーティングシステムの解
析結果が異なるのはいくつかの理由による。第1に、種
々の異なる測定がなにを表わしているかが必ずしも明確
ではない。さらに、異なるエンジニアがその測定をいろ
いろに翻訳する可能性がある。また、異なる測定に対し
て与えられるべき重みに関して不一致があり、この結果
として、各エンジニアによる“シート・オブ・ザ・パン
ツ(seat-of-the-pants)”作動が起こる。さらに、各
エンジニアの操作が異なることにより、このような解析
の結果が不均一となり、通常再現不可能である。
また、システムエンジニアのデータの評価を要求する一
般のシステムの他の顕著な欠点は、このようなシステム
は一般にエキスパートでない人に対しては有用でないと
いうことである。さらに、マニュアルには一般に提案さ
れた行動をとる理由の説明がなされていないことが多い
ため、オペレーティングシステムに対しある程度の知識
を有する人でも役に立つマニュアルを見つけることは難
しい。
性能解析の問題に対して人工知能またはエキスパートシ
ステムの技術を適用しようとする少なくとも1つのここ
ろみはあったが、このこころみはマニュアルを使用する
すべての問題に対応するものではない。デジタルレビュ
ー(Digital Review)、1986年5月号、109〜114ページ
に記載されているTIMM/TUNERではVMSオペレーティング
システムを有するVAXコンピュータシステムからのある
測定値を用い、これらの測定結果を評価のためオペレー
タに提供するようにしている。しかしながら、VAX/VMS
パーフォーマンスマネジメントガイド(VAX/VMS Perfor
mance Management Guide)と比較した場合、TIM/TUNER
システムは自動操作による質問以外はほとんど付加的可
能性を与えない。さらに、TIM/TUNERは単一ノード(す
なわち、VAXマシン)に限定される。
本発明の目的はデータプロセシングシステムまたはデー
タプロセシングシステムネットワークの性能を解析する
のに必要なデータを測定する性能調整および評価方法を
提供しようとするものである。
また、本発明の他の目的は、所定のルールにしたがって
測定データを解析する性能調整および評価方法を提供
し、かつ、これらのルールにより取られるべき行動を勧
告しようとするものである。
さらに、本発明の他の目的は勧告された行動を説明し、
かつ勧告の根據を形成する証據を供給するようにした性
能調整および評価方法を提供しようとするものである。
本発明によるときは、データプロセッサシステムまたは
データプロセッサシステムネットワークから複数のメト
リックおよびパラメータを周期的に収集し、次にこれら
のメトリックおよびパラメータにルールを適用して、該
ルールがトリガされたかどうかを調べ、最後に、該ルー
ルが充分な回数だけトリガされたとき、取られるべき行
動を勧告することにより、一般のシステムの問題点を解
決し、かつ前述の目的を達成している。
すなわち、データプロセッサシステムの性能を評価する
ための本発明方法においては、ワークロード特性の受入
れ可能な状態を規定する組のルールを決定するステップ
と、該メトリックの各々(データプロセッサシステム内
の測定可能量を表わす)の値を、メジャーインターバル
を構成する複数の所定時間周期の各々の間に少なくとも
1回測定するステップと、その間に測定が行われるメジ
ャーインターバルの1つにおいて各メトリックに対し測
定した値を記憶させるステップと、メジャーインターバ
ルの選択した1つの間にデータプロセッサシステムの性
能を解析するステップとを含むことを特徴とする。ま
た、組のルールを決定するステップは、組のルールに対
応する複数のメトリックを識別するサブステップと、該
複数のメトリックの各々に対してスレショールド値を選
定するサブステップと、該複数のメトリックの各々と各
ルールに合致することを要求される関連のスレショール
ドとの間の関係を規定するサブステップとを含むことを
特徴とする。
また、該解析ステップはメジャーインターバルのおのお
のに対して各メトリックの値と対応するスレショールド
値を比較するサブステップと、該各比較の結果を評価し
て該ルールの各々に対する特定関係が満足され、かつル
ールがトリガされたかどうかを決定するサブステップ
と、トリガされたルールの各々およびその間にルールが
トリガされたメジャーインターバルの各々を記録するサ
ブステップとを含むことを特徴とする。
(実施例) (A)全体説明 以下図面により本発明を説明する。
本発明に使用する性能評価は任意の特定プロセシングシ
ステムに限定されるものではないが、添付図面に示す方
法の例では、DEC社製VAXコンピュータよりなるVAXクラ
スタ(VAXcluster)ネットワークに関して記述してあ
る。また、この場合、VAXコンピュータはDEC社により提
供されるVMSオペレーティングシステム、バージョン4.4
を使用するものとする。
第1図は符号数字100として全体を設計したVAXクラスタ
(VAXcluster)ネットワークの一例を示す。VAXクラス
タネットワーク100はVAXコンピュータ110,120,130およ
びインテリジェントディスクコントローラ140,150を含
む5つのノードを具える。ディスクコントローラ140お
よび150はDEC社製のモデルHSC50または70により形成す
るを可とする。インテリジェントディスクコントローラ
140および150は、VAXクラスタネットワークの術語では
ノードと呼んでいるが、本発明の記述におけるノードの
呼称は注記しない限りVAXコンピュータのみに限定され
る。前記コントローラによりアクセス可能なディスク14
2,144および146は一般のディスクにより形成するを可と
し、第1図示VAXクラスタネットワーク100においては、
該ディスクをRA81ディスクドライブにより形成すること
が望ましい。
VAXクラスタネットワーク100の心臓部はスターカプラ16
0で、これを通信インタフェース(“CI")ラインを介し
てコンピュータ110,120,130およびディスクコントロー
ラ140,150の各々に結合する。スターカプラ160はコンピ
ュータ110,120および130間のプロセッサ間通信を可能に
するほか、VAXコンピュータ110,120または130によるデ
ィスク142,144および146のアクセスを可能にする。
本発明評価方法は、例えばVAXコンピュータ110,120およ
び130のようなデータプロセッサならびにVAXクラスタネ
ットワーク100のようなプロセッサネットワークの双方
に適用することができる。この場合、ネットワーク性能
の評価は、本発明により収集され解析されたデータ形式
が通常、一般の性能評価方法では得られなかったもので
あるためはじめて可能となったものである。
第2図は本発明方法を実施するのに使用可能なシステム
構成素子200を示す。ここで、システム200は表示のため
のシステムに過ぎないことを理解する必要がある。ま
た、図に示す種々のサブシステムの各々は別々のプロセ
ッサまたは別々のプログラムであることを要しない。実
際に、本発明実施例の詳細説明においては、ルールサブ
システム270のスレショールドサブシステム280との結合
のようなある種の最適化がなされている。第2図にシス
テム200として図示した目的は、全体として本発明の理
解を助けるためである。
システム200においては、本発明方法を実行するコンピ
ュータプログラムを開始するため、コンピュータ(端末
装置を含む)210を使用している。調整可能なシステム
パラメータはコンピュータ210のオペレーティングシス
テムに対するものである。システム200に示す構成素子
は必要な測定データの収集がいつ行われたかを決定する
データ収集スケジューラ220ならびにデータ収集が行わ
れる時間を含むスケジュールファイル230を含む。デー
タ収集サブシステム240は実際にデータ収集を行う。
収集されたデータは“メトリック(metrics)”と呼ば
れる複数の測定可能なプロセス、プロセッサおよびネッ
トワーク統計のほか若干の現行のパラメータセッティン
グを含む。サブシステム240により収集されたメトリッ
クおよびパラメータはデータベース250内に配置され
る。また、データベース250は評価に必要ないくつかの
パラメータを含む。
アドバイザサブシステム260はルールサブシステム270内
のルールの適用にデータベース250内のメトリックとと
もにいくつかのシステムパラメータを使用する。これら
のルールはしばしばデータベース250内のメトリックお
よびパラメータをスレショールドサブシステム280内の
スレショールド値と比較することを含む。
アドバイザサブシステム260により、ルールサブシステ
ム270内のルールのあるものがトリガされ、かつ充分な
回数トリガされたことが決定された場合は、メッセージ
テンプリットサブシステム290内のメッセージテンプリ
ット(message template)を使用してそれらのルールに
対応するメッセージが生成される。また、これらのメッ
セージはレポートサブシステム295内のレポートを形成
するために使用する若干数の他のデータを含む。
第3図はデータベース250を示すもので、この図も単に
データベースの例示を目的とするものに過ぎず、このよ
うなデータベースがどのように指向しなければならない
かを規定する積もりもない。第3図に示すデータベース
250は若干個のファイルを含み、前記ファイルの各々に
は、ファイル内の測定が属するノード(すなわち、コン
ピュータ)と測定がなされた日時の認識が含まれる。
第3図に示すように、ファイル300は各々ある測定時間
周期を有するレコード310を含む。メジャーインターバ
ル(大きい時間間隔)と呼ばれるこれらの時間間隔は測
定が行われる度数を示す。レコード310に関しては、こ
れらのメジャーインターバルを本実施例におけるディフ
ォールト状態(default condition)である2分の間隔
として表示してあるが、他のメジャーインターバルを選
定することも可能である。
各レコード310は第3図に例示するようなサブレコード3
20を含む。サブレコード320は、第3図に示すように測
定時間を含むタイムスタンプサブレコード、全システム
的なパフォーマンスメトリックを含むパフォーマンスサ
ブレコードならびに全システム的パラメータ値を含むパ
ラメータサブレコードを含む。
また、サブレコード320は、例えばそれらのワーキング
セットサイズ、フォールトレート(faultrate)および
ユーザー名のような各プロセスにより活性化(始動)さ
れたイメージを記述したイメージサブレコードおよびプ
ロセスサブレコードを含む。前述のように、語句“プロ
セス”はユーザーをいい、語句“イメージ”はプロセス
により実行されるプログラムをいう。
また、サブレコード320内のディスクサブレコードはデ
ィスクにおける活動(アクティビティ)を記述する。こ
のようなアクティビティには入力/出力(“I/O")レー
ト、I/Oサイズ、またはビジィタイムを包含することが
できる。
本実施例において測定され、調整されたメトリックおよ
びパラメータに関しては、それらのメトリックおよびパ
ラメータが各特定システムに対しユニークであるため、
個々には記述せず、その代り、次のセクションにルール
の説明の一部として特定のメトリックおよびパラメータ
に関し記述してある。
第4図はアドバイザ260の構成部分を示す。図示のアド
バイザ260は2つの機能を実施する。その1つは、チュ
ーニングのための解析(素子410)である。このような
解析を行うため、アドバイザ260はスレショールドサブ
システム280内のスレショールド値をデータベース250内
のメトリックおよびパラメータと比較し、ルールサブシ
ステム270内のルールがトリガされたかどうかを決定す
る。アドバイザ260はこれらのルールにもとづいてシス
テム210の性能に関し、ある結論に達する。このような
結論は、特定のルールが1つの解析セッション内にある
回数以上満足された後にのみ達せられる。
アドバイザ260により提供される解析はユーザーに表示
され、もしくは、しばしば勧告を含むメッセージの形で
プリントされる。また、ユーザーの要求がある場合は勧
告に関する“根據(エビデンス)”もプリントアウトさ
れる。このような根據はルールに合致していることを決
定するのに使用されるメトリック、パラメータおよびス
レショールドを伴ったルール文の形をとる。
また、アドバイザ260は個々のプロセッサおよび全体と
してのネットワークの双方に対して、ワークロード特性
データを組成することができる(素子420)。このよう
なデータは中央処理ユニット(“CPU")利用のパーセン
テージ、相互作用ジョブ、バッチジョブ、オーバーヘッ
ド等の間のワークロードの特性またはディスク使用量の
ようなプロセスに関する情報を編集したものである。本
発明用として利用可能な特殊な特性に関しては、収集デ
ータの形式および量にしたがい詳述されている。
(B)データ収集 第5図ないし第8図は本発明によるデータ収集方法に関
するフローチャートを示す。第5図ないし第8図に示す
方法はVMSオペレーティングシステムのバージョン4.4を
使用したVAXコンピュータ、モデル780よりなるVAXクラ
スタネットワーク上で使用される。
第5図はデータ収集に対するイニシアライゼーション
(初期設定)シーケンスを示す。シーケンスはステップ
500でスタートし、行われる最初の質問は、特定のオペ
レーティングシステムがデータ収集の実行のために使用
されるプログラムによりサポートされているかどうか
(ステップ505)ということである。もう、そうでない
場合には、システムはエラーメッセージをプリントし
(ステップ510)、プロシージア(手順)はエグジット
される。
オペレーティングシステムがプログラムによりサポート
されている場合は、最大数のプロセスに対するパラメー
タ(すなわち、VMSオペレーティングシステム用のMAXPR
OCESSCNT)をユーザーの総数またはVMSオペレーション
に対する512のようなある固定数のいずれか最小値にセ
ットする(ステップ520)。最大数のプロセッサパラメ
ータをセットする主な理由は、データ構造の作成を許容
するめである。また、ステップ520における固定数は、
使用する特定のコンピュータおよびオペレーティングシ
ステムに対し調整する必要がある。
次のステップはスケジューリングプライオリティレベル
のセッティング(ステップ525)を含む。本発明実施例
においては、このレベルを15にセットしている。スケジ
ューリングプライオリティレベルはシステムの作動に妨
害を与えることなく、できるだけ実時間に近い方法でデ
ータ(メトリックおよびパラメータ)が収集できるよう
データ収集に対し適正にセットされなければならない。
したがって、プライオリティレベルはスワッパーの優先
順位より下、または限界的にリアルタイムレスポンスを
必要とする任意のプロセスより下に設定することが望ま
しいが、プライオリティは大部分の他のプロセスより上
位に設定する必要がある。
次のステップは非同期システムトラップ(“AST")を使
用可能として測定スケジュールの再調査が必要であるこ
とをシステムに報知することである(ステップ530)。A
STはVMS構造で、ステップ530内で作動可能となり、測定
スケジュールが変わった際、システムに注意を喚起す
る。一般に、測定スケジュールはスケジュールファイル
内に保持されている。ASTを使用可能にする目的は、そ
の測定ファイルに変更が生じた際スケジュールファイル
をチェックするようシステムに助言するためである。
ASTが使用可能状態となった後、データ測定スケジュー
ルおよびインターバルがスケジュールファイルから読出
される(ステップ535)。測定スケジュールは測定が行
われるべき一日の時刻を示し、インターバルはどの位し
ばしば測定が行われるべきかを示す。データ測定スケジ
ュールには、計画されたスタート時間に対するパラメー
タがあり、システムはそのスタート時間が将来のものか
どうかをテストする必要があり(ステップ540)、もし
そうでなければシステムは計画されたスタート時間まで
休止する(ステップ545)。
もし、計画されたスタート時間が将来にない場合には、
計画されたスタート時間をテストしてそれが過去にあっ
たかどうかを調べる(ステップ550)。もし、計画され
たスタート時間が過去にある場合は、システムは無期限
あるいはスケジュールファイルが変更されるまで休止し
(ステップ555)、プロシージアはエグジットされる
(ステップ560)。
計画されたスタート時間が過去にもなく、将来にもない
場合は、システムはタイムキーパ(時計)ノードを選定
し、そのノードのクラスタ論理クロックをスタートさせ
る(ステップ565)。タイムキーパノードはプロセッサ
のネットワークにより測定を同期させるために使用す
る。本実施例により作動するプロセッサのネットワーク
においては、各プロセッサは他のプロセッサのクロック
に同期されることのないそれ自体の内部クロックを有す
る。この場合には、各プロセッサの内部タイミングを変
えるよりも、むしろ1つのプロセッサをタイムキーパノ
ードとして選定し、そのプロセッサに論理クラスタクロ
ックを記憶させるようにすることが望ましい。論理クラ
スタクロックは本発明データ収集方法による測定にのみ
関する。他のプロセッサの各々はそれ自体の論理クロッ
クを保持し、以下に詳述するように、そのクロックはタ
イムキーパノードのクラスタ論理クロックと確実に同期
される。
次に、システムはすべての測定を開始する(ステップ57
0)。この測定開始は、後刻、データ測定ループの間に
増分値を測定しうるようなメトリックの読出しを与え
る。このイニシァライゼーションシーケンスは最後にエ
グジットされる(ステップ575)。
第6図はデータ収集のための主制御ループを示す。第6
図に示す主制御ループには2つの測定インターバルがあ
る。1つはその間にシステムメトリックの大部分が測定
され、その値が記憶されるメジャーインターバル(大き
な時間間隔)である。本実施例の場合、このインターバ
ルに関するディフォールト状態(default condition)
は2分ごとである。
また、このほか、メジャーインターバルごとに正確に表
示するためには変化が早過ぎるようなある種のメトリッ
クを測定するマイナーインターバル(小さい時間間隔)
がある。このような急速変化メトリックは、しばしば、
作業記憶サイズのようなある種のプロセッサメトリック
を含む。このような急速変化メトリックに対しては各マ
イナーインターバルにつき1回1つの測定が行われる。
本実施例の場合、マイナーインターバルに関するディフ
ォールト条件(default condition)は5秒である。ま
た、メジャーインターバルに亘っての連続平均はマイナ
ーインターバルの間に測定されたメトリックについてと
ったものである。
第6図に示す主制御ループにおいて、プロシージアはス
テップ600でスタートした後、クラスタ論理クロック
(すなわち、タイムキーパ ノードにおける論理クロッ
ク)が読出される(ステップ605)。次に、各個別プロ
セッサはそれ自体の論理クロックを、例えば30分ごとの
ように周期的にクラスタ論理クロックに対して再校正す
る(ステップ610)。次に、一日の絶対時刻を計算した
後、種々の論理クロックを用いてメジャーおよびマイナ
ーインターバルタイマーのような種々のタイマーをリセ
ットする(ステップ615)。
次に、プロシージアはマイナーインターバルを待つ(ス
テップ620)。さらに、VMSオペレーティングシステムが
ディスク測定のフラッシングのようなある行動(ステッ
プ630)をとる場合にも、ステップ620は入力(エンタ
ー)されるのでマイナーインターバルの終わりにのみ測
定は行われる。
マイナーインターバルの終わりには、測定が継続されて
いるかどうかの質問がなされる(ステップ635)。例え
ば、測定が以前は停止されていたが、現在は再スタート
しているような場合は、測定は継続されているものとす
る。測定が継続されている場合には、プロシージアAに
続く(ステップ640)。手順Aの詳細は第7図に示す。
第7図に示すように、プロシージアAはステップ700で
スタートし、適当なディリーデータベースファイルが既
になかった場合は、データベースファイルを作成し、デ
ータベースファイルが存在する場合はそれを付加する。
次に、例えば、前日からのような期限の切れたデータベ
ースファイルを削除する(ステップ720)。
次に、必要に応じて性能評価に関する特定の測定コード
をノン・ページドプール(non-paged pool)内にロード
する(ステップ730)。ノン・ページドプールは任意の
プロセスによりアクセス可能な共通領域である。また、
前記測定コードはこのような測定を行うことができない
場合にあるイメージ測定またはプロセス測定をとるため
1つのイメージにより実行されるコードである。イメー
ジはそれがノン・ページドプール内にあるため、測定コ
ードにアクセス可能である。
次に、必要に応じてイメージランダウン(rundown)が
インスツルメントされる(ステップ740)。このステッ
プにおいては、1つのイメージが終わるたびごとに1つ
のプロセスに対して特定の測定コードを実行するようVM
Sに対し命令する。イメージランダウンは例えば開かれ
たファイルを閉じ、メモリスペースの割当てを解除(デ
ィアロケート)するような若干のハウスキーピング機能
(準備機能)を含む。
次いで、必要に応じて、ディスクI/Oパーフォームがイ
ンスツルメントされる(ステップ750)。ディスクI/Oパ
ーフォームはディスク入出力アクティビティのモニタも
しくは測定を行う。
かくして、手順Aはエグジットされ、第5図に示すよう
にプロセシングはステップ535において再開され、スケ
ジュールファイルからデータ測定スケジュールおよびイ
ンターバルが読出される。
第6図において、ステップ635でのテストにより、測定
が再開されていないことを示している場合は、スケジュ
ーリングによって測定が停止中であるのかどうかの決定
がされなければならず(ステップ645)もし、そうであ
れば、手順B(ステップ650)が実行されなければなら
ない。手順Bの詳細は第8図に示すとおりである。
第8図に示すように、プロシージアBはステップ800で
始まり、次いで、イメージランダウンのインスツルメン
テーションが取除かれ(ステップ810)、次にディスクI
/Oパーフォームのインスツルメンテーションが取除かれ
る(ステップ820)。最後に、デイリーデータベースフ
ァイルが閉じられ(ステップ830)、時間の終わりまで
待った後(ステップ840)、手順Bは終了する(ステッ
プ850)。手順Bを離れた後でなされる決定は、測定が
再開されているかどうかである(ステップ635)。
第6図示主制御ループによるときは、測定が再開され
ず、停止もされない場合はデータ測定が行われて新しい
デイリーファイルが作成され、真夜中の場合は期限の切
れたファイルが削除される(ステップ660)。次に前述
の急速変化プロセスデータが測定され、各マイナーイン
ターバルごとにレベルが平均化される。レベルの平均化
にはメジャーインターバル時間間隔に亘っての連続平均
を含むようにするを可とする。
次に、ノン・ページドデータベース(測定情報を含むノ
ン・ページドプール内のデータベース)がフラッシュ
(flush)される(ステップ670)。ノン・ページドデー
タベースは例えばイメージランダウンの間に測定された
情報を含む。また、データベースのフラッシングには、
データベース250を可とするデータ収集バッファへのデ
ータの再書込み(リライト)を含む。
次に、第6図に示す主制御ループは各メジャーインター
バルごとに必要な測定を行う。これらの測定には、パラ
メータ値および各マイナーインターバルごとに測定され
なかったメトリックの残りが含まれる。例えば、タイム
レコードは各メジャーインターバルごとに記録され(ス
テップ675)、同様にオペレーティングシステム統計も
各メジャーインターバルごとに記録される(ステップ68
0)。さらに、パラメータ値、ディスクレコードおよび
通信レコードも各メジャーインターバルごとに記録され
る(ステップ683,686および688)。パラメータ値は前述
のように、オペレーティングシステムまたはユーザーの
いずれかにより設定される値であり、ディスクレコード
はステップ680で記録されたオペレーティングシステム
統計またはメトリックとは区別されるようなディスクI/
Oに関するメトリックである。また、通信レコードは通
信リソースメトリックと呼ばれるもので、後述のルール
の説明に記載されている。
また、ネットワークまたはプロセッサの校正が変わった
場合には、メジャーインターバルの終りに構成レコード
が読出される(ステップ690)。例えば、あるプロセッ
サがダウンするか、ディスクが取除かれた場合は構成が
変わり新しいレコードが読出される。
次に、ノン・ページドプール内のプロセスデータベース
が各プロセスに対して更新され、最後にメジャーインタ
ーバルの終わりにプロセスディスク統計が記録される
(ステップ696)。
主制御ループの終わりには、ノン・ページドプール内の
記録された統計がデータベース250のようなデータベー
スに書込まれ、さらにそのデータベースがチェックポイ
ントされる(ステップ698)。これには、新しいデータ
ベースが記録されたことを全システムに報知し、かつデ
ータベースのサイズを調整する更新手順が含まれる。次
いで、主制御ループはステップ620に到り、そこでシス
テムは継続する前にマイナーインターバルの終了するま
で待機する。
(C)解析 一般に、本発明の解析の部分はデータ収集作動中に収集
されたメトリックおよびパラメータへのルールの適用を
含む。前記ルールは一般にメトリックおよびパラメータ
をそれら自身またはあるスレショールド値と比較し、例
えば、より大きい、より小さい等のルールの規準を満足
しているかどうかを調べることを含む。あるルールに対
するすべての規準が満足された場合ルールはトリガされ
たと呼ぶことにする。ルールが所定回数以上トリガされ
た際はメッセージの部分として包含される勧告がそのル
ールにしたがって行われる。この勧告は、一般にシステ
ム性能を改善するため、システム構成の変更またはある
パラメータの調整をユーザーに対し示唆することを含
む。
本実施例に含まれるルールは、一般にメモリルール、CP
Uルール、I/Oルール、チャネルルール、リソースルール
およびクラスタルールに分類される。ここでは、本実施
例のルールの数に応じ、スレショールド値とルールの双
方をともに機能させるようなプログラムを用いてルール
を作成するようにしているが、特に、システムの成長に
したがい、プログラムによる場合よりもさらに容易に修
正可能なルールの知識ベースや推論エンジンを用いたル
ールの作成に置き換えることもできる。
第9A図ないし第9I図はメモリルールに対応するルール1
〜32に関するデシジョンツリー構造を含む。また、第10
A図および第10B図はルール33〜39として示すCPUルール
に関するデシジョンツリー構造を含み、また第11A図な
いし第11D図は本実施例においてルール40〜51で示すI/O
ルールに関するデシジョンツリー構造を含む。さらに、
チャネルルール、リソースルールおよびクラスタルール
に関してはデシジョンツリー構造としては表示せず、本
文中に後述してある。
第9A図ないし第9I図、第10A図、第10B図、および第11A
図ないし第11D図に示すデシジョンツリー構造におい
て、円形素子はそれぞれ行われるべきテストまたは特定
のデシジョンツリーからのエグジット(出口)を示すデ
シジョンポイントあるいはストップポイントのいずれか
である。行われるべきテストは円形ノードの側部に沿っ
て記載してあり、またその詳細はテキスト内で説明して
ある。また、方形ブロックはルール番号を含み、ルール
に関するメッセージテンプリットは本文の終わりの付録
1ないし6に記載してある。
ネットワーク内のプロセッサの1つは、そのプロセッサ
がデータベースに記憶させたすべてのメトリックおよび
パラメータを使用して、ルールのテストを行うことが望
ましい。各レコードは個々にテストされるので、ルール
は考慮中の第1メジャーインターバルの間に収集された
メトリックに最初に適用される。次いで、ルールは第2
メジャーインターバルの間に収集されたメトリックおよ
びパラメータに適用され、このパターンは所望の解析時
間内のすべてのメジャーインターバルがカバーされるま
で継続する。また、システムマネジャーまたはシステム
エンジニアはどのような時間周期の間に解析が所望され
るかを解析プログラムに特定しうることが望ましい。
本発明方法の一実施例においては、システムは、解析プ
ロシージアの間に、トリガまたは点火されたルールなら
びにそのルールに関するエビデンス(根據)を示すデー
タ構造を生成している。前記エビデンスはテストされた
メトリックおよびパラメータの値を含むほか、ルールの
トリガリングをもたらす関連のスレショールド値を有す
る。これらのデータ構造に関しては、本明細書のレポー
ト生成のセクションで詳述することにする。
第9図において、メモリルールに対し行われる最初のテ
ストはデシジョンポイント900においてである。このテ
ストはディスクからのページフォールトレートが、例え
ば10のようなあるスレショールド値に等しいかそれより
大きいかを決定し、キャッシ(cache)からのページフ
ォールトが、例えば100のような他のスレショールド値
に等しいかそれより大きいかを決定し、イン・スワップ
・レート(in-swap-rate)が1のような他のスレショー
ルド値に等しいかそれより大きいかを決定し、あるいは
freecnt+mfycntの和がFREEGOAL+HILIMITに等しいかそ
れより小さいかを決定する。ここで、本発明実施例の記
述の中で使用しているパラメータの多くは呼称を簡単に
するため省略した形を用いており、したがってHILIMIT
は正確には“MPY HILIMIT"である。基本的に、デシジョ
ンポイント900におけるテストは過度のページングまた
は過度のスワッピングのいずれかが存在するか、あるい
はそこにスケアスフリーメモリ(scarce free memory)
があるかどうかを決定することである。
過度のページングに関するテストはディスクおよびキャ
ッシメモリの双方からページフォールトレートをそれぞ
れ10および100のような異なるスレショールド値と比較
することである。ディスクよりのページフォールトは、
それらがソフトフォールトと呼ばれるキャッシよりのペ
ージフォールトに比し時間的観点から一般に高価である
ことから、ハードフォールトと呼ばれる。双方とも秒ご
とに発生しているディスクからのページフォールトレー
トおよびキャッシからのページフォールトレートはデー
タ収集操作中に測定されるメトリックである。
過度のスワッピングについての質問は任意のプログラム
がスワップアウトされたかどうかを決めるイン・スワッ
プ・レートにより決定される。イン・スワップ・レート
もまた1つのメトリックでプロセスがスワップされた回
数を測定する。
スケアスフリーメモリは、デシジョンポイント900に示
す残りのテストにより決定される。FREEGOALおよびHILI
MITはそれぞれフリーメモリのページ数およびメモリ内
で使用可能な修正ページリスト上のページ数に関するリ
ミットである。あるプロセスに関する修正ページリスト
上のページはもはやアクティブではないが、このような
ページはディスクに書き戻す必要があるような変更を含
む。また、freecntおよびmfycntメトリックはフリーリ
スト上の実際のページ数および修正ページリスト上の実
際のページ数をいう。これら2つのパラメータはともに
フリーメモリの量を表わし、それらがそのフリーメモリ
に対する所望の目標より少ない場合は、フリーメモリが
スケアスである(欠乏している)という決定がなされ
る。
過度のページング、過度のスワッピングあるいはスケア
スフリーメモリのいずれもが無い場合は、対応する時間
周期の間にはなんらメモリの問題はないので、メモリル
ールをテストするプロシージアはストップポイント902
に到る。
しかし、過度のページングまたはスワッピングがあり、
もしくはスケアスフリーメモリがある場合は、デシジョ
ンノード904に到り、そこでイメージが少なくとも500フ
ォールトのようなページフォールト(ディスクおよびキ
ャッシの双方からのページフォールト)のスレショール
ド数を有しているかどうか、そのCPUタイム(実行モー
ドにおいてイメージがどの位長いかを示すメトリック)
が4秒のような他のスレショールド値に等しいかそれよ
り大きいか、また、そのイメージのアップタイムすなわ
ち使用可能時間(イメージが存在する時間を示すメトリ
ック)が30秒のような他のスレショールド値に等しいか
それより大きいかの決定がなされ、もしそうであれば、
ルール1がトリガされる。ついで、前記ルール(付録
1)に関するメッセージテンプリットがイメージ名、ユ
ーザー名、時間、イメージフォールトレートおよびトー
タルフォールトレートに関する情報とともにプリントア
ウトされる。基本的には、ルール1は、アプリケーショ
ンプログラムが特殊形式のものか、下手に設計されてい
る場合にトリガされる。メッセージWSQUOTAにおいて議
論したパラメータは特定プロセスに対するワーキングサ
イズクオータ(working size quota)である。前記パラ
メータは、そのイメージのために多くのページを記憶さ
せることを可能にし、ページフォールトの発生率を少な
くするためそれを増加させることが望ましい。
次にデシジョンノード906に到り、ルール1をトリガす
るか否かを決定し、さらに、デシジョンポイント900に
おいて尋ねられたと同じページングに関する質問、特に
ディスクからのページフォールトレートまたはキャッシ
からのページフォールトレートが高すぎないかどうかに
ついての質問が再度行われ、もうそうであれば、デシジ
ョンポイント908に移る。
デシジョンポイント908では、トータルイメージアクテ
ィベーションを例えば毎秒0.5のようなスレショールド
値と比較し、その答がイエスの場合はそこには過度のイ
メージアクティベーションがあるという決定がなされ、
デシジョンポイント910において、任意のプロセスが毎
秒ある数(本実施例では0.5/秒)以上のアクティベーシ
ョンを起こしているかどうかの質問がなされ、もうそう
であれば、アクティベーションは1つのプロセスにより
起こるものと考えられ、ルール2がトリガされる。ルー
ル2(付録1)に関するメッセージテンプリットは過度
のページフォールトの原因となる過度のイメージアクテ
ィベーションが存在することを示す。このメッセージに
おいては、下手に書かれたコマンドプロシージアにより
過大のプログラムを活性化したことがその原因であるこ
とを示唆している。このメッセージは時間、ユーザー名
および活性化されるイメージ数とともにプリントアウト
される。
デシジョンポイント910における答がノウの場合はルー
ル3がトリガされ、全体としてシステム内に過度のイメ
ージアクティベーションに関連する過大のページフォー
ルトがあることを示す。ルール3に関するメッセージテ
ンプリットが示すように、その原因は下手に設計された
アプリケーションプログラムもしくは多過ぎるコマンド
プロシージアを頻繁に実行させようとしたことにあると
考えられる。この場合にも、前記メッセージのほか、時
間、トータルフォールトレート、ハードフォールトレー
トおよびイメージアクティベーションレートがプリント
アウトされる。
また、過度のイメージアクティベーションがないことに
より、デシジョンポイント908における答がノウである
場合は、デシジョンポイント912においてディスクから
のページフォールトがスレショールド値と再度比較さ
れ、ディスクよりのページフォールトレートがスレショ
ールド値より大で、ハードフォールトレートが高すぎる
ことを示す場合には、デシジョンポイント914に移る。
デシジョンポイント914においては、トータルページフ
ォールトが例えば100のようなスレショールド値と比較
され、FREEGOALとHILIMITの和が3000またはユーザーペ
ージの5%のいずれか小さい方と比較される。この第2
の決定の目的は、和FREEGOAL+HILIMITであるページキ
ャッシをワーキングセットに割当てられたメモリの5%
または3000のいずれかと比較することである。これはペ
ージキャッシが充分大きいかどうかをテストする方法
で、もうそうでなければ、デシジョンポイント916に到
る。
デシジョンポイント916においては、freecntとmfycntの
和が再度FREEGOALとHILIMITの和と比較され、フリーメ
モリがスケアスである(欠乏している)かどうかを決定
し、もしそうでなければ、ストップポイント918に到
り、プロセスはメモリルールを去る。
デシジョンポイント916における決定がイエスの場合に
は、ルール4がトリガされる。付録1に示すようなルー
ル4に関する関連のメッセージは温度のハードフォール
ティングがページキャッシの小さすぎることに原因があ
ることを示している。この場合、ページキャッシは、例
えば、MPW_LOLIMIT,MPW_HILIMIT,MPW_THRESH,FREEGOAL
およびFREELIMのようなページサイズを規定するパラメ
ータを増やすことにより増加させることができる。
デシジョンポイント912において、ハードフォールトレ
ートが高すぎることが発見されなかった場合は、デシジ
ョンポイント920に到り、そこで、ページフォールトの
総数の例えば100のようなスレショールド値との比較が
行われる。これは、ソフトページフォールトが高すぎる
かどうかをテストする他の方法を与える。もうそうでな
ければ、ストップポイント922に到り、それ以上メモリ
ルールのテストは行われない。
しかし、デシジョンポイント920においてテストされた
ソフトページフォールトレートが高すぎる場合には、デ
シジョンポイント924に移り、そこでデシジョンポイン
ト914および916の説明に示すように、ページキャッシが
いま大きすぎるか、フリーメモリがいまスケアス(ほと
んどない)状態であるかの決定がなされ、もうそうであ
ればルール5がトリガされる。付録1の関連のメッセー
ジテンプリットはページキャッシを減少させるための勧
告を含む。また、この場合にも、時間、トータルフォー
ルトレート、イメージアクティベーションレート、ハー
ドフォールトレートおよびフリーメモリリスト(freecn
t)のサイズがプリントアウトされる。
デシジョンポイント914(高いソフトフォールトレート
または充分大きいページキャッシ)が満足されるか、デ
シジョンポイント924(大きいページキャッシがなく、
スケアスメモリがない)が満足されない場合には、第9C
図に示すデシジョンポイント926に達する。デシジョン
ポイント926では、2つの決定がなされる。第1は、COM
(計算)モードにないようなフォールティングプロセス
の下半分のプロセス、換言すれば過度のフォールティン
グのないプロセスを見つけ出すことである。次の決定
は、このようなプロセスが使用可能メモリの5%より大
きいワーキングセットサイズをもっているかどうか、PF
RATH(VMSオペレーティングシステムがあるプロセスの
ために割当てる最大レート)より少ないページフォール
トをもっているかどうか、またそれらの割当数(quot
a)に等しいかそれより少ないワーキングセットサイズ
をもっているかどうかを発見することである。これらの
諸条件が満足された場合は、ルール6がトリガされる。
このルールに関する付録1のメッセージテンプリットに
示すように、ルール6のトリガリングは、全システム的
なページフォールトが高く、また適度に遊んでいたある
プロセッサが大きなワーキングセットを有していたとい
う決定を含む。また、この場合には、あるユーザーに対
してワーキングセットサイズクオータ、WSQUOTAを減ら
し、分離したプロセスに対してそのクオータを減らすこ
とが勧告される。このルールに関するメッセージととも
にプリントアウトされる要素としては、ユーザー名、関
連のワーキングセットクオータおよびイクステント(領
域)、イメージ名、時間およびワーキングセットサイズ
があり、また、イメージフォールトレート、トータルフ
ォールトレートおよびフリーリストのサイズもプリント
アウトされる。
ルール6が満足された後は、デシジョンポイント930に
おいて、特定のプロセスがその上限値の2倍以上のペー
ジフォールトを有し、例えば、0.5秒のようなある数よ
り大きいCPUタイムを有するか、またはプロセスが計算
モードにあった1以上の回数を示すCOM変数を有するか
の決定がなされる。これらの条件が満足され、かつその
プロセスがWSEXTENT(ワーキングセットの最大サイズ)
マイナス2/3*WSINC(付加的スペースを必要とすると
き、VMSオペレーティングシステムが付加するページ
数)より大きいワーキングセットサイズを有する場合
は、ルール7がトリガされる。また、ルール7は、デシ
ジョンポイント926における条件が満足されないとき到
達するデシジョンポイント928でテストされる同じ条件
に対してもトリガされる。
デシジョンポイント928および930における決定は、ユー
ザーのワーキングセット領域が低すぎるかどうかという
ことである。ユーザーのワーキングセット領域が低すぎ
ることが分かった場合はルール7がトリガされる。結論
はあるユーザーが許容されたものより多くのメモリを所
望するイメージを実行していたという事実にもとづいて
おり、また、付録1のルール7に関するテンプリットに
説明しているように、あるユーザーに対してWSEXTENTを
増加させる必要がある。また、この場合もメッセージテ
ンプリットとともに、ユーザー名、ワーキングセットク
オータおよびイクステント、イメージ名、時間、ワーキ
ングセットサイズ、イメージフォールトレート、トータ
ルフォールトレートおよびフリーリストのサイズがプリ
ントアウトされる。
デシジョンポイント930における答がノウの場合は、ス
トップポイント931に移る。デシジョンポイント928にお
ける答がノウの場合はデシジョンポイント932に到り、
そこでプロセスの総数がBALSETCNTより大きいかどうか
の質問がなされる。BALSETCNTはデータ構造に関してあ
らかじめ構成されたプロセス数を示すパラメータであ
る。さらに、任意の余分なフリーメモリ(freemem)が
(freecnt+mfycnt)マイナス(FREEGOAL+HILIMIT)に
等しいかどうか、またイン・スワップ・レートが0より
大きかったかどうかが質問される。これらの2つの質問
は、そこに任意の余分なフリーメモリがあるかどうか、
スワップされているプロセスがあるかどうかを決めるこ
とである。
もうそうであれば、ルール8がトリガされ、充分なフリ
ーメモリがあるにも拘らず、そこには過度のページフォ
ールティングがあることを示す。ルール8に関するメッ
セージテンプリット(付録1)は、スワッパーが不必要
にワーキングセットをトリミングし、スワップの準備を
していることを示している。また、メッセージテンプリ
ット内には、パラメータBALSETCNTを増加させて、そこ
に充分なメモリがあるときスワッパーがプロセスをトリ
ミングしないようにし、かくしてページフォールトを減
少させるよう勧告がなされている。この場合、メッセー
ジとともにプリントアウトされるデータには、時間、ト
ータルフォールトレート、ハードフォールトレート、イ
メージアクティベーションレート、フリーリストのサイ
ズおよびシステム内のプロセスの数が包含される。
デシジョンポイント932における答がノウの場合には、
デシジョンポイント934に到り、BORROWLIMおよびGROWLI
Mパラメータが比較される。BORROWLIMパラメータはある
プロセスが付加的メモリを受容するよう緩和されたかど
うかを示し、GROWLIMパラメータはあるプロセッサが実
際にそのメモリを受入れているかどうかを示す。BORROW
LIMがGROWLIMより小さい場合は、ルール9がトリガされ
る。ルール9により示される問題に対する解はそのルー
ルに関するメッセージテンプリットに示唆されており、
その助言はGROWLIMパラメータをBORROWLIM以下に減少さ
せ、利用可能メモリの割当てを許容することである。ま
た、この場合にも、ユーザー名、イメージ名、ワーキン
グセットサイズ、イメージフォールトレート、時間のほ
かにFREELM,BORROWLIM,GROWLIM,PAGECACHE,FREELIM,FRE
EGOAL,WSMAXを含む種々のパラメータがメッセージとと
もにプリントアウトされる。ここで、WSMAXは最大のワ
ーキングセットサイズを示す。
デシジョンポイント934がノウであるというデシジョン
の結果、すなわち、BORROWLIMがGROWLIMに等しいかそれ
より大きい場合には、デシジョンポイント936に到り、
デシジョンポイント936においてWSINCが0に等しいかど
うかを調べるためテストれる。この状態は、AWSA(自動
ワーキングセット調整)がターンオフされた場合に起こ
る。デシジョンポイント936におけるテストの結果がイ
エスの場合は、ルール10がトリガされる。この場合問題
は、過度のページフォールティングを軽減するため、VM
Sは付加的メモリを割当てることができないということ
である。これは付録1のルール10に関するメッセージテ
ンプリットに説明されている。この問題は、WSINCを150
またはある適当な他の値に設定することにより補正する
ことができる。
デシジョンポイント936における決定がWSINCが0に等し
くないというものであった場合は、デシジョンポイント
938に到り、そこで他のいくつかの決定が行われる。そ
の第1は、フリーメモリが、例えば100のようなあるス
レショールド値より大きいかどうかということである。
また第2は、例えば10またはそれ以上のような過度のペ
ージフォールトを有し、0.2秒またはそれ以上のような
大きいCPU時間を有し、WSEXTENTマイナスWSINCより小さ
いwssizを有し、また(7/8)*WSLISTより大きいwssizを有
するようなプロセスの5%もしくは2つのプロセスのい
ずれかがそこにあるかどうかということでる。ここで、
WSLISTはワーキングセットのポテンシャルサイズであ
る。もうそうである場合は、ワーキングセットサイズを
より多いページまで増加させることはできたが、それが
なされなかったことによりAWSAが遅すぎることが分か
る。
デシジョンポイント938における決定がイエスの場合
は、デシジョンポイント940に移り、そこでRSNS SWPFIL
Eを待っている任意のユーザーがあるかどうかの決定が
なされる。これは、メモリスペースを待っているがかな
えられないすべてのプロセッサを示すファイルである。
スワップファイルに対して待ち状態にあるプロセスがあ
る場合は、ルール11がトリガされる。付録1のルール11
に関するテンプリットに示すように、スワッピングファ
イルを増やすことはプロセスの成長を助長し、フォール
トを削減することを許容する。メッセージテンプリット
とともにプリントアウトされるデータには、時間、トー
タルフォールトレート、ハードフォールトレート、イメ
ージアクティベーションレート、フリーリストのサイズ
およびシステム上のプロセス数が包含される。
プロセスがスワップファイル内で待機していないことに
より、デシジョンポイント940における決定がノウの場
合には、デシジョンポイント942においてPFRATH(ペー
ジフォールトレートが高い)が160のようなスレショー
ルドに対してテストされる。その条件が満足される場合
は、ルール12がトリガされる。ルール12は、余分のフリ
ーメモリがあるにもかかわらず、過度のページフォール
ティングがあったことにより、AWSAの応答が遅いことを
示す。ルール12に関するメッセージは付録1に示すとお
りである。また、メッセージがプリントアウトされる際
は、時間、トータルフォールトレート、ハードフォール
トレート、イメージアクティベーションレートおよびフ
リーリストのサイズとともにPFRATHに対する値もプリン
トアウトされる。
条件とデシジョンポイント942が合致しない場合には、
デシジョンポント944に到り、そこでWSINCのサイズが例
えば100のようなスレショールドと比較され、WSINCが該
スレショールド値より小さい場合には、ルール13がトリ
ガされる。付録1に示すルール13に関するメッセージテ
ンプリットは、AWSAの遅いレスポンスの理由がワーキン
グセットの成長が遅すぎることによるものでWSINCを増
加させることによりこの状態を改善できることを示して
いる。この場合にも、時間、トータルフォールトレー
ト、ハードフォールトレート、イメージアクティベーシ
ョンレートおよびフリーリストのサイズがメッセージテ
ンプリットとともにプリントアウトされる。
デシジョンポイント944における結果がノウの場合に
は、デシジョンポイント946に達し、そこで、パラメー
タAWSTIMが50のようなスレショールド値と比較される。
AWSTIMパラメータは連続するワーキングセット調整の間
のCPUタイムの量である。もし、この数が高すぎる場合
にはルール14がトリガされる。このメッセージに関する
テンプリットは、AWSTIMEパラメータ(ワーキングセッ
ト調整の間の最小時間)を例えば220のように減少させ
る必要があり、もしくはAWSTIMをリセットするのにAUTO
GENユーティリティが許容できることを示している。こ
の場合には、メッセージテンプリットとともに、時間、
トータルフォールトレート、イメージアクティベーショ
ンレートおよびフリーリストのサイズがプリントアウト
またはディスプレイされる。デシジョンポイント946に
おける決定がノウの場合には、ストップポイント948に
達する。
次に、デシジョンポイント938における決定がノウであ
り、かつ、AWSAが遅すぎることが発見されなかった場合
には、デシジョンポイント950に到り、そこで自発的な
減少がターンオンされたかどうかの質問がなされる。も
しそうでなければ、デシジョンポイント952に移り、2
つの他のテストが行われる。第1の決定はフォールティ
ング中のトップの2つのプロセスが2つの最も大きいワ
ーキングセットサイズプロセスを有するプロセスより小
さいワーキングセットサイズを有するかどうかというこ
とで、第2の決定は、freecntがBORROWLIMプラスWSINC
より小さいかどうかということである。これら双方の条
件が満足される場合は、自発的減少が必要となり、ルー
ル15がトリガされる。付録1のルール15に関するメッセ
ージテンプリットは、パラメータWSDEC(ワーキングセ
ットサイズを減少させうる量)を35のように適当な値に
設定し、パラメータPFRATL(ページフォールトレートの
低いパラメータ)を10のような低い値に設定することに
より補正を行うことを示唆している。
デシジョンポイント950において、自発的減少がターン
オンされたという決定が行われた場合はデシジョンポイ
ント954に到る。デシジョンポイント954においては、デ
ィスクからのページフォールトレート(ハードフォール
ト)が10のようなある数より小さいかどうか、トップの
2つのフォールティングプロセッサ(1)がWSEXTENTマ
イナスWSINCより小さいサイズを有し、(2)がPFRATH
より小さいpfrate(プロセス当たりのページフォールト
レート)を有しているかどうかの決定がなされる。双方
の条件が満足された場合はAWSAがワーキングセットをシ
ュリンク(縮小)させすぎ、かくしてルール17がトリガ
される。付録1のルール17に関するメッセージテンプリ
ットはWSDECもしくはPFRTLを減少させるべきことを示し
ている。また、この場合にも時間、トータルフォールト
レート、イメージアクティベーションレート、ハードフ
ォールトレートおよびフリーリストのサイズがメッセー
ジテンプリットとともにプリントアウトされる。
デシジョンポイント952または954における決定の結果が
ノウの場合には、デシジョンポイント956に到り、そこ
でいくつかの条件がテストされる。その第1は、freeme
mが小さすぎるかどうか(すなわち100に等しいかそれよ
り小さいかどうか)であり、第2は、プロセスがスワッ
パートリミングにカットバックされるサイズを示すSWPO
UTPGCNTが例えば200のような他のスレショールドより小
さいかどうかである。また、第3の条件は、プロセスの
1/3がそれらのクオータ(割当数)またはSWPOUTPGCNTの
近く(例えば、プラスまたはマイナス30ページ)にある
かどうかである。これらの3つの条件がすべて満足され
る場合は、いくつかのプロセスが理由なしにカットバッ
クされ、かつスワッパートリミングが激しすぎたことに
なり、かくして、ルール16がトリガされる。このルール
に関するテンプリットは、LONGWAIT(アイドルまたは放
棄プロセスを一時的に休止しているプロセスと区別する
時間の長さ)の増加が一時的に休止しているプロセスに
対して、トリミングされる前に、さらに長い時間をスワ
ッパーにより与えうることを示している。この場合に
も、メッセージテンプリットのほかに、時間、トータル
フォールトレート、イメージアクティベーションレー
ト、ハードフォールトレート、平均のワーキングセット
サイズおよび最大のワーキングセットサイズがプリント
アウトされる。
デシジョンポイント956において、スワッパートリミン
グが激しすぎることが発見されなかった場合は、デシジ
ョンポイント958において、freememが再度100のような
あるスレショールド値と比較され、フリーメモリがスケ
アスであるかどうかを調べ、もしそうでなければ、スト
ップポイント959に到る。もし、フリーメモリがスケア
スの場合には強いメモリ要求により過度のページフォー
ルティングが存在するものと考えられ、ルール18がトリ
ガされる。付録1のルール18に関するメッセージテンプ
リットにこの条件を詳細に記述してある。この場合も、
前記メッセージテンプリットとともに、時間、トータル
フォールトレート、イメージアクティベーションレー
ト、ハードフォールトレートおよびフリーリストのサイ
ズがプリントアウトされる。
これまでのルールはページングに関するものであった
が、デシジョンポイント906において過度のページング
が発見されなかった場合には、スワッピングに関する質
問を調べる必要があり、デシジョンポイント960におい
てこれが行われる。このポイント960においては、特
に、イン・スワップ・レートが例えば1のようなスレシ
ョールド値と比較され、イン・スワップ・レートが1に
等しいかそれより大きい場合には、デシジョンポイント
962に到る。
デシジョンポイント962においては、フリーバランスセ
ットスロットが例えば2のような他のスレショールドと
比較される。バランスセットスロットは各々共存可能な
1つのプロセスに対応する。フリーバランスセットスロ
ットに対する小さすぎる値とは、スワッピングのためそ
こには過度のオーバーヘッドがあり、かつ、そこにフリ
ーバランスセットスロットがないことにより、BALSETCN
Tが小さすぎることを意味する。デシジョンポイント962
における決定の結果がイエスの場合には、ルール19がト
リガされる。このルールに関するメッセージテンプリッ
トは付録1に示すとおりで、前記メッセージテンプリッ
トは、時間、イン・スワップ・レート、CPUアイドルタ
イム、フリーページレイショ、バランスセットにおける
プロセス数およびアウトスワッププロセスの数とともに
プリントアウトされる。
デシジョンポイント962において、充分な数のフリーバ
ランススロットが発見された場合は、デシジョンポイン
ト964に到り、すべてのプロセスに関するppgcntプラスg
pgcntの和がユーザ−ページの総数マイナスキャッシマ
イナス100と比較される。メトリックppgcntおよびgpgcn
tはそれぞれプロセスページの数およびグローバルペー
ジの数を表わす。キャッシのサイズは、一般にfreecnt
プラスmfycntのサイズであり、また最後の項100は変更
可能な数で、通常これはある種のバッファ数もしくはス
ラックを表わすものである。デシジョンポイント964で
考慮中のメトリックおよびパラメータは、すべてのワー
キングセットに対して充分なメモリがあるかどうか(す
なわち、ppgcntプラスgpgcntが他の項より大きいかどう
か)を決定するのに使用される。もしそうであれば、ス
トップポイント965に到り、そうでなければ、デシジョ
ンポイント966に到る。
デシジョンポイント966においては、キャッシのサイズ
が使用可能メモリの5%か3000のようなある他の値のい
ずれか小さい方と比較され、キャッシがこれら2つの数
の小さいものより大きい場合は、ルール20がトリガされ
る。このルールに関するメッセージテンプリットは付録
1に示すとおりで、前記メッセージテンプリットのほ
か、時間、イン・スワップ・レート、CPUアイドルタイ
ム、フリーバランスセットスロット、使用可能なメモリ
ページ数および使用されるメモリページ数がプリントア
ウトまたはディスプレイされる。
デンジョンポイント966における決定がノウの場合は、
デシジョンポイント968に到り、そこで、トップの2つ
のプロセスがともに例えば5%のようなある使用可能メ
モリ量以上のメモリ量を有するかどうか、また、それら
が半分以上の時間COM(計算)モードにあるか、もしく
はCPUの半分以上を集合的に使いつくしているかどうか
についての決定がなされる。もうそうであれば、そこに
はシステムリソースを使いつくす大きなコンピュート・
バウンド(compute-bound)プロセスがあるという決定
がなされ、ルール21がトリガされる。この条件に関する
勧告が付録1のルール21に関するメッセージテンプリッ
トに示されている。この場合、メッセージの他にプリン
トアウトされるデータには、ユーザー名、ワーキングセ
ットクオータ、イメージ名、ワーキングセットサイズ、
時間、イン・スワップレート、フリーバランスセットス
ロットの数およびフリーリストのサイズが含まれる。
デシジョンポイント968において、大きいコンピュート
・バウンドプロセスが検出されなかった場合は、デシジ
ョンポイント970に到り、NOSWAPセットを有するプロセ
スが探究される。NOSWAPセットはそのプロセスがスワッ
プアウトされることができないことを示す。このような
プロセスが存在し、ユーザーメモリの5%以上のメモリ
量を有し、かつ、10%のようなある時間のパーセンテー
ジより少ない時間、COMモードにある場合は、ルール22
がトリガされる。付録1のこのルールに関するメッセー
ジテンプリットには、スワッピングが示唆されている。
この場合にも、ルール22に関するメッセージテンプリッ
トの他にユーザー名、イメージ名、時間、フリーバラン
スセットスロットの数、フリーリストのサイズ、ワーキ
ングセットサイズおよびイン・スワップ・レートがプリ
ントアウトされる。
デシジョンポイント970における結果がノウの場合には
デシジョンポイント972に移る。デシジョンポイント972
においては、プロセスの2つまたは5%の大きい方がメ
モリの5%以上を有しているかどうかが質問される。そ
こで、もしそうでなければ、ルール24がトリガされ、ス
ワッピングにより過度のオーバーヘッドが生じているこ
とを示す。また、この場合には、このルールに関するメ
ッセージテンプリットとともに時間、イン・スワップ・
レード、フリーバランスセットスロットの数およびユー
ザーに対し使用可能なメモリページ数がプリントアウト
される。
ノード972における決定がイエスで、過度のスワッピン
グがないことを示す場合には、デシジョンポイント974
に移り、そこに対応する割当数(クオータ)より大きい
ワーキングセットサイズをもった任意のプロセスがある
かどうかについて質問がなされる。そこにそのようなプ
ロセスが存在する場合は、ルール23がトリガされ、そこ
に過度の借用(borrowing)があるらしいことを示す。
この場合は、ルール23に関するメッセージテンプリット
に示したように、BORROWLIMおよびGROWLIMを増やす必要
がある。また、このルール23に関するメッセージととも
にプリントアウトされるデータには、ユーザー名、ワー
キングセットクオータ、イメージ名、ワーキングセット
サイズ、時間、フリーバランスセットスロットの数およ
びイン・スワップ・レートが含まれる。
デシジョンポイント974における答がノウの場合は、デ
シジョンポイント976に到る。デシジョンポイント976に
おいて、COMOプロセスの数が全プロセスの50%以上であ
ること(すなわち、プロセスの大部分が計算可能である
こと)が分かった場合は、デシジョンポイント978に到
る。
デシジョンポイント978において、bpri(最も低い優先
順位)におけるCOMOプロセスの数がCOMOプロセスの数マ
イナス1に等しいかそれより大きい(すなわち、COMOプ
ロセスが基準優先順位にある)ことが判明した場合は、
デシジョンポイント980に移る。
デシジョンポイント980においては、すべてのバッチジ
ョブに対するワーキングセットサイズの和が30%のよう
なあるパーセンテージの使用可能メモリと比較される。
ワーキングセットサイズの和が該パーセンテージより大
で、そこに大きなバッチジョブがあることを示す場合
は、ルール25がトリガされる。関連のメッセージテンプ
リットは付録1に記載のとおりで、前記メッセージテン
プリットのほか、時間、イン・スワップ・レート、フリ
ーバランスセットスロットの数、ユーザーに対して使用
可能なメモリページ数および計算可能なプロセスの数が
プリントアウトまたはディスプレイされる。
デシジョンポイント980における答がノウの場合は、ル
ール26がトリガされ、スワッピングによるオーバーヘッ
ドを減少させ、スワップ間の時間量すなわちSWPRATEを
増加させるべきことが示唆される。また、ルール26に関
するメッセージは付録1に示すとおりで、前記メッセー
ジとともに、時間、イン・スワップ・レート、フリーバ
ランスセットスロットの数、ユーザーに対して使用可能
なメモリページ数および計算可能なプロセスの数がプリ
ントアウトされる。
デシジョンポイント978の結果が、すべてのCOMOプロセ
スが基準優先順位にないことが判明した場合は、デシジ
ョンポイント982に移り、そこで、ページフォールトの
総数と有効なフォールト間の差が25のようなあるスレシ
ョールド値と比較される。ここで、有効なフォールト
(valid fault)はスワッピングにより起こるページフ
ォールトの数を示す。また、トータルページフォールト
にはハードページフォールトおよびソフトページフォー
ルトの双方が含まれる。かくして、もしその差がスレシ
ョールド値より大きい場合は、ルール27がトリガされ
る。このルールに関するメッセージテンプリットはスワ
ッピングにより過度のオーバーヘッドが生ずることを示
しており、メモリの付加またはワーキングセットサイズ
の縮小のような勧告を与えている。また、この場合も前
記メッセージテンプリットとともに、時間、イン・スワ
ップ・レート、フリーバランスセットスロットの数、ユ
ーザーに対して使用可能なメモリページ数、計算可能プ
ロセスの数およびトータルフォールトレートがプリント
アウトされる。
デシジョンポイント982における決定がノウの場合は、
ルール28がトリガされ、システムはページを付加するよ
りむしろスワップ中であることを示す。このルールに関
するメッセージテンプリットはWSQUOTA,PFRATH,WSINCを
変えてこの問題を軽減することを示唆している。また、
前記メッセージテンプリットとともにプリントアウトさ
れるデータには、時間、イン・スワップ・レート、フリ
ーバランスセットスロットの数、ユーザーに対して使用
可能なメモリページの数および計算可能なプロセスの数
のほか、トータルフォールトレートおよび有効なフォー
ルトレートが含まれる。
デシジョンポイント976において、大部分のプロセスが
計算可能でないことが判明した場合は、デシジョンポイ
ント984に到り、SWPOUTPGCNTが例えば100以上のように
過大かどうかを決定する。もうそうであれば、ルール29
がトリガされスワッピングに起因する過度のオーバーヘ
ッドが生じたことを示す。このルールに関するメッセー
ジテンプリットはSWPOUTPGCNTを減少させることを示唆
している。また、この場合にも、このメッセージテンプ
リットとともに、平均ワーキングセットサイズ、最大ワ
ーキングセットサイズ、イン・スワップ・レート、フリ
ーバランスセットスロットの数、ユーザーに対して使用
可能なメモリページの数および計算可能なプロセスの数
がプリントアウトされる。
デシジョンポイント984における決定の結果として、SWP
OUTPGCNTが過度に低くなかった場合は、ルール30がトリ
ガされる。このルールに関するメッセージは、アイドル
プロセスに過大なメモリが浪費されていることを示し、
WSQUOTA,PFRATH,WSINCおよびSET PROC/NOSWAPを変える
ことが示唆されている。また、このメッセージテンプリ
ットとともに、時間、平均ワーキングセットサイズ、最
大ワーキングセットサイズ、イン・スワップ・レート、
フリーバランスセットスロットの数、ユーザーに対して
使用可能なメモリページの数および計算可能なプロセス
の数がプリントアウトされる。
ここで、デシジョンポイント960に戻り、過度のスワッ
ピングがないことが決定された場合は、スケアスフリー
メモリが調査されなければならず、それはデシジョンポ
イント986で起こる。デシジョンポイント986においては
あるプロセスのワーキングサイズの和が、例えば25%の
ような使用可能メモリのパーセンテージと比較される。
そのワーキングセットサイズの和を求められる上記プロ
セスは充分小さいページフォールトレートを有し、その
サイズがWSQUOTAより小さいプロセスを含む。この条件
が満足された場合は、メモリの割当てが可能と思われる
ので、ルール31がトリガされる。この場合にも付録1に
示すルール31に関するメッセージテンプリットのほか、
時間、イン・スワップ・レート、フリーリストのサイ
ズ、トータルフォールトレート、ユーザー名、ワーキン
グセットクオータ、ワーキングセットサイズおよびイメ
ージフォールトレートがプリントアウトまたはディスプ
レイされる。
デシジョンポイント986における決定が、メモリの割当
てが可能と思われなかった場合には、デシジョンポイン
ト988でフリーリストサイズがFREEGOALと比較される。
かくして、フリーリストサイズがFREEGOALに等しいか、
それより大きい場合は、ストップポイント990に到る。
もし、そうでない場合は、ルール32がトリガされ、まも
なく問題が起こる可能性があることを示す。これは付録
1のルール32に関するメッセージテンプリットに説明さ
れている。この場合に、前記メッセージのほかに時間イ
ン・スワップ・レート、フリーリストのサイズ、修正さ
れたリストのサイズおよびトータルフォールトレートが
プリントアウトされる。CPUに関するルールは第10A図お
よび第10B図に示すとおりで、前記ルールはルール33な
いし39を含む。デシジョンノード1000においてなされる
最初の質問はCOMおよびCOMOプロセスの双方が5に等し
いかそれより大きいかということである。もうそうでな
ければ過度の計算可能なプロセスがないことを示し、ス
トップポイント1005に到る。デシジョンポイント1000に
おける答がイエスの場合は、デシジョンポイント1010に
おいて、最も高い優先順位のCPUユーザーが時間の1/3以
上COMモードにある他のプロセスより高い基準優先順位
をもっているかどうか、また、例えば、4より大きいよ
うな充分高い基準優先順位をもっているかどうかの決定
がなされる。もし、これらの条件が満足された場合は、
そこには、より高い優先順位のロックアウトがあるとい
う結論に達し、付録2のルール33に関するメッセージテ
ンプリットに示すように、基準優先順位を調整するよう
勧告がなされる。もうそうでなければ、デシジョンポイ
ント1015に到り、例えば、4のようなある数に等しいか
それより大きい基準優先順位を有するすべてのプロセス
に対してPRO L COMが付加される。ここで、PRO L COMは
あるプロセスが計算可能であることが発見された回数で
ある。もし、その和が5のような他のスレショールドに
等しいかそれより高く、かつ、CPUの1/2以上(または他
の適当な任意のパーセンテージ)を使っている単一プロ
セスがある場合は、ルール34がトリガされ、付録2のル
ール34に関するテンプリットに示すように、そこには調
査を必要とする“ホッグ(hog)”プロセスがあること
を示す。デシジョンポイント1015における結果がノウの
場合は、デシジョンポイント1020において、割込みCPU
タイムが20のような他のあるスレショールドと比較され
る。割込みCPU時間が充分に高く、割込みスタック上に
過度のCPU時間があることを示す場合は、例えば、DMF32
またはDMZ32のような異なる通信装置を使用し、異なる
インタフェースを使用し、待機中I/O(QIO)を異なるオ
ペレーション形式に変更し、かつそれらをバッファ内に
配置するような再構成、もしくはビデオ端末を使用する
プログラムの再設計を含むいくつかの異なる行動をとる
ことが勧告されている。またルール35に関するテンプリ
ットは付録2に示すとおりである。
割込みスタック上に過度のCPUタイムがない場合には、
次のデシジョンポイント、すなわちデシジョンポイント
1025において、そこに任意のCPU遊び時間があるかどう
かの決定がなされ、もしそうであれば、ストップポイン
ト1030に到り、もしそうでなければ、デシジョンポイン
ト1035に到る。デシジョンポイント1035においては、CP
Uの核の時間(カーネルタイム)が30のようなあるスレ
ショールドと比較される。VMSコードにおけるカーネル
(Kernel)タイムはシステムサービスおよびオーバーヘ
ッドタスクに関する。そこに過度のCPUカーネルタイム
があるという決定がなされた場合には、デシジョンポイ
ント1040に達し、そこで、変数QUANTUMが15のようなス
レショールド値と比較され、ページフォールトの総数が
100のような他のスレショールド値と比較され、さら
に、ハードフォールトの総数が10のような他のスレショ
ールド値に対してテストされる。ここで、QUANTUMはプ
ロセスが、スケジュールアウトされる前にランを始める
回数を示す。もし、その回数が充分高く、ハードページ
フォールトレートおよびソフトページフォールトレート
がスレショールド以下の場合は、おそらく、あるシステ
ムサービスの使いすぎにより、カーネルモードタイムに
関する問題が発生している。デシジョンノード1040にお
ける決定がイエスの場合にトリガされるルール36に関す
るテンプリットは付録2に示すとおりである。
デシジョンポイント1040における決定がノウの場合に
は、デシジョンポイント1045において、QUANTUM変数が
同じスレショールドに対してチェックされ、それがスレ
ショールドより小さいかどうかが調べられ、もうそうで
なければ、ストップポイント1050に到る。もしそうであ
る場合は、ルール37がトリガされ、付録2のルール37に
関するテンプリットに示すように、QUANTUMタイムを増
加させることが示唆される。
デシジョンポイント1035において過度のカーネルタイム
がないことが判明した場合には、デシジョンポイント10
55に到り、そこでEXECモードタイムが例えば、20のよう
なスレショールドより大きいかどうかがテストされ、も
しそうであれば、ルール38がトリガされ、そうでなけれ
ば、ルール39がトリガされる。これら2つのルールに関
するメッセージテンプリットは付録2に示すとおりであ
る。
第11A図ないし第11D図はI/Oに関するルールを示す。デ
シジョンポイント1100においてなされる最初の決定は、
秒あたり最大のオペレーションを有するディスクが設定
されたスレショールドに等しいかそれより大きいか、あ
るいは任意のディスクが該スレショールドに等しいかそ
れより大きい秒あたりのオペレーションを有するかとい
うことである。もしそうであれば、デシジョンポイント
1110に到り、そこで、ファイルシステム(すなわち、I/
Oを行うに必要なファイル)内で費消された時間がCPUタ
イムのパーセンテージと比較される。もし、ファイルシ
ステム内で費消される時間がCPUタイムのパーセンテー
ジより大きい場合は、デシジョンポイント1115に到る。
デシジョンポイント1115においてはファイルキャッシヒ
ットレイショが70のようなスレショールド値と比較さ
れ、また、ミスI/Oレート(missed I/O rate)が5のよ
うなスレショールド値と比較される。ファイルキャッシ
ヒットレイショはファイルキャッシのヒットのミスとの
比であり、また、ミスI/Oレートはプロセスがファイル
に関する情報を得るため外に出たがそれを発見できなか
った秒あたりの回数を示す。ファイルキャッシヒットレ
ートが低すぎず、また、ミスI/Oレートが高すぎない場
合には、ルール40がトリガされる。付録3のルール40に
関するメッセージテンプリットには、オーバーヘッドを
生成するためファイルシステムを再構成することが勧告
されている。
そうでなくして、ファイルキャッシヒットレートが低す
ぎるか、ミスI/Oレートが高すぎる場合には、デシジョ
ンポイント1120に到り、そこで、ファイルオープンレー
トが毎秒5のようなスレショールドと比較される。この
ファイルオープンレートが高すぎる場合には、ルール41
がトリガされる。ルール41に関するメッセージテンプリ
ットは付録3に示すようにファイルの開閉を最小にする
ことを示唆している。
デシジョンポイント1120における決定の結果がノウの場
合は、デシジョンポイント1125に移り、そこで、ファイ
ルヘッダーキャッシミス(file header cache misses)
がキャッシミスのトータルパーセンテージと比較され、
ファイルヘッダーキャッシミスが90%のようなあるパー
セント以下の場合には、ストップポイント1130に到る。
そうでない場合はルール42がトリガされ、付録3のルー
ル42に関するメッセージテンプリットに示すように、フ
ァイルシステムキャッシの増加を示唆する。
デシジョンポイント1110において、ファイル内のCPUタ
イムが高すぎなかった場合は、デシジョンポイント1135
に到り、そこで、CPUの実行モードタイムが例えば、20
のようなスレショールドと比較される。もし、CPUの実
行モードタイムが該スレショールド以上の場合には、ル
ール43がトリガされ、そこには高い実行モードタイムを
有する過度のI/O要求があることを示す。付録3に示す
ルール43に関するメッセージテンプリットにはある種の
再構成が勧告されている。
しかし、CPU実行時間がスレショールドより小さい場合
にはデシジョンポイント1140に到り、秒あたり最大のオ
ペレーションを有するディスクに対する秒あたりのペー
ジングおよびスワッピングオペレーションが該ディスク
に対する秒あたりのトータルオペレーションの50%のよ
うなあるパーセンテージと比較される。
そのディスクが本来ページングやスワッピングを行って
いないことが決定された場合は、デシジョンポイント11
45に到達する。デシジョンポイント1145においては、ト
ップのDIRIO(direct I/O)ユーザーの秒あたりのdiri
o'sが秒あたりのトータルシステムdirio'sと比較され
る。かくして、トップユーザーの秒あたりのdirio'sが
トータルシステムの秒あたりのdirio'sの50%のような
あるパーセンテージ以上であり、かつ秒あたりの最大オ
ペレーションのディスク上の待ちの長さが1.5秒(平均
長)より大きい場合には、ルール44がトリガされ、特
に、ディスクI/Oの再構成が再び提議される。詳細に関
しては、付録3のルール44に関するメッセージテンプリ
ットを参照されたい。デシジョンポイント1145におい
て、あるユーザーがI/Oの大部分をディスクに受け持た
せていないか、ディスクが待ち時間(queue)を有しな
い場合は、ストップポイント1150に到る。
デシジョンポイント1140においてディスクが本来ページ
ングおよびスワッピングをしないことが決められた場合
は、デシジョンポイント1155に移り、そこで秒あたりの
最大オペレーションの場合のディスクのページングオペ
レーションだけが該ディスクの秒あたりのオペレーショ
ンの50%のようなあるパーセンテージを超えているかど
うかの決定がなされる。もし、そうであれば、ディスク
が本来ページングを行っていることが決定されて、ルー
ル45がトリガされ、ルール45に関するメッセージテンプ
リットに示すように、ある種の再構成が示唆される。
デシジョンポイント1155において、最もビジイなディス
クが本来ページングを行っていることが発見されなかっ
た場合には、デシジョンポイント1160に到る。
デシジョンポイント1160においては秒あたりの最大オペ
レーションを有するディスクに対するスワッピングオペ
レーションがそれらのオペレーションの50%と比較さ
れ、ディスクが本来スワッピングを行っていないことが
決定された場合は、ストップポイント1165に達する。も
し、ディスクが本来スワッピングを行うことが決定され
た場合には、ルール46がトリガされて、スワッピングに
よりディスクに過度のロードが生じていることを示し、
かつ、付録3のルール46に関するメッセージテンプリッ
トによりさらに調査することが示唆される。
デシジョンポイント1100に戻って、ディスクに対するI/
Oレートが装置のスレショールドより大きいことが分か
った場合は、デシジョンポイント1105に到り、そこで2
つの質問がなされる。第1は任意のディスクが1.5秒
(平均)に等しいかそれより大きい待ちの長さを有する
かどうかという質問であり、第2は、FCPターン/ファ
イルオープンレイショが3のようなあるレイショ(比)
に等しいかそれより大きいかという質問である。FCP
(ファイル制御プロセッサ)ターンは擬似キャッシアク
セスと呼ばれるファイル制御パラメータを意味し、情報
を得るためシステムがファイルにアクセスする回数を示
す。これら2つの条件が満足された場合は、ルール47が
トリガされ、本発明方法により、そこにはディスクに関
するフラグメンテーション(細分化)問題があり得るこ
とが決定される。付録3のルール47に関するメッセージ
テンプリットにはこのような問題を補正するための勧告
が示されている。
デシジョンポイント1105における決定の結果がノウの場
合は、デシジョンポイント1170に到り、そこで次の2つ
の決定がなされる。第1はバッファードI/Oレートが70
のようなスレショールドに等しいかそれより大きいかど
うかという決定で、第2はCOMとCOMOの和が5のような
あるスレショールドを超えているかどうかという決定で
ある。これら双方の条件が満足されない場合は、ストリ
ップポイント1175に到る。
しかし、これら双方の条件が満足される場合は、デシジ
ョンポイント1180において、トータルターミナルI/Oレ
ートが60のような他のスレショールドと比較され、トー
タルターミナルI/Oレートがスレショールド値より大き
い場合は、デシジョンポイント1185に移る。
デシジョンポイント1185においては、トータルCPU割込
み時間が20のような他のスレショールド値と比較され、
もしトータルCPU割込み時間がスレショールド値より大
きい場合には、デシジョンポイント1190に到る。
デシジョンポイント1190においては、DMF32またはDMZ32
の存在が感知される。それらが存在する場合は、ルール
48がトリガされ、ターミナルI/Oが割込みによりCPUに重
荷をかけているという決定がなされ、ルール48に関する
メッセージテンプリットにより、再構成についての適当
な勧告が与えられる。
もしそうでない場合は、ルール49がトリガされ、異なる
種類の再構成に関する示唆が与えられる。これらについ
ては、付録3のルール49に関するメッセージテンプリッ
トに記載されている。
デシジョンポイント1185において、割込みスタッタ上の
CPUタイムが高すぎなかったことが決定された場合に
は、デシジョンポイント1195に到る。デシジョンポイン
ト1195においては、カーネルモードのCPUタイムが30の
ようなスレショールドに対してテストされる。カーネル
モードのCPUタイムが高すぎない場合は、ストップポイ
ント1198に到り、そうでない場合は、ルール50がトリガ
されて多数のQIOを減少するよう再設計することが勧告
される。勧告の詳細については、ルール50に関するメッ
セージテンプリットに示してある。
デシジョンポイント1180において、ターミナルに対する
I/Oレートが所定のスレショールド値より小さい場合
は、ルール51がトリガされ、付録3のルール51に関する
メッセージテンプリットに示すようにある他のターミナ
ルがCPUリソースを消費していることを示す。
他のルールとして、チャネルルール、リソースルールお
よびクラスタルールがある。チャネルルールは1つで、
ルール52であるが、ルール52はあるCI(通信インタフェ
ース)ポート上の秒あたりのすべてのI/Oが2125000のよ
うなスレショールドより大きいかどうか、単一UBA(ユ
ニバーサルバスアドレス)上の秒あたりのI/Oが1000000
のような他のスレショールドより大きいかどうか、ある
いは単一MBA(マス バス アドレス)上の秒あたりの
すべてのI/Oの和が1700000のような他のスレショールド
より大きいかどうかを決定する。もしそうであれば、ル
ール52がトリガされ、充分な回数ルールがトリガされた
後、ルール52(付録4)に関するメッセージテンプリッ
トがプリントアウトまたはディスプレイされる。
また、本発明実施例においては、ルール53ないし70とし
て以下に説明するいくつかのリソースルールがあり、こ
れらのルールに関するメッセージテンプリットは付録5
に示すとおりである。
ルール53は特定ノードに対して、秒あたりのDECNETアラ
イビングローカルパケットプラス秒当たりのDECNETデパ
ーティングローカルパケットプラス秒あたりのDECNETト
ランジットパケットが100のようなあるスレショールド
値に等しいかそれより大きいかを決定する。もしそうで
あれば、特定のノードにより過大数のパケットが取り扱
われているとうい決定がなされ、ルール53がトリガされ
る。
次のルール、すなわちルール54はプロセス内の任意のイ
メージが、例えば2回のようなある回数以上メッセージ
を転送するためメイルボックス(RSNSMAILBOX)を待っ
ているかどうかを質問する。もしそうであれば、ルール
54がトリガされ、かつ充分な回数トリガが行われた後、
付録5の関連のメッセージテンプリットがプリントアウ
トまたはディスプレイされる。
ルール55は任意のプロセスがノン・ページドダイナミッ
クメモリ(RSNSNPDYNMEN)を待っているかどうかを決定
し、もしそうであれば、ルール55がトリガされる。ま
た、ルール55に関する関連のメッセージテンプリットに
ついては、付録5を参照されたい。
ルール56に関しては、任意のプロセスがページングファ
イルリソース(RSNSPGFILE)を待っているかどうかの決
定がなされ、もしそうであれば、ルール56がトリガされ
る。
ルール57は任意のプロセスがページドダイナミックメモ
リ(RSNSPGDYNMEM)を待っているかどうかの決定がなさ
れ、もしそうであれば、ルール57がトリガされる。
また、ルール58は任意のプロセスがリソース(RSNSLOCK
ID)を待っている場合にトリガされる。このリソースは
ロック識別データベースと呼ばれ、クラスタ内の異なる
VAXコンピュータシステム間の通信用として使用するこ
とができる。プロセスが待機している場合は、ロック識
別データベースは一杯である。付録5のルール58に関す
るメッセージテンプリットには、その状態の説明がなさ
れている。
ルール59に対しては、スワップファイルスペースが一杯
のため、任意のプロセスがそのスワップファイルリソー
ス(RSNSSWPFILE)を待っているかどうかの決定がなさ
れ、もしそうであれば、ルール59がトリガされ、かつ充
分な回数トリガが行われた後、付録5の関連のメッセー
ジテンプリットがプリントアウトまたはディスプレイさ
れる。
ルール60においては、修正ページライターリソースがビ
ジイ(RSNSMPWBUSY)のため、任意のプロセスがそれを
待っているかどうかの決定がなされる。前記修正ページ
ライターリソースは修正されたページを元に戻してディ
スクに書込む。もしそうであれば、ルール60がトリガさ
れ、このルールの充分なトリガリングの後、付録5のメ
ッセージテンプリットがプリントアウトまたはディスプ
レイされ、この状態に関する理由ととるべき行動が示唆
される。
ルール61に関しては、まず、あるプロセスがNSNSSCSリ
ソースを待っているかどうかの決定がなされる。このリ
ソースは通信プロトコルである。もしそうであり、この
状態が1つのイメージに対し例えば2回のようなある回
数以上起こった場合に、ルール61がトリガされる。
ルール62は、任意のプロセスがリソースRSNSCLUSTRANを
待っているときトリガされる。このリソースはクラスタ
がノードの付加または削減のため転換(変移)中である
かどうかを決定する。
ルール63はVMSオペレーティングシステムからのページ
フォールトが毎秒3フォールトのようなあるスレショー
ルド値を超えているかどうかをテストし、もしそうであ
り、かつこのルールが充分な回数トリガされている場合
は、VMSのワーキングセットサイズを変えるよう勧告が
なされる。これらの勧告を含むメッセージテンプリット
は付録5に示すとおりである。
ルール64においては、使用されているSRPs(小リクエス
トパッケージ)の数がパラメータSRPCOUNTプラス5%の
ようなあるパーセンテージと比較され、もしそうであれ
ば、ルール64がトリガされる。
ルール65および66はルール64と同じであるが、IRPs(中
リクエストパッケージ)およびLRPs(大リクエストパッ
ケージ)がそれぞれ、IRPCOUNTプラスあるパーセンテー
ジまたはLRPCOUNTプラスあるパーセンテージと比較され
る。これらのパーセンテージも5%を可とする。
ルール67は使用されているノン・ページドプールバイト
の数がNPAGEDYNプラス5%のようなあるパーセンテージ
を超えているとき、トリガされる。NPAGEDYNは、ノン・
ページドダイナミックメモリにあらかじめ割当てられた
ノン・ページドダイナミックメモリビットの数である。
ルール68はハッシュテーブル用のリソースルールで、使
用されているリソースの数がパラメータRESHASHTBL(ブ
ートタイムにハッシュテーブルにあらかじめ割当てられ
たエントリーの数)プラス5%のようなあるパーセンテ
ージと比較され、もしそうであれば、ルール68がトリガ
される。また、このルールに関するメッセージテンプリ
ットは付録5に示すとおりである。
ルール69は、使用しているロックの数がLOCKIDTBLプラ
ス5%のようなあるパーセンテージを超えている場合に
トリガされる。前記ロックは分配されたリソースを管理
するのに使用され、LOCKIDTBLは可能なロック識別のテ
ーブルである。
ルール70はシステム内のバッチジョブの数に関係する。
特に、ルール70は考慮中のすべてのインターバルに対し
てバッチジョブがCPUの70%のようなあるパーセンテー
ジ以上を使用しているかどうか、また、そこには平均的
にインターバルあたり5のようなある数より少ない相互
作用ジョブがあるかどうかがテストされる。もし、そう
であれば、CPUはほとんどのバッチジョブを実行してい
るものと思われ、ルール70がトリガされる。また、ルー
ル70に関するメッセージテンプットについては、付録5
を参照されたい。
また、本発明の実施例においてはクラスタルールと呼ば
れるあるネットワークルールがある。VAXクラスタに関
するあるメトリックおよびパラメータをテストするクラ
スタルールはルール71ないし77よりなる。これらのクラ
スタルールに関するメッセージテンプリットは付録6に
示すとおりである。
例えば、ルール71は任意のディスク上の平均待ち長さ
が、例えば1.2のようなある数より大きいかどうか、ま
た任意のディスクに対する秒あたりのオペレーションが
該ディスクに対するスレショールドを超えているかどう
かがテストされ、もしそうであれば、ルール71がトリガ
される。このルールに関するメッセージテンプリットに
ついては付録6を参照されたい。
ルール72は、任意のディスクへの待ちの長さが、例え
ば、2のようなスレショールドを超えているかどうか、
また、該ディスクに対する秒あたりのオペレーションが
他のスレショールドより小さいかどうかがテストされ
る。もし、そうであれば、長い待ちに対する原因は使用
のはげしさにあるのでなく、一部のハードウエアの欠陥
または回線争奪に起因するものと考えられ、したがっ
て、ルール72に関するメッセージテンプリットには待ち
の長さの問題に対し異なる解決法が示唆されている。
ルール73はHSCに関するもので、任意のHSCに対する秒あ
たりのI/Oバイトが3750000のようなある数を超えている
かどうか、または任意のHSCに対する秒あたりのオペレ
ーションが500のような他のスレショールドを超えてい
るかどうかの質問がなされ、もしそうであれば、特定の
HSCがオーバースレショールドとなり、ルール73がトリ
ガされる。このルールに関するメッセージテンプリット
は付録6を示すとおりである。
ルール74はなんらかのデッドロック(行詰り)が発見さ
れた場合、トリガされる。デッドロックは、通信期間
中、アプリケーションはロックマネジャーを使用し、そ
れら自体のロッキングアクティビティを間違って操作し
ていることがその原因である。ルール74が充分な回数ト
リガされた場合は、付録6のルール74に関するメッセー
ジテンプリットがプリントアウトまたはディスプレイさ
れる。
ルール75については、3つの質問がなされる。第1は、
そこにデッドロックがなかったどうかということであ
り、第2は、デッドロックの探索数が毎秒0.1のような
スレショールドレートを超えているかどうかということ
である。また、第3はパラメータDEADLOCK_WAITが5の
ような他のスレショールドより小さいかどうかというこ
とである。DEADLOCK_WAITは、デッドロック条件が存在
するかどうかを検出する前にシステムが待機している時
間数である。3つの条件のすべてが満足された場合は、
デッドロック探索は行われたが、そこにはデッドロック
が発見されることはなく、これはパラメータDEADLOCK_W
AITに対するセッティングが低すぎることに起因する。
この場合には、ルール75に関するメッセージテンプリッ
トに示すように、該パラメータDEADLOCK_WAITの値を増
加させるよう提案がなされる。
ルール76は、第3のDEADLOCK_WAITに関して、ルール75
のスレショールドより大きいかどうかをテストするよう
にしたことを除き、ルール75と同じ質問がなされる。も
しそうであれば、ルール76に関するメッセージテンプリ
ットに示すように、問題はアプリケーションにあるので
なく、DEADLOCK_WAITパラメータにある可能性が強い。
最後に残ったクラスタルール、すなわちルール77は、フ
ァイルキャッシミスに起因するディスクI/Oの数がある
スレショールドを超えているかどうかを決定する。もし
そうであれば、そこにはシステムファイルキャッシ上の
低いヒットレイショに起因する多くのI/Oがありすぎる
という決定がなされる。このルールが充分な回数トリガ
された場合は、付録6のルール77に関するメッセージテ
ンプリットがプリントアウトまたはディスプレイされ
る。このメッセージには、ファイルキャッシ統計を調査
し、あるいはさらに大きいファイルキャッシを得るよう
な提案が含まれる。
ルール1ないし77の多くは共通の特性を含む。第1に、
ルールのトリガリングはスレショールド、メトリックお
よびパラメータ間の関係の決定を含むことであり、第2
に、ルールが充分な回数だけトリガされない場合は、そ
のルールに関するメッセージテンプリットはプリントア
ウトされないということである。これは、あるルールが
人為的にトリガされた場合、システムは問題のあること
を報知しないため、誤り警報を回避させることができ
る。最後に、スレショールドは種々の異なるネットワー
ク、プロセッサおよびオペレーティングシステムにフィ
ットするよう適応させる必要があるということである。
(D)レポート作成 本発明により生成されるレポートには2つの基本形式が
ある。その1つは“チューニング解析”または性能評価
レポートで、これはルールに関するメッセージテンプリ
ットのほかルールのトリガリング中に評価されたエビデ
ンス(根據)を含む。生成される第2の形式のレポート
はシステムまたはネットワークのワークロード特性で、
これはデータ収集プロセス中に収集されるデータおよび
該データの編成により可能である。
あるルールに関するチューニング解析または性能評価レ
ポートは、そのルールがトリガされた回数がそのルール
に関する所定のスレショールドを超えている場合に生成
される。前記レポートはそのルールのほか、ルールのト
リガリング中に調査されたいくつかのメトリック、パラ
メータおよびスレショールドを含む。
第12図はルールトリガリングおよび該ルールのための根
據(エビデンス)を記録する方法の一例を示す。本発明
実施例によるときは、第12図に示すように、各パーフォ
ーマンスプロブレムルール(性能問題ルール)をエビデ
ンステーブルに関連づけている。各エビデンステーブル
はそのルート(根)としてトリガリング数のカウントを
有し、ブランチは各々異なるデータ形式を表わす種々の
階層レベルの複数のノードに導く分岐を形成する。メッ
セージテンプリットは前記レベルに対応し、各レベルに
おけるデータの形式のほか解析レポートにおけるその表
現形式を記載する。転送データ、すなわちあるルールが
トリガされたとき記録されるべきデータは、第12図に示
すようにエビデンステーブルに記憶される。
第12図はツリー構造(木構造)としてエビデンステーブ
ルを示しているが、本発明方法を実行するプロセッサ内
で他の方法によりデータ記憶構造を実現できること当然
である。
本発明方法の一実施例によるときは、ルールがトリガさ
れる各時間ごとにそのルールに関連するエビデンステー
ブルのルート(レベル1)内のカウンタを1カウントだ
け増加させるようにしている。エビデンステーブルに転
送データを記憶させるに当たっては、各組のデータの最
初のデータを2番目に高いレベル(レベル2)に対応さ
せ、そのデータを同じレベルの他の値と比較し、マッチ
(突合せ)があった場合は、データのその値が発生した
回数を示すカウンタを増加させる。もし、そうでなけれ
ば、カウンタが1にセットされ、ルートに戻ってブラン
チした2番目に高いレベルに新しいエントリーが記憶さ
れる。
2番目に高いレベルでマッチがあった場合には、3番目
に高いレベル(レベル3)において、関連のデータが2
番目に高いレベルにおいてマッチしたエントリーに接続
した該レベルにおけるエントリーと比較され、マッチが
発見された場合は、関連のカウンタを増加させる。もし
そうでなければ、上記のマッチしたレベルに戻ってブラ
ンチし新しいツリーエントリーが生成される。
このプロシージアはすべての転送データがすべてのレベ
ルに記憶されるまで継続する。転送データをこのような
方法で記憶させることはメモリスペースの存在に有効で
ある。
第1のレベルまたは後続するレベルのいずれかにおい
て、新しいエントリーが生成される場合は、低次のレベ
ルには接続されるエントリーがないため、低次のレベル
は探索されない。その代わり、カウンタが1にセットさ
れるすべての低次レベルにおいてエントリーが生成され
る。
本発明実施例によるデータ記憶の詳細については第13A
図ないし第13D図に示すとおりである。これらの図は第1
2図示転送データに対するエビデンステーブルの生成ス
テップを示す。
ルールの最初のトリガリングに対して、データエントリ
ーは第12図に示すようにA1,B1およびC1である。第13A図
に示すように、ツリーのルート(根)におけるカウンタ
は1にセットされ、A1は2番目に高いレベルに記憶さ
れ、B1は3番目に高いレベルに記憶され、またC1は4番
目に高いレベルに記憶される。そこにはマッチがあり得
ないため、データはこのようにして記憶される。
ルールトリガリングにより次のデータエントリーが生じ
た際は、ルートにあるカウンタは再び増加される。かく
して、A1に対する第2のレベルに沿っての探索が起こ
り、マッチが発見されるので、関連のカウンタは第13B
図に示すように2に増加する。次に、A1に関連するB1エ
ントリーが起こり、このようなエントリーが発見される
ので、そのカウンタも2に増加する。しかし、A1および
B1に関連するC1に対する次の探索は起こらないので、C2
に対する新しいエントリーが1のカウントで生ずる。
4番目のルールトリガリングによりデータエントリーが
起こった場合は、ルート(根)におけるカウントは第13
C図に示すように4に増加する。A1に対しては第2のレ
ベルでマッチが発見されるので、カウンタは4に増加す
るが、A1に接続されたB2エントリーに対してはマッチが
発見されない。したがって、B2に対する第3レベルにお
ける新しいエントリーが1のカウントで生ずる。第3の
レベル上でのC2に対する探索が行われる場合には、B2に
関係するマッチが発見されないので、C2に対するエント
リーが1のカウントで生ずる。これは、C2に対する前の
エントリーがあった場合でも、前のC2エントリーはA1/B
1通路に対応し、この第3のC2エントリーはA1/B2通路に
対応するためである。
第13D図は第12図に示す転送データに対する全体のエン
ビデンステーブルを示す。
1つのルールに関するエビデンスをこのようにして記憶
させる場合は二重エントリーの数が減るので、メモリス
ペースの節約をもたらす。さらに、ツリー構造はレポー
ト作成のためのアクセスを容易にする。
ひとたび、メトリックおよびパラメータの解析が完了す
ると、ルールカウントはそのルールに関するスレショー
ルドに対して比較される。ルールカウントが該スレショ
ールドを超えている場合は、このルールに関するメッセ
ージテンプリットがプリントアウトされ、対応するエビ
デンステーブルに記憶されたエビデンスがプリントアウ
トされる。所定のルールに関するエビデンステンプリッ
トは、テーブルに記憶されている階層的順序でのすべて
のデータを含む行のテキストにより記述することが望ま
しい。例えば、ルールの各トリガリングに対しては1行
のテキストがあり、テキストの各行にはエビデンステー
ブルから検索され、テキストのその行に導入された各レ
ベルにおけるデータの1つの値があるようにすることが
望ましい。
本発明実施例によるときは、ツリーは順次的に横断する
形をとり、各横断に際し各レベルにおける各データ値の
カウンタが減少され、その値が検索される。その値は、
最低レベルのカウンタが0に減数されるまで同じ値を保
持し、その時には次の高位のノードの次のブランチがと
られる。第14図および第15図はメッセージテンプリット
および関連のエビデンスに関するプリントアウトまたは
ディスプレイの2つの例を示すものである。
また、エビデンスおよびメッセージの出力のほかに、種
々のプロセッサに関する性能レポートおよび全体として
のネットワークに関する性能レポートを出力することも
できる。性能レポートは、メッセージテンプリット内の
勧告にもとづいて行われる変化が改良されたシステム性
能を有するか否かを決定するに際し、システムエンジニ
アまたはシステムマネジャーを助けるようなワークロー
ド特性のディスプレイを与える。このようなレポートは
摘要表およびヒストグラムの双方を含む。第16図ないし
第18図はこれらの例を示す。
性能レポートは収集されたデータおよび解析用にデータ
ベース内に記憶されたデータを用いて生成される。これ
らのデータはプロセッサメトリックおよびパラメータと
ネットワークメトリックの双方をふくむ。表またはヒス
トグラムのプリンティングは既知のディスプレイプログ
ラミング技術を用いて実現可能であるが、性能レポート
内にこのようなデータを提供することは本発明の重要な
1つの部分である。
一般に、性能レポートは統計特性プロセッサおよびネッ
トワークロードのほか、アクティブイメージによるリソ
ースの使用を与える。例えば、性能レポートを再調査す
るシステムマネジャーは、各イメージに対して、平均の
ワーキングセットサイズ、ページフォールトの総数、消
費時間、CPUタイムのパーセンテージ、ディスクI/Oおよ
びターミナルI/Oを調査することができる。
第16図は、例えば1つのノードで実行される相互作用イ
メージに関するレポートの一例を示す。このレポートか
ら、システムマネジャーは、例えば、リソースの使用と
使用頻度の双方を考慮して、どのイメージが有効なチュ
ーニングをするかを決定することができる。
また、あらゆる形式のプロセッサの特性を示すような他
のレポートを実現することも可能である。
第17図はネットワークデータ、特に、すべてのノードに
よる特定ディスクへのアクセスに関する性能レポートを
示す。本発明方法は、一般のシステムと違って、全ネッ
トワークに関するデータの収集を許容するので、このレ
ポート形式のみが可能である。本発明においては、同期
およびデータの構成を含むこの種データ収集の難しさを
全ネットワーク的解析だけでなく全ネットワーク的パー
フォーマンスデータの提供を可能にすることにより解決
するようにしている。
第18図はデータ収集操作により使用可能となるデータか
ら生成しうるヒストグラムを示す。ヒストグラムはオペ
レータの評価および解析に対するワークロード特性の図
式表示を与え、また各ノードに対するCPU、ディスクお
よびターミナルI/Oを与える。
ヒストグラム内のデータは、特定時間間隔の間にシステ
ムがどのように使用されているかを示す。異なるレポー
ティング周期はヒストグラムのスケールを変えるほかそ
れらのタイムレゾリューション(time resolution)を
変える。このようなヒストグラムは、システムマネジャ
ーまたはシステムエンジニアが解析のセクションで提供
された結論と実施された勧告をダブルチェックする場合
の助けとなる。
例えば、あるイメージに関するレジデンスタイム(すな
わち、イメージの始動と終わりまでの時間)を解析する
ことにより、システムエンジニアは、例えば更新された
データベースまたは組立てられたアプリケーションのよ
うな大量なリソースを費消するイメージを追跡すること
が可能となる。
第18図はヒストグラムの有用さを示す例を与えるもので
ある。図において、縦軸はプロセッサにより使用される
CPUタイムのパーセンテージを表し、また、横軸はヒス
トグラムによりもたらされる時間数、この場合は24を表
す。このヒストグラムは、例えば、正午12.00時には割
込みおよびDECnetジョブがCPUタイムの5%を使い、相
互作用ジョブがCPUタイムの85%を使用することを示し
ている。
(E)結論 本発明実施例の場合は、VMSオペレーティングシステム
を用いたVAXコンピュータを含む特定のVAXクラスタ(VA
Xcluster)配置を使用しているが、本発明方法は他のプ
ロセッサまたはプロセッサネットワークに対しても広い
適用の可能性を有すること勿論である。この場合には、
特に、メトリックおよびパラメータの特定名称を各プロ
セッサまたはネットワークに適応させるようにする必要
があり、また、あるルール自体を変える必要がある場合
は、そのルールに対するスレショールドを変えることが
必要となる。
本発明は本明細書記載の実施例に限定されるものでな
く、本発明は他の変形をも包含するものである。
付録(アペンディクス)1 メモリルール ルール番号 メッセージテンプリット 1.そこには、次のプロセスよりの過度のページフォール
ト(ページ不在)がある。これはアプリケーションプロ
グラムがまずく設計されている場合、あるいはAI型プロ
グラムまたはCADプログラム等のような特殊な形式のプ
ログラムの場合に起こる可能性がある。プログラムを再
設計することができる場合はそうすることが望ましい。
もし、そのWSQUOTAを増加させることが可能なら、それ
は救済策となる。問題を起こしているユーザーと発生回
数を以下に記入すること。
2.そこには、過度のページフォールトの原因となる過度
のイメージアクティベーションがある。これは過度のプ
ログラムをアクティベートするまずく書かれたコマンド
手順により生ずる可能性がある。過度のイメージアクテ
ィベーションを起こしたユーザーを以下に記入するこ
と。
3.そこには、全体としてシステム内の過度のイメージア
クティベーションに関連する過度のページフォールトが
ある。これは多くのアプリケーションプログラムを下手
に設計した場合または過度のコマンド手順を頻繁にラン
させようとした場合に起こる可能性がある。
4.過度のハードフォールティングはページキャッシの小
さすぎることが原因で生ずる。ハードフォールトはソフ
トフォールトより高価で、ページキャッシが小さすぎる
場合に起こり易い。
MPW_LOLIMIT,MPW_HILIMIT,MPW_THRESH,FREEGOALおよびF
REELIMの値を増やすことによりページキャッシを増加さ
せることができる。FREELIMはBALSETCNT+20にほぼ等し
く、GROWLIMはFREEGOAL−1にほぼ等しくなければなら
ない。FREEGOALは3*FREELIMまたはメモリの2%の大き
い方にほぼ等しくなければならず、またMPW_LOLIMITは1
20または3*BALSETCNTの小さい方に等しくなければなら
ない。関連のAWSAパラメータの自動調整を行わせるため
AUTOGENを使用することが望ましい。
5.ページフォールティングの高いレートはプロセスのワ
ーキングセットにさらにメモリを割当てることができる
場合は低くなる可能性がある。ページキャッシが小さい
場合は、過度のページがプロセスのワーキングセットの
部分となりうるので、ページフォールティングを減少さ
せることができる。
MPW_LOLIMIT,MPW_HILIMIT,MPW_THRESH,FREEGOALおよびF
REELIMの値を減らすことによりページキャッシを減少さ
せることができる。FREELIMはBALSETCNT+20にほぼ等し
く、GROWLIMはFREEGOAL−1にほぼ等しくなければなら
ない。また、FREEGOALは3*FREELIMまたはメモリの2%
の大きい方にほぼ等しく、MPW_LOLIMITは120または3*BA
LSETCNTの小さい方にほぼ等しくなければならない。関
連のAWSAパラメータの自動調整を行わせるためAUTOGEN
を使用することが望ましい。
6.全システム的なページフォールト(ハードまたはソフ
トページフォールト)は高く、いくつかの(適度に遊ん
でいる)プロセスは大きいワーキングセットを保持して
いる。スワッパーが遊んでいるプロセスのワーキングセ
ットからさらに多くのページを取戻すことができれば、
全体のページフォールトレートは低下する。
次のユーザーに対するWSQUOTAを減らすことが望まし
い。分離したプロセスがその問題の原因である場合に
は、PQL_DWSQUOTAを減らすことが望ましい。
7.過度のページフォールティングが起こっており、そこ
には、許容されたそれらのWSEXTENTsより多いメモリを
所望すると思われるイメージを実行中のあるユーザーが
ある。これらのユーザーに対するWSEXTENTsが大きい場
合は、ページフォールティングは少なくなる。
次のユーザーに対するWSEXTENTsを増やすことが望まし
い。分離したプロセスがその問題の原因である場合は、
PQL_DWSEXTENTを増やすことが望ましい。
8.そこには、充分なフリーメモリがあるにもかかわらず
過度のページフォールティングがある。スワッパーはイ
ン・スワップの準備のため、不必要にワーキングセット
をトリミングする。BALSETCNTが充分高い場合は、プロ
セスは不必要にスワップアウトされず、したがってこの
条件は除去される。
BALSETCNTを増やすことが望ましい。これは充分なメモ
リがあるとき、スワッパーがプロセスをトリミングする
ことを防止し、また、ページフォールトレートをも減少
させる。
9.フリーメモリがほとんど使いつくされたとき、過度の
ページフォールティングが生じた。AWSAは、フリーリス
トがBORROWLIMより大きいとき、それを必要とするプロ
セスに使用可能なメモリを割当てようとするが、プロセ
スは、GROWLIMがBORROWLIMおよびFREELIMの双方より大
きい場合、これらのローンを利用できない。VMSが、ペ
ージフォールティング中のプロセスにメモリを供給する
ことができれば、全体のページフォールトレートは減ら
すことができる。
GROWLIMをBORROWLIM以下に減らすことが望ましい。これ
によりプロセスはAWSAにより与えられるローンを使用す
ることができる。また、AUTOGENを使用して、これらの
パラメータに対し適当な値を得ることができる。
これらのパラメータおよび関連する他のパラメータの現
在値は次のとおりである。
PFRATH:%%%%,BORROWLIM:%%%%%,GROWLIM:%%
%%%,PAGECACHE:%%%%%%,FREELIM:%%%%%,F
REEGOAL:%%%%%,WSMAX:%%%%%% 10.過度のページフォールティングが生じており、VMSは
ユーザーワーキングセットに付加的メモリを割当てるこ
とができない。VMSにおける自動ワーキングセット調整
(AWSA)特性を用いて、ユーザーのワーキングセットへ
のメモリの割当てを変更することができる。また、WSIN
Cを増加させることにより、VMSは使用可能メモリを適正
に割当てることができ、ページフォールトレートを減ら
すことができる。
WSINCを150にセットし、ディフォールトSYSGENをセッテ
ィングする。WSINCは0である(AWSAがターンオフされ
ることを意味する)ため、プロセスのワーキングセット
は成長できない。
11.スワッピング(SWAPPING)ファイルのサイズを増や
すこと。プロセスは成長することができず、性能の劣化
をきたすおそれがある。スワッピングファイルを増やす
ことにより、プロセスは成長が助長され、利用可能なメ
モリを使用することができるようになる。
12.そこには余分なフリーメモリがあるにもかかわらず
過度のページフォールティングが生じている。ページフ
ォールティングはプロセスのワーキングセットがより早
く成長できる場合は低くなる。AWSAはプロセスのワーキ
ングセットの成長を許容するための応答が遅いらしい。
PFRATHに対する値を減らすことが望ましい。PFRATHの現
在値はPFRATH:## 13.使用可能なフリーメモリがあるにもかかわらず、過
度のページフォールティングが存在する。プロセスのワ
ーキングセットに付加的メモリを与えることについての
AWSAのレスポンスが遅いらしい。ページフォールトレー
トは、AWSAのレスポンスを改善し、ワーキングセットの
さらに早い成長を許容することにより、これを減らすこ
とができる。
WSINCを150にセットし、ディフォールトSYSGENをセッテ
ィングする。
14. 使用可能なフリーメモリがあるにもかかわらず、
過度のページフォールティングが存在する。プロセスの
ワーキングセットに付加的メモリを与えることについて
のAWSAのレスポンスが遅いものと思われる。ページフォ
ールトは、AWSAのレスポンスを改善し、ワーキングセッ
トのさらに早い成長を許容することにより、これを減ら
すことができる。
AWSTIMEを20に減らすか、AUTOGENをしてAWSTIMをリセッ
トさせることが望ましい。AWSTIMは連続するワーキング
セット調整間のCPUタイムの総計である。
15.フリーメモリは存在せず、かつ過度のページフォー
ルティングが生じた。遊んでいるプロセスは最も重いペ
ージフォールティングを有するプロセスより大きいワー
キングセットを有する。自動ワーキングセットデクレメ
ンティングは、ページフォールティングの最も多いプロ
セスの使用に供するため、VMSによりワーキングセット
から遊休ページを取戻すことを許容し、ページフォール
トレートを減少させることを可能にする。
WSDECを35に減らし、PFRATHを10に減らすことにより自
動ワーキングセットデクレメンティングをターンオンさ
せることが望ましい。
16.スケアスメモリ状態において過度のページフォール
ティングが生じている。スワッパーはしばしばワーキン
グセットをトリミングすることを強制され、フォールテ
ィングや付加的オーバーヘッドを生ずる。以下はいくつ
かの手段であるが、メモリへの過度のロードにより変更
にあたり注意を要する。
SWPOUTPGCNTをシステムの標準的プロセスがそのワーキ
ングセットサイズとして使用するのに充分な大きさの値
まで増加させることが望ましい。これは第2のレベルの
スワッパートリミングを不能にし、恐らく有利と思われ
るスワッピングをも不能にする。スワッパーは、メモリ
を取り戻すための候補としては作動中のプロセスよりも
遊休プロセスの方が良いと考えると思われ、したがっ
て、恐らく、さらに有利なレベルのオーバーヘッドが与
えられる。
LONGWAITに対する理想の値は、遊休プロセスまたは放棄
されたプロセスを一時的に作動するプロセスから正しく
識別する時間の長さで、標準的にはこの値は3ないし20
秒の範囲にある。LONGWAITを増加させて、プロセスがス
ワッピングまたはトリミングのための適格者となる前に
遊休のままでいられるようスワッパからさらに長い時間
をプロセスに与えるようにする。
17.過度の自動ワーキングセットデクレメンティングに
よる過度のページングが存在する。プロセスのワーキン
グセットが過大または過度に減少した場合は、ページフ
ォールティングに突然の増加が生ずる。ワーキングセッ
トから取り去られたページの数が小さいか、またはPFRA
TLの値が低下した場合は、ページフォールトレートも低
下する。
WSDECを減らし、もしくはPFRATLを減らすことが望まし
い。
18.強いメモリ要求による過度のページフォールティン
グが存在する。性能が受入れ難いものである場合は、メ
モリ要求を低下させるようこころみることができる。メ
モリは付加することが最良の賭かもしれないが、これは
しばしば起こる状態であることを確認し、かつ、補助的
意見を聞く必要がある。
19.スワッピングに起因する過度のオーバーヘッドが存
在する。そこにはフリーバランスセットスロットがない
ので、BALSETCNTがなんらかの問題を起こしている。
20.スワッピングに起因する過度のオーバーヘッドが生
じた。スワッピングは、ユーザーにもっと多くのメモリ
を与えるページキャッシのサイズを減らすことにより減
少させることができる。
MPW_LOLIMIT,MPW_HILIMIT,MPW_THRESH,FREEGOALおよびF
REELIMの値を減らすことにより、ページキャッシを減少
させることができる。FREELIMはBALSETCNT+20にほぼ等
しくなければならず、またGROWLIMはFREEGOAL−1にほ
ぼ等しくなければならない。FREEGOALは3*FREELIMまた
はメモリの2%の大きい方にほぼ等しくなければなら
ず、また、MPW LOLIMITは120または3*BALSETCNTの小さ
い方にほぼ等しくなければならない。関係するAWSAパラ
メータの自動調整を行わせるため、AUTOGENを使用する
ことが望ましい。
21.スワッピングに起因する過度のオーバーヘッドが生
じた。スワッピングは、過度のメモリを費消するプロセ
スを抑制または制御することにより、これを減少させる
ことができる。次のユーザーおよびイメージは多くのメ
モリを使いすぎている。以下のような予防調整を行うよ
う努めることが望ましい。1)一日のノンピーク時まで
プロセスを休止する。2)ノンピーク時間中にプロセス
の再スケジュールを行う。3)そのユーザーのWSQUOTA
を制限する。
22.スワッピングに起因する過度のオーバーヘッドが起
こった。大きい遊休プロセスはスワップアウトできない
ため、アクティブプロセスのスワッピングはさらに重い
ものとなる。この状態はコマンドSET PROCESS/NOSWAPを
使用したとき起こりうる。
23.スワッピングに起因する過度のオーバーヘッドが生
じた。借り(borrowing)があまり多すぎる場合は、AWS
Aはスワッピングをさらに重くする可能性がある。GROWL
IMがFREEGOAL−1に等しくBORROWLIMがGROWLIMより高い
ことを確認すること。
借りが多すぎる。BORROWLIMおよびGROWLIMを増やすこと
が望ましい。
24.スワッピングに起因する過度のオーバーヘッドが存
在する。使用可能なメモリを獲得するため争っている同
時進行プロセスが多すぎる。MAXPROCESSCNT(したがっ
てBALSETCNT)を低下させるか、要求を減らすか、メモ
リを付加すること。ただし、メモリを付加する前に、性
能が受入れ難いものであることを確認し、かつエキスパ
ートよりの意見を聴取すること。
25.スワッピングに起因する過度のオーバーヘッドが生
じた、多くのCOMおよびCOMOがメモリ獲得のため競争中
である。同時進行の大きいバッチジョブの数を減らし、
要求が少なくなった時のためにそれらを再スケジュール
し、またはバッチ待ちのJOBLIMを減らすことを考えよ。
メモリを付加することは救済策となるが、まず再確認
し、補助的意見を聞くことが必要である。
26.スワッピングに起因する過度のオーバーヘッドが生
じた。多くのプロセスは計算可能であり、かつ基準優先
順位にあるため、スワップの間の時間数を増やすことに
よりスワッピングレートを減少させることができる。
27.スワッピングに起因する過度のオーバーヘッドが生
じた。性能がしばしば受入れ難い状態の場合には、メモ
リの付加に関する必要性を評価するエキスパートを必要
とする。
要求を減らすか、メモリを付加することが望ましい。ワ
ーキングセットの減少も救済策となる。
28.システムはページングよりむしろスワップしてい
る。条件を緩和するため次のステップをとることができ
る。
1.WSQUOTASを減らす 2.PFRATHを増やす 3.WSINCを減らす 29.スワッピングに起因する過度のオーバーヘッドが生
じた。そこにはメモリに対する強い要求があり、しかも
遊んでいるメモリが利用可能であるが、パラメータSWPO
UTPGCNTによりユーザーのワーキングセットに割当てら
れている。これは、VMSが遊休メモリを取戻そうとする
とき、ユーザーのワーキングセット内に残すページの数
である。SWPOUTPGCNTを60に減らすことが望ましい。こ
れは、メモリを必要とするとき、VMSが遊休中のユーザ
ーのワーキングセットから付加的メモリを取戻すことを
可能にする。
30.スワッピングに起因する過度のオーバーヘッドが生
じた。多くのプロセスが計算不能で、遊休プロセスに過
大なメモリが浪費されているものと思われる。
可能な救済法は次のとおりである。
1.WSQUOTASを減らす 2.PFRATHを増やす 3.できればWSINCを減らす 4.“SET PROC/NOSWAP"を有するプロセスをチェックす
る。
31.メモリが欠乏状態(スケアス)であり、現在は性能
の問題は生じていないが、メモリに対する要求が増大し
た場合は、メモリ隘路(ボトルネック)が起こる可能性
がある。その場合には、メモリの5%以上を使っている
ユーザーのWSQUOTAsを減らしてメモリを再割当すること
が望ましい。
32.メモリが欠乏状態(スケアス)であり、メモリ隘路
は生じていないが、容量プランに要求の伸びを予定して
いる場合は、メモリ隘路を生ずる可能性があり、その準
備が必要である。
付録2: CPUルール ルール番号 メッセージテンプリット 33.COMOプロセスの数が多いことによりCPUに明らかなボ
トルネック(隘路)がある。そこには、低い優先順位の
COMもしくはCOMOプロセスにCPUを待たせるような高い優
先順位のプロセスが存在し、それが問題の原因となって
いる。これはロックアウト状態と考えられる。プロセス
優先順位を調査もしくは再調査することが望ましい。CO
MプロセスへのCPUタイムの公正な分配に関し、それらが
すべて基準優先順位を有することを確認することが必要
である。
34.COMOプロセスの数が多いことによりCPUにはボトルネ
ックがある。そこには、また、CPUタイムの少なくとも5
0%を費消するホッグプロセスも存在する。間違った設
計、誤って管理された優先順位または他のありうる理由
についてホッグプロセスを調査することが望ましい。
35.CPUを待っている多数のプロセスがあり、また、割込
みスタックに関するCPUタイムも高い。割込みスタック
タイムはプロセスにより使用されることのできないCPU
タイムである。
以下の4つの行動をとるよう勧告する。
1.ターミナルI/OをDMF32またはDMZ32によりハンドリン
グしない場合:アプリケーションプログラムが一時に20
0またはそれ以上のキャラクタを書く場合はDMx32のDMA
特性が有用である。アプリケーションが一時に10または
それ以上のキャラクタを書くときは、DMx32のソロの転
送がさらに有効である。また、アプリケーションが一時
に10より少ないキャラクタを書くときは、DZ11を上廻る
ようなDMx32の顕著な性能改善はない。
2.DZ11またはDZ32インタフェースを使用している場合
は、DZ11またはDZ32が他のキャラクタに対して割込みを
行う度数を少なくするため、そのボー(baud)レートを
減少させるよう考慮することが必要である。
3.MAXBUFまでのできるだけ多数のキャラクタを書く大き
な書込み操作にQIOsを集めるようなアプリケーションを
設計すること。
4.全スクリーンをリライトするアプリケーションを設計
するよりむしろスクリーンの影響のある部分を更新する
ビデオ端末用アプリケーションを設計すること。
36.カーネルモードタイムがスレショールド値を超えて
いる。あるシステムサービスの過度の使用が高いカーネ
ルモードを生じていると思われる。この問題を緩和する
ため、次の1つまたはそれ以上を実行することが望まし
い。
1.同時に実行されるコンピュートバウンド(compute-bo
und)プロセスが少なくなるようワークロードを計画す
ること。
2.より少ないシステムサービスを使用して同じ作業を行
う改良アルゴリズムによりあるアプリケーションを再設
計できるかどうかを調べること。
上記のステップで問題が解決されない場合は、 1.ワークロードが独立のジョブおよびデータ構造により
形成されている場合は、複数のCPU(クラスタ)が問題
を解決する可能性がある。
2.各ピースの完成が前のピースの完成に従属するような
ワークロードを有する場合は、さらに高速のCPUを得る
ようにする。
3.メモリ制限のある場合は、メモリをさらに付加する。
37.カーネルモードタイムが高すぎる:QUANTUMを増やす
ことが望ましい。
QUANTUMを少なくとも20msに増やす。QUANTUMに対する現
在値は##である。QUANTUMを増やした時は、タイムベ
ースドコンテキストスイッチングの速度は減少し、した
がって、CPUスケジューリングおよび関連のメモリ管理
をサポートするのに使用するCPUのパーセンテージも減
る。このオーバーヘッドが少なくなれば、性能は改善さ
れる。
38.EXECモードタイムがスレショールドを超えている。I
Oまたはデータベース管理システムが誤って使われてい
る可能性がある。RMSまたはRDBのようなIOシステムを使
用して、アプリケーションにまずい設計やアンバランス
なパラメータがないかを調査することが望ましい。
39.CPUを待っている多数のプロセスがあるため、そこに
はCPUボトルネックがある。メモリの問題またはIOの問
題が同時に存在する場合は、それらの問題を最初に解決
しようとこころみることが必要である。それでもなお、
性能が受入れ難く、かつ問題が残っている場合は、CPU
要求を減らすか、CPUパワーを増加させるようにする。
問題を軽減させるため、次のうち1つまたはそれ以上を
実行することが望ましい。
1.同時に実行されるコンピュートバウンド(compute-bo
und)プロセスが少なくなるようワークロードを計画す
ること。
2.より少ない処理で同じ作業を行う改良形アルゴリズム
によりあるアプリケーションを再設計できるかどうかを
調べる。
3.ターミナルIOに対する同時要求を制御すること、上記
のステップで問題が解決しない場合には、ワークロード
が独立のジョブおよびデータ構造により形成されている
場合は、複数のCPU(クラスタ)により問題は解決する
であろうし、各ピースの完成が前のピースの完成に従属
するようなワークロードの場合は、より高速のCPUを要
するものと思われる。これに関しては、新しいCPUを購
入する前に再確認のうえ、補助的意見を聞くことが肝要
である。
付録3: I/Oルール ルール番号 メッセージテンプリット 40.ファイルシステムオーバーヘッドを減らすよう再構
成することが望ましく、そこにはファイル制御根源語の
使いすぎがある。
41.ファイルの開閉を最小にし、適当なファイル割当て
を使用することが望ましい。また、どのユーザーがファ
イルの使い方の激しいユーザーかを決定するため、コマ
ンドSSHO DEV/FILESを使用することが望ましい。
42.ファイルシステムキャッシを増やすことが望まし
い。
43.高いEXECモードタイムに関する過度のIO要求があ
る。RMSおよびRDBのようなIOランタイムシステムがボト
ルネックかもしれない。もし可能ならば、IOシステムフ
ァイルキャッシングまたはファイルデザインを改良する
ようにし、そうでないときはIO要求を減らすかIO容量を
増やすよう再構成することが望ましい。
44.明示しすぎたQIOsに関してユーザープログラムをチ
ェックし、もし可能であれば、ファイルキャッシングを
良好に使用させるようこれらのアプリケーションを再設
計するよう努める。これは、明白なQIOsの代わりにRMS
を使用することにより可能である。
45.ページングが特定のディスクに過度のロードを生じ
ている。これはメモリに関係する問題であるが、現存の
ディスクに他のページングファイルを付加することによ
り、その状態を改善することができる。もし、個別のデ
ィスクにすでに複数のページングファイルを有する場合
は、構成内の使われ方の少ないディスクもしくはより高
速のディスクにページングファイルを移すことができ
る。
VAX11/780は2つのページングファイルを有効に使用す
ることができ、VAX8600は3つを使用することができ
る。主ページファイルは特に共用システムディスク上で
小さく保持されなければならず、補助ページファイルは
個別ディスク上に配置することが望ましい。1つのスワ
ップファイルのみを使用すること、ただし、共用システ
ムディスクのいずれかに配置しないようにすること。
46.スワッピングが特定のディスク上に過度のロードを
生じている。これはメモリに関係する問題であるが、ス
ワッピングファイルが共用システムディスク上にある場
合は、それを他のシステムがページングまたはスワッピ
ング中でないディスクに移すことにより、その状態を改
善することができる。
47.IO待ちの要求は低いオペレーションカウントを有す
るディスクに関し形成される。ウインドウターンレート
は特定のディスクにフラグメンテーションの問題がある
かもしれないことを示す。
ディスクを規則的にリフレッシュし、ディスク上のスペ
ースのなるべく40%を空けるようにすることが望まし
い。これは、フラグメンテーションの発生を早め、探索
時間を減少させて、良好なIOパーフォーマンスをもたら
す。
48.ターミナルIOがハードウエア割込みによりCPUに荷を
負わせている。要求を減らすか、CPU容量を付加するこ
とが望ましい。
49.ターミナルIOがハードウエア割込みによりCPUに荷を
負わせている。これは、DZ11を、例えばDMF32またはDMZ
32のようなバースト出力可能な装置と置き換えることに
より改善することができる。DMA特性はソフトウエア要
求を減らすことにより、さらに有効な通信設備の使用を
可能にする。
50.ターミナルIOに対するユーザーの明示的なQIOsの使
用がCPUに荷を負わせている。可能ならば、多数のQIOs
を、さらに多くのキャラクタを一時に転送する少数のQI
Osにグループ化するようアプリケーションを再設計する
ことが望ましい。第2の方法はワークロードを調整し
て、要求をバランスさせることである。これらがいずれ
を可能でない場合は、要求を減らすか、CPUの容量を増
やす必要がある。
51.通信装置、ラインプリンタ、グラフィック装置、ノ
ン・デジタル装置または機器、あるいはターミナルを競
争している装置のような他の装置がCPUリソースを消費
している可能性がある。
付録4: チャネルルール ルール番号 メッセージテンプリット 52.チャネルがスレショールド値を超えている。特定のI
Oチャネル上に過度のIOレートがある。チャネル上のオ
ーバーロードによるボトルネックに注意を要する。
付録5: リソースルール ルール番号 メッセージテンプリット 53.そこには、このノードにより取扱われる過大数のDec
netパケットがある。毎秒100パケット以上ある場合には
CPUパワーの30%以上が消費されたものと評価する。
54.メールボックス(Mailbox)が一杯のため次のイメー
ジが待機中である。
55.ノン・ページドダイナミックメモリが一杯のため、
次のイメージが待機中である。
56.ページファイルが一杯のため、次のイメージが待機
中である。もし、(平均プログラムサイズ)*(MAXPROCE
SSCNT)=1/2*(ページングファイルサイズ)の場合
は、ページファイルのサイズを2*(平均プログラムサイ
ズ)*(MAXPROCESSCNT)に増加させることが望ましい。
57.ページドダイナミックメモリが一杯のため次のイメ
ージが待機中である。
58.ロック識別データベースが一杯のため、次のイメー
ジが待機中である。
59.スワップファイルスペースが一杯のため次のイメー
ジが待機中である。もし、(実行中プロセスの平均ワー
キングセットクオータ)*(MAXPROCESSCNT)が3/4*(ス
ワッピングファイルサイズ)に等しいかそれより大きい
場合は、スワッピングファイルのサイズを4/3*(平均WS
QUOTA)*(MAXPROCESSCNT)に増やすことが望ましい。
60.修正ページライター(Modified page writer)が忙
しいか、いなかったため、次のイメージが待機中であ
る。修正ページリストがSYSBOOTパラメータMPW_WAITLIM
ITより多いページを含む場合は、そのワーキングセット
から修正ページをフォールトアウト(fault out)する
プロセスはこの待ちのなかに置かれる。
標準的には、この待ち状態の理由は次のとおりである。
1.MPW_WAITLIMITがMPW_HILIMITに等しくない。
2.コンピュートバウンドリアルタイムジョブがスワッパ
プロセスをブロックしている。
上記のいずれもが問題を起こしていない場合には、MPW_
HILIMITを増加させ、もしくはMPW_LOLIMITを減少させ
る。ここでのアイデアは、修正ページをしばしばフラッ
シュアウトする必要がないように、これら2つのパラメ
ータ間の差を充分大きくすることである。また、MPW_HI
LIMITがMPW_WAITLIMITに等しいことを確認することが望
ましい。
61.RSNS_SCSのため次のイメージが待機中である。ロッ
クマネジャーは、特定のロックリソースに関する情報を
得るため他のVAXクラスタノードの相手と通信する必要
があるとき、プロセスをその待ち状態に置く。
この待ち状態の中でプロセスが遅れた場合、それはCI問
題、非安定クラスタあるいは定足数のロス(loss of qu
orum)の表示である。クラスタの状態を示すメッセージ
用コンソールをチェックし、さらにエラーログならびに
CI問題に関する情報用コンソールをチェックすることが
望ましい。
62.RSNS_CLUSTRANのため次のイメージが待機中である。
転移中(すなわち、ノードが付加または除去されている
間)の任意のクラスタノードに関して任意のロック要求
を出しているプロセスを、クラスタメンバーシップが安
定する間この待ち状態に置くようにする。
63.VMSに対するシステムフォールトレートが後続の時間
周期に対して毎秒2フォールト以上である。VMSフォー
ルトレートを減少させうる場合は、全システムに対して
性能を改善することができる。
システムフォールトレートを減少させるため、VMSに対
するワーキングセットサイズ(SYSMWCNT)を増加させる
ことが望ましい。
64.ノン・ページドダイナミックメモリから付加的SRPs
を作るための不必要なオーバーヘッドが生ずる。ブート
タイムにもっと多くのSRPsをあらかじめ割当てた場合
は、付加的オーバーヘッドを招くこともなく、また浪費
されるダイナミックメモリもないと思われる。
SRPCOUNTパラメータを使用しているSRPsの最大数より僅
かに高い値まで増加させ、SRPCOUNTVパラメータをSRPCO
UNTの値の4倍にセットすることが望ましい(高くセッ
トしすぎた場合も、性能を害なうことはない)。
65.ノン・ページドダイナミックメモリから付加的IRPs
を作るための不必要なオーバーヘッドが生ずる。ブート
タイムにもっと多くのIRPsをあらかじめ割当てた場合
は、付加的オーバーヘッドを招くこともなく、また、ダ
イナミックメモリの浪費をきたすこともないと思われ
る。
IRPCOUNTパラメータを使用しているIRPsの最大数より僅
かに高い値まで増加させ、IRPCOUNTVパラメータをIRPCO
UNTの値の4倍にセットする(高くセットしすぎた場合
も性能を害なうことはない)ことが望ましい。
66.ノン・ページドダイナミックメモリから付加的LRPs
を作るための不必要なオーバーヘッドが生ずる。ブート
タイムに、もっと多くのLRPsをあらかじめ割当て場合
は、付加的オーバーヘッドを招くこともなく、またダイ
ナミックメモリの消費をきたすこともないと思われる。
LRPCOUNTパラメータを使用しているLRPsの最大数より僅
かに高い値まで増加させ、LRPCOUNTVパラメータをLRPCO
UNTの値の4倍にセットする(高くセットしすぎた場合
も性能を害なうことはない)ことが望ましい。
67.付加的ノン・ページドダイナミックメモリを造るた
め不必要なオーバーヘッドが生ずる。ブートタイムにも
っと多くのバイトがあらかじめ割当てられていれば、付
加的オーバーヘッドを招くことはなかったと思われる。
NPAGDYNパラメータを使用しているノン・ページドバイ
トの最大数より僅かに高い値まで増加させ、NPAGEVIRパ
ラメータをNPAGEDYNの値の3倍にセットすることが望ま
しい。
68.付加的リソースハッシュテーブルエントリーを造る
ため不必要なオーバーヘッドが生ずる。ブートタイム
に、もっと多くのエントリーがRESHASHTBLにあらかじめ
割当てられていれば、付加的オーバーヘッドを招くこと
はなかったと思われる。
RESHASHTBLパラメータを既知のリソースの最大数より僅
かに高い値まで増加させることが望ましい。
69.付加的ロッキード(lockid)テーブルエントリーを
造るため不必要なオーバーヘッドが生ずる。ブートタイ
ムに、もっと多くのエントリーがLOCKIDTBLにあらかじ
め割当てられていれば、付加的オーバーヘッドを招くこ
とはなかったと思われる。
LOCIDTBLパラメータを使用しているロックの最大数より
僅かに高くすることが望ましい。
70.このCPUは大部分のバッチジョブときわめて少量のイ
ンタラクティブワークを実行しているものと思われる。
もしそうである場合は、QUANTUMの値を増加させること
を考えたいであろう。これは、ジョブにコンテキストス
イッチ当りさらに多くのCPUサイクルを費消することを
許容し、総合のオーバーヘッドを低下させることができ
る。VAX-11/780上では、QUANTUMをバッチ環境に対して5
00に高くセットすることができる。インタラクティブユ
ーザーの平均数は%%%であり、バッチジョブが費消し
たCPUのパーセンテージは%%%であった。
付録6: クラスタルール ルール番号 メッセージテンプリット 71.頻繁に使用されるディスク上に待ちが形成されてい
る。経験によれば、待ちの長さが長くなると遅れも長く
なることが分かっている。
起こりうるフラグメンテーション問題に関してディスク
をチェックすること。ディスクが多くの書込(WRITE)
操作で容量に近い(70%一杯以上)場合は、フラグメン
テーションは早く起こるように思われる。そうなった場
合は、PHYSICALクオリファイヤなしにBACKユーティリテ
ィを用いて、ディスクをリフレッシュすること。
フラグメンテーションが問題でない場合には、特定時間
の間(できれば)他のディスクボリュームにすべての新
しい作業を割当て、特定のディスクボリュームでの使用
を低減させるようにすることが望ましい。
72.低いオペレーションカウントを有するディスク上に
待ちが存在する。これは通路(回線)争奪または部分的
ハードウエア障害に起因する遅れを暗示している。
救済策としては、予備機(SPEAR)を使用して、特定の
ボリューム上に装置のエラーが生成されないことを確認
し、もしくは通路(チャネルまたはコントローラ)を付
加してディスクへのアクセスに関する任意の争いを軽減
する方法が有効である。
73.HSCがスレショールド以上となっている。
74.ロックマネジャーはデッドロック(deadlock)が生
じたことを検出した。デッドロックは、ロックマネジャ
ーを使用し、それらのロッキングアクティビティの扱い
方を誤っているアプリケーションにより生じている。デ
ッドロックは、デッドロック探索が高い優先順位で始ま
り、必ずしも任意の1つのノードに限定されないため、
全クラスタ的な性能の劣化をきたすことがありうる。
デッドロックの原因となるアプリケーションを隔離し、
かつロッキングアルゴリズムを再設計しようとこころみ
ることが望ましい。
75.デッドロックが発見されていないのに、デッドロッ
ク探索が起こっている。デッドロック探索はパラメータ
DEADLOCK_WAITに対するセッティングが低すぎることに
より行われる可能性がある。デッドロック探索は全クラ
スタ的な性能劣化をもたらす可能性がある。デッドロッ
ク探索は高い優先順位で開始され、必ずしも任意の1つ
のノードに限定されることはない。
DEADLOCK_WAITの値をAUTOGENディフォールト(10秒以
上)まで増加させることが望ましい。
76.ロック管理者は、デッドロックが発見されないのに
デッドロック探索が行われていることを検出した。それ
は、アプリケーションが(デッドロック探索がトリガリ
ングすることにより)、長時間に亘って制限的ロックを
保持し続けていることによるものと思われる。デッドロ
ック探索は全クラスタ的性能劣化をきたす可能性があ
る。また、デッドロック探索は高い優先順位で開始さ
れ、必ずしも任意の1つのノードに限定されない。デッ
ドロック探索を起こさせるアプリケーションを隔離し、
制限的ロックをできるだけ短時間保持するようにロッキ
ングアルゴリズムを再設計することが望ましい。
77.そこには、システムファイルキャッシ上の低いヒッ
トレイショに起因する過大数のディスクIOが存在する。
ファイルキャッシルックアップが失敗したときは、必要
なデータを検索するためのディスク操作がもたらされ
る。余分なI/Oオーバーヘッドを減少させるため1つま
たはそれ以上のファイルキャッシのサイズを増加させる
必要があるかも知れない。
より大きいキャッシを必要とするかどうかを決定するた
めファイルキャッシ統計を調べることが望ましい。も
し、キャッシのサイズを増やすことを決定した場合は、
AUTOGENを使用し、かつ新しい値が使用されるようシス
テムをリブート(reboot)することが望ましい。
【図面の簡単な説明】
第1図は本発明方法を説明するためのVAXコンピュー
タ、ディスクおよびディスクコントローラを含むVAXク
ラスタ(VAXcluster)ネットワークを示す図、 第2図は本発明方法を実行可能なシステムの構成素子を
示す図、 第3図は第2図示データベースを示す図、 第4図は第2図示アドバイザサブシステムの構成部分を
示す図、 第5図はデータ収集手順用のイニシアライゼーションル
ーチンのフローチャート、 第6図は本発明により使用されるデータ収集手順に関す
る主制御ループのフローチャート、 第7図は第6図にそのフローチャートを示すようなデー
タ収集手順用主制御ループにより測定が継続されている
時コールされる手順のフローチャート、 第8図は第6図にそのフローチャートを示すようなデー
タ収集手順用主制御ループにより測定が休止されている
とき、コールされる手順のフローチャート、 第9A〜9I図は本発明により決められるメモリルール用の
デシジョンツリー構造を示す図、 第10A図および第10B図は本発明により決められるCPUル
ール用のデシジョンツリー構造を示す図、 第11A〜11D図は本発明により決められるI/Oルール用の
デシジョンツリー構造を示す図、 第12図はエビデンステーブルへの転送データの記憶を示
す図、 第13A〜13D図は第12図に示す転送データに対するエビデ
ンステーブルの4つの状態を示す図、 第14図および第15図は本発明実施例の教えにより作成し
た解析レポートの例を示す図、 第16図および第17図は本発明実施例の教えにより作成し
た性能レポートの例を示す図、 第18図は本発明実施例の教えにより作成したCPU利用の
ヒストグラムの例を示す図である。 100……VAXクラスタ(VAXcluster)ネットワーク 110,120,130……VAXコンピュータ 140,150……インテリジェントディスクコントローラ 142,144,146……ディスク 160……スターカプラ 200……システム 210……コンピュータ 220……データ収集スケジューラ 230……スケジュールファイル 240……データ収集サブシステム 250……データベース 260……アドバイザサブシステム 270……ルールサブシステム 280……スレショールドサブシステム 290……メッセージテンプリット 295……レポートサブシステム 300……ファイル 310……レコード 320……サブレコード 410,420……素子
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェームス・エッチ・トーレイ・ジュニア アメリカ合衆国マサチューセッツ州01519 グラフトン ポッター ヒル ロード84 (56)参考文献 特開 昭58−149527(JP,A)

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】データ プロセッサ システムの性能を示
    す複数のワークロード特性を有し、かつデータ プロセ
    ッサ システムに対する許容動作領域を規定する複数個
    のシステム パラメータを有するデータ プロセッサ
    システムであって、これらの複数のシステム パラメー
    タはデータ プロセッサの性能に影響を及ぼしうるよう
    調整可能であり、データ プロセッサの性能の評価は、
    ワークロード特性の受入れ可能な状態を規定する1組の
    ルールに関連して行なわれるデータ プロセッサの性能
    評価のための作動方法において、 メジャー インターバルを構成する複数個の各時間間隔
    中に少なくとも1回、それぞれ前記1組のルールに対応
    する複数個のメトリックの各々の値を測定する工程で、
    該メトリックのそれぞれはデータ プロセッサ システ
    ムの測定可能量を表わし、前記メジャー インターバル
    は該データ プロセッサ システムにより周期的に開始
    されるものである測定工程と、 前記メトリックの各々に対する測定値と、当該測定が行
    なわれた時のメジャー インターバルとを、前記データ
    プロセッサ システムのメモリ内に記憶蓄積する工程
    と、 前記の計測したメトリックの各々の蓄積値を、データ
    プロセッサ メモリ内に蓄積されている当該メトリック
    に対応するスレショールドと比較し、この比較は、前記
    複数のメジャー インターバルのうちの選択された1つ
    に対し行なわれる比較工程と、 前記メトリックの蓄積値と対応のスレショールド値の各
    比較結果を評価して、前記蓄積値によって代表される各
    メトリックと、これらメトリックに対する対応のスレシ
    ョールドに対して複数の所定の特別な関係が存在するか
    を決定する工程で、前記特定の関係は、前記ルールの組
    の1つ以上に関するものである評価決定工程、 関連のすべての特定の関係が満足される前記ルールの1
    つをトリガするトリガ工程、 トリガされた各ルールを代表するデータと、これら各ル
    ールのそれぞれがトリガされたメジャー インターバル
    とをデータ プロセッサ メモリ内に記録する記録工
    程、 前記ルールの各々がその時間内にトリガされる前記メジ
    ャー インターバルの数をカウントし、ルールの前記各
    セットに対するメジャー インターバルの全トリガ数を
    得る計数工程、並びに トリガされた各ルールより、前記データ プロセッサ
    システムの機能(パーフォーマンス)を改良するため前
    記システム パラメータの特定の1つを勧告(リコメン
    ド)する勧告工程とを有し、該勧告工程は次の副工程、
    すなわち、 前記メモリ内に記憶されたサジェスション アクション
    のリストを検査する検査工程で、対応のルールがトリガ
    されたルールであるサジェステッド アクションの1つ
    を見出し、前記サジェスション アクションのリスト
    は、各サジェスション アクションに対応する前記ルー
    ルの識別を含むものである検査工程、 前記各ルールに対する前記トリガを行うメジャー イン
    ターバルの全数が、前記検査ステップ内に発見されたサ
    ジェステッド アクションのディスプレイ前に、対応の
    所定のスレショールド数を超過することを確保する確保
    工程、かつ 前記検査工程で発見されたサジェステッド アクション
    の1つをディスプレイするディスプレイ工程とを有して
    なることを特徴とするデータ プロセッサ システムの
    作動方法。
  2. 【請求項2】前記のディスプレイされた各推奨アクショ
    ンに対し、予め選択された前記メトリックの1つ、パラ
    メータ、前記比較結果の評価又はこれに用いられたスレ
    ショールドを出力し、前記のディスプレイされた推奨ア
    クションに対応するルールの1つをトリガすべきか否か
    を決定する出力工程を含んでなる特許請求の範囲第1項
    記載の方法。
  3. 【請求項3】前記の記憶されたメトリック値より前記デ
    ータ プロセッサ システムのワーク ロード特性のデ
    ィスプレイをデータ プロセッサ システムによって構
    成する工程、及び 前記ディスプレイを出力する工程を含む特許請求の範囲
    第1項記載の方法。
  4. 【請求項4】前記計測工程は、次の副工程、すなわち、 前記各メジャー インターバルの間、1回以上前記メト
    リックの何れかを選択的に急速に変化させる数個の値を
    測定する副工程、 前記メトリック1つを選択的に急速に変化させる数個の
    測定値を平均化し、前記メトリックの選択的に急速に変
    化するものの各値の平均値を得る平均化副工程を有し、 ここにおいて、前記記憶工程は、データ プロセッサ
    システム メモリ内へ前記メトリックの選択的に急速に
    変化するものの平均値を記憶する副工程を具えてなる特
    許請求の範囲第1項記載の方法。
  5. 【請求項5】前記記憶工程は、 データ プロセッサ システム メモリ内に、前記各ル
    ールに対し構成されたデータベースを構成する副工程を
    有し、このデータベースは前記ルールに対応するメトリ
    ックの選択されたものの情報と、これら各ルールがトリ
    ガされた回数の情報とを含んでいることを特徴とする特
    許請求の範囲第1項記載の方法。
  6. 【請求項6】データ プロセッサ システムの性能を評
    価するためのデータ プロセッサ システムの作動方法
    であって、該データ プロセッサ システムは複数個の
    相互接続素子を有し、かつデータ プロセッサ システ
    ムの性能を表示する複数個のワーク ロード特性を有し
    ており、さらにデータ プロセッサ システムに対する
    許容しうる動作範囲を規定する複数個のシステム パラ
    メータを有していて、これらのシステム パラメータは
    データ プロセッサ システムの性能に影響を及ぼすよ
    うに調整が可能であり、前記評価はワーク ロード特性
    の許容可能な状態を特定する1組のルールに関して遂行
    される方法において、 メジャー インターバルを構成する複数の所定時間周期
    の各々間に少なくとも1回、前記1組のルールに対応す
    る複数のメトリックの各々の値を測定する工程で、これ
    らメトリックの各々は、データ プロセッサ システム
    内の測定可能な量を表わし、前記メジャー インターバ
    ルはデータ プロセッサ システムによって周期的に開
    始される測定工程、 データ プロセッサ システムのメモリ内に、前記メト
    リックの各測定値、並びにその測定が行われたメジャー
    インターバルを記憶する工程、 前記の測定された各メトリックの記憶値を、データ プ
    ロセッサ システム メモリ内に記憶されている該メト
    リックに対する対応のスレショールドと比較し、この比
    較は、前記メジャー インターバルの選択された1つに
    対して行われる比較工程、 前記の記憶値と対応のスレショールドの各比較の結果を
    評価して、前記記憶値に代表される各メトリックと、こ
    れらメトリックの対応のスレショールドの複数の所定の
    特別な関係が満足されているかを決定する評価工程で、
    これらの特別な関係は前記ルールの組の1つ又は1つ以
    上に関するものである工程、 関連の特別な関係がすべて満足される前記ルールの1つ
    をトリガする工程、 かくトリガされた各ルールを表わすデータと、これら各
    ルールがトリガされたメジャー インターバルのデータ
    をデータ プロセッサ メモリ内に記録する工程、 前記ルールの各々がトリガされたメジャー インターバ
    ルの数を計数し、前記ルールの組に対してトリガを行っ
    たメジャー インターバルの全数を得る計数工程、 前記データ プロセッサの性能(パーフォーマンス)を
    改善するため、前記複数の相互接続素子の特定の形状を
    変化するよう、トリガされたルールより、勧告(リコメ
    ンデーション)を行う工程、さらに該勧告工程は次の各
    副工程を含む、 前記メモリ内に記憶されている推奨すべきアクションの
    リストを検査し、該推奨アクションの対応のルールが、
    トリガされたルールである推奨アクションの1つを発見
    する副工程で、前記推奨アクションのリストはこれら推
    奨アクションの各々に対応する前記ルールの1つの表示
    を含んでいる検査副工程、 前記各ルールの各々に対しトリガを行うメジャー イン
    ターバルの全数が、前記検査副工程で発見された推奨ア
    クションをディスプレイする前において、対応の所定ス
    レショールド数を超えていることを確保する副工程、 前記検査副工程で発見された前記推奨アクションの1つ
    をディスプレイする副工程、 を含んでなるデータ プロセッサ システムの作動方
    法。
  7. 【請求項7】前記のディスプレイされた各推奨アクショ
    ンに対し、予め選択された前記メトリックの1つ、パラ
    メータ、前記比較結果の評価又はこれに用いられたスレ
    ショールドを出力し、前記のディスプレイされた推奨ア
    クションに対応するルールの1つをトリガすべきか否か
    を決定する出力工程を含んでなる特許請求の範囲第6項
    記載の方法。
  8. 【請求項8】前記の記憶されたメトリック値より前記デ
    ータ プロセッサ システムのワーク ロード特性のデ
    ィスプレイをデータ プロセッサ システムによって構
    成する工程、及び 前記ディスプレイを出力する工程を含む特許請求の範囲
    第6項記載の方法。
  9. 【請求項9】前記計測工程は、次の副工程、すなわち、 前記各メジャー インターバルの間、1回以上前記メト
    リックの何れかを選択的に急速に変化させる数個の値を
    測定する副工程、 前記メトリック1つを選択的に急速に変化させる数個の
    測定値を平均化し、前記メトリックの選択的に急速に変
    化するものの各値の平均値を得る平均化副工程を有し、 ここにおいて、前記記憶工程は、データ プロセッサ
    システム メモリ内へ前記メトリックの選択的に急速に
    変化するものの平均値を記憶する副工程を具えてなる特
    許請求の範囲第6項記載の方法。
  10. 【請求項10】前記記憶工程は、 データ プロセッサ システム メモリ内に、前記各ル
    ールに対し構成されたデータベースを構成する副工程を
    有し、このデータベースは前記ルールに対応するメトリ
    ックの選択されたものの情報と、これら各ルールがトリ
    ガされた回数の情報とを含んでいることを特徴とする特
    許請求の範囲第6項記載の方法。
JP62218071A 1986-09-02 1987-09-02 データプロセッサシステムの性能評価方法 Expired - Lifetime JPH0762832B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US06/904,093 US4849879A (en) 1986-09-02 1986-09-02 Data processor performance advisor
US904093 1986-09-02

Publications (2)

Publication Number Publication Date
JPS63126042A JPS63126042A (ja) 1988-05-30
JPH0762832B2 true JPH0762832B2 (ja) 1995-07-05

Family

ID=25418537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62218071A Expired - Lifetime JPH0762832B2 (ja) 1986-09-02 1987-09-02 データプロセッサシステムの性能評価方法

Country Status (11)

Country Link
US (1) US4849879A (ja)
EP (1) EP0259224B1 (ja)
JP (1) JPH0762832B2 (ja)
AT (1) ATE122481T1 (ja)
AU (1) AU584515B2 (ja)
CA (1) CA1281427C (ja)
DE (1) DE3751284T2 (ja)
DK (1) DK449187A (ja)
FI (1) FI873792A (ja)
IE (1) IE872343L (ja)
IL (1) IL83695A0 (ja)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE460386B (sv) * 1988-03-18 1989-10-02 Ibm Svenska Ab Foerfarande foer diagnostisering av bristfaellig prestanda i en datorinstallation
CA1337132C (en) 1988-07-15 1995-09-26 Robert Filepp Reception system for an interactive computer network and method of operation
US5121496A (en) * 1988-07-25 1992-06-09 Westinghouse Electric Corp. Method for creating, maintaining and using an expert system by recursively modifying calibration file and merging with standard file
US5155847A (en) * 1988-08-03 1992-10-13 Minicom Data Corporation Method and apparatus for updating software at remote locations
US5067107A (en) * 1988-08-05 1991-11-19 Hewlett-Packard Company Continuous computer performance measurement tool that reduces operating system produced performance data for logging into global, process, and workload files
JPH0245831A (ja) * 1988-08-08 1990-02-15 Ricoh Co Ltd 知識推諭処理装置
US5249260A (en) * 1988-08-12 1993-09-28 Hitachi, Ltd. Data input system
US4964125A (en) * 1988-08-19 1990-10-16 Hughes Aircraft Company Method and apparatus for diagnosing faults
EP0372682A3 (en) * 1988-12-05 1991-07-17 Digital Equipment Corporation System characterization method
US5161116A (en) * 1989-02-27 1992-11-03 Dynix System for evaluating the performance of a large scale programmable machine capable of having a plurality of terminals attached thereto
DE69032058T2 (de) * 1989-03-14 1998-07-02 Canon Kk Prozesszustandsüberwachungssystem
GB2236202B (en) * 1989-09-21 1993-11-03 Sun Microsystems Inc Method and apparatus for extracting process performance information from a computer over a network
US5159687A (en) * 1989-11-14 1992-10-27 Caseworks, Inc. Method and apparatus for generating program code files
US5586022A (en) * 1990-02-14 1996-12-17 Hitachi, Ltd. Method of evaluating easiness of works and processings performed on articles and evaluation apparatus
US5907488A (en) * 1990-02-14 1999-05-25 Hitachi, Ltd. Method of evaluating easiness of works and processings performed on articles and evaluation apparatus
US5222197A (en) * 1990-06-28 1993-06-22 Digital Equipment Corporation Rule invocation mechanism for inductive learning engine
US5276877A (en) * 1990-10-17 1994-01-04 Friedrich Karl S Dynamic computer system performance modeling interface
US5245638A (en) * 1990-10-29 1993-09-14 Iowa State University Research Foundation, Inc. Method and system for benchmarking computers
US5231593A (en) * 1991-01-11 1993-07-27 Hewlett-Packard Company Maintaining historical lan traffic statistics
US5251152A (en) * 1991-01-17 1993-10-05 Hewlett-Packard Company Storage and display of historical LAN traffic statistics
US5243543A (en) * 1991-01-17 1993-09-07 Hewlett-Packard Company Remote LAN segment traffic monitor
US5396612A (en) * 1991-05-02 1995-03-07 At&T Corp. Data tracking arrangement for improving the quality of data stored in a database
US5630097A (en) * 1991-06-17 1997-05-13 Digital Equipment Corporation Enhanced cache operation with remapping of pages for optimizing data relocation from addresses causing cache misses
SE470031B (sv) * 1991-06-20 1993-10-25 Icl Systems Ab System och metod för övervakning och förändring av driften av ett datorsystem
US7370008B1 (en) 1992-04-10 2008-05-06 Charles E. Hill & Associates, Inc. Electronic catalog system and method
US5528490A (en) * 1992-04-10 1996-06-18 Charles E. Hill & Associates, Inc. Electronic catalog system and method
US5903757A (en) * 1992-09-10 1999-05-11 International Business Machines Corporation Monitoring and handling of exception conditions in computer system
GB9302225D0 (en) * 1993-02-05 1993-03-24 Int Computers Ltd Data processing system
US5652842A (en) * 1994-03-01 1997-07-29 Healthshare Technology, Inc. Analysis and reporting of performance of service providers
US5606681A (en) * 1994-03-02 1997-02-25 Eec Systems, Inc. Method and device implementing software virtual disk in computer RAM that uses a cache of IRPs to increase system performance
FR2717282B1 (fr) 1994-03-10 1996-04-05 Bull Sa Procédé d'analyse de système.
US5619656A (en) * 1994-05-05 1997-04-08 Openservice, Inc. System for uninterruptively displaying only relevant and non-redundant alert message of the highest severity for specific condition associated with group of computers being managed
US5577226A (en) * 1994-05-06 1996-11-19 Eec Systems, Inc. Method and system for coherently caching I/O devices across a network
US5615359A (en) * 1994-06-23 1997-03-25 Candle Distributed Solutions, Inc. Data server with data probes employing predicate tests in rule statements
US5623598A (en) * 1994-11-22 1997-04-22 Hewlett-Packard Company Method for identifying ways to improve performance in computer data storage systems
US6161101A (en) * 1994-12-08 2000-12-12 Tech-Metrics International, Inc. Computer-aided methods and apparatus for assessing an organization process or system
US5727167A (en) * 1995-04-14 1998-03-10 International Business Machines Corporation Thresholding support in performance monitoring
US5748878A (en) * 1995-09-11 1998-05-05 Applied Microsystems, Inc. Method and apparatus for analyzing software executed in embedded systems
US5887167A (en) * 1995-11-03 1999-03-23 Apple Computer, Inc. Synchronization mechanism for providing multiple readers and writers access to performance information of an extensible computer system
US5920719A (en) * 1995-11-06 1999-07-06 Apple Computer, Inc. Extensible performance statistics and tracing registration architecture
US5867643A (en) * 1995-11-06 1999-02-02 Apple Computer, Inc. Run-time data type description mechanism for performance information in an extensible computer system
JP3367305B2 (ja) * 1995-11-14 2003-01-14 三菱電機株式会社 ネットワークシステム
US5963943A (en) * 1996-05-28 1999-10-05 Mci Communication Corporation System and method for storing and retrieving performance and topology information
US6108637A (en) 1996-09-03 2000-08-22 Nielsen Media Research, Inc. Content display monitor
US5781703A (en) * 1996-09-06 1998-07-14 Candle Distributed Solutions, Inc. Intelligent remote agent for computer performance monitoring
US5732218A (en) * 1997-01-02 1998-03-24 Lucent Technologies Inc. Management-data-gathering system for gathering on clients and servers data regarding interactions between the servers, the clients, and users of the clients during real use of a network of clients and servers
US6003079A (en) * 1997-02-27 1999-12-14 Hewlett Packard Company System and method for continuously measuring quality of service in a federated application environment
US5872913A (en) * 1997-03-07 1999-02-16 International Business Machines Corporation System and method for low overhead, high precision performance measurements using state transistions
US6643696B2 (en) 1997-03-21 2003-11-04 Owen Davis Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US5796952A (en) * 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US5991705A (en) 1997-07-23 1999-11-23 Candle Distributed Solutions, Inc. End-to-end response time measurement for computer programs using starting and ending queues
US6917971B1 (en) 1999-12-23 2005-07-12 International Business Machines Corporation Method and apparatus for determining a response time for a segment in a client/server computing environment
FR2767399B1 (fr) * 1997-08-14 1999-09-17 Bull Sa Procede de determination du temps de demarrage d'un systeme informatique
US6035306A (en) * 1997-11-24 2000-03-07 Terascape Software Inc. Method for improving performance of large databases
US6044335A (en) * 1997-12-23 2000-03-28 At&T Corp. Productivity metrics for application software systems
US6106571A (en) * 1998-01-29 2000-08-22 Applied Microsystems Corporation Relocatable instrumentation tags for testing and debugging a computer program
US6473897B1 (en) * 1998-04-13 2002-10-29 Intel Corporation Method and apparatus for generating multiple processor-specific code segments in a single executable
US6339750B1 (en) 1998-11-19 2002-01-15 Ncr Corporation Method for setting and displaying performance thresholds using a platform independent program
US6636905B1 (en) * 1999-03-26 2003-10-21 Unisys Corporation Method for analyzing input/output performance of a data processing system
US6606671B1 (en) * 1999-04-19 2003-08-12 Unisys Corporation Method for analyzing input/output operations of a data processing system
US6470388B1 (en) 1999-06-10 2002-10-22 Cisco Technology, Inc. Coordinated extendable system for logging information from distributed applications
US7200651B1 (en) 1999-07-02 2007-04-03 Cisco Technology, Inc. Dynamic configuration and up-dating of integrated distributed applications
AUPQ206399A0 (en) 1999-08-06 1999-08-26 Imr Worldwide Pty Ltd. Network user measurement system and method
JP2003530623A (ja) * 1999-09-17 2003-10-14 マーキュリー インタラクティブ コーポレーション サーバおよびネットワーク性能の監視
CA2396565A1 (en) 2000-01-12 2001-07-19 Jupiter Media Metrix, Inc. System and method for estimating prevalence of digital content on the world-wide-web
US6522768B1 (en) * 2000-01-31 2003-02-18 Hewlett-Packard Company Predicting system behavior of a managed system using pattern recognition techniques
US6658367B2 (en) * 2001-03-28 2003-12-02 Hewlett-Packard Development Company, L.P. System for time-bucketing of baselined data collector data
US20020198985A1 (en) * 2001-05-09 2002-12-26 Noam Fraenkel Post-deployment monitoring and analysis of server performance
US6738933B2 (en) 2001-05-09 2004-05-18 Mercury Interactive Corporation Root cause analysis of server system performance degradations
US7197559B2 (en) * 2001-05-09 2007-03-27 Mercury Interactive Corporation Transaction breakdown feature to facilitate analysis of end user performance of a server system
US6941450B2 (en) * 2001-07-30 2005-09-06 International Business Machines Corporation System and method for identifying one or more optimum configurations of a data processing system
CA2455079A1 (en) * 2001-08-06 2003-02-20 Mercury Interactive Corporation System and method for automated analysis of load testing results
CH701481B1 (de) * 2001-09-25 2011-01-31 Roland Pulfer Prozessmanagement.
US7085786B2 (en) * 2002-05-20 2006-08-01 International Business Machines Corporation Apparatus and method to schedule and perform database maintenance
US8271778B1 (en) 2002-07-24 2012-09-18 The Nielsen Company (Us), Llc System and method for monitoring secure data on a network
US20040054515A1 (en) * 2002-09-18 2004-03-18 Todi Rajat Kumar Methods and systems for modeling the performance of a processor
CH703073B1 (de) * 2003-03-19 2011-11-15 Roland Pulfer Vergleich von Modellen eines komplexen Systems.
CH703081B1 (de) * 2003-03-19 2011-11-15 Roland Pulfer Analyse eines Modells eines komplexen Systems.
CH698890B1 (de) * 2003-03-19 2009-11-30 Roland Pulfer Modellierung eines komplexen Systems.
WO2005024669A1 (en) * 2003-09-04 2005-03-17 Oracle International Corporation Self-managing database architecture
US7673291B2 (en) * 2003-09-05 2010-03-02 Oracle International Corporation Automatic database diagnostic monitor architecture
US7734750B2 (en) * 2003-12-19 2010-06-08 International Business Machines Corporation Real-time feedback for policies for computing system management
JP4367167B2 (ja) * 2004-02-18 2009-11-18 日本電気株式会社 リアルタイムシステム、QoS適応制御装置及びそれらに用いるQoS適応制御方法並びにそのプログラム
US8024301B2 (en) * 2004-03-26 2011-09-20 Oracle International Corporation Automatic database diagnostic usage models
US7444450B2 (en) * 2004-04-28 2008-10-28 Hewlett-Packard Development Company, L.P. Method and system for detecting excessive interrupt processing for a processor
US20050289115A1 (en) * 2004-06-28 2005-12-29 Microsoft Corporation Integrating best practices into database design
US7954062B2 (en) * 2005-01-03 2011-05-31 International Business Machines Corporation Application status board mitigation system and method
US20070227928A1 (en) * 2005-05-31 2007-10-04 Olson Christopher R Container comprising a disposable cleaning implement and a method of promoting the sale of a disposable cleaning implement
US7844701B2 (en) * 2005-08-01 2010-11-30 Network Appliance, Inc. Rule-based performance analysis of storage appliances
US8260831B2 (en) * 2006-03-31 2012-09-04 Netapp, Inc. System and method for implementing a flexible storage manager with threshold control
KR101305978B1 (ko) * 2006-12-28 2013-09-12 삼성전자주식회사 화상형성장치 및 그 제어방법
US8069154B2 (en) * 2007-03-05 2011-11-29 International Business Machines Corporation Autonomic rule generation in a content management system
US7779127B2 (en) * 2007-03-09 2010-08-17 Hewlett-Packard Development Company, L.P. System and method for determining a subset of transactions of a computing system for use in determing resource costs
JP5166519B2 (ja) * 2007-05-16 2013-03-21 インターナショナル・ビジネス・マシーンズ・コーポレーション ソフトウェア資産ベースのソリューションを開発する一貫した方法システムおよびコンピュータ・プログラム
US20080300965A1 (en) * 2007-05-31 2008-12-04 Peter Campbell Doe Methods and apparatus to model set-top box data
US8990811B2 (en) * 2007-10-19 2015-03-24 Oracle International Corporation Future-based performance baselines
US8326970B2 (en) * 2007-11-05 2012-12-04 Hewlett-Packard Development Company, L.P. System and method for modeling a session-based system with a transaction-based analytic model
US8793223B1 (en) * 2009-02-09 2014-07-29 Netapp, Inc. Online data consistency checking in a network storage system with optional committal of remedial changes
US10031829B2 (en) * 2009-09-30 2018-07-24 International Business Machines Corporation Method and system for it resources performance analysis
US8635180B2 (en) * 2011-02-06 2014-01-21 International Business Machines Corporation Multiple hash scheme for use in a pattern matching accelerator
US8793459B2 (en) * 2011-10-31 2014-07-29 International Business Machines Corporation Implementing feedback directed NUMA mitigation tuning
US10075520B2 (en) * 2012-07-27 2018-09-11 Microsoft Technology Licensing, Llc Distributed aggregation of real-time metrics for large scale distributed systems
US9247273B2 (en) 2013-06-25 2016-01-26 The Nielsen Company (Us), Llc Methods and apparatus to characterize households with media meter data
US9396061B1 (en) * 2013-12-30 2016-07-19 Emc Corporation Automated repair of storage system components via data analytics
WO2015123201A1 (en) 2014-02-11 2015-08-20 The Nielsen Company (Us), Llc Methods and apparatus to calculate video-on-demand and dynamically inserted advertisement viewing probability
US10219039B2 (en) 2015-03-09 2019-02-26 The Nielsen Company (Us), Llc Methods and apparatus to assign viewers to media meter data
RU2629444C2 (ru) * 2015-06-30 2017-08-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения спам активности в облачной системе
US9848224B2 (en) 2015-08-27 2017-12-19 The Nielsen Company(Us), Llc Methods and apparatus to estimate demographics of a household
US10791355B2 (en) 2016-12-20 2020-09-29 The Nielsen Company (Us), Llc Methods and apparatus to determine probabilistic media viewing metrics
KR20180078512A (ko) * 2016-12-30 2018-07-10 삼성전자주식회사 반도체 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58149527A (ja) * 1982-03-02 1983-09-05 Fujitsu Ltd システムの自動チユ−ニング方式
JPS593651A (ja) * 1982-06-30 1984-01-10 Fujitsu Ltd フア−ムウエアによる性能測定システム
US4648044A (en) * 1984-06-06 1987-03-03 Teknowledge, Inc. Basic expert system tool
US4730259A (en) * 1985-03-01 1988-03-08 Gallant Stephen I Matrix controlled expert system producible from examples
US4713775A (en) * 1985-08-21 1987-12-15 Teknowledge, Incorporated Intelligent assistant for using and operating computer system capabilities to solve problems

Also Published As

Publication number Publication date
AU584515B2 (en) 1989-05-25
EP0259224B1 (en) 1995-05-10
DK449187A (da) 1988-03-03
IE872343L (en) 1988-03-02
FI873792A (fi) 1988-03-03
DE3751284D1 (de) 1995-06-14
IL83695A0 (en) 1988-01-31
CA1281427C (en) 1991-03-12
EP0259224A3 (en) 1989-11-23
ATE122481T1 (de) 1995-05-15
JPS63126042A (ja) 1988-05-30
AU7617187A (en) 1988-03-10
US4849879A (en) 1989-07-18
DK449187D0 (da) 1987-08-27
FI873792A0 (fi) 1987-09-01
DE3751284T2 (de) 1996-02-15
EP0259224A2 (en) 1988-03-09

Similar Documents

Publication Publication Date Title
JPH0762832B2 (ja) データプロセッサシステムの性能評価方法
US5062055A (en) Data processor performance advisor
Witt et al. Predictive performance modeling for distributed batch processing using black box monitoring and machine learning
US6067412A (en) Automatic bottleneck detection by means of workload reconstruction from performance measurements
El-Sayed et al. Learning from failure across multiple clusters: A trace-driven approach to understanding, predicting, and mitigating job terminations
JP2667376B2 (ja) クライアント/サーバ・データ処理システム
US10831387B1 (en) Snapshot reservations in a distributed storage system
US6493837B1 (en) Using log buffers to trace an event in a computer system
US5675739A (en) Apparatus and method for managing a distributed data processing system workload according to a plurality of distinct processing goal types
US7290259B2 (en) Virtual computer system with dynamic resource reallocation
US7694070B2 (en) Computer system for managing performances of storage apparatus and performance management method of the computer system
US9031826B2 (en) Method and apparatus for simulating operation in a data processing system
US5325505A (en) Intelligent storage manager for data storage apparatus having simulation capability
JP4028820B2 (ja) コンピュータ・システムでのトランザクションの選択的キャッシングの方法および装置
Xiao et al. Dynamic cluster resource allocations for jobs with known and unknown memory demands
US6269410B1 (en) Method and apparatus for using system traces to characterize workloads in a data storage system
US8141089B2 (en) Method and apparatus for reducing contention for computer system resources using soft locks
US20240319885A1 (en) Workload management using a trained model
Endo et al. Improving interactive performance using TIPME
Chen et al. Dynamic load sharing with unknown memory demands in clusters
US6915516B1 (en) Apparatus and method for process dispatching between individual processors of a multi-processor system
JP2001184175A (ja) ストレージ管理システム
Schwetman et al. An experimental study of computer system performance
Reiner et al. A method for adaptive performance improvement of operating systems
US6345337B1 (en) Method and system for determining a cache single reference residency time