JPH0926942A - 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法 - Google Patents

並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法

Info

Publication number
JPH0926942A
JPH0926942A JP7175809A JP17580995A JPH0926942A JP H0926942 A JPH0926942 A JP H0926942A JP 7175809 A JP7175809 A JP 7175809A JP 17580995 A JP17580995 A JP 17580995A JP H0926942 A JPH0926942 A JP H0926942A
Authority
JP
Japan
Prior art keywords
communication packet
processor
communication
time
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7175809A
Other languages
English (en)
Inventor
Machiko Asaka
真知子 朝家
Shigeo Takeuchi
茂雄 武内
Tatsu Toba
達 鳥羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi ULSI Engineering Corp
Hitachi Ltd
Original Assignee
Hitachi ULSI Engineering Corp
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi ULSI Engineering Corp, Hitachi Ltd filed Critical Hitachi ULSI Engineering Corp
Priority to JP7175809A priority Critical patent/JPH0926942A/ja
Publication of JPH0926942A publication Critical patent/JPH0926942A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】複数のプロセッサ5とネットワーク2,3,プ
ロセッサ間通信路を判定するネットワークルータ4から
なる並列計算機1で、ネットワークルータ部に通信パケ
ットをモニタする部分を設け、通過した通信パケットの
識別子,通過時刻,通信データ長などを監視し、モニタ
リング専用線6を介して、モニタリング制御装置10に
通知する。モニタリング制御装置10では、モニタリン
グレコードを解析して、リアルタイムにディスプレイ装
置に解析結果を表示する。 【効果】プロセッサ間通信モニタ専用線を設けることに
より、並列計算機のプログラム動作に干渉せずに、プロ
セッサ間ネットワークの混雑率がリアルタイムに認識で
きる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は並列計算機のプロセッサ
間ネットワーク動作状況を観察するためのモニタリング
装置、および、プロセッサ間通信パケットの生成方法に
関する。
【0002】
【従来の技術】従来、並列計算機の稼働状況の性能モニ
タリングは、ソフトウェアにプローブを挿入するなどし
て、情報を収集し、並列計算機内のプロセッサに付属す
る記憶装置に収集したモニタリングデータを蓄積してい
た。
【0003】特開平6−19865号公報によれば、プロセッ
サがプロセッサ間通信を生じたとき、通信状況を示すデ
ータを自己プロセッサの記憶部に記録しておき、動作終
了後に各プロセッサに保持している通信状況データを収
集して、解析編集している。
【0004】ソフトウェアにプローブを挿入するなどし
て情報を収集し、並列計算機内のプロセッサに付属する
記憶装置に収集したモニタリングデータを蓄積する方法
では、本来の並列計算機のプロセッサ動作が使用する記
憶装置を共有し、並列計算機の動作を妨げ、実行時間を
遅らせたり、動作順序やタイミングを本来ではない姿に
変化させてしまう可能性があり、正確なモニタリング情
報は得られない。
【0005】
【発明が解決しようとする課題】並列計算機のデバッグ
や性能チューニングは、多数のプロセッサやプロセッサ
間ネットワークが複雑に動作するため、解析が難しい。
【0006】特に、プロセッサ間ネットワークでは多数
のプロセッサ間パケットが通過するため、混雑や衝突が
生じ、ユーザの期待したプロセッサ間通信性能が期待で
きない場合も多い。
【0007】本発明の目的は、プロセッサ間ネットワー
クの混雑度をリアルタイムに直感的に認識し、プログラ
マがデバッグおよび通信性能チューニングするための情
報を提供するため、並列計算機のプログラム動作に干渉
せずに、ネットワークをリアルタイムモニタリングし、
混雑度を視覚化することにある。混雑度を認識するた
め、ネットワークを通過するプロセッサ間パケットの
量、および通過に要した時間の監視が必要である。
【0008】本発明のさらに他の目的は、並列計算機の
プロセッサ間を通過したプロセッサ間通信パケットのサ
イズ,種類,通過時間を、並列計算機の本来の動作に干
渉せずに、正確にモニタリングしてプロセッサ間通信履
歴情報を収集し、後刻に詳細解析することにある。
【0009】
【課題を解決するための手段】上記目的達成のため、本
発明では、ネットワークルータ部にモニタリング機構
と、リアルタイムに解析するための通信履歴情報を含む
プロセッサ間通信パケット生成手段を備える。
【0010】複数のネットワークルータ部に共通の時計
を持たせ、ネットワークルータ部を通過するプロセッサ
間パケットに、通過した時刻,通信データ長,通過した
ネットワークルータ識別番号の情報を付加して、プロセ
ッサ間ネットワークに送出する。
【0011】ネットワークルータ内の通信パケット監視
部では、ルータ識別番号,通信パケットの始点プロセッ
サ識別番号,通信パケットの終点プロセッサ識別番号,
プロセッサ間通信パケット識別番号,ルータ通過時刻,
通信データ長,通信種類,既通過ルータ識別番号、およ
び既通過ルータ通過時刻の情報をモニタリングレコード
として、構成生成する。モニタリングレコードは、並列
計算機の動作に干渉しないために張り巡らせた、ネット
ワークルータ部に接続するモニタ専用回線を介して収集
する。
【0012】プロセッサ間通信パケットの識別子に着目
して、これらの情報をモニタリング,解析することによ
って、(i)ルータ間を通過するのに要した時間,(ii)通
過したルータ識別番号の履歴,(iii)ルータ間の混雑
率,(iv)特定プロセッサ間の通信パケットの発生頻度等
が計算出来る。
【0013】
【作用】プロセッサ間通信パケットに、ネットワークル
ータの通過時刻を付加し、プロセッサ間を通過する間
中、通過ルータ識別番号と通過時刻を保存することによ
って、ネットワークルータを通過した通信パケットのネ
ットワーク通過履歴が、ネットワークモニタで瞬時に判
別可能となり、従来全実行履歴を採集した後に後刻に解
析する必要があったが、リアルタイムに可視化すること
が出来る。
【0014】プロセッサ間通信パケットモニタリング専
用回線を設けることによって、並列計算機上のプログラ
ム動作に干渉せずに、客観的にモニタリングデータ収集
できる。
【0015】共通の時計を持ったネットワークルータ上
にモニタリング機構を持たせることによって、複数の通
信パケットを同じ時間軸上で解析でき、プロセッサやル
ータ間の時刻差を考慮せずに、ネットワーク間通信の履
歴が収集できる。
【0016】
【実施例】図1は本発明の一実施例の全体構成を表すブ
ロック図である。
【0017】1は並列計算機を表し、複数のプロセッサ
ユニット5が、プロセッサ間ネットワーク2,3で接続
される。ここで、2はクロスバネットワークであり、1
本のクロスバネットワークに接続しているプロセッサユ
ニットは、互いに1対1に接続される。4はルータであ
り、2のクロスバと3のクロスバを接続する機能があ
る。また、ルータ4はプロセッサ間に発行された通信パ
ケットを、適当な通信ポートを選んで出力する。
【0018】8はクロック発振器であり、複数のルータ
4に同時にクロック信号を送る。9はクロック幅調整器
であり、クロック信号を出力する間隔を調整する。
【0019】10はモニタリング制御装置である。ルー
タ4に接続したモニタリング信号線6と接続し、ルータ
内部に存在する通信パケット・モニタ部207から、モ
ニタリング・レコードを受け取る。モニタリングレコー
ドは、モニタリングレコード解析部11を介して、通信
パケット解析テーブル12に登録される。計算および表
示部13では、通信パケット解析テーブル12の内容を
参照して、通信パケットの履歴,ルータ間の混雑率をデ
ィスプレイ装置14に表示する。
【0020】図2はルータ4およびプロセッサユニット
5を表す図である。プロセッサユニット5は、CPU201,
主記憶202,ネットワークインタフェース部203か
ら構成する。他のプロセッサへの通信要求が生じると、
ネットワークインタフェース部203で通信データに行
き先プロセッサ識別番号等を付加した通信パケットを生
成し、ルータ4側に送出する。
【0021】ルータ4では、通信パケットを通信パケッ
ト入力部204から受け取り、通信パケット・タイムス
タンプ付加部205で、クロック発振器8の信号をカウ
ントしてタイムスタンプ生成部206で生成されたタイ
ムスタンプ、すなわち、通信パケットの先頭部が通過し
た時刻のタイムスタンプを、通信パケットに付加する。
さらに、ルータ識別番号を図3で示す形式に付加する。
【0022】通信パケット・モニタ部207では、通信
パケットに付属する以下の情報,ルータ識別番号,通信
始点プロセッサID,通信パケットID,通信終点プロ
セッサID,通信種類,通信データ長などを解析し、モ
ニタリング・レコード生成部208で現在の時刻を付加
して、図4で示すモニタリング・レコード40を生成す
る。モニタリング・レコードはモニタ信号線6から外部
モニタリング制御装置10に送出する。
【0023】通信パケットは、さらにルーティング判定
部209を通過して、次に出力するネットワークポート
を選定し、プロセッサ間ネットワーク2または3を選別
して、通信パケット出力部210から出力する。
【0024】図3はプロセッサ間通信パケット形式を示
す。30はプロセッサ間通信パケットを示す。307は
パケット情報タグ部であり、通信始点プロセッサID3
01,通信パケットID302,通信終点プロセッサI
D303,通信種類304,通信データ長305、およ
び予備領域306から構成する。通信始点プロセッサI
D301とは、他のプロセッサへデータを送出するプロ
セッサの識別番号を示す。通信パケットID302は、
通信始点プロセッサにおいて発行したプロセッサ間通信
パケットの順に番号付けされた番号である。従って、通
信始点プロセッサID301と通信パケットID302
の組によって、通信パケットは一意に決まる。通信終点
プロセッサID303とは、通信始点プロセッサ303
の通信先であり、通信パケットの最終的な目的地であ
る。通信種類304は、例えば、1プロセッサから全ユ
ニットに通信するブロードキャスト通信,1対1の通
信,優先順位の高い高速通信などの、通信のタイプを表
すフラグである。通信データ長305は、プロセッサ間
通信で送信する通信パケットのデータ量を示す。
【0025】312はルータ通過時刻格納領域を示す。
この例では、第1通過ルータID308,第1ルータ通過時刻
309,前段通過ルータID310,前段ルータ通過時
刻311を格納する。
【0026】第1通過ルータとは通信パケットが最初に
通過したルータID、前段通過ルータとは通信パケット
が現在までに最後に通過したルータIDと定義する。ま
た、通過時刻とは、ルータの通信パケット・モニタ部2
08を、通信パケットの先頭が通過したときのタイムス
タンプの値と定義する。
【0027】通信始点プロセッサから通信パケットが送
出される時点では、ルータ通過時刻格納領域312には
初期値0を記載する。
【0028】通信パケットの先頭部がルータを通過した
時点で、第1通過ルータID領域308、および第1ル
ータ通過時刻領域309が初期値の場合は、ルータI
D、およびルータ通過時刻をそれぞれ第1通過ルータI
D領域308、および第1ルータ通過時刻領域309
と、前段通過ルータID領域310,前段ルータ通過時
刻領域311に記載する。
【0029】また、通信パケットの先頭部がルータを通
過した時点で、第1通過ルータID領域308、および
第1ルータ通過時刻領域309が初期値でない場合は、
ルータID、およびルータ通過時刻をそれぞれ前段通過
ルータID領域310,前段ルータ通過時刻領域311
に記載する。
【0030】313には、通信するデータを格納する。
【0031】図4はモニタリングレコード形式を表す図
である。40はルータ4内のモニタリング・レコード生
成部208で生成するモニタリングレコードの形式を表
す。
【0032】通信パケット・モニタ部207を通過する
通信パケット30のパケット情報タグ307、およびル
ータ通過時刻格納領域312の内容に、ルータID40
1,ラップアラウンドコード405,現在の時刻406
を追加したものである。
【0033】ラップアラウンドコード405は、ルータ
4のタイムスタンプ生成部206のタイマカウンタの値
が、カウンタの最大値を超えたときに、真(true)とす
る。通常のモニタリングレコード40は、ラップアラウ
ンドコード部405を偽(false)として他の領域に
は、通信パケットの情報を記載する。
【0034】図5はラップアラウンドコード認識レコー
ド40を示す。ラップアラウンドコード部405は、ル
ータ4のタイムスタンプ生成部206のタイマカウンタ
の値が、カウンタの最大値を超えたときにtrueとする。
このとき、ルータID401はルータ識別番号を記載
し、他の領域501〜503,504〜510はドント
ケアとする。
【0035】通信パケット・モニタ部207では、(i)
通信パケットがルータを通過したとき、および(ii)タイ
マカウンタがラップアラウンドしたときの二つの場合
に、イベント・ドリブン方式で、図4および図5で示す
同サイズのモニタリング・レコードを発行する。
【0036】図6は、通信パケット・モニタ部207の
挙動フローを示す図である。
【0037】タイムスタンプ生成部206のタイマカウ
ンタがラップアラウンドコードを発行(602)すれば
(609)、ラップアラウンドコード部405をtrueと
した、モニタリングレコードを生成し(606)、モニ
タリングレコードを発行する(607)。
【0038】プロセッサ間通信パケットが通過する(6
03)と、通信パケットのパケット情報タグ307,ル
ータ通過時刻格納領域312の情報を判別して(60
4)、タイムスタンプを取得(605),付加してモニタ
リングレコードを生成(606),発行(607)する。
【0039】図7は本実施例で取得したモニタリングレ
コードをリアルタイムで解析,画面表示する場合のフロ
ーを示す。図8に示す、PU間通信混雑率を表す例を表
示する場合の処理を示す。
【0040】モニタリング制御装置10では、表示間隔
であるモニタリングインターバル時間を設定し(70
2)、さらにモニタリングする対象の通信パス{始点プ
ロセッサ,終点プロセッサ}の組を設定する(70
3)。これらの情報を、リアルタイムにメモリ上に判別
するために、メモリ上にモニタリングカウンタを確保
し、初期化しておく(704)。メモリカウンタの形式
は、通信パス{始点プロセッサ,終点プロセッサ}の組
をアドレスとし、(i)トラベル時間カウンタ,(ii)通過
データ長カウンタを具備する。
【0041】モニタリングを開始する(705)と、モ
ニタリング中止命令(707)が発行されるまで、以下
の処理を行う。
【0042】モニタリングインターバル時間内(70
8),(721)に、モニタリング・レコードが入力され
た場合、モニタリング・レコードを取得(710)解析
し、始点プロセッサID・終点プロセッサIDを判別
(711)する。ルータID401=通信終点プロセッサ
ID403の場合のみ解析対象とし、その他のデータ
は、そのまま廃棄する。
【0043】トラベル時間=(現在の時刻406−第1
ルータ通過時刻410)の絶対値 と定義し、対応する{始点プロセッサ,終点プロセッ
サ}の組のトラベル時間カウンタに値を足し込む(71
2)。同様に、通信データ長408の値を通過データ長
カウンタに足し込む(713)。
【0044】一つのモニタリング・レコードに対する処
理が終了したら(723)、モニタリング・インターバ
ル時間内、以上の処理を繰り返す。
【0045】モニタリング・インターバル時間が終了し
たら(724)、(i)トラベル時間カウンタ,(ii)通過
データ長カウンタの値を解析し、表示する。
【0046】経路の平均実転送性能=通信データ長の和
/トラベル時間の和 経路の平均混雑率=経路の平均実転送性能/理想転送性
能 (理想転送性能とは、論理的に全く障害無くデータが転
送されると考えたときの最大転送性能であり、並列計算
機システムに固有の一定値。)と定義する。
【0047】まず、モニタリング対象パスに対し、モニ
タリング・インターバル中の通信パス平均混雑率を上記
定義により、(i)トラベル時間カウンタ,(ii)通過デー
タ長カウンタの値を用いて計算し(714)、混雑率に
対応する表示線分の太さを計算する(715)。インタ
ーバル時間の混雑率を画面描画(716)して、モニタ
リング・インターバル時間における一連の処理を終わ
り、モニタリング・インターバル時間を更新する(71
7)。
【0048】図7の例では、始点プロセッサと終点プロ
セッサ間の通信をモニタリングしたが、40のモニタリ
ング・レコードから、以下の計算が可能となり、始点プ
ロセッサ・終点プロセッサ間の混雑率の表現方法と同様
に、リアルタイムに解析可能となる。
【0049】(1)始点プロセッサからルータまでのト
ラベル時間=現時刻−第1ルータ通過時刻 (2)始点プロセッサからルータまでの経路の平均混雑
率=(通信データ長/ルータまでのトラベル時間)/理
想転送性能 (3)ルータと前段ルータ間のトラベル時間=現時刻−
前段ルータ通過時刻 (4)ルータと前段ルータ間の経路の平均混雑率=(通
信データ長/ルータと前段ルータ間のトラベル時間)/
理想転送性能 さらに、図7では、トラベル時間の定義を トラベル時間=(現在の時刻406−第1ルータ通過時
刻410)の絶対値 とした。ここでは、リアルタイム性を重視し混雑率の計
算を高速にするために、ラップアラウンドコード405
については扱わない。従って、タイムカウンタの最大値
を超える場合は除外する。このため、トラベル時間が十
分タイムカウンタの最大値以下に収まるように、クロッ
ク幅調整器9にてクロック幅を大きくし、タイムカウン
タの最大値を変更することが出来る。
【0050】図8はプロセッサ間ネットワークモニタリ
ング・リアルタイム表示例を示す図である。
【0051】80は特定のプロセッサ間通信混雑率を示
す。PU1〜PUnは、プロセッサ識別番号を表す。ま
た、807〜810の矢印は、プロセッサ間の混雑率を
表す。矢印の方向は通信データの移動した方向を示す。
矢印の線分の太さを混雑率で表現し、細いほど混雑率が
高く、通信性能が得られないことを示す。言い換えれ
ば、矢印線分の太さが太いほど実転送性能が高く、一定
時間における通信データ量が多いことを示す。例えば、
PUnからPU1への通信はスムーズに流れているのに
対し、PUiからPU0への通信は、何らかの障害があ
って、スムーズに行かないことを示している。この原因
は、(i) 複数プロセッサから同一プロセッサへの通信要
求が発生し、ネットワーク衝突待ちが生じている、(ii)
いずれかの通信経路上ルータの通信が混雑している、な
どを推測することが出来る。
【0052】図9はプロセッサ間ネットワーク・モニタ
リング・データの加工前の構成を示す図である。
【0053】プロセッサ間ネットワークのモニタリング
レコードを後刻に解析する場合に、まず、図9の形式で
蓄積しておく。モニタリングレコード40は、モニタリ
ング制御装置10に到着順に通信パケット解析テーブル
12の領域にテーブルの形式で登録する。
【0054】項目は、ルータID,通信始点プロセッサ
ID,通信パケットID,通信終点プロセッサID,ラ
ップアラウンドコード,現在の時刻,通信種類,通信デ
ータ長,第1通過ルータID,第1ルータ通過時刻,前
段通過ルータID,前段ルータ通過時刻とする。1〜5
…の列は、各モニタリングレコードの項番を表す。
【0055】モニタリングレコード項番1は、ルータI
D R1を観測したとき、通信始点プロセッサIDがP
0で、通信パケットIDが0、通信終点プロセッサID
がP5の通信パケットが通過した。このときの通信パケ
ットの先頭部が通過した時刻はt1で、通信種類はAタ
イプ、通信データ長はl0であった。このパケットの第
1通過ルータIDはR0であり、第1ルータ通過時刻は
t0である。前段通過ルータIDもR0であり、前段ル
ータの通過時刻はt0である。従って、この通信パケッ
トはプロセッサP0→ルータR0→ルータR1の順に通
過してきたことがわかる。
【0056】モニタリングレコード項番3は、ラップア
ラウンド認識レコードを示している。ルータID R3
では、通信パケットが通過する前にタイマがラップアラ
ウンドし、ラップアラウンドコード部がtrueのモニタリ
ングレコードが発行された。
【0057】この後に、モニタリングレコード項番5
に、ルータID R3のモニタリングレコードが通知さ
れた。このモニタリングレコード項番5は、通信パケッ
ト{始点プロセッサP0,通信パケットID 1}が、
プロセッサP0→ルータR0→(不明)→ルータR1→
ルータR3の順に通過し、終点プロセッサP6に向かっ
て進んでいることがわかる。
【0058】図10はプロセッサ間ネットワーク・モニ
タリング・解析テーブルの構成を表す図である。
【0059】これは、前記テーブル90を後刻に解析し
整理したテーブルであり、通信パケット解析テーブル1
2の領域に格納する。図10では、通信パケットの通信
履歴を表す項目,第1通過ルータID,第1ルータ通過
時刻,前段通過ルータID,前段ルータ通過時刻は省い
ている。テーブルは、ラップアラウンドコードを除き、
正確な通過時刻に変換した後のテーブルである。
【0060】項目は、90の項目を継承し、ルータI
D,通信始点プロセッサID,通信パケットID,通信
終点プロセッサID,通過時刻,通信種類,通信データ
長で表す。
【0061】モニタリングレコード項番1は、このモニ
タリングレコードが到着する前にラップアラウンドコー
ドが到着していないので、図9の項番1の値をそのまま
継承する。
【0062】モニタリングレコード項番3は、通過時刻
を変換する。モニタリングレコード項番5が到着する前
に1個のラップアラウントコードが到着しているので、
タイムスタンプ値t4に、タイマの最大値Mを足して、
M+t4とする。
【0063】図11にタイムスタンプのラップアラウン
ドコードの解読方法と、モニタリングレコードのプロセ
ッサ間ネットワーク・モニタリング・解析テーブルへの
登録方法の流れを示す。
【0064】はじめにタイムスタンプ生成部206内の
タイマカウンタの最大値を取得して、定数Timer_MAX を
定義する(1102)。
【0065】モニタリングレコード原データに対して、
モニタリングルータIDに関してソートし(110
3)、ルータID毎(1104)に以下の処理を行う。
【0066】ラップアラウンドカウンタWA_counterを定
義し、0をセットする(1105)。当該ルータIDに
ついて、モニタリングデータが終了するまで(110
6)、ソート後のモニタリングデータを読み(110
7)、ラップアラウンドコードがtrueの場合(110
8)、ラップアラウンドカウンタWA_counterをインクリ
メントする。ラップアラウンドコードがfalseの場合
は、現在時刻をTpseudoという変数に格納し(111
0)、ラップアラウンドカウンタの値を読んで実時刻Tr
ealを計算する(1111)。実時刻Trealは、Treal=T
pseudo+WA_counter*Timer_MAXと定義できる。計算し
たTrealの値を、図10の通過時刻(1006)に、そ
の他の項目は値をそのまま継承して、解析テーブルに登
録する(1112)。
【0067】以上の処理を各ルータIDについて(11
04)実行し、全モニタリングレコードが終了したら、
終わる(1113)。
【0068】図12はプロセッサ間ネットワークモニタ
リング解析結果を表現する1つの方法を表す図である。
【0069】通信パケット各々について、通信履歴を可
視化したものである。
【0070】横軸は時間を、縦軸は通信パケットIDを
表す。1203,1204はそれぞれ通信パケットID
P0−1,P4−1の通信履歴に対応する。P0−1
とは、始点プロセッサID P0が発行した通信パケッ
トID1を表す。
【0071】通信パケットID P0−1の履歴を追っ
てみると、ルータR0→R1→R2→R3を通過し、R
3に接続するプロセッサに通信データが送られる。12
05,1207,1209,1211はそれぞれルータ
R0,R1,R2,R3を表すノードである。120
6,1208,1210はルータ間の通信がどのように
実行されたかを表す線分である。線分の長さをルータ間
のトラベル時間,線分の面積を通信データ長で表すと、
線分の太さは実転送性能となる。ルータ間の混雑度が高
ければ、線分が長く細くなる。
【0072】複数の通信パケットIDの通信履歴につい
て、同時刻頃に同一のルータを通過している場合があれ
ば、ルータにおいて通信待ちが生じていることが表現で
きる。
【0073】図13は図12を表現するためのデータ構
造を表す。
【0074】通信パケットについて、データ1301を
先頭とした構造体が出来る。
【0075】パケットID,通信種類,データ長,ルー
タの通過履歴リストで構成する。
【0076】1303,1305は、通過ルータ,通過
時刻を持った構造体である。
【0077】図14はプロセッサ間ネットワークモニタ
リング解析結果を表現するもう一つの方法を表す図であ
る。横軸に時間,縦軸にルータIDを示す。R0〜R3
はルータのIDである。黒い矩形1411,1413,
1415,1417、および白い矩形1412,141
4,1416は、ルータを通過した通信パケットを表し
ている。
【0078】矩形に通信パケットIDを付加するか、ま
たは色によって通信パケットを認識することによって、
通信パケットがルータを渡って行く様子が認識できる。
矩形の時間軸方向の幅は、通信データ長を疑似的に表現
したものである。データ長が大きいときは矩形の幅を大
きくする。縦軸方向の高さは、矩形に大きさを持たせる
ためのものでありどの通信パケットに関しても一定とす
る。
【0079】図15は、図14を表現するためのデータ
構造を表す。ルータIDを先頭とした構造体が出来る。
その下のブロックは、ルータIDを通過した通信パケッ
トのリストを表す。1503は1通信パケットのルータ
通過時のデータである。通過時刻,始点ルータID,パ
ケットID,通信種類,データ長,次に通過する通信パ
ケットデータへのポインタで構成する。
【0080】通信パケットに関するデータには、通信種
類も含んでいるので通信種類の情報を、図14の通信パ
ケットを示す矩形1411に付加することが可能であ
る。
【0081】
【発明の効果】本発明では、プロセッサ間通信パケット
に、ネットワークルータの通過時刻を付加し、プロセッ
サ間を通過する間中、通過ルータ識別番号と通過時刻を
保存することによって、ネットワークルータを通過した
通信パケットのネットワーク通過履歴が、ネットワーク
モニタで瞬時に判別可能となり、リアルタイムに可視化
することが出来る。
【0082】また、モニタリング専用線を設けることに
より、並列計算機のプログラム動作に干渉せずに、プロ
セッサ間通信状況がリアルタイムに取得できる。
【0083】モニタリングレコードの1種として、タイ
マのラップアラウンドコードを生成し、通知することに
よって、タイマの最大値を超えた値であっても、正確な
時刻が計算できる。
【図面の簡単な説明】
【図1】全体構成のブロック図。
【図2】ルータおよびプロセッサユニットを表すブロッ
ク図。
【図3】プロセッサ間通信パケットの構成の説明図。
【図4】プロセッサ間通信パケット・モニタリング・レ
コード構成の説明図。
【図5】ラップアラウンド認識レコード構成の説明図。
【図6】ルータ内通信パケットモニタ部動作のフローチ
ャート。
【図7】プロセッサ間ネットワーク・モニタリング・リ
アルタイム解析のフローチャート。
【図8】プロセッサ間ネットワーク・モニタリング・リ
アルタイム表示例の説明図。
【図9】プロセッサ間ネットワーク・モニタリング・デ
ータ加工前の構成の説明図。
【図10】プロセッサ間ネットワーク・モニタリング・
解析テーブルの構成の説明図。
【図11】タイムスタンプ・ラップアラウンド・コード
解読のフローチャート。
【図12】プロセッサ間ネットワーク・モニタリング・
解析結果表現方法の説明図。
【図13】図12を表現するためのデータ構成の説明
図。
【図14】プロセッサ間ネットワーク・モニタリング・
解析結果表現方法の説明図。
【図15】図14を表現するためのデータのブロック
図。
【符号の説明】
1…並列計算機、2,3…プロセッサ間ネットワーク、
4…プロセッサ間ネットワークルータ、5…プロセッサ
ユニット、6…ネットワークモニタリング専用線、7…
ネットワークルータにクロックを配布する電線、8…ネ
ットワークルータにクロックを発振するクロック発振
器、10…モニタリング制御装置、11…モニタリング
レコード解析部、12…通信パケットの解析テーブル、
13…通信パケット解析結果を計算表示する部分、14
…ディスプレイ装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 武内 茂雄 東京都小平市上水本町5丁目20番1号 日 立超エル・エス・アイ・エンジニアリング 株式会社内 (72)発明者 鳥羽 達 東京都小平市上水本町5丁目20番1号 日 立超エル・エス・アイ・エンジニアリング 株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】複数のプロセッサと前記プロセッサ間ネッ
    トワークから構成され、プロセッサ間通信パケットの受
    信先を判別して適当なネットワーク経路を選んで通信パ
    ケットを送出するネットワークルータに対し、並列計算
    機の内部または外部にクロック発振器を持つ並列計算機
    において、前記通信パケットの先頭部が通過した時刻を
    前記通信パケットの通過時刻として定義し、前記プロセ
    ッサ間通信パケットが前記ネットワークルータを通過す
    る時に、前記ネットワークルータ識別番号と、前記通信
    パケットの通過時刻を、前記ネットワークルータにおい
    て前記プロセッサ間通信パケットに付加して送出する前
    記プロセッサ間通信パケット生成手段を具備し、前記ネ
    ットワークルータに前記プロセッサ間通信用回線とは独
    立なモニタ専用線を接続し、前記ネットワークルータを
    通過する前記プロセッサ間通信パケットをモニタし、 現時刻、および前記プロセッサ間通信パケットに付属す
    る以下の情報,送信元プロセッサ識別番号,通信パケッ
    ト識別番号,送信元プロセッサ出発時刻,受信先プロセ
    ッサ間識別番号,既通過ルータ識別番号および通過時
    刻,通信種類タグ,通信パケットデータ長、を識別し、
    通信パケット解析テーブルに前記プロセッサ間通信パケ
    ットに付属する情報を蓄積する手段を持つことを特徴と
    する並列計算機のプロセッサ間ネットワークモニタリン
    グ装置。
  2. 【請求項2】複数のプロセッサと前記プロセッサ間ネッ
    トワークから構成され、プロセッサ間通信パケットの受
    信先を判別して適当なネットワーク経路を選んで通信パ
    ケットを送出するネットワークルータに対し、並列計算
    機の内部または外部にクロック発振器を持つ並列計算機
    において、前記通信パケットの先頭部が通過した時刻を
    前記通信パケットの通過時刻として定義し、前記プロセ
    ッサ間通信パケットが前記ネットワークルータを通過す
    る時に、前記ネットワークルータ識別番号と、前記通信
    パケットの通過時刻を、前記ネットワークルータにおい
    て前記プロセッサ間通信パケットに付加して送出する前
    記プロセッサ間通信パケット生成手段を具備し、前記ネ
    ットワークルータに前記プロセッサ間通信用回線とは独
    立なモニタ専用線を接続し、前記ネットワークルータを
    通過する前記プロセッサ間通信パケットをモニタし、 前記プロセッサ間通信パケットの先頭部通過時刻,プロ
    セッサ間通信パケットの末尾部通過時刻、および前記プ
    ロセッサ間通信パケットに付属する以下の情報,送信元
    プロセッサ識別番号,通信パケット識別番号,送信元プ
    ロセッサ出発時刻,受信先プロセッサ間識別番号,既通
    過ルータ識別番号および通過時刻,通信種類タグ,通信
    パケットデータ長、を識別し、通信パケット解析テーブ
    ルに前記プロセッサ間通信パケットに付属する情報を蓄
    積する手段を持つ並列計算機のプロセッサ間ネットワー
    クモニタリング装置。
  3. 【請求項3】請求項1または請求項2において、前記プ
    ロセッサ間通信パケットがネットワークルータを通過す
    る時に当該ネットワークルータ識別番号と通信パケット
    の通過時刻を、前記ネットワークルータにおいてプロセ
    ッサ間通信パケットに付加して送出するプロセッサ間通
    信パケット生成方法。
  4. 【請求項4】請求項1または請求項2において、前記ネ
    ットワークルータを通過する前記プロセッサ間通信パケ
    ットをモニタし、現時刻、および前記プロセッサ間通信
    パケットに付属する以下の情報,送信元プロセッサ識別
    番号,送信元プロセッサ出発時刻,受信先プロセッサ間
    識別番号,通過ルータ識別番号および通過時刻,通信種
    類タグ,通信パケットデータ長、を識別し、上記情報
    を、プロセッサ間通信パケットが通過する度に、前記プ
    ロセッサ間通信パケット・モニタリングレコードとして
    モニタ専用線を介してモニタリング制御装置に通知する
    ための、並列計算機のプロセッサ間通信パケットのモニ
    タリングレコード生成方法。
  5. 【請求項5】請求項4において、時刻を観察する際に、
    ネットワークルータに付属するクロックカウンタの最大
    値を超えた場合、ネットワークルータ番号とクロックカ
    ウンタのラップアラウンドコードを、モニタリング制御
    装置に通知するプロセッサ間通信パケットのモニタリン
    グレコード生成方法。
  6. 【請求項6】請求項1または請求項2において、前記プ
    ロセッサ間パケット各々に関して得られたモニタリング
    情報に対して、通信ルートに沿って、時間軸を設定し、
    通過ルータ識別番号を通過時刻の該当する位置に配置
    し、通過ルータを示すノード間を、長さがルータ間トラ
    ベル時間,面積がプロセッサ間通信パケット長に相当す
    る矩形で接続するグラフにて表現するプロセッサ間通信
    パケット通信履歴表現方法。
JP7175809A 1995-07-12 1995-07-12 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法 Pending JPH0926942A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7175809A JPH0926942A (ja) 1995-07-12 1995-07-12 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7175809A JPH0926942A (ja) 1995-07-12 1995-07-12 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法

Publications (1)

Publication Number Publication Date
JPH0926942A true JPH0926942A (ja) 1997-01-28

Family

ID=16002617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7175809A Pending JPH0926942A (ja) 1995-07-12 1995-07-12 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法

Country Status (1)

Country Link
JP (1) JPH0926942A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269330B1 (en) 1997-10-07 2001-07-31 Attune Networks Ltd. Fault location and performance testing of communication networks
WO2012025997A1 (ja) * 2010-08-24 2012-03-01 富士通株式会社 プロセッサ間通信測定システム
WO2013098954A1 (ja) * 2011-12-27 2013-07-04 富士通株式会社 情報処理装置、演算処理装置及び情報処理装置の制御方法
JP2016514296A (ja) * 2013-02-14 2016-05-19 アビニシオ テクノロジー エルエルシー キュー監視及び視覚化
JP2016091042A (ja) * 2014-10-29 2016-05-23 沖電気工業株式会社 通信装置、ログ処理プログラム、通信システム、及びログ処理方法
JP2020010096A (ja) * 2018-07-03 2020-01-16 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269330B1 (en) 1997-10-07 2001-07-31 Attune Networks Ltd. Fault location and performance testing of communication networks
WO2012025997A1 (ja) * 2010-08-24 2012-03-01 富士通株式会社 プロセッサ間通信測定システム
JP5482902B2 (ja) * 2010-08-24 2014-05-07 富士通株式会社 プロセッサ間通信測定システム
US8855950B2 (en) 2010-08-24 2014-10-07 Fujitsu Limited Interprocessor communication measurement system
WO2013098954A1 (ja) * 2011-12-27 2013-07-04 富士通株式会社 情報処理装置、演算処理装置及び情報処理装置の制御方法
JP2016514296A (ja) * 2013-02-14 2016-05-19 アビニシオ テクノロジー エルエルシー キュー監視及び視覚化
JP2016091042A (ja) * 2014-10-29 2016-05-23 沖電気工業株式会社 通信装置、ログ処理プログラム、通信システム、及びログ処理方法
JP2020010096A (ja) * 2018-07-03 2020-01-16 富士ゼロックス株式会社 情報処理装置及びプログラム
US11455136B2 (en) 2018-07-03 2022-09-27 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
RU2419986C2 (ru) Объединение многострочных протокольных вхождений
US10033607B2 (en) Packet loss debug system and method
US8631331B2 (en) Apparatus for network traffic classification benchmark
US5412753A (en) Expert system capable of meeting real time constraints
JPH0756636B2 (ja) データ処理方法
US10599476B2 (en) Device and method for acquiring values of counters associated with a computational task
JPH0926942A (ja) 並列計算機のプロセッサ間ネットワークモニタリング装置およびその方法
CN114666238B (zh) 一种数据链路的可视化监控方法、系统、设备及介质
CN112000548A (zh) 大数据组件的监测方法、装置及电子设备
CN116260738B (zh) 设备监控方法及相关设备
CN116708217A (zh) 一种数据中心设备监控方法、系统、电子设备及存储介质
CN110245120A (zh) 流式计算系统及流式计算系统的日志数据处理方法
Merino et al. Impact of data quality in real-time big data systems
CN112565457B (zh) 一种通用物联网数据处理系统
CN114095523B (zh) 综合调度系统中的通信数据处理方法、设备及系统
US20150254160A1 (en) Tracing the operations of a data processing apparatus
US11474985B2 (en) Data processing apparatus, method, and recording medium
CN114697234B (zh) 智能上报数据的电缆
CN116708209A (zh) 一种网络链路状态的可视化处理方法
JP2585541B2 (ja) 多重メッセージ処理方法
JP2950291B2 (ja) Atmにおける時分割oam処理方法
JPH05189395A (ja) 並列計算機の性能評価方法及びその装置
JP3222504B2 (ja) サービス装置
JP2006154919A (ja) プラントデータ記録システム
CN115426246A (zh) 告警处理方法、装置、服务器及存储介质