JPH1040224A - System for monitoring action of network inside parallel computer - Google Patents

System for monitoring action of network inside parallel computer

Info

Publication number
JPH1040224A
JPH1040224A JP8197288A JP19728896A JPH1040224A JP H1040224 A JPH1040224 A JP H1040224A JP 8197288 A JP8197288 A JP 8197288A JP 19728896 A JP19728896 A JP 19728896A JP H1040224 A JPH1040224 A JP H1040224A
Authority
JP
Japan
Prior art keywords
communication
node
message
time
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8197288A
Other languages
Japanese (ja)
Inventor
Machiko Asaie
真知子 朝家
Nobutoshi Sagawa
暢俊 佐川
Shunji Takubo
俊二 田窪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8197288A priority Critical patent/JPH1040224A/en
Publication of JPH1040224A publication Critical patent/JPH1040224A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To minutely analyze the communication state of a communication message in the network of a parallel computer by monitoring a hardware without changing a program. SOLUTION: A result obtained by monitoring the hardware concerning whole communication packets is preserved in a storage device, the monitored result is analyzed, rectangulars 10 and 11 corresponding to the communication message which is color-divided by communication kind and communication data length(8) with the route node number 30 and the time 31 of the network as axes are arranged in places corresponding to the route node and the passage time of the network and a stay time in the route node is expressed by rectangular width. Moreover, the passage route of the communication packets is tracked and the rectangulars 10 and 11 expressing the communication packets are connected by a straight line 21.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は並列計算機の内部ネ
ットワーク挙動監視システムに関する。
The present invention relates to a system for monitoring the internal network behavior of a parallel computer.

【0002】[0002]

【従来の技術】コンピュータ パフォーマンス エバリ
ュエーション,モデリング テクニックス アンド ツ
ールズ(Computer Performance Evaluation - Modellin
g Techniques and Tools-,7th International Confere
nce Proceedings,pp.76-88,May.3-6,1994(Springer-V
erlag))によれば、Intel社Paragon(2次元メッシュ
構造並列計算機)に搭載されているパフォーマンスモニ
タParAide は、システム パフォーマンス ビジュアラ
イゼーション(System Performance Visualizati
on:SPV)と、ParaGraph(M.T.Heath, J.A.Etheridge:
“Visualizingthe Performance of Parallel Program
s”, IEEE Software, 8(5):29-39, September.1991)
による、プロセッサ間ネットワークモニタおよび描画ツ
ールを持っている。
2. Description of the Related Art Computer Performance Evaluation and Modeling Techniques and Tools
g Techniques and Tools-, 7th International Confere
nce Proceedings, pp.76-88, May.3-6, 1994 (Springer-V
According to erlag), the performance monitor ParAide mounted on Intel Paragon (two-dimensional mesh structure parallel computer) is a system performance visualization (System Performance Visualizati).
on: SPV) and ParaGraph (MTHeath, JAEtheridge:
“Visualizing the Performance of Parallel Program
s ”, IEEE Software, 8 (5): 29-39, September.1991)
Has a network monitor and drawing tools between processors.

【0003】SPVは、各プロセッサノードにおける、
CPU使用率,バス使用率,ネットワーク通信量を、一
部はハードウェア・パフォーマンス・モニタ・カウン
タ,一部はMachカーネルで採集して、2次元メッシュ上
に描画するツールである。アプリケーション・コードと
は独立に動作する。積算値、またはサンプリングデータ
の収集によると考えられる。
[0003] The SPV is used in each processor node.
It is a tool that collects the CPU usage rate, bus usage rate, and network traffic, partly with a hardware performance monitor counter, partly with the Mach kernel, and drawing it on a two-dimensional mesh. Operates independently of application code. This may be due to the accumulation of the integrated value or sampling data.

【0004】ParaGraph は、ソースコードにパフォーマ
ンス・ライブラリをリンクさせてコードを変換し、この
プログラムを実行することによって、イベント・トレー
スを採集する。イベント・トレース結果を、ParaGraph
の認識できるフォーマットに変換して、ParaGraph の描
画ツールを使用して、CPUの使用率やプロセッサ間通
信状態を描画する。通信ネットワーク解析図は、時間と
ノード番号を軸としたダイアグラムである。通信メッセ
ージを追っているか、メッセージのノード滞在時間を考
慮しているか、は不明であるが、トレースデータ作成の
ために、ソースコードの変換が必要である。
ParaGraph collects an event trace by linking a source library with a performance library, converting the code, and executing the program. Event trace results can be saved in ParaGraph
Then, use ParaGraph's drawing tool to draw the CPU usage rate and communication status between processors using the drawing tool of ParaGraph. The communication network analysis diagram is a diagram based on time and node numbers. It is not known whether the communication message is being tracked or the message stay time in the node is taken into account, but the source code must be converted to create the trace data.

【0005】また、前記刊行物のComputer Performance
Evaluation pp.25-51,May.1994には、Pablo Communic
ation Matrixというツールがある。縦軸をセンダ(Send
er),横軸をレシーバ(Receiver)とした格子状のグラ
フに、Sender/Receiverペア間の通信データ量のバイト
数、または通信メッセージ数を対応する格子に色調で表
す。このツールでは実行結果データ取得のために、アプ
リケーション・ソースコードに性能取得用コードを組み
入れたオブジェクトコードを生成し、データ・キャプチ
ャ・ライブラリをリンクすることによって、実行結果を
トレース結果として採取する。
[0005] Also, Computer Performance in the above publication.
Evaluation pp.25-51 and May.1994 include Pablo Communic
There is a tool called ation Matrix. The vertical axis is the sender (Send
er), the number of bytes of the communication data amount between the Sender / Receiver pairs or the number of communication messages is represented in a corresponding grid by a color tone on a grid-like graph with the horizontal axis representing a receiver. In this tool, to obtain execution result data, an object code in which the performance acquisition code is incorporated into the application source code is generated, and the execution result is collected as a trace result by linking the data capture library.

【0006】[0006]

【発明が解決しようとする課題】従来技術によれば、並
列計算機上におけるプログラムの実行性能を計測するた
めのモニタリングコードをソースコードに埋め込む必要
があり、これらのモニタリングコードをソースコードに
埋め込むために、専用のコンパイラを通して実行し、イ
ベント・トレース結果を得る必要があった。モニタリン
グコードの挿入後のオブジェクトコードは、挿入前のオ
ブジェクトコードの実行動作と挙動が異なってしまう可
能性があり、モニタリングのために実行時間も伸長す
る。
According to the prior art, it is necessary to embed a monitoring code for measuring the execution performance of a program on a parallel computer in a source code. It was necessary to run through a dedicated compiler and get the event trace results. The object code after the insertion of the monitoring code may have a different behavior from the execution operation of the object code before the insertion, and the execution time is extended for monitoring.

【0007】また、従来、CPU稼働率やプロセッサ間
通信量などの一部の情報を得るため、OSやハードウェ
ア・パフォーマンスモニタ・カウンタを利用していた
が、これらでは、積算値情報、またはサンプリング情報
しか得られず、特にプロセッサ間通信メッセージの通過
詳細情報を得ることができない。
Conventionally, an OS or a hardware performance monitor counter has been used to obtain a part of information such as a CPU operating rate and an inter-processor communication amount. Only information can be obtained, and in particular, it is not possible to obtain detailed information on passage of an interprocessor communication message.

【0008】さらに、実行結果における、プロセッサ間
通信のSender/Receiverを格子状に配する表現形式、お
よびSender/Receiver間の通信量を表す方法では、プロ
セッサ間通信メッセージが、複数のプロセッサノード、
あるいは複数の経路ノードを通過してReceiverノードに
到着するようなネットワーク構造であった場合に、その
経路上で通信メッセージが競合して通過し、通信性能ボ
トルネックを生じさせるような事態になった場合に、経
路上の状態を認識することができない。さらに、通信メ
ッセージ個別の通信結果を得ることができない。
Further, according to the expression form in which the Sender / Receiver of the inter-processor communication is arranged in a grid pattern in the execution result and the method of expressing the communication amount between the Sender / Receiver, the inter-processor communication message includes a plurality of processor nodes,
Or, if the network structure is such that it passes through multiple path nodes and arrives at the Receiver node, communication messages compete and pass on that path, causing a communication performance bottleneck. In this case, the state on the route cannot be recognized. Furthermore, it is not possible to obtain a communication result for each communication message.

【0009】同様に、2次元メッシュ・ネットワークに
おいて、隣接するノードとのデータ通信量のみを表示す
る方法であっても、複数ノードを通過して宛先ノードに
たどり着く経路上のどこの場所で、通信性能ボトルネッ
クを生じているかを発見することは困難である。
Similarly, even in a method of displaying only the amount of data communication with an adjacent node in a two-dimensional mesh network, communication is performed at any place on a route that reaches a destination node through a plurality of nodes. It is difficult to find out if a performance bottleneck is occurring.

【0010】本発明では、プログラムコードに一切手を
加えることなく、プログラム挙動にも影響を与えずに、
ネットワークを通過するプロセッサ間通信メッセージ全
てをハードウェア・モニタリングして、プロセッサ間通
信メッセージの挙動を詳細トレースすることを目的とす
る。
According to the present invention, the program code is not modified at all and the program behavior is not affected.
The purpose of the present invention is to hardware monitor all inter-processor communication messages passing through a network and to trace the behavior of the inter-processor communication messages in detail.

【0011】さらに、通信メッセージに識別番号が付加
されている場合はもちろんのこと、通信メッセージに識
別番号がない場合でも、通信メッセージの種類やデータ
長を判別することによって、通信メッセージの通過経路
を推測して追跡し、通信メッセージの挙動を掌握するこ
とを目的とする。
Further, even when an identification number is added to a communication message, even when the communication message does not have an identification number, the type and data length of the communication message can be determined to determine the passage of the communication message. The purpose is to guess and track and to grasp the behavior of communication messages.

【0012】[0012]

【課題を解決するための手段】上記、課題を解決するた
めに、並列計算機のプロセッサ間ネットワーク上に存在
し、プロセッサ間通信メッセージを中継する各経路ノー
ドに、プロセッサ間通信メッセージのモニタリング機構
を付加し、通信メッセージの種類,長さ,通信メッセー
ジを発行したプロセッサノード名と送り先ノード名,通
信メッセージの先頭部分,末尾部分の通過した時刻を監
視する。経路ノードのモニタは、通信メッセージが通過
する度にモニタリング・レコードを生成し、モニタリン
グ結果専用線を介してモニタリング・レコードを送出し
て、並列計算機のプログラム動作とは独立な記憶装置に
蓄積しておく。監視対象プログラムの実行後、通信メッ
セージのトレース結果を解析する。
In order to solve the above-mentioned problems, a monitoring mechanism for an inter-processor communication message is added to each path node existing on a network between processors of a parallel computer and relaying the inter-processor communication message. It monitors the type and length of the communication message, the name of the processor node and the destination node that issued the communication message, and the time when the head and tail of the communication message have passed. The monitor of the path node generates a monitoring record every time a communication message passes, sends the monitoring record through a dedicated line for monitoring results, and stores the monitoring record in a storage device independent of the program operation of the parallel computer. deep. After executing the monitoring target program, analyze the trace result of the communication message.

【0013】解析前処理において、経路ノード番号と通
信メッセージが送出ノード,中継ノード,受信ノードの
いずれを通過したときのモニタリング・レコードである
かを判別して、時刻順にならべてレコード・キューを作
成しておく。
In the pre-analysis processing, it is determined whether the path node number and the communication message are monitoring records when the communication message has passed through the sending node, the relay node, or the receiving node, and a record queue is created in time order. Keep it.

【0014】次に、通信メッセージの経路追跡を行う。
送出ノードに対応するモニタリング・レコード・キュー
の先頭から、次に通過すべき経路ノードの中継ノード、
または受信ノードのレコードのレコード・キューから、
通信メッセージ識別番号、または、通信メッセージの種
類,長さ,通信メッセージを発行したプロセッサノード
名と送り先ノード名のすべてが一致し、時刻の大きいレ
コードの中から、送出ノードのモニタリング・レコード
と最も時刻が近いレコードを、前記通信メッセージの次
の通過データとしてリンクする。
Next, the path of the communication message is traced.
From the head of the monitoring record queue corresponding to the sending node, the relay node of the route node to be passed next,
Or from the record queue of the receiving node's record:
The communication message identification number, or the type and length of the communication message, and the processor node name that issued the communication message and the destination node name all match, and among the records with the largest time, the monitoring record of the sending node and the most recent time Are linked as the next passing data of the communication message.

【0015】通信メッセージの経路追跡した結果を、経
路ノード番号と時刻を軸としたタイムチャートに、通信
メッセージを経路ノード駐在時間を幅,通信メッセージ
種類と長さとであらかじめ定めた色の矩形として配置
し、さらに、通信メッセージを表す矩形を経路追跡した
結果に基づいて、結線する。
The result of tracing the route of the communication message is arranged in a time chart on the axis of the route node number and the time as a rectangle of a color predetermined by the width of the route node residence time, the communication message type and the length. Then, based on the result of tracing the rectangle representing the communication message, a connection is made.

【0016】[0016]

【発明の実施の形態】本発明の一実施例を、図1ないし
図11を用いて説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described with reference to FIGS.

【0017】図1はプロセッサ間通信パケット経路追跡
図である。
FIG. 1 is a tracing diagram of an inter-processor communication packet path.

【0018】本発明では、プロセッサ間通信パケットを
監視し、その挙動を図1に示すようなタイムチャートグ
ラフに表現することが目的である。1は、プロセッサ間
通信パケット経路追跡図を表すウィンドウである。縦軸
30は、プロセッサ間通信経路上の経路ノード番号を表
す軸、横軸31は時間の経過を表す軸である。縦軸30
上の3,4は、経路ノード番号を表す。10,11,1
2,13,14,15,16,17,18,19,20
は、それぞれ経路ノードで観測された通信パケットを表
す。8は、通信パケットの種類と長さを色、または網掛
けパターンで判別するための凡例を示している。パケッ
トの種類は、優先度の高い緊急パケット80と、通常の
パケット81に分類し、緊急パケットは斜線、通常パケ
ットは塗りつぶしで表すこととする。さらに、パケット
の長さ、例えば、82は0−127Bytesの短パケッ
ト、83は128−511Bytes程度、84は512−
4095Bytes、85は4096Bytes以上の長パケット
のように分類し、色調の明暗、または任意の色、例え
ば、青,緑,黄,赤のように色分けする。通信パケット
矩形は、通信パケットが経路ノードに進入した時刻を左
端とし、経路ノードに滞在していた時間を時間軸方向の
幅とする。
It is an object of the present invention to monitor inter-processor communication packets and express the behavior in a time chart graph as shown in FIG. Reference numeral 1 denotes a window representing a communication packet path trace diagram between processors. The vertical axis 30 is an axis representing the path node number on the inter-processor communication path, and the horizontal axis 31 is an axis representing the passage of time. Vertical axis 30
Upper 3 and 4 represent path node numbers. 10,11,1
2,13,14,15,16,17,18,19,20
Represents a communication packet observed at each path node. Reference numeral 8 denotes a legend for determining the type and length of a communication packet by color or hatching pattern. The types of packets are classified into an urgent packet 80 with a high priority and a normal packet 81. The urgent packet is indicated by diagonal lines, and the normal packet is indicated by solid color. Further, the packet length, for example, 82 is a short packet of 0 to 127 bytes, 83 is about 128 to 511 bytes, and 84 is 512-
4095 Bytes and 85 are classified as long packets of 4096 Bytes or more, and are classified into light and dark colors or arbitrary colors such as blue, green, yellow, and red. In the communication packet rectangle, the time when the communication packet enters the route node is set to the left end, and the time spent in the route node is set to the width in the time axis direction.

【0019】図中の2は、経路ノード軸30をスクロー
ルするためのスクロールバー、7は時間軸31をスクロ
ールするためのタイムスライダーを表す。目盛り70を
左右に移動することによって、時間軸31の絶対時刻を
設定する。6は表示する時間軸31の幅を定義するため
のタイムスケールスライダーを表す。タイムスケールス
ライダーの目盛り60を移動することによって、通信パ
ケット経路追跡図1の表示時間幅を変更する。5は、ト
ラフィック・インディケータを表す。並列計算機の全シ
ステムにおいて、全体としてどのくらいのプロセッサ間
通信が発生しているかを表す。例えば、50の区間は中
程度、51の区間は通信が頻発、53の区間は通信がほ
とんど発生していないことを表す。トラフィック・イン
ディケータは、オプションを設定して特定の経路ノー
ド、または特定の経路ノードの集合についての、経路ノ
ードを通過する通信パケットの統計として表現してもよ
い。
In the figure, reference numeral 2 denotes a scroll bar for scrolling the path node axis 30, and reference numeral 7 denotes a time slider for scrolling the time axis 31. The absolute time on the time axis 31 is set by moving the scale 70 left and right. Reference numeral 6 denotes a time scale slider for defining the width of the time axis 31 to be displayed. By moving the scale 60 of the time scale slider, the display time width of the communication packet path tracking diagram 1 is changed. 5 represents a traffic indicator. It indicates how much inter-processor communication is occurring as a whole in all the parallel computer systems. For example, a section 50 indicates a medium level, a section 51 indicates frequent communication, and a section 53 indicates that communication hardly occurs. The traffic indicator may set an option and express it as statistics of communication packets passing through the path node for a specific path node or a specific set of path nodes.

【0020】通信パケット10は、パケット長が0−1
27Bytes の通常パケットであり、経路ノードR(0,
0)を通過したことを表す。通信パケット11に関して
も、同様に経路ノードR(1,0)を通過したことを表
す。通信パケット矩形10,11の時間軸方向の幅は、
それぞれ通信パケット10,11が経路ノードR(0,
0)またはR(1,0)に滞在した時間を表す。
The communication packet 10 has a packet length of 0-1.
This is a normal packet of 27 Bytes, and the route node R (0,
0). Similarly, the communication packet 11 indicates that the communication packet 11 has passed the path node R (1, 0). The width of the communication packet rectangles 10 and 11 in the time axis direction is
Communication packets 10 and 11 are route nodes R (0,
0) or R (1,0).

【0021】各プロセッサ間通信経路ノードで独立に、
通信パケットの観察を行うので、10,11,12,1
3,14,15,16,17,18,19,20のよう
に、プロセッサ間通信パケット経路追跡図の全体に、通
信パケットを表す矩形が分布する。
In each of the inter-processor communication path nodes,
Since observation of communication packets is performed, 10, 11, 12, 1
As shown in 3, 14, 15, 16, 17, 18, 19, and 20, rectangles representing communication packets are distributed throughout the inter-processor communication packet path tracking diagram.

【0022】さらに、通信パケットの通過経路を追跡す
るために、同一のパケットとみなされる場合には、2
1,22,23のように通信パケットを表す矩形を結線
する。10,21,11は、パケット長0−127Byte
s の通常パケットが経路ノードR(0,0)→経路ノー
ドR(1,0)の順に通過したことを表す。同様に、通
信パケット14,15,16は、パケット長128−5
11Bytes の通常パケットで、経路ノードR(4,0)
→R(0,0)→R(0,1)を通過したことを表す。
同一の通信パケットであっても、14,15,16の矩
形の幅が異なるのは、経路ノードに滞在していた時間が
異なるからである。同一長のパケットであっても、経路
上が混雑していたりして通信を待たされるときには、経
路ノードに滞在する時間が長くかかることがあるため
に、経路ノード滞在時間が異なる場合がある。性能解析
には、経路ノード滞在時間がパケット長に対して必要以
上に大きい値を示す通信パケット、および同時間に発生
する通信パケットについて、詳細に解析することができ
る。
Further, in order to track the passage of a communication packet, if the packet is regarded as the same packet, 2
A rectangle representing a communication packet such as 1, 22, 23 is connected. 10, 21, and 11 have a packet length of 0 to 127 bytes.
s indicates that the normal packet has passed in the order of the route node R (0,0) → the route node R (1,0). Similarly, the communication packets 14, 15, and 16 have a packet length of 128-5.
11 Bytes normal packet, route node R (4, 0)
→ R (0,0) → R (0,1).
The reason why the widths of the rectangles 14, 15, and 16 are different even for the same communication packet is that the time spent in the route node is different. Even if packets of the same length are waiting for communication due to congestion on the route or the like, the time spent in the route node may take a long time, and thus the route node stay time may be different. In the performance analysis, it is possible to analyze in detail the communication packets in which the route node stay time is unnecessarily large with respect to the packet length and the communication packets that occur during the same time.

【0023】図2は、並列計算機内部ネットワーク挙動
監視システムの全体構成を表す図である。
FIG. 2 is a diagram showing the overall configuration of the parallel computer internal network behavior monitoring system.

【0024】200は、並列計算機を表す。201,2
03はPU(プロセッサユニット)、205,206は
プロセッサ間通信ネットワークを表す。202,204
はプロセッサ間通信ネットワークのルータであり、以下
ではネットワーク通信経路ノードとして扱う。クロック
幅調整器216,クロック発振器215により、クロッ
クを発生してクロック配信線209を介して各ネットワ
ーク通信経路ノードに配信する。これにより、並列計算
機200内のすべてのネットワーク通信経路ノードに同
じ時刻を指す時計を実現する。
Reference numeral 200 denotes a parallel computer. 201,2
03 denotes a PU (processor unit), and 205 and 206 denote communication networks between processors. 202, 204
Is a router of a communication network between processors, and is hereinafter treated as a network communication path node. A clock is generated by the clock width adjuster 216 and the clock oscillator 215 and distributed to each network communication path node via the clock distribution line 209. As a result, a clock indicating the same time is realized for all network communication path nodes in the parallel computer 200.

【0025】210はプロセッサ間通信パケットを監視
し、監視結果を解析・計算するモニタリング制御装置で
ある。プロセッサ間を通信するパケットは、ネットワー
ク通信経路ノード202,204でモニタされ、モニタ
リング専用回線207,208を経由してモニタリング結
果をモニタリング制御装置210に通知する。モニタリ
ング制御装置210には、モニタリングレコード解析部
211があり、モニタリング結果のレコードを解析し
て、通信パケット解析テーブル212に格納する。さら
に、詳細な結果を213部で解析して、図1の1プロセ
ッサ間通信パケット経路図として、ディスプレイ装置2
14に表示する。
Reference numeral 210 denotes a monitoring control device that monitors the inter-processor communication packet and analyzes and calculates the monitoring result. Packets communicating between the processors are monitored by the network communication path nodes 202 and 204, and the monitoring result is notified to the monitoring control device 210 via the dedicated monitoring lines 207 and 208. The monitoring control device 210 has a monitoring record analysis unit 211, which analyzes a record of a monitoring result and stores it in the communication packet analysis table 212. Further, the detailed result is analyzed by the part 213, and is displayed as the one-processor communication packet path diagram of FIG.
14 is displayed.

【0026】図3は、プロセッサ間通信ネットワーク上
のルータおよびプロセッサユニットを表す図である。
FIG. 3 is a diagram showing a router and a processor unit on the interprocessor communication network.

【0027】201はプロセッサユニット、202はル
ータ、205,206はプロセッサ間ネットワークを表
す。プロセッサ間通信パケットは、プロセッサユニット
201のネットワークインタフェース部302から発行
し、ルータ202の通信パケット入出力部303,ルー
ティング判定部304でプロセッサ間ネットワーク205,
206のどちらに送出するかを判定し、通信パケット入
出力部305を介して、314または312のどちらか
からプロセッサ間ネットワークに送出する。
Reference numeral 201 denotes a processor unit, 202 denotes a router, and 205 and 206 denote inter-processor networks. The communication packet between processors is a processor unit.
The communication packet input / output unit 303 of the router 202 and the routing determination unit 304 issue an inter-processor network 205,
The transmission packet input / output unit 305 determines which of the transmission destinations is to be transmitted, and transmits it to the inter-processor network from either the transmission unit 314 or the transmission unit 312 via the communication packet input / output unit 305.

【0028】また、外部から前記プロセッサユニットへ
の通信パケットは、プロセッサ間ネットワーク205,
206のいずれかから、315または313からルータ
202の通信パケット入出力部305,ルーティング判定
部304,通信パケット入出力部303を介して、ネッ
トワークインタフェース部302に入力され、解読され
る。
A communication packet from the outside to the processor unit is transmitted to the inter-processor network 205,
From any of 206, 315 or 313 from router
The information is input to the network interface unit 302 via the communication packet input / output unit 305, the routing determination unit 304, and the communication packet input / output unit 303, and is decoded.

【0029】ルーティング判定部304では、X方向プ
ロセッサ間ネットワーク205への出力か、入力か、Y
方向プロセッサ間ネットワーク206への出力か、入力
か、あるいは、ネットワークルータ202を通過するだ
けで、X方向プロセッサ間ネットワーク205からY方
向プロセッサ間ネットワーク206への中継か、Y方向
プロセッサ間ネットワーク206からX方向プロセッサ
間ネットワーク205への中継かを判定し、それぞれの
ルータ内経路を通信パケットが通過する。
The routing determination unit 304 determines whether to output or input to the X-direction inter-processor network 205,
An output to or an input to the directional inter-processor network 206, or a relay from the X-directional inter-processor network 205 to the Y-directional inter-processor network 206 or a It is determined whether the packet is relayed to the directional processor network 205, and the communication packet passes through each router route.

【0030】本実施例では、通信パケットが、送信元プ
ロセッサユニットから受信先プロセッサユニットへ到着
するまでの通過経路は、複数の任意個の経路ノードであ
り、その順番はあらかじめ一意に定まっていることを前
提とする。
In this embodiment, the path through which the communication packet passes from the source processor unit to the destination processor unit is a plurality of arbitrary path nodes, and the order is uniquely determined in advance. Is assumed.

【0031】306は通信パケット・モニタ部である。
307では、通信パケットが通過する度に、通信パケッ
トの送受信プロセッサユニット番号、通信パケットの通
過時刻等の通信パケットの監視結果をモニタリング・レ
コード500として生成し、モニタ信号線207を介し
て図2中のモニタリング制御装置に送る。308はモニ
タリング・レコードにタイムスタンプを刻印するための
タイムスタンプ生成部であり、全ルータに対して唯一の
クロック発振器215から発振された信号に基づいて、
カウンタを用いてタイムスタンプを生成する。
Reference numeral 306 denotes a communication packet monitor unit.
In step 307, every time a communication packet passes, a monitoring result of the communication packet such as the transmission / reception processor unit number of the communication packet and the passage time of the communication packet is generated as a monitoring record 500, and the monitoring record 500 in FIG. To the monitoring controller. Reference numeral 308 denotes a time stamp generation unit for imprinting a time stamp on the monitoring record, based on a signal oscillated from a single clock oscillator 215 for all routers.
Generate a time stamp using the counter.

【0032】図4は、プロセッサ間通信パケット形式の
例である。
FIG. 4 shows an example of an inter-processor communication packet format.

【0033】(a)は通信パケットIDがないプロセッ
サ間通信パケット400、(b)は通信パケットID4
12があるプロセッサ間通信パケット410を示す。プ
ロセッサ間通信パケット400は、通信始点プロセッサ
ID401,通信終点プロセッサID402,プロセッ
サ間通信の優先度や種類を示す通信種類指定部403,
通信データ長404などから成るパケット情報タグと、
通信データ部406から構成する。プロセッサ間通信パ
ケット410は、パケット情報タグ部に通信パケットI
D412を付加した構成である。
(A) is a communication packet 400 between processors without a communication packet ID, and (b) is a communication packet ID4.
12 shows an inter-processor communication packet 410 with twelve. The inter-processor communication packet 400 includes a communication start processor ID 401, a communication end processor ID 402, a communication type designation unit 403 indicating the priority and type of inter-processor communication,
A packet information tag including a communication data length 404 and the like;
It comprises a communication data section 406. The inter-processor communication packet 410 includes the communication packet I in the packet information tag section.
D412 is added.

【0034】図5は、プロセッサ間通信パケットのモニ
タリング・レコード形式である。
FIG. 5 shows a monitoring record format of an inter-processor communication packet.

【0035】(a)モニタリング・レコード500はプ
ロセッサ間通信パケット400に対応、(b)モニタリ
ング・レコード510はプロセッサ間通信パケット41
0に対応した形式である。
(A) The monitoring record 500 corresponds to the inter-processor communication packet 400, and (b) the monitoring record 510 corresponds to the inter-processor communication packet 41.
This is a format corresponding to 0.

【0036】モニタリング・レコード500は、プロセ
ッサ間ネットワークルータ202を通信パケット400
が通過する度に、モニタリング・レコード生成部307
が生成する。モニタリング・レコード500は、モニタ
リング・レコードの生成されたルータID501,通信
パケット400のパケット情報タグ部の情報を基に作成
した、502通信始点プロセッサID,503通信終点
プロセッサID,504通信種類,505通信データ長,
ルーティング判定部304を通過したときのルータ内経
路ID,ルータを通信パケットが通過したときの通信パ
ケット先頭部の通過時刻507,通信パケット末尾部の
通過時刻508で構成する。
The monitoring record 500 indicates that the inter-processor network router 202 has transmitted the communication packet 400
Each time the monitoring record is passed, the monitoring record generation unit 307
Is generated. The monitoring record 500 includes a router ID 501 for which the monitoring record has been generated, a 502 communication start processor ID, a 503 communication end processor ID, a 504 communication type, and a 505 communication created based on the information of the packet information tag portion of the communication packet 400. Data length,
It is composed of the route ID in the router when passing through the routing determination unit 304, the passage time 507 at the head of the communication packet when the communication packet passes through the router, and the passage time 508 at the end of the communication packet.

【0037】モニタリング・レコード510は、通信パ
ケットID512を付加した場合の構成である。
The monitoring record 510 has a configuration in which a communication packet ID 512 is added.

【0038】通信パケットの通過経路はあらかじめ一意
に定まっているので、ルータID501,通信始点プロセッサ
番号502,通信終点プロセッサ番号503,ルータ内
経路ID506の四つの情報から、前記通信パケット
が、次に通過すべきルータを判別できる。
Since the path through which the communication packet passes is uniquely determined in advance, the communication packet passes through the next information from the four pieces of information of the router ID 501, the communication start processor number 502, the communication end processor number 503, and the route ID 506 in the router. The router to be determined can be determined.

【0039】図6は、パケットキューレコード形式を示
す。
FIG. 6 shows a packet queue record format.

【0040】パケットキューレコード600は、図1の
プロセッサ間通信パケット経路追跡図1を描画するため
に、プロセッサ間通信パケットのモニタリング・レコー
ドを時刻順、およびルータIDでソートして加工したレ
コードである。パケットキューについては、図7で述べ
る。
The packet queue record 600 is a record obtained by sorting the monitoring records of the inter-processor communication packets by time and router ID in order to draw the inter-processor communication packet path tracing diagram 1 of FIG. . The packet queue will be described with reference to FIG.

【0041】パケットキューレコード600は、ネット
ワークルータを通過したプロセッサ間通信パケットのモ
ニタのモニタリングレコードを、パケット情報601,
ルータ通過情報602,次のレコードへのポインタ60
3,前記通信パケットが次に通過するルータにおける当
該通信パケットについてのレコードへのポインタ604か
ら構成する。パケット情報601は、通信始点プロセッ
サID605,通信終点プロセッサID606,通信種
類607,通信データ長608で構成する。ルータ通過
情報602は、ルータID609,ルータ内経路ID6
10,通信パケット先頭部通過時刻611,通信パケッ
ト先頭部通過時刻と通信パケット末尾部通過時刻から算
出した通信パケットのルータ駐在時間612で構成す
る。
The packet queue record 600 stores a monitoring record of the monitor of the inter-processor communication packet passing through the network router as packet information 601,
Router passage information 602, pointer 60 to next record
3. The pointer comprises a pointer 604 to a record of the communication packet in a router through which the communication packet passes next. The packet information 601 includes a communication start processor ID 605, a communication end processor ID 606, a communication type 607, and a communication data length 608. The router passage information 602 includes a router ID 609 and a route ID 6 within the router.
10, the communication packet head passage time 611, the router residence time 612 of the communication packet calculated from the communication packet head passage time and the communication packet tail passage time.

【0042】パケットキューレコードの使い方は、一つ
には図1の通信パケット10,11を描画するための描
画情報になる。例えば、図1の通信パケット10の描画
位置は、垂直方向にはルータID609に相当する位
置、水平時間軸方向には通信パケット先頭部通過時刻6
11を左端に相当する位置に、通信パケットのルータ駐
在時間612を時間軸方向の幅として持つ矩形を描画す
る。矩形の色は、通信種類607,通信データ長608
からあらかじめ定めた色を描画する。通信パケット矩形
10と通信パケット矩形11を結線する直線21は、図
11において述べる通信パケット通過経路探索の後に求
められる。
One use of the packet queue record is drawing information for drawing the communication packets 10 and 11 in FIG. For example, the drawing position of the communication packet 10 in FIG. 1 is the position corresponding to the router ID 609 in the vertical direction, and the communication packet head passage time 6 in the horizontal time axis direction.
At a position corresponding to 11 on the left end, a rectangle having the router residence time 612 of the communication packet as the width in the time axis direction is drawn. The color of the rectangle is communication type 607, communication data length 608
Draws a predetermined color from. The straight line 21 connecting the communication packet rectangle 10 and the communication packet rectangle 11 is obtained after the communication packet passing route search described with reference to FIG.

【0043】パケットキューレコードのもう一つの使い
方は、通信パケット矩形10と通信パケット矩形11を
結線する直線21のように、通信パケットに注目して通
過経路を探索する際に便利である。
Another use of the packet queue record is convenient when searching for a passage route by paying attention to a communication packet, such as a straight line 21 connecting the communication packet rectangle 10 and the communication packet rectangle 11.

【0044】(b)パケットキューレコード620は、
モニタリングレコード510に相当するパケットキュー
レコードである。通信パケットID625を付加してい
る。
(B) The packet queue record 620 is
This is a packet queue record corresponding to the monitoring record 510. A communication packet ID 625 is added.

【0045】図7はパケットキューおよびタイムインデ
ックステーブルを表す図である。
FIG. 7 is a diagram showing a packet queue and a time index table.

【0046】パケットキュー700は、パケットキュー
レコード600を時刻順、およびルータIDでソートし
たキューの集合である。703,704,705はルー
タIDを示す。701は時刻軸である。OUT706,
PASS707,IN708 はそれぞれ、ルータを出力した
通信パケットのモニタリングレコード,ルータを中継し
た通信パケットのモニタリングレコード,ルータに入力
した通信パケットのモニタリングレコードを、図6のパ
ケットキューレコード形式600で時刻順にリンクした
キューである。それぞれ、OUTキュー,PASSキュ
ー,INキューと呼ぶことにする。
The packet queue 700 is a set of queues obtained by sorting the packet queue records 600 in time order and by router ID. Reference numerals 703, 704, and 705 indicate router IDs. 701 is a time axis. OUT706,
The PASS 707 and the IN 708 respectively link the monitoring record of the communication packet output from the router, the monitoring record of the communication packet relayed through the router, and the monitoring record of the communication packet input to the router in chronological order in the packet queue record format 600 of FIG. It is a queue. These are referred to as an OUT queue, a PASS queue, and an IN queue, respectively.

【0047】例えば、ルータIDがRouter[0]で、こ
のルータを始点とした通信パケットが観測されたとき、
INキュー709に時刻順に600,710,712の
ようにリンクする。613,711,713はそれぞ
れ、次のレコードを指すポインタである。Router[0]
を中継点とした通信パケットについて、PASSキュー
714にレコード715,717をリンクする。同様
に、Router[0]を終点とした通信パケットについてI
Nキューリンクする。さらに、Router[1]を出発した
パケットがRouter[0]を中継するとき、このパケット
に関するレコードを722,715とすると、パケット
リンク723をリンクして、同一のパケットに関する情
報をリンクする。このリンクは、図1の通信パケット矩
形10,11を結ぶ直線21に相当する。
For example, when the router ID is Router [0] and a communication packet starting from this router is observed,
The links are linked to the IN queue 709 in the order of time, such as 600, 710, and 712. 613, 711, and 713 are pointers to the next record. Router [0]
The records 715 and 717 are linked to the PASS queue 714 for the communication packet having the relay point as a relay point. Similarly, for a communication packet having Router [0] as the end point, I
Link N queues. Further, when a packet departed from Router [1] relays Router [0], assuming that records regarding the packet are 722 and 715, the packet link 723 is linked to link information regarding the same packet. This link corresponds to a straight line 21 connecting the communication packet rectangles 10 and 11 in FIG.

【0048】730はタイムインデックステーブルであ
る。図1のプロセッサ間通信パケット経路追跡図の描画
対象時刻、および通信パケットの通過経路探索の開始時
刻を設定し、任意の時刻から描画開始できるように、時
刻検索用のタイムインデックステーブルを設ける。単位
時間をTimeSlice 702とするとき、時刻目盛りをT
[0]734,T[1]735,T[j]736とす
る。このテーブルは、パケットキュー700のレコード
とリンクさせ、例えば、740は、Router[0]に関し
T[0]以上T[1]未満のレコードのうち、先頭レコ
ード600を指す。同様に、Router[1]に関しT
[0]以上T[1]未満のレコードのうち、先頭レコー
ド722を指す。
Reference numeral 730 is a time index table. A drawing target time in the inter-processor communication packet path trace diagram of FIG. 1 and a start time of a communication packet passing route search are set, and a time index table for time search is provided so that drawing can be started from an arbitrary time. When the unit time is TimeSlice 702, the time scale is T
[0] 732, T [1] 735, and T [j] 736. This table is linked to the record of the packet queue 700. For example, 740 indicates the first record 600 among the records of T [0] or more and less than T [1] with respect to Router [0]. Similarly, T for Router [1]
It points to the first record 722 of records that are not less than [0] and less than T [1].

【0049】パケットキュー700とタイムインデック
ステーブル730のリンクにより、任意の時刻のレコー
ドを効率よく引き出すことが可能となる。
By linking the packet queue 700 and the time index table 730, a record at an arbitrary time can be efficiently extracted.

【0050】図8は、プロセッサ間通信パケット経路追
跡図1を描画するまでの処理全体の流れを示した図であ
る。
FIG. 8 is a diagram showing a flow of the entire processing up to drawing FIG. 1 of the inter-processor communication packet path tracing.

【0051】プロセッサ間通信パケット経路追跡図のた
めのデータを作成するために、通信パケット経路探索対
象の時間範囲Ts,Teを指定する801。時間範囲が
特定できないときは、モニタリングレコード数を指定す
る。指定範囲のモニタリングレコードを入力し802,
パケットキュー700とタイムインデックステーブル7
30を作成しておく803,804。次に、通信パケッ
ト通過経路の探索805を行って、図7のパケットリンク
604,723を探索してリンクする。
In order to create data for the inter-processor communication packet path trace diagram, a time range Ts, Te for which a communication packet path is to be searched is designated 801. If the time range cannot be specified, specify the number of monitoring records. Enter the monitoring records in the specified range, 802
Packet queue 700 and time index table 7
803, 804 for which 30 has been created. Next, a search 805 of the communication packet passage route is performed to search and link the packet links 604 and 723 in FIG.

【0052】パケットキュー700とタイムインデック
ステーブル730が完成したら、図1のタイムスライダ
ー7,70、およびタイムスケール・スライダー6,6
0から、描画開始時刻,タイムスケールを入力806す
る。描画開始時刻をT[0]とすれば、この値は時間範
囲Ts≦T[0]<Teであることが必要である。ま
た、タイムインデックス値(タイムスライス幅)702
をΔtとするとき、描画幅となるタイムスケールΔT6
0は、Δtの倍数で定義する。
When the packet queue 700 and the time index table 730 are completed, the time sliders 7, 70 and the time scale sliders 6, 6 in FIG.
From 0, a drawing start time and a time scale are input 806. Assuming that the drawing start time is T [0], this value needs to satisfy the time range Ts ≦ T [0] <Te. Also, a time index value (time slice width) 702
Is the time scale ΔT6 which is the drawing width,
0 is defined as a multiple of Δt.

【0053】描画開始時刻,描画幅を定義したら、通信
パケット、および通過経路を描画する807。トラフィ
ック・インディケータ5を計算して描画808、最後に
探索に失敗した数、および探索済みの通信パケット数を
報告して809、全体の処理を終わる810。
After the drawing start time and the drawing width are defined, a communication packet and a passage route are drawn 807. The traffic indicator 5 is calculated and drawn 808, and finally the number of search failures and the number of searched communication packets are reported 809, and the whole process ends 810.

【0054】図9は、パケットキューの作成803の方
法について、流れを示した図である。
FIG. 9 is a diagram showing a flow of the method 803 of creating a packet queue.

【0055】モニタリングレコードが入力される間90
1,ルータ番号を判定し902,OUTキューに登録す
べきレコードか903,PASSキューに登録すべきレ
コードか905,INキューに登録すべきレコードか9
07を判定し、それぞれ、OUTキュー904,PAS
Sキュー906,INキュー908に時刻順に登録す
る。
While a monitoring record is being input 90
1, Determine router number 902, Record to be registered in OUT queue 903, Record to be registered in PASS queue 905, Record to be registered in IN queue 9
07, the OUT queue 904 and the PAS, respectively.
The information is registered in the S queue 906 and the IN queue 908 in order of time.

【0056】図10は、タイムインデックステーブルの
作成方法804を表す流れ図である。
FIG. 10 is a flowchart showing a method 804 of creating a time index table.

【0057】タイムインデックス幅(タイムスライス幅
702)Δt,タイムインデックス始点時刻T0,タイ
ムインデックス総数MAXを指定する1001。パケッ
トキューのルータID703,704,705、レコー
ドタイプOUT706,PASS707,IN708の
キューに登録されているレコードについて1002、各キュ
ーをそれぞれ処理する。先頭レコードのアドレスをcurr
ent_pとしておく1003。current_p は現在扱ってい
るレコードを指すポインタとする。
A time index width (time slice width 702) Δt, a time index start point time T0, and a time index total number MAX 1001 are designated. The routers 703, 704, and 705 of the packet queue, the records registered in the queues of the record types OUT706, PASS707, and IN708 are 1002, and each queue is processed. Curr the address of the first record
1003 is set as ent_p. current_p is a pointer to the record currently being handled.

【0058】Ti=T0+i*Δtとするとき100
5、タイムインデックステーブルのTiに相当するレコ
ードをキューの先頭から検索する。current_p の時刻が
Tiより小さい場合1006は、T[i−1]以前に関
するレコードであるので、current_pを次のレコードに
移動する1012。current_pの時刻がTiと等しいま
たは大きい場合1007は、T[i+1]以降に関する
レコードであるので、カレントポインタはそのままでI
をインクリメントして1013、次の処理を行う。curr
ent_p の時刻がTiと等しいまたは大きく、かつT[i
−1]より小さい場合1008は、T[i]に関するレ
コードである。キューの先頭から検索したので、初めて
1008の条件を満たすレコードが前記ルータID,パ
ケットキューレコードタイプの、T[i]ポインタの指
すべきレコードである1009。カレントポインタとi
をインクリメントして1010、次の処理1020へ進
む。
When Ti = T0 + i * Δt, 100
5. Search for a record corresponding to Ti in the time index table from the head of the queue. If the time of current_p is smaller than Ti, 1006 is a record relating to T [i-1] or earlier, so current_p is moved to the next record 1012. If the time of current_p is equal to or greater than Ti, 1007 is a record relating to T [i + 1] or later, so that the current pointer remains unchanged as I
Is incremented 1013, and the next processing is performed. curr
The time of ent_p is equal to or greater than Ti, and T [i
1001 is a record related to T [i]. The record that satisfies the condition 1008 for the first time since the search was performed from the head of the queue is the record to be pointed to by the T [i] pointer of the router ID and the packet queue record type 1009. Current pointer and i
Is incremented by 1010, and the process proceeds to the next process 1020.

【0059】iがMAXを超えたら1004、前記ルー
タID,パケットキューレコードタイプについての処理
を終わる1011。
If i exceeds MAX, 1004, the processing for the router ID and packet queue record type ends 1011.

【0060】以上同様の処理を、全ルータID,全パケ
ットキューレコードタイプについて1002処理する。
The same processing is performed 1002 for all router IDs and all packet queue record types.

【0061】図11は通信パケットの通過経路探索のフ
ローチャートである。
FIG. 11 is a flowchart of a search for a passage of a communication packet.

【0062】図6のパケットキューレコードにおける通
信パケットの次の通過ルータレコードへのポインタ60
4、および図7パケットキュー700におけるパケット
リンク604,723のリンクを探索するためのフロー
である。
A pointer 60 to the next passing router record of the communication packet in the packet queue record of FIG.
4 and FIG. 7 are flowcharts for searching for links of the packet links 604 and 723 in the packet queue 700.

【0063】探索すべき範囲のタイムインデックスTs
(開始点),Te(終了点)を指定して、探索を開始す
る805。ルータIDの0番から探索する1101。前
記ルータIDのOUTキューのタイムインデックスTs
に存在するレコードから探索する1102。OUTキュ
ーレコードに対して、前記通信パケットが次に通過すべ
きルータIDのPASSキューレコード、またはINキ
ューレコードから通信パケットに対応するレコードを検
索して、パケットリンクを張る。通信始点プロセッサI
D,通信終点プロセッサIDから一意に通過経路が特定
できるので、次に通過すべきルータIDが、中継点にな
るか、終点すなわちプロセッサユニットへの入力となる
かは、通信始点プロセッサID,通信終点プロセッサI
D,前記ルータID,ルータ内パスIDから一意に算出
できる。
Time index Ts of range to be searched
The search is started 805 by specifying (start point) and Te (end point). 1101 to search from the router ID number 0. The time index Ts of the OUT queue of the router ID
1102 to search from the records existing in. For the OUT queue record, a record corresponding to the communication packet is searched from the PASS queue record or the IN queue record of the router ID that the communication packet should pass next, and a packet link is established. Communication start point processor I
D, since the passage route can be uniquely specified from the communication end processor ID, whether the router ID to be passed next becomes a relay point or an end point, that is, an input to the processor unit, depends on the communication start processor ID and the communication end point. Processor I
D, the router ID, and the intra-router ID can be uniquely calculated.

【0064】以下、図11に従って、探索処理の流れを
説明する。
Hereinafter, the flow of the search process will be described with reference to FIG.

【0065】カレントポインタをcurrent としておく。
また、通信パケットの通過経路をたどるためのポインタ
をpath_pとする1104。探索範囲内において110
3、path_p=current とし1126、カレントポインタ
の指すレコードの通信パケットの通信始点プロセッサI
D(Sender)605,通信終点プロセッサID(Receiv
er)606,ルータID(Router)609,ルータ内経
路ID(path)610の四つの情報から、次に前記通信
パケットが通過すべきルータID(next_Router)、お
よび中継点か、終点かのタイプ(next_Type)を計算す
る1105。next_Router,next_Typeに相当するパケッ
トキュー700の中から、path_pレコードの通信パケッ
ト先頭部通過時刻611より大きく、かつ、通信始点プ
ロセッサID(Sender)605,通信終点プロセッサID
(Receiver)606,通信種類607,通信データ長60
8の四つの情報すべてが一致するレコード、あるいは6
20形式のパケットキューレコードの場合、通信パケッ
トID625の一致するレコードを探索する1106。
The current pointer is set to current.
In addition, a pointer for following a passage route of the communication packet is set to path_p 1104. 110 in search range
3, path_p = current, 1126, the communication start point processor I of the communication packet of the record indicated by the current pointer
D (Sender) 605, communication end point processor ID (Receiv
er) 606, router ID (Router) 609, and router ID (path) 610, from the four pieces of information, the router ID (next_Router) that the communication packet should pass next, and the type of relay point or end point ( next_Type) 1105. out of the packet queue 700 corresponding to next_Router, next_Type, which is larger than the communication packet head passage time 611 of the path_p record, the communication start processor ID (Sender) 605, and the communication end processor ID
(Receiver) 606, communication type 607, communication data length 60
A record in which all four pieces of information 8 match, or 6
In the case of the packet queue record of the 20 type, a record matching the communication packet ID 625 is searched 1106.

【0066】1106の条件を満たすレコードが存在す
る場合1122は、条件を満たすレコードのうち、通信
パケット先頭部通過時刻611の一番小さいレコード
を、前記通信パケットの2番目の経路上のデータとみな
して、path_pのパケットリンクに接続する1107。
If there is a record satisfying the condition of 1106, the record 1122 considers the record with the smallest passage time 611 of the head of the communication packet among the records satisfying the condition as the data on the second route of the communication packet. Then, it connects 1107 to the packet link of path_p.

【0067】通信パケットID625の一致する場合
は、これを前記通信パケットの2番目の経路上のデータ
とみなして、path_pのパケットリンクに接続する110
7。path_pのポインタを移動して1108、path_pの持
つ通信終点プロセッサID606とルータID609が一致
するまで、1105,1106,1107,1108の
処理を繰り返す1109,1126。
If the communication packet ID 625 matches, the packet is regarded as data on the second path of the communication packet, and is connected to the packet link of path_p 110.
7. The pointer of path_p is moved 1108, and the processing of 1105, 1106, 1107, 1108 is repeated 1109, 1126 until the communication end point processor ID 606 of path_p matches the router ID 609.

【0068】1106の条件を満たすレコードが存在し
ない場合1123は、フェイルカウンタをインクリメン
トして1110、パケットに関する探索を終了する11
11。探索終了時に、終了点であってもなくても、path
_pの先に接続するパケットリンクはnilとしておく1
111。レコードを指すカレントポインタcurrent をO
UTキューの次のレコードに移動して1112、次の通
信パケットについて、同様の処理を行う1125。
If there is no record that satisfies the condition of 1106, in step 1123, the fail counter is incremented by 1110, and the search for the packet is terminated.
11. At the end of the search, whether it is an end point or not, path
Packet link connected to the end of _p is set to nil 1
111. Set the current pointer current pointing to the record to O
The next record in the UT queue is moved to 1112, and the same processing is performed for the next communication packet 1125.

【0069】現在扱っているOUTキューの探索終了点
Teに達したら1103、探索開始点Tsにおけるタイ
ムスライスのうち、PASSキューのレコードの中で未
探索のものが存在したら、PASSレコードを先頭とし
て、この通信パケットの前記レコードから後の通過経路
に従って、パケットリンク604を探索する1113。
When the search end point Te of the currently handled OUT queue is reached 1103, and among the time slices at the search start point Ts, if there is an unsearched one among the records of the PASS queue, the PASS record is set at the head. A search is made for a packet link 604 from the record of the communication packet according to a later passing route 1113.

【0070】以上の通信パケットの通過経路探索処理
を、すべてのルータIDについて行う1114,111
5。
The above-described process of searching for a passage of a communication packet is performed for all router IDs.
5.

【0071】図12は通信パケットの発生頻度統計グラ
フを示した図である。
FIG. 12 is a diagram showing a statistical graph of the occurrence frequency of communication packets.

【0072】図7のパケットキューおよびタイムインデ
ックステーブルを使用すれば、図1のプロセッサ間通信
パケット経路追跡図以外にも、図12のような統計グラ
フを描画することも簡単である。
If the packet queue and the time index table of FIG. 7 are used, it is easy to draw a statistical graph as shown in FIG. 12 in addition to the tracking diagram of the inter-processor communication packet path shown in FIG.

【0073】1200は通信パケット発生頻度統計グラ
フを描画するウィンドウである。
Reference numeral 1200 denotes a window for drawing a communication packet occurrence frequency statistical graph.

【0074】1201,1202,1203は、それぞ
れルータR(0,0)における入力,ルータR(1,
0)における入力,ルータR(0,0)における出力を
観測したときの、通信パケットの発生頻度を表す棒グラ
フである。横軸は通信パケットの長さ、縦軸は発生頻度
を表す。凡例1205に示す通信パケットの種類によっ
て、1211,1212,1213のように発生頻度を
積み上げる。通信パケットの種類1205は、優先度の
高いpreference通信,通常通信ordinary,1プロセッサ
から全プロセッサへ通信するブロードキャスト通信Broa
dcast ,1プロセッサから1プロセッサへのPoint-to-P
oint通信に種類分けする。通信優先度に関してはprefer
enceとordinaryの色別けを行い、通信先の数を表すBroa
dcastとPoint-to-Point の区別は矩形の塗りつぶしパタ
ーンを斜線か全塗りつぶしで区別する。この色と塗りつ
ぶしパターン組み合わせで通信の種類を表現する。12
04は観測パケットの描画メニューであり、入力のモニ
タリングin,出力のモニタリングout ,クロスバの乗り
換えpassの描画を指定する。1207はタイムスライダ
ーであり観測時間を設定する。1206はスナップショ
ット時間の確認のための窓である。1201,120
2,1203の通信パケット発生頻度統計グラフを描画
するためには、図7のパケットキュー700の各タイム
スライス702内に含まれるパケットキューレコード6
00の統計情報を計算すればよい。
Reference numerals 1201, 1202, and 1203 denote inputs at the router R (0, 0) and router R (1, 0), respectively.
7 is a bar graph showing the frequency of occurrence of communication packets when observing an input at 0) and an output at router R (0,0). The horizontal axis represents the length of the communication packet, and the vertical axis represents the frequency of occurrence. Depending on the type of communication packet shown in the legend 1205, the occurrence frequency is accumulated as indicated by 1211, 1212 and 1213. The communication packet type 1205 includes a preference communication having a high priority, a normal communication ordinary, and a broadcast communication Broa communicating from one processor to all processors.
dcast, Point-to-P from one processor to one
Classify into oint communication. Prefer for communication priority
Broa that indicates the number of communication destinations by color-coding ence and ordinary
The distinction between dcast and point-to-point is to distinguish a rectangular fill pattern by diagonal or full fill. The type of communication is expressed by the combination of the color and the paint pattern. 12
Reference numeral 04 denotes an observation packet drawing menu, which designates input monitoring in, output monitoring out, and crossbar transfer pass drawing. A time slider 1207 sets an observation time. Reference numeral 1206 denotes a window for confirming the snapshot time. 1201,120
In order to draw a communication packet occurrence frequency statistical graph of 2,1203, the packet queue record 6 included in each time slice 702 of the packet queue 700 of FIG.
00 may be calculated.

【0075】図7のパケットキュー700,タイムイン
デックステーブル730は、図1,図12といった複数
の解析情報を提供するために有効なデータ形式である。
The packet queue 700 and the time index table 730 shown in FIG. 7 have a data format effective for providing a plurality of pieces of analysis information as shown in FIGS.

【0076】[0076]

【発明の効果】本発明では、プロセッサ間通信パケット
をプロセッサ間通信ネットワーク上の各経路ノード上で
監視した情報を、通信パケットの種類,長さで色別けし
た矩形で表し、経路ノードと時間を軸としたタイムチャ
ート上に配置することにより、プロセッサ間通信ネット
ワーク上のトラフィックを正確に把握できる。
According to the present invention, information obtained by monitoring the inter-processor communication packet on each path node on the inter-processor communication network is represented by a rectangle colored by the type and length of the communication packet, and the path node and time are represented. By arranging them on the axis time chart, the traffic on the inter-processor communication network can be accurately grasped.

【0077】本発明の通信パケットの通過経路探索方法
によって、通信パケットの識別子がある場合はもちろん
のこと、通信パケットの識別子がない場合であっても、
容易に通信パケットのネットワーク上の通過状況を検出
することができ、さらに、経路ノードと時間を軸とした
タイムチャート上に通信パケットの矩形を描画するとき
に、同一通信パケットに関する情報を直線で結ぶことに
より、通信パケットの挙動が正確に把握できる。
According to the communication packet passing route search method of the present invention, not only when there is a communication packet identifier but also when there is no communication packet identifier,
It is easy to detect the passage status of communication packets on the network, and when drawing a rectangle of a communication packet on a time chart based on a route node and time, information on the same communication packet is connected by a straight line. Thus, the behavior of the communication packet can be accurately grasped.

【0078】本発明のパケットキューとタイムインデッ
クステーブル形式を用いることによって、任意の時刻,
任意の経路ノードに対して、通信パケットが送信元プロ
セッサユニットを出発した状態か,通信パケットが受信
先プロセッサユニットに到達した状態か、の通信状態,
通信パケットの種類,通信パケットの長さ,通信パケッ
トの通過時間などの描画情報を簡単に導き出すことがで
きる。
By using the packet queue and the time index table format of the present invention, an arbitrary time,
For a given path node, the communication state of whether the communication packet has departed from the source processor unit or whether the communication packet has reached the destination processor unit,
Drawing information such as the type of communication packet, the length of the communication packet, and the passage time of the communication packet can be easily derived.

【図面の簡単な説明】[Brief description of the drawings]

【図1】プロセッサ間通信パケット経路追跡の説明図。FIG. 1 is an explanatory diagram of inter-processor communication packet path tracking.

【図2】全体構成のブロック図。FIG. 2 is a block diagram of the overall configuration.

【図3】ルータおよびプロセッサユニットを表すブロッ
ク図。
FIG. 3 is a block diagram showing a router and a processor unit.

【図4】プロセッサ間通信パケット形式の説明図。FIG. 4 is an explanatory diagram of an inter-processor communication packet format.

【図5】モニタリング・レコード形式の説明図。FIG. 5 is an explanatory diagram of a monitoring record format.

【図6】パケットキューレコード形式の説明図。FIG. 6 is an explanatory diagram of a packet queue record format.

【図7】パケットキューとタイムインデックステーブル
の説明図。
FIG. 7 is an explanatory diagram of a packet queue and a time index table.

【図8】プロセッサ間通信パケット経路追跡における処
理全体のフローチャート。
FIG. 8 is a flowchart of the entire processing in tracking a communication packet path between processors.

【図9】パケットキューの作成方法の説明図。FIG. 9 is an explanatory diagram of a method of creating a packet queue.

【図10】タイムインデックステーブルの作成方法の説
明図。
FIG. 10 is an explanatory diagram of a method of creating a time index table.

【図11】通信パケット通過経路探索のフローチャー
ト。
FIG. 11 is a flowchart of a communication packet passage route search.

【図12】通信パケット発生頻度統計グラフ。FIG. 12 is a communication packet occurrence frequency statistical graph.

【符号の説明】[Explanation of symbols]

1…パケット経路追跡図、3,4…ルータ番号、5…ト
ラフィックインディケータ、8…パケットの種類,長さ
を表す凡例、10,11…パケットを表す矩形、21…
パケットの通過経路を表す直線、31…時間軸。
1 ... Packet path tracking diagram, 3,4 ... Router number, 5 ... Traffic indicator, 8 ... Legend indicating type and length of packet 10, 11, ... Rectangle indicating packet, 21 ...
A straight line representing a packet passage path, 31... A time axis.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】複数のプロセッサを持つ並列計算機におい
て、前記プロセッサ間通信メッセージが、複数の任意個
の経路ノードを含む、一意に決定する経路を通過し、発
信元と受信先のノード名,メッセージ長,メッセージの
優先順位等のメッセージ種類の情報、および通信データ
を持ち、前記プロセッサ間通信メッセージを監視する手
段と、共通の時刻刻印手段を各経路ノードに備え、前記
プロセッサ間通信メッセージに関するプロセッサ間通信
メッセージの通過した経路ノード番号,発信元と受信先
のノード名,メッセージ長,メッセージの優先順位等の
メッセージ種類,前記経路ノードの通過時刻,前記経路
ノードにおける駐在時間を監視するとき、監視した通信
メッセージ情報を蓄積し、解析し、解析結果を表示する
手段を持ち、その通信メッセージ情報解析結果を経路ノ
ード番号と時刻を軸とするタイムチャートグラフに、通
信メッセージ情報を、通信メッセージが経路ノードに進
入した時刻を始点,経路ノードに駐在している時間を
幅,通信パケットの種類及び長さを色で表現した矩形と
して表し、タイムチャートグラフ上の、経路ノード番号
と通信メッセージの通過時刻の対応する場所に配置し、
通信メッセージ情報を表す矩形を結線することによって
通信メッセージの通過経路を表現することを特徴とする
並列計算機の内部ネットワーク挙動監視システム。
1. In a parallel computer having a plurality of processors, the inter-processor communication message passes through a uniquely determined route including a plurality of arbitrary route nodes, and a node name of a source and a destination and a message A means for monitoring the inter-processor communication message and a common time stamping means for each path node, having information on message types such as length, message priority, etc., and a common time stamping means; When monitoring the route node number through which the communication message passed, the source and destination node names, the message length, the message type such as the priority of the message, the passage time of the route node, and the resident time at the route node, the monitoring was performed. It has means to accumulate and analyze communication message information and display the analysis result. The analysis result of the communication message is shown in a time chart graph with the path node number and time as axes, and the communication message information is displayed at the start point of the time when the communication message entered the path node, the width of time spent in the path node, and the communication packet. Is represented as a rectangle expressing the type and length of the color, and placed on the time chart graph at the location corresponding to the path node number and the passage time of the communication message,
An internal network behavior monitoring system for a parallel computer, characterized by expressing a passage path of a communication message by connecting rectangles representing communication message information.
【請求項2】請求項1において、単位時間内における並
列計算機システム全体、あるいは任意の選択した経路ノ
ードについての通信量の統計を、タイムチャートグラフ
下部に表示するプロセッサ間通信メッセージ情報解析結
果の表現方法を備えた並列計算機の内部ネットワーク挙
動監視システム。
2. The representation of the inter-processor communication message information analysis result in which the statistics of the traffic of the entire parallel computer system or an arbitrary selected path node within a unit time are displayed below the time chart graph. Internal network behavior monitoring system of parallel computer with method.
【請求項3】請求項1において、その通信メッセージの
通過経路履歴探索方法は、あらかじめ通信パケットを監
視して得られた全通信メッセージ情報に対して、前記通
信パケットが、発信元ノード,受信先ノード,中継ノー
ドのいずれかを通過したかを判別し、それぞれ、各通信
経路ノード番号別に作成する、発信元ノード,受信先ノ
ード,中継ノードに対応した通信パケット情報キュー
に、前記通信経路ノード番号,発信元ノード名,受信先
ノード名,通信メッセージ長,メッセージの優先順位等
のメッセージ種類,前記経路ノードにメッセージが進入
した時刻,前記経路ノードにメッセージが駐在した時間
の情報を記載したレコードを時刻順に登録し、あらかじ
め、作成しておいた通信パケット情報キューについて、
発信元ノードに対応する通信パケット情報キューの先頭
からレコードを取り出し、あらかじめ登録しておいた、
通信パケットの通過すべき経路に従って、対応する中継
ノード通信パケット情報キュー、および、受信先ノード
通信パケット情報キューの未探索レコードの中から、発
信元ノード名,受信先ノード名,通信メッセージ長,メ
ッセージの優先順位等のメッセージ種類に関するすべて
の情報が一致し、かつ、メッセージ進入時刻が新しく、
かつ最も近いレコードを選択して、任意の通信パケット
それぞれについて通過した通信経路ノード履歴を探索す
ることを特徴とする並列計算機の内部ネットワーク挙動
監視システム。
3. The method according to claim 1, wherein said communication packet is transmitted from a source node and a destination to all communication message information obtained by monitoring a communication packet in advance. The communication path node number is determined in the communication packet information queue corresponding to the source node, the destination node, and the relay node, which is created for each communication path node number. A record that describes information such as a message type such as a source node name, a destination node name, a communication message length, a message priority, a time at which the message entered the route node, and a time at which the message resided at the route node. Registered in chronological order, and for the communication packet information queue created in advance,
The record is taken out from the head of the communication packet information queue corresponding to the source node and registered in advance,
According to the route through which the communication packet should pass, from among the unsearched records of the corresponding relay node communication packet information queue and the receiving node communication packet information queue, the source node name, destination node name, communication message length, message All information about the message type, such as priority, matches and the message entry time is new,
An internal network behavior monitoring system for a parallel computer, wherein a closest record is selected, and a history of communication path nodes passed for each communication packet is searched.
【請求項4】請求項3において、単位時間内における並
列計算機システム全体、あるいは任意の選択した経路ノ
ードについての通信量の統計を、タイムチャートグラフ
下部に表示することを特徴とした、プロセッサ間通信メ
ッセージ情報解析結果の表現方法を備えた並列計算機の
内部ネットワーク挙動監視システム。
4. The communication between processors according to claim 3, wherein statistics of the communication amount of the entire parallel computer system within a unit time or an arbitrary selected path node are displayed at a lower part of a time chart graph. An internal network behavior monitoring system for a parallel computer equipped with a method for expressing message information analysis results.
【請求項5】請求項1において、プロセッサ間通信メッ
セージがユニークな通信メッセージ識別番号を持つと
き、監視した通信メッセージ情報を蓄積し、解析し、解
析結果を表示する手段を持ち、その通信メッセージ情報
解析結果を経路ノード番号と時刻を軸とするタイムチャ
ートグラフに、通信メッセージ情報を、通信メッセージ
が経路ノードに進入した時刻を始点,経路ノードに駐在
している時間を幅,通信パケットの種類及び長さを色で
表現した矩形として表し、タイムチャートグラフ上の、
経路ノード番号と通信メッセージの通過時刻の対応する
場所に配置し、通信メッセージ情報を表す矩形を結線す
ることによって通信メッセージの通過経路を表現するこ
とを特徴とした、プロセッサ間通信メッセージ情報解析
結果の表現方法を備えた並列計算機の内部ネットワーク
挙動監視システム。
5. The communication message information according to claim 1, further comprising means for storing and analyzing the monitored communication message information when the inter-processor communication message has a unique communication message identification number, and displaying the analysis result. The analysis result is shown in a time chart graph with the path node number and the time as axes, and the communication message information is provided. The starting point is the time when the communication message enters the path node, the time spent in the path node is the width, the type of communication packet and The length is represented as a rectangle that is represented by color, and on the time chart graph,
It is arranged at a location corresponding to the path node number and the passage time of the communication message, and expresses the passage path of the communication message by connecting rectangles representing the communication message information. An internal network behavior monitoring system for parallel computers equipped with an expression method.
【請求項6】請求項5において、単位時間内における並
列計算機システム全体、あるいは任意の選択した経路ノ
ードについての通信量の統計を、タイムチャートグラフ
下部に表示する並列計算機の内部ネットワーク挙動監視
システム。
6. An internal network behavior monitoring system for a parallel computer according to claim 5, wherein statistics of the traffic of the entire parallel computer system within a unit time or of an arbitrary selected path node are displayed at the bottom of a time chart graph.
【請求項7】請求項5において、その通信メッセージの
通過経路履歴探索方法は、あらかじめ通信パケットを監
視して得られた全通信メッセージ情報に対して、前記通
信パケットが、発信元ノード,受信先ノード,中継ノー
ドのいずれかを通過したかを判別し、それぞれ、各通信
経路ノード番号別に作成する、発信元ノード,受信先ノ
ード,中継ノードに対応した通信パケット情報キュー
に、前記通信経路ノード番号,通信メッセージ識別番
号,発信元ノード名,受信先ノード名,通信メッセージ
長,メッセージの優先順位等のメッセージ種類,前記経
路ノードにメッセージが進入した時刻,前記経路ノード
にメッセージが駐在した時間の情報を記載したレコード
を時刻順に登録し、あらかじめ、作成しておいた通信パ
ケット情報キューについて、発信元ノードに対応する通
信パケット情報キューの先頭からレコードを取り出し、
あらかじめ登録しておいた、通信パケットの通過すべき
経路に従って、対応する中継ノード通信パケット情報キ
ュー、および、受信先ノード通信パケット情報キューの
未探索レコードの中から、通信メッセージ識別番号が一
致するレコードを選択して、任意の通信パケットそれぞ
れについて通過した通信経路ノード履歴を探索する並列
計算機の内部ネットワーク挙動監視システム。
7. The method according to claim 5, wherein said communication packet is transmitted from a source node and a destination to all communication message information obtained by monitoring communication packets in advance. The communication path node number is determined in a communication packet information queue corresponding to a source node, a destination node, and a relay node, which is created for each communication path node number, by judging whether the packet has passed through a node or a relay node. , Communication message identification number, source node name, destination node name, communication message length, message type such as message priority, time when the message entered the route node, time when the message resided at the route node Are registered in chronological order, and a record is created for the communication packet information queue created in advance. Te retrieves a record from the beginning of the communication packet data queue corresponding to the source node,
A record whose communication message identification number matches among the unregistered records of the corresponding relay node communication packet information queue and the reception node communication packet information queue registered in advance according to the path through which the communication packet should pass. And an internal network behavior monitoring system of the parallel computer for searching for a communication path node history that has passed for each communication packet.
【請求項8】請求項7において、単位時間内における並
列計算機システム全体、あるいは任意の選択した経路ノ
ードについての通信量の統計を、タイムチャートグラフ
下部に表示することを特徴とした、プロセッサ間通信メ
ッセージ情報解析結果の表現方法を備えた並列計算機の
内部ネットワーク挙動監視システム。
8. The processor-to-processor communication according to claim 7, wherein statistics of the communication amount of the entire parallel computer system or an arbitrary selected path node within a unit time are displayed at the bottom of the time chart graph. An internal network behavior monitoring system for a parallel computer equipped with a method for expressing message information analysis results.
JP8197288A 1996-07-26 1996-07-26 System for monitoring action of network inside parallel computer Pending JPH1040224A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8197288A JPH1040224A (en) 1996-07-26 1996-07-26 System for monitoring action of network inside parallel computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8197288A JPH1040224A (en) 1996-07-26 1996-07-26 System for monitoring action of network inside parallel computer

Publications (1)

Publication Number Publication Date
JPH1040224A true JPH1040224A (en) 1998-02-13

Family

ID=16371977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8197288A Pending JPH1040224A (en) 1996-07-26 1996-07-26 System for monitoring action of network inside parallel computer

Country Status (1)

Country Link
JP (1) JPH1040224A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009529722A (en) * 2006-03-09 2009-08-20 エイアールエム リミテッド Apparatus, method and computer program product for generating tracking data
US9740541B2 (en) 2012-10-01 2017-08-22 Fujitsu Limited Information processing apparatus and method of collecting performance analysis data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009529722A (en) * 2006-03-09 2009-08-20 エイアールエム リミテッド Apparatus, method and computer program product for generating tracking data
US8468394B2 (en) 2006-03-09 2013-06-18 Arm Limited Method of tracing selected activities within a data processing system by tagging selected items and tracing the tagged items
US9740541B2 (en) 2012-10-01 2017-08-22 Fujitsu Limited Information processing apparatus and method of collecting performance analysis data

Similar Documents

Publication Publication Date Title
Mansouri-Samani et al. Monitoring distributed systems
US6526044B1 (en) Real-time analysis through capture buffer with real-time historical data correlation
JP5027301B2 (en) Information collection method in computer system, management computer using the method, and computer system
CN109388537B (en) Operation information tracking method and device and computer readable storage medium
CN103081407B (en) Fail analysis device, trouble analysis system and failure analysis methods
JP6085550B2 (en) Log analysis apparatus and method
US20050216241A1 (en) Method and apparatus for gathering statistical measures
US11323463B2 (en) Generating data structures representing relationships among entities of a high-scale network infrastructure
CN109359007B (en) Method and system for processing error log, electronic device and storage medium
EP1192546A1 (en) Computer program profiler
CN101989931A (en) Operation alarm processing method and device
JP2014153721A (en) Log visualization device and method and program
CN115022153B (en) Fault root cause analysis method, device, equipment and storage medium
CN110730100B (en) Alarm information processing method and device and server
CN112636942B (en) Method and device for monitoring service host node
CN101277218B (en) Dynamic analysis system and method for network alarm
CN111343029A (en) Monitoring platform and method based on data forwarding node topology monitoring
US11349730B2 (en) Operation device and operation method
CN111970151A (en) Flow fault positioning method and system for virtual and container network
KR102473637B1 (en) Apparatus and method for managing trouble using big data of 5G distributed cloud system
CN110071843A (en) A kind of Fault Locating Method and device based on flow path analysis
CN116260738B (en) Equipment monitoring method and related equipment
JPH1040224A (en) System for monitoring action of network inside parallel computer
CN117370053A (en) Information system service operation-oriented panoramic monitoring method and system
CN108055152A (en) Communication network information system method for detecting abnormality based on Distributed Services daily record