JP4978504B2 - Information processing apparatus, communication information collecting method, and program - Google Patents

Information processing apparatus, communication information collecting method, and program Download PDF

Info

Publication number
JP4978504B2
JP4978504B2 JP2008037074A JP2008037074A JP4978504B2 JP 4978504 B2 JP4978504 B2 JP 4978504B2 JP 2008037074 A JP2008037074 A JP 2008037074A JP 2008037074 A JP2008037074 A JP 2008037074A JP 4978504 B2 JP4978504 B2 JP 4978504B2
Authority
JP
Japan
Prior art keywords
communication
information
waiting
time
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008037074A
Other languages
Japanese (ja)
Other versions
JP2009199121A (en
Inventor
武 早坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008037074A priority Critical patent/JP4978504B2/en
Publication of JP2009199121A publication Critical patent/JP2009199121A/en
Application granted granted Critical
Publication of JP4978504B2 publication Critical patent/JP4978504B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、情報処理装置、通信情報採取方法、及び、プログラムに関し、更に詳しくは、複数プロセス間で通信を行い処理を実行する情報処理装置、並びに、そのような情報処理装置における通信情報採取方法及びプログラムに関する。   The present invention relates to an information processing device, a communication information collecting method, and a program, and more specifically, an information processing device that communicates between a plurality of processes to execute processing, and a communication information collecting method in such an information processing device. And the program.

複数のプロセスから構成されるメッセージパッシング型分散並列プログラムがある。メッセージパッシング型分散並列プログラムの実行において、各プロセスの処理量が均一ではないと(インバランスが発生していると)、後続のプロセス間通信において通信待合わせが発生し、プロセス間通信所要時間が増大する。これにより、プログラム全体の実行性能が低下する。プログラムの実行性能チューニングのために、インバランス発生箇所を特定し、改善する手法が採られている。インバランスの発生は、プロセス間所要時間が増大している箇所を検出することで検出可能である。   There is a message passing type distributed parallel program composed of a plurality of processes. In message-passing distributed parallel program execution, if the amount of processing of each process is not uniform (if imbalance occurs), communication waiting occurs in subsequent inter-process communication, and the time required for inter-process communication Increase. As a result, the execution performance of the entire program decreases. In order to tune the execution performance of the program, a method for identifying and improving the imbalance occurrence point is employed. The occurrence of imbalance can be detected by detecting a place where the required time between processes has increased.

従来は、各プロセスの処理量が不均一となっている箇所を検出するために、プロセス間通信に関する情報を採取・保存し、プログラム実行終了後にその情報を解析している。すなわち、プログラムの実行開始時から終了まで、分散並列プログラムを構成する全てのプロセスについて、全てのプロセス間通信イベント情報(通信相手プロセス、通信データサイズ、通信所要時間など)を採取し、その情報をファイルに保存し、解析している。採取したプロセス間通信イベント情報の解析では、専用のツールを利用し、例えば、縦軸をプロセス、横軸を時間として、採取したプロセス間通信情報をグラフィカルに表示させ、送信側プロセスと受信側プロセスの対応状況、各プロセス間通信に要した時間等を目視により確認し、通信時間が長い箇所を特定している。   Conventionally, in order to detect a portion where the processing amount of each process is not uniform, information related to inter-process communication is collected and stored, and the information is analyzed after the program execution is completed. That is, for all processes that make up a distributed parallel program from the start to the end of program execution, collect all interprocess communication event information (communication partner process, communication data size, required communication time, etc.) Save to file and analyze. For analysis of collected inter-process communication event information, a dedicated tool is used.For example, the collected inter-process communication information is displayed graphically with the vertical axis as the process and the horizontal axis as the time, and the sending process and receiving process. The correspondence situation, the time required for each inter-process communication, etc. are visually confirmed, and the place where the communication time is long is specified.

ここで、メッセージ交換型通信システムにて、通信待ち合わせを行う技術が、特許文献1に記載されている。特許文献1では、プロセス間での通信の発生、特に通信待合せの発生を監視し、その情報を採取する。次に通信待ち合わせが発生したときには、以前に発生した通信待ち合わせの状態を参照し、適切な待ち合わせ方式、すなわちビジーウェイト方式又はサスペンド方式の何れかを選択する。特許文献1では、このようにすることで、通信性能の低下を抑えつつ、通信待ち合わせ処理に必要なCPU資源の浪費を回避することができるとしている。   Here, a technique for performing communication waiting in a message exchange type communication system is described in Patent Document 1. In Patent Document 1, the occurrence of communication between processes, particularly the occurrence of communication waiting is monitored, and the information is collected. Next, when a communication waiting occurs, the state of the communication waiting previously generated is referred to, and an appropriate waiting method, that is, a busy wait method or a suspend method is selected. According to Patent Document 1, it is possible to avoid waste of CPU resources necessary for communication waiting processing while suppressing deterioration in communication performance in this way.

特開2001−117787号公報JP 2001-117787 A

上記した、プロセス間通信に関する情報を採取・保存し、プログラム実行終了後にその情報を解析する手法では、実行プロセス数が少ない場合や、実行が短時間で終了するプログラムでは、特に問題は発生しない。しかし、HPC(High Performance Computing)分野のアプリケーションプログラム、特に大規模科学技術計算プログラムなどでは、プロセス数が多く、また、プログラムの実行が長時間にわたり、発生するプロセス間通信の数が膨大となる。このため、収集する情報が膨大となり、通信情報ファイルのサイズが巨大になることで、ファイルアクセスのコストが増大するという問題が発生する。また、解析を行う際に、プロセス間通信の発生状況を示すグラフィカル表示も複雑となり、目視による確認が困難となるという問題も発生する。   The above-described technique for collecting and storing information related to inter-process communication and analyzing the information after the program execution ends causes no particular problem in a case where the number of execution processes is small or a program whose execution is completed in a short time. However, application programs in the field of HPC (High Performance Computing), particularly large-scale science and technology calculation programs, have a large number of processes, and the execution of the program takes a long time, resulting in an enormous number of interprocess communications. For this reason, there is a problem that the information to be collected becomes enormous and the size of the communication information file becomes enormous, which increases the cost of file access. In addition, when performing analysis, a graphical display showing the state of occurrence of inter-process communication is complicated, and there is a problem that visual confirmation becomes difficult.

また、通信性能情報の採取に際しては、実行性能重視の観点から、通信中に性能情報採取用のコードなど、実行時のオーバーヘッドとなり実行性能低下の要因となる処理を組み込むことはできない。このため、情報採取の方法としては、ユーザプログラムから情報採取用手続き呼び出し、情報採取用手続きから実際にプロセス間通信を行う手続きを呼び出すラッパー式が一般的に採られている。この場合は、プロセス間通信を行う手続きとは別に、情報採取用の手続きを用意する必要がある。   Also, when collecting communication performance information, from the viewpoint of emphasizing execution performance, it is not possible to incorporate processing that causes overhead during execution, such as performance information collection code, during communication, which causes a decrease in execution performance. For this reason, as a method for collecting information, a wrapper method is generally employed that calls a procedure for collecting information from a user program and calls a procedure that actually performs inter-process communication from the procedure for collecting information. In this case, it is necessary to prepare a procedure for collecting information separately from the procedure for performing inter-process communication.

特許文献1では、通信待合せ時間を採取している。しかし、特許文献1では、採取した通信待合せ時間は、通信待合せ方式の選択にのみ使用しており、これをファイルに書き出して、後の解析に用いることはしていない。従って、特許文献1に記載の技術では、プログラム実行後に、発生した通信待合せ時間の解析を行うことはできず、インバランス発生箇所を特定することはできない。   In Patent Document 1, communication waiting time is collected. However, in Patent Document 1, the collected communication queuing time is used only for selecting a communication queuing method, and this is not written to a file and used for later analysis. Therefore, in the technique described in Patent Document 1, it is not possible to analyze the communication waiting time that has occurred after executing the program, and it is not possible to specify an imbalance occurrence location.

本発明は、発生するプロセス間通信が膨大な数となるケースについても、各プロセスの処理量が不均一になっている箇所を特定するための情報を、選択的、かつ、自動的に採取し保存できる通信情報採取方法、情報処理装置、及び、プログラムを提供することを目的とする。   The present invention selectively and automatically collects information for specifying a place where the processing amount of each process is uneven even in a case where a large number of inter-process communication occurs. It is an object to provide a communication information collection method, an information processing apparatus, and a program that can be stored.

上記目的を達成するために、本発明の情報処理装置は、複数のプロセス間で通信を行い、処理を実行する情報処理装置であって、プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別手段と、前記判別手段によって前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録するプロセス間通信情報記録手段とを備えることを特徴とする。 To achieve the above object, the information processing apparatus of the present invention communicates between a plurality of processes, an information processing apparatus for executing processing, in the communication between processes, imbalance in the communication target process a determining means for communication awaiting registration by generating it is determined whether or not the generated, measures the communication waiting adjustment time until the communication waiting is terminated when the communication waiting alignment is determined to have occurred by the determining means and characterized by comprising a process communication information recording means for recording the communication waiting adjustment time measured in the inter-process communication information file.

本発明の通信情報採取方法は、複数のプロセス間で通信を行い、処理を実行する情報処理装置における通信情報採取方法であって、前記情報処理装置が、プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別ステップと、前記情報処理装置が、前記判別ステップで前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録する記録ステップとを有することを特徴とする。 The communication information collection method of the present invention is a communication information collection method in an information processing apparatus that performs communication between a plurality of processes and executes processing . a determining step of determining whether the communication waiting alignment due to the occurrence of imbalance occurs in the process, the information processing apparatus, said communication waiting when the communication waiting alignment is determined to have occurred in the determination step sensing the communication waiting adjustment time until the end of, and having a recording step of recording the communication waiting adjustment time measured in the inter-process communication information file.

本発明のプログラムは、複数のプロセス間で通信を行い、処理を実行するコンピュータに、通信情報を採取する処理を実行させるプログラムであって、前記コンピュータに、プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別処理と、前記判別処理で前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録する記録処理とを実行させることを特徴とする。 The program of the present invention is a program for performing communication between a plurality of processes and causing a computer that executes processing to execute processing for collecting communication information . a determining process for determining whether a communication waiting alignment due to the occurrence of imbalance occurs in the process, the communication waiting until the communication waiting is terminated when the said communication waiting alignment in the determination process is determined to have occurred the combined measures the time, characterized in that to execute a recording process of recording the communication waiting adjustment time measured in the inter-process communication information file.

本発明の通信情報採取方法、情報処理装置、及び、プログラムは、発生するプロセス間通信が膨大な数となるケースについても、各プロセスの処理量が不均一になっている箇所を特定するための情報を、選択的、かつ、自動的に採取し保存できる。   The communication information collection method, the information processing apparatus, and the program according to the present invention are for identifying a portion where the processing amount of each process is uneven even in a case where a large number of interprocess communications are generated. Information can be collected and stored selectively and automatically.

以下、図面を参照し、本発明の実施の形態を詳細に説明する。図1は、本発明の一実施形態の分散並列プログラムを示している。分散並列プログラム10は、複数のプロセス11−1〜11−nを有する。プロセス11−1〜11−nは、プロセス間通信処理部12−1〜12−nを有する。プロセス間通信処理部12−1〜12−nは、プロセス間通信情報処理部13−1〜13−nを有する。分散並列プログラム10は、サーバなどのコンピュータ(情報処理装置)に読み込まれ、コンピュータ上で各種の処理を実行する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a distributed parallel program according to an embodiment of the present invention. The distributed parallel program 10 has a plurality of processes 11-1 to 11-n. The processes 11-1 to 11-n include inter-process communication processing units 12-1 to 12-n. The inter-process communication processing units 12-1 to 12-n include inter-process communication information processing units 13-1 to 13-n. The distributed parallel program 10 is read into a computer (information processing apparatus) such as a server and executes various processes on the computer.

プロセス間通信処理部12は、プロセス間通信処理を行う。プロセス間通信情報処理部13は、プロセス間通信処理部12がプロセス間通信を実施した際に、各種通信情報を採取し処理する。プロセス間通信情報処理部13は、プロセス間で通信待ち合わせが発生したときにのみ、各種通信情報を採取する。プロセス間通信情報処理部13が採取する通信情報は、通信待ち時間と、データ転送時間とを含む。プロセス間通信情報ファイル14−1〜14−nは、プロセス11−1〜11−nについて採取されたプロセス間通信情報を格納するファイルであり、プロセスごとに存在する。   The inter-process communication processing unit 12 performs inter-process communication processing. The interprocess communication information processing unit 13 collects and processes various communication information when the interprocess communication processing unit 12 performs interprocess communication. The inter-process communication information processing unit 13 collects various pieces of communication information only when communication waiting occurs between processes. The communication information collected by the inter-process communication information processing unit 13 includes a communication waiting time and a data transfer time. The inter-process communication information files 14-1 to 14-n are files for storing inter-process communication information collected for the processes 11-1 to 11-n, and exist for each process.

図2に、動作手順を示す。分散並列プログラム10を構成する各プロセス11は、プロセス間通信処理部12により、プロセス間通信手続きを実行する。プロセス間通信処理部12は、通信対象のプロセス側で、通信開始の準備が整っているか否かを判定する(ステップS1)。通信対象プロセスで通信開始の準備が整っている場合は、プロセス間データ転送処理を実行し(ステップS2)、プロセス間通信手続きを終了する。このとき、プロセス間通信情報処理部13による通信情報の収集は行わない。   FIG. 2 shows an operation procedure. Each process 11 constituting the distributed parallel program 10 executes an interprocess communication procedure by an interprocess communication processing unit 12. The inter-process communication processing unit 12 determines whether or not the communication target process side is ready for communication start (step S1). If the communication target process is ready to start communication, inter-process data transfer processing is executed (step S2), and the inter-process communication procedure is terminated. At this time, communication information is not collected by the inter-process communication information processing unit 13.

プロセス間通信処理部12は、通信対象プロセス側で通信開始の準備が整っていないと判断したときは、通信待ち合わせのロジックに移行する。通信待ち合わせのロジックにて、プロセス間通信情報処理部13により、通信情報の採取を実施する。プロセス間通信情報処理部13は、通信待ち合わせロジックへの移行時に、通信待ち合わせ開始時刻を採取する(ステップS3)。プロセス間通信処理部12は、通信対象プロセス側で通信開始の準備が整っているか否かを再度確認し(ステップS4)、準備が整うまでステップS4を繰り返し実行して待機する。   When the inter-process communication processing unit 12 determines that the communication target process side is not ready for communication start, the inter-process communication processing unit 12 proceeds to communication waiting logic. Communication information is collected by the interprocess communication information processing unit 13 in the communication waiting logic. The inter-process communication information processing unit 13 collects a communication waiting start time when shifting to the communication waiting logic (step S3). The inter-process communication processing unit 12 confirms again whether or not the communication target process is ready to start communication (step S4), and repeatedly executes step S4 and waits until it is ready.

プロセス間通信処理部12が通信対象プロセスで通信開始の準備が整ったと判断すると、プロセス間通信情報処理部13は、プロセス間待ち合わせ終了時刻を採取する(ステップS5)。ステップ3で採取した時刻とステップS5で採取した時刻との時間差が、通信待ち合わせ時間となる。プロセス間通信処理部12は、プロセス間のデータ転送処理を実施する(ステップS6)。ステップS6のデータ転送処理は、ステップS2のデータ転送処理と同じ処理である。   When the inter-process communication processing unit 12 determines that the communication target process is ready for communication start, the inter-process communication information processing unit 13 collects the inter-process waiting end time (step S5). The time difference between the time collected in step 3 and the time collected in step S5 is the communication waiting time. The inter-process communication processing unit 12 performs data transfer processing between processes (step S6). The data transfer process in step S6 is the same process as the data transfer process in step S2.

データ転送処理の実施後、プロセス間通信情報処理部13は、プロセス間データ転送処理の終了時刻を採取する(ステップS7)。ステップS5で採取した時刻とステップS7で採取した時刻との時間差が、データ転送所要時間となる。プロセス間通信情報処理部13は、データサイズや通信相手プロセス情報などのその他の情報を採取する(ステップS8)。プロセス間通信情報処理部13は、通信待ち合わせ時間、データ転送所要時間、及び、ステップS8で取得したその他の情報を、プロセス間通信情報ファイル14に書き込む(ステップS9)。   After performing the data transfer process, the inter-process communication information processing unit 13 collects the end time of the inter-process data transfer process (step S7). The time difference between the time sampled in step S5 and the time sampled in step S7 is the data transfer required time. The inter-process communication information processing unit 13 collects other information such as data size and communication partner process information (step S8). The inter-process communication information processing unit 13 writes the communication waiting time, the required data transfer time, and other information acquired in step S8 in the inter-process communication information file 14 (step S9).

図3に、ラッパー方式で採取される情報と本実施形態で採取される情報とを模式的に示す。ラッパー方式では、ユーザプログラム51に通信情報採取用手続き52を設け、通信情報採取用手続き52が、通信手続き53の前後で情報採取処理54、55を行うことで、情報を採取する。このようにして採取された情報は、データ転送時間と通信待ち時間とを含む。   FIG. 3 schematically shows information collected by the wrapper method and information collected by the present embodiment. In the wrapper method, a communication information collection procedure 52 is provided in the user program 51, and the communication information collection procedure 52 performs information collection processing 54 and 55 before and after the communication procedure 53 to collect information. The information collected in this way includes data transfer time and communication waiting time.

ラッパー方式では、データ転送時間と通信待ち時間とを含む情報しか採取できないので、通信時間に占める通信待ち時間のみを選択的に採取することがでない。このため、通信待ちの発生は、通信時間全体から判断する必要がある。より詳細には、通信データサイズ、及び、プロセス間通信経路ごとに、あらかじめ、通信待ちが発生しない場合の理想的なデータ転送所要時間である基準時間を算出又は測定しておき、これと実際の通信所要時間とを比較して、所要時間が基準時間を上回るか否かで、通信待ちの発生を判断する必要がある。   In the wrapper method, only information including the data transfer time and the communication waiting time can be collected. Therefore, it is not possible to selectively collect only the communication waiting time occupying the communication time. For this reason, occurrence of communication waiting needs to be determined from the entire communication time. More specifically, for each communication data size and inter-process communication path, a reference time, which is an ideal data transfer required time when communication waiting does not occur, is calculated or measured in advance. It is necessary to determine the occurrence of waiting for communication based on whether the required time exceeds the reference time by comparing with the required communication time.

本実施形態では、通信処理を行う通信手続き中(プロセス間通信処理部12内)に、情報採取用コード(プロセス間通信情報処理部13)を組み込み、通信待ちの発生を契機として情報採取を実施する。本実施形態では、通信待ちが発生した通信のみを対象に情報を採取することができるため、全てのプロセスについて全てのプロセス間通信イベント情報を採取する場合に比して、採取した情報をファイルに書き出すコスト、及び、ファイルサイズを大幅に削減することができる。従って、発生するプロセス間通信が膨大な数となるケースについても、各プロセスの処理量が不均一になっている箇所を特定するための情報を、選択的、かつ、自動的に採取し保存できる。   In this embodiment, an information collection code (interprocess communication information processing unit 13) is incorporated into a communication procedure for performing communication processing (in the interprocess communication processing unit 12), and information collection is performed when a communication wait occurs. To do. In this embodiment, since it is possible to collect information only for communications for which waiting for communication has occurred, the collected information is stored in a file compared to collecting all interprocess communication event information for all processes. The writing cost and the file size can be greatly reduced. Therefore, even in cases where the number of inter-process communications that occur is enormous, it is possible to selectively and automatically collect and store information for identifying locations where the throughput of each process is uneven .

本実施形態では、プロセス間通信ごとに、通信待ち合わせ時間とデータ転送時間とを分離して採取する。通信待ち合わせ時間とデータ転送時間とを分離して採取することで、インバランス発生箇所を特定するために必要な情報を保存することができ、その後の解析に利用することができる。また、本実施形態では、通信待ちの発生を契機として情報採取を行っており、通信待ちが発生しない場合は、情報採取を行わないので、性能への影響も小さい。更に、ラッパー方式では、通信待ち発生を判断するために、通信データサイズ及び通信経路ごとに基準時間を保持する必要があった。本実施形態では、通信待ちの発生を契機として情報採取を行い、通信待ち時間は転送サイズや通信経路とは無関係であるので、ラッパー方式の場合と異なり、データ転送に要する基準時間を保持する必要はない。   In this embodiment, the communication waiting time and the data transfer time are separately collected for each inter-process communication. By collecting the communication waiting time and the data transfer time separately, it is possible to save information necessary for specifying the location where the imbalance has occurred and to use it for subsequent analysis. Further, in the present embodiment, information collection is performed in response to the occurrence of communication wait, and information collection is not performed when communication wait does not occur, so the influence on performance is small. Furthermore, in the wrapper method, it is necessary to hold a reference time for each communication data size and communication path in order to determine whether communication waiting has occurred. In this embodiment, information is collected when a communication wait occurs, and the communication waiting time is independent of the transfer size and communication path. Therefore, unlike the wrapper method, it is necessary to maintain the reference time required for data transfer. There is no.

以上、本発明をその好適な実施形態に基づいて説明したが、本発明の情報処理装置、通信情報採取方法、及び、プログラムは、上記実施形態にのみ限定されるものではなく、上記実施形態の構成から種々の修正及び変更を施したものも、本発明の範囲に含まれる。   As mentioned above, although this invention was demonstrated based on the suitable embodiment, the information processing apparatus of this invention, the communication information collection method, and a program are not limited only to the said embodiment, The said embodiment is not limited. Those in which various modifications and changes are made from the configuration are also included in the scope of the present invention.

本発明の分散並列プログラムを示すブロック図。The block diagram which shows the distributed parallel program of this invention. 情報採取の動作手順を示すフローチャート。The flowchart which shows the operation | movement procedure of information collection. ラッパー方式で採取される情報と本実施形態で採取される情報とを模式的に示すブロック図。The block diagram which shows typically the information extract | collected by a wrapper system, and the information extract | collected by this embodiment.

符号の説明Explanation of symbols

10:分散並列プログラム
11:プロセス
12:プロセス間通信処理部
13:プロセス間通信情報処理部
14:プロセス間通信情報ファイル
10: Distributed parallel program 11: Process 12: Interprocess communication processing unit 13: Interprocess communication information processing unit 14: Interprocess communication information file

Claims (8)

複数のプロセス間で通信を行い、処理を実行する情報処理装置であって、
プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別手段と、
前記判別手段によって前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録するプロセス間通信情報記録手段とを備える情報処理装置。
An information processing apparatus that communicates between a plurality of processes and executes processing,
In the communication between processes, and determination means for communicating awaiting registration due to the occurrence of imbalance in the communication target process determines whether it occurred,
Process said discrimination means by sensing the communication waiting adjustment time until the communication waiting when the communication waiting alignment is determined to have occurred is completed, records the communication waiting adjustment time measured in the inter-process communication information file An information processing apparatus comprising inter-communication information recording means.
前記判別手段は、前記通信待ち合わせが発生したと判別した後、前記通信待ち合わせが終了したか否かを判別し、
前記プロセス間通信情報記録手段は、前記判別手段によって前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが発生した時刻を取得し、前記判別手段によって前記通信待ち合わせが終了したと判別されたときに前記通信待ち合わせが終了した時刻を取得し、取得した前記通信待ち合わせが発生した時刻と前記通信待ち合わせが終了した時刻との時間差から、前記通信待ち合わせ時間を求める、請求項1に記載の情報処理装置。
It said discriminating means after the communication waiting alignment is determined to have occurred, it is determined whether the communication waiting alignment has been completed,
The interprocess communication information recording means, wherein the communication waiting alignment acquires the time that occurred when the communication waiting alignment is determined to have occurred by determining means, the communication waiting alignment has been completed by the determining means and Gets the time when the communication waiting alignment has been completed when it is judged, from the time difference between the obtained time of the communication waiting adjustment is time and the communication waiting alignment generated is completed, determining the communication waiting adjustment time, wherein Item 4. The information processing apparatus according to Item 1.
前記プロセス間通信情報記録手段は、前記プロセス間通信が終了するとデータ転送終了時刻を取得し、前記通信待ち合わせが終了した時刻と前記データ転送終了時刻との時間差から、データ転送所要時間を求め、求めた前記データ転送所要時間を前記プロセス間通信情報ファイルに記録する、請求項2に記載の情報処理装置。 The interprocess communication information recording unit obtains data transfer end time when the inter-process communication ends, from said time difference between communication waiting alignment has been completed and the data transfer end time, for data transfer required time, The information processing apparatus according to claim 2, wherein the calculated time required for data transfer is recorded in the inter-process communication information file. 前記プロセス間通信情報記録手段は、前記プロセス間通信が終了すると、データサイズ及び通信対象プロセス情報を取得し、該取得した情報を前記プロセス間通信情報ファイルに記録する、請求項1乃至3の何れか一に記載の情報処理装置。   4. The inter-process communication information recording unit acquires a data size and communication target process information when the inter-process communication ends, and records the acquired information in the inter-process communication information file. An information processing apparatus according to claim 1. 前記複数のプロセスのそれぞれが、他のプロセスとの間で通信を行うプロセス間通信処理部を備えており、該プロセス間通信処理部内に、前記プロセス間通信情報記録手段を有する、請求項1乃至4の何れか一に記載の情報処理装置。   Each of the plurality of processes includes an inter-process communication processing unit that communicates with another process, and the inter-process communication information recording unit is included in the inter-process communication processing unit. 4. The information processing apparatus according to any one of 4. 複数のプロセス間で通信を行い、処理を実行する情報処理装置における通信情報採取方法であって、
前記情報処理装置が、プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別ステップと、
前記情報処理装置が、前記判別ステップで前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録する記録ステップとを有する通信情報採取方法。
A communication information collection method in an information processing apparatus that performs communication between a plurality of processes and executes processing,
The information processing apparatus, in the communication between processes, the determination step that the communication waiting alignment due to the occurrence of imbalance in the communication target process determines whether it occurred,
The information processing apparatus, the determination the communication waiting measures a communication waiting adjustment time until terminated when the communication waiting alignment is determined to have occurred in step, interprocess communication the communication waiting adjustment time measured A communication information collecting method comprising: a recording step of recording in an information file.
前記判別ステップでは、前記通信待ち合わせが発生したと判別した後、前記通信待ち合わせが終了したか否かを判別し、
前記記録ステップでは、前記判別ステップで前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが発生した時刻を取得し、前記判別ステップで前記通信待ち合わせが終了したと判別されたときに前記通信待ち合わせが終了した時刻を取得し、取得した前記通信待ち合わせが発生した時刻と前記通信待ち合わせが終了した時刻との時間差から、前記通信待ち合わせ時間を求める、請求項6に記載の通信情報採取方法。
Wherein in the determination step, after said communication waiting alignment is determined to have occurred, it is determined whether the communication waiting alignment has been completed,
Said recording step, said communication waiting alignment acquires the time that occurred when the communication waiting alignment in the determination step is determined to have occurred when the communication waiting alignment with said determining step is determined to have been completed the acquiring time of the communication waiting alignment is completed, the time difference between the obtained time of the communication waiting adjustment is time and the communication waiting alignment generated is completed, determining the communication waiting adjustment time, according to claim 6 Communication information collection method.
複数のプロセス間で通信を行い、処理を実行するコンピュータに、通信情報を採取する処理を実行させるプログラムであって、前記コンピュータに、
プロセス間の通信にて、通信対象のプロセスでインバランスの発生による通信待ち合わせが発生したか否かを判別する判別処理と、
前記判別処理で前記通信待ち合わせが発生したと判別されたときに前記通信待ち合わせが終了するまでの通信待ち合わせ時間を測定し、測定した前記通信待ち合わせ時間をプロセス間通信情報ファイルに記録する記録処理とを実行させるプログラム。
A computer that performs communication between a plurality of processes and that causes a computer that executes processing to execute processing that collects communication information.
In the communication between processes, the determination process communication waiting alignment due to the occurrence of imbalance in the communication target process determines whether it occurred,
Recording said discriminating the communication waiting alignment processing measures the communication waiting adjustment time until the communication waiting is terminated if it is determined to have occurred, recording the communication waiting adjustment time measured in the inter-process communication information file A program that executes processing.
JP2008037074A 2008-02-19 2008-02-19 Information processing apparatus, communication information collecting method, and program Expired - Fee Related JP4978504B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008037074A JP4978504B2 (en) 2008-02-19 2008-02-19 Information processing apparatus, communication information collecting method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008037074A JP4978504B2 (en) 2008-02-19 2008-02-19 Information processing apparatus, communication information collecting method, and program

Publications (2)

Publication Number Publication Date
JP2009199121A JP2009199121A (en) 2009-09-03
JP4978504B2 true JP4978504B2 (en) 2012-07-18

Family

ID=41142584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008037074A Expired - Fee Related JP4978504B2 (en) 2008-02-19 2008-02-19 Information processing apparatus, communication information collecting method, and program

Country Status (1)

Country Link
JP (1) JP4978504B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5509921B2 (en) * 2010-02-24 2014-06-04 日本電気株式会社 Performance information collection device, performance information collection method, and performance information collection program
JP5949346B2 (en) * 2012-09-04 2016-07-06 富士通株式会社 Message communication status acquisition program, method, and system between computation nodes
JP7434925B2 (en) * 2020-01-23 2024-02-21 日本電気株式会社 Information processing device, information processing method and program

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040139A (en) * 1996-07-19 1998-02-13 Nec Corp Performance monitor system
JP2000315198A (en) * 1999-05-06 2000-11-14 Hitachi Ltd Distributed processing system and its performance monitoring method
JP3599232B2 (en) * 1999-10-15 2004-12-08 日本電気株式会社 Message exchange type communication system and communication waiting method thereof
JP3937341B2 (en) * 2004-01-30 2007-06-27 日本電気株式会社 Transaction profile generation system for computer system performance measurement analysis, its generation method and program
JP4410661B2 (en) * 2004-11-09 2010-02-03 株式会社日立製作所 Distributed control system
JP2007249373A (en) * 2006-03-14 2007-09-27 Osaka Prefecture Univ Monitoring system of distributed program

Also Published As

Publication number Publication date
JP2009199121A (en) 2009-09-03

Similar Documents

Publication Publication Date Title
JP5520371B2 (en) Time-based context sampling of trace data with support for multiple virtual machines
JP5719930B2 (en) System test equipment
JP6260130B2 (en) Job delay detection method, information processing apparatus, and program
US20100017583A1 (en) Call Stack Sampling for a Multi-Processor System
CN105955876B (en) Data monitoring processing method and device
EP4182796B1 (en) Machine learning-based techniques for providing focus to problematic compute resources represented via a dependency graph
CN105607986A (en) Acquisition method and device of user behavior log data
CN110297767B (en) Automatic execution method, device, equipment and storage medium for test cases
TW201415216A (en) System and method for retrieving test logs
US11409704B2 (en) Method, device and computer program product for managing storage system
CN109189582B (en) Method and device for detecting reason of semaphore timeout
JP4978504B2 (en) Information processing apparatus, communication information collecting method, and program
JP4504346B2 (en) Trouble factor detection program, trouble factor detection method, and trouble factor detection device
JP2015185027A (en) Job discrimination program, device and method
EP4060435B1 (en) Method and system for infrastructure monitoring
CN111258765A (en) Load balancing method and device, computing equipment and storage medium
CN111221744A (en) Data acquisition method and device and electronic equipment
JP6064571B2 (en) Processing program, processing method, and processing apparatus
US20130006568A1 (en) Test Operation
CN113946422A (en) Dynamic allocation website monitoring and scheduling method
JP2007249490A (en) Automatic failure log selection/collection method and apparatus
JP6476978B2 (en) Log information collection program, log information collection device, and log information collection method
US20140089270A1 (en) Methods for determining event counts based on time-sampled data
CN111506422A (en) Event analysis method and system
JP6048555B1 (en) Classification information creation device, classification information creation method, classification information creation program, search device, search method, and search program

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120222

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120321

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120403

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150427

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4978504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees