JP2019219755A - 監視プログラム、監視方法、および並列処理装置 - Google Patents
監視プログラム、監視方法、および並列処理装置 Download PDFInfo
- Publication number
- JP2019219755A JP2019219755A JP2018114883A JP2018114883A JP2019219755A JP 2019219755 A JP2019219755 A JP 2019219755A JP 2018114883 A JP2018114883 A JP 2018114883A JP 2018114883 A JP2018114883 A JP 2018114883A JP 2019219755 A JP2019219755 A JP 2019219755A
- Authority
- JP
- Japan
- Prior art keywords
- node
- message
- monitoring
- identifier
- monitoring message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
以下、図面を参照して、実施形態について説明する。図1は、実施形態におけるノード1および表示装置2の一例を示す図である。ノード1は、並列処理装置の一例であり、複数のノード1による並列処理を行うシステムに含まれる。ノード1は、並検出部11と記録部12と生成部13と送信部14と判定部15と出力部16と記憶部17とを含む。送信部14は、第1送信部および第2送信部の一例である。
記録部12は、検出部11が待ち状態が発生したことを検出した場合、監視メッセージ関連情報を記録する。記録部12は、例えば、待ち状態となった処理で他のノードに送信されるメッセージの種類、および自ノードを示す識別情報を、監視メッセージ関連情報として記録する。
1:ブロッキング型の1対通信
send(1,2)
recv(1,2)
2:他の動作単位からの待ち合わせを行う集団通信
barrier(2,1)
gather(2,2)
reduce(2,3)
本実施形態は、以上に述べた実施の形態に限定されるものではなく、本実施形態の要旨を逸脱しない範囲内で様々な変更、追加、省略が適用可能である。
2 表示装置
11 検出部
12 記録部
13 生成部
14 送信部
15 判定部
16 出力部
17 記憶部
100 バス
111 プロセッサ
112 メモリ
113 補助記憶装置
114 通信インタフェース
115 媒体接続部
116 入力装置
117 出力装置
118 可搬型記録媒体
Claims (6)
- 複数のノードによる並列処理を行うシステムにおいて前記ノードに実行させる監視プログラムであって、
第1ノードからの所定メッセージを待つ状態であるときにタイムアウトが発生した場合、自ノードの識別子を含む監視メッセージを前記第1ノードに送信し、
第2ノードからの所定メッセージを待つ状態であるときに前記監視メッセージを受信した場合、受信した前記監視メッセージに自ノードの識別子を付加し、前記自ノードの識別子が付加された前記監視メッセージを前記第2ノードに送信し、
受信した前記監視メッセージに自ノードの識別子が含まれている場合、受信した前記監視メッセージに含まれる各識別子を表示する
処理を前記ノードに実行させるための監視プログラム。 - 前記監視メッセージを受信したときに自ノードが休止状態である場合、自ノードの識別子と休止状態となった原因に関する情報とを前記監視メッセージに付加し、前記監視メッセージの送信元ノードに前記監視メッセージを送信する、
処理を前記ノードに実行させることを特徴とする請求項1記載の監視プログラム。 - 受信した前記監視メッセージに自ノードの識別子と前記休止状態となった原因に関する情報とが含まれている場合、前記情報を表示し、
受信した前記監視メッセージに自ノードの識別子が含まれ、前記休止状態となった原因に関する情報が含まれていない場合、デッドロックが発生したことを示すメッセージを表示する、
処理を前記ノードに実行させることを特徴とする請求項2記載の監視プログラム。 - 前記第1ノードからの所定メッセージを待つ状態が発生した場合、前記所定メッセージの種類を記録し、
前記第1ノードからの所定メッセージを待つ状態であるときにタイムアウトが発生した場合、記録した前記所定メッセージの種類と自ノードの識別子とを含む監視メッセージを前記第1ノードに送信し、
受信した前記監視メッセージに自ノードの識別子が含まれている場合、受信した前記監視メッセージに含まれる前記所定メッセージの種類と各識別子とを表示する
処理を前記ノードに実行させることを特徴とする請求項1乃至3のうちのいずれか1項に記載の監視プログラム。 - 複数のノードによる並列処理を行うシステムにおける前記ノードが、
第1ノードからの所定メッセージを待つ状態であるときにタイムアウトが発生した場合、自ノードの識別子を含む監視メッセージを前記第1ノードに送信し、
第2ノードからの所定メッセージを待つ状態であるときに前記監視メッセージを受信した場合、受信した前記監視メッセージに自ノードの識別子を付加し、前記自ノードの識別子が付加された前記監視メッセージを前記第2ノードに送信し、
受信した前記監視メッセージに自ノードの識別子が含まれている場合、受信した前記監視メッセージに含まれる各識別子を表示する
処理を実行することを特徴とする監視方法。 - 複数の並列処理装置による並列処理を行うシステムにおける前記並列処理装置であって、
第1ノードからの所定メッセージを待つ状態であるときにタイムアウトが発生した場合、自ノードの識別子を含む監視メッセージを前記第1ノードに送信する第1送信部と、
第2ノードからの所定メッセージを待つ状態であるときに前記監視メッセージを受信した場合、受信した前記監視メッセージに自ノードの識別子を付加する記録部と、
前記自ノードの識別子が付加された前記監視メッセージを前記第2ノードに送信する第2送信部と、
受信した前記監視メッセージに自ノードの識別子が含まれている場合、受信した前記監視メッセージに含まれる各識別子を表示する出力部と
を備えることを特徴とする並列処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018114883A JP7063139B2 (ja) | 2018-06-15 | 2018-06-15 | 監視プログラム、監視方法、および並列処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018114883A JP7063139B2 (ja) | 2018-06-15 | 2018-06-15 | 監視プログラム、監視方法、および並列処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019219755A true JP2019219755A (ja) | 2019-12-26 |
JP7063139B2 JP7063139B2 (ja) | 2022-05-09 |
Family
ID=69096488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018114883A Active JP7063139B2 (ja) | 2018-06-15 | 2018-06-15 | 監視プログラム、監視方法、および並列処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7063139B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115174427A (zh) * | 2022-06-01 | 2022-10-11 | 中国电子科技集团公司第十研究所 | 一种航天地面设备报文监视系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0314161A (ja) * | 1989-06-13 | 1991-01-22 | Toshiba Corp | プロセッサ監視処理方式 |
JPH0816430A (ja) * | 1994-06-27 | 1996-01-19 | Mitsubishi Electric Corp | 並列プログラムトレース装置 |
JP2002312199A (ja) * | 2001-04-13 | 2002-10-25 | Mitsubishi Electric Corp | 異常検知電子機器及び異常検知方法及び異常検知電子機器システム及び異常検知プログラム及び異常検知プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002351855A (ja) * | 2001-05-28 | 2002-12-06 | Mitsubishi Electric Corp | 計算機異常処理システムおよび、計算機異常処理方法および、計算機で動作する計算機異常処理プログラムおよび、コンピュータにより読み取り可能な記録媒体に記録された計算機異常処置プログラム |
JP2016038705A (ja) * | 2014-08-07 | 2016-03-22 | 富士通株式会社 | システム及び異常検知方法 |
-
2018
- 2018-06-15 JP JP2018114883A patent/JP7063139B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0314161A (ja) * | 1989-06-13 | 1991-01-22 | Toshiba Corp | プロセッサ監視処理方式 |
JPH0816430A (ja) * | 1994-06-27 | 1996-01-19 | Mitsubishi Electric Corp | 並列プログラムトレース装置 |
JP2002312199A (ja) * | 2001-04-13 | 2002-10-25 | Mitsubishi Electric Corp | 異常検知電子機器及び異常検知方法及び異常検知電子機器システム及び異常検知プログラム及び異常検知プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002351855A (ja) * | 2001-05-28 | 2002-12-06 | Mitsubishi Electric Corp | 計算機異常処理システムおよび、計算機異常処理方法および、計算機で動作する計算機異常処理プログラムおよび、コンピュータにより読み取り可能な記録媒体に記録された計算機異常処置プログラム |
JP2016038705A (ja) * | 2014-08-07 | 2016-03-22 | 富士通株式会社 | システム及び異常検知方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115174427A (zh) * | 2022-06-01 | 2022-10-11 | 中国电子科技集团公司第十研究所 | 一种航天地面设备报文监视系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7063139B2 (ja) | 2022-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169211B2 (en) | Application programming interface testing services | |
US10599551B2 (en) | Automatically detecting distributed concurrency errors in cloud systems | |
US8549540B1 (en) | Message queue transaction tracking using application activity trace data | |
US20180329860A1 (en) | Remote direct memory access (rdma) high performance producer-consumer message processing | |
US20070101179A1 (en) | Method for fault handling in a co-operative workflow environment | |
US7941703B2 (en) | Capturing machine state of unstable java program | |
JP5998764B2 (ja) | 情報処理装置、ログ出力方法およびログ出力プログラム | |
US20170126580A1 (en) | Tracking Contention in a Distributed Business Transaction | |
CN112685247B (zh) | 基于Zabbix监控系统的告警抑制方法及监控系统 | |
JP7063139B2 (ja) | 監視プログラム、監視方法、および並列処理装置 | |
US20110035730A1 (en) | Tracking Database Deadlock | |
CN112445860B (zh) | 一种处理分布式事务的方法和装置 | |
WO2018088490A1 (ja) | 情報蓄積装置、情報蓄積方法およびプログラム | |
US20180287914A1 (en) | System and method for management of services in a cloud environment | |
US9348721B2 (en) | Diagnosing entities associated with software components | |
JP2010511955A (ja) | ウェブサービス基盤の規則処理のためのデバイス及びその方法 | |
US20100306777A1 (en) | Workflow message and activity correlation | |
WO2022179470A1 (zh) | 定时器处理方法、装置、电子设备和计算机可读存储介质 | |
US10419306B2 (en) | Determining the causation of events across multiple nodes using message properties | |
JP6497278B2 (ja) | ログ管理プログラム、ログ管理方法およびログ管理装置 | |
CN118041804B (zh) | 通信设备联网数据检测方法、装置、电子设备与可读介质 | |
US11956071B2 (en) | Systems and methods for synchronous and asynchronous messaging | |
US11693739B2 (en) | Hang detection and remediation in a multi-threaded application process | |
WO2023162272A1 (ja) | テスト支援装置、システム、及び、方法、並びに、コンピュータ可読媒体 | |
JP2009277119A (ja) | ログ記録システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7063139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |