JPH0432936A - Tracing method for system operation in on-line service - Google Patents
Tracing method for system operation in on-line serviceInfo
- Publication number
- JPH0432936A JPH0432936A JP2131368A JP13136890A JPH0432936A JP H0432936 A JPH0432936 A JP H0432936A JP 2131368 A JP2131368 A JP 2131368A JP 13136890 A JP13136890 A JP 13136890A JP H0432936 A JPH0432936 A JP H0432936A
- Authority
- JP
- Japan
- Prior art keywords
- trace
- information
- failure
- cause
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 8
- 238000004891 communication Methods 0.000 claims description 2
- 238000011835 investigation Methods 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、オンライン・サービス中のシステム動作トレ
ース方法に関し、特に、オンライン・システムのシステ
ム障害原因探索に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a system operation tracing method during online service, and particularly to searching for the cause of a system failure in an online system.
従来、システム動作のトレース情報はLP(ラインプリ
ンタ) 、MT (磁気テープ)、DK(磁気ディスク
)などの二次媒体に収集していた。Conventionally, trace information of system operations has been collected on secondary media such as LP (line printer), MT (magnetic tape), and DK (magnetic disk).
システム動作のトレース情報は大規模オンライン・シス
テムのシステム障害原因の探索のために有効な情報であ
るが、トレース情報を二次媒体に書き込むためのDS(
ダイナミック・ステップ)、書込み時間がオンライン・
システムのターンアラウンドおよびスループットに与え
る影響が大きく、オンライン・サービス中に本情報を収
集することができなかった。Trace information of system operations is useful information for searching for the cause of system failure in large-scale online systems, but DS (
dynamic step), write time is online
This information could not be collected during online service due to the impact on system turnaround and throughput.
従来、システム動作のトレース情報の収集は、土曜・日
曜などサービス運体中に再現試験を行なう必要があり、
多大の時間と労力がかかっていた。Traditionally, to collect trace information on system operations, it was necessary to conduct reproduction tests during service operations such as Saturdays and Sundays.
It took a lot of time and effort.
また、再現試験を実施しても、再現試験環境と実サービ
ス環境の違いにより、障害が再現せず徒労に終わること
が多かった。Furthermore, even if reproduction tests were conducted, the failures could not be reproduced due to the difference between the reproduction test environment and the actual service environment, and the effort was often in vain.
そして、障害原因の探索および修復に手間取っている間
に、同じ障害がオンライン・サービス中に再発するとい
う問題があった。Then, while it takes time to search for the cause of the failure and repair it, there is a problem in that the same failure occurs again during the online service.
本発明はこのような点に鑑みてなされたものであり、そ
の目的とするところは、障害原因の探索および修復が容
易なオンライン・サービス中のシステム動作トレース方
法を得ることにある。The present invention has been made in view of these points, and its purpose is to provide a system operation tracing method during online service that facilitates searching for and repairing the cause of a failure.
このような目的を達成するために本発明は、サービス運
転中に、OS、パフケージ、業務プログラムに予め設定
してあるトレース・ポイント上の命令をCPUが実行し
た時に、そのポイントを通過した旨のトレース情報を主
記憶上にスタックするようにしたものである。In order to achieve such an object, the present invention provides information indicating that when the CPU executes an instruction on a trace point preset in the OS, puff cage, or business program during service operation, the trace point has been passed. The trace information is stacked on the main memory.
本発明においては、同じ障害が再発した時には障害原因
探索のための確度の高い情報が得られる。In the present invention, when the same failure occurs again, highly accurate information for searching for the cause of the failure can be obtained.
まず本発明によるシステム動作トレース方法の一実施例
の概要について述べる。First, an outline of an embodiment of the system operation tracing method according to the present invention will be described.
本実施例においては予め障害原因が有ると予想されるプ
ログラムの前後にトレース・ポイントを設定しておく、
オンライン処理中にトレース・ポイントをCPUが通過
した時にその情報を主記憶上のトレース・ポイント格納
域にスタックしておく。システム障害が発生し、システ
ム・ダウンが発生した時は、システムの運用ルールによ
り主記憶のダンプ情報が磁気MTに採られる。主記憶の
ダンプ情報中のトレース・ポイント格納域よりシステム
障害が発生した直前のプログラムの動作状態が判明し、
障害個所の特定が容易になる。In this embodiment, trace points are set in advance before and after the program where the cause of the failure is expected to exist.
When the CPU passes a trace point during online processing, the information is stacked in the trace point storage area on the main memory. When a system failure occurs and the system goes down, dump information from the main memory is taken to the magnetic MT according to system operation rules. The operating state of the program immediately before the system failure can be determined from the trace point storage area in the main memory dump information.
It becomes easier to identify the location of the failure.
第1図は、本発明によるオンライン・サービス中のシス
テム動作トレース方法の一実施例を説明するためのブロ
ック系統図である。同図において、1は処理装置、2は
被試験プログラム(O3、パッケージ、業務プログラム
)、3は詳細を第2図に示す試験プログラム、4は業務
用端末、5は通信回線、6は周辺装置である。FIG. 1 is a block system diagram for explaining an embodiment of a system operation tracing method during online service according to the present invention. In the figure, 1 is a processing device, 2 is a program under test (O3, package, business program), 3 is a test program whose details are shown in FIG. 2, 4 is a business terminal, 5 is a communication line, and 6 is a peripheral device. It is.
第1図において、O81パツケージ、業務プログラムに
予めトレース・ポイントを設定する。設定したトレース
・ポイントをCPUが実行すると、ハードウェアの割り
込みにより、割り込み処理プログラムに制御が移行する
0割り込み処理プログラムは、トレース・ポイント情報
をトレース・ポイント情報格納域にスタックする。トレ
ース・ポイント情報格納域が一杯になった時には先頭よ
りオーバライドして使用する。In FIG. 1, trace points are set in advance in the O81 package and business program. When the CPU executes the set trace point, control is transferred to the interrupt processing program due to a hardware interrupt.The interrupt processing program stacks the trace point information in the trace point information storage area. When the trace point information storage area becomes full, it is overridden and used from the beginning.
第2図(a)はトレース・ポイント設定処理を示すフロ
ーチャートであり、まず、指定トレース・ポイントの命
令を第3図に示すトレース・ポイント・テーブルに退避
する(ステップIf)。そして、指定トレース・ポイン
トの命令を不当コードに修正する(ステップ12)。FIG. 2(a) is a flowchart showing the trace point setting process. First, the instruction at the designated trace point is saved in the trace point table shown in FIG. 3 (step If). Then, the instruction at the designated trace point is corrected to invalid code (step 12).
第2図山)は割り込み処理を示すフローチャートである
。まず、PSW(プログラム・ステータス・ワード)よ
りアドレスを得る(ステップ21)。Fig. 2 (Figure 2) is a flowchart showing interrupt processing. First, an address is obtained from a PSW (program status word) (step 21).
次に、アドレスをスタック域に書き込む(ステップ22
)0次に、トレース・ポイント・テーブルに退避されて
いる命令を実行する(ステップ23)。Next, write the address into the stack area (step 22
)0 Next, the instructions saved in the trace point table are executed (step 23).
そして、第4図に示すトレース・ポイント情報格納域が
一杯の時はポインタを先頭に戻す。When the trace point information storage area shown in FIG. 4 is full, the pointer is returned to the beginning.
以上説明したように本発明は、サービス運転中に、OS
、パンケージ、業務プログラムに予め設定してあるトレ
ース・ポイント上の命令をCPUが実行した時に、その
ポイントを通過した旨のトレース情報を主記憶上にスタ
ックすることにより、オンライン・サービス中にトレー
ス情報の収集が可能となるので、同じ障害が再発した時
には、障害原因探索のための確度の高い情報が得られる
ことになり、障害原因の探索および修復が容易になる。As explained above, the present invention allows the OS to
,PanCage,When the CPU executes an instruction on a trace point,preset in a business program, trace information indicating that the,point has been passed is stacked in the main memory, so that,the trace information is stored during online service. Therefore, when the same failure occurs again, highly accurate information for searching for the cause of the failure can be obtained, making it easier to search for the cause of the failure and repair it.
また、トレース情報を主記憶上にスタックすることによ
り、オンライン・サービスのスループット、ターンアラ
ウンドに与える影響はごくわずかであり、無視できる。Furthermore, by stacking the trace information on the main memory, the effect on the throughput and turnaround of online services is negligible and can be ignored.
一般にシステム障害が発生してシステムがダウンするケ
ースでは、その障害原因はダウンの直前に発生している
。このため、トレース情報のスタック域はオーバライド
方式でも良いので、スタック域も少量で済み、オンライ
ン処理への影響は無視できる。Generally, when a system failure occurs and the system goes down, the cause of the failure occurs immediately before the system goes down. Therefore, the trace information stack area can be overridden, so the stack area can be kept small and the impact on online processing can be ignored.
第1図は本発明によるオンライン・サービス中のシステ
ム動作トレース方法の一実施例を説明するためのブロッ
ク系統図、第2図は試験プログラムの内容を示すフロー
チャート、第3図はトレース・ポイント・テーブルを示
す説明図、第4図はトレース・ポイント情報格納域を示
す説明図である。
特許出願人 日本電信電話株式会社エヌ・ティ・テ
ィ・ソフトウ
ェア株式会社FIG. 1 is a block diagram for explaining an embodiment of the system operation tracing method during online service according to the present invention, FIG. 2 is a flowchart showing the contents of a test program, and FIG. 3 is a trace point table. FIG. 4 is an explanatory diagram showing a trace point information storage area. Patent applicant Nippon Telegraph and Telephone Corporation NTT Software Corporation
Claims (1)
ン処理システムにおいて、サービス運転中に、OS、パ
ッケージ、業務プログラムに予め設定してあるトレース
・ポイント上の命令をCPUが実行した時に、そのポイ
ントを通過した旨のトレース情報を主記憶上にスタック
することを特徴とするオンライン・サービス中のシステ
ム動作トレース方法。In an online processing system where many terminals are connected via communication lines, when the CPU executes an instruction on a trace point preset in the OS, package, or business program during service operation, that point A system operation tracing method during an online service, characterized by stacking trace information indicating that the system has passed through the main memory.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2131368A JPH0432936A (en) | 1990-05-23 | 1990-05-23 | Tracing method for system operation in on-line service |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2131368A JPH0432936A (en) | 1990-05-23 | 1990-05-23 | Tracing method for system operation in on-line service |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0432936A true JPH0432936A (en) | 1992-02-04 |
Family
ID=15056299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2131368A Pending JPH0432936A (en) | 1990-05-23 | 1990-05-23 | Tracing method for system operation in on-line service |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0432936A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2507505A (en) * | 2012-10-31 | 2014-05-07 | Ibm | Recording dump data of a computer process which provides trace data |
US9128832B2 (en) | 2012-12-14 | 2015-09-08 | International Business Machines Corporation | Performing diagnostic tracing of an executing application to identify suspicious pointer values |
-
1990
- 1990-05-23 JP JP2131368A patent/JPH0432936A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2507505A (en) * | 2012-10-31 | 2014-05-07 | Ibm | Recording dump data of a computer process which provides trace data |
US9372783B2 (en) | 2012-10-31 | 2016-06-21 | International Business Machines Corporation | Recording the core data of a computer process which provides trace data |
US9128832B2 (en) | 2012-12-14 | 2015-09-08 | International Business Machines Corporation | Performing diagnostic tracing of an executing application to identify suspicious pointer values |
US9164821B2 (en) | 2012-12-14 | 2015-10-20 | International Business Machines Corporation | Performing diagnostic tracing of an executing application to identify suspicious pointer values |
US10423474B2 (en) | 2012-12-14 | 2019-09-24 | International Business Machines Corporation | Performing diagnostic tracing of an executing application to identify suspicious pointer values |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020233053A1 (en) | Method, apparatus, device, and storage medium for making test page script | |
CN110083581A (en) | A kind of method, apparatus, storage medium and the computer equipment of log retrospect | |
JPH0820978B2 (en) | Failure analysis information edit output method | |
JPH0432936A (en) | Tracing method for system operation in on-line service | |
US5642507A (en) | Apparatus for collecting control data of a virtual machine and method of thereof | |
CN117252133A (en) | Layout processing method and electronic equipment | |
CN113760696A (en) | Program problem positioning method and device, electronic equipment and storage medium | |
JPH09146782A (en) | Method for handling occurance of abnormality in inter-job data succession | |
JP2631778B2 (en) | Computer program test equipment | |
CN117009247A (en) | Test method, device, equipment and medium | |
JPH0535414A (en) | Magnetic tape file access system | |
JPS6180426A (en) | System editing processing system | |
JPH01187648A (en) | Data generating device | |
JPS6218072B2 (en) | ||
CN114461529A (en) | Automatic testing method and device for password control, electronic equipment and storage medium | |
JP2560545B2 (en) | Interface inspection processor | |
JPS62292045A (en) | Protocol testing device | |
JPH04373060A (en) | Batch job input number limiting system | |
JPS62113208A (en) | Nc program error detection system for numerical controller | |
JPS5870361A (en) | Input controlling system | |
JPH02242447A (en) | Memory dump collecting system | |
JPS59108130A (en) | Method for generating automatic system of controlling program for input/output controlling device | |
JPH04165402A (en) | Manufacture control system | |
JPH06110797A (en) | Information processor | |
JPH05224979A (en) | Pseudo terminal equipment |