JPH0432936A - Tracing method for system operation in on-line service - Google Patents

Tracing method for system operation in on-line service

Info

Publication number
JPH0432936A
JPH0432936A JP2131368A JP13136890A JPH0432936A JP H0432936 A JPH0432936 A JP H0432936A JP 2131368 A JP2131368 A JP 2131368A JP 13136890 A JP13136890 A JP 13136890A JP H0432936 A JPH0432936 A JP H0432936A
Authority
JP
Japan
Prior art keywords
trace
information
failure
cause
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2131368A
Other languages
Japanese (ja)
Inventor
Yutaka Sakata
豊 坂田
Yuji Kataoka
片岡 雄二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T SOFTWARE KK
Nippon Telegraph and Telephone Corp
NTT Software Corp
Original Assignee
N T T SOFTWARE KK
Nippon Telegraph and Telephone Corp
NTT Software Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T SOFTWARE KK, Nippon Telegraph and Telephone Corp, NTT Software Corp filed Critical N T T SOFTWARE KK
Priority to JP2131368A priority Critical patent/JPH0432936A/en
Publication of JPH0432936A publication Critical patent/JPH0432936A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To facilitate the investigation of the cause of failure and its repair by stacking trace information showing trace points are passed in a main storage when a CPU executes instructions at the trace points set previously in an OS, a package, and a transaction program during service operation. CONSTITUTION:The trace points are set before and behind a program 3 where the presence of the cause of failure is estimated and when the CPU passes the trace points in on-line processing, information on the passage is stacked in a trace point storage area on the main storage. If system failure occurs and the system is shut down, main storage dump information is gathered on a magnetic MT by the operation rule of the system. Therefore, the operation state of the program 3 right before the system failure occurs is made clear with the trace point storage area in the dump information of the main storage. Consequently, the investigation of the cause of the failure and its repair are facilitated.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、オンライン・サービス中のシステム動作トレ
ース方法に関し、特に、オンライン・システムのシステ
ム障害原因探索に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a system operation tracing method during online service, and particularly to searching for the cause of a system failure in an online system.

〔従来の技術〕[Conventional technology]

従来、システム動作のトレース情報はLP(ラインプリ
ンタ) 、MT (磁気テープ)、DK(磁気ディスク
)などの二次媒体に収集していた。
Conventionally, trace information of system operations has been collected on secondary media such as LP (line printer), MT (magnetic tape), and DK (magnetic disk).

システム動作のトレース情報は大規模オンライン・シス
テムのシステム障害原因の探索のために有効な情報であ
るが、トレース情報を二次媒体に書き込むためのDS(
ダイナミック・ステップ)、書込み時間がオンライン・
システムのターンアラウンドおよびスループットに与え
る影響が大きく、オンライン・サービス中に本情報を収
集することができなかった。
Trace information of system operations is useful information for searching for the cause of system failure in large-scale online systems, but DS (
dynamic step), write time is online
This information could not be collected during online service due to the impact on system turnaround and throughput.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

従来、システム動作のトレース情報の収集は、土曜・日
曜などサービス運体中に再現試験を行なう必要があり、
多大の時間と労力がかかっていた。
Traditionally, to collect trace information on system operations, it was necessary to conduct reproduction tests during service operations such as Saturdays and Sundays.
It took a lot of time and effort.

また、再現試験を実施しても、再現試験環境と実サービ
ス環境の違いにより、障害が再現せず徒労に終わること
が多かった。
Furthermore, even if reproduction tests were conducted, the failures could not be reproduced due to the difference between the reproduction test environment and the actual service environment, and the effort was often in vain.

そして、障害原因の探索および修復に手間取っている間
に、同じ障害がオンライン・サービス中に再発するとい
う問題があった。
Then, while it takes time to search for the cause of the failure and repair it, there is a problem in that the same failure occurs again during the online service.

本発明はこのような点に鑑みてなされたものであり、そ
の目的とするところは、障害原因の探索および修復が容
易なオンライン・サービス中のシステム動作トレース方
法を得ることにある。
The present invention has been made in view of these points, and its purpose is to provide a system operation tracing method during online service that facilitates searching for and repairing the cause of a failure.

〔課題を解決するための手段〕[Means to solve the problem]

このような目的を達成するために本発明は、サービス運
転中に、OS、パフケージ、業務プログラムに予め設定
してあるトレース・ポイント上の命令をCPUが実行し
た時に、そのポイントを通過した旨のトレース情報を主
記憶上にスタックするようにしたものである。
In order to achieve such an object, the present invention provides information indicating that when the CPU executes an instruction on a trace point preset in the OS, puff cage, or business program during service operation, the trace point has been passed. The trace information is stacked on the main memory.

〔作用〕[Effect]

本発明においては、同じ障害が再発した時には障害原因
探索のための確度の高い情報が得られる。
In the present invention, when the same failure occurs again, highly accurate information for searching for the cause of the failure can be obtained.

〔実施例〕〔Example〕

まず本発明によるシステム動作トレース方法の一実施例
の概要について述べる。
First, an outline of an embodiment of the system operation tracing method according to the present invention will be described.

本実施例においては予め障害原因が有ると予想されるプ
ログラムの前後にトレース・ポイントを設定しておく、
オンライン処理中にトレース・ポイントをCPUが通過
した時にその情報を主記憶上のトレース・ポイント格納
域にスタックしておく。システム障害が発生し、システ
ム・ダウンが発生した時は、システムの運用ルールによ
り主記憶のダンプ情報が磁気MTに採られる。主記憶の
ダンプ情報中のトレース・ポイント格納域よりシステム
障害が発生した直前のプログラムの動作状態が判明し、
障害個所の特定が容易になる。
In this embodiment, trace points are set in advance before and after the program where the cause of the failure is expected to exist.
When the CPU passes a trace point during online processing, the information is stacked in the trace point storage area on the main memory. When a system failure occurs and the system goes down, dump information from the main memory is taken to the magnetic MT according to system operation rules. The operating state of the program immediately before the system failure can be determined from the trace point storage area in the main memory dump information.
It becomes easier to identify the location of the failure.

第1図は、本発明によるオンライン・サービス中のシス
テム動作トレース方法の一実施例を説明するためのブロ
ック系統図である。同図において、1は処理装置、2は
被試験プログラム(O3、パッケージ、業務プログラム
)、3は詳細を第2図に示す試験プログラム、4は業務
用端末、5は通信回線、6は周辺装置である。
FIG. 1 is a block system diagram for explaining an embodiment of a system operation tracing method during online service according to the present invention. In the figure, 1 is a processing device, 2 is a program under test (O3, package, business program), 3 is a test program whose details are shown in FIG. 2, 4 is a business terminal, 5 is a communication line, and 6 is a peripheral device. It is.

第1図において、O81パツケージ、業務プログラムに
予めトレース・ポイントを設定する。設定したトレース
・ポイントをCPUが実行すると、ハードウェアの割り
込みにより、割り込み処理プログラムに制御が移行する
0割り込み処理プログラムは、トレース・ポイント情報
をトレース・ポイント情報格納域にスタックする。トレ
ース・ポイント情報格納域が一杯になった時には先頭よ
りオーバライドして使用する。
In FIG. 1, trace points are set in advance in the O81 package and business program. When the CPU executes the set trace point, control is transferred to the interrupt processing program due to a hardware interrupt.The interrupt processing program stacks the trace point information in the trace point information storage area. When the trace point information storage area becomes full, it is overridden and used from the beginning.

第2図(a)はトレース・ポイント設定処理を示すフロ
ーチャートであり、まず、指定トレース・ポイントの命
令を第3図に示すトレース・ポイント・テーブルに退避
する(ステップIf)。そして、指定トレース・ポイン
トの命令を不当コードに修正する(ステップ12)。
FIG. 2(a) is a flowchart showing the trace point setting process. First, the instruction at the designated trace point is saved in the trace point table shown in FIG. 3 (step If). Then, the instruction at the designated trace point is corrected to invalid code (step 12).

第2図山)は割り込み処理を示すフローチャートである
。まず、PSW(プログラム・ステータス・ワード)よ
りアドレスを得る(ステップ21)。
Fig. 2 (Figure 2) is a flowchart showing interrupt processing. First, an address is obtained from a PSW (program status word) (step 21).

次に、アドレスをスタック域に書き込む(ステップ22
)0次に、トレース・ポイント・テーブルに退避されて
いる命令を実行する(ステップ23)。
Next, write the address into the stack area (step 22
)0 Next, the instructions saved in the trace point table are executed (step 23).

そして、第4図に示すトレース・ポイント情報格納域が
一杯の時はポインタを先頭に戻す。
When the trace point information storage area shown in FIG. 4 is full, the pointer is returned to the beginning.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、サービス運転中に、OS
、パンケージ、業務プログラムに予め設定してあるトレ
ース・ポイント上の命令をCPUが実行した時に、その
ポイントを通過した旨のトレース情報を主記憶上にスタ
ックすることにより、オンライン・サービス中にトレー
ス情報の収集が可能となるので、同じ障害が再発した時
には、障害原因探索のための確度の高い情報が得られる
ことになり、障害原因の探索および修復が容易になる。
As explained above, the present invention allows the OS to
,PanCage,When the CPU executes an instruction on a trace point,preset in a business program, trace information indicating that the,point has been passed is stacked in the main memory, so that,the trace information is stored during online service. Therefore, when the same failure occurs again, highly accurate information for searching for the cause of the failure can be obtained, making it easier to search for the cause of the failure and repair it.

また、トレース情報を主記憶上にスタックすることによ
り、オンライン・サービスのスループット、ターンアラ
ウンドに与える影響はごくわずかであり、無視できる。
Furthermore, by stacking the trace information on the main memory, the effect on the throughput and turnaround of online services is negligible and can be ignored.

一般にシステム障害が発生してシステムがダウンするケ
ースでは、その障害原因はダウンの直前に発生している
。このため、トレース情報のスタック域はオーバライド
方式でも良いので、スタック域も少量で済み、オンライ
ン処理への影響は無視できる。
Generally, when a system failure occurs and the system goes down, the cause of the failure occurs immediately before the system goes down. Therefore, the trace information stack area can be overridden, so the stack area can be kept small and the impact on online processing can be ignored.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明によるオンライン・サービス中のシステ
ム動作トレース方法の一実施例を説明するためのブロッ
ク系統図、第2図は試験プログラムの内容を示すフロー
チャート、第3図はトレース・ポイント・テーブルを示
す説明図、第4図はトレース・ポイント情報格納域を示
す説明図である。 特許出願人   日本電信電話株式会社エヌ・ティ・テ
ィ・ソフトウ ェア株式会社
FIG. 1 is a block diagram for explaining an embodiment of the system operation tracing method during online service according to the present invention, FIG. 2 is a flowchart showing the contents of a test program, and FIG. 3 is a trace point table. FIG. 4 is an explanatory diagram showing a trace point information storage area. Patent applicant Nippon Telegraph and Telephone Corporation NTT Software Corporation

Claims (1)

【特許請求の範囲】[Claims] 通信回線を介して多数の端末が接続されているオンライ
ン処理システムにおいて、サービス運転中に、OS、パ
ッケージ、業務プログラムに予め設定してあるトレース
・ポイント上の命令をCPUが実行した時に、そのポイ
ントを通過した旨のトレース情報を主記憶上にスタック
することを特徴とするオンライン・サービス中のシステ
ム動作トレース方法。
In an online processing system where many terminals are connected via communication lines, when the CPU executes an instruction on a trace point preset in the OS, package, or business program during service operation, that point A system operation tracing method during an online service, characterized by stacking trace information indicating that the system has passed through the main memory.
JP2131368A 1990-05-23 1990-05-23 Tracing method for system operation in on-line service Pending JPH0432936A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2131368A JPH0432936A (en) 1990-05-23 1990-05-23 Tracing method for system operation in on-line service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2131368A JPH0432936A (en) 1990-05-23 1990-05-23 Tracing method for system operation in on-line service

Publications (1)

Publication Number Publication Date
JPH0432936A true JPH0432936A (en) 1992-02-04

Family

ID=15056299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2131368A Pending JPH0432936A (en) 1990-05-23 1990-05-23 Tracing method for system operation in on-line service

Country Status (1)

Country Link
JP (1) JPH0432936A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2507505A (en) * 2012-10-31 2014-05-07 Ibm Recording dump data of a computer process which provides trace data
US9128832B2 (en) 2012-12-14 2015-09-08 International Business Machines Corporation Performing diagnostic tracing of an executing application to identify suspicious pointer values

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2507505A (en) * 2012-10-31 2014-05-07 Ibm Recording dump data of a computer process which provides trace data
US9372783B2 (en) 2012-10-31 2016-06-21 International Business Machines Corporation Recording the core data of a computer process which provides trace data
US9128832B2 (en) 2012-12-14 2015-09-08 International Business Machines Corporation Performing diagnostic tracing of an executing application to identify suspicious pointer values
US9164821B2 (en) 2012-12-14 2015-10-20 International Business Machines Corporation Performing diagnostic tracing of an executing application to identify suspicious pointer values
US10423474B2 (en) 2012-12-14 2019-09-24 International Business Machines Corporation Performing diagnostic tracing of an executing application to identify suspicious pointer values

Similar Documents

Publication Publication Date Title
WO2020233053A1 (en) Method, apparatus, device, and storage medium for making test page script
CN110083581A (en) A kind of method, apparatus, storage medium and the computer equipment of log retrospect
JPH0820978B2 (en) Failure analysis information edit output method
JPH0432936A (en) Tracing method for system operation in on-line service
US5642507A (en) Apparatus for collecting control data of a virtual machine and method of thereof
CN117252133A (en) Layout processing method and electronic equipment
CN113760696A (en) Program problem positioning method and device, electronic equipment and storage medium
JPH09146782A (en) Method for handling occurance of abnormality in inter-job data succession
JP2631778B2 (en) Computer program test equipment
CN117009247A (en) Test method, device, equipment and medium
JPH0535414A (en) Magnetic tape file access system
JPS6180426A (en) System editing processing system
JPH01187648A (en) Data generating device
JPS6218072B2 (en)
CN114461529A (en) Automatic testing method and device for password control, electronic equipment and storage medium
JP2560545B2 (en) Interface inspection processor
JPS62292045A (en) Protocol testing device
JPH04373060A (en) Batch job input number limiting system
JPS62113208A (en) Nc program error detection system for numerical controller
JPS5870361A (en) Input controlling system
JPH02242447A (en) Memory dump collecting system
JPS59108130A (en) Method for generating automatic system of controlling program for input/output controlling device
JPH04165402A (en) Manufacture control system
JPH06110797A (en) Information processor
JPH05224979A (en) Pseudo terminal equipment