JP5605279B2 - Inter-process synchronization method - Google Patents

Inter-process synchronization method Download PDF

Info

Publication number
JP5605279B2
JP5605279B2 JP2011056049A JP2011056049A JP5605279B2 JP 5605279 B2 JP5605279 B2 JP 5605279B2 JP 2011056049 A JP2011056049 A JP 2011056049A JP 2011056049 A JP2011056049 A JP 2011056049A JP 5605279 B2 JP5605279 B2 JP 5605279B2
Authority
JP
Japan
Prior art keywords
host
synchronization
standby
active
synchronous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011056049A
Other languages
Japanese (ja)
Other versions
JP2012194615A (en
Inventor
武雄 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011056049A priority Critical patent/JP5605279B2/en
Publication of JP2012194615A publication Critical patent/JP2012194615A/en
Application granted granted Critical
Publication of JP5605279B2 publication Critical patent/JP5605279B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、複数のプロセス間で同期を取って処理を行う計算機システムのプロセス間同期方法に関するものである。   The present invention relates to an inter-process synchronization method for a computer system that performs processing by synchronizing a plurality of processes.

従来のプロセス間同期方法は、バリア同期に参加するプロセッサについて、あらかじめ同期ポイントの総数を同期管理部に設定しておき、各プロセッサからのバリア同期要求が発生する毎にカウンタによって同期ポイントへの到達数を計数し、カウンタの計数値が同期ポイントの総数に到達したときに、バリア同期成立通知を発行して、各プロセッサにおける同期待ちを解除していた(例えば、特許文献1参照)。   The conventional inter-process synchronization method sets the total number of synchronization points in advance in the synchronization manager for the processors participating in barrier synchronization, and reaches the synchronization point by a counter each time a barrier synchronization request from each processor occurs. When the count value of the counter reaches the total number of synchronization points, a barrier synchronization establishment notification is issued to release the synchronization wait in each processor (see, for example, Patent Document 1).

特開2000−215182号公報JP 2000-215182 A

しかしながら従来のプロセス間同期方法は、常用系及び待機系のホストプロセッサからなる、フォールトトレラントシステム(Fault tolerant system)構成を組んだ計算機システムへの適用についてまで、想定されたものではない。このため、待機系の全てのホストプロセッサが起動しないと、同期待ちが解除されないという問題があった。   However, the conventional inter-process synchronization method is not supposed to be applied to a computer system having a fault tolerant system configuration including a normal system and a standby system host processor. For this reason, there is a problem that the synchronization wait is not released unless all the host processors in the standby system are activated.

また、常用系と待機系のホストプロセッサが切り替わる場合、切り替わるホストプロセッサが再起動し初期化されるので、この再起動したホストプロセッサでは同期待ちの解除がなされないという問題が発生する。この問題を解決するためには、所定のタイムアウト時間を設定し、当該タイムアウト時間に達した場合は常用系と待機系が切り替わり再起動していると判断して、強制的に同期待ちの解除をかけるようにする必要がある。   In addition, when the active and standby host processors are switched, the host processor to be switched is restarted and initialized. This causes a problem that the restarted host processor is not released from the synchronization wait state. To solve this problem, set a predetermined time-out period, and when the time-out period is reached, determine that the active system and standby system have switched and restarted, and forcibly release the synchronization wait. It is necessary to make it.

しかし、当該タイムアウト時間は、ホストプロセッサの再起動後に同期ポイントに至るまでの到達時間を考慮して、通常十分に長い時間が設定される。このため、タイムアウト時間が到達するまでは何れのホストプロセッサも同期待ちの解除がなされないことから、同期が完了するまでの時間が無駄に延びてしまうという問題がある。   However, the time-out period is normally set to a sufficiently long period in consideration of the arrival time until the synchronization point is reached after the host processor is restarted. For this reason, since no host processor is released from waiting for synchronization until the timeout time is reached, there is a problem that the time until synchronization is completed is unnecessarily extended.

この発明は係る課題を解決するために成されたものであり、常用系及び待機系のフォールトトレラントシステム構成の計算機システムにおいて、タイムアウトに依存しないプロセス間同期方法を得ることを目的とする。   The present invention has been made to solve the above-described problems, and an object of the present invention is to obtain an interprocess synchronization method that does not depend on timeout in a computer system having a fault-tolerant system configuration of a normal system and a standby system.

この発明によるプロセス間同期方法は、常用系及び待機系ホストからなる組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組のプロセス間で同期待ちの状態から同期待ち解除の状態を得てタイミング調整を行い、プロセス間の同期を取るプロセス間同期方法であって、上記各ホストが同期待ちを解除するまでに実行する所定のタスク数の進行に応じて、各ホストが発する同期呼び出し数を、それぞれの組毎に常用系及び待機系を区別して計数するステップと、上記常用系ホストの発した同期呼び出し数の計数値の全組の総数が、予め規定された値に一致したときに、常用系ホストの同期待ちを解除するステップと、上記待機系ホストの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の常用系ホストの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、待機系ホストの同期待ちを解除するステップと、を備えたものである。   The inter-process synchronization method according to the present invention includes a plurality of sets including a normal system and a standby system host, and in a computer system including a synchronization monitoring device, a synchronization wait release state from a synchronization wait state between different sets of processes. Is an inter-process synchronization method that synchronizes between processes by obtaining timing adjustments, and synchronization generated by each host according to the progress of a predetermined number of tasks executed by each host before releasing the wait for synchronization. The step of counting the number of calls by distinguishing between the active system and the standby system for each group, and the total number of the total number of synchronous call counts issued by the above-mentioned active system host coincided with a predetermined value. Sometimes, the step of canceling the standby wait of the active host and the count value of the number of synchronous calls issued by the standby host are the same as the active host of the standby host. When it becomes equal to the synchronous call number count value when the synchronous waiting list is canceled, in which and a step of releasing a synchronization wait in standby host.

この発明によれば、常用系ホストの同期待ちの解除条件が待機系ホストの同期待ちの解除条件に依存しないので、不要なタイムアウト待ちを無くすことができ、タイムアウトに依存しないプロセス間同期方法を得ることができる。   According to the present invention, the synchronization waiting cancellation condition of the active host does not depend on the standby host synchronization waiting cancellation condition, so unnecessary timeout waiting can be eliminated, and an interprocess synchronization method that does not depend on timeout is obtained. be able to.

実施の形態1による常用系及び待機系のフォールトトレラントシステムをなす計算機システムの構成を示す図である。1 is a diagram illustrating a configuration of a computer system that constitutes a normal and standby fault tolerant system according to Embodiment 1. FIG. 実施の形態1による同期監視装置の動作例を示すフローチャートである。4 is a flowchart illustrating an operation example of the synchronization monitoring apparatus according to the first embodiment. 実施の形態1による同期監視装置が常用待機切り替えを検出した場合の処理フローを示す図である。It is a figure which shows the processing flow when the synchronous monitoring apparatus by Embodiment 1 detects regular standby switching. 実施の形態2による同期監視装置の動作例を示すフローチャートである。10 is a flowchart illustrating an operation example of the synchronization monitoring apparatus according to the second embodiment. 実施の形態3による同期監視装置の処理フローを示す図である。FIG. 10 is a diagram illustrating a processing flow of the synchronization monitoring apparatus according to the third embodiment.

実施の形態1.
図1は、この発明に係る実施の形態1による常用系及び待機系のフォールトトレラントシステムをなす計算機システムの構成を示す図であり、(a)は計算機システムの全体構成を示し、(b)は計算機システムに設けられた同期監視装置の構成を示し、(c)は同期監視装置に設けられた記憶部の一部のデータ領域の構成例を示す図である。
Embodiment 1 FIG.
FIG. 1 is a diagram showing a configuration of a computer system that constitutes a fault-tolerant system of a normal system and a standby system according to Embodiment 1 of the present invention, (a) shows the overall configuration of the computer system, and (b) 2 shows a configuration of a synchronization monitoring device provided in the computer system, and FIG. 3C is a diagram showing a configuration example of a partial data area of a storage unit provided in the synchronization monitoring device.

図1(a)において、実施の形態1の計算機システムは、常用系ホスト群3aと、待機系ホスト群3bと、同期監視装置2と、ネットワーク6から構成されたフォールトトレラントシステムをなしている。フォールトトレラントシステムは、その構成部品の一部が故障しても正常に処理を続行するシステムであり、この例では1対の常用系と待機系のホストを設けることで、何れか一方のホストが故障しても故障していない他方のホストに切り替わり、処理が正常に継続するようにシステムが構成されている。ここでのホストとは、ネットワーク6を介して別の機器やコンピュータ、プロセッサにサービスや処理能力などを提供するコンピュータ若しくはプロセッサである。常用系ホスト群3a及び待機系ホスト群3bの各ホストは、ネットワーク6を介して異なる所属グループ(組)間でプロセス間通信を行い、共有情報へのアクセス時に衝突がないように、プロセス間で同期を取って、相互に情報のやり取りを行っている。ネットワーク6は、LAN(Local Area Network)ケーブルや、電話回線、光回線や、プロセッサ間を接続するデータバスであっても良い。   In FIG. 1A, the computer system of the first embodiment forms a fault tolerant system composed of an active host group 3 a, a standby host group 3 b, a synchronization monitoring device 2, and a network 6. A fault-tolerant system is a system that continues processing normally even if some of its components fail. In this example, a pair of regular and standby hosts are provided, Even if a failure occurs, the system is configured to switch to the other host that has not failed and continue processing normally. Here, the host is a computer or processor that provides services, processing capabilities, and the like to another device, computer, or processor via the network 6. Each host of the active host group 3a and the standby host group 3b performs inter-process communication between different belonging groups (groups) via the network 6 so that there is no collision when accessing shared information. Synchronize and exchange information with each other. The network 6 may be a LAN (Local Area Network) cable, a telephone line, an optical line, or a data bus that connects processors.

図1(a)の例では、常用系及び待機系のフォールトトレラントシステムをなす計算機システムの形態として、常用系に3つのホストがあるという想定で説明を行う。この場合、待機系は必然的に、常用系と対をなす3つのホストが存在することになる。
この常用系ホスト群3aを、ホスト1a、ホスト1c、ホスト1eとする。また、常用系と対をなす待機系ホスト群3bを、ホスト1b、ホスト1d、ホスト1fとする。
常用系ホスト群3aの各ホスト1a、1c、1eと、待機系ホスト群3bの各ホスト1b、1d、1fは、それぞれネットワーク6に接続される。
常用系ホストと対を成す待機系ホストを同一のグループ(組)とするようにグループ化し、ホスト1aとホスト1bをグループ4a、ホスト1cとホスト1dをグループ4b、ホスト1eとホスト1fをグループ4cとして、複数の異なる所属グループにグループ分けする。
各グループは、1つの常用系ホストと対を成す1つの待機系ホストで構成されていることになる。
なお、各グループに属する常用系及び待機系のホストは、それぞれ2つ以上設けられても良く、またグループ数も2つ若しくは3つ以上の複数個設けられても良い
In the example of FIG. 1A, description will be made on the assumption that there are three hosts in the normal system as a form of the computer system that constitutes the fault tolerant system of the normal system and the standby system. In this case, the standby system inevitably has three hosts that are paired with the regular system.
The regular host group 3a is defined as a host 1a, a host 1c, and a host 1e. Further, the standby host group 3b that forms a pair with the regular system is referred to as a host 1b, a host 1d, and a host 1f.
The hosts 1a, 1c, and 1e of the active host group 3a and the hosts 1b, 1d, and 1f of the standby host group 3b are connected to the network 6, respectively.
The standby hosts that are paired with the regular hosts are grouped into the same group (group), the host 1a and the host 1b are group 4a, the host 1c and the host 1d are group 4b, and the host 1e and the host 1f are group 4c. As shown in FIG.
Each group is composed of one standby host that is paired with one regular host.
Two or more regular and standby hosts belonging to each group may be provided, and the number of groups may be two or three or more.

常用系ホスト群3aの各ホスト1a、1c、1eと、待機系ホスト群3bの各ホスト1b、1d、1fは、何れかのホストに異常が生じた場合、計算機システムに設けられた制御部(図示せず)がその異常を検出し、それぞれ同一のグループ内で、常用系ホストと待機系ホストを互いに切り替えるように自動的に制御される。
また、常用系ホストと待機系ホストが切り替わるとき、異常が生じて切替えられる方のホストは再起動が行われ、遂行中のプロセスの進行が初期化される(リスタートされる)。
Each of the hosts 1a, 1c, 1e of the active host group 3a and each of the hosts 1b, 1d, 1f of the standby host group 3b is provided with a control unit ( (Not shown) detects the abnormality and is automatically controlled to switch between the active host and the standby host in the same group.
When the active host and the standby host are switched, the host that is switched due to an abnormality is restarted, and the progress of the process being executed is initialized (restarted).

各ホスト1a〜1fは、そのプロセッサに設定されたプログラムにしたがって、予め設定されたプロセスを順次遂行していく。各ホスト1a〜1fに設定されたプログラムは、一群のプロセスからなる複数のタスクから構成される。各ホスト1a〜1fは、所定のタスクの処理を完了することで予め設定された「同期ポイント」に到達すると、同期呼び出しを発する。この同期ポイントは、各ホスト1a〜1fにおいてそれぞれ規定のタスクが完了する毎に設定されている。すなわち、各ホスト1a〜1fは順次タスクを処理し、同期ポイントに到達する都度、同期呼び出しを発する。   Each of the hosts 1a to 1f sequentially performs a preset process according to a program set in the processor. A program set in each of the hosts 1a to 1f includes a plurality of tasks composed of a group of processes. Each of the hosts 1a to 1f issues a synchronous call when reaching a preset “synchronization point” by completing the processing of a predetermined task. This synchronization point is set each time a prescribed task is completed in each of the hosts 1a to 1f. That is, each host 1a to 1f processes tasks sequentially and issues a synchronous call whenever it reaches the synchronization point.

ホスト1a〜1f間でプロセス間同期が行われるまでの間に、各ホストは同期待ちの状態を得る。例えば、各ホスト1a〜1fがそれぞれ所要数の同期呼び出しを発呼し、異なるホスト間でプロセス間同期を実行すべきタイミングである「同期待ちポイント」に到達すると、各ホスト1a〜1fはホスト情報を含むメッセージを送信して同期待ちの状態となる。その後、後述する同期監視装置2によって、各ホスト1a〜1fの同期待ちの解除がなされる。
各ホスト1a〜1fは、同期待ちが解除されると、異なるグループ間で各所属ホストの処理するプロセス間の同期を取って、共有情報へのアクセスに衝突がないように相互に同期タイミングを取りながら並列処理を行うことで、異なるグループ間の各所属ホストの協調作業により、所定の一連のタスクが遂行される。
なお、ホスト間でプロセス間同期が行われるまでの間に、各ホストが発する同期呼び出しの数(以下、同期呼び出し数と呼ぶ)は通常ホスト毎に異なり、各ホストの同期待ち時間は必ずしも一様ではない。
Until the inter-process synchronization is performed between the hosts 1a to 1f, each host obtains a synchronization waiting state. For example, when each host 1a to 1f issues a required number of synchronous calls and reaches a "synchronization wait point" that is a timing at which inter-process synchronization should be executed between different hosts, each host 1a to 1f receives host information. A message containing is sent to the synchronization wait state. Thereafter, the synchronization monitoring device 2 described later releases the synchronization wait of each of the hosts 1a to 1f.
When the host 1a to 1f is released from the synchronization wait state, it synchronizes between the processes processed by each host belonging to different groups and sets the synchronization timing so that there is no collision in access to the shared information. However, by performing parallel processing, a predetermined series of tasks is performed by the cooperative work of the hosts belonging to different groups.
Note that the number of synchronous calls issued by each host (hereinafter referred to as the number of synchronous calls) before the inter-process synchronization is performed between the hosts is usually different for each host, and the synchronization waiting time of each host is not necessarily uniform. is not.

同期監視装置2は、ネットワーク6を介して各ホスト(1a〜1f)に接続される。また、図2(b)に示すように同期監視装置2は、主要な処理を行うメイン制御部(図示せず)と、同期呼び出し認識部21と、記憶部22と、再起動認識部23と、書き込み部24と、同期待ち判定部25と、同期待ち解除指示部26を具備している。   The synchronization monitoring device 2 is connected to each host (1a to 1f) via the network 6. 2B, the synchronization monitoring device 2 includes a main control unit (not shown) that performs main processing, a synchronous call recognition unit 21, a storage unit 22, and a restart recognition unit 23. , A writing unit 24, a synchronization waiting determination unit 25, and a synchronization waiting release instruction unit 26.

同期監視装置2の同期呼び出し認識部21は、各ホスト(1a〜1f)からの同期呼び出しを認識する手段である。同期呼び出し認識部21は、常用系ホスト群3aと待機系ホスト群3bを区別して、各ホスト1a〜1fからの同期呼び出しを認識する。   The synchronous call recognition unit 21 of the synchronous monitoring device 2 is means for recognizing a synchronous call from each host (1a to 1f). The synchronous call recognizing unit 21 recognizes the synchronous call from each of the hosts 1a to 1f by distinguishing between the normal host group 3a and the standby host group 3b.

同期監視装置2の保持する記憶部22は、常用系ホスト群3aと待機系ホスト群3bに接続され、各ホストのシステム状態を記録及び再生する。また、図2(c)に示すように、記憶部22が保持する一部のデータ領域には、各グループ(4a〜4c)の常用系及び待機系毎に区分けされたカウンタからなる、マトリクス表7が構成されている。このマトリクス表7のカウンタには、グループ(4a〜4c)毎に、常用系及び待機系別の「同期呼び出し数」のカウント値(同期呼び出しの発生数を累積した計数値)がそれぞれ計上され、記憶保持される。マトリクス表7への値の書き込みは書き込み部24によって行われる。   The storage unit 22 held by the synchronization monitoring device 2 is connected to the active host group 3a and the standby host group 3b, and records and reproduces the system state of each host. Further, as shown in FIG. 2C, a part of the data area held by the storage unit 22 includes a matrix table composed of counters divided for the normal system and the standby system of each group (4a to 4c). 7 is configured. In the counter of the matrix table 7, for each group (4a to 4c), a count value of “synchronous call” for each of the active system and the standby system (a count value obtained by accumulating the number of generated synchronous calls) is recorded. Retained. Writing of values to the matrix table 7 is performed by the writing unit 24.

また、図2(c)に示すように、記憶部22が保持するデータ領域には、同期呼び出し総数領域8が設定されている。この同期呼び出し総数領域8には、常用系だけの呼び出し数の総和で設定される「同期呼び出し総数」の値が記憶保持される。同期呼び出し総数領域8への値の書き込みは書き込み部24によって行われる。   As shown in FIG. 2C, the synchronous call total area 8 is set in the data area held by the storage unit 22. The total number of synchronous calls 8 stores and holds the value of “total number of synchronous calls” set as the sum of the numbers of calls only for the regular system. The writing unit 24 writes a value in the synchronous call total area 8.

同期監視装置2の再起動認識部23は、各ホスト1a〜1fが再起動したことを認識する手段である。再起動認識部23は、常用系から待機系へのホストの切り替わりのタイミングで、切り替わりによって新たに待機系となる元の常用系ホストの再起動を認識すると、マトリクス表7のデータ領域にアクセスし、切替えられる元の常用系ホストが属するグループにおける、待機系ホストのプロセス間同期呼び出し数を、0にリセットする。なお、常用系と待機系の切り替えが起こると、切り替わった方のホストは新たに常用系となり、切替えられて再起動する方のホストは新たに待機系となる。   The restart recognition unit 23 of the synchronization monitoring device 2 is means for recognizing that each of the hosts 1a to 1f has been restarted. When the restart recognition unit 23 recognizes the restart of the original active host that becomes the standby system at the timing of switching of the host from the active system to the standby system, it accesses the data area of the matrix table 7. The number of inter-process synchronous calls of the standby host in the group to which the original active host to be switched belongs is reset to zero. When switching between the active system and the standby system occurs, the host that has been switched becomes a new active system, and the host that is switched and restarted becomes a new standby system.

また、同期監視装置2の同期待ち判定部25は、タスクが同期待ちになったことを判定する手段である。例えば、何れかのホストのタスクが同期待ちポイントに到達したら、当該ホストのタスクは同期監視装置2の同期待ち判定部25に自身のホスト情報を含むメッセージを送信することで、同期待ち判定部25は当該タスクが同期待ちになったことを認識して、判定が行われる。   The synchronization wait determination unit 25 of the synchronization monitoring device 2 is means for determining that a task has been waiting for synchronization. For example, when a task of any host reaches the synchronization waiting point, the task of the host transmits a message including its host information to the synchronization waiting determination unit 25 of the synchronization monitoring device 2, thereby causing the synchronization waiting determination unit 25. Recognizes that the task is waiting for synchronization and makes a determination.

同期監視装置2の同期待ち解除指示部26は、同期待ち解除の条件が整うと、同期待ち解除の命令を任意のホストに指示する手段である。例えば、同期監視装置2は、同期待ち判定部25によってタスクが同期待ちになったことが判定され、かつ同期待ち解除の条件が整ったことを認識すると、ホストへ同期待ち解除を指示するメッセージを送信する。ホスト側では、このメッセージを受信すると同期待ちを解除する。   The synchronization wait release instructing unit 26 of the synchronization monitoring device 2 is means for instructing an arbitrary host to issue a synchronization wait release instruction when the conditions for releasing the synchronization wait are satisfied. For example, when the synchronization monitoring apparatus 2 determines that the task is waiting for synchronization and the synchronization waiting determination unit 25 recognizes that the condition for releasing synchronization waiting is satisfied, the synchronization monitoring apparatus 2 sends a message to the host to release the synchronization waiting. Send. When receiving this message, the host releases the synchronization wait.

次に、実施の形態1による同期監視装置2の動作の一例について、以下に説明する。
この動作例では、常用系ホスト1aは同期待ちが必要なタスク数(以下、同期待ち数と呼ぶ)が3つあり、ホスト1cは同期待ち数が4つあり、ホスト1eは同期待ち数が2つあるとした場合を想定する。
つまり、ホスト間でプロセス間同期を行うタイミングに到達して、同期待ちが解除される「同期待ち解除の条件」は、同期待ち状態になったタスクの総数が9になったときである。この値は、常用系ホスト1aの同期待ち数3と、常用系ホスト1bの同期待ち数4と、常用系ホスト1aの同期待ち数2の和に相当する(すなわち、9=3+4+2である)。
この同期呼び出し総数が例えば9であることは、システム設計時に確定する情報であるため、同期監視装置2は、予めプロセス間同期の同期呼び出し総数を9として記憶するために、書き込み部24により同期呼び出し総数領域8にこのプロセス間同期の呼び出し総数の値9を書き込んでいる。
なお、同期待ち数は、同期待ちが解除されるまでの間に、各ホスト1a〜1fが必要とする同期呼び出し数の計数値に相当する。タスクが同期待ちになったときは、「同期呼び出し数」の計数値は、同期待ち数に一致することとなる。
Next, an example of the operation of the synchronization monitoring device 2 according to the first embodiment will be described below.
In this operation example, the active host 1a has three tasks that need to wait for synchronization (hereinafter referred to as the number of synchronization waits), the host 1c has four synchronization waits, and the host 1e has two synchronization waits. Assume that there are two cases.
That is, the “synchronization wait release condition” in which the synchronization wait state is released when the timing for performing the inter-process synchronization between the hosts is reached is when the total number of tasks in the synchronization wait state becomes nine. This value corresponds to the sum of the synchronization waiting number 3 of the active host 1a, the synchronization waiting number 4 of the active host 1b, and the synchronization waiting number 2 of the active host 1a (that is, 9 = 3 + 4 + 2).
The fact that the total number of synchronous calls is 9, for example, is information determined at the time of system design. Therefore, the synchronization monitoring device 2 uses the write unit 24 to synchronously call the total number of synchronous calls for inter-process synchronization as 9 in advance. The value 9 of the total number of calls for interprocess synchronization is written in the total number area 8.
The number of synchronization waits corresponds to the count value of the number of synchronous calls required by each of the hosts 1a to 1f until the synchronization wait is canceled. When the task waits for synchronization, the count value of “synchronous call count” matches the synchronization wait number.

図2は、実施の形態1による同期監視装置2の動作例を示すフローチャートである。
図において、同期監視装置2は、同期呼び出し認識部21にて、各ホスト1a〜1fからの同期呼び出しがなされたか否かを監視する処理を行う(ステップS100)。
監視の結果、同期呼び出しがなされたことを検出すると、記憶部22にアクセスして、同期呼び出しを実施したホストのマトリクス表7における、該当するカウンタの「同期呼び出し数」のカウント値を、1つインクリメント(カウントアップ)する(ステップS101)。
FIG. 2 is a flowchart showing an operation example of the synchronization monitoring apparatus 2 according to the first embodiment.
In the figure, the synchronization monitoring device 2 performs a process of monitoring whether or not a synchronous call from each of the hosts 1a to 1f has been made by the synchronous call recognition unit 21 (step S100).
As a result of monitoring, when it is detected that a synchronous call has been made, the storage unit 22 is accessed, and the count value of “synchronous call number” of the corresponding counter in the matrix table 7 of the host that has executed the synchronous call is set to one. Increment (count up) (step S101).

次に、同期監視装置2は、ホストが常用系ホスト群3aと待機系ホスト群3bの何れに属するホストであるかを判定する(ステップS102)。
ステップS102の判定の結果、常用系ホスト群3aに属する常用系ホストであった場合は、マトリクス表7にアクセスし、全グループの常用系ホスト1a、1c、1eに対応したカウンタの同期呼び出し数の総和を求め、求めた総和に基づいて、常用系ホストの「同期待ちの解除条件」を満足するか否かの判定を行う(ステップS103)。
ここでは、「全グループの常用系ホストの同期呼び出し数の総和が、同期呼び出し総数領域8に記憶された値(予め設定された同期呼び出し総数)に一致している」ことが、常用系ホストの同期待ちの解除条件を満足する判定条件となる。
Next, the synchronization monitoring device 2 determines whether the host belongs to the active host group 3a or the standby host group 3b (step S102).
If the result of determination in step S102 is that the active host belongs to the active host group 3a, the matrix table 7 is accessed and the number of synchronous calls of the counters corresponding to the active hosts 1a, 1c, and 1e of all groups is determined. The sum is obtained, and based on the obtained sum, it is determined whether or not the “synchronization waiting release condition” of the active host is satisfied (step S103).
Here, “the total sum of the synchronous calls of the active hosts of all groups matches the value stored in the synchronous call total number area 8 (the preset total number of synchronous calls)” This is a determination condition that satisfies the synchronization wait cancellation condition.

ステップS103の判定の結果、常用系ホストの同期待ちの解除条件が満足される、すなわち「全グループの常用系ホストの同期呼び出し数の総和が同期呼び出し総数領域8の値に一致」となった段階で、同期監視装置2の同期待ち解除指示部26は、常用系ホスト群3aの全てのホスト1a、1c、1eに対して、同期待ちの解除の命令を指示する(ステップS104)。
また、「全グループの常用系ホストの同期呼び出し数の総和が同期呼び出し総数領域8の値に不一致」となった場合は、ステップS100に立ち戻り、引き続き同期呼び出し認識部21による監視処理が行われる。
As a result of the determination in step S103, the release condition for waiting for synchronization of the active hosts is satisfied, that is, “the sum of the synchronous calls of the active hosts in all groups matches the value in the synchronous call total area 8” Thus, the synchronization wait cancellation instructing unit 26 of the synchronization monitoring device 2 instructs all hosts 1a, 1c, and 1e in the active host group 3a to release the synchronization wait (step S104).
If “the total number of synchronous calls of the active hosts in all groups does not match the value in the synchronous call total area 8”, the process returns to step S100, and the monitoring process by the synchronous call recognition unit 21 is continued.

一方、ステップS102の判定の結果、待機系ホスト群3bに属する待機系ホストであった場合は、同期監視装置2がステップS105の処理を行う。
ステップS105では、待機系ホストが「同期待ちの解除条件」を満足しているか否かの判定が行われる。
On the other hand, if the result of determination in step S102 is that the host is a standby host belonging to the standby host group 3b, the synchronization monitoring device 2 performs the process of step S105.
In step S105, it is determined whether or not the standby host satisfies the “synchronization wait cancellation condition”.

この待機系ホストの「同期待ちの解除条件」は、常用系ホストとは異なる。
ここでの「同期待ちの解除条件」は、「常用系ホストが同期解除済みの状態であって、かつその状態で待機系ホストの属するグループの対をなす常用系ホストの同期呼び出し数の計数値(この場合同期待ち数となる)と同じ数の同期呼び出し数の計数値が、マトリクス表7のカウンタに設定されている」こととなっている。
また、この場合、同期監視装置2の同期待ち判定部25によって、タスクが同期待ちになったことが認識されたときに、「常用系ホストが同期解除済み」の状態となる。
The “synchronization wait release condition” of this standby host is different from that of the regular host.
The "synchronization wait release condition" here means "count value of the number of synchronous calls of the active host that is paired with the group to which the standby host belongs in the state where the active host has been released from synchronization" The count value of the number of synchronous calls equal to (in this case, the number of waiting for synchronization) is set in the counter of the matrix table 7 ”.
Further, in this case, when the synchronization waiting determination unit 25 of the synchronization monitoring device 2 recognizes that the task is waiting for synchronization, the state becomes the state that “the active host has been released from synchronization”.

判定の結果、待機系ホストが「同期待ちの解除条件」を満足している場合、その待機系ホストに対してのみ同期が解除される(ステップS106)。   If the standby host satisfies the “synchronization waiting cancellation condition” as a result of the determination, the synchronization is canceled only for the standby host (step S106).

ここで、同期監視装置2は、グループごとに常用系の同期呼び出し数のカウント値(計数値)を集計しているので、待機系が同期状態を解除するのに必要な、同期待ち数を認識することができる。
例えば、待機系の同期解除の条件となる、全総数で9回の同期呼び出しを行ったときの、各ホストの同期呼び出し数の計数値(すなわち同期待ち数)の内訳は、グループ4aが3、グループ4bが4、グループ4cが2となる。
したがって、待機系のホスト1bは、常用系のホスト1aの同期が解除されているという条件と、同期待ち数が3となった場合に、同期待ちが解除される。同様に、待機系のホスト1dは、同期待ち数が4となったとき、待機系のホスト1fは、同期待ち数が2となったときに、それぞれ同期監視装置2の同期待ち解除指示部26によって同期待ちの解除がなされる。
Here, since the synchronization monitoring device 2 counts the count value (count value) of the number of regular synchronization calls for each group, the synchronization monitoring device 2 recognizes the number of synchronization waits required for the standby system to release the synchronization state. can do.
For example, the breakdown of the count value of the number of synchronous calls of each host (that is, the number of synchronization waits) when the total number of synchronous calls is nine, which is a condition for releasing synchronization of the standby system, is 3 for group 4a, The group 4b is 4, and the group 4c is 2.
Therefore, the standby host 1b is released from the synchronization wait when the synchronization with the active host 1a is released and the number of synchronization waits is 3. Similarly, the standby host 1d has a synchronization wait number of 4, and the standby host 1f has a synchronization wait release instruction unit 26 of the synchronization monitoring device 2 when the synchronization wait number is 2, respectively. Is used to cancel the synchronization wait.

なお、一度、常用系の同期解除条件が成立すると、マトリクス表7の各常用系ホストにおける、同期呼び出し総数を得るための同期待ち数の値は、固定化する。常用系と待機系の切り替えなどで、ホストが再起動する場合は、再起動する側のホストは新たに待機系となって起動する。   Once the normal system synchronization release condition is satisfied, the value of the number of synchronization waits for obtaining the total number of synchronous calls in each normal system host in the matrix table 7 is fixed. When the host is restarted due to switching between the active system and the standby system, the restarting host starts as a new standby system.

図3は、同期監視装置2が常用系と待機系の切り替えを検出した場合の処理について示している。
同期監視装置2の再起動認識部23は、常用系と待機系の切り替えによって、新たに待機系となる元の常用系ホストの再起動を検出すると、待機系の同期呼び出し数を0にリセットする(ステップS200)。
新たに待機系となる元の常用系ホストが再起動してくると、図2と同じ処理によって、新たな待機系ホストの同期呼び出し数の計数値が、待機系の同期待ちの解除条件と一致して、待機系ホストの同期呼び出し数の計数値が常用系ホストの同期待ち数と同じ値になると、同期待ちが解除される。
FIG. 3 shows processing when the synchronization monitoring device 2 detects switching between the normal system and the standby system.
The restart recognition unit 23 of the synchronization monitoring device 2 resets the number of synchronous calls of the standby system to 0 when it detects the restart of the original active host that becomes the standby system by switching between the active system and the standby system. (Step S200).
When the original active host that newly becomes the standby system is restarted, the count value of the number of synchronous calls of the new standby system becomes equal to the release condition for the standby system synchronization wait by the same processing as in FIG. Then, when the count value of the number of synchronous calls of the standby host becomes the same value as the synchronization wait number of the active host, the synchronization wait is released.

ここで、常用系と待機系の区別は、最初の起動時にはホストにあらかじめ割り振られているが、ホストに対して常に固定化されているものではなく、上記した通り、常用系と待機系の切り替えによって、同じグループ内のホストで役割が切り替わることとなる。
常用系ホストの同期待ちの解除条件は待機系ホストの同期待ちの解除条件に依存しないため、待機系ホストが異常となっても同期待ちが解除されない状態にはならない。このため、常用系ホストさえ条件が整えば、同期待ちの解除が達成され、不要なタイムアウト待ちを無くすことができる。
Here, the distinction between the active system and the standby system is pre-allocated to the host at the first startup, but it is not always fixed to the host. As a result, the roles of hosts in the same group are switched.
Since the standby wait cancellation condition of the primary host does not depend on the standby wait cancellation condition of the standby host, even if the standby host becomes abnormal, the synchronization wait is not released. For this reason, as long as the conditions for the regular host are satisfied, the cancellation of the synchronization wait can be achieved, and the unnecessary timeout wait can be eliminated.

なお、待機系ホストの同期待ち解除は、常用系ホストの同期待ちの解除よりも遅れることがあり得る。このため実施の形態1では、常用系ホストが同期待ちの解除後、即座に異常を発生すると待機系ホストへの切り替え時に、待機系ホストが同期待ちの解除条件に到達していないことから、その切り替えに支障をきたすことが可能性としてあり得る。
しかし、同じグループのホストでは同じ処理が実行されている関係上、常用系ホストが同期待ちの解除に到達するタイミングよりそれほど遅れることなく、待機系ホストが同期待ちの解除の条件に到達することが想定される。このため、常用系ホストの同期待ちの解除の直後に、常用系ホストの異常が発生して常用系と待機系のホストの切り替えが発生しない限りは、このような事象が問題となることはなく、その可能性は僅少であり実質的な問題はない。
Note that the standby wait release of the standby host may be delayed from the release of the standby wait of the active host. For this reason, in the first embodiment, if an abnormality occurs immediately after the active host cancels the synchronization wait, the standby host does not reach the synchronization wait cancellation condition when switching to the standby host. There is a possibility that the switching may be hindered.
However, because the same processing is being executed on the hosts in the same group, the standby host may reach the condition for releasing the synchronization wait without lagging behind the timing when the active host reaches the release of the synchronization wait. is assumed. For this reason, such an event will not cause a problem unless the primary host fails and the primary host and standby host are switched immediately after the standby synchronization of the primary host is released. The possibility is small and there is no substantial problem.

以上説明した通り、実施の形態1によるプロセス間同期方法は、常用系及び待機系ホストからなる組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組のプロセス間で同期待ちの状態から同期待ち解除の状態を得てタイミング調整を行い、プロセス間の同期を取るプロセス間同期方法であって、上記各ホストが同期待ちを解除するまでに実行する所定のタスク数の進行に応じて、各ホストが発する同期呼び出し数を、それぞれの組毎に常用系及び待機系を区別して計数するステップと、上記常用系ホストの発した同期呼び出し数の計数値の全組の総数が、予め規定された値に一致したときに、常用系ホストの同期待ちを解除するステップと、上記待機系ホストの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の常用系ホストの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、待機系ホストの同期待ちを解除するステップと、を備えたことを特徴とする。   As described above, the inter-process synchronization method according to the first embodiment includes a plurality of sets including the normal system and the standby system host, and in the computer system including the synchronization monitoring device, the synchronization wait is performed between different sets of processes. This is an inter-process synchronization method that obtains the synchronization wait release state from the status and adjusts the timing to synchronize the processes, and according to the progress of a predetermined number of tasks executed by each of the hosts before releasing the synchronization wait And counting the number of synchronous calls issued by each host by distinguishing between the active system and the standby system for each group, and the total number of the total number of synchronous call counts issued by the above-mentioned active host When the value matches the specified value, the step of canceling the synchronization wait of the active host and the count value of the number of synchronous calls issued by the standby host And a step of releasing the standby waiting of the standby host when the same value as the count of the number of synchronous calls when the standby waiting of the active host in the same group as the host is released is provided. .

これによって、常用系ホストの同期待ちの解除条件が待機系ホストの同期待ちの解除条件に依存しないので、不要なタイムアウト待ちを無くすことができ、タイムアウトに依存しないプロセス間同期方法を得ることができるという効果が得られる。   As a result, the waiting condition for releasing the synchronization wait for the active host does not depend on the waiting condition for waiting for the synchronization of the standby host, so that unnecessary timeout waiting can be eliminated and an inter-process synchronization method that does not depend on timeout can be obtained. The effect is obtained.

実施の形態2.
この発明に係る実施の形態2による計算機システムの同期監視装置2では、常用系ホストの同期待ちの解除条件として、実施の形態1の条件と合わせて、同じグループ内の待機系ホストの同期待ちの解除条件が揃ったことを、条件に加えている。
Embodiment 2. FIG.
In the computer system synchronization monitoring apparatus 2 according to the second embodiment of the present invention, the synchronization wait for the standby hosts in the same group is set as the condition for releasing the synchronization wait for the active host in addition to the condition for the first embodiment. The fact that the release conditions are complete is added to the conditions.

図4は、実施の形態2による同期監視装置2の動作を示すフローチャートである。
図2で説明した実施の形態1のフローチャートと比べて、実施の形態2では、ステップS104がステップS104−2に代わっている。なお、その他のステップは同じであるので、説明を略す。
FIG. 4 is a flowchart showing the operation of the synchronization monitoring apparatus 2 according to the second embodiment.
Compared with the flowchart of the first embodiment described in FIG. 2, in the second embodiment, step S104 is replaced with step S104-2. Since other steps are the same, description thereof is omitted.

図4のステップS104−2では、ステップS103の条件が成立することに加えて、同じグループの常用系ホストと対を成す待機系ホストの同期待ちの解除条件が成立している場合のみ、該当する常用系ホストの同期待ちが解除されるように、条件判定の処理が行われる。すなわちこの場合、同じグループの常用系ホストと対を成す待機系ホストとの間で、同期呼び出し数のカウント値(計数値)が一致することとなる。   In step S104-2 in FIG. 4, in addition to the condition in step S103 being satisfied, this is applicable only when the condition for canceling the synchronization wait of the standby host that is paired with the regular host in the same group is satisfied. Condition determination processing is performed so that the synchronization wait of the active host is released. That is, in this case, the count value (count value) of the number of synchronous calls coincides with the standby host paired with the regular host in the same group.

実施の形態2では、常用系ホストは対となる待機系ホストの同期待ちが解除されるまで待機するため、同期待ちが解除された直後に、常用系ホストで異常が発生したときは、待機系ホストへの切り替えが発生しても、待機系ホストが同期ポイントに到達していることを確実に保証することができる。   In the second embodiment, the active host waits until the synchronization waiting of the paired standby host is released. Therefore, when an error occurs in the active host immediately after the synchronization waiting is released, the standby host Even if the switch to the host occurs, it can be ensured that the standby host has reached the synchronization point.

このように実施の形態2では、待機系ホストが異常などによって同期ポイントに規定数到達できないケースを想定して、常用系ホストが待機系ホストの同期待ち数への到達を待機できる最大タイムアウト時間を規定して、タイムアウトが発生した場合には、待機系の同期待ちが完了するのを待つことなく、同期待ちを解除するための仕組みを備えたことを特徴する。   As described above, in the second embodiment, assuming that the standby host cannot reach the synchronization point due to an abnormality or the like, the maximum timeout period during which the active host can wait for the standby host to reach the synchronization wait number is set. It is characterized by having a mechanism for canceling the waiting for synchronization without waiting for the waiting for synchronization of the standby system to be completed when a timeout occurs.

このようにすることで、不必要に長いタイムアウト時間によるフォールトトレラントシステムのハングアップを回避することができる。また、実施の形態2では、従来のプロセス間同期方法と比べて、タイムアウト待ちの範囲を同一のグループ内に限定できるため、より短い適切なタイムアウト時間を設定できるので、より適切に同期待ちの解除を行うことができるようになる。   By doing so, it is possible to avoid the hang-up of the fault tolerant system due to an unnecessarily long timeout time. Further, in the second embodiment, compared to the conventional inter-process synchronization method, the time-out waiting range can be limited to the same group, so a shorter appropriate time-out time can be set. Will be able to do.

以上説明した通り、実施の形態2によるプロセス間同期方法は、複数のホストから構成される組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組のプロセス間で同期待ちの状態から同期待ち解除の状態を得てタイミング調整を行い、プロセス間の同期を取るプロセス間同期方法であって、上記各ホストが同期待ちを解除するまでに実行する所定のタスク数の進行に応じて、各ホストが発する同期呼び出し数を、それぞれの組毎かつホスト毎に区別して計数するステップと、同じ組内で上記各ホストの発した同期呼び出し数の計数値の最大値を選び、当該最大値について全組の総和を取り、当該総和が予め規定された値に一致したときに、組毎に当該最大値を与えるそれぞれのホストを常用系ホストとして、常用系ホストの同期待ちを解除するステップと、同じ組内で上記常用系ホスト以外となったホストを待機系ホストとし、当該待機系ホストの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の常用系ホストの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、当該待機系ホストの同期待ちを解除するステップと、を備えたことを特徴とする。   As described above, the inter-process synchronization method according to the second embodiment includes a plurality of sets composed of a plurality of hosts, and in a computer system including a synchronization monitoring device, a state of waiting for synchronization between different sets of processes. Is an inter-process synchronization method that adjusts timing by obtaining the state of synchronization wait release from the host, and synchronizes between processes, according to the progress of a predetermined number of tasks executed by each host before releasing the synchronization wait The step of counting the number of synchronous calls issued by each host separately for each group and for each host, and selecting the maximum value of the number of synchronous calls issued by each host in the same group, When the sum of all sets is taken for each set, and when the sum matches a predetermined value, each host that gives the maximum value for each set is defined as a regular host. The step of canceling the synchronization wait of the primary host and the host other than the primary host in the same group as the standby host, and the count value of the number of synchronous calls issued by the standby host is the standby host And a step of releasing the standby wait of the standby host when the same value as the count of the number of synchronous calls when the standby wait of the same set of active hosts is released. .

これによって、タイムアウト待ちの範囲を同一のグループ内に限定できるため、より短い適切なタイムアウト時間を設定できるという効果が得られる。   As a result, the time-out waiting range can be limited to the same group, so that an effect that a shorter appropriate time-out time can be set can be obtained.

実施の形態3.
この発明に係る実施の形態3による計算機システムでは、ホストの起動時に、グループ内のどちらのホストが常用系と待機系になるのかを予め決めることなしに同期待ちを開始して、同期監視装置2が、全グループの何れかのホストの同期呼び出し数のカウント値(計数値)の総和が予め設定された同期呼び出し総数に到達したことを検出したときに、各グループで最大の同期呼び出し数(この場合同期待ち数になる)に到達したものを常用系ホストと定義して、常用系ホストの同期待ちを解除することを特徴とする。このようにすることで、同期が取れるまでに要する時間を最短にすることができる。
Embodiment 3 FIG.
In the computer system according to the third embodiment of the present invention, when the host is started, the synchronization monitoring device 2 starts synchronization waiting without predetermining which host in the group will be the active system and the standby system. When it is detected that the sum of the count values (count values) of the number of synchronous calls of any host in all groups has reached the preset total number of synchronous calls, the maximum number of synchronous calls in each group (this In this case, the host that has reached the number of waiting for synchronization) is defined as the active host, and the waiting for synchronization of the active host is released. By doing so, it is possible to minimize the time required for synchronization.

つまり、実施の形態3では、常用系及び待機系ホストが動的に決定され、最も早く同期待ちの解除の条件がそろったものを常用系ホストとするため、常用系ホストの同期待ちの解除にかかる時間も最も早くできる。   In other words, in the third embodiment, the active host and the standby host are dynamically determined, and the host that has the conditions for releasing the synchronization wait earliest is used as the active host. This time can be the fastest.

図5は、実施の形態3による計算機システムの同期監視装置2の処理を示すフローチャートである。
ステップS300では、各ホストからの同期呼び出しを受けて、同期呼び出しを受け付けると、マトリクス表7の該当ホストの同期呼び出し数のカウンタを1インクリメントする。
FIG. 5 is a flowchart showing processing of the synchronization monitoring device 2 of the computer system according to the third embodiment.
In step S300, upon receiving a synchronous call from each host and receiving the synchronous call, the counter of the number of synchronous calls of the corresponding host in the matrix table 7 is incremented by one.

しかし、該当ホストが常用系か待機系の何れであるかは確定していないので、暫定常用系または暫定待機系としてカウンタをインクリメントする(ステップS301)。
次に、各グループの同期呼び出し数のカウンタのカウント値(計数数)が最大値となる値を抽出し、全グループから抽出された各カウント値の最大値を合計する計算を行って、計算された合計値が規定数の同期呼び出し総数領域8の値と一致しているか否かを確認する(ステップS302)。
However, since it is not determined whether the corresponding host is the regular system or the standby system, the counter is incremented as a temporary regular system or a provisional standby system (step S301).
Next, the value that maximizes the count value (count) of the counter for the number of synchronous calls in each group is extracted, and the sum of the maximum values of each count value extracted from all groups is calculated. It is confirmed whether or not the total value matches the value of the prescribed number of synchronous call total area 8 (step S302).

確認の結果、これが一致した場合は、同期待ちの解除に必要な組み合わせがあることを示すため、各グループ内で同期呼び出し数のカウント値の最大値を与えるホストを、常用系ホストとして扱う。   If they match as a result of confirmation, this indicates that there is a combination necessary for canceling the synchronization wait, so that the host that gives the maximum count value of the number of synchronous calls in each group is treated as a regular host.

このとき、もしも暫定待機系ホストのカウンタ値が最大値になっている場合は、マトリクス表7の常用系の値と待機系の値を入れ替える(ステップS303)。
これで常用系の同期待ちの解除条件が揃うので、常用系に確定したホストの同期待ちを解除する(ステップS304)。
この後の処理は、実施の形態1で説明した図2のフローチャートと同じ処理フローとなるので、説明を略す。
At this time, if the counter value of the temporary standby host is the maximum value, the value of the normal system and the value of the standby system in the matrix table 7 are exchanged (step S303).
Now that the conditions for releasing the waiting for synchronization of the normal system are met, the waiting for synchronization of the host determined as the active system is released (step S304).
Since the subsequent processing is the same processing flow as the flowchart of FIG. 2 described in the first embodiment, description thereof is omitted.

以上説明した通り、実施の形態3によるプロセス間同期方法は、複数のホストから構成される組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組のプロセス間で同期待ちの状態から同期待ち解除の状態を得てタイミング調整を行い、プロセス間の同期を取るプロセス間同期方法であって、上記各ホストが同期待ちを解除するまでに実行する所定のタスク数の進行に応じて、各ホストが発する同期呼び出し数を、それぞれの組毎かつホスト毎に区別して計数するステップと、同じ組内で上記各ホストの発した同期呼び出し数の計数値の最大値を選び、当該最大値について全組の総和を取り、当該総和が予め規定された値に一致したときに、組毎に当該最大値を与えるそれぞれのホストを常用系ホストとして、常用系ホストの同期待ちを解除するステップと、同じ組内で上記常用系ホスト以外となったホストを待機系ホストとし、当該待機系ホストの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の常用系ホストの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、当該待機系ホストの同期待ちを解除するステップと、を備えたことを特徴とする。   As described above, the inter-process synchronization method according to the third embodiment includes a plurality of sets composed of a plurality of hosts, and in a computer system including a synchronization monitoring device, a state of waiting for synchronization between different sets of processes. Is an inter-process synchronization method that adjusts timing by obtaining the state of synchronization wait release from the host, and synchronizes between processes, according to the progress of a predetermined number of tasks executed by each host before releasing the synchronization wait The step of counting the number of synchronous calls issued by each host separately for each group and for each host, and selecting the maximum value of the number of synchronous calls issued by each host in the same group, When the sum of all sets is taken for each set, and when the sum matches a predetermined value, each host that gives the maximum value for each set is defined as a regular host. The step of canceling the synchronization wait of the primary host and the host other than the primary host in the same group as the standby host, and the count value of the number of synchronous calls issued by the standby host is the standby host And a step of releasing the standby wait of the standby host when the same value as the count of the number of synchronous calls when the standby wait of the same set of active hosts is released. .

これによって、実施の形態1の効果に加えて、同期が取れるまでに要する時間を最短にすることができるという効果が得られる。   As a result, in addition to the effect of the first embodiment, the effect that the time required until synchronization can be minimized can be obtained.

信頼性が求められる計算機システムでは、一部の計算機が故障しても処理が継続できるように、フォールトトレラントシステムを構成する。一方、規模の大きな計算機システムでは、各計算機間でプログラムが連携するために、同期を取りながら並列処理を行う必要性がある。
上記実施の形態1乃至3で説明したプロセス間同期方法は、フォールトトレラントシステムをなした計算機システムを構成する、各計算機間のプログラムについて、同期処理を行うために利用することが可能である。
In a computer system that requires reliability, a fault tolerant system is configured so that processing can be continued even if some computers fail. On the other hand, in a large-scale computer system, it is necessary to perform parallel processing while maintaining synchronization because the programs are linked between the computers.
The inter-process synchronization method described in the first to third embodiments can be used for performing a synchronization process on a program between computers constituting a computer system that forms a fault-tolerant system.

1a〜1f ホスト、2 同期監視装置、3a 常用系を構成するホスト群、3b 待機系を構成するホスト群、4a〜4c 常用系及び待機系のグループ(組)を構成するホスト群、5a 常用系の同期解除指示、5b 待機系の同期解除指示、6 同期呼び出し指示、7 マトリクス表、8 同期呼び出し総数領域。   1a to 1f Host, 2 Synchronization monitoring device, 3a Host group constituting the active system, 3b Host group constituting the standby system, 4a to 4c Host group constituting the normal system and standby system group (set), 5a Regular system Synchronization release instruction, 5b Standby system synchronization release instruction, 6 Synchronous call instruction, 7 Matrix table, 8 Synchronous call total area.

Claims (3)

常用系及び待機系ホストからなる組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組の常用系及び待機系ホストのプロセス間の同期を取るプロセス間同期方法であって、
上記同期監視装置が、上記各常用系及び待機系ホストが同期待ちの状態から同期待ちの状態を解除するまでの間に、上記常用系及び待機系ホストの各プロセスが発する同期呼び出し数を、それぞれの組毎に常用系及び待機系を区別して計数するステップと、
上記同期監視装置が、上記常用系ホストのプロセスが発した同期呼び出し数の計数値の全組の総数が、予め規定された値に一致したときに、全組の常用系ホストのプロセスの同期待ちを解除するステップと、
上記同期監視装置が、上記待機系ホストのプロセスが発した同期呼び出し数の計数値が、当該待機系ホストと同一組の上記常用系ホストのプロセスの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、当該待機系ホストのプロセスの同期待ちを解除するステップと、
を備えたプロセス間同期方法。
A computer system having a plurality of sets of active and standby hosts, and a computer system having a synchronization monitoring device, an inter-process synchronization method for synchronizing the processes of different sets of active and standby hosts ,
The number of synchronous calls issued by each process of the active system and the standby system host until each of the active system and the standby system host cancels the synchronization standby state from the synchronization standby state, respectively, A step of distinguishing and counting a normal system and a standby system for each set of
When the total number of all counts of the synchronous call counts issued by the active host process matches the predetermined value, the synchronization monitoring device waits for synchronization of all the active host processes. The step of releasing
The synchronization monitoring device, process synchronization call number of counts that originated in the standby host, synchronous call number when a synchronization wait process of the standby host and the same set of the conventional system host is released when it becomes equal to the count value, and releasing the synchronization wait process of the standby host,
With inter-process synchronization.
複数のホストから構成される組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組の上記各ホストのプロセス間の同期を取るプロセス間同期方法であって、
上記同期監視装置が、上記各常用系及び待機系ホストが同期待ちの状態から同期待ちの状態を解除するまでの間に、上記各ホストのプロセスが発する同期呼び出し数を、それぞれの組毎かつホスト毎に区別して計数するステップと、
上記同期監視装置が、同じ組内で上記各ホストの発した同期呼び出し数の計数値の最大値を選び、当該最大値について全組の総和を取り、当該総和が予め規定された値に一致したときに、組毎に当該最大値を与えるそれぞれのホストを常用系ホストとして、常用系ホストのプロセスの同期待ちを解除するステップと、
上記同期監視装置が、同じ組内で上記常用系ホスト以外となったホストを待機系ホストとし、当該待機系ホストのプロセスの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の上記常用系ホストの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、当該待機系ホストの同期待ちを解除するステップと、
を備えたプロセス間同期方法。
In a computer system provided with a plurality of sets composed of a plurality of hosts and provided with a synchronization monitoring device, an inter-process synchronization method that synchronizes the processes of the respective hosts in different sets,
The synchronization monitoring device determines the number of synchronous calls issued by the processes of each host for each set and host until each of the active and standby hosts releases the synchronization waiting state from the synchronization waiting state. A step of counting each separately,
The synchronization monitoring device selects the maximum count value of the number of synchronous calls issued by each host in the same group, takes the sum of all the groups for the maximum value, and the sum matches the predetermined value. Sometimes, each host giving the maximum value for each group as an active host, releasing the process of waiting for synchronization of the process of the active host,
The synchronization monitoring device uses a host other than the regular host in the same group as a standby host, and the count value of the number of synchronous calls issued by the process of the standby host is the same as that of the standby host. when synchronization wait in the conventional system host is the same as the synchronization number of calls counted value when it is released, and releasing the synchronization wait in the standby host,
With inter-process synchronization.
常用系及び待機系ホストからなる組を複数組備えるとともに、同期監視装置を備えた計算機システムにおいて、異なる組の常用系及び待機系ホストのプロセス間の同期を取るプロセス間同期方法であって、
上記同期監視装置が、上記各常用系及び待機系ホストが同期待ちの状態から同期待ちの状態を解除するまでの間に、上記各ホストのプロセスが発する同期呼び出し数を、それぞれの組毎に常用系及び待機系を区別して計数するステップと、
上記同期監視装置が、上記常用系ホストのプロセスが発した同期呼び出し数の計数値の全組の総数が、予め規定された値に一致し、なおかつ当該常用系ホストと同一組の待機系ホストのプロセスの同期呼び出し数の計数値が、当該常用系ホストの同期呼び出し数の計数値と一致したときに、当該常用系ホストのプロセスの同期待ちを解除するステップと、
上記同期監視装置が、上記待機系ホストの発した同期呼び出し数の計数値が、当該待機系ホストと同一組の常用系ホストのプロセスの同期待ちが解除されるときの同期呼び出し数の計数値と同じになったとき、当該待機系ホストの同期待ちを解除するステップと、
を備えたプロセス間同期方法。
A computer system having a plurality of sets of active and standby hosts, and a computer system having a synchronization monitoring device, an inter-process synchronization method for synchronizing the processes of different sets of active and standby hosts ,
The synchronization monitoring device uses the number of synchronous calls issued by the processes of each host for each set until the respective active and standby hosts release the synchronization waiting state from the synchronization waiting state. Distinguishing and counting the system and the standby system;
The synchronization monitoring device, the total number of the entire set of process synchronous call number of the count values emitted in the conventional system host, matches the predefined value, yet the conventional system host the same set of standby host and synchronous call number of the count value of the process, if they match the synchronous call number of the count value of the conventional system host, and releasing the synchronization wait process of the conventional system host,
The synchronization monitoring device counts the number of synchronous calls issued by the standby host, and the count of synchronous calls when the process of the standby host in the same set as the standby host is released from the synchronization wait state. when it is the same, the step of releasing the synchronization wait in the standby host,
With inter-process synchronization.
JP2011056049A 2011-03-15 2011-03-15 Inter-process synchronization method Active JP5605279B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011056049A JP5605279B2 (en) 2011-03-15 2011-03-15 Inter-process synchronization method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011056049A JP5605279B2 (en) 2011-03-15 2011-03-15 Inter-process synchronization method

Publications (2)

Publication Number Publication Date
JP2012194615A JP2012194615A (en) 2012-10-11
JP5605279B2 true JP5605279B2 (en) 2014-10-15

Family

ID=47086490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011056049A Active JP5605279B2 (en) 2011-03-15 2011-03-15 Inter-process synchronization method

Country Status (1)

Country Link
JP (1) JP5605279B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7157709B2 (en) * 2019-07-04 2022-10-20 株式会社日立製作所 Computer system and program execution method
CN114978296B (en) * 2022-08-01 2022-11-15 成都星联芯通科技有限公司 Equipment switching method, device, earth station and readable storage medium

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249199A (en) * 1995-03-15 1996-09-27 N T T Data Tsushin Kk Inter-process delay time restricting method
JP2783192B2 (en) * 1995-06-21 1998-08-06 日本電気株式会社 Barrier synchronizer
JP2004030204A (en) * 2002-06-25 2004-01-29 Jmnet Inc Load distribution device and node computer connected to the same

Also Published As

Publication number Publication date
JP2012194615A (en) 2012-10-11

Similar Documents

Publication Publication Date Title
US10020980B2 (en) Arbitration processing method after cluster brain split, quorum storage apparatus, and system
JP4572250B2 (en) Computer switching method, computer switching program, and computer system
JP4529767B2 (en) Cluster configuration computer system and system reset method thereof
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
WO2016202051A1 (en) Method and device for managing active and backup nodes in communication system and high-availability cluster
JP2006011992A (en) System switching method of cluster configuration computer system
US9886358B2 (en) Information processing method, computer-readable recording medium, and information processing system
WO2017215430A1 (en) Node management method in cluster and node device
US9210059B2 (en) Cluster system
US20100268687A1 (en) Node system, server switching method, server apparatus, and data takeover method
JP2009129409A (en) Failure recovery method, computer, cluster system, management computer, and failure recovery program
JP5994601B2 (en) Parallel computer, parallel computer control program, and parallel computer control method
JP5605279B2 (en) Inter-process synchronization method
JP5201134B2 (en) Redundant system, switching program and switching method
JP6866927B2 (en) Cluster system, cluster system control method, server device, control method, and program
JP2010044553A (en) Data processing method, cluster system, and data processing program
WO2011116672A1 (en) Method and apparatus for patching shared code segment
CN112737844A (en) Method and device for switching between main and standby in redundant system
JP5691248B2 (en) Task takeover program, processing device, and computer system
JP5012850B2 (en) Exclusive control method for clustered computer system
JP2013156963A (en) Control program, control method, information processing apparatus, and control system
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
US11836058B2 (en) System and method for automated secondary or disaster-recovery data center site failover
JP2007305059A (en) Computer system, control computer and program
JP5723757B2 (en) Virtual IP address management method and duplex server system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130918

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20140326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140811

R151 Written notification of patent or utility model registration

Ref document number: 5605279

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250