JP2018101343A - 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム - Google Patents

排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム Download PDF

Info

Publication number
JP2018101343A
JP2018101343A JP2016248038A JP2016248038A JP2018101343A JP 2018101343 A JP2018101343 A JP 2018101343A JP 2016248038 A JP2016248038 A JP 2016248038A JP 2016248038 A JP2016248038 A JP 2016248038A JP 2018101343 A JP2018101343 A JP 2018101343A
Authority
JP
Japan
Prior art keywords
task
lock
exclusive control
deadlock
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016248038A
Other languages
English (en)
Inventor
聖子 松村
Kiyoko Matsumura
聖子 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016248038A priority Critical patent/JP2018101343A/ja
Publication of JP2018101343A publication Critical patent/JP2018101343A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】 適切な遅延時間の経過後に、遅延デッドロックチェックを実施する。
【解決手段】 複数の資源を共有するホストコンピュータに接続され、ホストコンピュータ上で実行されるタスクから、何れかの資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする排他制御手段と、資源がタスクにロックされているロック時間を計測するロック時間収集手段と、計測されたロック時間に基づいて、遅延時間を決定する遅延時間算出手段と、タスクが待ち状態になっている時間が、遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック手段に、送信する遅延デッドロック制御手段と、を備える排他制御装置。
【選択図】 図2

Description

本発明は、排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム、特に、遅延デッドロックチェック方式に関する。
特許文献1や特許文献2が開示するように、排他制御装置は、ホストコンピュータの共有資源のロック要求がロック待ちとなった場合、デッドロックが発生していないかチェックしなければならない。複数の共有資源を複数の排他制御装置で分散して管理しているシステムにおいてデッドロックを検出するさい、排他制御装置は、全ての排他制御装置内でロック待ちを発生させている共有資源に関係する全てのタスク情報を一か所に集める。
このとき排他制御装置は、データを集めるために装置間でデータを送受信し、通信トラフィックを増加させてしまう。また、ホストコマンドの延長で登録・更新や削除を実行する場合には、ホストコマンドの処理時間が長くなるという問題がある。
一方、ロック待ちとなってもデッドロックが発生しているとは限らず、多くは、単に先行する処理の終了待ち合わせの発生である。この場合、一定時間経過すると先行するロックは解放され、待ちになったロック要求はロック可となる。
このため、特許文献2が開示するように、待ち状態発生後一定時間待ってからデッドロックチェックを開始する遅延デッドロックチェック方式が採用された。この方式は、通信および登録・削除処理のオーバーヘッドを低減することを目的としている。
遅延デッドロックチェックを開始する遅延時間については、特許文献2が開示するようなロック要求元が指定する方法や、事前に初期設定値として設定する方法などが実施されてきた。
特許文献3は、リカバリ機能を有して、複数の運用系排他制御装置と待機系排他制御装置という構成をとるシステムを開示する。
特開昭62−177631号公報 特開平9−223030号公報 特開2009-58998号公報
遅延デッドロックチェック方式において、最適な遅延時間は、その資源がロックされている時間で決まるものである。資源のロック時間は、資源の種類(アクセスに時間のかかるものとそうでないもの)やアクセス種別(参照/共有、および、更新/排他)で異なる。また、最適な遅延時間は、システムの全体の負荷で変動するものでもある。
要するに、最適な遅延時間は、初期設定値のように事前に固定的に決まるものではなく、かつ、システム全体を考慮して決まるものである。従って、個々のホストコンピュータが、適切な遅延時間は算出し指定することは出来ない。
特に、共用資源の要求元が遅延時間を指定する方式は次のような問題がある。まず、ホストコンピュータの要求元で指定する遅延時間は、要求元の許容できる時間またはそのホストコンピュータ内で把握しているロック時間であって、システム全体のロック時間ではない。従って、このように指定される遅延時間は、遅延デッドロックチェックの最適な遅延時間とはならない。
また、特定の要求元が誤って著しく長い遅延時間を指定してロック待ちとなった場合、デッドロックの検出はこの遅延時間後となり、デッドロックに関与した他のタスクの待ちが解除されないという問題の発生も懸念される。
本発明は、上記課題を解決し、適切な遅延時間の経過後に、遅延デッドロックチェックを実施することが出来る、排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラムを提供することを目的とする。
本発明の1実施の形態の排他制御装置は、複数の資源を共有するホストコンピュータに接続され、前記ホストコンピュータ上で実行されるタスクから、何れかの前記資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする排他制御手段と、前記資源が前記タスクにロックされているロック時間を計測するロック時間収集手段と、計測された前記ロック時間に基づいて、遅延時間を決定する遅延時間算出手段と、前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック手段に、送信する遅延デッドロック制御手段と、を備える。
本発明の1実施の形態の排他制御方法は、ホストコンピュータ上で実行されるタスクから、複数存在する何れかの資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にし、前記資源が前記タスクにロックされているロック時間を計測し、計測された前記ロック時間に基づいて、遅延時間を決定し、前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を送信する。
本発明の1実施の形態の排他制御プログラムは、複数の資源を共有するホストサーバ装置に接続されたコンピュータに、前記ホストサーバ装置上で実行されるタスクから、何れかの前記資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする排他制御処理と、前記資源が前記タスクにロックされているロック時間を計測するロック時間収集処理と、計測された前記ロック時間に基づいて、遅延時間を決定する遅延時間算出処理と、前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック処理を実行する装置に、送信する遅延デッドロック処理と、を実行させる。
本発明にかかる排他制御装置は、適切な遅延時間の経過後に、遅延デッドロックチェックを実施することを可能とする。
図1は、第1の実施の形態にかかる排他制御システム40の構成例を示すブロック図である。 図2は、第1の実施の形態にかかる排他制御装置200の構成例を示すブロック図である。 図3は、排他制御テーブル290の具体例を示す図である。 図4は、排他制御部210または遅延デッドロック制御部230と、デッドロックチェック部300間で送受信される通信データの例を示す図である。 図5は、デッドロックチェックテーブル390の1例を示す図である。 図6は、遅延デッドロックチェックの概要を示す図である。 図7は、排他制御部210の処理例を示す流れ図である。 図8は、ロック時間収集部220の処理例を示す流れ図である。 図9は、遅延デッドロック制御部230の処理例を示す流れ図である。 図10は、デッドロックチェック部300の処理例を示す流れ図である。 図11は、遅延時間算出部240の処理例を示す流れ図である。 図12は、コンピュータ装置600の構成図である。 図13は、第2の実施の形態にかかる排他制御装置200の構成例を示すブロック図である。
<第1の実施の形態>
<概要>
複数の排他制御装置200で構成可能な排他制御システム40が実行する遅延デッドロックチェック実行時に、「遅延時間」を環境や要求種別などの条件を元に排他制御装置200が適切な時間を算出する。これにより、排他制御装置200は、デッドロックチェック検出の遅れや登録・更新の処理を削減することで排他制御システム40の性能向上を実現する。
<構成>
図1は、第1の実施の形態にかかる排他制御システム40の構成例を示すブロック図である。排他制御システム40は、1台以上の排他制御装置200と、1台以上のホストコンピュータ10(ホストサーバ装置ともいう)と、これらホストコンピュータ10で共有される複数の共有資源20とが、ネットワーク30で接続された疎結合コンピュータシステムである。共有資源20は例えば、ファイルやデータベースの個々のデータやプリンタであり、排他制御システム40で共有される資源である。
共有資源20は、ホストコンピュータ10が実行するタスク(プロセスと呼ばれることも有る)により、アクセスされる。共有資源20は、ディスク装置など、複数のタスクで同時にアクセスされても良い資源と、プリンタなど排他的にアクセスされることが必要な資源がある。また、同じ共有資源20であっても、例えばファイルやデータは、参照など複数のタスクで同時にアクセスされても良い場合と、更新やプリントアウトなど排他的にアクセスされることが必要な場合がある資源もある。排他制御装置200は、これらの共有資源20の排他制御を行う。
排他制御システム40に複数の排他制御装置200が含まれる場合、各々の排他制御装置200は、複数の共有資源20のうち、割り当てられた1以上の共用資源を対象に排他制御を行う。すなわち、複数の排他制御装置200は、排他制御システム40内の複数の共有資源20の排他制御を分担して実施する。このように、排他制御装置200が複数台になることで、排他制御システム40は、共有資源20の増減に対する拡張性および負荷分散が可能となっている。
図2は、第1の実施の形態にかかる排他制御装置200の構成例を示すブロック図である。排他制御装置200は、排他制御機能を担う、排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、遅延時間算出部240、排他制御テーブル290と、を備える。排他制御システム40内の1台の排他制御装置200は、さらに、デッドロックチェック機能を担う、デッドロックチェック部300とデッドロックチェックテーブル390を備える。これに加え、各排他制御装置200は排他制御システム40内を結ぶネットワーク30のためのネットワークインターフェース250を備える。
排他制御部210は、排他制御要求としてホストコンピュータ10から共有資源20およびタスクの指定を伴う“ロック要求(アクセス権の確保)”と“アンロック要求(アクセス権の解放)”を受け付ける。“ロック要求”は、排他または共有の2つのロック種別がある。排他制御部210は、種別が排他であるロック要求を受け付けると、指定されている資源が「どのタスクからもロックされていない」場合に、指定されたタスクによる排他的なロックを許可し、「他のタスクにロックされていれば」、当該タスクをロック待ち状態にする。
排他制御部210は、種別が共有であるロック要求を受け付けると、指定されている資源が「どのタスクからもロックされていない、または、共有でロックされ、かつ、ロック待ちのタスクが無い」場合、指定されたタスクによる共有でのロックを許可する。それ以外の場合、排他制御部210は、当該タスクをロック待ち状態にする。
ロック待ちとなった場合、排他制御部210は、遅延デッドロック制御部230を用いて遅延デッドロックチェックスケジューリングする。その後、排他制御部210は、ロック可またはロック待ちとなった結果をホストコンピュータ10に応答する。
さらに、排他制御部210は、アンロック要求を受け付けると、指定されたタスクを指定された共有資源20から削除する。ロックしていたタクスを削除する場合、排他制御部210は、同資源の待ちタスクを確認し可能なら当該タスクにロックさせる。最後に、排他制御部210は、結果をホストコンピュータ10に応答する。
ロック時間収集部220は、タスクが資源をロックしていた時間を計測し、共有資源20のロック種別毎に記録する。ロック時間収集部220は、排他制御部210よりロック可時に呼び出されたときはタスク情報292のロック成功時刻に現在時刻を保存し、アンロック時によびだされたときは現在時刻とロック成功時刻の差分を計算する。その後、ロック時間収集部220は、ロック種別に従い、資源情報291にリンクされているロック時間情報テーブル293の空きエントリの登録時刻に現在時刻を、ロック時間に計算した時間を登録する。尚空きエントリがなければ、ロック時間収集部220は、登録時刻の最古のエントリを削除し空きエントリを確保する。
遅延時間算出部240は、排他制御部210からロック待ち発生時に呼ばれて、対象資源毎かつロック種別毎に遅延時間を計算する。
遅延デッドロック制御部230は、待ちになったロック要求に対する遅延デッドロックの遅延時間を、遅延時間算出部240を用いて求める。遅延デッドロック制御部230は、当該遅延時間が経過しても対象のロック要求がなお待ち状態ならば、デッドロックチェックを要求する。その結果、デッドロックが発生していれば、遅延デッドロック制御部230は、排他制御テーブル290から要求のロック待ちを削除し、ホストコンピュータ10にデッドロック発生を通知する。
デッドロックチェック部300は排他制御部210から要求されて、デッドロックチェックテーブル390の更新、および、ロック中のタスク(待たせるタスク)とロック待ちのタスク(待たされるタスク)の関係からデッドロックの発生検出を実行する。
排他制御テーブル290には、資源情報291、タスク情報292、および、ロック時間情報テーブル293が複数記憶される。排他制御テーブル290の具体例を図3に示す。
資源情報291は、資源識別子、ロックリストポインタ、待ちリストポインタ、排他ロック時間ポインタ、および、共有ロック時間ポインタを格納する。資源識別子は、共有資源20を排他制御システム40全体で一意に識別する。ロックリストポインタは、その共有資源20をロックしているタスクのタスク情報292のリストの先頭へのポインタである。待ちリストポインタは、その資源をロック待ちしているタスクのタスク情報292のリストの先頭へのポインタである。排他ロック時間ポインタと共有ロック時間ポインタは、その資源が過去にロックされた際のロック時間をロック種別毎に管理するロック時間情報テーブル293へのポインタである。
タスク情報292は、タスク識別子、次タスクポインタ、ロック種別、ロック成功時刻、および、登録済みフラグを格納する。タスク識別子は、システム全体で一意にタスクを識別する。次タスクポインタは、リストにおける次のタスク情報292をリンクする。ロック種別は、そのタスクがロックまたはロック待ちする際のロック種別である。ロック成功時刻は、そのタスクがロック可となった時刻を記憶する。登録済みフラグは、そのタスク情報292がデッドロックチェックテーブル390に登録済みか否かを示す。
タスク情報292は、資源情報291のロックリストポインタまたは待ちリストポインタから先頭の1個をリンクし、2個目以降はタスク情報292の次タスクポインタでリンクするリスト構成となる。
ロック時間情報テーブル293は、複数のエントリからなる配列構造をとる。各エントリは、そのエントリに情報を登録した登録時間と個々のタスクが共有資源20をロックしていた時間を記録するロック時間から成る。ロック時間情報テーブル293は、資源情報291にロック種別毎に1個ずつ存在する。
図4は、排他制御部210または遅延デッドロック制御部230と、デッドロックチェック部300間で送受信される通信データの例を示す図である。通信データは、図4a)のデッドロックチェック部300へ処理を要求する要求通信と、図4b)のデッドロックチェック部300が処理結果を通知する応答通信と、が存在する。
図4a)が示す要求通信には、以下の3つの要求種別の要求通信がある。
1)デッドロックが発生しているか否かのチェックを要求するためのデッドロックチェック要求
2)デッドロックチェックテーブル390に登録済みのデータをロック待ちからロック中に更新するための更新要求
3)デッドロックチェックテーブル390に登録済みのデータを削除するための削除要求
すべての要求通信は、上述の種別を含む。さらに、デッドロックチェック要求は、チェック対象の共有資源20の資源識別子1個と、この共有資源20をロックしている全てのタスク識別子と、チェックするロック待ちのタスク識別子1個をデータとして含む。更新要求と削除要求は、対象の共有資源20の資源識別子と更新対象のタスク識別子を含む。
応答通信は、デッドロックチェックの結果デッドロックが発生していなければ”成功”、発生いていればデッドロックが発生したタスク識別子とともに”失敗”を通知する。
デッドロックチェックテーブル390は、どのタスクがどの共有資源20をロックまたはロック待ちしているかを示す情報を格納する。デッドロックチェックテーブル390は、例えば、共有資源20毎の行とタスクごとの列からなるマトリクスである。デッドロックチェック部300は、或るタスクが或る共有資源20をロックしているとき、対応するセルには、ロック中表示Lを格納し、或るタスクが或る共有資源20をロック待ちしているとき、対応するセルには、ロック待ち表示Wを格納する。
図5a)の具体例は、資源識別子B1の共有資源20は、タスク識別子 T1のタスクがロック中(L)かつタスク識別子T6のタスクがロック待ち(W)であることを示す。他の資源も、同様にロック中およびロック待ちのタスクが存在している状態であるが、資源識別子B1乃至B4の共有資源20間ではデッドロックは発生していない。しかし、図5のb)に示すような資源識別子B5の共有資源20が存在する場合に、デッドロックチェックが行われると、タスク識別子T2のタスクとタスク識別子T5のタスクの間でデッドロックが検出される。
デッドロックチェック部300は、デットロックを次のように検出する。以降、タスクTn(nは自然数)は、タスク識別子がTnのタスクを意味する。資源Bnは、資源識別子がBnの共有資源20を意味する。
タスクT2は資源B5を待っているが、資源B5はタスクT4とタスクT5によりロックされている。タスクT4とタスクT5がロックを解放しなければタスクT2はロック出来ない。タスクT4はいずれの資源も待っていないため影響しない。タスクT5は資源B3を待っており資源B3をロックしているのはタスクB5のため、タスクT2とタスクT5で待つと待たされる関係の輪が出来上がりデッドロックとなる。
すなわち、2つのタスク間で、互いに、一方がある共有資源20をロックしたまま、直接に、あるいは他のタスクを介して、他方がロックしている共有資源20の待ち状態になると、デッドロックチェック部300は、デッドロックを検出する。
図6は、遅延デッドロックチェックの概要を示す図である。これを参照し、どのように遅延デッドロックチェックが行われるか概略を説明する。
図2が示すように、排他制御システム40内に包含される排他制御装置200は1台でも良いが、複数台でも良い。複数台の排他制御装置200が存在する場合、排他制御機能はすべての排他制御装置200で動作するが、デッドロックチェック機能は、特定の1台でのみ動作する。ここで、排他制御機能は、排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、排他制御テーブル290、および、遅延時間算出部240で果たされる機能を指す。デッドロックチェック機能は、デッドロックチェック部300、および、デッドロックチェックテーブル390で果たされる機能を指す。
排他制御システム40は、どの排他制御装置200がデッドロックチェック機能を担うかを、初期設定値等で特定の排他制御装置200に固定したり、最初に起動した排他制御装置200に決めたりするなどの適宜の方式で決定すれば良い。以降、仮にデッドロックチェック機能を担う排他制御装置200をマスタ装置と呼称し、デッドロックチェック機能を担わないその他の排他制御装置200をスレーブ装置と呼称する。
図6の例において、マスタの排他制御装置200上で、タスクT1は資源B1をロックした状態で、スレーブの排他制御装置200が管理する資源B2のロック要求を行う。資源B2は、既にタスクT2がロック中のためタスクT1は待ちとなる。スレーブの排他制御装置200は、待ちになってすぐにデッドロックチェックを要求せず、遅延時間後にマスタの排他制御装置200装置へデッドロックチェックを要求する(図6のデッドロックチェック要求A)。
この時点ではデッドロックは発生していないので、マスタの排他制御装置200から要求元へ”成功”の応答が行われる。その後資源B1に対しタスクT2がロック要求を行いロック待ちとなる。遅延時間経過後、タスクT2のデッドロックチェックを行う(図6のデッドロックチェック要求B)と、デッドロックを検出し、タスクT2と”失敗”の応答が行われる。
ここで、排他制御装置200の排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、遅延時間算出部240、および、デッドロックチェック部300は、論理回路で構成される。排他制御テーブル290、および、デッドロックチェックテーブル390は、半導体記憶装置またはディクス記憶装置に格納される。
排他制御装置200は、コンピュータ装置600により実現されても良い。図12は、コンピュータ装置600の構成図である。コンピュータ装置600は、バス640で相互に接続された、プロセッサ610、主記憶部630、および、外部記憶装置620を備える。プロセッサ610は、バス640を経由して、主記憶部630、および、外部記憶装置620に対してデータの読み書きを行う。また、プロセッサ610は、主記憶部630に格納されているプログラム650を実行する。なお、プログラム650は、当初外部記憶装置620に格納されており、コンピュータ装置600の初期設定時に、プロセッサ610が外部記憶装置620から主記憶部630にロードしても良い。
ここで、主記憶部630は半導体メモリ装置である。外部記憶装置620はディスク装置、または、半導体記憶装置等の記憶装置である。
プロセッサ610は、プログラム650を実行することにより、排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、遅延時間算出部240、および、デッドロックチェック部300として機能する。すなわち、プロセッサ610は、プログラム650を実行することにより、排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、遅延時間算出部240、および、デッドロックチェック部300が行う処理を実行する。
外部記憶装置620または主記憶装置60は、排他制御テーブル290、および、デッドロックチェックテーブル390の格納領域として使用されても良い。
<動作>
図7は排他制御部210の処理例を示す流れ図、図8はロック時間収集部220の処理例を示す流れ図、図9は遅延デッドロック制御部230の処理例を示す流れ図である。さらに、図10はデッドロックチェック部300の処理例を示す流れ図、図11は遅延時間算出部240の処理例を示す流れ図である。以下、各図を参照して本実施例の形態に係る排他制御装置200の動作例を説明する。
ホストコンピュータ10からのロック要求には、要求元を示すタスク識別子とロック対象の資源識別子とロックの種別(排他・共有)が示されている。
まずロック要求がロック成功となる流れを説明する。
図7を参照すると、排他制御部210は、要求の内容を確認して(S100)ロック要求と認識し、排他制御テーブル290を検索し(S101)、要求で指定されている資源識別子の共有資源20を、要求で指定されているロック種別でロックできるか否かを判定する(S102)。
このS101〜S102のロック可否判定の詳細は、次のように行われる。まず、排他制御部210は、要求で示された資源識別子と一致する資源情報291を排他制御テーブル290から検索する。次に、排他制御部210は、見つかった資源情報291のロックリストポインタを確認し、ロックリストポインタに何もリンクされていなければロック可と判定する。
ロックリストポインタにタスク情報292がリンクされていたら、排他制御部210は、要求のロック種別が排他ロックの場合、ロック不可(ロック待ち)と判定する。要求のロック種別が共有ロックの場合、排他制御部210は、ロックリストポインタにリンクされているタスク情報292のロック種別が同じ共有ロックならロック可と判定し、異なるならばロック不可(ロック待ち)と判定する。
S102でロック可と判定した場合、排他制御部210は、タスク情報292を作成し、対象の資源情報291のロックリストポインタに何もリンクされていなければタスク情報292のアドレスをロックリストポインタに保存する。ロックリストポインタに他のタスクのタスク情報292のアドレスが保存されていれば、排他制御部210は、タスク情報292の次タスクポインタを辿りリンク列の最後にタスク情報292を追加(リンク)する。排他制御部210は、タスク情報292には要求のタスク識別子と要求のロック種別を保存し、次タスクポインタとロック成功時刻登録済みフラグには何も設定しない(S103)。
次に排他制御部210は、ロック時間収集部220を呼び出す(S104)。ロック時間収集部220は、呼び出し理由が資源へのロック登録か資源のロック解放か判別し(S200)、ロック登録なのでタスク情報292のロック成功時刻に現在の時刻を記録する(S201)。次に排他制御部210は、処理結果を作成しホストコンピュータ10へ結果を応答する(S130)。
次に要求がロック不可(ロック待ち)となる例を示す。
ロック可不可の判定(S102)で、ロック不可と判定された場合、排他制御部210は、タスク情報292を作成し、資源情報291の待ちリストポインタに何もリンクされていなければタスク情報292のアドレスを待ちリストポインタに保存する。待ちリストポインタに他のタスクのタスク情報292のアドレスが保存されていれば、排他制御部210は、タスク情報292の次タスクポインタを辿りリンク列の最後にタスク情報292を追加する。排他制御部210は、タスク情報292に要求のタスク識別子と要求のロック種別を保存し、次タスクポインタとロック成功時刻登録済みフラグには何も設定しない(S105)。次に排他制御部210は、遅延デッドロック制御部230を起動後(S106)、待ちになった結果をホストコンピュータ10へ応答する(S130)。
排他制御部210から起動された遅延デッドロック制御部230は、まず遅延時間算出部240を呼び出して遅延時間を算出する(S300)。
遅延時間算出部240は、遅延デッドロックを実施するロック待ちの資源情報291をロックしているタスクのタスク情報292のロック種別を確認(S500)し、そのロック種別に対応するロック時間情報テーブル293を資源情報291から辿る(S501)。
次に、遅延時間算出部240は、現在の負荷状況を反映するためロック時間情報テーブル293の登録時刻が現在時刻より一定時間以上前の古いエントリが存在するか確認し(S502)存在すれば一定時間以上前の古いエントリは削除する(S503)。有効エントリが全く存在しなければ(S504)、遅延時間算出部240は、予め決めてある固定的な値等に余裕時間を加えて遅延時間とする(S507)。有効エントリが存在すれば(S504)、遅延時間算出部240は、有効エントリのロック時間の平均値を計算し(S505)これに余裕時間を加えて遅延時間とする(S506)。
遅延デッドロック制御部230は、遅延時間算出部240が算出した時間のタイマをセットする(S301)。
遅延デッドロック制御部230は、タイマがタイムアップしたら、対象のロック待ちタスクが待ち状態のままであるか確認する(S302)。例えば、対象タスクを待たせていたロックが解放され、対象タスクがロック状態にある場合や既にロックを解放して存在しない場合、遅延デッドロック制御部230は、は何もせずに終了する。
対象タスクがまだ待ち状態であれば、遅延デッドロック制御部230は、対象の共有資源20の資源識別子とロック中の全タスク識別子と遅延デッドロックを実施する待ちタスクのタスク識別子を設定したデッドロックチェック要求通信のデータを作成(S303)する。遅延デッドロック制御部230は、デッドロックチェック要求に設定した全タスク情報292に登録済みフラグをセットし(S308)、デッドロックチェック機能を担当する排他制御装置200へネットワークインターフェース250経由で要求通信のデータを送信する(S304)。
デッドロックチェック要求を受け取ったデッドロックチェック部300は、デッドロックチェックテーブル390から要求の資源識別子を検索し、存在しなければ資源識別子を登録する(S400)。
つぎに要求通信の要求種別を確認し(S401)、要求種別がデッドロックチェック要求の場合、デッドロックチェック部300は、デッドロックチェックテーブル390から要求通信に設定されたタスクのタスク識別子を順次検索する(S402)。デッドロックチェック部300は、タスク識別子が既に存在すれば何もせず、要求のタスク識別子が存在しなければタスク識別子を追加しロック中(L)とする(S403)。デッドロックチェック部300は、このタスクの検索を、ロック中のタスクのタスク識別子から初めて、要求中の最後のタスクのタスク識別子まで繰り返す(S404)。最後のタスク識別子はロック待ちタスクのタスク識別子なので、デッドロックチェック部300は、ロック待ち(W)に変更し(S407)、その後デッドロックチェックを実施する(S411)。
デッドロックチェック部300は、図5で説明したような手順で、デッドロックチェックを実施する。
デッドロックチェック部300は、デッドロックチェックが発生していなければ”成功”の応答を返却して処理を終了する(S412)。デッドロックチェック部300は、デッドロックが発生していれば”失敗”の応答を返却し(S413)、デッドロックチェック要求で追加した待ちタスク(W)のタスク識別子をデッドロックチェックテーブル390から削除する(S414)。
デッドロックチェック部300は、削除した後も資源識別子に他にロック待ち(W)のタスク識別子が存在するなら処理を終了し(S415)、他にロック待ち(W)のタスク識別子が無ければ、その資源識別子をデッドロックチェックテーブル390から削除する(S416)。
デッドロックチェック部300から”成功”の応答を受け取った場合、遅延デッドロック制御部230は処理を終了する(S305)。”失敗”の応答を受け取った場合、デッドロックチェック部300は、デッドロックとなったロック待ちのタスク情報292を対象資源情報291の待ちリストのリンクから外し(S306)、デッドロックによりロック待ちがキャンセルされたことをホストコンピュータ10に通知する(S307)。
次にホストコンピュータ10からの削除要求(取得済みのロックの解放またはロック待ちのキャンセル)について説明する。
削除要求ではタスク識別子と資源識別子が指定される。排他制御部210は、要求内容を削除要求と判断し(S100)、まず排他制御テーブル290を検索する(S111)。要求タスク識別子のタスク情報292が、要求の資源識別子の資源情報291のロックリストポインタのリンクに接続されている(ロック)か、待ちリストポインタのリンクに接続されている(ロック待ち)か、により処理が異なる(S112)。指定されたタスクが、ロック中かロック待ちかにより、処理が異なる。
ロックを削除する場合、排他制御部210は、ロック時間収集部220を呼び出す。
ロック時間収集部220は、呼び出し契機(理由)を確認する(S200)。それが、ロック削除であれば、ロック時間収集部220は、解放するタスク情報292のロック種別に基づいて資源情報291の排他ロック時間ポインタか共有ロック時間ポインタのいずれかを選択して、そこにつながるロック時間情報テーブル293を選択する(S202)。ロック時間収集部220は、選択したロック時間情報テーブル293に未登録のエントリ(登録時刻が設定されていないエントリ)が有れば未登録のエントリを、もし、全てのエントリが登録済みのであれば登録時刻が最古のエントリを選択する(S203)。
次に、ロック時間収集部220は、選択したエントリの登録時刻に現在の時刻を設定し(S204)、現在時刻からタスク情報292のロック成功時刻を引き算した時間をロック時間に設定する(S205)。
次に排他制御部210は、要求のタスク識別子のタスク情報292を削除し(S114)、タスク情報292に登録済みフラグがセットされていたらデッドロックチェック部300に削除要求を送信する(S125)。それを受けて、デッドロックチェック部300は、デッドロックチェックテーブル390から共有資源20を検索し(S400)、指定された共有資源20のタスク情報292を削除する(S406)。削除した結果その共有資源20に待ち(W)タスクがなくなれば資源情報291も削除する(S415、S416)。
その後、排他制御部210は、資源情報291の待ちリストポインタのリンクにタスク情報292が存在するか確認し(S115)、待ちがなければ終了をホストコンピュータ10に応答する(S130)。
待ちが存在し、その待ちがロック可能なら(S116)、排他制御部210は、タスク情報292を待ちリストから外してロックリストのリンクにつなぎかえ(S117)、ロック時間収集部220を呼び出す(S118)。これを受けて、ロック時間収集部220が、ロック成功時刻を設定(S201)する。
その後、排他制御部210は、ホストコンピュータ10へそのタスクのロック成功を通知し(S119)、続けてロック待ちからロック可となったタスクの情報を更新すべくデッドロックチェック部300に更新要求を送信する(S120)。これを待ちタスクが無くなるか(S115)、ロック可能なロック待ちタスクが無くなる(S116)まで繰り返し、最後にアンロック要求の結果をホストコンピュータ10に応答する(S130)。
更新要求を受け取ったデッドロックチェック部300は、資源を検索し(S400)、指定された資源とタスクの情報をロック待ち(W)からロック中(L)に更新する(S405)。更新した結果その共有資源20にロック待ち(W)がなくなれば資源情報291も削除する(S415,S416)。
ロック待ちを削除する場合について説明する。
排他制御部210は、対象の待ちのタスク情報292を、資源情報291の待ちリストのリンクから外し、タスク情報292を削除する(S121)。排他制御部210は、登録済みフラグを確認しデッドロックチェックテーブル390に登録されていなければ、終了通知を行い終了する(S122、S130)。デッドロックチェックテーブル390に登録されていれば、排他制御部210は、デッドロックチェック部300に削除要求を送る(S123)。それを受けて、デッドロックチェック部300は、デッドロックチェックテーブル390から共有資源20を検索し(S400)、指定された共有資源20のタスク情報292を削除する(S406)。削除した結果その共有資源20に待ち(W)タスクがなくなれば資源情報291も削除する(S415、S416)。
<効果>
本発明にかかる排他制御装置200は、適切な遅延時間の経過後に、遅延デッドロックチェックを実施することを可能とする。その理由は、ロック時間収集部220が、共有資源20のロック時間を計測し、遅延時間算出部240が、その計測結果時間に基づいて遅延時間を決定するからである。
特許文献2等で開示された方式(初期設定値や要求元がコマンド中で指定)は、適切な遅延時間を指定することが困難である。共有資源20のアクセス権を管理する排他制御装置200が処理時に逐次蓄積する情報によって、適切な遅延時間を設定することが可能となる。
また、排他制御システム40全体の負荷状況を反映するためには、排他制御装置200が遅延時間決定しなければならない。
適切な遅延時間を設定することにより、排他制御装置200は、デッドロックチェック検出の遅れを防止できる。さらに、排他制御機能からデッドロックチェック機能へのデッドロックチェック要求が削減され、デッドロックチェックテーブル390へ登録されなければ削除要求が不要となり、排他制御装置200の間の通信が削減される。
特にホストコマンドの延長でデッドロックチェック機能への要求が削減できることで、ホストコマンドの処理時間が短縮される。
<第1の実施の形態の変形例>
第1の実施の形態では、複数の排他制御装置200の内の1台が、デッドロックチェック機能を備えている。特許文献3に開示されているようなリカバリ機能を有するシステムは、複数の運用系の排他制御装置200と待機系の排他制御装置200という構成をとる場合がある。このようなシステムでは、排他制御機能は運用系の排他制御装置200で行い、デッドロックチェック機能を待機系の排他制御装置200で行うように機能分担する構成も可能である。
ロック時間情報テーブル293が揮発性のメインメモリ上に格納されている場合、排他制御装置200を再起動するとロック時間情報テーブル293は初期化され、再度蓄積する必要がある。これを避ける為、排他制御装置200は、装置の停止時に資源情報291とロック時間情報テーブル293を関連づけた形でディスク等の記憶装置に保存し、再起動後、記憶装置からメインメモリにロードし適切な遅延時間を計算できるようにしても良い。
排他制御装置200は、ロック時間情報テーブル293をロック種別毎に持たないで、テーブル内にロック種別を記憶し、遅延時間算出部240は、遅延時間を計算する際にロック種別が一致するものを選択して計算しても良い。
<第2の実施形態>
図13は、第2の実施の形態にかかる排他制御装置200の構成例を示すブロック図である。排他制御装置200は、複数の共有資源20、および、ホストコンピュータ10に、接続されている。そして、排他制御装置200は、排他制御部210、ロック時間収集部220、遅延デッドロック制御部230、遅延時間算出部240、を備える。
排他制御部210は、ホストコンピュータ10上で実行されるタスクから、何れかの共有資源20に対するロック要求を受信して、当該共有資源20がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする。
ロック時間収集部220は、共有資源20がタスクにロックされているロック時間を計測する。遅延時間算出部240は、計測されたロック時間に基づいて、遅延時間を決定する。
遅延デッドロック制御部230は、タスクが待ち状態になっている時間が遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック部300に、送信する。
ここで、デッドロックチェック部300は、この排他制御装置200が備えていても良いし、排他制御システム40内の他の排他制御装置200が備えていても良い。
本実施の形態にかかる排他制御装置200は、適切な遅延時間の経過後に、遅延デッドロックチェックを実施することを可能とする。その理由は、ロック時間収集部220が、共有資源20のロック時間を計測し、遅延時間算出部240が、その計測結果時間に基づいて遅延時間を決定するからである。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
10 ホストコンピュータ
20 共有資源
30 ネットワーク
40 排他制御システム
200 排他制御装置
210 排他制御部
220 ロック時間収集部
230 遅延デッドロック制御部
240 遅延時間算出部
250 ネットワークインターフェース
290 排他制御テーブル
291 資源情報
292 タスク情報
293 ロック時間情報テーブル
300 デッドロックチェック部
390 デッドロックチェックテーブル
600 コンピュータ装置
610 プロセッサ
620 外部記憶装置
630 主記憶部
640 バス
650 プログラム

Claims (10)

  1. 複数の資源を共有するホストコンピュータに接続され、
    前記ホストコンピュータ上で実行されるタスクから、何れかの前記資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする排他制御手段と、
    前記資源が前記タスクにロックされているロック時間を計測するロック時間収集手段と、
    計測された前記ロック時間に基づいて、遅延時間を決定する遅延時間算出手段と、
    前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック手段に、送信する遅延デッドロック制御手段と、を備える排他制御装置。
  2. 前記資源のおのおのに関連付けて、ロック中、および、待ち状態にある前記タスクの識別子を格納するデッドロックチェックテーブルと、
    前記デッドロックチェック要求を受信すると、前記デッドロックチェックテーブルに基づいてデッドロックを起こしているか否かを判定し、判定結果を前記デッドロックチェック要求送信元に返信する前記デッドロックチェック手段と、をさらに備える、請求項1の排他制御装置。
  3. 前記排他制御手段は、種別が占有である前記ロック要求を受信すると、当該資源が空きであれば前記タスクに排他ロックさせ、空きでなければ空きになるまで当該タスクを待ち状態し、前記種別が共有である前記ロック要求を受信すると、当該資源が排他ロックされていなければ前記タスクに共有ロックさせ、排他ロック中であれば排他ロックでなくなるまで当該タスクを前記待ち状態にし、
    前記ロック時間収集手段は、前記種別対応に前記ロック時間を計測し、
    前記遅延時間算出手段は、前記待ち状態になる前記タスクが発行した前記ロック要求の前記種別に対応する前記ロック時間に基づいて、遅延時間を決定する、請求項1乃至請求項2の何れか1項の排他制御装置。
  4. 前記遅延時間算出手段は、所定時間以内に計測された前記ロック時間に基づいて、遅延時間を決定する請求項1乃至請求項3の何れか1項の排他制御装置。
  5. 前記複数の資源と、前記ホストコンピュータと、前記複数の資源にたいし前記排他制御手段による排他制御を行う、請求項2の排他制御装置とを包含する、排他制御システム。
  6. 前記複数の資源と、前記ホストコンピュータと、前記複数の資源のうち割り当てられた一部の資源にたいし前記排他制御手段による請求項2の排他制御装置と、前記デッドロックチェックテーブルおよび、前記デッドロックチェック手段の両者を備えず、前記複数の資源のうち割り当てられた一部の資源たいし前記排他制御手段による排他制御を行う、請求項1の排他制御装置とを包含する、排他制御システム。
  7. ホストコンピュータ上で実行されるタスクから、複数存在する何れかの資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にし、
    前記資源が前記タスクにロックされているロック時間を計測し、
    計測された前記ロック時間に基づいて、遅延時間を決定し、
    前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を送信する、排他制御方法。
  8. 前記資源のおのおのに関連付けて、ロック中、および、待ち状態にある前記タスクの識別子をデッドロックチェックテーブル格納し、
    前記デッドロックチェック要求を受信すると、前記デッドロックチェックテーブルに基づいてデッドロックを起こしているか否かを判定し、判定結果を前記デッドロックチェック要求送信元に返信する、請求項7の排他制御方法。
  9. 複数の資源を共有するホストサーバ装置に接続されたコンピュータに、
    前記ホストサーバ装置上で実行されるタスクから、何れかの前記資源に対するロック要求を受信して、当該資源がロック可能であれば当該タスクにロックさせ、ロック可能でなければ可能になるまで当該タスクを待ち状態にする排他制御処理と、
    前記資源が前記タスクにロックされているロック時間を計測するロック時間収集処理と、
    計測された前記ロック時間に基づいて、遅延時間を決定する遅延時間算出処理と、
    前記タスクが前記待ち状態になっている時間が、前記遅延時間以上になると、デッドロックチェック要求を、デッドロックを検出するデッドロックチェック処理を実行する装置に、送信する遅延デッドロック処理と、を実行させる排他制御プログラム。
  10. 前記資源のおのおのに関連付けて、ロック中、および、待ち状態にある前記タスクの識別子をデッドロックチェックテーブルに格納する処理と、
    前記デッドロックチェック要求を受信すると、前記デッドロックチェックテーブルに基づいてデッドロックを起こしているか否かを判定し、判定結果を前記デッドロックチェック要求送信元に返信する前記デッドロックチェック処理と、をさらにコンピュータに実行させる、請求項9の排他制御プログラム。
JP2016248038A 2016-12-21 2016-12-21 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム Pending JP2018101343A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016248038A JP2018101343A (ja) 2016-12-21 2016-12-21 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016248038A JP2018101343A (ja) 2016-12-21 2016-12-21 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム

Publications (1)

Publication Number Publication Date
JP2018101343A true JP2018101343A (ja) 2018-06-28

Family

ID=62714391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016248038A Pending JP2018101343A (ja) 2016-12-21 2016-12-21 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム

Country Status (1)

Country Link
JP (1) JP2018101343A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114864456A (zh) * 2022-07-08 2022-08-05 埃克斯工业(广东)有限公司 半导体清洗设备调度方法、系统、装置及存储介质
JP7440170B2 (ja) 2021-03-10 2024-02-28 Necプラットフォームズ株式会社 排他制御装置、排他制御システム、制御方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7440170B2 (ja) 2021-03-10 2024-02-28 Necプラットフォームズ株式会社 排他制御装置、排他制御システム、制御方法及びプログラム
CN114864456A (zh) * 2022-07-08 2022-08-05 埃克斯工业(广东)有限公司 半导体清洗设备调度方法、系统、装置及存储介质
CN114864456B (zh) * 2022-07-08 2022-09-13 埃克斯工业(广东)有限公司 半导体清洗设备调度方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109491928B (zh) 缓存控制方法、装置、终端及存储介质
US10645152B2 (en) Information processing apparatus and memory control method for managing connections with other information processing apparatuses
US20070088760A1 (en) Method of controlling total disk usage amount in virtualized and unified network storage system
WO2018107772A1 (zh) 写入请求处理方法、装置及设备
US9535756B2 (en) Latency-hiding context management for concurrent distributed tasks in a distributed system
JP2010026814A (ja) 資源転送システム、資源転送方法、情報処理装置及びコンピュータプログラム
US20170262196A1 (en) Load monitoring method and information processing apparatus
US9514176B2 (en) Database update notification method
US8589441B1 (en) Information processing system and method for controlling the same
US9679084B2 (en) Memory sharing across distributed nodes
JP2010097489A (ja) 分散データ処理システム、分散データ処理方法および分散データ処理用プログラム
JP2018101343A (ja) 排他制御装置、排他制御システム、排他制御方法、および、排他制御プログラム
US20180089055A1 (en) Method and apparatus for monitoring logs
WO2020098682A1 (en) Systems and methods for managing shared database
CN108990422B (zh) 一种锁分配的方法、装置和计算设备
JP6947421B2 (ja) 監視装置、排他制御システム、プログラム及び制御方法
JP3681415B2 (ja) デッドロック検出装置
US20170031809A1 (en) Non-transitory computer-readable storage medium, information controller, and information control method
WO2015092873A1 (ja) 情報処理システム及び情報処理方法
KR102353141B1 (ko) 트랜잭션 처리 방법, 디바이스 및 장비
US8838888B2 (en) Conditional write processing for a cache structure of a coupling facility
US20150067014A1 (en) Computer system and control method of computer system
CN111259375A (zh) 应用于物联网操作系统的访问请求的处理方法及装置
US20140351362A1 (en) Computer system, data transfer method, and data transfer program
JP6961133B1 (ja) 検索装置、検索方法、及び、検索プログラム