JP7183384B2 - 分散コンピューティングシステムにおける共有リソースの管理 - Google Patents

分散コンピューティングシステムにおける共有リソースの管理 Download PDF

Info

Publication number
JP7183384B2
JP7183384B2 JP2021504583A JP2021504583A JP7183384B2 JP 7183384 B2 JP7183384 B2 JP 7183384B2 JP 2021504583 A JP2021504583 A JP 2021504583A JP 2021504583 A JP2021504583 A JP 2021504583A JP 7183384 B2 JP7183384 B2 JP 7183384B2
Authority
JP
Japan
Prior art keywords
transaction
state
resource
shared resource
transaction manager
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021504583A
Other languages
English (en)
Other versions
JP2021521570A (ja
JP2021521570A5 (ja
Inventor
クリスチャン ムーア ザッカリー
マイケル ギルバート ライアン
タハミド ホサイン アハヌフ
フォス セイモア トーマス
Original Assignee
オーエスアイソフト リミテッド ライアビリティ カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オーエスアイソフト リミテッド ライアビリティ カンパニー filed Critical オーエスアイソフト リミテッド ライアビリティ カンパニー
Publication of JP2021521570A publication Critical patent/JP2021521570A/ja
Publication of JP2021521570A5 publication Critical patent/JP2021521570A5/ja
Application granted granted Critical
Publication of JP7183384B2 publication Critical patent/JP7183384B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1474Saving, restoring, recovering or retrying in transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/3004Arrangements for executing specific machine instructions to perform operations on memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30076Arrangements for executing specific machine instructions to perform miscellaneous control operations, e.g. NOP
    • G06F9/30087Synchronisation or serialisation instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • G06F9/524Deadlock detection or avoidance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/466Transaction processing
    • G06F9/467Transactional memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Description

本開示は、分散コンピューティングシステムの分割されたパーティションにわたって共有リソースを管理する方法に関する。
並列コンピューティングはプロセスをコンピューティングシステム内の別々のプロセッサー上で同時に実行する部分に分割することにより、そのパフォーマンスを効率化することができる。通常、並列コンピューティング環境におけるサブタスクは、多様なスレッド間で共有される変数を頻繁に使用または更新する必要があるスレッドによって実行される。これらの変数はサブタスクを実行する全てのスレッド間で共有されるため、ロックを使用することで、競合するスレッドが各サブタスクに必要な共通データを上書きしたり変更したりしないようにすることが確保される。しかし、ロックを使用すると、デッドロックや競合状態など各サブタスクの実行に関するいくつかの課題が発生する可能性が高い。多くの場合、デッドロックが発生すると競合するサブタスクが中止されるため、結果として作業が失われるとともに、サブタスクを再度やり直す必要性があるため、非効率になる。
説明される実施形態は分散コンピューティングシステムにおいて、共有リソースを管理するためのトランザクションマネージャーを含む。分散コンピューティングシステムには、ユーザーが指定した動作やトランザクションを介して変更を受信する可能性のある共有リソースの個別のコピーをそれぞれ含む複数のパーティションが含まれている。各動作は、一度に1つの共有リソースを変更でき、どのリソースを変更すべきかを指示するリソースIDが含まれる。トランザクションマネージャーは、各パーティションの共有リソースの各コピーに対して、要求された動作またはトランザクションを並行して実行し、パーティション間で一貫した状態を維持する。さらに、動作とトランザクションによって変更される共有リソースを指定するリソースIDの使用は、分散コンピューティングシステムは、同じ共有リソースに対して動作が競合しないよう各リソースの変更を並行して振り分け、デッドロックや競合状態を回避する。
共有リソースのコピーを変更している間に動作またはトランザクションが失敗した場合、トランザクションマネージャーは、動作またはトランザクションが残りのコピーを変更することを防止し、失敗した動作またはトランザクションの結果を先行して阻止する。さらに、トランザクションマネージャーは、失敗した動作またはトランザクションをロールバックすることにより、共有リソース全体で一貫した状態に復旧させ、これによって、共有リソースの各コピーを動作またはトランザクションを実行する前の状態に戻すことができる。
この概要および以下の詳細な説明で述べられる機能および利点は、すべてを網羅しているわけではない。多くの付加的な特徴および利点は、ここに記載される図面、明細書、および特許請求の範囲を見ることによって当業者に明らかとなり得る。
本実施形態による分散コンピューティングシステムを示すブロック図である。 本実施形態によるトランザクションマネージャーを示すブロック図である。 本実施形態によるトランザクションを管理するための例示的なプロセスを示す。 本実施形態によるトランザクションを管理するための例示的なプロセスを示す。 本実施形態によるユーザー要求、トランザクションマネージャー、および状態マネージャーの間の相互作用を示す関係図である。 本実施形態によるユーザー要求、トランザクションマネージャー、および状態マネージャーの間の相互作用を示す関係図である。 本実施形態による、動作ハンドルをコミットするためのプロセスを示す図である。 本実施形態による、動作スタックをクリッピングするためのプロセスを示す図である。 本実施形態によるロールバック動作を示す図である。 本実施形態による、分散コンピューティングシステム上でトランザクションを管理するためのプロセスを示すフローチャートである。 本実施形態による管理コンピューターを示すブロック図である。
図および以下の説明は、例示のみを目的として特定の実施形態を説明している。以下の説明から、当業者は本明細書に記載する原理から逸脱することなく、本明細書に示す構造および方法の代替の実施形態を使用できることを容易に認識するであろう。ここでは、いくつかの実施形態を詳細に参照し、その例を添付の図に示す。実行可能な場合はいつでも類似の参照番号を図で使用することができ、同様の機能を示すことができることに留意されたい。
本明細書で説明する方法は分散コンピューティングシステム内の共有リソースで操作を実行するという技術的な課題(要求)に対応している。共有リソースを使用して操作を実行すると、分散コンピューティングシステムの複数のコンポーネントが同じリソースをめぐって競合するため、誤ったデータが導入され、リソースが変更されて一貫性のない状態になる可能性がある。リソースが共有されているため、これらの一貫性のない状態は、後続のプロセスで使用される分散コンピューティングシステム全体に誤ったデータを伝播する可能性がある。さらに、共有リソースをめぐって競合する多様なコンポーネントは、システム全体の進行を妨げるデッドロックシナリオを頻繁に引き起こす。ここで明示される方法は、ユーザーが一貫した状態を維持しながら、多様なパーティションに分散された共有リソースの個別のコピーを変更できるようにするトランザクションマネージャーフレームワークを提供する。さらに、同じ共有リソースのコピーを含む複数のパーティションの使用が、デッドロックを回避しながらパーティション間で同時に実行することができる、複雑なトランザクションを提供する。
分散コンピューティングシステム
図1は分散コンピューティングシステム100の一実施形態を示すブロック図である。分散コンピューティングシステム100は、いくつかのパーティション102A~C(ここでは「パーティション102」と個別に呼ばれる)、管理コンピューター128、およびネットワーク126を含む。各パーティション102は分割された一連の計算104A~Cおよびディスパッチエンジン106A~C(ここでは「計算104」および「ディスパッチエンジン106」と個別に呼ばれる)に加え、パーティション102A~Cの各々にわたって分布する共有リソース108A~C(ここでは「共有リソース108」と個別に呼ばれる)の複数のコピーを含む。管理コンピューター128は、分散コンピューティングシステム100のユーザーによって生成された1つまたは複数のユーザー要求132を受信するトランザクションマネージャー130を含む。
一実施形態では、パーティション102A~Cは分散される負荷の一部を備える個別の計算104A~Cをそれぞれ実行するサーバーである。分散コンピューティングシステム100の各パーティション102は、共有リソース108A~Cのそれ自身のコピーを含む。パーティション102A~Cは、計算104A~Cを実行するために共有リソース108A~Cを使用する。例えば、ユーザーが1000台のトラック集団のメンテナンススケジュールを決定するための計算を実行したい場合、各パーティション102A~Cは、共有リソース108A~Cを使用して各トラックのインスタンスを参照し、それに応じて計算102A~Cを分割することができる。各パーティションには同一の共有リソース108A~Cのコピーが含まれるため、新たなリソースのインスタンスの作成、リソースの読み取り、既存リソースの更新および/または削除といった、ユーザーが要求するあらゆる操作(ここでは「CRUD操作」と呼ばれる)は、他のパーティション102A~C全てにわたって共有リソースの各コピーが追加で作成される必要がある。パーティション102A~Cは、パーティション102で実行されるあらゆるCRUD操作が、共有リソース108A~Cのすべてのコピーの間で一貫性のある状態を維持するために残っているパーティション102A~C上で、共有リソース108A~Cのコピーに対して同様に適用されることを確実にするために、トランザクションマネージャー130によって管理される。
共有リソース108A~Cはユーザー要求132を介してユーザーによって要求されるCRUD操作を通じて変更を受信できるオブジェクトであるか、あるいは、ディスパッチエンジン106によって引き起こされた所与のパーティション102に特化した個々の計算104A~Cに用いられる。図1に示される実施形態では、共有リソース108A~Cはリソース1~3を含み、リソース1はスクリプト、リソース2はテンプレート、リソース3はスケジュールである。他の実施形態では、付加的またはより少ない共有リソースおよび/またはここで示されたものとは異なるリソースを含み得る。
本例の目的のため、スクリプトが、どのように計算104A~Cを実行すべきか、および/またはCRUD操作を通じて共有リソースをどのように変更すべきかを各パーティション102に指示する、ユーザーによって定義されたコード(例えば、JavaScript)のブロックであると仮定する。例えば、スクリプトの新しいインスタンスは、トランザクションマネージャー130に対してスクリプトを「作成する」ように指示するユーザー要求132を介し、ユーザーによって作成され得る。同様に、スクリプトを「更新」するためのユーザー要求132をトランザクションマネージャー130に提供することに応答し、スクリプトを新しい状態に更新することができる。さらに、スクリプトは「削除」するためのユーザー要求132を介して削除することができる。ただし、スクリプトのいずれかのコピーが変更完了に失敗すると、トランザクションマネージャーは、すべてのパーティション102A~Cにわたる各スクリプトの状態を、失敗したCRUDの指示を受信する前のスクリプトの状態に戻す。
テンプレートは、スクリプトによって使用されるエイリアスに加えて、ユーザーが計算104ごとに新しいスクリプトを生成するのではなく、一般的なアプリケーションスクリプトを定義できるようにするスクリプトを含むメタデータオブジェクトである。例えば、ユーザーがトラックの一団から特定のトラックのマイレージを決定したい場合、ユーザーは「mileage」などのエイリアスを使用し、各トラックのテンプレート(例えば、計算)のインスタンスを生成して単一のトラックのマイレージを計算するテンプレートを定義することができる。テンプレートはアクティブ状態または非アクティブ状態のいずれかに属し得る。テンプレートにはスクリプトで使用されるエイリアスが含まれているため、CRUD操作を実行する前に、テンプレートを非アクティブ状態にする必要がある。
スケジュールは計算104A~Cがパーティション102A~Cによっていつ実行されるかを指示する(例えば、日次ベース、時間ベース、週次ベースなど)。各パーティション102は、指定されたスケジュールに基づいて、独自の一連の計算104A~Cを実行する。ユーザーがスケジュールに従ってCRUD操作を実行するにためには、変更操作もテンプレートに適用する必要がある。
共有リソース108A~Cは「動作」と呼ばれるCRUD操作によって任意に変更することができる。動作とは、例えば、スクリプトの更新やテンプレートの削除など、ユーザーが1つの共有リソースを使用して実行しようとする作業の単位である。各動作は、一度に1つの共有リソース108A~Cのみを変更し、変更するリソースを示すリソースIDを含む。さらに、各動作にはトランザクションマネージャー130によって受信されたそれぞれの動作特有の識別子として機能する動作IDが割り当てられる。共有リソース108A~Cは変更を受信する前に、その前の状態に戻ることができるため、動作は「doアクション」および「undoアクション」もサポートする。このdoアクションは、スクリプトの作成、テンプレートの更新、スケジュールの削除など、動作が実行するCRUD操作を示す。undoアクションは、共有リソース108A~Cの状態を、作成操作に続く削除操作など、doアクションの実行前の状態に戻す。このように、共有リソース108A~Cを正常に変更することに失敗した場合、与えられる動作をロールバックすることができる。
一度に複数の共有リソース108A~Cに適用され得るCRUD操作は「トランザクション」と呼ばれる。トランザクションは、論理的な作業単位を表す動作の集合である。あるトランザクションの動作が共有リソース108を正常に変更することに失敗した場合、トランザクションマネージャー130は、トランザクションの残りの動作が実行されるのを防ぐ。例えば、「テンプレートの更新」および「スクリプトの削除」といった指示を含むトランザクションが、最初にテンプレートの更新に失敗した場合、トランザクションマネージャー130は失敗したトランザクションがスクリプトを削除するのを先行して阻止する。この場合、失敗したトランザクションですでに実行された動作はすべてロールバックされ、共有リソース108をトランザクション実行以前の状態に戻す。
パーティション102A~Cおよび管理コンピューター128は、図1に示されるネットワーク126を介して通信するように構成される。図1は、有線および/または無線通信システムの両方を使用して、ローカルエリアおよび/またはワイドエリアネットワークの任意の組み合わせを含み得る。本実施形態では、ネットワーク126は、標準的な通信技術および/またはプロトコルを使用する。例えば、ネットワーク126は、イーサネット、802.11、Worldwide Interoperability For Microwave Access(WiMAX)、3G、4G、符号分割多元接続(CDMA)、デジタル加入者線(DSL)などの技術を使用する通信リンクを含む。ネットワーク126を介した通信に使用されるネットワークプロトコルの例には、Multi-Protocol Label Switching(MPLS)、Transmission Control Protocol/Internet Protocol(TCP/IP)、Hyper Text Transfer Protocol(HTTP)、Simple Mail Transfer Protocol(SMTP)、およびFile Transfer Protocol(FTP)が含まれる。ネットワーク126を介して交換されるデータは、Hyper Text Markup Language(HTML)Extensible Markup Language(XML)などの任意の適切なフォーマットを使用して表現することができる。いくつかの実施形態では、ネットワーク126の通信リンクのすべて、またはいくつかは適切な技術を用いて暗号化することができる。
ユーザー要求132は、共有リソース108A~C上で動作、トランザクション、または計算104を実行するようにトランザクションマネージャーに指示する管理コンピューター128のユーザーによって生成された要求である。トランザクションマネージャー130は、受信したユーザー要求132ごとに動作、トランザクション、または計算104の新しいインスタンスを作成する。例えば、トランザクションマネージャー130がスクリプトを更新するための2つの連続するユーザー要求132を受信した場合、トランザクションマネージャー130は、各要求に個別の動作IDを割り当て、各動作のライフサイクルを、それに応じて監視できるようにする。
トランザクションマネージャー130は、分散コンピューティングシステム100のパーティション102A~Cに格納された共有リソースを変更する要求を受信し、受信した要求に基づいて共有リソース108の独自のコピーを変更するように、各パーティション102に指示する。各パーティション102は、共有リソース108A~C上で並行して動作する。変更を受信する共有リソース108A~Cは、動作および/またはトランザクションが実行される前に識別されるため、トランザクションマネージャー130は、動作および/またはトランザクションが競合しないよう、パーティション102A~Cにわたって各リソースの変更を割り付けることが可能である。この方法で動作とトランザクションを調整すると、デッドロックや競合状態を回避しながら並列で実行することができる。与えられた共有リソース108を使用して動作またはトランザクションが適切に実行されない場合、トランザクションマネージャー130は、動作またはトランザクションを実行する前に、リソースの状態を元に戻す。
トランザクションマネージャーフレームワーク
図2は本実施形態によるトランザクションマネージャー130を示すブロック図である。図2に示される実施形態では、トランザクションマネージャー130は状態マネージャー200、状態ストア202、リソースハンドルストア204、動作ハンドルストア206、ロールバックモジュール208、および復旧モジュール210を含む。他の実施形態では、トランザクションマネージャー130は、様々なアプリケーションのための付加的、より少ない、または異なるコンポーネントを含み得る。システムアーキテクチャの詳細を不明確にしないため、ネットワークインターフェース、セキュリティ機能、ロードバランサ、フェイルオーバーサーバー、管理およびネットワーク操作コンソールなどの従来のコンポーネントは示されていない。
状態マネージャー200はそれらがトランザクションと動作を通じて変更することができるよう、共有リソース108A~Cへのアクセスをトランザクションマネージャー130に供給する。状態マネージャー200はリソースハンドルを生成することにより、アクセスを提供する。各リソースハンドルは分散コンピューティングシステム100のパーティション102A~Cに格納された共有リソース108の表現として機能し、共有リソース108を変更するために使用される動作スタックを含む。各リソースハンドルは独自のリソースロックを有する。共有リソースに関連付けられた動作スタックにアクセスする前に、トランザクションマネージャー130は、リソースが変更されている間に他の動作が動作スタックに入るのを防ぐため、リソースロックを入力しなければならない。本実施形態では、動作スタックは、LIFO順序で追加、実行、またはロールバックされる後入れ先出し(LIFO)スタックとして動作する。共有リソース108ごとに1つの動作スタックが確実に存在する。ただし、トランザクションは、動作の集合的なトランザクションを調整するために、特定の時間に様々な動作スタックで動作する場合がある。トランザクションマネージャー130が与えられた動作スタックと関連付けられた各トランザクションまたは動作を完了するときは、有効にトランザクションを終了するために、トランザクションマネージャー130はリソースロックを解放、状態マネージャー200は、メモリーからリソースハンドルを解放する。リソースハンドルが使用されているとき、状態マネージャー200はそれらをリソースハンドルストア204に格納する。
トランザクションマネージャー130は所与のトランザクションを通じて共有リソース108A~Cの様々な状態の在庫を維持するために、状態ストア202を使用する。状態ストア202は、トランザクションマネージャー130が動作によって変更された共有リソース108A~Cの安定性を決めるために使用することができる動作の実行を説明する情報を保持する。例えば、ロールバック操作に失敗した後に動作が復旧のために設定されている場合、トランザクションマネージャー130はその動作を不安定としてマークし、状態ストア202は動作の不安定性の記録を維持する。本実施形態では、状態ストア202は、ユーザーによって定義および実装される。他の実施形態では、状態ストア202は、トランザクションマネージャー130によって維持および実装される。
動作ハンドルストア206は、トランザクションマネージャー130によって生成された動作ハンドルを格納するために使用される。動作ハンドルストア206内の各動作ハンドルは、ユーザー要求132においてトランザクションマネージャー130によって受信された動作の表現として機能する。動作ハンドルはパーティション102A~Cに格納された共有リソース108A~Cを変更するためにリソースハンドルと共に使用される。トランザクションマネージャー130は、変更するリソースハンドルの動作スタックに対応する動作ハンドルを追加することにより、共有リソース108A~Cで動作を実行する。実行されると、リソースハンドルに対応するパーティション102A~Cに格納された共有リソース108が変更され、動作ハンドルは、LIFO順序で動作スタックから削除される。動作ハンドルは動作ハンドルがユーザーによってコミットされたとき、動作ハンドルが無効にされたとき、または動作ハンドルがロールバックモジュール208によってロールバックされたときにのみ、スタックから削除することができる。
トランザクションマネージャー130は、それらの動作ハンドルに基づいて動作の状態に関する詳細を識別することが可能である。例えば、動作ハンドルは、動作がロールバックを要求されたかどうか、ロールバックが試行されたかどうか、ロールバックまたは復旧操作が正常に完了したかどうか、動作がコミットされたかどうか、動作が無効にされたかどうか、動作が失敗したロールバックから復旧されているかどうか、動作のライフサイクルが完了したかどうか、および動作が安定しているかどうか、を示すことが可能である。本実施形態では、失敗したロールバックを実行しなかった場合、または動作が失敗したロールバックから復旧した場合にのみ、動作が安定していると見なすことができる。動作のロールバックと復旧については、次のセクションで詳しく説明される。
ロールバックモジュール208は、与えられたリソースハンドルの動作スタック上における正常な実行に失敗した動作ハンドルを識別し、リソースハンドルを失敗した実行前の状態に復元しようと試行する。ロールバック用に指定された動作ハンドルは、ロールバックが正常に処理されるか、あるいは動作ハンドルが無効になるまではロールバックモジュール208によって削除されない(図5Bを参照してさらに説明する)。ロールバックモジュール208は動作スタックの最上部に位置する安定した動作ハンドルに対してのみロールバック操作を実行することができる。トランザクションマネージャー130はリソースに変更を加える前にリソースロックに入るので、ロールバックモジュール208は同一の共有リソース108A~C上で操作している他の動作がデッドロック、競合状態または、分散コンピューティングシステムの予期される状態との干渉に入ることを保証するために、動作スタック上のロールバックを処理する。ロールバックモジュール208は、ロールバックが成功したか失敗したかを示す信号をトランザクションマネージャー130に送信する。ロールバックモジュール208が失敗した動作ハンドルを適切にロールバックできない場合、必ずトランザクションマネージャー130が復旧操作を試行する。
復旧モジュール210は適切にロールバックに失敗し、動作スタック上で一貫性のない状態のままにされた動作ハンドルの復旧を管理する。復旧モジュール210は復旧タスクが正常に完了したかどうかを監視し、それに従って動作ハンドルを一貫性のある状態に戻し、成功した復旧または失敗した復旧のいずれかを示す信号を返す。復旧が成功した場合、一貫性のない動作ハンドルのライフサイクルは、動作スタックから削除されることによって終了する。復旧に失敗すると、ユーザーからの手動の介入が必要になる可能性がある。
トランザクションを実行するためのプロセス
図3Aは、本実施形態による分散コンピューティングシステム100においてトランザクションを管理するための例示的なプロセスを示す。共有リソース108A~Cを変更するトランザクションは、通常、トランザクションによって変更される共有リソース108の各コピーにおいて一貫した状態を達成すべく、各パーティション102A~C上で実行される。ただし、図3Aに示される例では、明確にするために1つのパーティションのみが示されている。この例では、トランザクションマネージャーは、スクリプトを削除するためのユーザー要求132を受信する。テンプレートリソースにはスクリプトとスクリプトで使用されるエイリアスが含まれているとすると、トランザクションマネージャーはスクリプトを削除する前に、テンプレートリソースを非アクティブ状態に設定する必要もある。これは、テンプレートが変更されているときに、他のスクリプトリソースがテンプレートを使用していないことを保証するために行われる。トランザクションマネージャーはテンプレート動作スタック300およびスクリプト動作スタック302を含む、テンプレートリソースおよびスクリプトリソースのリソースハンドルをそれぞれ取得する。テンプレート動作スタック300およびスクリプト動作スタック302は、トランザクションマネージャー130がテンプレートリソースおよびスクリプトリソースにアクセスし、要求されたトランザクションに従って両方のリソースを変更することができる。
トランザクションマネージャー130は、非アクティブにするためのテンプレートを変更する第1の動作ハンドル(例えば、更新操作)と、スクリプトを削除するための第2の動作ハンドルの2つのハンドルを生成する。これらの動作ハンドルは図3A中で動作ハンドル「更新A1」および動作ハンドル「削除A1」として示され、下付き文字はトランザクションAの範囲内で実行される順序を示している。トランザクションマネージャー130はトランザクションが失敗した場合に現在の状態にロールバックするために、トランザクションAを実行する前に各リソースの状態を記録する。例えば、テンプレートの効果的の非アクティブ化によって更新A1動作ハンドルは正常に実行されたが、削除A2動作ハンドルは失敗した場合、トランザクションAは集合トランザクションとして失敗となる。この例では、ロールバックモジュール208は、トランザクションAの実行が失敗する前に記録された状態情報を使用して、テンプレートリソースおよびスクリプトリソースを以前の状態に復元することが可能である。
図3Bは、本実施形態による図3Aに示されるトランザクションを実行するための例示的な実行順序を示すフローチャートである。図3B中で示される本実施形態において、トランザクションAとCはそれぞれの動作スタックの最下部に位置するため、最初に実行を開始する。一般に、動作スタックの最下部に位置する動作ハンドルは、同じトランザクション内で相互に依存関係がない場合、同時に実行される可能性がある。さらに、同じ動作スタック上の動作ハンドルは、必ず動作スタックの最下部に位置する動作ハンドルから開始し、その後、動作スタックの最上位に到達するまで動作ハンドルを上に処理する。これが図3B中に示されており、トランザクションは更新A1および削除C1を実行することによって開始306をする。動作ハンドル更新A1と削除A2はそれぞれの動作スタックの一番下に位置するが、動作ハンドル削除A2は動作アハンドル更新A1に依存しており、実行する前にその完了を待つ必要がある。しかし、スケジュール動作スタック304の動作ハンドル削除C1は、スクリプト動作スタック302の削除C2に依存せず、実行を開始することが可能である。ただし、仮にスケジュール動作スタック304上の削除C1が、トランザクションAおよびBがそれぞれの実行を完了する前にその実行を正常に完了したとしても、削除A2が更新A1を、削除B2は更新B1を待たなければならないとすると、スクリプト動作スタック302上の削除C2はトランザクションAおよびBが正常に完了するまで実行を待たなければならない。
動作を実行するためのプロセス
図4Aは、本実施形態による共有リソース108を変更するためのプロセスを示す関係図である。図4Aに示される実施形態において、トランザクションマネージャーはユーザー要求から動作400を実行するための指示を受信し、リソースハンドル要求402を状態マネージャーに送信して、変更される共有リソース108へのアクセスを取得する。状態マネージャーは要求された共有リソースに対するリソースハンドルを作成300し、リソースハンドルをトランザクションマネージャーに送信406する。トランザクションマネージャーはリソースハンドルの動作ロックを入力408し、要求された動作を表す動作ハンドルを作成410する。トランザクションマネージャーは変更する共有リソースに対応する動作スタック上に動作ハンドルを配置412する。トランザクションマネージャーは動作を実行414する。動作が成功416に実行された場合、トランザクションマネージャーは結果418を、ユーザー要求を生成したユーザーに送信し、状態マネージャーにリソースハンドルがもはや不要になったことを通知420する。状態マネージャーは、ユーザーが動作ハンドルをコミットするのを待ってから428、リソースハンドルをメモリーから解放する。ただし、実行された動作が成功しなかった場合416、ロールバックモジュールは動作のロールバック422を試行する。ロールバックが成功した場合、トランザクションマネージャーが実行され、失敗した動作ハンドルが動作スタックから削除され、共有リソースは動作ハンドルの実行前に保持していた状態を再開する。ロールバックが失敗した場合、復旧モジュールは要求された動作が実行される前に、共有リソースの前の状態への復旧426を必ず試行する。
図4Bは、本実施形態による動作スタック上で正常に実行された動作ハンドルをコミットするためのプロセスを示す関係図である。図4Bに示す実施形態では、トランザクションマネージャーはユーザー要求からコミット動作426指示を受信し、共有リソースにアクセスするために前もって使われていたリソースハンドルを再取得するために、リソースハンドル要求432を状態マネージャーに再送信する。状態マネージャーはリソースハンドルをトランザクションマネージャーに送信434し、トランザクションマネージャーはリソースハンドルに正常な動作ハンドルをコミットするような指示436を出す。コミットされると、状態マネージャーは動作スタックから動作ハンドルを削除438し、動作ハンドルがクリップインヴォーキング440かどうかを識別する。動作ハンドルがクリップインヴォーキングである場合、動作ハンドルの以前の状態は無効になり、動作スタックからクリップ442される。動作ハンドルがクリップインヴォーキングでない場合は、単純に動作スタックの最上部から削除される。トランザクションマネージャーは、リソースハンドルが不要になったことを状態マネージャーに再度通知444する。状態マネージャーは、動作スタックが空であるかどうかを判定446する。いくつかの動作ハンドルが動作スタック上に残っている場合、状態マネージャーは各動作ハンドルが正常に実行されるか、ロールバックされるか、動作スタックからクリップされるまで、リソースハンドルをメモリーから解放しない。動作スタックが空の場合は、状態マネージャーはリソースハンドルを解放448し、次の要求を待つ。
動作スタックを管理するためのプロセス
図5A、5B、および6は分散コンピューティングシステム100の各パーティション102内の共有リソース108に対応するリソース動作スタックの管理に関連するいくつかのプロセスを示している。以下の例では簡便のため、リソース動作スタックが1つのパーティションにのみ示されている。しかし、以下の例で実行される動作は分散コンピューティングシステム100内のすべてのパーティションにわたる共有リソースの各コピーに適用される。各例においては、リソース動作スタック500はスクリプト動作スタック、テンプレート動作スタック、またはスケジュール動作スタックに対応し得る。
動作ハンドルをコミットするプロセス
図5Aは、本実施形態によるリソース動作スタック500上で正常な動作ハンドルをコミットするためのプロセスを示している。図5に示されるように、ステップAではリソース動作スタック500は空(すなわち、対応する共有リソースを変更する動作ハンドルがない)であり、その初期状態はヌル(null)である。ステップBにおいて、リソース動作スタック500はリソースのインスタンスの作成を要求する動作ハンドルを受信し、リソース動作スタック500の状態を状態1に更新する。1つまたは複数の実施形態においては、この動作はスクリプト動作スタック内のスクリプト、テンプレート動作スタック内のテンプレート、またはスケジュール動作スタック内のスケジュールの作成に対応し得る。ステップCにおいては、動作ハンドルは正常に実行され、ユーザーによってコミットされ、そして、リソース動作スタック500から削除されるように設定される(点線で示されているように)。最終的に、ステップDでは、正常な動作ハンドルがリソース動作スタック500から削除され、現在の状態は状態1を維持する。
動作スタックをクリッピングするプロセス
図5Bは、本実施形態によるリソース動作スタック500をクリッピングするためのプロセスを示している。図5BのステップAに示されるように、リソース動作スタック500は動作スタックに対して状態3に更新するように指示する動作ハンドルを受信し、その結果、リソース動作スタックは現在の状態3を有するようになる。1つまたは複数の実施形態においては、この動作はスクリプト動作スタック内のスクリプトの更新、テンプレート動作スタック内のテンプレートの更新、またはスケジュール動作スタック内のスケジュールの更新に対応し得る。ただし、動作ハンドルがリソース動作スタック500から削除される前に、別の動作ハンドルが到着して実行される。ステップBでは、リソース動作スタック500は、動作スタックに指示する第2の動作ハンドルを受信して、リソース動作スタック500に対応する共有リソース上で、再び更新を実行する。ステップCにおいて、第2の動作ハンドルは正常に実行され、リソース動作スタックを状態4に更新し、そして、リソース動作スタック500から削除されるように設定される(点線で示されるように)。第2の更新動作ハンドルが成功であったため、それはコミットされ、リソース動作スタック500から削除される。しかし、共有リソースは現在の状態が状態4であるため、あたかもリソース動作スタックを状態3に更新する動作ハンドルが全く実行されなかったように見える可能性がある。したがって、トランザクションマネージャー130は第1の更新動作ハンドルを無効にし、第2の動作ハンドルが削除されると動作スタックからクリップする。これは、ステップDに示されており、ここで、リソース動作スタック500は再び空となり、現在の状態は4を有することとなる。
失敗した動作をロールバックするプロセス
図6は本実施形態による、失敗した動作ハンドルをロールバックするためのプロセスを示している。図6に示される本実施形態のステップAにおいて、初期のリソース動作スタック500は作成動作に対応する動作ハンドルを有しており、現在の状態は1である。ステップBでは、初期の作成動作ハンドルが実行され、追加の作成動作ハンドルがリソース動作スタック500に加えられる。このステップでは、作成動作ハンドルはコミットもロールバックもされておらず、第2の作成動作ハンドルはまだ実行を終了せずに、リソース動作スタック500の現在の状態は2ではなくむしろ1のままである。ステップCにおいては、リソース動作スタック500によって参照される共有リソースが第1の作成動作ハンドルによって既に作成されているため、第2の作成動作ハンドルの実行は失敗することになる。第2の作成動作ハンドルはロールバック用にマークされ(点線で示されているように)、現在の状態は1を維持する。リソース動作スタック500は、ロールバックモジュール208によって処理される。第2の作成動作ハンドルはリソース動作スタック500の最上部にあり、ロールバックのマークが付けられているため、迅速にロールバックすることができる。ロールバックモジュール208は、第2の作成動作ハンドルに対してロールバック操作を実行し、それをリソース動作スタック500から削除する。ステップDでは、第1の作成動作ハンドルはコミットされ(点線で示されるように)、その後、現在の状態1を残してリソース動作スタック500から削除される。
トランザクションを管理するためのプロセス
図7は本実施形態によるトランザクションを管理するためのプロセスを示している。本実施形態では、図7に示されるように、トランザクションマネージャーはユーザー要求から共有リソース上でトランザクションを実行するための要求を受信700し、共有リソース上でトランザクションを実行710する。トランザクションが成功である場合、トランザクションマネージャーにトランザクションの成功を示し720、トランザクションをコミット730し、分散コンピューティングシステムのユーザーに結果を返す740。逆に、トランザクションが失敗である場合は失敗したトランザクションを示し720、ロールバックモジュールは失敗したトランザクションをロールバック750する。
管理コンピューターの例
図8は本実施形態による管理コンピューター800の例を示す高水準のブロック図である。チップセット804に結合された少なくとも1つのプロセッサー802が示されている。チップセット804はメモリーコントローラハブ820および入力/出力(I / O)コントローラハブ822を含む。メモリー806およびグラフィックアダプタ812はメモリーコントローラハブ820に結合され、ディスプレイデバイス818はグラフィックアダプタ812に結合される。ストレージデバイス808、キーボード810、ポインティングデバイス814、およびネットワークアダプタ816はI / Oコントローラハブ822に結合される。管理コンピューター800の他の実施形態は異なるアーキテクチャを有する。例えば、いくつかの実施形態では、メモリー806はプロセッサー802に直接結合される。
ストレージデバイス808は、ハードドライブ、コンパクトディスクリードオンリーメモリー(CD-ROM)、DVD、またはソリッドステートメモリーデバイスなどの1つまたは複数の非一時的なコンピューター可読記憶媒体を含む。メモリー806は、プロセッサー802によって使用される指示およびデータを保持する。ポインティングデバイス814は管理コンピューター800にデータを入力するために、キーボード810と組み合わせて使用される。グラフィックアダプタ812は、画像および他の情報をディスプレイデバイス818に表示する。いくつかの実施形態では、ディスプレイデバイス818はユーザー入力および選択を受信するためのタッチスクリーン機能を含む。ネットワークアダプタ816は管理コンピューター800をネットワーク126に結合する。管理コンピューター800のいくつかの実施形態は、図8に示されるものとは異なるおよび/または他の構成要素を有する。
管理コンピューター800は、本明細書で説明される機能を提供するためのコンピュータプログラムモジュールを実行するのに適したものである。「モジュール」という用語は、本明細書で使用されるときは、特定の機能を提供するために使用されるコンピュータープログラム指示および/または他の論理を指す。したがって、モジュールはハードウェア、ファームウェア、および/またはソフトウェアで実装することが可能である。本実施形態では、実行可能なコンピュータープログラム指示で形成されたプログラムモジュールは記憶装置808に格納され、メモリー806に導かれ、プロセッサー802によって実行される。
追加の考慮事項
上述のいくつかの部分は、アルゴリズムのプロセスまたは操作の観点から実施形態を説明している。これらのアルゴリズムの説明および表現は、当業者達の業務内容を他の当業者に効果的に伝えるために、データ処理技術の当業者によって一般的に用いられている。これらの操作は、プロセッサーまたは同等の電気回路、マイクロコード等によって実装するための指示を備えるコンピュータープログラムによって実装されると理解される。さらに、一般性を欠くことなく、これらの機能操作の配置をモジュールと呼ぶことも便利な場合があることが認められている。説明された操作およびそれらに関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらのあらゆる組み合わせで形態化することができる。
本明細書のあらゆる言及で使用される「一実施形態」または「実施形態」は、実施形態に関連して説明される特定の要素、特徴、構造、または特性が少なくとも1つの実施形態に含まれることを意味する。本明細書の様々な場所における「一実施形態において」という表現は、必ずしもすべてが同じ実施形態を指すとは限らない。
いくつかの実施形態は、それらから派生したものと合わせて「結合された」および「接続された」という表現を使用して説明され得る。これらの用語は、相互の同義語として意図されたものではないことを理解する必要がある。例えば、いくつかの実施形態は、2つ以上の要素が互いに直接物理的または電気的に接触していることを示すために「接続された」という用語を使用して説明され得る。別の例では、いくつかの実施形態は、2つ以上の要素が直接の物理的または電気的接触にあることを示すために「結合された」という用語を使用して説明され得る。ただし、「結合された」という用語は、2つ以上の要素が互いに直接接触していないが、それでも互いに協力または相互作用していることを意味する場合もある。
本明細書で使用される場合、「備える」、「備えている」、「含む」、「含んでいる」、「有する」、「有している」またはそれらの変形した用語は、非独占的な包含をカバーすることを意図している。例えば、要素のリストを含むプロセス、方法、物品、または装置は、必ずしもそれらの要素のみに限定されるわけではなく、そのようなプロセス、方法、物品、または装置に明確にリストに示されていないか、固有ではない他の要素を含み得る。さらに、明確に反対の記載がない限り、「または」は包括していることを指しており、排他的であることを指してはいない。例えば、条件AまたはBは次のいずれかによって満たされる:Aは真(あるいは、存在する)でありBは偽(あるいは、存在しない)、Aは偽(あるいは、存在しない)でありBは真(あるいは、存在する)、AとBの両方とも真(あるいは、存在する)である。さらに、「a」または「an」の使用は、本明細書の実施形態の要素およびコンポーネントを説明するために使用される。これは単に便宜のため、および開示の一般的な意味を与えるために行われる。この説明は、1つまたは少なくとも1つを含むように読む必要があり、別の意味であることが明確でない限り、単数形には複数形も含まれる。
この開示を読むにあたり、当業者はメッセージングディレクトリおよびそれらのディレクトリのメッセージングメンバーを生成するためのシステムおよびプロセスに対する、追加の代替となる構造的および機能的設計を理解し得る。したがって、特定の実施形態および用途が例示、説明されているが、説明される内容は本明細書に開示される通りの構造および構成要素に限定されないこと、そして、当業者によって本明細書に開示される方法および装置の配置、操作および詳細の様々な変更、変化、バリエーションは明白となるとなることは理解されるべきである。

Claims (17)

  1. 分散コンピュータシステムを使用してデッドロックを防止するための方法であって、
    トランザクションマネージャーによって、共有リソース上でトランザクションを実行する要求を受信する工程であって、前記共有リソースは複数のコピーを有し、前記複数のコピーのそれぞれのコピーは1つまたは複数のパーティションに配置されている工程と、
    前記トランザクションマネージャーによって、前記要求されたトランザクションに基づいて前記共有リソースの状態を変更する工程であって、前記変更する工程は、前記共有リソースの前記状態を第1の状態から第2の状態に変更する工程であり、
    状態マネージャーによって、1つまたは複数のリソースハンドルを生成する工程であって、前記1つまたは複数のリソースハンドルは前記共有リソースを表現する工程と、
    前記トランザクションマネージャーによって、1つまたは複数の動作ハンドルを生成する工程であって、前記1つまたは複数の動作ハンドルのそれぞれは動作を記述し、前記動作は共有リソースの状態を第1の状態から第2の状態に変更する工程と、
    前記トランザクションマネージャーによって、前記1つまたは複数の動作ハンドルを1つまたは複数の動作スタックに加える工程であって、前記1つまたは複数の動作スタックは前記1つまたは複数のリソースハンドル内に配置される工程と、
    を備える工程と、
    前記トランザクションマネージャーによって、成功したトランザクションまたは失敗したトランザクションを指示する工程であって、前記指示することは、前記共有リソースの前記状態に基づいている工程と、
    前記成功したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションを前記複数のコピーに適用する工程と、
    前記トランザクションマネージャーによって、前記共有リソースおよび前記複数のコピーをコミットする工程と、
    前記トランザクションマネージャーによって、前記変更された共有リソースに関連付けられた結果を返す工程と、
    前記失敗したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションが前記複数のコピーを変更することを防止する工程と、
    ロールバックモジュールによって、前記変更された共有リソースへのロールバックを適用する工程であって、前記ロールバックは前記共有リソースの前記状態を前記第2の状態から前記第1の状態に戻す工程と、
    前記ロールバックモジュールによって、前記コピーに前記ロールバックを適用する工程と、
    前記ロールバックモジュールによって、成功したロールバックまたは失敗したロールバックを指示する工程と、
    を備える、方法。
  2. 請求項1に記載の方法であって、前記パーティションは複数のトランザクションが各コピーに対して並行して実行されることを可能にする、方法。
  3. 請求項1に記載の方法であって、前記共有リソースは、スクリプトリソース、テンプレートリソース、またはスケジュールリソースのうちの少なくとも1つである、方法。
  4. 請求項に記載の方法であって、前記動作は、処理サイクルにおいて1つの共有リソースを変更する、方法。
  5. 請求項1に記載の方法であって、前記トランザクションは、処理サイクルにおいて複数の共有リソースを変更する、方法。
  6. 請求項1に記載の方法であって、前記失敗したトランザクションを指示することは、
    前記トランザクションマネージャーによって、前記複数のコピーに対する変更を防止する工程と、
    前記トランザクションマネージャーによって、前記共有リソースに関連付けられた結果を先行して阻止する工程と、
    をさらに備える、方法。
  7. 請求項に記載の方法であって、
    前記トランザクションマネージャーによって、前記動作スタックから1つまたは複数の動作ハンドルをクリッピングする工程であって、前記1つまたは複数の動作ハンドルは無効化を有し、前記無効化は最新の動作ハンドルに基づく
    工程をさらに備える、方法。
  8. 請求項に記載の方法であって、前記動作スタックは、LIFOデータ構造である、方法。
  9. 非一時的なコンピューター可読記憶媒体であって、プロセッサーによって実行されると、
    トランザクションマネージャーによって、共有リソース上でトランザクションを実行する要求を受信する工程であって、前記共有リソースは複数のコピーを有し、前記複数のコピーのそれぞれのコピーは1つまたは複数のパーティションに配置されている工程と、
    前記トランザクションマネージャーによって、前記要求されたトランザクションに基づいて前記共有リソースの状態を変更する工程であって、前記変更する工程は、前記共有リソースの前記状態を第1の状態から第2の状態に変更する工程であり、
    状態マネージャーによって、1つまたは複数のリソースハンドルを生成する工程であって、前記1つまたは複数のリソースハンドルは前記共有リソースを表現する工程と、
    前記トランザクションマネージャーによって、1つまたは複数の動作ハンドルを生成する工程であって、前記1つまたは複数の動作ハンドルのそれぞれは動作を記述し、前記動作は共有リソースの状態を第1の状態から第2の状態に変更する工程と、
    前記トランザクションマネージャーによって、前記1つまたは複数の動作ハンドルを1つまたは複数の動作スタックに加える工程であって、前記1つまたは複数の動作スタックは前記1つまたは複数のリソースハンドル内に配置される工程と、
    を備える工程と、
    前記トランザクションマネージャーによって、成功したトランザクションまたは失敗したトランザクションを指示する工程であって、前記指示することは、前記共有リソースの前記状態に基づいている工程と、
    前記成功したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションを前記複数のコピーに適用する工程と、
    前記トランザクションマネージャーによって、前記共有リソースおよび前記複数のコピーをコミットする工程と、
    前記トランザクションマネージャーによって、前記変更された共有リソースに関連付けられた結果を返す工程と、
    前記失敗したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションが前記複数のコピーを変更することを防止する工程と、
    ロールバックモジュールによって、前記変更された共有リソースへのロールバックを適用する工程であって、前記ロールバックは前記共有リソースの前記状態を前記第2の状態から前記第1の状態に戻す工程と、
    前記ロールバックモジュールによって、前記コピーに前記ロールバックを適用する工程と、
    前記ロールバックモジュールによって、成功したロールバックまたは失敗したロールバックを指示する工程と、
    を前記プロセッサーに実行させる符号化された命令を有する、非一時的なコンピューター可読記憶媒体。
  10. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記パーティションは複数のトランザクションが各コピーに対して並行して実行されることを可能にする、非一時的なコンピューター可読記憶媒体。
  11. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記共有リソースは、スクリプトリソース、テンプレートリソース、またはスケジュールリソースのうちの少なくとも1つである、非一時的なコンピューター可読記憶媒体。
  12. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記動作は、処理サイクルにおいて1つの共有リソースを変更する、非一時的なコンピューター可読記憶媒体。
  13. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記トランザクションは、処理サイクルにおいて複数の共有リソースを変更する、非一時的なコンピューター可読記憶媒体。
  14. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記失敗したトランザクションを指示することは、
    前記トランザクションマネージャーによって、前記複数のコピーに対する変更を防止する工程と、
    前記トランザクションマネージャーによって、前記共有リソースに関連付けられた結果を先行して阻止する工程と、
    をさらに備える、非一時的なコンピューター可読記憶媒体。
  15. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、
    前記トランザクションマネージャーによって、前記動作スタックから1つまたは複数の動作ハンドルをクリッピングする工程であって、前記1つまたは複数の動作ハンドルは無効化を有し、前記無効化は最新の動作ハンドルに基づく
    工程をさらに備える、非一時的なコンピューター可読記憶媒体。
  16. 請求項に記載の非一時的なコンピューター可読記憶媒体であって、前記動作スタックは、LIFOデータ構造である、非一時的なコンピューター可読記憶媒体。
  17. システムであって、
    コンピュータープロセッサーと、
    前記コンピュータープロセッサーに結合されたコンピューター可読記憶媒体と、
    を備え、
    前記コンピューター可読記憶媒体は実行可能コードを格納し、前記コードは、前記コンピュータープロセッサーによって実行されると、
    トランザクションマネージャーによって、共有リソース上でトランザクションを実行する要求を受信する工程であって、前記共有リソースは複数のコピーを有し、前記複数のコピーのそれぞれのコピーは1つまたは複数のパーティションに配置されている工程と、
    前記トランザクションマネージャーによって、前記要求されたトランザクションに基づいて前記共有リソースの状態を変更する工程であって、前記変更する工程は、前記共有リソースの前記状態を第1の状態から第2の状態に変更する工程であり、
    状態マネージャーによって、1つまたは複数のリソースハンドルを生成する工程であって、前記1つまたは複数のリソースハンドルは前記共有リソースを表現する工程と、
    前記トランザクションマネージャーによって、1つまたは複数の動作ハンドルを生成する工程であって、前記1つまたは複数の動作ハンドルのそれぞれは動作を記述し、前記動作は共有リソースの状態を第1の状態から第2の状態に変更する工程と、
    前記トランザクションマネージャーによって、前記1つまたは複数の動作ハンドルを1つまたは複数の動作スタックに加える工程であって、前記1つまたは複数の動作スタックは前記1つまたは複数のリソースハンドル内に配置される工程と、
    を備える工程と、
    前記トランザクションマネージャーによって、成功したトランザクションまたは失敗したトランザクションを指示する工程であって、前記指示することは、前記共有リソースの前記状態に基づいている工程と、
    前記成功したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションを前記複数のコピーに適用する工程と、
    前記トランザクションマネージャーによって、前記共有リソースおよび前記複数のコピーをコミットする工程と、
    前記トランザクションマネージャーによって、前記変更された共有リソースに関連付けられた結果を返す工程と、
    前記失敗したトランザクションを指示することに応答して、
    前記トランザクションマネージャーによって、前記トランザクションが前記複数のコピーを変更することを防止する工程と、
    ロールバックモジュールによって、前記変更された共有リソースへのロールバックを適用する工程であって、前記ロールバックは前記共有リソースの前記状態を前記第2の状態から前記第1の状態に戻す工程と、
    前記ロールバックモジュールによって、前記コピーに前記ロールバックを適用する工程と、
    前記ロールバックモジュールによって、成功したロールバックまたは失敗したロールバックを指示する工程と、
    を実行する、システム。
JP2021504583A 2018-04-10 2018-07-06 分散コンピューティングシステムにおける共有リソースの管理 Active JP7183384B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/950,031 2018-04-10
US15/950,031 US10698724B2 (en) 2018-04-10 2018-04-10 Managing shared resources in a distributed computing system
PCT/IB2018/055020 WO2019197887A1 (en) 2018-04-10 2018-07-06 Managing shared resources in a distributed computing system

Publications (3)

Publication Number Publication Date
JP2021521570A JP2021521570A (ja) 2021-08-26
JP2021521570A5 JP2021521570A5 (ja) 2021-10-07
JP7183384B2 true JP7183384B2 (ja) 2022-12-05

Family

ID=68096528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021504583A Active JP7183384B2 (ja) 2018-04-10 2018-07-06 分散コンピューティングシステムにおける共有リソースの管理

Country Status (7)

Country Link
US (1) US10698724B2 (ja)
JP (1) JP7183384B2 (ja)
CN (1) CN112272823B (ja)
AU (2) AU2018418837A1 (ja)
CA (1) CA3096915C (ja)
MX (1) MX2020010647A (ja)
WO (1) WO2019197887A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191451A (ja) 2014-03-28 2015-11-02 富士通株式会社 情報処理装置、制御方法および制御プログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941647B2 (en) * 1999-01-28 2011-05-10 Ati Technologies Ulc Computer for executing two instruction sets and adds a macroinstruction end marker for performing iterations after loop termination
EP1151374B1 (en) * 1999-01-28 2017-08-02 Advanced Silicon Technologies, LLC Executing programs for a first computer architecture on a computer of a second architecture
US7539999B2 (en) * 2003-10-23 2009-05-26 Microsoft Corporation Kernel-level transactions
US7730286B2 (en) 2005-12-30 2010-06-01 Intel Corporation Software assisted nested hardware transactions
GB0625698D0 (en) 2006-12-21 2007-01-31 Ibm Rollback support in distributed data management systems
US20090064141A1 (en) 2007-08-29 2009-03-05 Microsoft Corporation Efficient utilization of transactions in computing tasks
US8275815B2 (en) 2008-08-25 2012-09-25 International Business Machines Corporation Transactional processing for clustered file systems
US8166481B2 (en) * 2008-10-20 2012-04-24 Microsoft Corporation Transaction processing in transactional memory
US20100274972A1 (en) * 2008-11-24 2010-10-28 Boris Babayan Systems, methods, and apparatuses for parallel computing
US9165025B2 (en) * 2009-12-11 2015-10-20 International Business Machines Corporation Transaction recovery in a transaction processing computer system employing multiple transaction managers
CN102103518B (zh) * 2011-02-23 2013-11-13 运软网络科技(上海)有限公司 一种在虚拟化环境中管理资源的系统及其实现方法
CN102521028B (zh) * 2011-12-02 2013-07-24 华中科技大学 一种分布式环境下的事务内存系统
US9152509B2 (en) * 2011-12-13 2015-10-06 Advanced Micro Devices, Inc. Transactional memory conflict management
WO2014003974A1 (en) * 2012-06-26 2014-01-03 Intel Corporation Systems, apparatuses, and methods for a hardware and software system to automatically decompose a program to multiple parallel threads
EP3063630B1 (en) 2013-10-31 2018-10-10 Hewlett-Packard Enterprise Development LP Non-blocking registration in distributed transactions
CN103995868B (zh) * 2014-05-20 2017-07-21 科大国创软件股份有限公司 面向分布式系统的全局事务管理器及事务处理方法
GB2528270A (en) 2014-07-15 2016-01-20 Advanced Risc Mach Ltd Call stack maintenance for a transactional data processing execution mode
US11556396B2 (en) * 2015-05-08 2023-01-17 Seth Lytle Structure linked native query database management system and methods
CN106254466B (zh) * 2016-08-05 2019-10-01 河海大学常州校区 基于局域网的hdfs分布式文件共享方法
CN106776052B (zh) * 2016-12-07 2019-12-10 金蝶软件(中国)有限公司 共享资源访问方法和装置
CN106874074B (zh) * 2016-12-26 2020-05-05 哈尔滨工业大学 一种基于软件事务内存的并发缺陷规避系统及方法
US10819756B2 (en) * 2017-04-10 2020-10-27 OpenLegacy Technologies Ltd. Atomic transaction over non-persistent protocol(s)
US10268502B2 (en) * 2017-06-29 2019-04-23 Intel Corporation Methods and apparatus to perform atomic transactions in nonvolatile memory under hardware transactional memory

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015191451A (ja) 2014-03-28 2015-11-02 富士通株式会社 情報処理装置、制御方法および制御プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Oracle8i レプリケーション・ガイド リリース8.1 ,初版,ORACLE,2000年02月28日,pp.2-1~2-21

Also Published As

Publication number Publication date
JP2021521570A (ja) 2021-08-26
WO2019197887A1 (en) 2019-10-17
CA3096915C (en) 2023-07-25
CN112272823B (zh) 2024-04-23
US10698724B2 (en) 2020-06-30
US20190310877A1 (en) 2019-10-10
CA3096915A1 (en) 2019-10-17
EP3776201A1 (en) 2021-02-17
MX2020010647A (es) 2021-01-15
AU2022202804A1 (en) 2022-05-19
CN112272823A (zh) 2021-01-26
AU2022202804B2 (en) 2023-05-04
AU2018418837A1 (en) 2020-11-12

Similar Documents

Publication Publication Date Title
US8126843B2 (en) Cluster-wide read-copy update system and method
US10503720B2 (en) Providing eventual consistency for multi-shard transactions
CN106415538B (zh) 使用共享文件访问-rest接口的文件服务
US10067791B2 (en) Methods and apparatus for resource management in cluster computing
US7640249B2 (en) System and method for transactional session management
US9740582B2 (en) System and method of failover recovery
US11061884B2 (en) Method and system to accelerate transaction commit using non-volatile memory
US7240057B2 (en) System and method for implementing journaling in a multi-node environment
EP1900189B1 (en) Parallel filesystem traversal for transparent mirroring of directories and files
US7760743B2 (en) Effective high availability cluster management and effective state propagation for failure recovery in high availability clusters
CN105955804B (zh) 一种处理分布式事务的方法与设备
US20120102506A1 (en) Web service patterns for globally distributed service fabric
US20120331150A1 (en) Systems management operationalworkflow templates
US20140373026A1 (en) Method, Apparatus and System for Coordinating Execution of Tasks in a Computing System Having a Distributed Shared Memory
Memishi et al. Fault tolerance in MapReduce: A survey
US7757119B2 (en) Inherited transactions in asynchronous messaging
US11449241B2 (en) Customizable lock management for distributed resources
Shrivastava et al. Supporting transaction predictability in replicated DRTDBS
JP7183384B2 (ja) 分散コンピューティングシステムにおける共有リソースの管理
US8849916B2 (en) Infrastructure management operational workflows
WO2023103340A1 (zh) 一种区块数据提交的方法及装置
KR20190109638A (ko) 분산 파일 시스템을 기반으로 하는 빅데이터 처리 플랫폼의 태스크 스케줄링 방법, 이를 위한 컴퓨터 프로그램 및 컴퓨터 판독 가능 기록 매체
Pandey et al. SP-LIFT: a serial parallel linear and fast-paced recovery-centered transaction commit protocol
González-Aparicio et al. A transaction platform for microservices-based big data systems
US11424982B2 (en) Remediation of a system to new desired state using configuration dependency graph

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210701

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221122

R150 Certificate of patent or registration of utility model

Ref document number: 7183384

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150