JP7157709B2 - 計算機システム及びプログラム実行方法 - Google Patents

計算機システム及びプログラム実行方法 Download PDF

Info

Publication number
JP7157709B2
JP7157709B2 JP2019125471A JP2019125471A JP7157709B2 JP 7157709 B2 JP7157709 B2 JP 7157709B2 JP 2019125471 A JP2019125471 A JP 2019125471A JP 2019125471 A JP2019125471 A JP 2019125471A JP 7157709 B2 JP7157709 B2 JP 7157709B2
Authority
JP
Japan
Prior art keywords
processing unit
program
task
execution
core processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019125471A
Other languages
English (en)
Other versions
JP2021012481A (ja
Inventor
拓馬 野水
英宏 河合
雅昭 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019125471A priority Critical patent/JP7157709B2/ja
Priority to US17/618,016 priority patent/US20220261298A1/en
Priority to PCT/JP2020/009409 priority patent/WO2021002054A1/ja
Publication of JP2021012481A publication Critical patent/JP2021012481A/ja
Application granted granted Critical
Publication of JP7157709B2 publication Critical patent/JP7157709B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、計算機システム及びプログラム実行方法に関する。
システムの無停止運転を実現する技術として、フォールト・トレラント・コンピュータ(Fault tolerant computer)がある。フォールト・トレラント・コンピュータは、CPU(Central Processing Unit)やメモリ、I/O(Input, Output)バスなどを多重化したハードウェアにて、同一プログラムを複数のCPUで動作させて結果を照合する。このため、1台のCPUに障害が発生しても、他のCPUが処理を継続することができる。
このフォールト・トレラント・コンピュータと同じレベルの多重性を、多重化向けの専用ハードウェアを製作せずに実現する方法として、疎結合な複数の汎用計算機を用いてフォールト・トレラント・コンピュータを構成する技術がある。
例えば、特許文献1には、疎結合なフォールト・トレラント・コンピュータに関する記載がある。すなわち、特許文献1には、「複数CPUを二重化バスで接続して同一タスクを実行し、実行結果(命令の出力)を照合する。」と記載されている。
特開2009-217503号公報
ところで、特許文献1に記載された疎結合なフォールト・トレラント・コンピュータは、次に動作させるプログラムの情報をネットワーク越しに共有し、実行開始タイミングを待合わせることで、特定のコアが同期して動作する仕組み(タスク同期処理)である。このシステムで、単位時間当たりの処理性能を増やすためには、同期して動くコアを増やす必要がある。
しかし、同期して動作するコアを増やすためには、同期のための通信用帯域、通信用ハードウェアや、突合せを行う装置の演算資源を増やさなければならない。例えば、同期処理を行う一組のコアに加えて、さらにもう一組のコアが別の同期処理を行う場合には、同期のための通信用帯域、通信用ハードウェアや、突合せを行う装置の一組を追加しなければならない。このため、システムの管理者は、ハードウェアの増強を検討したり、システムの構成変更を検討する必要があった。
本発明はこのような状況に鑑みて成されたものであり、ハードウェアの構成を変更せず、計算機システムの処理性能を向上することを目的とする。
本発明に係る計算機システムは、オペレーティングシステムによって動作が管理される同期コア処理部及び準同期コア処理部を有し、同期コア処理部及び準同期コア処理部は、所定の実行単位ごとにプログラムを切り替えて、複数のプログラムを並列に実行可能である計算機と、ネットワークで接続される複数の計算機で実行されたプログラムの実行結果を比較して比較結果を出力する比較機と、を備え、計算機が実行するプログラムの実行タイミングを他の計算機で実行されるプログラムの実行タイミングと同期させるための同期用データを、ネットワークを介して規定の時間範囲で他の計算機と交換する。
そして、同期コア処理部は、他の計算機が備える同期コア処理部と同期した同期タイミングで、他の計算機が実行するプログラムと同じプログラムを実行単位ごとに実行し、プログラムの特性に応じて移住が要請される実行中のプログラムを準同期コア処理部に移住させ、準同期コア処理部は、同期コア処理部から移住したプログラムを実行した後、同期コア処理部にプログラムを移住させ、同期コア処理部は、準同期コア処理部から移住したプログラムを同期タイミングで実行して得た実行結果を比較機に出力する。
本発明によれば、プログラムの特性に応じて移住が要請される実行中のプログラムを準同期コア処理部に移住させることで、同期コア処理部と準同期コア処理部が並列に実行可能となる。また、複数の計算機で準同期コア処理部を同期して動作させる通信用帯域や新たなハードウェアは不要である。このため、計算機のハードウェア構成を変更することなく、計算機システムの処理性能を向上させることができる。
上記した以外の課題、構成及び効果は、以下の実施の形態の説明により明らかにされる。
本発明の一実施の形態に係る計算機システムのシステム構成図である。 本発明の一実施の形態に係るタスク同期処理のために各計算機で稼働するオペレーティングシステムの構成例と、タスク実行の例を示すタイムチャートである。
以下、本発明を実施するための形態について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素については、同一の符号を付することにより重複する説明を省略する。
[一実施の形態]
以下、本発明の一実施の形態に係るタスク同期処理の例について図1と図2を参照して説明する。
<計算機システムの構成例>
図1は、本発明の一実施の形態に係る計算機システム10のシステム構成図である。
計算機システム10は、計算機X201と、計算機Y211と、計算機Z221と、計算機T231と、出力比較機251とがネットワーク240に接続され、出力比較機251と外部装置とがネットワーク260で接続される構成をとる。
計算機X201~T231(複数の計算機の一例)は、いずれも共有するメモリ、ディスク等を持っておらず、プログラムの同期処理に必要な通知を互いに行う。このため、計算機システム10は、複数の計算機から出力結果を得る、疎結合なフォールト・トレラント・コンピュータを構成する。このため、計算機システム10では、計算機X201が実行するプログラムの情報を、ネットワーク240を介して規定の時間範囲で他の計算機Y211~T231が交換する。つまり、複数の計算機X201~t231が互いに実行するプログラムの情報を交換する。なお、計算機システム10が備える計算機の数は2台以上であればよく、本実施の形態に係る4台に限らない。
計算機X201は、CPU(Central Processing Unit)202と、バスコントローラ(BC:Bus Controller)205と、メモリ206と、NIC(Network Interface Card)207を備える。計算機Y211、計算機Z221、計算機T231は、計算機X201と同等の構成要素を備えるため、ここでは、計算機X201の構成例について説明する。
CPU202は、コア203と、コア204を備える。そして、CPU202と、バスコントローラ205と、メモリ206と、NIC207とが、計算機X201内に設けられたバスによって接続される構成をとる。計算機X201が搭載するCPU202は1つに限らず、また、CPU202の中のコアの数も2つ以上であれば数に制限はない。
CPU202は、本実施の形態に係る各機能を実現するソフトウェアのプログラムコードをメモリ206から読み出して、実行する演算器の一例として用いられる。メモリ206には、CPU202の演算処理の途中で発生した変数やパラメーター等が一時的に書き込まれ、これらの変数やパラメーター等がCPU202によって適宜読み出される。ただし、CPU202に代えてMPU(Micro Processing Unit)等の他の演算器を用いてもよい。
CPU202で稼働するコア203,204は、図1では不図示のオペレーティングシステムにより動作が管理される機能部であり、ソフトウェアプログラムによってコア203,204の機能が実現される。後述する図2にて詳細を説明するが、コア203は、例えば同期コア処理部101として用いられ、コア204は、準同期コア処理部108として用いられる。コア203,204で実行されるプログラムの実行単位はタスク(プロセスともいう)である。以下の説明では、実行されるプログラムをタスクと呼ぶこともある。本実施の形態に係るプログラムの特性によっては、コア203で実行されるタスクがコア204に移住され、コア204で実行された後、コア203に戻されて、コア203が戻されたタスクを実行することが可能である。
バスコントローラ205は、メモリ206におけるメモリ空間(アドレス)を生成し、メモリ206に書き込まれるデータを制御する。メモリ206には、例えば、コア203、204で実行されたプログラムの実行結果が書き込まれる。また、バスコントローラ205は、計算機X201内の各デバイスによるデータの衝突を避けるために、各デバイスのデータの入出力を管理する。
メモリ206としては、例えば、ROM(Read Only Memory)、RAM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フレキシブルディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁気テープ又は不揮発性のメモリ等が用いられる。メモリ206には、OS(Operating System)、各種のパラメーターの他に、計算機X201を機能させるためのプログラムや、計算機X201に実行が指示されたプログラムが記録されている。メモリ206は、CPU202が動作するために必要なプログラムやデータ等を永続的に記録しており、計算機X201によって実行されるプログラムを格納したコンピュータ読取可能な非一過性の記録媒体の一例として用いられる。
NIC207は、端子に接続されたLAN(Local Area Network)、専用線等を介して各種のデータを装置間で送受信することが可能である。
計算機X201と、他の計算機(計算機Y211~計算機T231の少なくともいずれか1台)とは、同じタイミングで同じプログラムを実行する。このため、計算機X201と、他の計算機とは、プログラムの実行タイミングを同期させるための同期用データを互いに通信し合う。各計算機がプログラムを実行した後、計算機X201が実行したプログラムの実行結果と、他の計算機が実行したプログラムの実行結果とがネットワーク240を通じて出力比較機251に転送される。
計算機X201~T231が実行したプログラムの実行結果は、ネットワーク240を通じて出力比較機251に送信される。出力比較機251は、ネットワーク240で接続される複数の計算機X201~T231で行われたプログラムの実行結果を受信して、各実行結果の比較照合を行った後、照合結果を外部のネットワーク260に出力する。
一方、出力比較機251は、外部のネットワーク260から受信したデータを各計算機にブロードキャスト送信する。そして、各計算機の同一タスクが同一データを受信した後、受信したデータの処理を行う。
出力比較機251(比較機の一例)は、CPU252と、バスコントローラ254と、メモリ255と、NIC256と、NIC257を備える。CPU252は、1つのコア253を備える。そして、CPU252と、バスコントローラ254と、メモリ255と、NIC256と、NIC257とは、出力比較機251の内部に設けられたバスによって接続される。
出力比較機251が備えるCPU252と、バスコントローラ254と、メモリ255と、NIC256,257の動作は、計算機X201が備えるCPU202と、バスコントローラ205と、メモリ206と、NIC207と同様である。ただし、NIC256は、ネットワーク260に接続され、NIC257は、ネットワーク240に接続される。
CPU252は、2台以上の計算機で得られたプログラムの実行結果を比較する機能を有する。各計算機の実行結果は、ネットワーク240を通じて、NIC257に入力され、メモリ255に書き込まれた後、CPU252のコア253が比較照合のプログラムを実行する。そして、コア253が比較照合のプログラムを実行して得た比較照合の結果は一旦、メモリ255に書き込まれ、NIC256を通じてネットワーク260に出力される。例えば、ネットワーク260に接続される表示装置等に比較照合の結果が表示される。表示装置を操作するユーザは、比較照合の結果に基づいて、各計算機の実行結果が、正常又は異常のいずれであるかを確認することができる。
また、各計算機が、後述する図2に示すオペレーティングシステムを動作させることで、4台の計算機のうち、2台の計算機が故障しても残りの2台の計算機で同一タスクを実行し、出力比較機251が、実行された同一タスクの2つの出力データを比較できる。また、4台の計算機のうち、3台の計算機が故障しても残りの1台の計算機がタスクの実行を継続することが可能となる。1台の計算機しかタスクを実行しない場合、出力比較機251による出力データの比較は行われない。
<オペレーティングシステム(OS)の構成例と、タスク実行方法の例>
図2は、本発明の一実施の形態に係るタスク同期処理のために各計算機で稼働するオペレーティングシステム(OS)の構成例と、タスク実行方法の例を示すタイムチャートである。本明細書では、オペレーティングシステムをOSと略記して説明する。
図2では、可読性を向上するため、計算機X201のOS100、計算機Y211のOS120の構成例について説明する。実際には、図1に示した計算機Z221、計算機T231も計算機X201、計算機Y211に接続され、4台の計算機がタスク同期処理を実行し、実行結果を出力比較機251に出力する。
計算機X201のOS100、及び計算機Y211のOS120の中には、タスク同期処理を行う構成要素が存在する。OS100,120は、マルチプログラミング機能を有するオペレーティング・システムであり、複数のプログラムの実行を可能とするために実行中のプログラムをタスク(プロセスともいう)という実行単位で管理する。また、OS100,120は、マルチプロセッサ用途であり、コア単位にタスクを並列して実行することが可能である。
OS100,120は、同期用データ通信路140で接続され、同期用データ通信路140を介して互いに同期用データを交換する。本実施の形態では、OS100の次実行タスク待合わせ処理部104と、OS120の次実行タスク待合わせ処理部124とが、同期用データ通信路140により接続される。なお、本明細書では、現在実行しているタスクの次に実行が予定されるタスクを「次実行タスク」と呼ぶ。
ただし、本実施の形態は2台の計算機に限定するものではなく、計算機システム10を任意の数の計算機で多重に構築することを可能とする。そして、同期用データ通信路140は、多重に構築された複数の計算機間を繋ぐ経路として用いられる。
また、本実施の形態に係る計算機X201、Y211は、それぞれオペレーティング・システムよりも上位の階層で実行されるプログラム(タスク)の処理を、決定性処理と非決定性処理とに分類して実行することが可能である。決定性処理は、入力結果が同一であれば出力結果が同一となる処理である。非決定性処理は、入力結果が同一であっても出力結果が同一とならない処理である。例えば、非決定性処理は、タスクを実行するハードウェアに何らかの要因で障害が発生した場合に、出力結果が同一とならないような処理である。また、非決定性処理は、実行中のタスクが、計算機ごとに異なるパラメータを別のタスクから受け取った場合に、出力結果が同一とならないような処理でもある。従来の同期コア処理部は、外乱等の影響を受けることで、非決定性処理のタスクを実行して得る出力結果が同一とならない。一方、本実施の形態に係る同期コア処理部101,121は、確実に同期実行されるため、非決定性処理の出力結果は同一となる。
このため、本実施の形態に係る計算機システム10では、同期しているコア(同期コア処理部101,121)が非決定性処理を実行(同期実行)し、同期していないコア(準同期コア処理部108,128)が決定性処理を実行(準同期実行)する。実行された決定性処理及び非決定性処理のいずれからも、複数のコアで同じ実行結果が得られる。以下に、本実施の形態に係る計算機X201で稼働するOS100、計算機Y211で稼働するOS120の構成例及び動作例について順に説明する。
<OS100の構成例>
始めに、OS100の構成例について説明する。
計算機X201は、OS100によって管理されるタスク(所定の実行単位の一例)ごとにプログラムを切り替えて、複数のプログラムを並列に実行可能な同期コア処理部101及び準同期コア処理部108を備える。
同期コア処理部101は、実行タスクキュー102と、次実行タスク選択処理部103と、次実行タスク待合わせ処理部104と、タスク起床処理部105と、コア移住処理部106と、コア移住要請受付部107とを備える。同期コア処理部101は、次実行タスク選択処理部103、次実行タスク待合わせ処理部104、タスク起床処理部105、次実行タスク選択処理部103…の順にループして処理を行う。同期コア処理部101は、処理部103~105のループ処理をしながら、タスクからのコア移住要請があれば、このループ処理よりも優先してコア移住処理部106を実行する。
準同期コア処理部108は、実行タスクキュー109と、次実行タスク選択処理部110と、タスク起床処理部111と、コア移住処理部112と、コア移住要請受付部113とを備える。準同期コア処理部108は、次実行タスク選択処理部110、タスク起床処理部111、次実行タスク選択処理部110…の順にループして処理を行う。準同期コア処理部108は、処理部110、111のループ処理をしながら、タスクからのコア移住要請があれば、このループ処理よりも優先してコア移住処理部112を実行する。
そこで、同期コア処理部101は、計算機Y211が備える同期コア処理部101と同期した同期タイミングで、計算機Y211(他の計算機)が実行するプログラムと同じプログラムをタスクごとに実行し、プログラムの特性に応じて移住が要請される実行中のプログラムを準同期コア処理部108に移住させる。次に、準同期コア処理部108は、同期コア処理部101から移住したプログラムを実行した後、同期コア処理部101にプログラムを移住させる。そして、同期コア処理部101は、準同期コア処理部108から移住したプログラムを同期タイミングで実行して得た実行結果を出力比較機251に出力する。ここで、同期コア処理部101が同期タイミングで実行するプログラムは、計算機Y211(他の計算機)と同期して実行されなければ入力される値が同一であっても出力結果が同一とならない非決定性処理を特性とする。ただし、非決定性処理は、計算機Y211(他の計算機)と同期して実行され、かつ入力される値が同一であれば出力結果が同一となる。また、同期コア処理部101から準同期コア処理部108に移住されるプログラムは、入力される値が同一であれば出力結果が同一となる決定性処理を特性とする。
なお、準同期コア処理部108は、CPU202のコア数に応じて複数存在してもよい。例えば、一つの同期コア処理部101に対して、複数の準同期コア処理部108が存在してもよい。この場合、同期コア処理部101は、コア移住要請161を行うタスクBを、番号等で指定した準同期コア処理部108に移住してもよいし、相対的に負荷が低い準同期コア処理部108に移住してもよい。
<同期コア処理部101の動作例>
ここで、OS100の同期コア処理部101が備えるキュー及び各処理部の詳細な動作例について説明する。
実行タスクキュー102(第1プログラム管理部の一例)は、タスクごとにプログラムをキューに接続し、実行待ち状態のタスクを優先度毎に管理する。図2には、実行タスクキュー102に「A」、「B」のタスクが接続される様子が示される。実行タスクキュー102では、上にあるタスクの優先度が高いので、「B」より「A」のタスクが優先して実行される。
次実行タスク選択処理部103(第1選択処理部の一例)は、実行タスクキュー102で実行可能状態となったタスクのうち、計算機X201,211で同一順序かつ最も早く実行可能待ちとなったタスクを選択する。
次実行タスク待合わせ処理部104(待合わせ処理部の一例)は、計算機Y211が備える同期コア処理部121との間で、次実行タスク選択処理部103により選択されたタスクの次に実行可能状態となるタスクの実行開始を待合わせる。このため、次実行タスク待合わせ処理部104は、次実行タスク選択処理部103が実行タスクキュー102から取り出したタスクの情報を、OS120の次実行タスク待合わせ処理部124と同期用データ通信路140を介して交換する。そして、次実行タスク待合わせ処理部104は、少なくとも2台以上の計算機における同期コアで、同一のタスクが同一の順序で実行可能状態となるまで、任意のタイムアウト時間内で待合わせを行う。
タスク起床処理部105(第1プログラム実行部の一例)は、次実行タスク待合わせ処理部104が選択したタスクを同期タイミングに合わせて起床し、実行する。タスク起床処理部105で実行されるタスクは、少なくとも2台以上の計算機における同期コアで同一のタスクが同一の順序で実行可能状態になったと判断されたタスクである。
同期コア処理部101は、タスク起床処理部105により起床したタスクが実行を終了し、又は中断したときに、再度、次実行タスク選択処理部103を実行する。次実行タスク選択処理部103は、次に実行するタスクを実行タスクキュー102から選択し、実行する。次実行タスク選択処理部103は、実行タスクキュー102に接続されるタスクが無くなるまで、次に実行すべきタスクを選択し、処理し続ける。
コア移住処理部106(第1移住処理部の一例)は、コア移住要請受付部107が移住要請を受付けたタスクを、準同期コア処理部108に移住させる。ここで、コア移住処理部106は、移住要請を行ったタスクが指定した任意の移住先(本実施の形態では準同期コア処理部108)に、コア移住要請受付部107が受付けたタスクを移住させる指示が可能である。
このとき、コア移住処理部106は、コア移住要請受付部107からの指示内容に基づいて、移住要請を行ったタスクが指定した任意の移住先(準同期コア処理部108)にある実行タスクキュー109に、コア移住要請受付部107が受付けたタスクを移住させて接続する。ここで、タスクが指定した任意の移住先とは、例えば、タスクを移住先として選択可能な準同期コア処理部が複数ある場合に、これら複数の準同期コア処理部から選択される一つの準同期コア処理部である。
コア移住要請受付部107(第1移住要請受付部の一例)は、実行中のタスクからコア移住要請を受け付ける。ここで、コア移住要請受付部107は、タスクの実行中の任意のタイミングで、タスクから移住要請を受け付けることが可能である。そして、コア移住要請受付部107は、受け付けたコア移住要請の内容をコア移住処理部106へと伝える。このとき、コア移住要請受付部107は、実行中タスクからの任意のタイミングでコア移住要請を受付けることが可能である。そして、コア移住要請受付部107は、タスク起床処理部105がタスクを実行してから、次実行タスク選択処理部103が、次に実行されるタスクを選択するまでの間に、コア移住処理部106を実行する。
<準同期コア処理部108の動作例>
次に、準同期コア処理部108が備えるキュー及び各処理部の詳細な動作例について説明する。
実行タスクキュー109(第2プログラム管理部の一例)は、同期コア処理部101の実行タスクキュー102と同様に、タスクごとにプログラムをキューに接続し、実行待ち状態のタスクを優先度毎に管理する。図2には、実行タスクキュー109に「F」のタスクが接続される様子が示される。
次実行タスク選択処理部110(第2選択処理部の一例)は、実行タスクキュー109で実行可能状態となったタスクのうち、最も早く実行可能待ちとなったタスクを選択する。
タスク起床処理部111(第2プログラム実行部の一例)は、次実行タスク選択処理部110が選択したタスクを起床し、実行する。
コア移住処理部112(第2移住処理部の一例)は、コア移住要請受付部113が移住要請を受付けたタスクを、同期コア処理部101に移住させる。ここで、コア移住処理部112は、タスクの移住元にタスクを移住させる。このため、コア移住処理部112は、コア移住要請受付部113からの指示内容に基づいて、指示されたタスクを、指示された同期コア処理部101の実行タスクキュー102に接続する。
コア移住要請受付部113(第2移住要請受付部の一例)は、同期コア処理部101のコア移住要請受付部107と同様に、タスク起床処理部111が実行中のタスクから移住要請を受付ける。コア移住要請受付部113は、タスクの実行中の任意のタイミングで、タスクから移住要請を受け付けることが可能である。そして、コア移住要請受付部113は、コア移住要請の内容をコア移住処理部112へと伝える。このとき、コア移住要請受付部113は、実行中タスクからの任意のタイミングでコア移住要請を受付けることが可能である。そして、コア移住要請受付部113は、タスク起床処理部111がタスクを起床し、実行してから、次実行タスク選択処理部110が、次に実行されるタスクを選択するまでの間に、コア移住処理部112を実行する。
<OS120の構成例>
次に、OS120の構成例について説明する。
計算機Y211は、計算機X201と同様に、OS120によって管理されるタスク(所定の実行単位の一例)ごとにプログラムを切り替えて、複数のプログラムを並列に実行可能な同期コア処理部121及び準同期コア処理部128を備える。
同期コア処理部121は、OS100の同期コア処理部101と同様に、実行タスクキュー122と、次実行タスク選択処理部123と、次実行タスク待合わせ処理部124と、タスク起床処理部125と、コア移住処理部126と、コア移住要請受付部127とを備える。次実行タスク選択処理部123、次実行タスク待合わせ処理部124、タスク起床処理部125、次実行タスク選択処理部123…の順にループして処理を行う。同期コア処理部121は、処理部123~125のループ処理をしながら、タスクからのコア移住要請があれば、このループ処理よりも優先してコア移住処理部126を実行する。
準同期コア処理部128は、OS100の準同期コア処理部108と同様に、実行タスクキュー129と、次実行タスク選択処理部130と、タスク起床処理部131と、コア移住処理部132と、コア移住要請受付部133とを備える。次実行タスク選択処理部130、タスク起床処理部131、次実行タスク選択処理部130…の順にループして処理を行う。準同期コア処理部128は、処理部130、131のループ処理を行いながら、タスクからのコア移住要請があれば、このループ処理よりも優先してコア移住処理部132を実行する。
そこで、同期コア処理部121は、計算機X201が備える同期コア処理部101と同期した同期タイミングで同じプログラムをタスクごとに実行し、プログラムの特性に応じて移住が要請される実行中のプログラムを準同期コア処理部128に移住させる。次に、準同期コア処理部128は、同期コア処理部121から移住したプログラムを実行した後、同期コア処理部121にプログラムを移住させる。そして、同期コア処理部121は、準同期コア処理部128から移住したプログラムを実行した実行結果を出力比較機251に出力する。
なお、準同期コア処理部128は、CPU212のコア数に応じて複数存在してもよい。例えば、一つの同期コア処理部121に対して、複数の準同期コア処理部128が存在してもよい。この場合、同期コア処理部121は、コア移住要請162を行うタスクBを、番号等で指定した準同期コア処理部128に移住してもよいし、相対的に負荷が低い準同期コア処理部128に移住してもよい。
計算機Y211のOS120で稼働する同期コア処理部121と準同期コア処理部128は、それぞれ計算機X201のOS100で稼働する同期コア処理部101と準同期コア処理部108と同じ構成要素を備える。
<同期コア処理部121の動作例>
ここで、OS120の同期コア処理部121が備えるキュー及び各処理部の詳細な動作例について説明する。
実行タスクキュー122(第1プログラム管理部の一例)は、タスクごとにプログラムをキューに接続し、実行待ち状態のタスクを優先度毎に管理する。図2には、実行タスクキュー122に「A」、「B」のタスクが接続される様子が示される。実行タスクキュー122では、上にあるタスクの優先度が高いので、「B」より「A」のタスクが優先して実行される。
次実行タスク選択処理部123(第1選択処理部の一例)は、実行タスクキュー122で実行可能状態となったタスクのうち、計算機X201,211で同一順序かつ最も早く実行可能待ちとなったタスクを選択する。
次実行タスク待合わせ処理部124(待合わせ処理部の一例)は、計算機X201が備える同期コア処理部101との間で、次実行タスク選択処理部123により選択されたタスクの次に実行可能状態となるタスクの実行開始を待合わせる。このため、次実行タスク待合わせ処理部124は、次実行タスク選択処理部123が実行タスクキュー122から取り出したタスクの情報を、OS100の次実行タスク待合わせ処理部104と同期用データ通信路140を介して交換する。そして、次実行タスク待合わせ処理部124は、少なくとも2台以上の計算機における同期コアで、同一のタスクが同一の順序で実行可能状態となるまで、任意のタイムアウト時間内で待合わせを行う。
タスク起床処理部125(第1プログラム実行部の一例)は、次実行タスク選択処理部123が選択したタスクを同期タイミングに合わせて起床し、実行する。タスク起床処理部125で実行されるタスクは、少なくとも2台以上の計算機における同期コアで同一のタスクが同一の順序で実行可能状態になったと判断されたタスクである。
同期コア処理部121は、タスク起床処理部125により起床したタスクが実行を終了し、又は中断したときに、再度、次実行タスク選択処理部123を実行する。次実行タスク選択処理部123は、次に実行するタスクを実行タスクキュー122から選択し、実行する。次実行タスク選択処理部123は、実行タスクキュー122に接続されるタスクが無くなるまで、次に実行すべきタスクを選択し、処理し続ける。
コア移住処理部126(第1移住処理部の一例)は、コア移住要請受付部127が移住要請を受付けたタスクを、準同期コア処理部128に移住させる。ここで、コア移住処理部126は、移住要請を行ったタスクが指定した任意の移住先に、コア移住要請受付部127が受付けたタスクを移住させる指示が可能である。このとき、コア移住処理部126は、コア移住要請受付部127からの指示内容に基づいて、移住要請を行ったタスクが指定した任意の移住先(本実施の形態では準同期コア処理部128)にある実行タスクキュー129に、コア移住要請受付部127が受付けたタスクを移住させて接続する。
コア移住要請受付部127(第1移住要請受付部の一例)は、実行中のタスクからコア移住要請を受け付ける。ここで、コア移住要請受付部127は、タスクの実行中の任意のタイミングで、タスクから移住要請を受け付けることが可能である。そして、コア移住要請受付部127は、受け付けたコア移住要請の内容をコア移住処理部126へと伝える。このとき、コア移住要請受付部127は、実行中タスクからの任意のタイミングでコア移住要請を受付けることが可能である。そして、コア移住要請受付部127は、タスク起床処理部125がタスクを起床し、実行してから、次実行タスク選択処理部123が、次に実行されるタスクを選択するまでの間に、コア移住処理部126を実行する。
<準同期コア処理部128の動作例>
次に、準同期コア処理部128が備えるキュー及び各処理部の詳細な動作例について説明する。
実行タスクキュー129(第2プログラム管理部の一例)は、同期コア処理部121の実行タスクキュー122と同様に、タスクごとにプログラムをキューに接続し、実行待ち状態のタスクを優先度毎に管理する。図2には、実行タスクキュー129に「F」のタスクが接続される様子が示される。
次実行タスク選択処理部130(第2選択処理部の一例)は、実行タスクキュー129で実行可能状態となったタスクのうち、最も早く実行可能待ちとなったタスクを選択する。
タスク起床処理部131は、次実行タスク選択処理部130が選択したタスクを起床し、実行する。
コア移住処理部132(第2移住処理部の一例)は、コア移住要請受付部133が移住要請を受付けたタスクを、同期コア処理部121に移住させる。ここで、コア移住処理部132は、タスクの移住元にタスクを移住させる。このため、コア移住処理部132は、コア移住要請受付部133からの指示内容に基づいて、指示されたタスクを、指示された同期コア処理部121の実行タスクキュー122に接続する。
コア移住要請受付部133(第2移住要請受付部の一例)は、同期コア処理部121のコア移住要請受付部127と同様に、タスク起床処理部131が実行中のタスクから移住要請を受付ける。コア移住要請受付部133は、タスクの実行中の任意のタイミングで、タスクから移住要請を受け付けることが可能である。そして、コア移住要請受付部133は、コア移住要請の内容をコア移住処理部132へと伝える。このとき、コア移住要請受付部133は、実行中タスクからの任意のタイミングでコア移住要請を受付けることが可能である。そして、コア移住要請受付部133は、タスク起床処理部131がタスクを起床し、実行してから、次実行タスク選択処理部130が、次に実行されるタスクを選択するまでの間に、コア移住処理部132を実行する。
ここで、同期コア処理部101,121で実行中のタスクが任意のタイミングで準同期コア処理部108,128に移動し、処理を継続した後、任意のタイミングで同期コア処理部101,121に戻って処理を継続するときの処理の具体例について、図2の下側に示すタイムチャートを参照して、各処理の内容を説明する。
タイムチャートの左から順に、計算機X201の準同期コア処理部108のタイムチャート150、計算機X201の同期コア処理部101のタイムチャート151を示す。また、計算機Y211の同期コア処理部121のタイムチャート152、計算機Y211の準同期コア処理部128のタイムチャート153を示す。
計算機X201の次実行タスク待合わせ処理部104と、計算機Y211の次実行タスク待合わせ処理部124とは、同期用データ通信路140を介して、次実行タスクを待合わせる(タスク同期)。この様子は、以下のタスク同期タイミング180~185の各処理に示される。なお、本明細書及び図面では、「タスク同期」と略記する。
タスク同期180は、計算機X201と計算機Y211がタスクAを次の実行タスクとして待合わせ完了したことを表す。
タスク同期181は、計算機X201と計算機Y211がタスクBを次の実行タスクとして待合わせ完了したことを表す。
タスク同期182は、計算機X201と計算機Y211がタスクCを次の実行タスクとして待合わせ完了したことを表す。
タスク同期183は、計算機X201と計算機Y211がタスクDを次の実行タスクとして待合わせ完了したことを表す。
タスク同期184は、計算機X201と計算機Y211がタスクBを次の実行タスクとして待合わせ完了したことを表す。
タスク同期185は、計算機X201と計算機Y211がタスクEを次の実行タスクとして待合わせ完了したことを表す。
なお、計算機X201の準同期コア処理部108で実行されるタスクF,G、計算機Y211の準同期コア処理部128で実行されるタスクH,I,J,Kはいずれも同期処理の対象ではない。これらのタスクの実行結果に対して、出力比較機251の比較照合は行われない。
このように計算機X201の同期コア処理部101のタイムチャート151には、タスクA~Eの実行開始及び終了のタイミングの例が示され、準同期コア処理部108のタイムチャート150には、タスクB,F,Gの実行開始及び終了のタイミングの例が示される。さらに、タイムチャート150,151には、それぞれコア移住要請160,161の例が示される。
計算機X201のOS100において、準同期コア処理部108では、実行されるタスクF、Gの間でタスクBが実行される。ここでは、OS100におけるタスクBの移住処理について説明する。
計算機X201の準同期コアイベントT1X170は、計算機X201でタスクBが同期コア処理部101から準同期コア処理部108に移住したタスクBの決定性処理を、準同期コア処理部108が開始したタイミングを示す。
計算機X201の準同期コアイベントT2X171は、計算機X201でタスクBが決定性処理を終了し、準同期コア処理部108から同期コア処理部101へのタスクBの移住要請を実施したタイミングを示す。
計算機X201の準同期コアイベントT3X172は、計算機X201でタスクBが準同期コア処理部108から同期コア処理部101に移住したタスクBの非決定性処理を、同期コア処理部101が開始したタイミングを示す。
タイムチャート151に示すように、同期コア処理部101にてタスクAの実行が終了した後、タスクBの実行が開始される。
コア移住要請161は、計算機X201の同期コア処理部101が実行中のタスクBから任意のタイミングで実施されるコア移住要請を示す。このコア移住要請により、タスクBが同期コア処理部101から準同期コア処理部108に移住される。なお、同期コア処理部101で実行されたタスクBの出力結果が、準同期コア処理部108に移住されたタスクBに入力されるのではない。
タイムチャート150に示すように、準同期コア処理部108にてタスクFの実行が終了した後、同期コア処理部101から移住されたタスクBの決定性処理が開始される。
コア移住要請160は、計算機X201の準同期コア処理部108が実行中のタスクBから任意のタイミングで実施されるコア移住要請を示す。このコア移住要請により、タスクBが準同期コア処理部108から同期コア処理部101に移住される。
そして、タイムチャート151に示すように、同期コア処理部101にてタスクC、Dの実行が終了した後、準同期コア処理部108から移住されたタスクBの非決定性処理が開始される。
計算機Y211の計算機X201の同期コア処理部121のタイムチャート152には、タスクA~Eの実行開始及び終了のタイミングの例が示され、準同期コア処理部128のタイムチャート153には、タスクB,H~Kの実行開始及び終了のタイミングの例が示される。さらに、タイムチャート152,153には、コア移住要請162,163の例が示される。
計算機Y211のOS120において、準同期コア処理部128では、実行されるタスクI、Jの間でタスクBが実行される。ここでは、OS120におけるタスクBの移住処理について説明する。
計算機Y211の準同期コアイベントT1Y173は、計算機Y211のタスクBが同期コア処理部121から準同期コア処理部128に移住したタスクBの決定性処理を、準同期コア処理部128が開始したタイミングを示す。
計算機Y211の準同期コアイベントT2Y174は、計算機Y211でタスクBが決定性処理を終了し、準同期コア処理部128から同期コア処理部121へのタスクBの移住要請を実施したタイミングを示す。
計算機Y211の準同期コアイベントT3Y175は、計算機Y211でタスクBが準同期コア処理部128から同期コア処理部121に移住したタスクBの非決定性処理を、同期コア処理部121が開始したタイミングを示す。
計算機Y211のOS120におけるタイムチャート152に示すように、同期コア処理部121にてタスクAの実行が終了した後、タスクBの非決定性処理が開始される。
コア移住要請162は、計算機Y211の同期コア処理部121が実行中のタスクBから任意のタイミングで実施したコア移住要請を示す。このコア移住要請により、同期コア処理部121から準同期コア処理部128にタスクBが移住される。
タイムチャート153に示すように、準同期コア処理部128にてタスクIの実行が終了した後、同期コア処理部121から移住されたタスクBの決定性処理が開始される。
コア移住要請163は、計算機Y211の準同期コア処理部128が実行中のタスクBから任意のタイミングで実施したコア移住要請を示す。このコア移住要請により、タスクBが準同期コア処理部128から同期コア処理部121に移住される。
そして、タイムチャート152に示すように、同期コア処理部101にてタスクC、Dの実行が終了した後、準同期コア処理部128から移住されたタスクBの非決定性処理が開始される。
上記のタスクBの移住処理を踏まえた上で、計算機X201,Y211にて実行される各タスクの処理について説明する。
まず、タスク同期180によって開始タイミングが決定されるタスクAは、計算機X201の同期コア処理部101が有するタスク起床処理部105によって実行され、計算機Y211の同期コア処理部121が有するタスク起床処理部125によって実行される。
計算機X201の同期コア処理部101と、計算機Y211の同期コア処理部121とでタスクAの実行が終了し、又は中断したとき、タスク同期181によって、タスクBが選択される。そして、計算機X201の同期コア処理部101、計算機Y211の同期コア処理部121にて、それぞれタスクBの処理が実行開始される。
計算機X201でタスクBを実行中に、決定性処理の開始ポイントで、タスクBが準同期コア処理部108へのコア移住要請161を実施する。開始ポイントとは、例えば、タスクBとして実行されるプログラム中で処理の種類ごとに規定されるパラメータである。ほぼ時を同じくして、計算機Y211のタスクBが準同期コア処理部128へのコア移住要請162を実施する。
計算機X201のタスクBからのコア移住要請161を受けたコア移住要請受付部107は、コア移住要請161の内容に従ってコア移住処理部106の処理を開始する。コア移住処理部106により、準同期コア処理部108の実行タスクキュー109にタスクBが接続される。
同様に、計算機Y211のタスクBからのコア移住要請162を受けたコア移住要請受付部127は、コア移住要請162の内容に従ってコア移住処理部126の処理を開始する。コア移住処理部126により、準同期コア処理部128の実行タスクキュー129にタスクBが接続される。
タスクBが移住したことにより、計算機X201のコア移住要請161、計算機Y211のコア移住要請162では、それぞれタスクBの実行が中断する。このため、計算機X201,Y211は、次のタスクを選択するためにタスク同期182を実施し、次の実行タスクとしてタスクCを選択する。計算機X201の同期コア処理部101と、計算機Y211の同期コア処理部121は、ほぼ時を同じくしてタスクCの実行を開始する。
計算機X201の準同期コア処理部108では、準同期コアイベントT1X170のタイミングで、タスクFの実行が終了すると、次実行タスク選択処理部110が実行タスクキュー109からタスクBを選択し、タスク起床処理部111がタスクBの実行を開始する。
計算機Y211の準同期コア処理部128では、準同期コアイベントT1Y173のタイミングで、タスクIの実行が終了すると、次実行タスク選択処理部130が実行タスクキュー129からタスクBを選択し、タスク起床処理部131がタスクBの実行を開始する。
このように、実行タスクキュー109,129にそれぞれタスクBを接続する場合、準同期コアイベントT1X170,T1Y173のタイミングは異なってもよい。このため、準同期コア処理部108,128は、計算機X201と計算機Y211の間でタイミングを合わせる必要が無い。
次に、計算機X201の準同期コア処理部108では、準同期コアイベントT2X171のタイミングでタスクBがコア移住要請160を実施する。計算機X201のコア移住要請受付部113がコア移住要請160を受付けると、コア移住処理部112にて、同期コア処理部101の実行タスクキュー102にタスクBを接続する。
一方、計算機Y211の準同期コア処理部128では、準同期コアイベントT2Y174のタイミングでタスクBがコア移住要請163を実施する。計算機Y211のコア移住要請受付部133がコア移住要請163を受付けると、コア移住処理部132にて、同期コア処理部121の実行タスクキュー122にタスクBを接続する。
このように、実行タスクキュー102,122にそれぞれタスクBを接続する場合も、準同期コアイベントT2X171,T2Y174のタイミングは異なってもよい。このため、準同期コア処理部108,128は、計算機X201と計算機Y211の間でタイミングを合わせる必要が無い。
計算機X201のタイムチャート150に示すように、タスク同期183は、タスクBのコア移住要請160の後のタイミングである。このため、タスクBは、準同期コアイベントT2X171より後に、実行タスクキュー102に接続されている。
しかし、計算機Y211のタイムチャート152に示すように、タスク同期183の時点で、準同期コア処理部128がタスクBを実行中である。このように、タスクBのコア移住要請163のタイミングは、タスク同期183の後であるため、タスク同期183のタイミングでは、タスクBが未だ実行タスクキュー122に接続されていない。
よって、タスク同期183では、計算機X201の次実行タスク選択処理部103と、計算機Y211の次実行タスク選択処理部123とは、それぞれ実行する次タスクをタスクBではなく、タスクBの次に優先度が高いタスクDに決定する。このとき、準同期コアイベントT2X171と、準同期コアイベントT2Y174との時間差の許容範囲は任意のタイムアウト時間として設定可能である。
このように、タスクBの決定性処理が、準同期コア処理部108,128で実施されることで、コア移住要請160,163のタイミングが一致しないことがある。そこで、計算機X201の次実行タスク選択処理部103は、実行タスクキュー102に接続される実行待ち状態のタスクを、同期コア処理部101が生成し、又は実行中断した後、実行タスクキュー102に接続されるタスクと、準同期コア処理部108から移住されるタスクとに分類して選択する。そして、次実行タスク次実行タスク待合わせ処理部104は、準同期コア処理部108から移住されるタスクの実行開始を待合わせる時間範囲を、同期コア処理部101が生成し、又は実行中断した後、実行タスクキュー102に接続されるタスクの実行開始を待合わせる時間範囲よりも長くする。
同様に、計算機Y211の次実行タスク選択処理部123は、実行タスクキュー122に接続される実行待ち状態のタスクを、同期コア処理部121が生成し、又は実行中断した後、実行タスクキュー122に接続されるタスクと、準同期コア処理部128から移住されるタスクとに分類して選択する。そして、次実行タスク次実行タスク待合わせ処理部124は、準同期コア処理部128から移住されるタスクの実行開始を待合わせる時間範囲を、同期コア処理部121が生成し、又は実行中断した後、実行タスクキュー122に接続されるタスクの実行開始を待合わせる時間範囲よりも長くする。
準同期コア処理部108,128から移住されるタスクが同期コア処理部101,121に戻るまでの時間が、設定された時間範囲よりも長ければ、実行タスクキュー102,122に接続された優先度の高い他のタスクが先に実行される。例えば、次実行タスク待合わせ処理部104,124は、準同期コア処理部108からタスクBがコア移住要請160をしたタイミングが時間範囲内であったとしても、準同期コア処理部128からタスクBがコア移住要請163をしたタイミングが時間範囲を超え得ていれば、別のタスクが先に実行される。
そして、実行された別のタスクが終了した後、コア移住要請160,163をした各タスクBが実行可能であれば、タスクBの実行が開始される。例えば、計算機X201の同期コア処理部101と、計算機Y211の同期コア処理部121において、タスクDの実行が終了し、又は中断したタスク同期184のタイミングで、計算機X201,Y211の同期コアの次実行タスクとしてタスクBが起床され、実行される。つまり、準同期コアイベントT3X172,T3Y175は、ほぼ同時刻に実行される。
計算機X201の同期コア処理部101と、計算機Y211の同期コア処理部121において、タスクBの実行が終了し、タスク同期165のタイミングで次タスクをタスクEに決定し、タスクEを起床させる。
以上の流れから、タスクBの非決定性処理は同期コア処理部101,121が実行し、決定性処理のみを準同期コア処理部108,128で処理した後、再度、同期コア処理部101,121がタスクを処理することで、実行結果の出力タイミングを合わせることが可能となる。
以上説明した一実施の形態に係る計算機システム10は、複数の計算機X201,Y211の間で、同期コア処理部101,121が同一のタスクを同一の順序で実行することが可能となる。また、同期コア処理部101,121が実行中のタスクが任意のタイミングで準同期コア処理部108,128に移動して処理が継続され、再度、同期コア処理部101,121に移動することで処理を完了することが可能となる。
各計算機のOSは、タスクの処理を決定性処理と非決定性処理とに分類する。そして、非決定性処理のタスクは常に同期コア処理部101,121上で同期実行され、決定性処理のみが準同期コア処理部108,128で準同期実行される。このように同期コア処理部101,121に加えて、準同期コア処理部108,128でもタスクを実行することが可能となる。このため、各計算機が備える複数のコアの全体で実行可能なタスクの単位時間当たりの処理効率が上がる。このため、計算機システム10では、各計算機のハードウェア構成を変更することなく、各計算機の処理性能を向上させることができる。
また、準同期コア処理部108,128は、決定性処理を一括して実行する。このために、非決定性処理が同期実行中であるタスクが自ら別なコアに移住要請する。この移住要請により、同期コア処理部101,121にて同期実行中のタスクが、決定性処理の開始ポイントで準同期コア処理部108,128に移住することが可能となる。また、準同期コア処理部108,128が決定性処理を終了する終了ポイントで、タスクが同期コア処理部101,121に戻って、処理を継続することが可能となる。
また、図2に示したような、決定性処理と非決定性処理を含むタスクBの実行を同期コア処理部が同期実行し、準同期コア処理部が準同期実行することで、タスクBの実行結果を一致させて出力することが可能となる。
また、準同期コア処理部108,128は、決定性処理を実行する際に、他の計算機と同期タイミングを合わせる必要がなく、同期用データ等の情報を共有する必要もない。このため、準同期コア処理部108,128を同期するための新たなネットワークを構築しなくてよい。そして、同期用データ通信路140が設けられるネットワーク240の通信帯域と、照合処理を行う出力比較機251の演算資源を変えずに、計算機システム10を疎結合なフォールト・トレラント・コンピュータとして処理性能を向上させるタスク実行方式を実現することができる。
なお、本発明は上述した実施の形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りその他種々の応用例、変形例を取り得ることは勿論である。
例えば、上述した実施の形態は本発明を分かりやすく説明するためにシステムの構成を詳細かつ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されない。また、本実施の形態の構成の一部について、他の構成の追加、削除、置換をすることも可能である。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
10…計算機システム、100,120…OS、101,121…同期コア処理部、102,109,122,129…実行タスクキュー、103,110,123,130…次実行タスク選択処理部、104,124…次実行タスク待合わせ処理部、105,111,125,131…タスク起床処理部、106,112,126,132…コア移住処理部、107,113,127,133…コア移住要請受付部、108,128…準同期コア処理部、201…計算機X、211…計算機Y、251…出力比較機

Claims (7)

  1. オペレーティングシステムによって動作が管理される同期コア処理部及び準同期コア処理部を有し、前記同期コア処理部及び前記準同期コア処理部は、所定の実行単位ごとにプログラムを切り替えて、複数の前記プログラムを並列に実行可能である計算機と、
    ネットワークで接続される複数の前記計算機で実行された前記プログラムの実行結果を比較して比較結果を出力する比較機と、を備え、
    前記計算機が実行する前記プログラムの実行タイミングを他の前記計算機で実行される前記プログラムの実行タイミングと同期させるための同期用データを、前記ネットワークを介して規定の時間範囲で他の前記計算機と交換する計算機システムであって、
    前記同期コア処理部は、他の前記計算機が備える同期コア処理部と同期した同期タイミングで、他の前記計算機が実行するプログラムと同じ前記プログラムを前記実行単位ごとに実行し、前記プログラムの特性に応じて移住が要請される実行中の前記プログラムを前記準同期コア処理部に移住させ、
    前記準同期コア処理部は、前記同期コア処理部から移住した前記プログラムを実行した後、前記同期コア処理部に前記プログラムを移住させ、
    前記同期コア処理部は、前記準同期コア処理部から移住した前記プログラムを前記同期タイミングで実行して得た前記実行結果を前記比較機に出力する
    計算機システム。
  2. 前記同期コア処理部が前記同期タイミングで実行する前記プログラムは、他の前記計算機と同期して実行されなければ入力される値が同一であっても出力結果が同一とならず、他の前記計算機と同期して実行され、かつ入力される値が同一であれば出力結果が同一となる非決定性処理を特性とし、
    前記同期コア処理部から前記準同期コア処理部に移住される前記プログラムは、入力される値が同一であれば出力結果が同一となる決定性処理を特性とする
    請求項1に記載の計算機システム。
  3. 前記同期コア処理部は、
    前記実行単位ごとに前記プログラムをキューに接続して管理する第1プログラム管理部と、
    前記第1プログラム管理部で実行可能状態となった前記プログラムのうち、複数の前記計算機で同一順序かつ最も早く実行可能待ちとなった前記プログラムを選択する第1選択処理部と、
    第1選択処理部が選択した前記プログラムを前記同期タイミングで実行する第1プログラム実行部と、
    前記第1プログラム実行部が実行中の前記プログラムから移住要請を受付ける第1移住要請受付部と、
    前記移住要請を受付けた前記プログラムを、前記準同期コア処理部に移住させる第1移住処理部と、
    他の前記計算機が備える前記同期コア処理部との間で、前記第1選択処理部により選択された前記プログラムの次に実行可能状態となる前記プログラムの実行開始を待合わせる待合わせ処理部と、を備える
    請求項2に記載の計算機システム。
  4. 前記第1選択処理部は、前記第1プログラム管理部に接続される実行待ち状態の前記プログラムを、前記同期コア処理部が生成し、又は実行中断した後、前記第1プログラム管理部に接続される前記プログラムと、前記準同期コア処理部から移住される前記プログラムとに分類して選択し、
    前記待合わせ処理部は、前記準同期コア処理部から移住される前記プログラムの実行開始を待合わせる時間範囲を、前記同期コア処理部が生成し、又は実行中断した後、前記第1プログラム管理部に接続される前記プログラムの実行開始を待合わせる時間範囲よりも長くする
    請求項3に記載の計算機システム。
  5. 前記準同期コア処理部は、
    前記実行単位ごとに前記プログラムをキューに接続して管理する第2プログラム管理部と、
    前記第2プログラム管理部で実行可能状態となった前記プログラムのうち、最も早く実行可能待ちとなった前記プログラムを選択する第2選択処理部と、
    第2選択処理部が選択した前記プログラムを実行する第2プログラム実行部と、
    前記第2プログラム実行部が実行中の前記プログラムから移住要請を受付ける第2移住要請受付部と、
    前記移住要請を受付けた前記プログラムを、前記同期コア処理部に移住させる第2移住処理部と、を備え、
    前記第1移住処理部は、移住要請を行った前記プログラムが指定した任意の移住先に、前記第1移住要請受付部が受付けた前記プログラムを移住させ、
    前記第2移住処理部は、前記プログラムの移住元に前記プログラムを移住させる
    請求項3又は4に記載の計算機システム。
  6. 前記第1移住要請受付部は、前記プログラムの実行中の任意のタイミングで、前記プログラムから前記移住要請を受け付け、
    前記第1移住処理部は、移住要請を行った前記プログラムが指定した任意の移住先にある前記第2プログラム管理部に、前記第1移住要請受付部が受付けた前記プログラムを移住させて接続する
    請求項5に記載の計算機システム。
  7. オペレーティングシステムによって動作が管理される同期コア処理部及び準同期コア処理部を有し、前記同期コア処理部及び前記準同期コア処理部は、所定の実行単位ごとにプログラムを切り替えて、複数の前記プログラムを並列に実行可能である計算機と、
    ネットワークで接続される複数の前記計算機で実行された前記プログラムの実行結果を比較して比較結果を出力する比較機と、を備え、
    前記計算機が実行する前記プログラムの実行タイミングを他の前記計算機で実行される前記プログラムの実行タイミングと同期させるための同期用データを、前記ネットワークを介して規定の時間範囲で他の前記計算機と交換する計算機システムで行われるプログラム実行方法であって、
    前記同期コア処理部は、他の前記計算機が備える同期コア処理部と同期した同期タイミングで、他の前記計算機が実行するプログラムと同じ前記プログラムを前記実行単位ごとに実行し、前記プログラムの特性に応じて移住が要請される実行中の前記プログラムを前記準同期コア処理部に移住させる処理と、
    前記準同期コア処理部は、前記同期コア処理部から移住した前記プログラムを実行した後、前記同期コア処理部に前記プログラムを移住させる処理と、
    前記同期コア処理部は、前記準同期コア処理部から移住した前記プログラムを前記同期タイミングで実行して得た実行結果を前記比較機に出力する処理と、を含む
    プログラム実行方法。
JP2019125471A 2019-07-04 2019-07-04 計算機システム及びプログラム実行方法 Active JP7157709B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019125471A JP7157709B2 (ja) 2019-07-04 2019-07-04 計算機システム及びプログラム実行方法
US17/618,016 US20220261298A1 (en) 2019-07-04 2020-03-05 Computer system and program execution method
PCT/JP2020/009409 WO2021002054A1 (ja) 2019-07-04 2020-03-05 計算機システム及びプログラム実行方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019125471A JP7157709B2 (ja) 2019-07-04 2019-07-04 計算機システム及びプログラム実行方法

Publications (2)

Publication Number Publication Date
JP2021012481A JP2021012481A (ja) 2021-02-04
JP7157709B2 true JP7157709B2 (ja) 2022-10-20

Family

ID=74100833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019125471A Active JP7157709B2 (ja) 2019-07-04 2019-07-04 計算機システム及びプログラム実行方法

Country Status (3)

Country Link
US (1) US20220261298A1 (ja)
JP (1) JP7157709B2 (ja)
WO (1) WO2021002054A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046356A (ja) 2002-07-09 2004-02-12 Fujitsu Ltd 高信頼性クラスタシステムおよびそれを実現するプログラム
JP2012194615A (ja) 2011-03-15 2012-10-11 Mitsubishi Electric Corp プロセス間同期方法
JP2016031651A (ja) 2014-07-29 2016-03-07 富士通株式会社 情報処理システム及び方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040117793A1 (en) * 2002-12-17 2004-06-17 Sun Microsystems, Inc. Operating system architecture employing synchronous tasks
US7093147B2 (en) * 2003-04-25 2006-08-15 Hewlett-Packard Development Company, L.P. Dynamically selecting processor cores for overall power efficiency
US20060026214A1 (en) * 2004-07-29 2006-02-02 International Business Machines Corporation Switching from synchronous to asynchronous processing
EP1812857B1 (de) * 2004-10-25 2008-09-03 Robert Bosch Gmbh Vorrichtung und verfahren zur modusumschaltung bei einem rechnersystem mit wenigstens zwei ausführungseinheiten
DE102005037213A1 (de) * 2004-10-25 2007-02-15 Robert Bosch Gmbh Verfahren und Vorrichtung zur Umschaltung zwischen Betriebsmodi eines Multiprozessorsystems durch wenigstens ein externes Signal
DE102005037217A1 (de) * 2005-08-08 2007-02-15 Robert Bosch Gmbh Verfahren und Vorrichtung zum Vergleich von Daten bei einem Rechnersystem mit wenigstens zwei Ausführungseinheiten
JP5534002B2 (ja) * 2010-03-25 2014-06-25 富士通株式会社 マルチコアプロセッサシステム、制御プログラム、および制御方法
US9436512B2 (en) * 2011-12-22 2016-09-06 Board Of Supervisors Of Louisana State University And Agricultural And Mechanical College Energy efficient job scheduling in heterogeneous chip multiprocessors based on dynamic program behavior using prim model
US9015373B2 (en) * 2012-05-17 2015-04-21 Hitachi, Ltd. Storage apparatus and method of controlling storage apparatus
US10466985B2 (en) * 2016-08-23 2019-11-05 Google Llc Hybrid deoptimization mechanism for class hierarchy analysis
JP7042709B2 (ja) * 2018-06-28 2022-03-28 ルネサスエレクトロニクス株式会社 半導体装置、制御システムおよび半導体装置の制御方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004046356A (ja) 2002-07-09 2004-02-12 Fujitsu Ltd 高信頼性クラスタシステムおよびそれを実現するプログラム
JP2012194615A (ja) 2011-03-15 2012-10-11 Mitsubishi Electric Corp プロセス間同期方法
JP2016031651A (ja) 2014-07-29 2016-03-07 富士通株式会社 情報処理システム及び方法

Also Published As

Publication number Publication date
JP2021012481A (ja) 2021-02-04
US20220261298A1 (en) 2022-08-18
WO2021002054A1 (ja) 2021-01-07

Similar Documents

Publication Publication Date Title
EP3270289B1 (en) Container-based multi-tenant computing infrastructure
US10275851B1 (en) Checkpointing for GPU-as-a-service in cloud computing environment
US10873623B2 (en) Dynamically modifying a cluster of computing nodes used for distributed execution of a program
US10628273B2 (en) Node system, server apparatus, scaling control method, and program
JP5874879B2 (ja) I/oデバイスの制御方法及び仮想計算機システム
JP3891936B2 (ja) 並列プロセス実行方法、及びマルチプロセッサ型コンピュータ
US8260840B1 (en) Dynamic scaling of a cluster of computing nodes used for distributed execution of a program
US9389976B2 (en) Distributed persistent memory using asynchronous streaming of log records
US11262933B2 (en) Sharing memory resources between asynchronous replication workloads
JP2016526735A (ja) 仮想ハドゥープマネジャ
US9152491B2 (en) Job continuation management apparatus, job continuation management method and job continuation management program
WO2015097839A1 (ja) 優先度割込み対応リアルタイムハイパバイザ
US20130311685A1 (en) Computer system and control method thereof
JP2000222368A (ja) リモ―ト・メソッド呼び出しシステムにおける複製サポ―トのための方法及びシステム
US10108463B2 (en) System, method of controlling to execute a job, and apparatus
US9398094B2 (en) Data transfer device
US20220027247A1 (en) Maintenance operations based on analysis of collected data
CN106354563A (zh) 用于3d重建的分布式计算系统以及3d重建方法
JP7157709B2 (ja) 計算機システム及びプログラム実行方法
US20210042322A1 (en) System and method of time-based snapshot synchronization
Andreoli et al. Priority-driven differentiated performance for nosql database-as-a-service
US10193767B1 (en) Multiple available witnesses
JP6446315B2 (ja) 多重化計算機の記憶領域一致化装置
US12026072B2 (en) Metering framework for improving resource utilization for a disaster recovery environment
JP6547363B2 (ja) 管理装置、管理装置の制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221007

R150 Certificate of patent or registration of utility model

Ref document number: 7157709

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150