JP5707409B2 - 計算機 - Google Patents
計算機 Download PDFInfo
- Publication number
- JP5707409B2 JP5707409B2 JP2012532731A JP2012532731A JP5707409B2 JP 5707409 B2 JP5707409 B2 JP 5707409B2 JP 2012532731 A JP2012532731 A JP 2012532731A JP 2012532731 A JP2012532731 A JP 2012532731A JP 5707409 B2 JP5707409 B2 JP 5707409B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- input
- request
- task
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims description 65
- 238000012545 processing Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 47
- 230000006854 communication Effects 0.000 description 36
- 238000004891 communication Methods 0.000 description 31
- 230000005856 abnormality Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000004083 survival effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/182—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits based on mutual exchange of the output between redundant processing components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/183—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components
- G06F11/184—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components where the redundant components implement processing functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1675—Temporal synchronisation or re-synchronisation of redundant processing components
- G06F11/1687—Temporal synchronisation or re-synchronisation of redundant processing components at event level, e.g. by interrupt or result of polling
Description
図1は、本実施形態のフォールトトレラントシステム1の構成図である。フォールトトレラントシステム1は2台以上の計算機ノード10とVoter2から構成される。図1において計算機ノードは10−A、10−B、10−Cの3台が存在するが、本発明は計算機ノード10が3台の場合に限らない。フォールトトレラントシステム1はVoter2を介してフォールトトレラントシステム1外部の1台以上の端末3との入出力を行う。Voter2は少なくとも端末3からの入力を各計算機ノード10に分配する機能と、端末3への出力について各計算機ノード10からの出力を受け取り、端末3へ転送する機能を備える。端末3への転送に際しては、Voter2は各計算機ノード10から取得した出力について多数決等の方法により妥当性のあるものを選択し、これを転送する。Voter2が複数個存在して多重構成をとっていてもよく、また、各計算機ノード10の機能として実装されていてもよい。
第二の実施形態として、図7に示したフローによるタスクの実行条件を緩和し、より効率的なタスク実行を行う構成について述べる。本方式では、図5、図6に示した入出力要求テーブル36、入出力要求通知50の代わりに各々図8、図9に示したものを、図7に示したフローの代わりに図10に示したものを用いる。
第三の実施形態では第一の実施形態に対して、フォールトトレラントシステム1を構成する計算機ノード10の一部に異常が発生した場合に、これを検知して切り離すことができる方式を実現する。この方式では、図1の基盤ソフトウェア30を図11に示すもので置き換え、基盤ソフトウェア30に図12に示すノード管理処理61、図13に示すノード管理テーブル62、図14に示すタスク管理テーブル64を追加し、図7のフローに代わり図15のフロー、図5、図6に示した入出力要求テーブル36、入出力要求通知50の代わりに図16、図17に示したものを用いる。
第四の実施形態では、入出力実行処理34における入出力処理開始から入出力実行までの時間が長い場合に、この時間を利用して計算機ノード10間の同期をとることで入出力時のオーバーヘッドを軽減するものである。この動作について、図18、図19のフロー図、図20、図21の通信内容、及び、データ形式を用いて説明する。
2 Voter
3 端末
10 計算機ノード
11 メモリ
12 プロセッサ
13 記憶装置
14 外部通信インタフェース
15 ノード間通信インタフェース
20 アプリケーション
21 タスク
30 基盤ソフトウェア
31 スケジューラ
36 入出力要求テーブル
37 タスク間共有記憶
40 入出力要求
51 入出力対象識別子
52 計算機ノード識別子
53 タスク識別子
54 シーケンス番号
62 計算機ノード管理テーブル
64 タスク管理テーブル
80 追従可否通知
90 追従可否テーブル
Claims (4)
- 少なくとも一の他の計算機と通信可能に接続された計算機であって、
プロセッサ、メモリ、前記他の計算機と通信するためのインタフェース部とを有しており、
前記プロセッサは、
当該プロセッサが実行しようとしているタスクにおいて入力若しくは出力の要求を処理する際に、
当該計算機の識別子と、当該タスクの識別子と、当該要求のアクセス対象の識別子とを含む要求通知を前記他の計算機に送信し、
前記他の計算機から当該他の計算機が送信した要求通知を受信し、
受信した前記要求通知の内容を前記メモリに格納し、
少なくとも1台以上の計算機にて、当該プロセッサが処理しようとしている要求と、前記他の計算機のプロセッサが処理しようとしている要求とを比較する際に、前記他の計算機全てから当該プロセッサが実行しようとしているタスクの識別子と同じタスクの識別子を受信したかを判定し、
更に、前記プロセッサが処理しようとしている前記要求と同じアクセス対象をアクセスしようとする他の要求が存在する場合に、当該計算機上にて当該他の要求が前記要求より後に発生した要求であるか否かを判定し、
当該計算機がリーダ計算機である場合には、前記他の計算機から追従可否通知を受信し、
前記プロセッサは過半数の前記他の計算機から追従可を示す追従可否通知を受信した場合に、当該プロセッサが処理しようとしている要求を処理することを特徴とする計算機。 - 請求項1に記載の計算機であって、
当該計算機がフォロワ計算機である場合には、前記リーダ計算機から受信した要求通知に基づいて、 当該プロセッサが処理しようとしている要求の処理の可否を決定する
ことを特徴とする計算機。 - 請求項2に記載の計算機であって、
前記フォロワ計算機はさらに、前記リーダ計算機への追従可否通知を前記他の計算機に送信し、
前記プロセッサは前記他の計算機から受信した追従可否通知を参照して、所定の数以上の計算機から追従可を示す追従可否通知を受信している場合に、前記リーダ計算機を引き続きリーダ計算機とすることを特徴とする計算機。 - 請求項3に記載の計算機であって、
前記フォロワ計算機は、
前記所定の数より少ない計算機から追従可を示す追従可否要求を受信している場合に、前記リーダ計算機とは異なる計算機を新たなリーダ計算機とする
ことを特徴とする計算機。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/005493 WO2012032572A1 (ja) | 2010-09-08 | 2010-09-08 | 計算機 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012032572A1 JPWO2012032572A1 (ja) | 2013-10-31 |
JP5707409B2 true JP5707409B2 (ja) | 2015-04-30 |
Family
ID=45810201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012532731A Expired - Fee Related JP5707409B2 (ja) | 2010-09-08 | 2010-09-08 | 計算機 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP2615548B1 (ja) |
JP (1) | JP5707409B2 (ja) |
WO (1) | WO2012032572A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014078186A (ja) * | 2012-10-12 | 2014-05-01 | Mitsubishi Electric Corp | 多重化装置、多重化方法および多重化プログラム |
JP6100135B2 (ja) * | 2013-09-26 | 2017-03-22 | 株式会社日立製作所 | フォールトトレラントシステム及びフォールトトレラントシステム制御方法 |
EP3070606B1 (en) | 2013-11-13 | 2022-03-16 | Fujitsu Limited | Event management program, event management method, and distributed system |
JP2017027092A (ja) * | 2013-12-03 | 2017-02-02 | 三菱電機株式会社 | データ処理装置およびデータ処理プログラム |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05165793A (ja) * | 1991-12-13 | 1993-07-02 | Mitsubishi Electric Corp | 計算機システムにおける資源の排他制御方式 |
JPH06282448A (ja) * | 1993-03-29 | 1994-10-07 | Nec Corp | 共有資源排他制御方式 |
JPH08314744A (ja) * | 1995-05-18 | 1996-11-29 | Hitachi Ltd | フォールトトレラントシステム |
JPH1083379A (ja) * | 1996-09-09 | 1998-03-31 | Fujitsu Ltd | 並列計算機システム |
JP2002049601A (ja) * | 2000-05-31 | 2002-02-15 | Internatl Business Mach Corp <Ibm> | コンピューティング環境のクラスタを自動的に構成するための方法、システム、およびプログラム製品 |
JP2005209191A (ja) * | 2004-01-20 | 2005-08-04 | Internatl Business Mach Corp <Ibm> | 高可用性システムの遠隔エンタープライズ管理 |
JP2006508469A (ja) * | 2002-11-27 | 2006-03-09 | オラクル・インターナショナル・コーポレイション | 相互接続を有するクラスタリングシステムおよび方法 |
JP2006519432A (ja) * | 2003-02-27 | 2006-08-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複数の処理要素を有するデータ処理システム、複数の処理要素を有するデータ処理システムを制御する方法 |
JP2009217503A (ja) * | 2008-03-10 | 2009-09-24 | Hitachi Ltd | 計算機システム、計算機制御方法及び計算機制御プログラム |
US20100107158A1 (en) * | 2008-10-28 | 2010-04-29 | Vmware, Inc. | Low overhead fault tolerance through hybrid checkpointing and replay |
JP2010128664A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ltd | マルチプロセッサシステム、競合回避プログラム及び競合回避方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10133652A1 (de) * | 2001-07-11 | 2003-01-30 | Siemens Ag | Zentraleinheit für ein redundantes Automatisierungssystem |
US7426656B2 (en) * | 2004-03-30 | 2008-09-16 | Hewlett-Packard Development Company, L.P. | Method and system executing user programs on non-deterministic processors |
FR2912526B1 (fr) * | 2007-02-13 | 2009-04-17 | Thales Sa | Procede de maintien du synchronisme d'execution entre plusieurs processeurs asynchrones fonctionnant en parallele de maniere redondante. |
-
2010
- 2010-09-08 EP EP10856925.2A patent/EP2615548B1/en not_active Not-in-force
- 2010-09-08 WO PCT/JP2010/005493 patent/WO2012032572A1/ja active Application Filing
- 2010-09-08 JP JP2012532731A patent/JP5707409B2/ja not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05165793A (ja) * | 1991-12-13 | 1993-07-02 | Mitsubishi Electric Corp | 計算機システムにおける資源の排他制御方式 |
JPH06282448A (ja) * | 1993-03-29 | 1994-10-07 | Nec Corp | 共有資源排他制御方式 |
JPH08314744A (ja) * | 1995-05-18 | 1996-11-29 | Hitachi Ltd | フォールトトレラントシステム |
JPH1083379A (ja) * | 1996-09-09 | 1998-03-31 | Fujitsu Ltd | 並列計算機システム |
JP2002049601A (ja) * | 2000-05-31 | 2002-02-15 | Internatl Business Mach Corp <Ibm> | コンピューティング環境のクラスタを自動的に構成するための方法、システム、およびプログラム製品 |
JP2006508469A (ja) * | 2002-11-27 | 2006-03-09 | オラクル・インターナショナル・コーポレイション | 相互接続を有するクラスタリングシステムおよび方法 |
JP2006519432A (ja) * | 2003-02-27 | 2006-08-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複数の処理要素を有するデータ処理システム、複数の処理要素を有するデータ処理システムを制御する方法 |
JP2005209191A (ja) * | 2004-01-20 | 2005-08-04 | Internatl Business Mach Corp <Ibm> | 高可用性システムの遠隔エンタープライズ管理 |
JP2009217503A (ja) * | 2008-03-10 | 2009-09-24 | Hitachi Ltd | 計算機システム、計算機制御方法及び計算機制御プログラム |
US20100107158A1 (en) * | 2008-10-28 | 2010-04-29 | Vmware, Inc. | Low overhead fault tolerance through hybrid checkpointing and replay |
JP2010128664A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ltd | マルチプロセッサシステム、競合回避プログラム及び競合回避方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2615548A4 (en) | 2015-12-02 |
EP2615548A1 (en) | 2013-07-17 |
EP2615548B1 (en) | 2016-12-28 |
WO2012032572A1 (ja) | 2012-03-15 |
JPWO2012032572A1 (ja) | 2013-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI101432B (fi) | Vikasietoinen tietokonejärjestelmä | |
Tan et al. | Coupling task progress for mapreduce resource-aware scheduling | |
EP3356937B1 (en) | Distributed stream-based database triggers | |
CN108647104B (zh) | 请求处理方法、服务器及计算机可读存储介质 | |
CN100380364C (zh) | 分布式系统和冗余控制方法 | |
CN110807064B (zh) | Rac分布式数据库集群系统中的数据恢复装置 | |
CN102630315B (zh) | 用于防止死锁状态的数据处理方法及系统 | |
US7865763B2 (en) | Data replication method | |
JP4529767B2 (ja) | クラスタ構成コンピュータシステム及びその系リセット方法 | |
US20060089975A1 (en) | Online system recovery system, method and program | |
KR20040015223A (ko) | 클러스터형 컴퓨터 시스템의 자원 작용 수행 방법,클러스터형 컴퓨터 시스템 및 그의 수행을 위한 컴퓨터프로그램 | |
CN108063813B (zh) | 一种集群环境下密码服务网络并行化的方法与系统 | |
KR20110044858A (ko) | 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지 | |
US9942107B2 (en) | Computer system including plural computer nodes synchronized with each other | |
US9424301B2 (en) | System and method for negotiated takeover of storage objects | |
JP5707409B2 (ja) | 計算機 | |
CN105373563B (zh) | 数据库切换方法及装置 | |
CN105579963B (zh) | 任务处理装置、电子设备及方法 | |
US20080077925A1 (en) | Fault Tolerant System for Execution of Parallel Jobs | |
US9015717B2 (en) | Method for processing tasks in parallel and selecting a network for communication | |
WO2021002054A1 (ja) | 計算機システム及びプログラム実行方法 | |
JP6119302B2 (ja) | 排他制御装置、排他制御方法、排他制御システムおよびプログラム | |
US9396050B2 (en) | Distributed execution system and distributed program execution method | |
JP6100135B2 (ja) | フォールトトレラントシステム及びフォールトトレラントシステム制御方法 | |
CN116069359A (zh) | 基于Cortex内核芯片的程序在线更新方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150302 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5707409 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |