JP6284795B2 - フォールトトレラントサーバ装置 - Google Patents

フォールトトレラントサーバ装置 Download PDF

Info

Publication number
JP6284795B2
JP6284795B2 JP2014056297A JP2014056297A JP6284795B2 JP 6284795 B2 JP6284795 B2 JP 6284795B2 JP 2014056297 A JP2014056297 A JP 2014056297A JP 2014056297 A JP2014056297 A JP 2014056297A JP 6284795 B2 JP6284795 B2 JP 6284795B2
Authority
JP
Japan
Prior art keywords
communication control
control device
cpu
unit
fault tolerant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014056297A
Other languages
English (en)
Other versions
JP2015179386A (ja
Inventor
丈博 山本
丈博 山本
仁則 岡崎
仁則 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Network Corp
Original Assignee
Mitsubishi Electric Information Network Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Network Corp filed Critical Mitsubishi Electric Information Network Corp
Priority to JP2014056297A priority Critical patent/JP6284795B2/ja
Publication of JP2015179386A publication Critical patent/JP2015179386A/ja
Application granted granted Critical
Publication of JP6284795B2 publication Critical patent/JP6284795B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

この発明は、フォールトトレラントサーバにおける第1の通信制御装置から第2の通信制御装置への切り替えに関する。
図4は従来のフォールトトレラントサーバ10における通信制御装置140の冗長化を示す図である。図5は従来のフォールトトレラントサーバ10の構成を示す図である。
図5のように、フォールトトレラントサーバ10は、ネットワーク30にシーケンサ21、シーケンサ22と共に接続し、シーケンサ21,22等と通信を行う。
図5のようにフォールトトレラントサーバ10は主系サーバ部100と、従系サーバ部200を備える。主系サーバ部100は、CPU(Central Processing Unit)110、I/Oユニット130、通信制御装置140を備えている。I/Oユニット130はフェイルオーバドライバ131及びドライバ132を備えている。従系の従系サーバ部200も主系サーバ部100と同様の構成である。
図4、図5に示すように、従来ではフォールトトレラントサーバ10に搭載する通信制御装置を冗長化するには、I/Oユニット130に含まれる、専用のフェイルオーバドライバ131,231が必要であった。このため、通信制御装置として使用できるのは、専用のフェイルオーバドライバ131,231によって制御できる通信制御装置に限定されていた。
フェイルオーバドライバ131は、通信制御装置140の故障を検出した場合、通信制御装置140を通信制御装置240に切り替える。その際、フェイルオーバドライバ131は、通信制御装置240が通信制御装置140に代替するように通信制御装置240を設定することに加え、通信制御装置240以外の機器の設定も変更する必要があった。
特許文献1ではデータ転送経路の冗長化技術を開示しているが、主系、従系のそれぞれに故障検知モジュールが必要となる。
特開平8−44637号公報
この発明は、フェイルオーバドライバを介さずに通信制御装置の故障を検出し、故障が検出されると他方の通信制御装置に切り替えるフォールトトレラントサーバの提供を目的とする。
この発明のフォールトトレラントサーバ装置は、
第1のCPUと、第1の入出力ユニットと、前記第1の入出力ユニットからの制御に基づきネットワーク通信を行う第1の通信制御装置とを有する主系の第1のサーバ部と、
第2のCPUと、第2の入出力ユニットと、前記第2の入出力ユニットからの制御に基づきネットワーク通信を行う第2の通信制御装置とを有する従系の第2のサーバ部と
を備え、
前記第1の通信制御装置が正常な場合には前記第1の通信制御装置によってネットワーク通信を行うフォールトトレラントサーバ装置であって、
前記第1のCPUと前記第2のCPUとのいずれかのCPUを用いることにより、正常時の前記第1の通信制御装置を監視して前記第1の通信制御装置の故障を検出する検出部と、
前記第1のCPUと前記第2のCPUとのいずれかのCPUを用いることにより、前記検出部が前記第1の通信制御装置の故障を検出した場合に前記第1の通信制御装置を前記第2の通信制御装置として機能させる機能情報を前記第2の通信制御装置に設定すると共に、前記第1の通信制御装置から前記第2の通信制御装置に切り替えて前記第1の通信制御装置を前記第2の通信制御装置で代替する切替部と
を備えたことを特徴とする。
この発明によれば、フェイルオーバドライバを介さずに通信制御装置の故障を検出し、故障が検出されると他方の通信制御装置に切り替えるフォールトトレラントサーバを提供できる。
実施の形態1の図で、フォールトトレラントサーバ1000における通信制御装置の冗長化を示す図。 実施の形態1の図で、フォールトトレラントサーバ1000の構成を示す図。 実施の形態1の図で、通信制御装置の切り替えの手順を示す図。 従来の技術を示す図で、従来のフォールトトレラントサーバ10における通信制御装置の冗長化を示す図。 従来の技術を示す図で、従来のフォールトトレラントサーバ10の構成を示す図。
実施の形態1.
図1〜図3を参照して、実施の形態1のフォールトトレラントサーバ1000(フォールトトレラントサーバ装置)を説明する。
図1は、フォールトトレラントサーバ1000における通信制御装置の冗長化を示す図である。
図2は、フォールトトレラントサーバ1000の構成を示す図である。
図3は、通信制御装置の切り替えの手順を示す図である。
図1は図4に対応する図である。図1のように、実施の形態1のフォールトトレラントサーバ1000では、常駐モニタプログラム(後述する検出部)が主系の通信制御装置140(第1の通信制御装置)の故障を検出すると、切替部(後述する)が通信制御装置140を通信制御装置240(第2の通信制御装置)に切り替える。
図2は、主系サーバ部100(第1のサーバ部)と従系サーバ部200(第2のサーバ部)とからなるフォールトトレラントサーバ1000の構成を示す図であり、図5に対応する。以下では図5と異なる点を説明する。図2のフォールトトレラントサーバ1000は図5のフォールトトレラントサーバ10に対して以下の点が異なる。
(1)フォールトトレラントサーバ1000ではI/Oユニット130(第1の入出力ユニット)、I/Oユニット230(第2の入出力ユニット)がフェイルオーバドライバ131,132を持たない。
(2)フォールトトレラントサーバ1000は、メモリー120、220を有する。フォールトトレラントサーバ1000は、メモリー120に格納された通信制御装置140の故障検出のプログラム(常駐モニタプログラム)をCPU110(第1のCPU)が実行することで、通信制御装置140を監視し、その故障を検出する。常駐モニタプログラムとCPU110とは、主系の通信制御装置140の故障を検出する検出部を構成する。なお、メモリー220に格納された常駐モニタプログラムをCPU210(第2のCPU)が実行することで、通信制御装置140を監視し、その故障を検出してもよい。この場合、メモリー220の常駐モニタプログラムとCPU210とが、検出部を構成する。
(3)またフォールトトレラントサーバ1000では、メモリー120に格納された切替プログラムをCPU110が実行することで、故障が検出された通信制御装置140を通信制御装置240に切り替える。切替プログラムとCPU110とは、切替部を構成する。なお、メモリー220に格納された切替プログラムをCPU210が実行することで、通信制御装置140を通信制御装置240に切り替えても良い。この場合、メモリー220の切替プログラムとCPU210とが、切替部を構成する。
(4)上記では常駐モニタプログラムと切替プログラムは別個のプログラムとして説明したが、一体のプログラムであってもよい。なお図2ではメモリー120とメモリー220とは別個としているが一体でも構わない。
(S10)
図3を参照してフォールトトレラントサーバ1000の通信制御装置の切替動作を説明する。図3の説明では、メモリー120に記憶された常駐モニタプログラムとCPU110とが検出部を構成し、メモリー120に記憶された切替プログラムとCPU110とが切替部を構成する場合を説明するが、メモリー220に記憶された常駐モニタプログラムとCPU210とが検出部を構成し、メモリー220に記憶された切替プログラムとCPU210とが切替部を構成してもよいことは、上記のとおりである。
(ステップS10)
検出部は、CPU110を用いることにより、正常時の通信制御装置140を監視して、通信制御装置140の故障を検出する(S10)。検出部は、通信制御装置140の故障を検出すると、故障検出の通知を切替部に送信する。
(ステップS20)
切替部は検出部から故障検出の通知を受信すると、通信制御装置140をネットワーク30から切り離す(S20)。
(ステップS30、ステップS40)
切替部は、CPU110を用いることにより、通信制御装置40を通信制御装置40として機能させる機能情報を通信制御装置240に設定する(S30)。ここで「機能情報」とは、例えば、ネットワーク30におけるアドレスを示す「アドレス情報」と、フォールトトレラントサーバ1000で実行されるアプリケーションが通信制御装置240を識別するための「識別情報」である。アドレス情報の例は図2に示す「局番」である。「アドレス情報」及び「識別情報」は、通信制御装置140に設定されていたものである。切替部は、CPU110を用いることにより、通信制御装置240をネットワーク30に接続し、通信制御装置140から通信制御装置240に切り替えて通信制御装置140を通信制御装置240で代替する。
以上のようにフォールトトレラントサーバ1000では、CPUとメモリーに記憶されたプログラムとが、検出部、切替部として機能するので、フェイルオーバドライバが不要であり、通信制御装置は汎用の装置を使用することができる。
また、フォールトトレラントサーバ1000では、切替部が通信制御装置240に機能情報を設定することで通信制御装置140から通信制御装置240に引き継ぐことができるので通信制御装置240以外の機器の設定が不要となり、簡単に別の通信制御装置に引き継ぐことができる。
21,22 シーケンサ、30 ネットワーク、100 主系サーバ部、110 CPU、120 メモリー、130 I/Oユニット、131 フェイルオーバドライバ、132 ドライバ、140 通信制御装置、200 従系サーバ部、210 CPU、220 メモリー、230 I/Oユニット、231 フェイルオーバドライバ、232 ドライバ、240 通信制御装置、1000 フォールトトレラントサーバ。

Claims (2)

  1. 第1のCPUと、第1の入出力ユニットと、前記第1の入出力ユニットからの制御に基づきネットワーク通信を行う第1の通信制御装置とを有する主系の第1のサーバ部と、
    第2のCPUと、第2の入出力ユニットと、前記第2の入出力ユニットからの制御に基づきネットワーク通信を行う第2の通信制御装置とを有する従系の第2のサーバ部と
    を備え、
    前記第1の通信制御装置が正常な場合には前記第1の通信制御装置によってネットワーク通信を行うフォールトトレラントサーバ装置であって、
    前記第1のCPUと前記第2のCPUとのいずれかのCPUを用いることにより、正常時の前記第1の通信制御装置を監視して前記第1の通信制御装置の故障を検出する検出部と、
    前記第1のCPUと前記第2のCPUとのいずれかのCPUを用いることにより、前記検出部が前記第1の通信制御装置の故障を検出した場合に前記第2の通信制御装置を前記第1の通信制御装置として機能させる機能情報を前記第2の通信制御装置に設定すると共に、前記第2の通信制御装置以外の機器の設定をすることなく前記第1の通信制御装置から前記第2の通信制御装置に切り替えて、前記第1の通信制御装置を前記第2の通信制御装置で代替する切替部と
    を備え
    前記切替部は、
    前記機能情報として、ネットワークにおけるアドレスを示すアドレス情報と、アプリケーションが前記第2の通信制御装置を識別するための識別情報とを設定することを特徴とするフォールトトレラントサーバ装置。
  2. 前記機能情報として設定される前記アドレス情報及び前記識別情報は、
    前記第1の通信制御装置に設定された前記アドレス情報及び前記識別情報と同一である請求項に記載のフォールトトレラントサーバ装置。
JP2014056297A 2014-03-19 2014-03-19 フォールトトレラントサーバ装置 Active JP6284795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014056297A JP6284795B2 (ja) 2014-03-19 2014-03-19 フォールトトレラントサーバ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014056297A JP6284795B2 (ja) 2014-03-19 2014-03-19 フォールトトレラントサーバ装置

Publications (2)

Publication Number Publication Date
JP2015179386A JP2015179386A (ja) 2015-10-08
JP6284795B2 true JP6284795B2 (ja) 2018-02-28

Family

ID=54263391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014056297A Active JP6284795B2 (ja) 2014-03-19 2014-03-19 フォールトトレラントサーバ装置

Country Status (1)

Country Link
JP (1) JP6284795B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3595033B2 (ja) * 1995-07-18 2004-12-02 株式会社日立製作所 高信頼化コンピュータシステム
JP4411602B2 (ja) * 2004-12-16 2010-02-10 日本電気株式会社 フォールトトレラント・コンピュータシステム
JP5585332B2 (ja) * 2010-09-14 2014-09-10 日本電気株式会社 耐故障システム、マスタft制御lsi、スレーブft制御lsiおよび耐故障制御方法

Also Published As

Publication number Publication date
JP2015179386A (ja) 2015-10-08

Similar Documents

Publication Publication Date Title
JP5509730B2 (ja) フォールトトレラントコンピュータ及び電源制御方法
US9141493B2 (en) Isolating a PCI host bridge in response to an error event
CN107229221A (zh) 用于多个热和冷备用冗余的容错模式和切换协议
US20160179639A1 (en) Selectively coupling a pci host bridge to multiple pci communication paths
KR20150088559A (ko) 네트워크의 장애를 복구하는 방법 및 장치
CN105095001A (zh) 分布式环境下虚拟机异常恢复方法
US9367375B2 (en) Direct connect algorithm
US10379931B2 (en) Computer system
JP6253956B2 (ja) ネットワーク管理サーバおよび復旧方法
JP5822783B2 (ja) 故障検出装置
WO2014207893A1 (ja) 演算回路及び計算機
JP6135403B2 (ja) 情報処理システム、情報処理システムの障害処理方法
JP6284795B2 (ja) フォールトトレラントサーバ装置
JP2009040199A (ja) 運行管理用フォルトトレラントシステム
KR101448013B1 (ko) 항공기용 다중 컴퓨터의 고장 허용 장치 및 방법
CN109219105B (zh) 路由切换方法以及路由切换系统
JP6196505B2 (ja) クラウド制御システム、及びその制御プログラムの実行方法
JP2015225522A (ja) システムおよび障害処理方法
JP2012190132A (ja) 情報処理装置
CN105306256B (zh) 一种基于VxWorks设备的双机热备实现方法
JP4957631B2 (ja) フォールトトレラントサーバの動作確認方法及び検査支援プログラム
US20160321149A1 (en) Computer apparatus and computer mechanism
JP2017142705A (ja) フォールトトレラントサーバ装置及び通信制御装置の切替プログラム
JP6227909B2 (ja) 代替制御装置、代替制御方法及び代替制御プログラム
JPWO2019073565A1 (ja) 分散制御システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170829

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180131

R150 Certificate of patent or registration of utility model

Ref document number: 6284795

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250