JP7028503B2 - コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム - Google Patents

コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム Download PDF

Info

Publication number
JP7028503B2
JP7028503B2 JP2018064531A JP2018064531A JP7028503B2 JP 7028503 B2 JP7028503 B2 JP 7028503B2 JP 2018064531 A JP2018064531 A JP 2018064531A JP 2018064531 A JP2018064531 A JP 2018064531A JP 7028503 B2 JP7028503 B2 JP 7028503B2
Authority
JP
Japan
Prior art keywords
service processor
memory
control unit
information
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018064531A
Other languages
English (en)
Other versions
JP2019175257A (ja
Inventor
直樹 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2018064531A priority Critical patent/JP7028503B2/ja
Priority to PCT/JP2019/013594 priority patent/WO2019189571A1/ja
Priority to US17/041,097 priority patent/US11113134B2/en
Publication of JP2019175257A publication Critical patent/JP2019175257A/ja
Application granted granted Critical
Publication of JP7028503B2 publication Critical patent/JP7028503B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0769Readable error formats, e.g. cross-platform generic formats, human understandable formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラムに関する。
コンピュータシステム内に多重構成のサービスプロセッサを備え、現用系(運用系)サービスプロセッサの負荷を軽減するコンピュータシステムがある。
特許文献1には、関連する技術として、計算機システム(CPU)から処理要求が発行されると、テーブルを参照し、処理担当装置が現用系の場合、当該要求を実行して、その処理結果をCPUへ報告するが、処理担当装置が待機系の場合には当該要求の処理を待機系サービスプロセッサへ依頼し、待機系サービスプロセッサが、現用系サービスプロセッサから依頼された処理を実行することで現用系サービスプロセッサの負荷を軽減する技術が記載されている。
特開2000-148525号公報
ところで、先行文献1に記載の技術を用いた二重化サービスプロセッサを含むコンピュータシステムの場合、現用系サービスプロセッサは、計算機システム(CPU)から処理要求が行われると、テーブルを検索する処理を行う。そのため、現用系サービスプロセッサの負荷が大きくなる可能性があり、他の処理に時間が掛かり、場合によっては他の処理を行うことができなくなる可能性がある。
本発明の各態様は、上記の課題を解決することのできるコンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラムを提供することを目的としている。
上記目的を達成するために、本発明の一態様によれば、コンピュータシステムは、運用系サービスプロセッサ、メモリを有する待機系サービスプロセッサ、ユニットを備えるコンピュータシステムであって、前記運用系サービスプロセッサは、前記ユニットのログを示すログ情報を取得して前記メモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力する第1制御部、を備え、前記待機系サービスプロセッサは、前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行する第2制御部、を備える。
本発明の別の態様によれば、通信システムは、上記のコンピュータシステムと、前記コンピュータシステムの備えるユニットのログを示すログ情報の操作端末における保存先を示す保存先情報を、前記コンピュータシステムに出力する前記操作端末と、を備える。
本発明の別の態様によれば、コンピュータシステムによる制御方法は、運用系サービスプロセッサ、待機系サービスプロセッサ、ユニットを備えるコンピュータシステムによる制御方法であって、前記運用系サービスプロセッサは、前記ユニットのログを示すログ情報を取得して前記待機系サービスプロセッサのメモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力し、前記待機系サービスプロセッサは、前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行する。
本発明の別の態様によれば、プログラムは、運用系サービスプロセッサ、待機系サービスプロセッサ、ユニットを備えるコンピュータシステムのコンピュータに、前記ユニットのログを示すログ情報を取得して前記待機系サービスプロセッサのメモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力することと、前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行することと、を実行させる。
本発明の各態様によれば、多重構成のサービスプロセッサを備えるコンピュータシステムにおいて、要求された処理に掛かる時間を短縮することができる。
本発明の第1の実施形態による通信システムの構成を示す図である。 本発明の第1の実施形態による通信システムの処理フローを示す図である。 本発明の第2の実施形態による通信システムの構成を示す図である。 本発明の第2の実施形態による通信システムの処理フローを示す図である。 本発明の実施形態によるコンピュータシステムの最小構成を示す図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
<第1の実施形態>
以下、図面を参照しながら実施形態について詳しく説明する。
本発明の第1の実施形態による通信システム1は、コンピュータシステム2と、操作端末3と、を備える。通信システム1は、コンピュータシステム2の障害発生時の障害情報(ログの一例)をコンピュータシステム2の共有メモリに一旦格納し、その後、コンピュータシステム2の運用系サービスプロセッサ内に障害情報として保存することで、処理要求が行われた場合であっても運用系サービスプロセッサの負荷を増加させないシステムである。コンピュータシステム2は、図1に示すように、サービスプロセッサ21(運用系サービスプロセッサの一例)、22(待機系サービスプロセッサの一例)と、ユニット23、24、25、26と、共有メモリ制御部27と、共有メモリ28と、を備える。
操作端末3は、コンピュータシステム2に障害情報の取得を要求する装置である。操作端末3は、通信インターフェースIF1を介して、サービスプロセッサ21、22それぞれに接続される。サービスプロセッサ21は、サービスプロセッサ間インターフェースIF2を介して、サービスプロセッサ22に接続される。共有メモリ制御部27は、診断インターフェースIF3を介して、サービスプロセッサ21、22それぞれに接続される。共有メモリ制御部27は、診断インターフェースIF4を介して、ユニット23、24、25、26それぞれに接続される。共有メモリ制御部27は、共有メモリ28に接続される。
サービスプロセッサ21は、運用系サービスプロセッサである。サービスプロセッサ21は、コンピュータシステム2の運用と制御を行う。
サービスプロセッサ21は、制御部211(第1制御部の一例)と、メモリ212と、を備える。
制御部211は、サービスプロセッサ22、ユニット23、24、25、26、操作端末3それぞれとの通信を制御する。また、制御部211は、メモリ212の情報の書き込み及び読み出しを制御する。
メモリ212は、全ユニットにおいて発生した障害のログを示す障害情報2121と、障害情報の操作端末3における保存先を示す保存先情報2122と、を記憶する。障害情報2121は、障害が発生した日時、障害を検出した箇所(プロセッサ番号など)、障害の種別(プロセッサ内部のキャッシュ障害、プロセッサ間インターフェースの障害など)の情報を含む。保存先情報2122は、ドライブ名、ディレクトリ名を含む。
サービスプロセッサ22は、待機系サービスプロセッサである。サービスプロセッサ22は、サービスプロセッサ21に障害や故障などの不具合が発生した場合、サービスプロセッサ21に替わってコンピュータシステム2の運用と制御を継続する。
サービスプロセッサ22は、制御部221(第2制御部の一例)と、メモリ222と、を備える。
制御部221は、サービスプロセッサ21、ユニット23、24、25、26、操作端末3それぞれとの通信を制御する。また、制御部221は、メモリ222の情報の書き込み及び読み出しを制御する。
メモリ222は、全ユニットにおいて発生した障害のログを示す障害情報2221と、操作端末3の障害情報の保存先情報2222と、を記憶する。
ユニット23、24、25及び26のそれぞれは、コンピュータシステム2内のプロセッサ、チップセットまたはコントローラである。ユニット23、24、25、26のそれぞれは、各ユニットごとに障害発生時の障害情報を保持する。具体的には、ユニット23は、ユニット23の障害情報231を保持する。ユニット24は、ユニット24の障害情報241を保持する。ユニット25は、ユニット25の障害情報251を保持する。ユニット26は、ユニット26の障害情報261を保持する。
共有メモリ制御部27は、共有メモリ28の情報の書き込み及び読み出しを制御する。 共有メモリ28は、ユニット23、24、25、26の何れかに障害が発生した場合、その障害の発生を含む障害情報281を記憶する。
次に、本発明の第1の実施形態による通信システム1の処理について説明する。ここでは、図2に示す通信システム1の処理フローについて説明する。
まず、初期設定の処理であるステップS1~S3について説明する。
制御部221は、通信インターフェースIF1を介して、障害情報を圧縮したファイルとして、操作端末3に出力する。
操作端末3は、サービスプロセッサ22から障害情報を受ける。操作端末3は、受けた障害情報を保存する。操作端末3は、通信インターフェースIF1を介して、障害情報の保存先を示す保存先情報をサービスプロセッサ21に出力する(ステップS1)。
制御部211は、操作端末3から保存先情報を受ける。制御部211は、受けた保存先情報をメモリ212に書き込む。メモリ212は、保存先情報を保存先情報2122として記憶する(保存する)(ステップS2)。制御部221は、サービスプロセッサ間インターフェースIF2を介して、保存先情報をサービスプロセッサ22に出力する。
制御部221は、制御部211から保存先情報を受ける。制御部221は、受けた保存先情報をメモリ222に書き込む。メモリ222は、保存先情報を保存先情報2222として記憶する(ステップS3)。
次に、障害発生時に障害情報を取得する処理であるステップS4~S11について説明する。
なお、ここでは、ユニット23で障害が発生した場合を例に障害発生時の処理を説明する。
障害が発生したユニット23は、障害が発生したことを示す障害発生通知を、診断インターフェースIF4、共有メモリ制御部27、診断インターフェースIF3を介して、サービスプロセッサ21に出力する(通知する)(ステップS4)。
制御部211は、ユニット23から障害発生通知を受ける。制御部211は、障害発生通知を受けると、共有メモリ制御部27に、ユニット23の障害情報231を読み出すよう指示する(ステップS5)。
共有メモリ制御部27は、制御部211から障害情報231を読み出す指示を受ける。共有メモリ制御部27は、その指示を受けると、ユニット23から障害情報231を読み出す。共有メモリ制御部27は、読み出した障害情報231を共有メモリ28に書き込む(保存する)(ステップS6)。その後、共有メモリ制御部27は、障害情報231をサービスプロセッサ21に出力する(送信する)(ステップS7)。
制御部211は、共有メモリ制御部27から障害情報231を受ける。制御部211は、受けた障害情報231を、メモリ212の障害情報2121として書き込む。
メモリ212は、障害情報231を障害情報2121として記憶する(ステップS8)。
制御部211は、障害情報2121をメモリ212へ書き込むと、障害情報2121の保存が完了したことを示す情報を、サービスプロセッサ22へ出力する(通知する)(ステップS9)。
制御部221は、サービスプロセッサ21から障害情報2121の保存が完了したことを示す情報を受ける。制御部221は、障害情報2121の保存が完了したことを示す情報を受けると、共有メモリ制御部27に、ユニット23の障害情報231を読み出すよう指示する。
共有メモリ制御部27は、サービスプロセッサ21から障害情報231を読み出す指示を受ける。共有メモリ制御部27は、その指示を受けると、ユニット23から障害情報231を読み出す。共有メモリ制御部27は、読み出した障害情報231をサービスプロセッサ22に出力する(送信する)。
制御部221は、共有メモリ制御部27から障害情報231を受ける(ステップS10)。制御部221は、受けた障害情報231を、メモリ222の障害情報2221として書き込む。
メモリ222は、障害情報231を障害情報2221として記憶する(ステップS11)。
次に、障害発生時に障害情報を読み出す処理であるステップS12~S16について説明する。
作業者は、操作端末3に対して、コンピュータシステム2で発生した障害情報を取得するための操作を行う。操作端末3は、作業者の操作に応じて、障害情報の読み出しを指示する情報をコンピュータシステム2に出力する(ステップS12)。
制御部211は、操作端末3から障害情報の読み出しを指示する情報を受ける。制御部211は、障害情報の読み出しを指示する情報を受けると、障害情報の圧縮処理・送信処理を行わずに、サービスプロセッサ22に障害情報の読み出し指示を示す情報のみを出力する(送信する)(ステップS13)。
制御部221は、サービスプロセッサ21から障害情報の読み出し指示を示す情報を受ける。制御部221は、障害情報の読み出し指示を示す情報を受けると、メモリ222から障害情報2221を読み出す(ステップS14)。
制御部221は、読み出した障害情報2221からテキストファイルを作成する。制御部221は、作成したテキストファイルのファイル圧縮を行う(ステップS15)。
制御部221は、作成された圧縮ファイル(処理結果の一例)を、初期設定で設定された保存先情報2222に従って、操作端末3の保存先に出力する(送信する)(ステップS16)。
操作端末3は、サービスプロセッサ22から圧縮ファイルを受ける。操作端末3は、受けた圧縮ファイルを保存先に書き込む(保存する)。
以上、本発明の第1の実施形態による通信システム1について説明した。本発明の第1の実施形態による通信システム1のコンピュータシステム2において、制御部211は、ユニット23の障害情報を取得して、サービスプロセッサ22のメモリ222に記憶させる。また、制御部211は、障害情報の読み出しを指示する操作があった場合に、障害情報を読み出させる読み出し指示をサービスプロセッサ22に出力する。制御部221は、障害情報の読み出し指示に応じてメモリ222から障害情報を読み出し、読み出した障害情報に係るファイル圧縮の処理を実行する。
このようにすれば、サービスプロセッサ22が障害情報を取得する処理を行い、サービスプロセッサ21は、要求された処理を行うことができる。そのため、多重構成のサービスプロセッサを備えるコンピュータシステム2は、要求された処理に掛かる時間を短縮することができる。
また、本発明の第1の実施形態による通信システム1のコンピュータシステム2が障害情報を記憶する共有メモリ28と、共有メモリ28の情報の書き込み及び読み出しを制御する共有メモリ制御部27と、を備え、コンピュータシステム2において、制御部211は、障害情報を共有メモリ制御部27を介して共有メモリ28から取得してサービスプロセッサ22のメモリ222に記憶させる。
共有メモリ制御部27が障害情報を取得する処理の一部を分担するため、制御部211の処理がさらに軽減される。そのため、多重構成のサービスプロセッサを備えるコンピュータシステム2は、要求された処理に掛かる時間をより短縮することができる。
<第2の実施形態>
本発明の第2の実施形態による通信システム1は、コンピュータシステム2と、操作端末3と、を備える。本発明の第2の実施形態による通信システム1は、本発明の第1の実施形態による通信システム1と同様に、コンピュータシステム2の障害発生時の障害情報(ログの一例)をコンピュータシステム2の共有メモリに一旦格納し、その後、コンピュータシステム2の運用系サービスプロセッサ内に障害情報として保存することで、処理要求が行われた場合であっても現用系SVPの負荷を増加させないシステムである。コンピュータシステム2は、図3に示すように、サービスプロセッサ21、22と、ユニット23、24、25、26と、を備える。
操作端末3は、通信インターフェースIF1を介して、サービスプロセッサ21、22それぞれに接続される。サービスプロセッサ21は、サービスプロセッサ間インターフェースIF5、IF6を介して、サービスプロセッサ22に接続される。サービスプロセッサ21は、診断インターフェースIF7を介して、ユニット23、24、25、26それぞれに接続される。サービスプロセッサ22は、診断インターフェースIF8を介して、ユニット23、24、25、26それぞれに接続される。
サービスプロセッサ21は、制御部211と、メモリ213、214と、を備える。
サービスプロセッサ22は、制御部221と、メモリ223、224と、を備える。
制御部211は、サービスプロセッサ22、ユニット23、24、25、26、操作端末3それぞれとの通信を制御する。制御部211は、サービスプロセッサ間インターフェースIF5を介して、メモリ213、223の情報の書き込みを制御する。制御部211は、メモリ213、223の情報の読み出しを制御する。
メモリ213は、プロセッサ21の取得した障害情報2131と、プロセッサ21の取得した保存先情報2132と、を記憶する。
メモリ214は、プロセッサ22の取得した障害情報2141を記憶する。
サービスプロセッサ22は、制御部221と、メモリ223、224と、を備える。
制御部221は、サービスプロセッサ21、ユニット23、24、25、26、操作端末3それぞれとの通信を制御する。制御部221は、サービスプロセッサ間インターフェースIF6を介して、メモリ214、224の情報の書き込みを制御する。制御部221は、メモリ223、224の情報の読み出しを制御する。
メモリ223は、プロセッサ21の取得した障害情報2231と、プロセッサ21の取得した保存先情報2232と、を記憶する。
メモリ224は、プロセッサ22の取得した障害情報2241を記憶する。
ユニット23、24、25、26のそれぞれは、各ユニットごとに障害発生時の障害情報を保持する。
次に、本発明の第2の実施形態による通信システム1の処理について説明する。ここでは、図4に示す通信システム1の処理フローについて説明する。
まず、初期設定の処理であるステップS1~S22について説明する。
制御部221は、通信インターフェースIF1を介して、障害情報を圧縮したファイルとして、操作端末3に出力する。
操作端末3は、サービスプロセッサ22から障害情報を受ける。操作端末3は、受けた障害情報を保存する。操作端末3は、ステップS1の処理を行う。
制御部211は、操作端末3から保存先情報を受ける。制御部211は、サービスプロセッサ間インターフェースIF5を介して、受けた保存先情報をメモリ213、223それぞれに書き込む。
メモリ213は、保存先情報を保存先情報2132として記憶する(保存する)(ステップS21)。
メモリ223は、保存先情報を保存先情報2232として記憶する(保存する)(ステップS22)。
次に、障害発生時に障害情報を取得する処理であるステップS23~S27について説明する。
なお、ここでは、ユニット23で障害が発生した場合を例に障害発生時の処理を説明する。
障害が発生したユニット23は、障害が発生したことを示す障害発生通知を、診断インターフェースIF7を介して、サービスプロセッサ21に出力する(通知する)(ステップS23)。
制御部211は、ユニット23から障害発生通知を受ける。制御部211は、障害発生通知を受けると、ユニット23から障害情報231を読み出す。制御部211は、読み出した障害情報231をメモリ213に書き込む(保存する)(ステップS24)。
メモリ213は、障害情報231を障害情報2131として記憶する(ステップS25)。
制御部211は、読み出した障害情報231をメモリ223に書き込む(保存する)(ステップS26)。
メモリ223は、障害情報231を障害情報2231として記憶する(ステップS27)。
次に、障害発生時に障害情報を読み出す処理であるステップS12~S29について説明する。
作業者は、操作端末3に対して、コンピュータシステム2で発生した障害情報を取得するための操作を行う。操作端末3は、ステップS12の処理を行う。
制御部211は、操作端末3から障害情報の読み出しを指示する情報を受ける。制御部211は、障害情報の読み出しを指示する情報を受けると、障害情報の圧縮処理・送信処理を行わずに、ステップS13の処理を行う。
制御部221は、サービスプロセッサ21から障害情報の読み出し指示を示す情報を受ける。制御部221は、障害情報の読み出し指示を示す情報を受けると、メモリ223から障害情報2231を読み出し、メモリ224から障害情報2241を読み出す(ステップS28)。
制御部221は、読み出した障害情報2231及び障害情報2241からテキストファイルを作成する。制御部221は、ステップS15の処理を行う。
制御部221は、作成された圧縮ファイルを、初期設定で設定された保存先情報2232に従って、操作端末3の保存先に出力する(送信する)(ステップS29)。
操作端末3は、サービスプロセッサ22から圧縮ファイルを受ける。操作端末3は、受けた圧縮ファイルを保存先に書き込む(保存する)。
以上、本発明の第2の実施形態による通信システム1について説明した。本発明の第2の実施形態による通信システム1のコンピュータシステム2において、制御部211及び制御部221のそれぞれは、ユニット23、24、25、26の何れかに障害が発生した場合に、その障害が発生したユニットから直接障害情報231を読み出す。
このようにすれば、本発明の第2の実施形態によるコンピュータシステム2は、第1の実施形態によるコンピュータシステム2よりも小さい構成とすることができる。
図5は、本発明の実施形態によるコンピュータシステム2の最小構成を示す図である。
コンピュータシステム2は、図5に示すように、運用系サービスプロセッサ21、メモリ222を有する待機系サービスプロセッサ22、ユニット23を備えるコンピュータシステムである。
運用系サービスプロセッサ21は、図5に示すように、第1制御部211を備える。
第1制御部211は、ユニット23のログを示すログ情報を取得してメモリ222に記憶させる。第1制御部211は、ログ情報の読み出しを指示する操作があった場合に、ログ情報を読み出させる読み出し指示を待機系サービスプロセッサ22に出力する。
待機系サービスプロセッサ22は、図5に示すように、第2制御部221を備える。
第2制御部221は、第1制御部211が出力した読み出し指示に応じてメモリ222からログ情報を読み出す。第2制御部221は、読み出したログ情報に係る処理を実行する。
なお、本発明の実施形態における処理は、適切な処理が行われる範囲において、処理の順番が入れ替わってもよい。例えば、図4に示した通信システム1の処理は、ステップS24及びステップS25の処理を行った後にステップS26及びステップS27の処理を行う、すなわち、障害情報231をメモリ213に書き込む処理を行った後に障害情報231をメモリ223に書き込む処理を行うものとした。しかしながら、本発明の別の実施形態では、通信システム1の処理は、ステップS26及びステップS27の処理を行った後にステップS24及びステップS25の処理を行うものであってもよい。
本発明の実施形態における共有メモリ28、メモリ212、213、214、222、223、224、その他の記憶装置のそれぞれは、適切な情報の送受信が行われる範囲においてどこに備えられていてもよい。また、共有メモリ28、メモリ212、213、214、222、223、224、その他の記憶装置のそれぞれは、適切な情報の送受信が行われる範囲において複数存在しデータを分散して記憶していてもよい。
本発明の実施形態について説明したが、上述の操作端末3、その他の制御装置は内部に、コンピュータシステムを有していてもよい。そして、上述した処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。コンピュータの具体例を以下に示す。
図6は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
コンピュータ5は、図6に示すように、CPU6、メインメモリ7、ストレージ8、インターフェース9を備える。
例えば、上述の操作端末3、その他の制御装置のそれぞれは、コンピュータ5に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ8に記憶されている。CPU6は、プログラムをストレージ8から読み出してメインメモリ7に展開し、当該プログラムに従って上記処理を実行する。また、CPU6は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ7に確保する。
また、コンピュータシステム2は、上述のコンピュータシステム、すなわち、図6に示すコンピュータ5を備えるものであってもよい。
ストレージ8の例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、半導体メモリ等が挙げられる。ストレージ8は、コンピュータ5のバスに直接接続された内部メディアであってもよいし、インターフェース9または通信回線を介してコンピュータ5に接続される外部メディアであってもよい。また、このプログラムが通信回線によってコンピュータ5に配信される場合、配信を受けたコンピュータ5が当該プログラムをメインメモリ7に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、ストレージ8は、一時的でない有形の記憶媒体である。
また、上記プログラムは、前述した機能の一部を実現してもよい。さらに、上記プログラムは、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるファイル、いわゆる差分ファイル(差分プログラム)であってもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例であり、発明の範囲を限定しない。これらの実施形態は、発明の要旨を逸脱しない範囲で、種々の追加、省略、置き換え、変更を行ってよい。
1・・・通信システム
2・・・コンピュータシステム
3・・・操作端末
5・・・コンピュータ
6・・・CPU
7・・・メインメモリ
8・・・ストレージ
9・・・インターフェース
21・・・サービスプロセッサ、運用系サービスプロセッサ
22・・・サービスプロセッサ、待機系サービスプロセッサ
23、24、25、26・・・ユニット
27・・・共有メモリ制御部
28・・・共有メモリ
211・・・制御部、第1制御部
221・・・制御部、第2制御部
212、213、214、222、223、224・・・メモリ
231、241、251、261、281、2121、2131、2141、2221、2231、2241・・・障害情報
2122、2132、2222、2232・・・保存先情報
IF1・・・通信インターフェース
IF2、IF5、IF6・・・サービスプロセッサ間インターフェース
IF3、IF4、IF7、IF8・・・診断インターフェース

Claims (8)

  1. 運用系サービスプロセッサ、メモリを有する待機系サービスプロセッサ、ユニットを備えるコンピュータシステムであって、
    前記運用系サービスプロセッサは、
    前記ユニットのログを示すログ情報を取得して前記メモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力する第1制御部、
    を備え、
    前記待機系サービスプロセッサは、
    前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行する第2制御部、
    を備えるコンピュータシステム。
  2. 前記ログ情報を記憶する共有メモリと、
    前記共有メモリの情報の書き込み及び読み出しを制御する共有メモリ制御部と、
    を備え、
    前記第1制御部は、
    前記ログ情報を前記共有メモリ制御部を介して前記共有メモリから取得して前記メモリに記憶させる、
    請求項1に記載のコンピュータシステム。
  3. 前記メモリは、
    操作端末における前記ログ情報の保存先を示す保存先情報を記憶する、
    請求項1または請求項2に記載のコンピュータシステム。
  4. 前記第2制御部は、
    実行した前記ログ情報に係る処理の処理結果を前記保存先情報の示す前記保存先へ出力する、
    請求項3に記載のコンピュータシステム。
  5. 前記ログ情報は、
    前記ユニットにおいて発生した障害のログを示す障害情報である、
    請求項1から請求項4の何れか一項に記載のコンピュータシステム。
  6. 請求項1から請求項5の何れか一項に記載のコンピュータシステムと、
    前記コンピュータシステムの備えるユニットのログを示すログ情報の操作端末における保存先を示す保存先情報を、前記コンピュータシステムに出力する前記操作端末と、
    を備える通信システム。
  7. 運用系サービスプロセッサ、メモリを備える待機系サービスプロセッサ、ユニットを備えるコンピュータシステムによる制御方法であって、
    前記運用系サービスプロセッサは、
    前記ユニットのログを示すログ情報を取得して前記メモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力し、
    前記待機系サービスプロセッサは、
    前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行する、
    コンピュータシステムによる制御方法。
  8. 運用系サービスプロセッサ、メモリを有する待機系サービスプロセッサ、ユニットを備えるコンピュータシステムのコンピュータに、
    前記ユニットのログを示すログ情報を取得して前記メモリに記憶させ、前記ログ情報の読み出しを指示する操作があった場合に、前記ログ情報を読み出させる読み出し指示を前記待機系サービスプロセッサに出力することと、
    前記読み出し指示に応じて前記メモリから前記ログ情報を読み出し、読み出した前記ログ情報に係る処理を実行することと、
    を実行させるプログラム。
JP2018064531A 2018-03-29 2018-03-29 コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム Active JP7028503B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018064531A JP7028503B2 (ja) 2018-03-29 2018-03-29 コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム
PCT/JP2019/013594 WO2019189571A1 (ja) 2018-03-29 2019-03-28 コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム
US17/041,097 US11113134B2 (en) 2018-03-29 2019-03-28 Computer system, communications system, control method by computer system, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018064531A JP7028503B2 (ja) 2018-03-29 2018-03-29 コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2019175257A JP2019175257A (ja) 2019-10-10
JP7028503B2 true JP7028503B2 (ja) 2022-03-02

Family

ID=68060157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018064531A Active JP7028503B2 (ja) 2018-03-29 2018-03-29 コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム

Country Status (3)

Country Link
US (1) US11113134B2 (ja)
JP (1) JP7028503B2 (ja)
WO (1) WO2019189571A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013190663A1 (ja) 2012-06-20 2013-12-27 富士通株式会社 管理装置およびログ採取方法
US20170214742A1 (en) 2014-10-08 2017-07-27 Huawei Technologies Co., Ltd. Message Processing Method and Apparatus, and Message Processing System
JP2017167675A (ja) 2016-03-14 2017-09-21 株式会社リコー 情報処理システム、情報処理方法、及びサーバ

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148525A (ja) 1998-11-18 2000-05-30 Hitachi Ltd サービスプロセッサ二重化システムの現用系負荷軽減方法
JP2003015901A (ja) * 2001-06-28 2003-01-17 Nissin Electric Co Ltd 監視制御装置
US7519572B2 (en) * 2005-02-15 2009-04-14 International Business Machines Corporation System and method for efficiently obtaining a summary from and locating data in a log file
GB2508419B (en) * 2012-11-30 2021-03-24 Metaswitch Networks Ltd Synchronisation of database records using a transaction log and global version
JP6206097B2 (ja) * 2013-11-01 2017-10-04 富士通株式会社 情報処理装置、起動方法及び起動プログラム
JP6595861B2 (ja) * 2015-09-14 2019-10-23 Necプラットフォームズ株式会社 情報処理装置、ログ取得方法およびログ取得プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013190663A1 (ja) 2012-06-20 2013-12-27 富士通株式会社 管理装置およびログ採取方法
US20170214742A1 (en) 2014-10-08 2017-07-27 Huawei Technologies Co., Ltd. Message Processing Method and Apparatus, and Message Processing System
JP2017167675A (ja) 2016-03-14 2017-09-21 株式会社リコー 情報処理システム、情報処理方法、及びサーバ

Also Published As

Publication number Publication date
WO2019189571A1 (ja) 2019-10-03
JP2019175257A (ja) 2019-10-10
US20210117262A1 (en) 2021-04-22
US11113134B2 (en) 2021-09-07

Similar Documents

Publication Publication Date Title
US9007641B2 (en) Information processing apparatus, control method, and storage medium
JPH05224832A (ja) アレイディスク装置のディスク装置診断方法
US10789184B2 (en) Vehicle control device
KR100827287B1 (ko) 반도체 보조 기억 장치 및 이를 이용한 데이터 저장 방법
US9251016B2 (en) Storage system, storage control method, and storage control program
JP7028503B2 (ja) コンピュータシステム、通信システム、コンピュータシステムによる制御方法及びプログラム
WO2018139223A1 (ja) 情報処理装置,制御プログラムおよび情報処理方法
US20190073147A1 (en) Control device, method and non-transitory computer-readable storage medium
US9298635B2 (en) Storage device and rebuild process method for storage device
JP5103823B2 (ja) 情報処理装置および入出力要求制御方法
US8862793B2 (en) Storage system, control device, and storage system control method of controlling storage system
JP4352224B2 (ja) 二重化系におけるデータ救済方法およびシステム
WO2016139774A1 (ja) 情報処理装置、情報処理システム
JP5773446B2 (ja) 記憶装置、冗長性回復方法、およびプログラム
JP6000754B2 (ja) 画像処理装置、画像処理装置の制御方法、及びプログラム
JP6007822B2 (ja) フォールトトレラントサーバ、およびそのメモリコピー方法
JP5231496B2 (ja) 情報処理装置及びそのサスペンド/リジューム方法
JP2016207142A (ja) 計算機及びメモリ故障診断方法
JP5703860B2 (ja) フォールトトレラントシステム、メモリ制御方法、及びプログラム
JP2005316697A (ja) ディスクアレイシステムおよびデータバックアップ方法
JP2000235458A (ja) 補助記憶装置およびこの補助記憶装置を搭載した情報処理装置
JP2022000824A (ja) サーバシステム、検出方法及びプログラム
JP6519266B2 (ja) 情報処理装置、デバイス、および復旧方法、並びにコンピュータ・プログラム
JP2023183437A (ja) 記憶システムおよび記憶方法
JP2010186422A (ja) データ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220210

R150 Certificate of patent or registration of utility model

Ref document number: 7028503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150