JP4935597B2 - コンピュータ及び通信処理方法 - Google Patents

コンピュータ及び通信処理方法 Download PDF

Info

Publication number
JP4935597B2
JP4935597B2 JP2007248667A JP2007248667A JP4935597B2 JP 4935597 B2 JP4935597 B2 JP 4935597B2 JP 2007248667 A JP2007248667 A JP 2007248667A JP 2007248667 A JP2007248667 A JP 2007248667A JP 4935597 B2 JP4935597 B2 JP 4935597B2
Authority
JP
Japan
Prior art keywords
processing
network
processing unit
communication
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007248667A
Other languages
English (en)
Other versions
JP2009081609A (ja
Inventor
淳二 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007248667A priority Critical patent/JP4935597B2/ja
Publication of JP2009081609A publication Critical patent/JP2009081609A/ja
Application granted granted Critical
Publication of JP4935597B2 publication Critical patent/JP4935597B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

本発明は、コンピュータにかかり、特に、ネットワークに接続するための処理を行うネットワーク処理部を備えたコンピュータに関する。
近年、コンピュータにて、通信ネットワークに接続し、他のコンピュータにアクセスすることが実現されている。このとき、コンピュータは、ネットワーク装置による処理を利用して、通信ネットワークに接続している。そして、ネットワーク装置は、例えば、TPC/IP処理などを行うことで、データ通信を実現している。
一方で、コンピュータに搭載のネットワーク装置は、当該ネットワーク装置内の一部に故障が発生した場合、そのネットワーク装置自体を切り離し他のネットワーク装置へ切り替えることで、接続されたネットワークへの影響を最小化していた。例えば、特許文献1は、コンピュータに外付けされたネットワーク接続装置を二重化して備え、一方に障害が発生した場合に、他方に切り替える、という技術を開示している。
特開平9−91233号公報
しかしながら、トランザクションが多いネットワークにおいては、ネットワーク装置のインターフェースの切り離しがパケットストームやハートビート確認不可によるシステムダウンを引き起こす可能性があった。このため、ネットワーク装置自体の可用性の向上を図ることができず、信頼性に欠ける、という問題があった。
このため、本発明では、上記従来例の有する不都合を改善し、特に、ネットワーク装置が搭載されたコンピュータのネットワーク接続時における可用性の向上を図ることができ、コンピュータの信頼性の向上を図ることをその目的とする。
そこで、本発明の一形態であるコンピュータは、
ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備え、ネットワーク処理部による通信データの処理結果を取り出す処理結果取出手段と、通信制御処理部にてネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行手段と、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較する処理結果比較手段と、この比較結果に基づいてネットワーク処理部の少なくとも一部の処理を代替する通信処理代替手段と、を備えた、という構成を採っている。
本発明は、以上のように構成されているため、これによると、一時的なネットワーク装置の停止を抑制してネットワーク接続の継続利用を図り、コンピュータの可用性を向上させ、コンピュータの信頼性の向上を図ることができる、という従来例にない優れた効果を有する。
本発明の一形態におけるコンピュータは、ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えている。そして、ネットワーク処理部による通信データの処理結果を取り出す処理結果取出手段と、通信制御処理部置にてネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行手段と、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較する処理結果比較手段と、この比較結果に基づいてネットワーク処理部の少なくとも一部の処理を代替する通信処理代替手段と、を備えた、という構成を採っている。
そして、本発明では、上記ネットワーク処理部が、通信データを処理する複数の処理部を備え、処理結果取出手段は、複数の処理部のうち少なくとも1の処理部の処理結果を取り出すと共に、同一処理実行手段は、少なくとも処理結果取出手段にて処理結果を取り出す処理部と同一の処理を実行し、通信処理代替手段は、処理結果比較手段による比較結果に基づいてネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、という構成を採る。
上記発明によると、まず、ネットワーク処理部にて通信データを処理して、その処理結果を取り出す。また、ネットワーク処理部と同一の処理を、通信制御処理部にて行う。そして、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較する。これにより、例えば、複数の処理部からなるネットワーク処理部の障害部位を特定する。そして、比較結果に基づいて、ネットワーク処理部の一部の処理、つまり、障害部位による処理を代替する。従って、仮にネットワーク処理部に障害が生じた場合であっても、かかる障害が生じた部位による処理を他で代替するため、一時的なネットワーク処理の停止を抑制でき、可用性の向上を図り、コンピュータの信頼性の向上を図ることができる。
また、本発明では、上記通信処理代替手段は、通信制御処理部が障害部位による通信データの処理を実行して、この処理済データをネットワーク処理部に送信する、という構成を採る。また、上記通信処理代替手段は、ネットワーク処理部内に設けられた障害部位の次に通信データの処理を実行する処理部に対して処理済データを送信する、という構成を採る。また、ネットワーク処理部は、TCPオフロードエンジンと、IP処理部と、イーサネット処理部と、を備え、処理結果比較手段は、ネットワーク処理部のTCPオフロードエンジンによる処理結果と、通信制御処理部によるTCP処理結果とを比較し、通信処理代替手段は、比較結果に基づいてTCPオフロードエンジンの障害を検出して、通信データにTCP処理を施した処理済データをネットワーク処理部のIP処理部に送信する、という構成を採る。さらに、ネットワーク処理部及び通信制御処理部にて処理結果を比較するために処理する通信データは、ダミーデータである、と言う構成を採る。
これにより、ネットワーク処理部に備えられたTCP処理部の障害を検出することができる。そして、障害が生じた場合であっても、迅速に復旧することができ、コンピュータの稼働の停止を抑制することができる。特に、ダミーデータにて障害の発生を検出できるため、通信中ではなく、任意のタイミングで障害の検出を行うことができる。
また、本発明では、上記ネットワーク処理部と同一構成の他のネットワーク処理部を備え、上記通信処理代替手段は、ネットワークに対して送受信する通信データの処理を他のネットワーク処理部にて行うよう設定する、という構成を採る。また、上記処理結果取出手段は、他のネットワーク処理部による通信データの処理結果を取り出し、処理結果比較手段は、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較すると共に、他のネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較する、という構成を採る。また、ネットワーク処理部及び他のネットワーク処理部は、TCPオフロードエンジンと、IP処理部と、イーサネット処理部と、をそれぞれ備えた、という構成を採る。さらに、ネットワーク処理部、他のネットワーク処理部、及び、通信制御処理部にて処理結果を比較するために処理する通信データは、ダミーデータである、という構成を採る。
これにより、ネットワーク処理部に障害が生じた場合でも、同一構成の他のネットワーク処理部にてネットワークに対する通信データの送受信処理を行うよう設定することで、ネットワーク処理部の一部の処理、つまり、障害部位による処理を、他のネットワーク処理部にて代替することができる。従って、一時的なネットワーク処理の停止を抑制でき、可用性の向上を図り、コンピュータの信頼性の向上を図ることができる。
また、本発明の他の形態であるプログラムは、ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えたコンピュータに、ネットワーク処理部による通信データの処理結果を取り出す処理結果取出手段と、通信制御処理部にてネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行手段と、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較して当該比較結果に基づいてネットワーク処理部の少なくとも一部の処理を代替する通信処理代替手段と、を実現させる、という構成を採る。
また、上記処理結果取出手段は、ネットワーク処理部が有する通信データを処理する複数の処理部のうち少なくとも1の処理部の処理結果を取り出すると共に、同一処理実行手段は、少なくとも処理結果取出手段にて処理結果を取り出すネットワーク処理部が備えた処理部と同一の処理を実行し、通信処理代替手段は、比較結果に基づいてネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、という構成を採る。
また、上記通信処理代替手段は、通信制御処理部が障害部位による通信データの処理を実行して、この処理済データをネットワーク処理部に送信する、という構成を採る。あるいは、上記通信処理代替手段は、ネットワークに対して送受信する通信データの処理を、ネットワーク処理部と同一構成の他のネットワーク処理部にて行うよう設定する、という構成を採る。
また、本発明の他の形態である通信処理方法は、ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えたコンピュータにて通信処理を行う方法であって、ネットワーク処理部による通信データの処理結果を取り出す処理結果取出工程と、この処理結果取出工程に前後して、通信制御処理部にてネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行工程と、ネットワーク処理部による処理結果と通信制御処理部による処理結果とを比較する処理結果比較工程と、比較結果に基づいてネットワーク処理部の少なくとも一部の処理を代替する通信処理代替工程と、を有する、という構成を採る。
また、上記処理結果取出工程は、ネットワーク処理部が有する通信データを処理する複数の処理部のうち少なくとも1の処理部の処理結果を取り出すると共に、同一処理実行工程は、少なくとも処理結果取出工程にて処理結果を取り出すネットワーク処理部が備えた処理部と同一の処理を実行し、通信処理代替工程は、比較結果に基づいてネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、という構成を採る。さらに、上記通信処理代替工程は、通信制御処理部が障害部位による通信データの処理を実行して、この処理済データをネットワーク処理部に送信する、という構成を採る。あるいは、通信処理代替工程は、ネットワークに対して送受信する通信データの処理を、ネットワーク処理部と同一構成の他のネットワーク処理部にて行うよう設定する、という構成を採る。
上述した構成のプログラム、方法の発明にであっても、上記コンピュータと同様に作用するため、上述した本発明の目的を達成することができる。以下、本発明の具体的な構成及び動作を、実施例にて説明する。
本発明の第1の実施例を、図1乃至図3を参照して説明する。図1乃至図2は、本実施例におけるコンピュータの構成を示すブロック図であり、図3は、コンピュータの動作を示すシーケンス図である。
[構成]
図1に示すように、本実施例におけるコンピュータ1は、まず、マウスやキーボードなどの操作手段11と、コンピュータ自体の動作を管理するOS管理部2と、OS管理部2の状態を表示する表示手段12と、通信ネットワーク10に対する通信データの送受信処理を行うネットワーク装置3と、を備えている。以下、各構成について詳述する。
まず、ネットワーク装置3は、コンピュータ1を外部の通信ネットワーク10に接続する機能を有している。具体的には、図1に示すように、TCPオフロードエンジン41と、IP処理部42と、イーサネット処理部43と、ネットワークインターフェース43と、を有するネットワーク主要処理部4(ネットワーク処理部)と、ネットワークインターフェース6と、メモリ5と、を備えている。ここで、上記ネットワーク主要処理部4は、OS管理部2からの指令に応じて、上記各処理部41,42,43にて通信データをTCP/IP処理する機能を有する。つまり、上述したように、本来はOS管理部2で可能な通信データの処理を実行する通信専用の各処理部41,42,43を備え、OS管理部2の処理負担を軽減している。また、本実施例におけるネットワーク装置3は、TCPオフロードエンジン41、IP処理部42、イーサネット処理部43、といった各処理結果をメモリ5に取り出すためのバイパス回路71を備えており、これにより、各処理部41,42,43の処理結果をメモリ5に記憶することが可能である。そして、このメモリ5に記憶された処理結果は、OS管理部2にて取得可能である。
なお、ネットワーク主要処理部4の各処理部41,42,43による処理結果とは、診断時にOS管理部2から符号72に示すパス72を介してTCPオフロードエンジン41に通信データとしてのダミーデータが送信されるが、このダミーデータに対して各処理部41,42,43にて実行された処理結果である。そして、各処理部41,42,43の処理結果であることを表すヘッダ付きデータが、メモリ5に記憶される。ここで、OS管理部2からダミーデータが送信され各処理部41,42,43の処理結果を取得する診断のタイミングは、例えば、(1)コンピュータ起動時のマシンイニシャライズ中、(2)通信ネットワークから送受信したパケットにチェックサムエラーがあった時、(3)OS管理部2による定期的なポーリング、(4)ユーザによる操作手段11からの起動、などがある。但し、通常のネットワーク処理時における処理結果をメモリに取り出してもよい。
また、OS管理部2(通信制御処理部)は、上記ネットワーク装置3を介した通信動作を制御する制御装置である。そして、このOS管理部2は、図2に示すように、所定のプログラムが組み込まれることで構築される、通信データ処理部21と、同一処理実行部22と、処理結果取得部23と、処理結果比較部24と、通信処理代替部25と、を備えている。
上記通信データ処理部21は、基本的には、ネットワーク装置3を介した通信処理を制御する機能を有する。従って、通常の通信処理時には、TCPオフロードエンジン41に対して、通信データの送受信を行う。また、通信データ処理部21は、上述した診断のタイミングで、パス72を介してTCPオフロードエンジン41にダミーデータを送信する機能を有する。さらに、通信データ処理部21は、後述する通信処理代替部25からの指令に応じて、TCPオフロードエンジン41の故障を検出した場合に、通信データに対してTCP処理を実行し、その処理済データを符号73に示すパス73を介してIP処理部42に送信する機能を有する。かかる機能については後述する。
また、上記同一処理実行部22(同一処理実行手段)は、上述した通信データ処理部21にてTCPオフロードエンジン41にダミーデータを送信した際に、当該ダミーデータに対する通信処理を実行する。つまり、ネットワーク装置3内のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、でそれぞれ実行される処理と同一の処理を実行し、各段階(TCP、IP、イーサネット)における処理結果を各段階による処理であることを表すヘッダ付きデータとして生成する。
また、上記処理結果取得部23は、上述したように、メモリ5に記憶されたネットワーク主要処理部4の各処理部41,42,43による処理結果を取得する。そして、同一処理実行部22にて実行した処理結果と共に、処理結果比較部24に渡す。このように、処理結果取得部23は、上述したバイパス71及びメモリ5と共に、ネットワーク装置3に装備された各処理部41,42,43による処理結果を取り出す処理結果取出手段として機能する。
また、上記処理結果比較部24(処理結果比較手段)は、上述したように取得したネットワーク装置3の各処理部41,42,43による処理結果と、OS管理部2による各処理結果と、を比較する。具体的には、TCPオフロードエンジン41による処理結果と、OS管理部2によるTCP処理の処理結果、IP処理部42による処理結果とOS管理部2によるIP処理の処理結果、イーサネット処理部43による処理結果とOS管理部2によるイーサネット処理の処理結果、というように、それぞれ対応して同一の処理内容となるはずの処理結果を比較する。そして、比較した結果を、通信処理代替部25に通知する。
通信処理代替部25は、比較した結果、各処理に差異が生じた場合には、ネットワーク装置3の処理部41,42,43が故障している、と判断する。例えば、TCPオフロードエンジン41による処理結果と、OS管理部2によるTCP処理の結果とに差異があると、当該TCPオフロードエンジン41が故障している(障害が発生している)と判断する。かかる状況で、さらに、IP処理部42による処理結果とOS管理部2によるIP処理の結果、イーサネット処理部43による処理結果とOS管理部2によるイーサネット処理の結果、にそれぞれ差異がない場合には、TCPオフロードエンジン41のみが故障したと判断する。この場合に、通信処理代替部25は、通信データ処理部21に指令を発し、その後の通信データは通信データ処理部21にてTCPオフロードエンジン41と同一のTCP処理を施して、パス73を介してTCPオフロードエンジン41の次の処理を行うIP処理部42に送信するよう指示する。以上のように、通信処理代替部25と通信データ処理部21とは、ネットワーク装置3の一部の処理を代替して行う通信処理代替手段として機能する。一方、IP処理部42等の処理結果にも差異が生じた場合には、リカバリーが困難な場合が多いため、ネットワーク装置3自体の動作を停止する。
[動作]
次に、上記構成のコンピュータ1の動作を、図3のシーケンス図を参照して説明する。なお、ここでは、TCPオフロードエンジン41を使用していたが、稼働中に故障した場合を想定して説明する。
まず、例えば、以下の4つの動作を契機として、故障診断処理が実行される。
(1)コンピュータ起動時のマシンイニシャライズ中
(2)通信ネットワーク10から送受信したパケットにチェックサムエラーがあった時
(3)OS管理部2による定期的なポーリング
(4)ユーザによる操作手段11からの起動
そして、上記タイミングで、OS管理部2は、ダミーの通信データを、パス72を経由してネットワーク装置3のTCPオフロードエンジン41に送信する(ステップS1)。すると、ネットワーク装置3のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、のそれぞれが、ダミーデータに対する処理を実行する(ステップS2)。そして、各処理部41,42,43による処理結果となるヘッダ付きデータを、バイパス回路71を介してメモリ5に保存する(ステップS3、処理結果取出工程)。
また、上記ステップ2と並行して、OS管理部2はネットワーク装置3に送信したダミーデータに対して、TCP、IP、イーサネットの、各段階における処理を実行し、それぞれヘッダ付きデータを生成する(ステップS4)。つまり、正常なネットワーク装置3のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43による各処理結果を、OS管理部2にて生成する(同一処理実行工程)。
続いて、OS処理部2は、メモリ5から、TCPオフロードエンジン41、IP処理部42、イーサネット処理部43、が実際に処理したヘッダ付きデータを取得する(ステップS5、処理結果取得工程)。さらに、OS管理部2にてTCP、IP、イーサネット処理を実行して生成した処理結果であるヘッダ付きデータを読み出して、それぞれ対応する処理同士の処理結果であるヘッダ付きデータを比較する(ステップS6、処理結果比較工程)。
すると、ここでは、TCPオフロードエンジン41の処理結果と、TCP処理の結果に差分が出る。このとき、さらに、IP、イーサネット処理後の比較結果に、両方とも差分が出ない場合には、TCPオフロードエンジン41のみが故障したと判断する(ステップS7)。そして、このTCPオフロードエンジン41を論理的に切り離すと共に、OS管理部2では、通信制御時に、通信パケットにTCP処理を実行し、その処理済の通信パケットを、パス73経由でIP処理部42に送信する。つまり、故障したTCPオフロードエンジン41に替わってOS管理部2が通信データに対してTCP処理を行い、これをTCPオフロードエンジン41の先に位置するIP処理部42に送信する(ステップS8、通信処理代替工程)。これにより、以後の通信ネットワークに対する通信処理を正常に実行することができる。
なお、さらに、IP、イーサネット処理後の比較結果に差分が出た場合には、上記構成ではネットワーク装置3のリカバリーは不可能であるため、ネットワーク装置3全体を停止する。その後、上述したステップS7,8の処理結果や、ネットワーク装置3の停止の旨を、表示手段12に表示する。
以上のように、本実施例によると、仮にネットワーク装置3に障害が生じた場合であっても、かかる障害が生じた部位による処理をOS管理部2にて代替するため、一時的なネットワーク装置の停止を抑制でき、可用性の向上を図り、コンピュータ1の信頼性の向上を図ることができる。
ここで、上記では、メモリ5に各処理部41,42,43の処理結果を取り出し、また、これらに対応する各処理をOS管理部2にて実行する場合を例示したが、必ずしも上述した処理を実行することに限定されない。例えば、障害の発生頻度の高い処理のみをメモリ5に取り出し、また、OS管理部2にて実行して比較し、障害の発生を検出して、かかる障害部位の代替処理を行ってもよい。つまり、上記では、TCPオフロードエンジン41が故障した場合を例示したが、他の処理部42,43の故障を検出した場合に、ネットワーク処理部4による通信データに対する処理をOS管理部2にて実行して、ネットワークインターフェース6に送信してもよい。
次に、本発明の第2の実施例を、図4乃至図6を参照して説明する。図4乃至図5は、本実施例におけるコンピュータの構成を示すブロック図であり、図5は、コンピュータの動作を示すシーケンス図である。
[構成]
本実施例におけるコンピュータ1は、実施例1のものとほぼ同様の構成を採っている。従って、以下では、実施例1と異なる構成について特に説明する。
図4に示すように、本実施例におけるコンピュータ1のネットワーク装置3は、上述したメモリ5に替えて、フレーム比較部51を備えている。このフレーム比較部51は、ネットワーク主要処理部4に設けられたTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、による各処理結果を、バイパス回路71を介して取り出す。また、フレーム比較部51は、図5に示すように、OS管理部2に設けられた同一処理実行部22によって生成されたTCP、IP、イーサネットの各処理結果を表すデータを取得する。そして、フレーム比較部51は、上記ネットワーク主要処理部4の各処理部41,42,43による各処理結果と、OS管理部2による各処理結果と、を比較する機能を有する。このように、フレーム比較部51は、処理結果取得手段及び処理結果比較手段として機能する。また、この比較結果をOS管理部2に設けられた比較結果取得部26に通知する。そして、この比較結果を取得したOS管理部2は、通信処理代替部25にて、上述同様に、ネットワーク主要処理部4の故障を検出し、その代替処理を行う。
[動作]
次に、実施例2におけるコンピュータ1の動作を、図6のシーケンス図を参照して説明する。なお、ここでは、TCPオフロードエンジン41を使用していたが、稼働中に故障した場合を想定して説明する。
まず、上述したような診断のタイミングで、OS管理部2は、ダミーの通信データをパス72を経由して、ネットワーク装置3のTCPオフロードエンジン41に送信する(ステップS11)。すると、ネットワーク装置3内のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、のそれぞれが、ダミーデータに対する処理を実行する(ステップS12)。そして、各処理部41,42,43による処理結果となるヘッダ付きデータは、バイパス回路71を介してフレーム比較部51にて取り出される(処理結果取出工程)。
また、上記ステップ2と並行して、OS管理部2はネットワーク装置3に送信したダミーデータに対して、TCP、IP、イーサネットの、各段階における処理を実行し、それぞれヘッダ付きデータを生成する(ステップS13)。つまり、正常なネットワーク装置3のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43による各処理結果を、OS管理部2にて生成する(同一処理実行工程)。そして、OS処理部2は、これら処理結果を、フレーム比較部51に送信する(ステップS14)。
続いて、フレーム比較部51は、TCPオフロードエンジン41、IP処理部42、イーサネット処理部43、が実際に処理したヘッダ付きデータと、OS管理部2にてTCP、IP、イーサネット処理を実行して生成した処理結果であるヘッダ付きデータとを比較する(ステップS15、処理結果比較工程)。そして、その比較結果をOS管理部2に送信する(ステップS16)。
その後、OS管理部2では、上述同様に、比較結果からネットワーク装置3の障害箇所を特定する。ここでは、TCPオフロードエンジン41の処理結果と、OS管理部2によるTCP処理の結果に差分が出たとする。このとき、さらに、IP、イーサネット処理後の比較結果に、両方とも差分が出ない場合には、TCPオフロードエンジン41のみが故障したと判断する(ステップS17)。そして、このTCPオフロードエンジン41を論理的に切り離すと共に、OS管理部2では、通信制御時に、TCP処理した通信パケットを、パス73経由でIP処理部42に送信する。つまり、故障したTCPオフロードエンジン41に替わってOS管理部2が通信データに対してTCP処理を行い、これをTCPオフロードエンジン41の先に位置するIP処理部42に送信する(ステップS18、通信処理代替工程)。これにより、通信ネットワークに対する通信処理を継続することができる。
なお、さらに、IP、イーサネット処理後の比較結果に差分が出た場合には、上記構成ではネットワーク装置3のリカバリーは不可能であるため、ネットワーク装置3全体を停止する。その後、上述したステップS7,8の処理結果や、ネットワーク装置3の停止の旨を、表示手段12に表示する。
以上のように、本実施例によると、仮にネットワーク装置3に障害が生じた場合であっても、かかる障害が生じた部位による処理をOS管理部2にて代替するため、一時的なネットワーク装置の停止を抑制でき、可用性の向上を図り、コンピュータ1の信頼性の向上を図ることができる。
次に、本発明の第3の実施例を、図7乃至図9を参照して説明する。図7乃至図8は、本実施例におけるコンピュータの構成を示すブロック図であり、図9は、コンピュータの動作を示すシーケンス図である。
[構成]
本実施例におけるコンピュータ1は、基本的には、実施例1のものとほぼ同様の構成を採っている。そして、本実施例では、さらに、ネットワーク装置3内に、ネットワーク主要処理部4,104を2つ備えている。つまり、稼動系となるTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、を有する第1ネットワーク主要処理部4と、待機系となるTCPオフロードエンジン141、IP処理部142、イーサネット処理部143、を有する第2ネットワーク主要処理部104と、を備えている。また、上記各ネットワーク主要処理部4,104内の各処理部から、それぞれの処理結果をバイパス回路71を介して取り出す記憶するメモリ5を備えている。
また、本実施例におけるOS管理部2は、基本的には、上述した実施例1と同様に、通信データ処理部121、同一処理実行部22、処理結果取得部123、処理結果比較部124、通信処理代替部125を備えている。そして、通信データ処理部121は、通常時には、稼動系である第1ネットワーク主要処理部4のTCPオフロードエンジン41に対して、パス72を介して通信データの送受信を行う。また、通信データ処理部121は、上述した診断のタイミングで、パス72及びパス75を介して、第1及び第2のネットワーク主要処理部4,104の各TCPオフロードエンジン41,141に、それぞれダミーデータを送信する機能を有する。さらに、通信データ処理部121は、後述する通信処理代替部125からの指令に応じて、稼動系の第1ネットワーク主要処理部4の構成の故障を検出した場合に、待機系の第2ネットワーク主要処理部104を稼動系として設定し、当該第2ネットワーク主要処理部104のTCPオフロードエンジン141に通信データを送信する。
また、上記同一処理実行部22(同一処理実行手段)は、実施例1と同様に、上述した通信データ処理部21にてTCPオフロードエンジン41にダミーデータを送信した際に、当該ダミーデータに対する通信処理を実行する。つまり、ネットワーク装置3内のTCPオフロードエンジン41、IP処理部42、イーサネット処理部43、でそれぞれ実行される処理と同一の処理を実行し、各段階(TCP、IP、イーサネット)における処理結果を各段階でのヘッダ付きデータとして生成する。
また、上記処理結果取得部123は、メモリ5に記憶された第1及び第2のネットワーク主要処理部4,104の各処理部41,42,43,141,142,143による処理結果を全て取得する。そして、上記同一処理実行部22にて実行した処理結果と共に、処理結果比較部124に渡す。
また、上記処理結果比較部124(処理結果比較手段)は、メモリ5から取得した稼動系である第1ネットワーク主要処理部4の各処理部41,42,43による処理結果と、OS管理部2による各処理結果と、を比較し、比較結果を、通信処理代替部125に通知する。また、この処理結果比較部124は、メモリ5から取得した待機系である第2ネットワーク主要処理部104の各処理部141,142,143による処理結果と、OS管理部2による各処理結果と、を比較し、比較結果を、通信処理代替部125に通知する。
そして、上記通信処理代替部125は、上述同様に、まず、稼動系である第1ネットワーク主要処理部4の各処理部41,42,43の処理結果とOS管理部2による各処理結果との比較結果に基づいて、第1ネットワーク主要処理部4内の処理部41,42,43が故障している、と判断する。例えば、IP処理部42による処理結果と、OS管理部2によるIP処理の結果とに差異がある場合に、当該IP処理部42が故障している(障害が発生している)と判断する。また、上記通信処理代替部125は、待機系である第2ネットワーク主要処理部104の各処理部141,142,143の処理結果とOS管理部2による各処理結果との比較結果に基づいて、第2ネットワーク主要処理部104が正常であるか否かを調べる。そして、正常である場合には、この第2ネットワーク主要処理部104を稼動系とする旨の指令を通信データ処理部21に発する。これにより、通信データ処理部121からは、その後の通信データは第2ネットワーク主要処理部104のTCPオフロードエンジン141に送信されることとなる。なお、比較結果から、第2ネットワーク主要処理部104にも障害が発生していると判断できる場合には、リカバリーが困難な場合が多いため、ネットワーク装置3自体の動作を停止する。
[動作]
次に、上記構成のコンピュータ1の動作を、図9のシーケンス図を参照して説明する。なお、ここでは、稼動系のIP処理部42を使用していたが、稼働中に故障した場合を想定して説明する。
まず、上述した任意のタイミングで、OS管理部2は、ダミーの通信データをパス72及びパス75を経由して、ネットワーク装置3の稼動系である第1ネットワーク主要処理部4と、待機系である第2ネットワーク主要処理部104と、に対してそれぞれ送信する(ステップS21)。すると、第1、第2のネットワーク主要処理部4,104で、TCPオフロードエンジン41,141、IP処理部42,142、イーサネット処理部43,143、のそれぞれが、ダミーデータに対する処理を実行する(ステップS22)。そして、各処理部41,42,43,141,142,143による処理結果となるヘッダ付きデータを、バイパス回路71を介してメモリ5に保存する(ステップS3、処理結果取出工程)。
一方、上記ステップ2と並行して、OS管理部2はネットワーク装置3に送信したダミーデータに対して、TCP、IP、イーサネットの、各段階における処理を実行し、それぞれヘッダ付きデータを生成する(ステップS24)。つまり、正常な場合における第1及び第2ネットワーク主要処理部4,104が備えるTCPオフロードエンジン41,141、IP処理部42,142、イーサネット処理部43,143による各処理結果を、OS管理部2にて生成する(同一処理実行工程)。
続いて、OS処理部2は、メモリ5から、第1及び第2のネットワーク主要処理部4,104のTCPオフロードエンジン41,141、IP処理部42,142、イーサネット処理部43,143、が実際に処理したヘッダ付きデータを取得する(ステップS25、処理結果取得工程)。さらに、OS管理部2にてTCP、IP、イーサネット処理を実行して生成した処理結果であるヘッダ付きデータを読み出して、それぞれ対応する処理同士の処理結果であるヘッダ付きデータを比較する(ステップS26、処理結果比較工程)。
このとき、まずは、稼動系である第1ネットワーク主要処理部4の各処理部41,42,43の処理結果と、OS管理部2による処理結果とに差分があるかを調べる。そして、差分がある場合には、いずれかの処理部41,42,43が故障していると判断できる(ステップS27)。そして、稼動系が故障している場合には、続いて、待機系である第2ネットワーク主要処理部104が正常であるかをチェックするために、その各処理部141,142,143の処理結果と、OS管理部2による処理結果とに差分があるかを調べる。このとき、待機系の第2ネットワーク主要処理部104の比較結果に差分がない場合には、正常であると判断し、第2ネットワーク主要処理部104を稼動系に設定し、第1ネットワーク主要処理部4を待機系に設定する。つまり、OS管理部2は、通信制御時に、パス75経由で、通信パケットを第2ネットワーク主要処理部104のTCPオフロードエンジン141に送信する。つまり、故障した第1ネットワーク主要処理部4は使用せずに、正常な第2ネットワーク主要処理部104の各処理部141,142,143を使用して通信処理を行う。これにより、通信ネットワークに対する通信処理を継続して実行することができる。
なお、待機系の第2ネットワーク主要処理部104の比較結果に差分がある場合には、当該第2ネットワーク主要処理部104も故障していると考えられ、リカバリー不可であるため、ネットワーク装置3全体を停止する。その後、上述したステップS27,28の処理結果や、ネットワーク装置3の停止の旨を、表示手段12に表示する。
以上のように、本実施例によると、仮に第1ネットワーク主要処理部4の一部に障害が生じた場合であっても、同一構成の第2ネットワーク主要処理部104に処理を代替するため、一時的なネットワーク装置の停止を抑制でき、可用性の向上を図り、コンピュータ1の信頼性の向上を図ることができる。特に、第2ネットワーク主要処理部104の故障についても、第1ネットワーク主要処理部4の診断と同時に診断しているため、より迅速に、かつ、高い信頼性を有する。
本発明は、継続したネットワーク接続を必要とされるコンピュータに好適であり、産業上の利用可能性を有する。
実施例1におけるコンピュータの構成を示すブロック図である。 実施例1におけるコンピュータの構成を示すブロック図である。 実施例1におけるコンピュータの動作を示すシーケンス図である。 実施例2におけるコンピュータの構成を示すブロック図である。 実施例2におけるコンピュータの構成を示すブロック図である。 実施例2におけるコンピュータの動作を示すシーケンス図である。 実施例3におけるコンピュータの構成を示すブロック図である。 実施例3におけるコンピュータの構成を示すブロック図である。 実施例3におけるコンピュータの動作を示すシーケンス図である。
符号の説明
1 コンピュータ
2 OS管理部
3 ネットワーク装置
4 ネットワーク主要処理部(第1ネットワーク主要処理部)
5 メモリ
6 ネットワークインターフェース
10 通信ネットワーク
11 操作手段
12 表示手段
21 通信データ処理部
22 同一処理実行部
23 処理結果取得部
24 処理結果比較部
25 通信処理代替部
26 比較結果取得部
41,141 TCPオフロードエンジン
42,142 IP処理部
43,143 イーサネット処理部
51 フレーム比較部
104 第2ネットワーク主要処理部

Claims (18)

  1. ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えたコンピュータであって、
    前記ネットワーク処理部による通信データの処理結果を取り出す処理結果取出手段と、前記通信制御処理部にて前記ネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行手段と、前記ネットワーク処理部による処理結果と前記通信制御処理部による処理結果とを比較する処理結果比較手段と、この比較結果に基づいて前記ネットワーク処理部の少なくとも一部の処理を代替する通信処理代替手段と、を備えた、
    ことを特徴とするコンピュータ。
  2. 前記ネットワーク処理部は、通信データを処理する複数の処理部を備え、
    前記処理結果取出手段は、前記ネットワーク処理部が備えた複数の処理部のうち少なくとも1の処理部の処理結果を取り出すと共に、
    前記同一処理実行手段は、少なくとも前記処理結果取出手段にて処理結果を取り出す前記ネットワーク処理部が備えた処理部と同一の処理を実行し、
    前記通信処理代替手段は、前記処理結果比較手段による比較結果に基づいて前記ネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、
    ことを特徴とする請求項1記載のコンピュータ。
  3. 前記通信処理代替手段は、前記通信制御処理部が前記障害部位による通信データの処理を実行して、この処理済データを前記ネットワーク処理部に送信する、
    ことを特徴とする請求項2記載のコンピュータ。
  4. 前記通信処理代替手段は、前記ネットワーク処理部内に設けられた前記障害部位の次に通信データの処理を実行する処理部に対して前記処理済データを送信する、
    ことを特徴とする請求項3記載のコンピュータ。
  5. 前記ネットワーク処理部は、TCPオフロードエンジンと、IP処理部と、イーサネット処理部と、を備え、
    前記処理結果比較手段は、前記ネットワーク処理部のTCPオフロードエンジンによる処理結果と、前記通信制御処理部によるTCP処理結果とを比較し、
    前記通信処理代替手段は、比較結果に基づいて前記TCPオフロードエンジンの障害を検出して、通信データにTCP処理を施した前記処理済データを前記ネットワーク処理部のIP処理部に送信する、
    ことを特徴とする請求項3又は4記載のコンピュータ。
  6. 前記ネットワーク処理部及び前記通信制御処理部にて処理結果を比較するために処理する通信データは、ダミーデータである、
    ことを特徴とする請求項1,2,3,4又は5記載のコンピュータ。
  7. 前記ネットワーク処理部と同一構成の他のネットワーク処理部を備え、
    前記通信処理代替手段は、前記ネットワークに対して送受信する通信データの処理を前記他のネットワーク処理部にて行うよう設定する、
    ことを特徴とする請求項1又は2記載のコンピュータ。
  8. 前記処理結果取出手段は、前記他のネットワーク処理部による通信データの処理結果を取り出し、
    前記処理結果比較手段は、前記ネットワーク処理部による処理結果と前記通信制御処理部による処理結果とを比較すると共に、前記他のネットワーク処理部による処理結果と前記通信制御処理部による処理結果とを比較する、
    ことを特徴とする請求項7記載のコンピュータ。
  9. 前記ネットワーク処理部及び前記他のネットワーク処理部は、TCPオフロードエンジンと、IP処理部と、イーサネット処理部と、をそれぞれ備えた、
    ことを特徴とする請求項8記載のコンピュータ。
  10. 前記ネットワーク処理部、前記他のネットワーク処理部、及び、前記通信制御処理部にて処理結果を比較するために処理する通信データは、ダミーデータである、
    ことを特徴とする請求項7,8又は9記載のコンピュータ。
  11. ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えたコンピュータに、
    前記ネットワーク処理部による通信データの処理結果を取り出す処理結果取出手段と、前記通信制御処理部にて前記ネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行手段と、前記ネットワーク処理部による処理結果と前記通信制御処理部による処理結果とを比較して当該比較結果に基づいて前記ネットワーク処理部の少なくとも一部の処理を代替する通信処理代替手段と、
    を実現させるためのプログラム。
  12. 前記処理結果取出手段は、前記ネットワーク処理部が有する通信データを処理する複数の処理部のうち少なくとも1の処理部の処理結果を取り出すると共に、
    前記同一処理実行手段は、少なくとも前記処理結果取出手段にて処理結果を取り出す前記前記ネットワーク処理部が備えた処理部と同一の処理を実行し、
    前記通信処理代替手段は、前記比較結果に基づいて前記ネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、
    ことを特徴とする請求項11記載のプログラム。
  13. 前記通信処理代替手段は、前記通信制御処理部が前記障害部位による通信データの処理を実行して、この処理済データを前記ネットワーク処理部に送信する、
    ことを特徴とする請求項12記載のプログラム。
  14. 前記通信処理代替手段は、前記ネットワークに対して送受信する通信データの処理を、前記ネットワーク処理部と同一構成の他のネットワーク処理部にて行うよう設定する、
    ことを特徴とする請求項12記載のプログラム。
  15. ネットワークに対して送受信する通信データを処理するネットワーク処理部と、このネットワーク処理部を介した通信動作を制御する通信制御処理部と、を備えたコンピュータにて通信処理を行う方法であって、
    前記ネットワーク処理部による通信データの処理結果を取り出す処理結果取出工程と、
    この処理結果取出工程に前後して、前記通信制御処理部にて前記ネットワーク処理部による処理と同一の通信データの処理を実行する同一処理実行工程と、
    前記ネットワーク処理部による処理結果と前記通信制御処理部による処理結果とを比較する処理結果比較工程と、
    前記比較結果に基づいて前記ネットワーク処理部の少なくとも一部の処理を代替する通信処理代替工程と、
    を有することを特徴とする通信処理方法。
  16. 前記処理結果取出工程は、前記ネットワーク処理部が有する通信データを処理する複数の処理部のうち少なくとも1の処理部の処理結果を取り出すると共に、
    前記同一処理実行工程は、少なくとも前記処理結果取出工程にて処理結果を取り出す前記ネットワーク処理部が備えた処理部と同一の処理を実行し、
    前記通信処理代替工程は、前記比較結果に基づいて前記ネットワーク処理部が備えた処理部のうち障害部位を特定し、この障害部位による通信データの処理を代替する、
    ことを特徴とする請求項15記載の通信処理方法。
  17. 前記通信処理代替工程は、前記通信制御処理部が前記障害部位による通信データの処理を実行して、この処理済データを前記ネットワーク処理部に送信する、
    ことを特徴とする請求項16記載の通信処理方法。
  18. 前記通信処理代替工程は、前記ネットワークに対して送受信する通信データの処理を、前記ネットワーク処理部と同一構成の他のネットワーク処理部にて行うよう設定する、
    ことを特徴とする請求項16記載の通信処理方法。
JP2007248667A 2007-09-26 2007-09-26 コンピュータ及び通信処理方法 Expired - Fee Related JP4935597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007248667A JP4935597B2 (ja) 2007-09-26 2007-09-26 コンピュータ及び通信処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007248667A JP4935597B2 (ja) 2007-09-26 2007-09-26 コンピュータ及び通信処理方法

Publications (2)

Publication Number Publication Date
JP2009081609A JP2009081609A (ja) 2009-04-16
JP4935597B2 true JP4935597B2 (ja) 2012-05-23

Family

ID=40656050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007248667A Expired - Fee Related JP4935597B2 (ja) 2007-09-26 2007-09-26 コンピュータ及び通信処理方法

Country Status (1)

Country Link
JP (1) JP4935597B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6237074B2 (ja) * 2013-10-02 2017-11-29 日本電気株式会社 通信装置および障害検出方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01198148A (ja) * 1988-02-02 1989-08-09 Nec Corp 両方向通信テスト用のエミュレータ
JP2675814B2 (ja) * 1988-05-16 1997-11-12 キヤノン株式会社 通信装置
JPH09106378A (ja) * 1995-10-12 1997-04-22 Hitachi Ltd インタフェース方法
JP3711879B2 (ja) * 2001-03-09 2005-11-02 三菱電機株式会社 ネットワーク障害解析装置およびネットワーク障害解析方法

Also Published As

Publication number Publication date
JP2009081609A (ja) 2009-04-16

Similar Documents

Publication Publication Date Title
CN109286529B (zh) 一种恢复RabbitMQ网络分区的方法及系统
US11221612B2 (en) System and method of communicating data over high availability industrial control systems
JP5272263B2 (ja) ロードバランス型ネットワーク環境におけるインテリジェントフェイルオーバー
CN108983682B (zh) 一种基于双总线的冗余表决控制方法
JP4935597B2 (ja) コンピュータ及び通信処理方法
US10203973B2 (en) High availability service virtual machine in virtualization environment
JP4344333B2 (ja) パケット転送装置、パケット転送ネットワークシステムおよびパケット転送方法
EP2012492A1 (en) Communication system, IPsec tunnel termination device, and IPsec tunnel communication continuation method used for them
CN105553735A (zh) 一种堆叠系统故障处理方法、设备及堆叠系统
JP4442528B2 (ja) 冗長構成装置、冗長構成システム、バージョンアップ可能化方法、及びバージョンアップ可能化プログラム
JP6351076B2 (ja) 保守装置、ネットワークシステム及びその保守方法
JP5464886B2 (ja) 計算機システム
JP4419094B2 (ja) 情報処理装置および方法、並びにプログラム
JP4984772B2 (ja) ネットワーク接続型分析装置制御システム
US10491544B2 (en) Consistency control of a logical path passing through a relay device
JP5949711B2 (ja) 情報処理装置、情報処理装置の処理継続方法
JP7120678B1 (ja) 通信処理装置、通信処理システム、障害通知方法及び障害通知プログラム
US11461157B2 (en) Peripheral device, method, and recording medium
JP6653250B2 (ja) 計算機システム
JP5682007B2 (ja) 電子機器装置
JP2018160030A (ja) 制御装置、制御方法、及び、フォールトトレラント装置
JP5370222B2 (ja) 冗長構成を有する通信装置及びその稼働待機切替方法
EP2432152B1 (en) Method and apparatus for switching the main/standby single board
JP2006146685A (ja) マルチノードシステム及び障害復旧方法
JP2017054347A (ja) コンピュータシステムとコンピュータおよびネットワーク接続回復方法とプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100617

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees