JP7417773B1 - Network interface card and transmission performance monitoring method - Google Patents
Network interface card and transmission performance monitoring method Download PDFInfo
- Publication number
- JP7417773B1 JP7417773B1 JP2023012770A JP2023012770A JP7417773B1 JP 7417773 B1 JP7417773 B1 JP 7417773B1 JP 2023012770 A JP2023012770 A JP 2023012770A JP 2023012770 A JP2023012770 A JP 2023012770A JP 7417773 B1 JP7417773 B1 JP 7417773B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- optical
- server
- network interface
- interface card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 114
- 230000005540 biological transmission Effects 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 14
- 230000003287 optical effect Effects 0.000 claims abstract description 171
- 238000004891 communication Methods 0.000 claims abstract description 36
- 230000005856 abnormality Effects 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 abstract description 11
- 238000001152 differential interference contrast microscopy Methods 0.000 description 68
- UPPPRUGHDBCPEF-UHFFFAOYSA-N Nic 17 Natural products CC(C(O)CC(=O)C)c1ccc2C3C4OC4C5(O)CC=CC(=O)C5(C)C3CCc2c1 UPPPRUGHDBCPEF-UHFFFAOYSA-N 0.000 description 7
- 230000007423 decrease Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
Abstract
【課題】 光出力信号の安定性に関する、NICにおけるデータ送信の性能を監視することを可能にする技術を提供する。【解決手段】 ネットワークインターフェースカードは、サーバ内部のバスインターフェースを介して、サーバの、外部サーバとのデータの送受信を制御するコントローラと、コントローラと接続され、コントローラから入力されるデータを電気信号から光信号に変換し、変換したデータを、ネットワークに接続される光分岐回路に出力する通信用光モジュールと、光分岐回路により分岐された折り返しデータを、光信号から電気信号に変換する監視用光モジュールと、監視用光モジュールから入力された折り返しデータの正常性に基づいて、データ送信の性能を監視する監視部と、を備え、監視部は、データ送信の性能が低下した場合、サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う。【選択図】 図1A technique is provided that allows monitoring the performance of data transmission in a NIC with respect to the stability of an optical output signal. [Solution] A network interface card is connected to a controller that controls the transmission and reception of data between the server and an external server via a bus interface inside the server, and is connected to the controller, and converts data input from the controller into electrical signals and optical signals. A communication optical module that converts the data into a signal and outputs the converted data to an optical branch circuit connected to the network, and a monitoring optical module that converts the returned data branched by the optical branch circuit from an optical signal to an electrical signal. and a monitoring unit that monitors data transmission performance based on the normality of return data input from the monitoring optical module. Notify a system or application. [Selection diagram] Figure 1
Description
本開示は、ネットワークインターフェースカードおよび送信性能監視方法に関する。 The present disclosure relates to a network interface card and a transmission performance monitoring method.
サーバは、その利用において、支障がないことを求められる場合がある。しかし、そのサーバに備えられたネットワークインターフェースカード(以下、NICと記載する)の性能低下が発生したまま利用が継続されてしまい、大きな問題となってしまうことがある。 Servers may be required to be used without any problems. However, the network interface card (hereinafter referred to as NIC) provided in the server may continue to be used with performance degradation occurring, resulting in a serious problem.
特許文献1には、LANに接続するインターフェースの内部に備えられた折り返し専用の回路を用いて、通信経路の疎通を確認するためのパケットにより送信の異常を検出する方法が記載されている。 Patent Document 1 describes a method of detecting abnormality in transmission using a packet for confirming the communication path by using a loop-back dedicated circuit provided inside an interface connected to a LAN.
しかしながら、特許文献1に記載の方法では、NIC内部で発生する異常は検出できるが、実際にサーバ外部との通信に利用する光モジュールにおける、光出力信号が安定しないという異常の有無は検出できない。 However, although the method described in Patent Document 1 can detect an abnormality that occurs inside the NIC, it cannot detect the presence or absence of an abnormality in which the optical output signal is unstable in the optical module actually used for communication with the outside of the server.
本開示の目的の一例は、光出力信号の安定性に関する、NICにおけるデータ送信の性能を監視することを可能にする技術を提供することにある。 One example objective of the present disclosure is to provide a technique that allows monitoring the performance of data transmission in a NIC with respect to the stability of the optical output signal.
本開示の一態様におけるネットワークインターフェースカードは、サーバ内部のバスインターフェースを介して、サーバの、外部サーバとのデータの送受信を制御するコントローラと、コントローラと接続され、コントローラから入力されるデータを電気信号から光信号に変換し、変換したデータを、ネットワークに接続される光分岐回路に出力する通信用光モジュールと、光分岐回路により分岐された折り返しデータを、光信号から電気信号に変換する監視用光モジュールと、監視用光モジュールから入力された折り返しデータの正常性を監視することにより、データ送信の性能を監視する監視部と、を備え、監視部は、データ送信の性能が低下した場合、サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う。 A network interface card in one aspect of the present disclosure is connected to a controller that controls transmission and reception of data between the server and an external server via a bus interface inside the server, and is connected to the controller to transmit data input from the controller into electrical signals. A communication optical module that converts the data into an optical signal and outputs the converted data to an optical branch circuit connected to the network, and a monitoring module that converts the return data branched by the optical branch circuit from an optical signal to an electrical signal. an optical module; and a monitoring unit that monitors data transmission performance by monitoring the normality of return data input from the monitoring optical module, and the monitoring unit is configured to: Notify the operating system or application inside the server.
本開示の一態様における送信性能監視方法は、サーバに備えられ、サーバとネットワークとの間におけるデータの送受信を行うネットワークインターフェースカードにおいて、コンピュータが、ネットワークインターフェースカードに備えられたコントローラが出力し、通信用光モジュールにより光信号に変換され、さらに、監視用光モジュールにより電気信号に変換されて入力された折り返しデータの正常性を監視することにより、データ送信の性能を監視し、監視の結果、データ送信の性能が低下した場合、サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う。 In a transmission performance monitoring method according to an aspect of the present disclosure, in a network interface card that is included in a server and that transmits and receives data between the server and a network, a computer outputs an output from a controller included in the network interface card, and a communication The data transmission performance is monitored by monitoring the normality of input return data that is converted into an optical signal by the monitoring optical module and then converted into an electrical signal by the monitoring optical module. If transmission performance deteriorates, a notification is sent to the server's internal operating system or application.
本開示による効果の一例は、光出力信号の安定性に関する、NICにおけるデータ送信の性能を監視することができることである。 One example of the benefits of the present disclosure is that the performance of data transmission at the NIC can be monitored with respect to the stability of the optical output signal.
本開示の実施形態について図面を参照して詳細に説明する。 Embodiments of the present disclosure will be described in detail with reference to the drawings.
[実施形態]
図1は、実施形態におけるNIC100と光分岐回路200とを備えるネットワークインターフェース部の構成の一例を示すブロック図である。図1を参照すると、NIC100は、コントローラ101と、通信用光モジュール102と、監視用光モジュール103と、監視部104と、を備える。また、NIC100の通信用光モジュール102および監視用光モジュール103は、光分岐回路200と通信可能に接続される。また、光分岐回路200は、ネットワーク300と通信可能に接続される。
[Embodiment]
FIG. 1 is a block diagram illustrating an example of the configuration of a network interface section including an
NIC100は、ネットワーク関連機器とネットワーク間の通信を実現するための装置である。本開示において、NIC100は、ネットワーク関連機器であるサーバに備えられる。 The NIC 100 is a device for realizing communication between network-related devices and a network. In the present disclosure, the NIC 100 is provided in a server that is a network-related device.
図2は、実施形態におけるNIC100を含むサーバ10および接続先の機器を含む通信システムの一例を示すブロック図である。図2を参照すると、サーバ10は、メモリ11、メモリ制御部12、プロセッサ13、入出力制御部14、入出力カードスロット15、システムバス18、およびバスインターフェース19を備える。また、入出力カードスロット15には、現用系NIC16および予備系NIC17が挿入される。また、サーバ10は、ネットワークスイッチ30と通信可能に接続される。ここで、サーバ10の現用系NIC16は、光分岐回路200を介してネットワークスイッチ30と接続される。また、サーバ10の予備系NICは、ネットワークスイッチ30と接続される。さらに、ネットワークスイッチ30は、他のサーバ40と通信可能に接続される。ネットワークスイッチ30は、複数のサーバなどの機器を接続する。ネットワーク300は、ネットワークスイッチ30とネットワークスイッチ30に接続されるサーバ10および複数の他のサーバ40が接続され、相互にデータの伝送を行う。
FIG. 2 is a block diagram illustrating an example of a communication system including the
図2において、現用系NIC16は、図1のNIC100である。また、予備系NIC17は、NIC100であってもよいし、周知のNICであってもよい。また、予備系NIC17は、現用系NIC16と同様に、光分岐回路200を介してネットワークスイッチ30と接続されてもよい。
In FIG. 2, the
図2のサーバ10の他の構成について説明する。サーバ10において、メモリ11は、データを格納する。メモリ11は、RAM(Random Access Memory)やROM(Read Only Memory)であってよい。メモリ制御部12は、メモリ11を管理する。メモリ制御部12は、例えば、プロセッサ13の要求により、メモリ11の一部の割り当てや、割り当てた一部のメモリ11の解放を行う。プロセッサ13は、プログラムに記述された情報処理を行う。プログラムは、例えば、オペレーティングシステム(以下、OS(Operating System)とも記載する)やアプリケーションなどである。入出力制御部14は、プロセッサから入出力命令を受けると、サーバにデータを入出力する入出力装置との間でデータの入出力を行う。入出力カードスロット15は、様々な入出力装置と接続するための拡張機器の差込口を備える。上述のように、サーバ10における入出力カードスロット15には、現用系NIC16および予備系NIC17が挿入される。システムバス18は、プロセッサ13と他の構成を接続するデータ伝送路である。バスインターフェース19は、入出力制御部14と、現用系NIC16および予備系NIC17とをそれぞれ接続するデータ伝送路である。
Another configuration of the
図2において、サーバ10は、NICとして、現用系NIC16および予備系NIC17を備える。このように、装置を複数用意する構成は、冗長構成と呼ばれる。本開示におけるサーバ10は、NICが冗長構成であることによって、片方のNICが故障しても、もう一方のNICを利用してサーバ10の運用を継続しながら、故障したNICの修理や交換を行うことが可能である。このような構成は、ミッションクリティカルな、すなわち、停止や誤作動があってはならないようなサーバなどにおいて、用いられる。
In FIG. 2, the
ここまで、図2のサーバ10について説明したが、NIC100が備えられるサーバの構成はこの限りでない。
Up to this point, the
図1および図2を参照し、NIC100の一般的な機能について説明する。図1および図2において、NIC100は、サーバ10からバスインターフェース19を介して入力されたデータを、ネットワーク300に送信する。例えば、NIC100は、サーバ10からバスインターフェース19を介して入力されたデータを、光分岐回路200およびネットワークスイッチ30を経由して、および他のサーバ40に送信する。また、NIC100は、ネットワーク300から、データを受信する。例えば、NIC100は、ネットワークスイッチ30および光分岐回路200を介して、他のサーバ40が送信したデータを受信し、サーバ10に入力する。
The general functions of the NIC 100 will be described with reference to FIGS. 1 and 2. In FIGS. 1 and 2, the NIC 100 transmits data input from the
次に、本実施形態のNIC100の各構成について詳細に説明する。
Next, each configuration of the
コントローラ101は、サーバ10内部のバスインターフェース19を介して、サーバ10の、外部のサーバ40とのデータの送受信を制御する。NIC100がLANインターフェースカードである場合、コントローラ101は、LANコントローラとも呼ばれる。
The
図1において、通信用光モジュール102は、電気信号から光信号に、および、光信号から電気信号にデータを変換する装置である。通信用光モジュール102は、コントローラ101と接続され、コントローラ101から入力されるデータを電気信号から光信号に変換する。そして、通信用光モジュール102は、変換したデータを、ネットワークに接続される光分岐回路200に出力する。光分岐回路200については後述する。
In FIG. 1, a communication
通信用光モジュール102は、例えば、SFP(Small Form-Factor Pluggable)モジュール、SFP+モジュールなどであるが、これらの例に限られない。通信用光モジュール102には、データを電気信号から光信号に変換する際に、光出力信号が安定しないという、特有の故障が発生する可能性がある。光信号が安定しないことは、光通信を含む伝送において信号波形の遷移を多数重ね合わせて表示したアイパターンが乱れることにより可視化される。
The communication
ここで、光分岐回路200は、入力された光信号を物理的に分岐し、分岐した光信号をそれぞれ出力する回路である。光分岐回路200は、サーバ10のNIC100、およびネットワーク300に接続される。より具体的には、光分岐回路200は、NIC100の通信用光モジュール102および監視用光モジュール103と、光インターフェース20によりそれぞれ接続される。また、光分岐回路200は、他のサーバ40と接続されるネットワークスイッチ30と接続される。
Here, the optical branching
光分岐回路200は、通信用光モジュール102から入力された光信号を分岐する。光分岐回路200は、分岐した光信号の一方を、ネットワーク300に含まれる接続先、例えば、ネットワークスイッチ30に出力する。そして、光分岐回路200は、分岐した光信号のもう一方を、監視用光モジュール103に出力する。以下の説明において、サーバ10からネットワーク300や他のサーバ40に送信されるデータを送信データ、光分岐回路200が分岐して監視用光モジュール103に出力されるデータを折り返しデータと呼ぶ。
The optical branching
監視用光モジュール103は、光信号から電気信号にデータを変換する装置である。監視用光モジュール103は、光分岐回路200と接続され、光分岐回路200により分岐された折り返しデータを、光信号から電気信号に変換する。監視用光モジュール103は、電気信号に変換した折り返しデータを、監視部104に出力する。
The monitoring
なお、本開示において、通信用光モジュール、光分岐回路、監視用光モジュールなどに含まれるRx、Txは、それぞれ、受信コネクタ、送信コネクタである。 Note that in the present disclosure, Rx and Tx included in a communication optical module, an optical branch circuit, a monitoring optical module, etc. are a reception connector and a transmission connector, respectively.
監視部104は、データ送信の性能を監視する。例えば、監視部104は、データ送信の性能が低下していることを判定する。より具体的には、監視部104は、NIC100のデータ送信の性能を監視する。監視部104は、データ送信の性能の監視を、監視用光モジュール103から入力された折り返しデータの正常性に基づいて、行う。監視部104による、折り返しデータの正常性の監視、および、データ送信の性能の監視については、後述する。また、監視部104は、データ送信の性能が低下した場合、コントローラ101を介してサーバ10内部のオペレーティングシステムまたはアプリケーションに対して、データ送信の性能が低下したことに関する通知を行う。この通知については、後述する。
The
まず、監視部104による、データ送信の性能の監視について説明する。監視部104は、折り返しデータの誤り検出符号から、所定の方法により算出された異常の検出に関する値に基づき、データ送信の性能を監視する。誤り検出符号とは、データ通信においてデータに誤りが生じていることを検出可能に構成されたである。例えば、データの送信側は、データの送信時に、誤り検出符号として、送信するデータから一定の手順で算出したデータを送信するデータに付加する。そして、データの受信側は、受信したデータに付加された誤り検出符号により誤りを検出する。監視部104は、例えば、折り返しデータのフレームに付加された誤り検出符号と、データ送信時に用いられる誤り検出演算と同じ手法にて折り返しデータのフレームデータから算出された値とを比較することにより、折り返しデータの誤りを検出してもよい。誤り検出符号は、例えば、FCS(Frame Check Sequence)またはCRC(Cyclic Redundancy Code)であるが、これらの例に限られない。
First, monitoring of data transmission performance by the
監視部104は、誤り検出符号により折り返しデータに異常があることを検出した場合、第1エラー数として、異常が検出された回数をカウントする。監視部104は、送信データ数に対する第1エラー数が閾値以上である場合、データ送信の性能が低下したと判定してよい。
When the
また、監視部104は、折り返しデータの異常に加え、コントローラ101に入力された送信データの異常を加味してデータ送信の性能を監視してもよい。ここで、コントローラ101に入力された送信データの異常がカウントされた第2エラー数とする。第2エラー数は、コントローラ101により監視されてもよいし、他に追加された構成によって監視されてもよい。この場合、監視部104は、第1エラー数と、第2エラー数と、の合計エラー数を算出し、送信データ数に対する前記合計エラー数が閾値以上である場合、データ送信の性能が低下したと判定してよい。
Furthermore, the
なお、データ送信の性能が低下したと判定する閾値は、あらかじめ設定されればよい。閾値は、例えば、0.025%である。閾値は、この例に限られず、適宜定められればよい。 Note that the threshold value for determining that data transmission performance has deteriorated may be set in advance. The threshold value is, for example, 0.025%. The threshold value is not limited to this example, and may be determined as appropriate.
次に、監視部104による、データ送信の性能が低下した場合における、データ送信の性能が低下したことに関する通知について説明する。上述のように、監視部104は、データ送信の性能が低下した場合、コントローラ101を介して、サーバ10内部のオペレーティングシステムまたはアプリケーションに対して、データ送信の性能が低下したことに関する通知を行う。これにより、サーバ10は、NIC100のデータ送信の性能の低下を検出し、これに応じて必要な対応を行うことができる。ここで、必要な対応とは、冗長構成におけるNICの切り替え、または、管理者等への修理や交換が必要であることの通知などである。また、例えば、監視部104は、データ送信の性能が低下した場合、コントローラ101を介して、サーバ10内部のオペレーティングシステムまたはアプリケーションに対して、NICの切り替えが必要であることを示す通知を行ってもよい。NICの切り替えとは、現在利用しているNIC(例えば現用系NIC16)から、予備であるNIC(例えば予備系NIC17)に利用するNICを切り替えることである。
Next, a notification regarding a decrease in data transmission performance by the
また、監視部104は、データ送信の性能が低下した場合、NIC100によるデータの送受信を停止させてもよい。例えば、監視部104は、コントローラ101のデータ送信を停止し、かつ、サーバ10内部に備えられるネットワークアダプタドライバからの送信要求に対しエラーリターンを返すことにより、ネットワークインターフェースカードによるデータの送信を停止する。
Further, the
以上のように構成されたNIC100と周辺装置による、データ送信性能監視の動作について、図3のシーケンス図を参照して説明する。
The operation of data transmission performance monitoring by the
図3に示すように、まず、通信用光モジュール102は、コントローラ101から入力された送信データ(電気信号)を、電気信号から光信号に変換する(ステップS101)。そして、通信用光モジュール102は、変換した送信データ(光信号)を光分岐回路200へ出力する(ステップS102)。
As shown in FIG. 3, first, the communication
次に、光分岐回路200は、通信用光モジュール102から入力された送信データ(光信号)を分岐する(ステップS103)。光分岐回路200は、分岐した光信号の一方を送信データ(光信号)としてネットワーク300へ出力する(ステップS104)。そして、光分岐回路200は、分岐した光信号の他方を、折り返しデータ(光信号)として、監視用光モジュール103に出力する(ステップS105)。
Next, the
次に、監視用光モジュール103は、入力された折り返しデータ(光信号)を、光信号から電気信号に変換する(ステップS106)。そして、監視用光モジュール103は、変換した折り返しデータ(電気信号)を監視部104へ出力する(ステップS107)。
Next, the monitoring
そして、監視部104は、監視用光モジュール103から入力された折り返しデータ(電気信号)の正常性を監視する(ステップS108)。ステップS108以降の監視部104の動作については、図4のフローチャートを参照して後述する。
Then, the
以上で、NIC100と周辺装置は、一連の動作を終了する。これらの一連の動作は、サーバ10によるデータ送信に対して逐次行われてよい。
With this, the
次に、図4のフローチャートを参照して、監視部104の動作について説明する。
Next, the operation of the
監視部104は、まず、監視用光モジュール103から折り返しデータ(電気信号)を入力される(ステップS201)。
The
監視部104は、折り返しデータ(電気信号)に異常があるか判定する(ステップS202)。監視部104は、例えば、誤り検出符号であるFCSやCRCを用いて異常があるか判定する。
The
折り返しデータ(電気信号)に異常がある場合(ステップS202:Yes)、監視部104は、エラーカウンタ登録を行うことにより、第1エラー数をカウントする(ステップS203)。折り返しデータ(電気信号)に異常がない場合(ステップS202:No)、監視部104は、ステップS201の動作に戻る。
If there is an abnormality in the return data (electrical signal) (step S202: Yes), the
そして、監視部104は、データの異常発生の割合が閾値を超えるか判定する(ステップS204)。データの異常発生の割合は、上述のように、送信データ数に対する第1エラー数、または、送信データ数に対する、第1エラー数と第2エラー数の合計エラー数であってよい。
Then, the
監視部104は、データの異常発生の割合が閾値を超えると判定された場合(ステップS204:Yes)、NIC100のデータ送信の性能が低下したと判断し、サーバ10のオペレーティングシステムやアプリケーションに通知を行う(ステップS205)。また、データの異常発生の割合が閾値を超えると判定された場合、監視部104は、上述のように、NIC100によるデータの送受信を停止してもよい。また、データの異常発生の割合が閾値を超えると判定された場合(ステップS204:No)、監視部104は、ステップS201の動作に戻る。
If the
以上で、監視部104は、一連の動作を終了する。
With this, the
上述した本実施形態におけるNICは、コントローラ、通信用光モジュール、監視用光モジュール、および監視部を備える。通信用光モジュールと監視用光モジュールは、それぞれ光分岐回路に接続される。通信用光モジュールがサーバの送信データを電気信号から光信号に変換し、変換した光信号を光分岐回路に入力する。光分岐回路により分岐された折り返しデータである光信号が、監視用光モジュールに入力される。監視用光モジュールは、折り返しデータを光信号から電気信号に変換し、監視部に入力する。そして、監視部は、折り返しデータの正常性を監視することにより、データ送信の性能を監視する。 The NIC in this embodiment described above includes a controller, a communication optical module, a monitoring optical module, and a monitoring section. The communication optical module and the monitoring optical module are each connected to an optical branch circuit. The communication optical module converts the server's transmission data from an electrical signal to an optical signal, and inputs the converted optical signal to the optical branch circuit. The optical signal, which is the return data branched by the optical branch circuit, is input to the monitoring optical module. The monitoring optical module converts the return data from an optical signal to an electrical signal and inputs it to the monitoring section. The monitoring unit then monitors the data transmission performance by monitoring the normality of the return data.
その結果、本実施形態におけるNICは、NICにおいてデータ送信の性能を監視することができる。 As a result, the NIC in this embodiment can monitor data transmission performance in the NIC.
電気信号を光信号に変換する光モジュールを備えるNICは、光出力信号が安定しないという、光モジュール特有の故障が発生する場合がある。 In a NIC that includes an optical module that converts an electrical signal into an optical signal, a failure peculiar to the optical module may occur in which the optical output signal is unstable.
光出力信号が安定しない場合、サーバに備えられたNICから送信されるデータを受信する接続先、例えば、LAN(Local Area Network)スイッチでは、光の受信強度の低下によるリンクダウン(Link-down)検出はされない。サーバに備えられたNICから送信されるデータを受信する接続先では、受信したデータの異常が検出され、受信したデータは廃棄される。接続先で受信したデータの異常とは、例えば、FCS(Frame Check Sequence)エラーなどのbit化けである。そして、ネットワークスイッチの該当受信ポートが持つMIB(Management Information Base)のエラーカウントがカウントアップされることにより、受信したフレームの異常の履歴が残される。さらに、サーバ間の上位TCP(Transmission Control Protocol)層では、TCP/IP(Internet Protocol)ネットワークの仕様により、相手からの受信応答がない場合、フレームの再送によりリカバリされる。 If the optical output signal is unstable, the connection destination, such as a LAN (Local Area Network) switch that receives data transmitted from the NIC provided in the server, may go down due to a decrease in the optical reception strength. Not detected. At a connection destination that receives data transmitted from a NIC provided in a server, an abnormality in the received data is detected and the received data is discarded. An abnormality in the data received at the connection destination is, for example, a bit garbled such as an FCS (Frame Check Sequence) error. Then, the error count of the MIB (Management Information Base) of the corresponding reception port of the network switch is incremented, thereby leaving a history of abnormalities in the received frame. Further, in the upper TCP (Transmission Control Protocol) layer between servers, if there is no reception response from the other party, recovery is performed by retransmitting the frame according to the specifications of the TCP/IP (Internet Protocol) network.
しかし、この場合、サーバに備えられたNICでは、送信したデータが、接続先において異常検出および廃棄されていることを認識する手段がない。このため、サーバの上位アプリケーションソフトウエアは、通信性能低下が発生していることを認識できない。 However, in this case, the NIC provided in the server does not have a means to recognize that the transmitted data has been detected as abnormal and discarded at the connection destination. For this reason, the upper level application software of the server cannot recognize that communication performance has deteriorated.
これに対し、監視部は、通信用光モジュールで電気信号から光信号に変換され、光分岐回路で分岐された折り返しデータの正常性を監視する。これにより、データの送信元であるサーバ側で検出できていなかった、通信用光モジュールで発生するエラーを検出することができるようになる。これにより、NICを備えるサーバが、通信用光モジュールで発生するエラーを含むNICの性能低下に対する対応を実施することができる。 On the other hand, the monitoring unit monitors the normality of return data that is converted from an electrical signal to an optical signal by the communication optical module and branched by the optical branch circuit. This makes it possible to detect errors that occur in the communication optical module, which could not be detected by the server that is the data transmission source. Thereby, a server equipped with a NIC can take measures against performance degradation of the NIC including errors occurring in the communication optical module.
[変形例]
次に、実施形態の変形例について、図面を参照して説明する。
[Modified example]
Next, a modification of the embodiment will be described with reference to the drawings.
図5は、光分岐回路200を含むNIC100Aの機能構成を示す図である。図5に示されるように、NICは、光分岐回路をNIC内に備える構成としてもよい。
FIG. 5 is a diagram showing the functional configuration of the
また、図6は、NIC100と光分岐回路200Aとの機能構成を示すブロック図である。図6に示されるように、光分岐回路200Aは、入力された光信号を分岐して出力する構成であってもよい。すなわち、光分岐回路200Aは、実施形態における光分岐回路200と比較して、ネットワーク300からデータを入力される受信コネクタと、入力されたデータを出力する送信コネクタと、を備えない。この場合、NIC100の通信用光モジュール102は、ネットワーク300から直接、データを入力されてよい。
Further, FIG. 6 is a block diagram showing the functional configuration of the
なお、光分岐回路200Aも、光分岐回路200と同様に、NIC内に備えられてよい。
Note that the
以上、各実施形態を参照して本発明を説明したが、本発明は上記実施の形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえる様々な変更をすることができる。 Although the present invention has been described above with reference to each embodiment, the present invention is not limited to the above embodiments. Various changes can be made to the configuration and details of the present invention that can be understood by those skilled in the art within the scope of the present invention.
また、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は、内容的に支障しない範囲で変更されてよい。 Furthermore, although the plurality of operations are described in order in the form of a flowchart, the order in which they are described does not limit the order in which the plurality of operations are executed. Therefore, when implementing each embodiment, the order of the plurality of operations may be changed within a range that does not interfere with the content.
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 Part or all of the above embodiments may be described as in the following additional notes, but are not limited to the following.
(付記1)
サーバ内部のバスインターフェースを介して、サーバと、外部サーバとのデータの送受信を制御するコントローラと、
前記コントローラと接続され、前記コントローラから入力されるデータを電気信号から光信号に変換し、変換したデータを、ネットワークに接続される光分岐回路に出力する通信用光モジュールと、
前記光分岐回路により分岐された折り返しデータを、光信号から電気信号に変換する監視用光モジュールと、
前記監視用光モジュールから入力された前記折り返しデータの正常性に基づいて、データ送信の性能を監視する監視部と、を備え、
前記監視部は、データ送信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う、
ネットワークインターフェースカード。
(Additional note 1)
A controller that controls data transmission and reception between the server and an external server via a bus interface inside the server;
a communication optical module connected to the controller, converting data input from the controller from an electrical signal to an optical signal, and outputting the converted data to an optical branch circuit connected to a network;
a monitoring optical module that converts the return data branched by the optical branch circuit from an optical signal to an electrical signal;
a monitoring unit that monitors data transmission performance based on the normality of the return data input from the monitoring optical module;
The monitoring unit notifies an operating system or an application inside the server when data transmission performance deteriorates.
network interface card.
(付記2)
前記監視部は、前記折り返しデータの誤り検出符号から、所定の方法により算出された異常の検出に関する値に基づき、データ送信の性能を監視する
付記1に記載のネットワークインターフェースカード。
(Additional note 2)
The network interface card according to supplementary note 1, wherein the monitoring unit monitors data transmission performance based on a value related to abnormality detection calculated by a predetermined method from an error detection code of the return data.
(付記3)
前記監視部は、前記折り返しデータに異常がある場合、第1エラー数としてカウントし、送信データ数に対する第1エラー数が閾値以上である場合、データ送信の性能が低下したとする
付記1または2に記載のネットワークインターフェースカード。
(Additional note 3)
If there is an abnormality in the return data, the monitoring unit counts it as a first error number, and if the first error number with respect to the number of transmitted data is equal to or more than a threshold value, it is determined that the performance of data transmission has deteriorated. Supplementary Note 1 or 2 Network interface cards listed in .
(付記4)
前記監視部は、前記コントローラに入力された送信データの異常がカウントされた数である第2エラー数と、前記第1エラー数と、の合計エラー数を算出し、送信データ数に対する前記合計エラー数が閾値以上である場合、データ送信の性能が低下したとする
付記3に記載のネットワークインターフェースカード。
(Additional note 4)
The monitoring unit calculates the total number of errors of the second number of errors, which is the number of abnormalities in the transmission data input to the controller, and the first number of errors, and calculates the total number of errors with respect to the number of transmission data. If the number is equal to or greater than the threshold, it is determined that the data transmission performance has deteriorated. The network interface card according to appendix 3.
(付記5)
前記監視部は、データ送受信の性能が低下した場合、ネットワークインターフェースカードによるデータの送受信を停止する
付記1から4のいずれかに記載のネットワークインターフェースカード。
(Appendix 5)
The network interface card according to any one of appendices 1 to 4, wherein the monitoring unit stops data transmission and reception by the network interface card when data transmission and reception performance deteriorates.
(付記6)
前記監視部は、データ送信の性能が低下した場合、前記コントローラのデータ送信を停止し、かつ、前記サーバ内部に備えられるネットワークアダプタドライバからの送信要求に対しエラーリターンを返すことにより、ネットワークインターフェースカードによるデータの送受信を停止する
付記5に記載のネットワークインターフェースカード。
(Appendix 6)
When the data transmission performance deteriorates, the monitoring unit stops data transmission of the controller and returns an error return in response to a transmission request from a network adapter driver provided inside the server, thereby controlling the network interface card. Stop sending and receiving data by the network interface card described in Appendix 5.
(付記7)
前記監視部は、データ送信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して、データ送信の性能が低下したことを示す通知を行う、
付記1から6のいずれかに記載のネットワークインターフェースカード。
(Appendix 7)
When the data transmission performance deteriorates, the monitoring unit notifies an operating system or an application inside the server that the data transmission performance has deteriorated.
The network interface card according to any one of Supplementary Notes 1 to 6.
(付記8)
前記監視部は、データ送信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して、ネットワークインターフェースカードの切り替えが必要であることを示す通知を行う、
付記1から7のいずれかに記載のネットワークインターフェースカード。
(Appendix 8)
The monitoring unit notifies an operating system or an application inside the server that a network interface card needs to be switched when data transmission performance deteriorates;
The network interface card according to any one of Supplementary Notes 1 to 7.
(付記9)
前記光分岐回路をさらに備える、
付記1から8のいずれかに記載のネットワークインターフェースカード。
(Appendix 9)
further comprising the optical branch circuit;
The network interface card according to any one of Supplementary Notes 1 to 8.
(付記10)
サーバに備えられ、前記サーバとネットワークとの間におけるデータの送受信を行うネットワークインターフェースカードにおいて、
コンピュータが、
前記ネットワークインターフェースカードに備えられたコントローラが出力し、通信用光モジュールにより光信号に変換され、さらに、監視用光モジュールにより電気信号に変換されて入力された折り返しデータの正常性に基づいて、データ送受信の性能を監視し、
監視の結果、データ送受信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う、
監視方法。
(Appendix 10)
A network interface card provided in a server and configured to transmit and receive data between the server and a network,
The computer is
The controller provided in the network interface card outputs the data, which is converted into an optical signal by the communication optical module, and further converted into an electrical signal by the monitoring optical module.Based on the normality of input return data, the data is Monitor transmit and receive performance,
As a result of monitoring, if the performance of data transmission and reception deteriorates, notifying the operating system or application inside the server;
Monitoring method.
10 サーバ
11 メモリ
12 メモリ制御部
13 プロセッサ
14 入出力制御部
15 入出力カードスロット
16 現用系ネットワークインターフェースカード
17 予備系ネットワークインターフェースカード
18 システムバス
19 バスインターフェース
20 光インターフェース
30 ネットワークスイッチ
40 サーバ
100 ネットワークインターフェースカード
100A ネットワークインターフェースカード
101 コントローラ
102 通信用光モジュール
103 監視用光モジュール
104 監視部
200 光分岐回路
200A 光分岐回路
300 ネットワーク
10
Claims (10)
前記コントローラと接続され、前記コントローラから入力されるデータを電気信号から光信号に変換し、変換したデータを、ネットワークに接続される光分岐回路を介して前記外部サーバに第1の送信コネクタから出力し、前記外部サーバから第1の受信コネクタに入力されるデータを光信号から電気信号に変換する通信用光モジュールと、
前記外部サーバに出力する光信号から前記光分岐回路により分岐され、第2の受信コネクタに入力された折り返しデータを、光信号から電気信号に変換する監視用光モジュールと、
前記監視用光モジュールから入力された前記折り返しデータの正常性に基づいて、データ送信の性能を監視する監視部と、を備え、
前記監視部は、データ送信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う、
ネットワークインターフェースカード。 A controller that controls data transmission and reception between the server and an external server via a bus interface inside the server;
A first transmission connector connected to the controller, converts data input from the controller from an electrical signal to an optical signal, and outputs the converted data to the external server via an optical branch circuit connected to a network. a communication optical module that converts data input from the external server to the first receiving connector from an optical signal to an electrical signal ;
a monitoring optical module that converts return data that is branched from the optical signal output to the external server by the optical branch circuit and input to the second reception connector from an optical signal to an electrical signal;
a monitoring unit that monitors data transmission performance based on the normality of the return data input from the monitoring optical module;
The monitoring unit notifies an operating system or an application inside the server when data transmission performance deteriorates.
network interface card.
請求項1に記載のネットワークインターフェースカード。 The network interface card according to claim 1, wherein the monitoring unit monitors data transmission performance based on a value related to abnormality detection calculated by a predetermined method from an error detection code of the return data.
請求項1に記載のネットワークインターフェースカード。 The monitoring unit counts as a first error number when there is an abnormality in the return data, and determines that data transmission performance has deteriorated when the first error number with respect to the number of transmitted data is equal to or more than a threshold value. Network interface card listed.
請求項3に記載のネットワークインターフェースカード。 The monitoring unit calculates the total number of errors of the second number of errors, which is the number of abnormalities in the transmission data input to the controller, and the first number of errors, and calculates the total number of errors with respect to the number of transmission data. The network interface card according to claim 3, wherein when the number is equal to or greater than a threshold value, data transmission performance is determined to have deteriorated.
請求項1に記載のネットワークインターフェースカード。 The network interface card according to claim 1, wherein the monitoring unit stops data transmission and reception by the network interface card when data transmission and reception performance deteriorates.
請求項5に記載のネットワークインターフェースカード。 When the data transmission performance deteriorates, the monitoring unit stops data transmission of the controller and returns an error return in response to a transmission request from a network adapter driver provided inside the server, thereby controlling the network interface card. The network interface card according to claim 5, wherein data transmission and reception by the network interface card is stopped.
請求項1に記載のネットワークインターフェースカード。 When the data transmission performance deteriorates, the monitoring unit notifies an operating system or an application inside the server that the data transmission performance has deteriorated.
The network interface card according to claim 1.
請求項1に記載のネットワークインターフェースカード。 The monitoring unit notifies an operating system or an application inside the server that a network interface card needs to be switched when data transmission performance deteriorates;
The network interface card according to claim 1.
請求項1から8のいずれかに記載のネットワークインターフェースカード。 further comprising the optical branch circuit;
A network interface card according to any one of claims 1 to 8.
前記ネットワークインターフェースカードに備えられる通信用光モジュールが、
コントローラから入力されるデータを電気信号から光信号に変換し、変換したデータを、ネットワークに接続される光分岐回路を介して前記外部サーバに第1の送信コネクタから出力し、前記外部サーバから第1の受信コネクタに入力されるデータを光信号から電気信号に変換し、
前記ネットワークインターフェースカードに備えられる監視用光モジュールが、
前記外部サーバに出力する光信号から前記光分岐回路により分岐され、第2の受信コネクタに入力された折り返しデータを、光信号から電気信号に変換し、
コンピュータが、
前記監視用光モジュールから入力された前記折り返しデータの正常性に基づいて、データ送信の性能を監視し、
監視の結果、データ送信の性能が低下した場合、前記サーバ内部のオペレーティングシステムまたはアプリケーションに対して通知を行う、
送信性能監視方法。 A network interface card provided in a server and configured to transmit and receive data between the server and an external server ,
A communication optical module included in the network interface card,
Data input from the controller is converted from an electrical signal to an optical signal, the converted data is output from the first transmission connector to the external server via an optical branch circuit connected to a network, and the data is transmitted from the external server to the first transmission connector. Converts the data input to the receiving connector of 1 from an optical signal to an electrical signal,
A monitoring optical module included in the network interface card,
Converting return data that is branched from the optical signal output to the external server by the optical branch circuit and input to the second reception connector from an optical signal to an electrical signal;
The computer is
Monitoring data transmission performance based on the normality of the return data input from the monitoring optical module;
If the data transmission performance deteriorates as a result of monitoring, notifying the operating system or application inside the server;
Transmission performance monitoring method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023012770A JP7417773B1 (en) | 2023-01-31 | 2023-01-31 | Network interface card and transmission performance monitoring method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023012770A JP7417773B1 (en) | 2023-01-31 | 2023-01-31 | Network interface card and transmission performance monitoring method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7417773B1 true JP7417773B1 (en) | 2024-01-18 |
JP2024108417A JP2024108417A (en) | 2024-08-13 |
Family
ID=89534161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023012770A Active JP7417773B1 (en) | 2023-01-31 | 2023-01-31 | Network interface card and transmission performance monitoring method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7417773B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118612168A (en) * | 2024-06-24 | 2024-09-06 | 新华三人工智能科技有限公司 | Server, GPU interconnection method, device and storage medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040228627A1 (en) | 2003-05-15 | 2004-11-18 | International Business Machines Corporation | Highly available redundant optical modules using single network connection |
US20180006925A1 (en) | 2016-06-30 | 2018-01-04 | Juniper Networks, Inc. | Automatically detecting an error in a communication and automatically determining a source of the error |
US20190081881A1 (en) | 2017-09-08 | 2019-03-14 | Brocade Communications Systems LLC | Diagnostic port for inter-switch and node link testing in electrical, optical and remote loopback modes |
-
2023
- 2023-01-31 JP JP2023012770A patent/JP7417773B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040228627A1 (en) | 2003-05-15 | 2004-11-18 | International Business Machines Corporation | Highly available redundant optical modules using single network connection |
US20180006925A1 (en) | 2016-06-30 | 2018-01-04 | Juniper Networks, Inc. | Automatically detecting an error in a communication and automatically determining a source of the error |
US20190081881A1 (en) | 2017-09-08 | 2019-03-14 | Brocade Communications Systems LLC | Diagnostic port for inter-switch and node link testing in electrical, optical and remote loopback modes |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118612168A (en) * | 2024-06-24 | 2024-09-06 | 新华三人工智能科技有限公司 | Server, GPU interconnection method, device and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP2024108417A (en) | 2024-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0570882B1 (en) | A distributed control methodology and mechanism for implementing automatic protection switching | |
US7397385B1 (en) | Predicting cable failure through remote failure detection of error signatures | |
US11221612B2 (en) | System and method of communicating data over high availability industrial control systems | |
JP7417773B1 (en) | Network interface card and transmission performance monitoring method | |
CN103684845A (en) | Network backup device and network system with same | |
CN109889411B (en) | Data transmission method and device | |
US5923840A (en) | Method of reporting errors by a hardware element of a distributed computer system | |
JP4827651B2 (en) | Optical transmission method and apparatus | |
CN115085993A (en) | Data verification method and device and domain controller | |
US8576699B2 (en) | Method for operating a network having a ring topology | |
JP2016100843A (en) | Relay device | |
US7593323B2 (en) | Apparatus and methods for managing nodes on a fault tolerant network | |
EP1897286A1 (en) | Communication network system | |
EP1793626B1 (en) | System and method for implementing service switching | |
US8111625B2 (en) | Method for detecting a message interface fault in a communication device | |
CN114884803B (en) | Method, device, equipment and medium for processing multiple redundant states | |
JP6134720B2 (en) | Connection method | |
CN114095462A (en) | Fault tolerance method and system for SRIO communication system of radar processor | |
JP2005268889A (en) | Transmission path switching system and operating method of the transmission path switching system | |
EP4084492A1 (en) | A method, system and olt for dual-parenting pon protection | |
JP2019062484A (en) | Power reception device and control method | |
US7724642B2 (en) | Method and apparatus for continuous operation of a point-of-sale system during a single point-of-failure | |
CN108156098B (en) | Communication network system based on POWERLINK | |
JP7120678B1 (en) | Communication processing device, communication processing system, failure notification method and failure notification program | |
CN116866153A (en) | Network fault processing method and device, storage medium and electronic equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240105 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7417773 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |