WO2022102088A1

WO2022102088A1 - ネットワークカードおよびバッファ制御方法

Info

Publication number: WO2022102088A1
Application number: PCT/JP2020/042457
Authority: WO
Inventors: 勇輝有川; 顕至田仲; 猛伊藤; 勉竹谷; 健坂本
Original assignee: 日本電信電話株式会社
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2022-05-19
Also published as: US20230421510A1; JP7464144B2; JPWO2022102088A1

Abstract

本発明のネットワークカード（１０）は、バッファ（１３）を、メモリアクセス速度または記憶容量を含む物理的性能が異なるバッファから構成し、バッファ制御回路（１４）が、物理ポート（１１）が受信したパケットのヘッダ情報から特定した、パケットの優先度またはサービス品質と、バッファ（１３）の物理的性能とに基づいて、バッファ１３のうちからパケットの蓄積先となるバッファ（１３）を選択する。これにより、通信ネットワークの優先制御とパケットに対する演算処理の割り当て制御とを融合することができ、結果として、パケットに対して演算処理を効率よく実行することが可能となる。

Description

ネットワークカードおよびバッファ制御方法

　本発明は、通信ネットワークの優先制御に基づいてパケットを転送制御する際、当該パケットに対して演算処理を実行するためのバッファ制御技術に関する。

　機械学習や人工知能（ＡＩ）やＩｏＴ（Internet of Things）など多くの分野で技術革新が進み、様々な情報やデータを活用することで、サービスの高度化・付加価値の提供が盛んに行われている。このような処理では、大量の計算をする必要があり、そのための情報処理基盤が必須である。
　例えば、非特許文献１では、既存の情報処理基盤をアップデートしようとする試みが展開されてはいるものの、急速に増えていくデータに対して現代のコンピュータが対応しきれていないのも事実であり、今後さらなる進化を遂げていくためには、ムーアの法則を越える「ポストムーア技術」が確立されなければいけないと指摘している。

　ポストムーア技術として、例えば、非特許文献２では、フローセントリックコンピューティングという技術が開示されている。フローセントリックコンピューティングでは、データのある場所で処理を行うというこれまでのコンピューティングの考えではなく、計算機能が存在する場所にデータを移動して処理を行うという新たな概念を導入した。
　このようなフローセントリックコンピューティングを実現するためには、データ移動に必要な広帯域な通信ネットワークが必要となるだけでなく、同時に効率よく通信ネットワークを制御しないと、データの移動を効率よく実施できない可能性がある。

特開２０１２－４４５１１号公報

「NTT Technology Report for Smart World 2020」，日本電信電話株式会社，28 May 2020，［2020年10月19日検索］，インターネット，＜https://www.rd.ntt/_assets/pdf/techreport/NTT_TRFSW_2020_EN_W.pdf＞ R. Takano and T. Kudoh, "Flow-centric computing leveraged by photonic circuit switching for the post-moore era", Tenth IEEE/ACM International Symposium on Networks-on-Chip (NOCS), Nara, 2016, pp. 1-3, ［2020年10月19日検索］，インターネット，＜https://ieeexplore.ieee.org/abstract/document/7579339＞

　一般に、データを効率よく移動させるためには、データを一時的に保持するバッファやメモリをどのように構成するかがシステム全体の処理性能に影響する。メモリアクセス速度や消費電力が異なるバッファが存在する場合、バッファの内部状態を見て、その切替を行う技術が知られている（例えば、特許文献１）。このような従来技術によれば、メモリアクセス速度が速く、消費電力の小さいバッファを優先的に用いることができる。
　一方、通信ネットワークを介したフローセントリックコンピューティングでは、処理内容や優先度がデータごとに異なる。このため、通信ネットワークの優先制御に加えて、データごとの処理内容や優先度を考慮して、データに対する演算処理を割り当てる必要がある。したがって、従来技術には、通信ネットワークの優先制御とパケットに対する演算処理の割り当て制御とを融合するためのバッファ制御技術については開示されていない。

　本発明はこのような課題を解決するためのものであり、通信ネットワークの優先制御とパケットに対する演算処理の割り当て制御とを融合できるバッファ制御技術を提供することを目的としている。

　このような目的を達成するために、本発明にかかるネットワークカードは、伝送路を介してパケットを受信および送信するように構成された複数の物理ポートと、前記複数の物理ポートが受信した第１のパケットを一時的に蓄積するように構成された複数のバッファと、前記複数のバッファから読み出された第２のパケットに対して所定の演算処理を行うように構成された複数の演算処理回路と、前記複数のバッファのいずれかに前記第１のパケットを格納し、前記第２のパケットに関する、前記演算処理回路への割り当ておよび前記バッファからの読み出しを制御するように構成されたバッファ制御回路とを備え、前記複数のバッファは、メモリアクセス速度または記憶容量を含む物理的性能が異なるバッファからなり、前記バッファ制御回路は、前記第１のパケットのヘッダ情報に基づいて、前記第１のパケットの優先度またはサービス品質を特定し、得られた優先度またはサービス品質と、前記複数のバッファの物理的性能とに基づいて、前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択するように構成したものである。

　また、本発明にかかるバッファ制御方法は、伝送路を介してパケットを受信および送信するように構成された複数の物理ポートと、前記複数の物理ポートが受信した第１のパケットを一時的に蓄積するように構成された複数のバッファと、前記複数のバッファから読み出された第２のパケットに対して所定の演算処理を行うように構成された、メモリアクセス速度または記憶容量を含む物理的性能が異なる、複数の演算処理回路と、前記複数のバッファのいずれかに前記第１のパケットを格納し、前記第２のパケットに関する、前記演算処理回路への割り当ておよび前記バッファからの読み出しを制御するように構成されたバッファ制御回路とを備えるネットワークカードで用いられるバッファ制御方法であって、前記バッファ制御回路が、前記第１のパケットのヘッダ情報に基づいて、前記第１のパケットの優先度またはサービス品質を特定する第１のステップと、前記バッファ制御回路が、得られた優先度またはサービス品質と、前記複数のバッファの物理的性能とに基づいて、前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択する第２のステップとを備えている。

　本発明によれば、通信ネットワークの優先制御とパケットに対する演算処理の割り当て制御とを融合することができ、結果として、パケットに対して演算処理を効率よく実行することが可能となる。

図１は、第１の実施の形態にかかるネットワークカードの構成を示すブロック図である。図２は、第１の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。図３は、第１の実施の形態にかかるネットワークカードのバッファ制御方法の動作を示すフローチャートである。図４は、第２の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。図５は、第２の実施の形態にかかるネットワークカードのバッファ制御方法の動作を示すフローチャートである。図６は、第３の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。図７は、バッファ選択基準例を示す説明図である。図８は、バッファ選択動作例を示すグラフである。図９は、第３の実施の形態にかかるネットワークカードのバッファ制御方法の動作を示すフローチャートである。図１０は、従来のネットワークカードの構成を示すブロック図である。

　次に、本発明の実施の形態について図面を参照して説明する。
［第１の実施の形態］
　まず、図１および図２を参照して、本発明の第１の実施の形態にかかるネットワークカード１０の構成について説明する。図１は、第１の実施の形態にかかるネットワークカードの構成を示すブロック図である。図２は、第１の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。

［ネットワークカード］
　このネットワークカード（Network Interface Card：ＮＩＣ）は、ネットワークアダプタとも呼ばれ、コンピュータなどの機器を伝送路に接続するための拡張装置である。ネットワークカード１０は、機器の筐体背面や側面、さらには筐体内部に用意された拡張スロットに挿入する形態で使用されるカード型のものがあるが、これに限定されるものではない。例えば、機器の筐体内、例えばＣＰＵなどの制御回路１５が搭載された基板に回路として実装される形態や、ＵＳＢ（Universal Serial Bus）ポートなどの周辺機器用のインターフェースに接続される形態もある。

　図１に示すように、本実施の形態にかかるネットワークカード１０は、主な回路部として、Ｐ（Ｐは１以上の整数）個の物理ポート（＃１～＃Ｐ）１１、Ｎ（Ｎは２以上の整数）個の演算処理回路１２（＃１～＃Ｎ）、バッファ制御回路１４、Ｍ（Ｍは２以上の整数）個のバッファ１３、および、制御回路１５を備えている。

　このネットワークカード１０は、全体として、物理ポート１１が伝送路Ｌを介して受信したデータパケットなどのパケット（第１のパケット）を、バッファ制御回路でバッファ１３に一時的に格納し、バッファ１３から順次読み出したパケット（第２のパケット）に対して、演算処理回路１２で所定の演算処理を実行し、得られた演算処理結果をパケットに格納して物理ポート１１から送信するように構成されている。
　この際、バッファ制御回路で、各パケットのヘッダ情報を抽出し、このヘッダ情報に基づいて、物理的性能が異なるバッファ１３のうちからいずれか１つまたは複数を、パケットの蓄積先として選択するように構成されている。

［物理ポート］
　物理ポート１１（＃１～＃Ｐ）は、外部装置、外部ネットワーク、外部接続デバイス（ともに図示せず）との入出力インターフェースであって、伝送路Ｌを介して外部から入力される光または電気信号により、パケットを受信する機能と、当該ネットワークカード１０で得られた演算処理結果を送信するためのパケットを、光または電気信号により、伝送路Ｌを介して外部へ出力する機能と、を有する。具体的には、物理ポート１１は、イーサネット（Ethernet：登録商標）のポートや、インフィニバンド（InfiniBand）のポート、ＰＣＩ　ＥｘｐｒｅｓｓなどのＩ／Ｏシリアルインターフェースなど、任意の入出力インターフェースから構成されるが、一般的な市中技術で入手できる入出力インターフェースのみならず、独自に定めたインターフェースで構成してもよい。

［演算処理回路］
　演算処理回路１２（＃１～＃Ｎ）は、バッファ１３から読み出したパケットに含まれるデータに対して所定の演算処理（演算または処理）を行う機能と、得られた演算処理結果（演算結果また処理結果）を出力する機能と、を有する。演算処理回路１２からの出力は、バッファ制御回路１４でパケットに格納された後、物理ポート１１から伝送路Ｌを介して、前述の外部装置、外部ネットワーク、外部接続デバイスへ出力される。

　演算処理回路１２は、ＣＰＵ（Central processing Unit）やＧＰＵ（Graphics Processing Unit）上で動作するソフトウェアで実現してもよく、ＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）に形成したＬＳＩ（Large Scale Integration）回路などのハードウェアで実現してもよい。また、演算処理回路１２は、物理ポート１１、バッファ１３、バッファ制御回路１４、制御回路１５のいずれかまたは全部と同一の物理デバイス上で実現してもよい。また、演算処理回路１２のそれぞれは、異なる種類のデバイスや、異なる種類の機能を提供する専用回路で構成してもよく、同一のプロセッサで構成し、汎用プロセッサのように汎用的に用いることができるように構成してもよい。

［バッファ］
　バッファ１３は、演算処理回路１２から入力されるパケットを一時的に格納するように構成されている。これらバッファ１３には、データの書き込み・読み出し速度と記憶容量などの物理的性能が異なるものが含まれている。
　例えば、ネットワークカード１０において、通信プロトコル処理を担うデバイス、例えばＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）の内部に備えるようなオンチップメモリからなるバッファ（以下、オンチップバッファということもある）は、比較的記憶容量は小さいが、メモリアクセス速度、つまりデータを読み書きする速度は比較的高速である特徴を有している。このようなオンチップメモリは、低遅延な処理が求められるサービスのデータや、優先度の高いデータ、記憶容量が少なく済むサービスのデータ、を格納するのに適している。

　一方、通信プロトコル処理を担うデバイスの外部に備え、当該デバイスと同じプリント基板上に備えられるオンボードメモリからなるバッファ（以下、オンボードバッファということもある）は、メモリアクセス速度、つまりデータの読み書きの速度は比較的低速である特徴を有している。また、オンボードメモリは、メモリアクセスに伴う消費電力が比較的大きいことが知られている。ただし、オンボードメモリは、記憶容量が大きく、処理遅延が許容されるデータや、比較的記憶容量を確保する必要があるサービス、例えば、高精細動画像を大規模なニューラルネットワークを用いて解析する際に、メモリアクセス速度に比べて、後段の演算に要する時間が長く、メモリアクセスに伴う処理遅延を無視できる場合において、データを格納するのに適している。

［パケット制御回路］
　バッファ制御回路１４は、全体として、物理ポート１１から入力されたパケットのパケットヘッダからヘッダ情報を抽出し、抽出したヘッダ情報に基づいて、当該パケットを格納するバッファ１３を選択し、選択したバッファ１３に当該パケットを格納するように構成されている。
　図２に示すように、ヘッダ抽出回路１４Ａ、バッファ選択回路１４Ｂ、および、Ｍ個のバッファ入出力回路１４Ｃを備えている。

［ヘッダ抽出回路］
　ヘッダ抽出回路１４Ａは、物理ポート１１から入力されたパケットについて、当該パケットのパケットヘッダに格納されているヘッダ情報を解析して抽出するように構成されている。具体的には、当該パケットの優先度やユーザＩＤ、当該パケットに対して施すべき演算の内容を特定する情報を、当該パケットの所定フィールドからヘッダ情報として抽出する。

［バッファ入出力回路］
　バッファ入出力回路１４Ｃは、バッファ選択回路１４Ｂで選択された１つまたは複数のバッファ１３に対して、物理ポート１１から入力されたパケットを出力し、バッファ選択回路１４Ｂで選択された１つまたは複数のバッファ１３から、格納されているパケットを読み出すように構成されている。

［バッファ選択回路］
　バッファ選択回路１４Ｂは、ヘッダ抽出回路１４Ａで抽出したヘッダ情報に基づいて、物理ポート１１から入力されたパケットを格納するバッファ１３を１つまたは複数選択し、選択したバッファ１３にバッファ入出力回路１４Ｃを介して当該パケットを格納し、優先度の高いほうから順にバッファ１３を選択し、選択したバッファ１３からバッファ入出力回路１４Ｃを介してパケットを読み出して、当該パケットに対応する演算処理回路１２へ出力するように構成されている。

　バッファ制御回路１４（バッファ選択回路１４Ｂ）は、物理ポート１１から入力されたパケットの優先度に応じて、当該パケットを格納するバッファ１３を選択する。例えば、パケットの優先度が高いほど、メモリアクセス速度が高速なバッファ（例えば、オンチップバッファや内部バッファ）を選択する。また、パケットの優先度が低いほど、メモリアクセス速度が低速なバッファ（例えば、オンボードバッファや外付けバッファ）を選択する。なお、優先度が高・中・低のように３段階あり、バッファ１３が２つの場合、高優先パケットのみをメモリアクセス速度が比較的高速なバッファを選択し、中・低優先パケットはメモリアクセス速度が比較的低速なバッファを選択すればよい。この場合の高速バッファと低速バッファの振り分ける基準は予め設定しておけばよい。

　また、バッファ制御回路１４（バッファ選択回路１４Ｂ）は、バッファ１３を選択するための情報として、当該パケットのユーザＩＤや当該パケットが入力された物理ポート１１、当該パケットに対して施すべき演算の内容に応じて、当該パケットを格納するバッファ１３を選択する。例えば、ユーザＩＤごとにサービス品質を制御する場合、低遅延なサービス品質を担保すべきユーザＩＤが割り当てられたパケットほど、すなわちパケットのサービス品質が高いほど、メモリアクセス速度が高速なバッファを選択する。また、当該パケットに対して施すべき演算の内容が、比較的処理時間を要する処理であるパケットについては、全体の処理時間に対してメモリアクセスの処理時間が無視できるレベルとなる。このため、このようなパケットのサービス品質が低いほど、メモリアクセス速度が低速なバッファを選択する。

　また、バッファ制御回路１４（バッファ選択回路１４Ｂ）は、後段の演算処理回路１２の稼働状況を確認するとともに、バッファ１３に格納されているパケットのうち、当該パケットに対して施すべき演算の種類と、割り当て可能な演算処理回路１２が対応できる演算の種類とが一致する場合、当該パケットを当該演算処理回路１２へ割り当てるとともに、当該パケットをバッファ１３から読み出す。
　このように、バッファ制御回路１４（バッファ選択回路１４Ｂ）は、物理的性能が異なるバッファ１３を、格納するパケット（データ）の性質、具体的には、パケットの優先度またはサービス品質に応じて選択する。

　図１０は、従来のネットワークカードの構成を示すブロック図である。図１０に示すように、従来のネットワークカード５０は、オンボードメモリまたはオンチップメモリとして、入力パケットを蓄積するバッファを備えるが、パケットの蓄積先は固定であったり、予めユーザが指定したりする。これに対して、本発明のネットワークカード１０は、物理的性質の異なる複数のバッファ１３を備え、バッファ制御回路１４が、入力されたパケットのヘッダ情報から特定した当該パケットの優先度またはサービス品質に基づいて、当該パケットの蓄積先を選択するとともに蓄積先を動的に切り替えるように構成した点が異なる。

　これにより、優先度またはサービス品質が高いパケットは、バッファ１３のうちメモリアクセス速度が比較的高速なバッファへ格納され、優先度またはサービス品質が低いパケットは、メモリアクセス速度が比較的低速なバッファへ格納される。したがって、優先度またはサービス品質が高いパケットの処理時間を短縮することが可能であるとともに、優先度またはサービス品質が低いパケットの処理は演算処理回路１２の負荷が軽い時間に実施することで、システム全体の負荷を平準化することが可能となる。

　また、本発明のネットワークカード１０では、バッファ１３としてオンボードメモリに加えてオンチップメモリを併用することができる。この際、オンチップメモリは、メモリアクセスの消費電力が比較的小さいため、バッファ１３としてオンボードメモリのみを用いる場合と比較して、全体の消費電力を削減することができる。また、オンチップメモリは、メモリアクセス速度が比較的速いため、全体の処理時間を短縮することができる。また、オンボードメモリとオンチップメモリを併用することで、両者を並列動作させることも可能となるため、メモリアクセスの競合を抑制することができる。

　一方、本発明のネットワークカード１０では、バッファ１３としてオンチップメモリに加えてオンボードメモリを併用することができる。この際、オンボードメモリは、記憶容量が比較的大きいため、バッファ１３としてオンチップメモリのみを用いる場合と比較して、データサイズの大きな高精細画像やニューラルネットワークモデルなど、比較的サイズの大きなデータを扱うアプリケーションやサービスへ適用することができる。また、オンチップメモリのみを用いる場合、オンチップメモリの記憶容量を大きくすると、当該チップの面積も大きくなり、製造過程における歩留まりが悪化したり、リーク電力が増加したり、する。これに対して、オンボードメモリを併用すれば、オンチップメモリの記憶容量を削減することができ、当該チップの面積を縮小でき、製造過程における歩留まりが改良することができ、リーク電力を抑制することができる。また、オンボードメモリとオンチップメモリを併用することで、両者を並列動作させることも可能となるため、メモリアクセスの競合を抑制することができる。

［第１の実施の形態の動作］
次に、図３を参照して、第１の実施の形態にかかるネットワークカード１０の動作について説明する。図３は、第１の実施の形態にかかるネットワークカードのバッファ制御方法の動作を示すフローチャートである。

　図３に示すように、まず、物理ポート１１は、外部装置または外部ネットワーク、外部接続デバイスから伝送路Ｌを介してパケットを受信する（ステップＳ１００）。
　続いて、バッファ制御回路は、物理ポート１１から入力されたパケットからヘッダ情報を抽出し（ステップＳ１０１）（第１のステップ）、得られたヘッダ情報に基づいて、バッファ１３のうちから当該パケットの蓄積先となるバッファ１３を選択する（ステップＳ１０２）（第２のステップ）。

　この際、バッファ制御回路は、例えば、物理ポート１１から入力されたパケットの優先度に応じて、当該パケットを格納するバッファ１３を選択する。例えば、優先度の高いパケットについては、メモリアクセス速度が比較的高速なバッファ（オンチップバッファや内部バッファ）を選択する。また、優先度の低いパケットについては、メモリアクセス速度が比較的低速なバッファ（オンボードバッファや外付けバッファ）を選択する。なお、優先度が高・中・低のように３段階あり、バッファ１３として物理的性能が異なる２つのバッファが２つある場合、高優先パケットのみをメモリアクセス速度が比較的高速なバッファを選択し、中・低優先パケットはメモリアクセス速度が比較的低速なバッファを選択する。この場合の高速バッファと低速バッファの振り分ける基準は予め設定する。

　また、バッファ制御回路１４は、バッファ１３を選択するための情報として、当該パケットのユーザＩＤや当該パケットが入力された物理ポート１１、当該パケットに対して施すべき演算の内容に応じて、当該パケットを格納するバッファを選択する。例えば、ユーザＩＤごとにサービス品質を制御する場合、低遅延なサービス品質を担保すべきユーザＩＤが割り当てられたパケットについては、メモリアクセス速度が比較的高速なバッファへ格納する。また、当該パケットに対して施すべき演算の内容が、比較的処理時間を要する処理については、全体の処理時間に対してメモリアクセスの処理時間が無視できるレベルとなることから、メモリアクセス速度が比較的高速なバッファへ格納する。

　次に、バッファ１３のうち、演算処理回路１２で選択されたバッファ１３は、演算処理回路１２から入力されたパケットを一時的に格納する（ステップＳ１０３）。これらバッファ１３には、データの書き込み・読み出し速度と記憶容量などの物理的性能が異なるものが含まれている。
　例えば、ネットワークカード１０において、通信プロトコル処理を担うデバイス、例えばＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）の内部に備えるようなオンチップメモリからなるバッファ（以下、オンチップバッファということもある）は、比較的記憶容量は小さいが、メモリアクセス速度、つまりデータを読み書きする速度は比較的高速である特徴を有している。このようなオンチップメモリは、低遅延な処理が求められるサービスのデータや、優先度の高いデータ、記憶容量が少なく済むサービスのデータ、を格納するのに適している。

　この後、バッファ制御回路１４は、各演算処理回路１２の稼働状況に基づいてパケットの割り当て可否を確認する。ここで、割り当て可能な演算処理回路１２が対応できる演算の種類が、各バッファ１３に格納されているパケットのうち、当該パケットに対して施すべき演算の種類と一致する場合、バッファ制御回路１４は、当該パケットを当該演算処理回路１２へ割り当てるとともに、当該パケットをバッファ１３から読み出して、当該演算処理回路１２へ出力する（ステップＳ１０４）。

　次に、演算処理回路１２は、バッファ制御回路１４によりバッファ１３から読み出されたパケットに対して所定の演算処理を行い、得られた演算処理結果を出力する（ステップＳ１０５）。
　バッファ制御回路１４は、演算処理回路１２から出力された演算処理結果をパケットに格納して、物理ポート１１から光または電気信号として送信し（ステップＳ１０６）、一連のパケット演算処理を終了する。

［第１の実施の形態の効果］
　このように、本実施の形態のネットワークカード１０は、バッファ１３を、メモリアクセス速度または記憶容量を含む物理的性能が異なるバッファから構成し、バッファ制御回路１４が、物理ポート１１が受信したパケットのヘッダ情報から特定した、パケットの優先度またはサービス品質と、バッファ１３の物理的性能とに基づいて、バッファ１３のうちからパケットの蓄積先となるバッファ１３を選択するように構成したものである。

　これにより、優先度またはサービス品質が高いパケットは、バッファ１３のうちメモリアクセス速度が比較的高速なバッファへ格納され、優先度またはサービス品質が低いパケットは、メモリアクセス速度が比較的低速なバッファへ格納される。したがって、優先度またはサービス品質が高いパケットの処理時間を短縮することができるとともに、優先度またはサービス品質が低いパケットの処理は演算処理回路１２の負荷が軽い時間に実施することで、システム全体の負荷を平準化することができる。

　また、バッファ１３としてオンボードメモリのみを用いる場合と比較して、メモリアクセスの消費電力が小さなオンチップメモリを活用することができるため、消費電力を削減することができる。また、メモリアクセス速度が速いオンチップメモリを活用することができるため、処理時間を短縮することができる。また、オンボードメモリとオンチップメモリを併用することで、両者を並列動作させることも可能となるため、メモリアクセスの競合を抑制することができる。

　一方、オンチップメモリのみを用いる場合と比較して、記憶容量が大きなオンボードメモリを活用することができるため、データサイズの大きな高精細画像やニューラルネットワークモデルなど、比較的サイズの大きなデータを扱うアプリケーションやサービスへ適用することができる。また、オンチップメモリの記憶容量を大きくすると、当該チップの面積も大きくなり、製造過程における歩留まりが悪化したり、リーク電力が増加したり、するのに対し、オンチップメモリの記憶容量を小さくすることが可能となるため、当該チップの面積を縮小でき、製造過程における歩留まりが改良されたり、リーク電力を抑制させたりすることができる。また、オンボードメモリとオンチップメモリを併用することで、両者を並列動作させることも可能となるため、メモリアクセスの競合を抑制することができる。

　また、パケットの優先度に応じて蓄積先のバッファ１３が選択されるため、最高優先のパケットの蓄積先として、高速なメモリアクセスが可能なオンチップメモリを選択でき、処理時間を低減することができる。また、優先度の低いパケットの蓄積先として、記憶容量の大きいオンボードメモリを選択できる。これにより、優先度の高いパケットを、記憶容量の小さなオンチップメモリに優先的に蓄積することができるため、オンチップメモリ量を増やすことなく、サービス品質を改善することができる。

　また、パケットのサービス内容に応じて蓄積先のバッファ１３が選択されるため、低遅延が要求されるサービスのパケットの蓄積先として、高速なメモリアクセスが可能なオンチップメモリを優先的に選択でき、処理時間の増大を抑制することができる。また、比較的遅延要求が緩いサービスのパケットの蓄積先として、記憶容量の大きいオンボードバッファを選択できる。これにより、トラヒックが混雑している状況においても、サービス品質の低下を抑制でき、オンチップメモリの記憶容量を増やすことなく、サービス品質を改善することができる。

［第２の実施の形態］
　次に、図４を参照して、本発明の第２の実施の形態にかかるネットワークカード１０について説明する。図４は、第２の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。
　第１の実施の形態との違いは、バッファ制御回路１４が、ヘッダ抽出回路１４Ａに代えてモニタ回路１４Ｄを備えている点である。

　すなわち、図４に示すように、本実施の形態において、モニタ回路１４Ｄは、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのトラヒック量（データトラヒック量）などの、ネットワークカード１０全体でのパケット処理状況を監視し、得られたパケット監視情報が予め設定されている閾値を超えているか否かを判定するように構成されている。
　また、バッファ制御回路１４（バッファ選択回路１４Ｂ）は、モニタ回路１４Ｄでの閾値判定結果に基づき、パケットの蓄積先を選択するように構成されている。

　例えば、パケット処理状況としてバッファ１３のバッファ蓄積量を用い、モニタ回路１４Ｄでバッファ蓄積量が閾値を超えていないと判定された場合、バッファ制御回路１４は、メモリアクセス速度が比較的高速なバッファ（オンチップバッファや内部バッファ）をパケットの蓄積先として選択する。また、モニタ回路１４Ｄでバッファ蓄積量の閾値を超えていると判定された場合、バッファ制御回路１４は、メモリアクセス速度が比較的低速ではあるが、記憶容量が大きなバッファ（オンボードバッファや外付けバッファ）をパケットの蓄積先として選択する。

　なお、上記の例では、パケットの蓄積先を選択する場合、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのトラヒック量など、ネットワークカード１０全体のパケット処理状況に基づいて、蓄積先を動的に変更する例を示したが、これに限定されるものではない。例えば、物理ポート１１ごとのパケット処理状況に基づいてパケットの蓄積先を選択することもある。この際、モニタ回路１４Ｄで、物理ポート１１ごとにバッファ蓄積量やトラヒック量をモニタして、それぞれの閾値で閾値処理し、得られた比較結果に応じて蓄積先を先駆してもよい。さらには、ネットワークカード１０全体のパケット処理状況と物理ポート１１ごとのパケット処理状況の両方に基づいて、パケットの蓄積先を選択してもよい。

［第２の実施の形態の動作］
　次に、図５を参照して、第２の実施の形態にかかるネットワークカードの動作について説明する。図５は、第２の実施の形態にかかるネットワークカードのバッファ制御方法の動作を示すフローチャートである。
　図５に示す動作は、前述した図３と比較して、ステップＳ１０１，Ｓ１０２に代えて、ステップＳ２００，Ｓ２０１が設けられている点が異なる。図５におけるその他のステップについては、図３と同様であり、ここでの説明は省略する。

　図５に示すように、ステップＳ１００において、物理ポート１１が、伝送路Ｌを介してパケットを受信した後、バッファ制御回路は、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのトラヒック量などのパケット処理状況を監視（モニタ）し、得られたパケット監視情報を取得する（ステップＳ２００）。
　次に、バッファ制御回路は、得られたパケット監視情報を予め設定されている閾値と比較し、得られた比較結果に基づいて、各バッファ１３のうちからパケットを蓄積すべきバッファ１３を選択し（ステップＳ２０１）、前述したステップＳ１０３へ移行する。

　例えば、パケット監視情報としてバッファ蓄積量を監視する場合、バッファ蓄積量が閾値を超えていない場合は、バッファ制御回路は、蓄積先としてメモリアクセス速度が比較的高速なバッファ１３を選択する。また、バッファ蓄積量の閾値を超えている場合、バッファ制御回路は、メモリアクセス速度が比較的低速ではあるが、記憶容量が大きなバッファ１３を選択する。
　なお、上記の例では、パケット監視情報としてネットワークカード１０全体のバッファ蓄積量やトラヒック量を用いる例を示したが、物理ポート１１ごとのバッファ蓄積量やトラヒック量を用いてもよい。例えば、物理ポート１１ごとにバッファ蓄積量やトラヒック量を、パケット監視情報として監視してそれぞれの閾値と比較し、得られた比較結果を蓄積先バッファの選択に用いることもある。

［第２の実施の形態の効果］
　このように、本実施の形態のネットワークカード１０は、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのパケットのトラヒック量など、ネットワークカード１０全体のパケット処理状況を監視し、得られたパケット監視情報を予め設定されている閾値と比較するモニタ回路１４Ｄを備え、バッファ制御回路が、モニタ回路１４Ｄで得られた比較結果に基づいて、パケットの蓄積先を選択するように構成したものである。

　これにより、例えば、パケット監視情報としてバッファ蓄積量を用いた場合、蓄積先のバッファ１３として、記憶容量の小さいオンチップメモリを優先的に使いつつも、バッファ蓄積量が多くなった場合、記憶容量の大きいオンボードメモリへ蓄積することができる。このため、バッファ溢れを抑制することができ、バッファ溢れによる再送を回避することができる。また、バッファ溢れに伴うバックプレッシャをかけるなど、処理時間の増大を抑制することができ、これに伴い、サービス品質を改善することができる。

　また、例えば、パケット監視情報としてトラヒック量を用いた場合、トラヒック量が多い場合には、蓄積先の１３バッファとして、記憶容量の大きなオンボードメモリを使うことができ、パケットロスやバッファ溢れを抑制することができる。一方、トラヒック量が少ない場合には、高速なメモリアクセスができるオンチップメモリを使えるようになるため、処理時間が増大することを抑制することができる。また、パケットロスを抑制することで、再送などの不要なトラヒックの発生を抑制できるので、ネットワーク負荷を軽減することができる。また、これに伴い、サービス品質を改善することができる。

［第３の実施の形態］
　次に、図６を参照して、本発明の第３の実施の形態にかかるネットワークカードの構成について説明する。図６は、第３の実施の形態にかかるバッファ制御回路の構成を示すブロック図である。
　第１、第２の実施の形態との違いは、バッファ制御回路１４が、ヘッダ抽出回路１４Ａとモニタ回路１４Ｄの両方を備えている点である。

　すなわち、図６に示すように、本実施の形態において、ヘッダ抽出回路１４Ａは、物理ポート１１から入力されたパケットについて、当該パケットのパケットヘッダに格納されているヘッダ情報を解析して抽出するように構成されている。具体的には、当該パケットの優先度やユーザＩＤ、当該パケットに対して施すべき演算の内容を特定する情報を、当該パケットの所定フィールドからヘッダ情報として抽出する。

　また、モニタ回路１４Ｄは、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのトラヒック量などの、ネットワークカード１０全体でのパケット処理状況を監視し、得られたパケット監視情報が予め設定されている閾値を超えているか否かを判定するように構成されている。
　また、バッファ制御回路１４（バッファ選択回路１４Ｂ）は、モニタ回路１４Ｄでの閾値判定結果に基づき、パケットの蓄積先を選択するように構成されている。

　ここで、バッファ制御回路１４でのバッファ選択例について説明する。図７は、バッファ選択基準例を示す説明図である。図８は、バッファ選択動作例（バッファ蓄積量）を示すグラフであり、バッファ処理情報としてバッファ蓄積量を用いた例が示されている。例えば、図７に示すように、パケットの優先度として高・中・低のように３段階設定されており、バッファ１３として物理的性能が異なる２つのバッファＨ，Ｌが設けられている構成を想定する。パケット監視情報として、バッファ１３全体でのバッファ蓄積量と、物理ポート１１全体でのトラヒック量とが用いられる。

　この構成において、図８に示すように、バッファ蓄積量が閾値を超えていない場合、バッファ制御回路１４は、図７の選択基準Ａに基づいて、高・中優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨ（オンチップバッファ）を選択し、低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。一方、バッファ蓄積量の閾値を超えている場合、バッファ制御回路１４は、図７の選択基準Ｂに基づいて、高優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、中・低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。

　また、トラヒック量が閾値を超えていない場合、バッファ制御回路１４は、図８の選択基準Ａに基づいて、高・中優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。一方、トラヒック量の閾値を超えている場合、バッファ制御回路１４は、図８の選択基準Ｂに基づいて、高優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、中・低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。

　なお、上記の例ではパケットの優先度に応じてパケットの蓄積先を選択する場合、その蓄積先をバッファ蓄積量やトラヒック量に応じて動的に変更する例を示したが、必ずしもパケットの優先度に応じて蓄積先を選択しなくともよい。例えば、パケットの処理内容に基づいてパケットの蓄積先を選択する場合は、処理内容ごとにバッファ蓄積量やトラヒック量をモニタしてそれぞれの閾値と閾値処理することもある。また、ユーザＩＤに基づきパケットの蓄積先を選択する場合は、ユーザＩＤごとにバッファ蓄積量やトラヒック量をモニタしてそれぞれの閾値と閾値処理することもある。また、物理ポート１１に基づきパケットの蓄積先を選択する場合は、物理ポート１１ごとにバッファ蓄積量やトラヒック量をモニタしてそれぞれの閾値と閾値処理することもある。

［第３の実施の形態の動作］
　次に、図９を参照して、第３の実施の形態にかかるネットワークカードのバッファ制御方法の動作について説明する。図９は、第３の実施の形態にかかるネットワークカードの動作を示すフローチャートである。
　図９に示す動作は、前述した図３と比較して、ステップＳ１０２に代えて、ステップＳ３００，Ｓ３０１が設けられている点が異なる。図９におけるその他のステップについては、図３と同様であり、ここでの説明は省略する。

　図９に示すように、ステップＳ１０１において、バッファ制御回路は、物理ポート１１から入力されたパケットからヘッダ情報を抽出し、当該パケットの優先度を示す情報やユーザＩＤ、当該パケットに対して施すべき演算処理の内容を特定する情報などを取得する。

　また、バッファ制御回路は、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのトラヒック量などのパケット処理状況を監視（モニタ）し、得られたパケット監視情報を取得する（ステップＳ３００）。
　次に、バッファ制御回路は、得られたパケット監視情報を予め設定されている閾値と比較し、得られた比較結果とヘッダ情報とに基づいて、各バッファ１３のうちからパケットを蓄積すべきバッファ１３を選択し（ステップＳ３０１）、前述したステップＳ１０３へ移行する。

　この際、バッファ制御回路１４は、図７に示したように、パケットの優先度として高・中・低のように３段階設定されており、バッファ１３として物理的性能が異なる２つのバッファＨ，Ｌが設けられている構成を想定すると、バッファ蓄積量が閾値を超えていない場合、バッファ制御回路１４は、図７の選択基準Ａに基づいて、高・中優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨ（オンチップバッファ）を選択し、低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。一方、バッファ蓄積量の閾値を超えている場合、バッファ制御回路１４は、図７の選択基準Ｂに基づいて、高優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、中・低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。

　また、トラヒック量が閾値を超えていない場合、バッファ制御回路１４は、図７の選択基準Ａに基づいて、高・中優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。一方、トラヒック量の閾値を超えている場合、バッファ制御回路１４は、図７の選択基準Ｂに基づいて、高優先パケットの蓄積先として、メモリアクセス速度が比較的高速なバッファＨを選択し、中・低優先パケットの蓄積先として、メモリアクセス速度が比較的低速なバッファＬを選択する。

　なお、上記の例では、パケット監視情報としてネットワークカード１０全体のバッファ蓄積量やトラヒック量を用いる例を示したが、物理ポート１１ごとのバッファ蓄積量やトラヒック量を用いてもよい。例えば、物理ポート１１ごとにバッファ蓄積量やトラヒック量を、パケット監視情報として監視してそれぞれの閾値と比較し、得られた比較結果を蓄積先のバッファ１３の選択に用いることもある。

［第３の実施の形態の効果］
　このように、本実施の形態のネットワークカード１０は、バッファ制御回路１４が、バッファ１３全体でのバッファ蓄積量や、物理ポート１１全体でのパケットのトラヒック量など、ネットワークカード１０全体のパケット処理状況を監視し、得られたパケット監視情報を予め設定されている閾値と比較した比較結果と、パケットのヘッダ情報から特定した、パケットの優先度またはサービス品質とに基づいて、パケットの蓄積先を選択するように構成したものである。

　これにより、バッファ蓄積量やトラヒック量などのパケット監視情報と、パケットの優先度またはサービス品質との組み合わせごとに、物理的性能の異なるバッファ１３を選択することができる。このため、ネットワークカード１０全体のパケット処理状況に応じて、優先度またはサービス品質が異なるパケットを、最適なバッファ１３に蓄積することができる。したがって、通信ネットワークの優先制御とパケットに対する演算処理の割り当て制御とを融合することができ、結果として、パケットに対して演算処理を効率よく実行することが可能となる。

　また、パケットの優先度に応じて蓄積先のバッファ１３が選択されるため、最高優先のパケットの蓄積先として、高速なメモリアクセスが可能なオンチップメモリを優先的に選択でき、処理時間を低減することができる。また、優先度の低いパケットの蓄積先として、記憶容量の大きいオンボードメモリを選択できる。これにより、優先度の高いパケットを、記憶容量の小さなオンチップメモリに優先的に蓄積することができるため、オンチップメモリ量を増やすことなく、サービス品質を改善することができる。

　また、パケット監視情報としてバッファ蓄積量を用いた場合、パケットの蓄積先バッファとして、記憶容量の小さいオンチップメモリを優先的に使いつつも、バッファ蓄積量が多くなった場合、記憶容量の大きいオンボードメモリへ蓄積することができる。このため、バッファ溢れを抑制することができ、バッファ溢れによる再送を回避することができる。また、バッファ溢れに伴うバックプレッシャをかけるなど、処理時間の増大を抑制することができ、これに伴い、サービス品質を改善することができる。

　また、パケット監視情報としてトラヒック量を用いた場合、トラヒック量が多い場合には、パケットの蓄積先バッファとして、記憶容量の大きなオンボードメモリを使うことができ、パケットロスやバッファ溢れを抑制することができる。一方、トラヒック量が少ない場合には、高速なメモリアクセスができるオンチップメモリを使えるようになるため、処理時間が増大することを抑制することができる。また、パケットロスを抑制することで、再送などの不要なトラヒックの発生を抑制できるので、ネットワーク負荷を軽減することができる。また、これに伴い、サービス品質を改善することができる。

　また、トラヒック量に応じて、蓄積先としてオンチップメモリまたはオンボードメモリを選択する選択基準を変更することができる。したがって、トラヒック量が多い場合には、最高優先パケットの蓄積先としてオンチップメモリを選択できるため、処理時間の増大を抑制でき、サービス品質の低下を抑制することができる。一方、トラヒック量が少ない場合には、最高優先および高優先パケットの蓄積先としてオンチップメモリを選択できるため、高優先パケットの処理時間を短縮しつつ、消費電力を削減することができる。

［実施の形態の拡張］
　以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。また、各実施形態については、矛盾しない範囲で任意に組み合わせて実施することができる。

　１０…ネットワークカード、１１…物理ポート、１２…演算処理回路、１３…バッファ１３…バッファ制御回路、１４Ａ…ヘッダ抽出回路、１４Ｂ…バッファ選択回路、１４Ｃ…バッファ入出力回路、１４Ｄ…モニタ回路、Ｌ…伝送路。

Claims

　伝送路を介してパケットを受信および送信するように構成された複数の物理ポートと、
　前記複数の物理ポートが受信した第１のパケットを一時的に蓄積するように構成された複数のバッファと、
　前記複数のバッファから読み出された第２のパケットに対して所定の演算処理を行うように構成された複数の演算処理回路と、
　前記複数のバッファのいずれかに前記第１のパケットを格納し、前記第２のパケットに関する、前記演算処理回路への割り当ておよび前記バッファからの読み出しを制御するように構成されたバッファ制御回路とを備え、
　前記複数のバッファは、メモリアクセス速度または記憶容量を含む物理的性能が異なるバッファからなり、
　前記バッファ制御回路は、前記第１のパケットのヘッダ情報に基づいて、前記第１のパケットの優先度またはサービス品質を特定し、得られた優先度またはサービス品質と、前記複数のバッファの物理的性能とに基づいて、前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択する
　ことを特徴とするネットワークカード。
　請求項１に記載のネットワークカードにおいて、
　前記バッファ制御回路は、前記第１のパケットの優先度またはサービス品質が高いほど、前記複数のバッファのうちからメモリアクセス速度が高速なバッファを選択することを特徴とするネットワークカード。
　請求項１または請求項２に記載のネットワークカードにおいて、
　前記バッファ制御回路は、前記第１のパケットの優先度またはサービス品質が低いほど、前記複数のバッファのうちから記憶容量が大きいバッファを選択することを特徴とするネットワークカード。
　請求項１～請求項３のいずれかに記載のネットワークカードにおいて、
　前記バッファ制御回路は、前記複数のバッファのバッファ蓄積量または前記複数の物理ポートのトラヒック量を監視し、得られたパケット監視情報に基づいて前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択することを特徴とするネットワークカード。
　請求項１～請求項３のいずれかに記載のネットワークカードにおいて、
　前記バッファ制御回路は、前記複数のバッファのバッファ蓄積量または前記複数の物理ポートのトラヒック量を監視し、得られたパケット監視情報と前記第１のパケットの優先度またはサービス品質とに基づいて前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択することを特徴とするネットワークカード。
　伝送路を介してパケットを受信および送信するように構成された複数の物理ポートと、前記複数の物理ポートが受信した第１のパケットを一時的に蓄積するように構成された、メモリアクセス速度または記憶容量を含む物理的性能が異なる、複数のバッファと、前記複数のバッファから読み出された第２のパケットに対して所定の演算処理を行うように構成された複数の演算処理回路と、前記複数のバッファのいずれかに前記第１のパケットを格納し、前記第２のパケットに関する、前記演算処理回路への割り当ておよび前記バッファからの読み出しを制御するように構成されたバッファ制御回路とを備えるネットワークカードで用いられるバッファ制御方法であって、
　前記バッファ制御回路が、前記第１のパケットのヘッダ情報に基づいて、前記第１のパケットの優先度またはサービス品質を特定する第１のステップと、
　前記バッファ制御回路が、得られた優先度またはサービス品質と、前記複数のバッファの物理的性能とに基づいて、前記複数のバッファのうちから前記第１のパケットの蓄積先となるバッファを選択する第２のステップと
　を備えることを特徴とするバッファ制御方法。