WO2022269786A1 - 通信データ識別装置およびその方法 - Google Patents

通信データ識別装置およびその方法 Download PDF

Info

Publication number
WO2022269786A1
WO2022269786A1 PCT/JP2021/023724 JP2021023724W WO2022269786A1 WO 2022269786 A1 WO2022269786 A1 WO 2022269786A1 JP 2021023724 W JP2021023724 W JP 2021023724W WO 2022269786 A1 WO2022269786 A1 WO 2022269786A1
Authority
WO
WIPO (PCT)
Prior art keywords
communication data
data identification
identification device
field values
hash
Prior art date
Application number
PCT/JP2021/023724
Other languages
English (en)
French (fr)
Inventor
悠介 関原
寛之 鵜澤
奈美子 池田
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to PCT/JP2021/023724 priority Critical patent/WO2022269786A1/ja
Priority to JP2023529304A priority patent/JPWO2022269786A1/ja
Publication of WO2022269786A1 publication Critical patent/WO2022269786A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/18Multiprotocol handlers, e.g. single devices capable of handling multiple protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • H04L45/7453Address table lookup; Address filtering using hashing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers

Definitions

  • the present invention relates to a communication data identification device and method used for packet transmission and reception.
  • TCAM Ternary Content Addressable Memory
  • Patent Document 1 a technique for identifying a flow by computing a hash value for each field of a packet header has been disclosed.
  • the primitive method of executing hash calculations on all fields to be analyzed can support various protocols, but on the other hand, it has the problem of requiring a large amount of hash calculation resources.
  • the communication data identification device includes a header analysis unit that divides the header of a received packet into field values, and a hash operation that performs a hash operation based on the field values. and a part.
  • a communication data identification method comprises a step of dividing a header of a received packet into field values, and a step of performing a hash operation based on the field values.
  • FIG. 1 is a block diagram showing the configuration of a communication data identification device according to the first embodiment of the present invention.
  • FIG. 2 is a diagram for explaining the operation of the communication data identification device according to the first embodiment of the present invention.
  • FIG. 3 is a diagram for explaining the operation of a conventional communication data identification device.
  • FIG. 4 is a diagram for explaining the operation of the communication data identification device according to the first embodiment of the present invention.
  • FIG. 5 is a diagram for explaining the operation of the communication data identification device according to the first embodiment of the present invention.
  • FIG. 6A is a diagram for explaining the operation of the communication data identification device according to the first embodiment of the present invention;
  • FIG. 6B is a diagram for explaining the operation of the communication data identification device according to the first embodiment of the present invention;
  • Communication data identification apparatus 10 includes, as shown in FIG. 1, header analysis section 11 and a plurality of hash calculation sections 12 connected in parallel to the header analysis section.
  • Fig. 2 shows an example of the data structure of a packet to be analyzed.
  • the packet data 1 consists of a data body 2 and header data (header) 3 required for transmission/reception.
  • header data header data
  • each header 3 has meaning for each arbitrary number of bits.
  • This meaningful bit segment is hereinafter referred to as field value 4 .
  • a group of packets whose field value 4 matches is called a flow.
  • a packet to be analyzed is input to the header analysis unit 11 .
  • the header analysis unit 11 reads the header configuration of each packet and divides the packet into the field value 4 of each header 3 and the data value of the data body 2 .
  • each field value 4 is hashed by a parallelized individual hash calculator 12 in order to support a high-speed network.
  • hash calculation is executed for each field value.
  • field values of protocols having the same function in the OSI reference model are calculated by the same hash calculator.
  • L2VPN Protocol 1 and “L2VPN Protocol 2” have the same function in the OSI reference model, so they are calculated by the same hash calculator.
  • the same hash calculation unit performs hash calculation on field values having the same function in the same layer in the OSI reference model.
  • the protocol provides transport over networks based on the OSI reference model. At this time, except for protocols that provide specific functions such as encryption, the same transport protocol at the same layer is rarely applied. Therefore, in the same layer such as VPN, a plurality of protocols providing the same function can share the hash calculator.
  • the communication data identification device 10 assigns an identification bit to each field value of the same layer and the same function.
  • the protocol to be hashed is identified, and the hash calculator is shared by multiple protocols that provide the same function in the same layer. be able to.
  • Fig. 5 shows an example of a protocol that provides the same functions. This embodiment is not limited to this, and can be similarly applied among a plurality of protocols that provide equivalent functions.
  • the format of the input data to the hash calculation unit must be the same.
  • the short field value is padded to the same bit length as the long field value.
  • the MPLS label field value is padded in area 21 .
  • the input data when treated as the same data format, the input data may be the same between different field values, which may cause false detection.
  • each field value having the same function in the same layer is given an identification bit. For example, in FIG. 6A, as the identification bit 22, "1" and "0" are added to the beginning of each field value.
  • the identification bit is a bit string with a sufficient length to identify field values that share the hash calculation part, and is attached to areas that can be easily identified within the field value, such as the beginning and end.
  • the field values of protocols that provide the same functions in the OSI reference model can be calculated by the same hash calculation unit, and the calculation resources required for the hash calculation unit for identifying each packet can be reduced.
  • the communication data identification device and method according to the present embodiment it is possible to reduce computational resources and identify packets in which a plurality of different protocols coexist at high speed.
  • the corresponding protocol was exemplified, but the protocol is not limited to this, and any protocol that provides similar functions on the network may be used.
  • hash operations are not limited to spatial parallelization, and the same applies to temporal parallelization such as pipelines.
  • all or part of the embodiments of the present invention may be implemented as hardware circuits or as software using a CPU.
  • the present invention relates to a communication data identification device and method, and can be applied to a packet transmission/reception system in a communication network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本発明の通信データ識別装置(10)は、受信したパケットのヘッダをフィールド値に分割するヘッダ解析部(11)と、フィールド値に基づき、ハッシュ演算を実行するハッシュ演算部(12)とを備える。 これにより、本発明は、演算リソースを低減して、複数の異なるプロトコルが混在するパケットを識別できる通信データ識別装置およびその方法を提供できる。

Description

通信データ識別装置およびその方法
 本発明は、パケット送受信に用いる通信データ識別装置およびその方法に関する。
 近年、ネットワークの仮想化が進み、複数のネットワークのパケットを単一の装置上で処理する必要がある。このような複数ネットワークのパケットを監視するためには、多様なプロトコルを識別して処理することが重要である。
 このように、多様なプロトコルに対応するため、例えば、比較一致方式であるTCAM(Ternary Content Addressable Memory)が用いられる。しかしながら、TCAMは専用のチップとして実装されるため、高価な専用装置にしか導入できないという問題がある。
 一方、専用チップでないハードウェア及びソフトウェアにおいて、例えば、パケットヘッダのフィールド毎のハッシュ値を演算してフローを特定する技術が開示されている(特許文献1)。
特開2019-9630号公報
 従来方法において、すべての解析対象となるフィールドに対しハッシュ演算を実行するプリミティブな方式は、多様なプロトコルに対応できる反面、ハッシュ演算リソースを大量に要するという問題があった。
 また、特許文献1に開示される方式では、フィールド位置をあらかじめ指定するため、必要最小限のハッシュ演算で実行できる反面、複数の異なるプロトコルが混在する場合には対応できないという問題があった。
 上述したような課題を解決するために、本発明に係る通信データ識別装置は、受信したパケットのヘッダをフィールド値に分割するヘッダ解析部と、前記フィールド値に基づき、ハッシュ演算を実行するハッシュ演算部とを備える。
 また、本発明に係る通信データ識別方法は、受信したパケットのヘッダをフィールド値に分割するステップと、前記フィールド値に基づき、ハッシュ演算を実行するステップとを備える。
 本発明によれば、演算リソースを低減して、複数の異なるプロトコルが混在するパケットを識別できる通信データ識別装置およびその方法を提供できる。
図1は、本発明の第1の実施の形態に係る通信データ識別装置の構成を示すブロック図である。 図2は、本発明の第1の実施の形態に係る通信データ識別装置の動作を説明するための図である。 図3は、従来の通信データ識別装置の動作を説明するための図である。 図4は、本発明の第1の実施の形態に係る通信データ識別装置の動作を説明するための図である。 図5は、本発明の第1の実施の形態に係る通信データ識別装置の動作を説明するための図である。 図6Aは、本発明の第1の実施の形態に係る通信データ識別装置の動作を説明するための図である。 図6Bは、本発明の第1の実施の形態に係る通信データ識別装置の動作を説明するための図である。
<第1の実施の形態>
 本発明の第1の実施の形態に係る通信データ識別装置およびその方法ついて、図1~図6Bを参照して説明する。
<通信データ識別装置の構成>
 本実施の形態に係る通信データ識別装置10は、図1に示すように、ヘッダ解析部11と、ヘッダ解析部に並列に接続する、複数のハッシュ演算部12を備える。
 図2に、解析対象となるパケットのデータ構造の一例を示す。パケットデータ1は、データ本体2と送受信に必要なヘッダデータ(ヘッダ)3で構成されている。ここで、各ヘッダ3内は任意のビット数ごとに意味づけられている。以下、この意味づけられたビット区切りをフィールド値4という。また、フィールド値4が一致するパケットの一群をフローという。
 通信データ識別装置10では、ヘッダ解析部11に、解析対象となるパケットが入力される。
 ヘッダ解析部11は、各パケットのヘッダ構成を読み取り、パケットを各ヘッダ3のフィールド値4とデータ本体2のデータ値に分割する。
 ヘッダ解析部11で分割されたフィールド値4は、ハッシュ演算部12へ通知され、ハッシュ演算部12で各フィールド値4に対応したハッシュ値が演算される。ここで、高速なネットワークへ対応するために、各フィールド値4は並列化された個別のハッシュ演算部12によってハッシュ演算が実行される。
 従来法では、図3に示すように、各フィールド値に対応して、ハッシュ演算が実行される。
 本実施の形態に係る通信データ識別装置10では、図4に示すように、OSI参照モデルにおいて同一機能を有するプロトコルのフィールド値は、同一のハッシュ演算部によって演算される。例えば、図中、「L2VPN Protocol1」と「L2VPN Protocol2」は、OSI参照モデルにおいて同一機能を有するので、同一のハッシュ演算部によって演算される。
 このように、通信データ識別装置10では、フィールド値のうち、OSI参照モデルにおいて同一レイヤで同一機能を有するフィールド値に対して、同一のハッシュ演算部がハッシュ演算を実行する。
 この構成では、ハッシュ演算の特性とプロトコル(フィールド値)との意味づけが利用される。プロトコルは、OSI参照モデルに基づきネットワーク上での転送を提供する。このとき、暗号化などの特定機能を提供するプロトコルを除いて、同一レイヤで同一の転送プロトコルはほとんど適用されない。そこで、VPNなど同一レイヤにおいて、同じ機能を提供する複数のプロトコルに対してハッシュ演算部を共用することができる。
 ここで、単純に同じ演算処理を実行すると、どのプロトコルがハッシュ演算対象となったのかが混同される可能性がある。そこで、ハッシュ演算を共有するプロトコルにおいて、後述のように、先頭に識別ビットを付与する。
 このように、通信データ識別装置10では、同一レイヤで同一機能のフィールド値それぞれに、識別ビットを付与する。
 このように、識別ビットを含めたフィールド値をハッシュ演算することで、ハッシュ演算対象となるプロトコルを識別して、同一レイヤにおいて、同じ機能を提供する複数のプロトコルに対してハッシュ演算部を共用することができる。
 図5に、同一機能を提供するプロトコルの一例を示す。本実施の形態では、これに限らず、同等の機能を提供する複数のプロトコル間で同様に適用できる。
 このように複数のフィールド値の間でハッシュ演算を共有するためには、ハッシュ演算部への入力データの形式が同一であることが必要である。
 そこで、通信データ識別装置では、ハッシュ演算部を共有する異なるフィールド値のうち、短いフィールド値を長いフィールド値と同じビット長となるようパディングする。例えば、図6Aでは、MPLSラベルのフィールド値が、領域21でパディングされる。これにより、各フィールド値は同一のデータ形式として扱うことができる。
 また、同一のデータ形式として扱う場合、異なるフィールド値の間で入力データが同一になり誤検出が生じる可能性がある。
 そこで、通信データ識別装置では、ヘッダ解析部またはハッシュ演算部において、ハッシュ演算部を共有するフィールド値を識別するために、同一レイヤで同一機能のフィールド値それぞれに、識別ビットを付与する。例えば、図6Aでは、識別ビット22として、それぞれのフィールド値の先頭に「1」、「0」が付与される。
 識別ビットは、ハッシュ演算部を共有するフィールド値を識別するために十分な長さを有するビット列であり、先頭や末尾などのフィールド値内で容易に特定できる領域に付与される。
 本実施の形態では、識別ビットに「1」、「0」を用いる例を示したが、識別できる所定の値であればよく、「10」、「111」等でもよい。
 以上の処理により、OSI参照モデルにおいて同一機能を提供するプロトコルのフィールド値を同一のハッシュ演算部で演算でき、各パケットを特定するためのハッシュ演算部に要求される演算リソースを削減できる。
 本実施の形態に係る通信データ識別装置およびその方法によれば、演算リソースを低減して、高速で、複数の異なるプロトコルが混在するパケットを識別できる。
 本実施の形態では、対応するプロトコルを例示したが、これに限らず、ネットワーク上において同様の機能を提供しているプロトコルであればよい。
 また、ハッシュ演算は空間的並列化に限らず、パイプラインなどの時間的並列化においても同様である。
 また、本発明の実施の形態における全てまたは一部を、ハードウェアの回路で実現しても、CPUを用いてソフトウェアとして実現してもよい。
 本発明の実施の形態では、通信データ識別装置の構成、その方法などにおいて、各構成部の構造、寸法、材料等の一例を示したが、これに限らない。通信データ識別装置の機能を発揮し効果を奏するものであればよい。
 本発明は、通信データ識別装置およびその方法に関し、通信ネットワークにおけるパケット送受信システムに適用することができる。
10 通信データ識別装置
11 ヘッダ解析部
12 ハッシュ演算部

Claims (6)

  1.  受信したパケットのヘッダをフィールド値に分割するヘッダ解析部と、
     前記フィールド値に基づき、ハッシュ演算を実行するハッシュ演算部と
    を備える通信データ識別装置。
  2.  前記フィールド値のうち、OSI参照モデルにおいて同一レイヤで同一機能を有するフィールド値に対して、同一の前記ハッシュ演算部がハッシュ演算を実行する
     ことを特徴とする請求項1に記載の通信データ識別装置。
  3.  前記同一レイヤで同一機能のフィールド値それぞれに、識別ビットを付与する
     こと特徴とする請求項2に記載の通信データ識別装置。
  4.  受信したパケットのヘッダをフィールド値に分割するステップと、
     前記フィールド値に基づき、ハッシュ演算を実行するステップと
     を備える通信データ識別方法。
  5.  前記フィールド値のうち、OSI参照モデルにおいて同一レイヤで同一機能のフィールド値に対して、一括でハッシュ演算を実行する
     ことを特徴とする請求項4に記載の通信データ識別方法。
  6.  前記同一レイヤで同一機能のフィールド値それぞれに、識別ビットを付与するステップを備える
     ことを特徴とする請求項5に記載の通信データ識別方法。
PCT/JP2021/023724 2021-06-23 2021-06-23 通信データ識別装置およびその方法 WO2022269786A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/023724 WO2022269786A1 (ja) 2021-06-23 2021-06-23 通信データ識別装置およびその方法
JP2023529304A JPWO2022269786A1 (ja) 2021-06-23 2021-06-23

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/023724 WO2022269786A1 (ja) 2021-06-23 2021-06-23 通信データ識別装置およびその方法

Publications (1)

Publication Number Publication Date
WO2022269786A1 true WO2022269786A1 (ja) 2022-12-29

Family

ID=84545322

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/023724 WO2022269786A1 (ja) 2021-06-23 2021-06-23 通信データ識別装置およびその方法

Country Status (2)

Country Link
JP (1) JPWO2022269786A1 (ja)
WO (1) WO2022269786A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006020317A (ja) * 2004-06-30 2006-01-19 Zarlink Semiconductor Inc 交換環境用の結合パイプライン化パケット分類およびアドレス探索方法および装置
JP2011114820A (ja) * 2009-11-30 2011-06-09 Panasonic Electric Works Co Ltd 発信源追跡システム、パケット特定情報記録装置、追跡管理装置、通信装置のプログラム及び追跡管理装置のプログラム
JP2020509478A (ja) * 2017-02-13 2020-03-26 マイクロソフト テクノロジー ライセンシング,エルエルシー 不正アクセス範囲識別のための多信号分析

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006020317A (ja) * 2004-06-30 2006-01-19 Zarlink Semiconductor Inc 交換環境用の結合パイプライン化パケット分類およびアドレス探索方法および装置
JP2011114820A (ja) * 2009-11-30 2011-06-09 Panasonic Electric Works Co Ltd 発信源追跡システム、パケット特定情報記録装置、追跡管理装置、通信装置のプログラム及び追跡管理装置のプログラム
JP2020509478A (ja) * 2017-02-13 2020-03-26 マイクロソフト テクノロジー ライセンシング,エルエルシー 不正アクセス範囲識別のための多信号分析

Also Published As

Publication number Publication date
JPWO2022269786A1 (ja) 2022-12-29

Similar Documents

Publication Publication Date Title
US8867395B2 (en) Accelerating data packet parsing
US8681819B2 (en) Programmable multifield parser packet
US8176300B2 (en) Method and apparatus for content based searching
US7467406B2 (en) Embedded data set processing
US9356844B2 (en) Efficient application recognition in network traffic
US10708272B1 (en) Optimized hash-based ACL lookup offload
Rizzo Revisiting network I/O APIs: the netmap framework
US10911579B1 (en) Generating programmatically defined fields of metadata for network packets
GB2365668A (en) Network data packet classification and demultiplexing
US9819587B1 (en) Indirect destination determinations to forward tunneled network packets
US20190281018A1 (en) Lsb based symmetric receive-side scaling
KR20120067345A (ko) 데이터 패킷 분석 장치, 데이터 패킷 처리 시스템 및 방법
Rizzo Revisiting Network I/O APIs: The netmap Framework: It is possible to achieve huge performance improvements in the way packet processing is done on modern operating systems.
TWI593256B (zh) 用於靈活封包分類的方法和系統
CN114885045B (zh) 一种在高速智能网卡/dpu内节约dma通道资源方法和装置
US9985885B1 (en) Aggregating common portions of forwarding routes
KR100871731B1 (ko) 네트워크 인터페이스 카드 및 그 카드에서 수행되는 트래픽 분할 처리 방법, 상기 네트워크 인터페이스 카드를 포함하는 다중처리 시스템
JP2009218743A (ja) Ipプロトコル処理装置及びその処理方法
CN108737239B (zh) 一种报文转发方法及装置
WO2022269786A1 (ja) 通信データ識別装置およびその方法
US11294688B2 (en) Parallel information processing on multi-core computing platforms
US10084893B2 (en) Host network controller
EP3610615B1 (en) Packet batch processing with graph-path based pre-classification
KR100864889B1 (ko) Tcp 상태 기반 패킷 필터 장치 및 그 방법
US20090285207A1 (en) System and method for routing packets using tags

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2023529304

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE