CN104023039A - 数据包传输方法和装置 - Google Patents

数据包传输方法和装置 Download PDF

Info

Publication number
CN104023039A
CN104023039A CN201310064524.2A CN201310064524A CN104023039A CN 104023039 A CN104023039 A CN 104023039A CN 201310064524 A CN201310064524 A CN 201310064524A CN 104023039 A CN104023039 A CN 104023039A
Authority
CN
China
Prior art keywords
packet
data
guide
field
gathers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310064524.2A
Other languages
English (en)
Other versions
CN104023039B (zh
Inventor
李严
郑凯
李剑
陈冠诚
李欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN201310064524.2A priority Critical patent/CN104023039B/zh
Publication of CN104023039A publication Critical patent/CN104023039A/zh
Application granted granted Critical
Publication of CN104023039B publication Critical patent/CN104023039B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种数据包传输方法和装置。所述方法包括:确定具有相同目的地并且结构相同的多个常规数据包;确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;在发送所述多个常规数据包之前发送所述先导数据包。本发明实施例的装置与上述方法对应。利用本发明实施例的方法和装置,可以改善数据包传输的效率。

Description

数据包传输方法和装置
技术领域
本发明是涉及数据传输,更具体而言,涉及一种改善了的数据包传输方法和装置。
背景技术
当前,计算机网络越来越普及,并且计算机网络的规模仍在日益扩大。在当前的计算机网络中有数十万台服务器以及存储器。
为了在这种计算机网络中执行大规模任务,诸如大数据集合的计算,已经提出了一种分布式的并行计算架构。在使用这种并行计算架构的计算系统中,通常包括一个主控节点、一个或多个计算节点和一个或多个汇总节点。主控节点将大规模数据计算任务划分为多个规模较小的子任务,确定用于执行任务的计算节点和汇总节点的个数及其位置等,并给每个子任务指定用于完成其的计算节点和汇总节点。计算节点接收并执行给其指定的子任务并将子任务执行完成通知给主控节点。计算节点根据主控节点的指示将中间数据发送给主控节点为其指定的汇总节点。汇总节点根据其从相应的计算节点接收到的中间结果进行适当的合并以获得针对本次任务的计算结果。计算节点和汇总节点都是逻辑节点,其可以位于同一或不同的物理网络节点上。
这种并行计算架构的一个典型例子是GoogleTM公司于2004年发布的用于支持在计算机集群上对大数据集合进行分布式计算的软件架构MapReduce。在MapReduce架构中也包括一个Master(即,主控节点)、一个或多个充当计算节点的Mapper(即,映射节点)和一个或多个充当汇总节点的Reducer。基于MapReduce架构的应用程序在运行时包括从Mapper到Reducer交换中间结果的数据传输(shuffle)阶段。通常,一个Reducer要从多个Mapper取所需要的结果,一个Mapper的结果会被送给多个Reducer.。如果Mapper给每一个Reducer的结果比较大时,就会带来大量的网络传输。对于大规模的计算,可能会有上万个Mapper,每个Mapper的结果可能为GB的量级,这样就会有以T来计算的中间结果在网络上传输,会对网络造成巨大的压力。对于这种由于中间结果巨大,并且其传输在整体执行时间上占据了明显的比例的,可称之为传输关键(shuffle critical)的计算机系统。对于这些传输关键的应用而言,中间结果的传输成为性能的瓶颈,特别是在数据传输很集中的场景下,会严重的影响效率。
由上可见,对于中间数据传输关键的应用来说,需要对其进行改进以提高数据传输的效率。
发明内容
根据本发明的一个方面,提供了一种用于计算节点的数据包发送方法,包括:确定具有相同目的地并且结构相同的多个常规数据包;确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型;在发送所述多个常规数据包之前发送所述先导数据包。
根据本发明的另一个方面,提供了一种用于交换机的数据包处理方法,包括:接收数据包,根据所述数据包中的类型字段确定数据包的类型;响应于所述数据包是先导数据包,解析该先导数据包以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;确定出与所述先导数据包相对应的多个常规数据包;根据所述解析结果将所述多个常规数据包中进行合并;发送合并后的数据包以替换所述多个常规数据包。
根据本发明的第三个方面,提供了一种用于计算节点的数据包发送装置,包括:数据包确定单元,配置为确定具有相同目的地并且结构相同的多个常规数据包;汇总运算确定单元,配置为确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;先导数据包生成单元,配置为生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型;数据包发送单元,配置为在发送所述多个常规数据包之前发送所述先导数据包。
根据本发明的第四方面,提供了一种用于交换机的数据包处理装置,包括:数据包接收单元,配置为接收数据包,根据所述数据包中的类型字段确定数据包的类型;先导数据包解析单元,配置为响应于所述数据包是先导数据包,解析该先导数据包以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;常规数据包确定单元,配置为确定出与所述先导数据包相对应的多个常规数据包;数据包合并单元,配置为根据所述解析结果将所述多个常规数据包中进行合并;发送单元,配置为发送合并后的数据包以替换所述多个常规数据包。
利用本发明实施例的方法和装置,可以明显的改善了数据包传输的效率。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图;
图2示出根据本发明一个实施例的发送数据包的方法的流程图;
图3A示出先导数据包的示例;
图3B示出常规数据包的示例;
图4示出根据本发明一个实施例的用于交换机的数据包处理方法的流程图;
图5示出步骤404的一个实施例;
图6示出根据本发明实施例的用于计算节点数据包发送装置的框图;
图7示出根据本发明实施例的用于交换机的数据包处理装置的框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品(manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
现在参看图2,其示出根据本发明一个实施例的发送数据包的方法流程图。如图2所示,本发明一个实施例中发送数据包的方法包括:
在步骤201中,确定具有相同目的地址并且结构相同的多个常规数据包。
在MapReduce编程模型中,Mapper通过计算产生中间结果数据并进行存储,当Mapper完成运算后,会通知相应的Reducer,然后由该Reducer请求传输中间结果数据,接收到该请求后,计算节点就会以数据包的形式将中间结果传输至相应的Reducer。在一个实施例中,每个Reducer不断通过远程调用(RPC)从获取Mapper的计算任务是否完成,当确认完成时,使用远程调用从Mapper所在主机的磁盘上请求读取这些中间结果数据,从而开始传输中间结果数据。
在传输中间结果数据时,所生成的常规数据包通常具有相同的目的地址相同并且数据结构也相同,而且这些常规数据包还具有连续性以及突发性。
根据本发明的实施例,具有相同目的地是具有相同的目的地址或相同的目的应用程序。
在步骤202中,确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及针对该数据字段的汇总运算类型。
在一个实施例中,通过与作业服务器(Job Tracker)之间的通信,任务服务器(Task Tracker)能够确定出所述多个常规数据包中需要进行汇总计算的数据字段以及相应的汇总运算类型。而且,在数据包这个级别,判断哪些数据包可以进行合并操作并不负责,无需按照TCP/IP等协议对数据包进行解析。
按照本申请的一个实施例,汇总计算类型包括但不限于求和、求差、求积以及求最大值、最小值等运算。
步骤203,生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型。在本申请的一个实施例中,是通过类型字段、汇总运算类型字段记载该些信息,具体而言,所述先导数据包的数据部分包括:用于记载先导数据包标识信息的类型字段,与所述进行汇总运算的至少一个字段相对应的汇总运算类型字段,该汇总运算类型字段记载汇总运算操作类型信息,并通过所述汇总运算类型字段的位置表示所述进行汇总运算的至少一个数据字段的位置信息。通过该先导数据包(Pioneer Packet)定义后续多个常规数据包的格式以及进行合并的规则。
步骤204,在发送所述多个常规数据包之前发送所述先导数据包。
图3A,图3B分别示出先导数据包与常规数据包的示例,以对图2中步骤203进行详细的说明。在图3A以及图3B的示例中,先导数据包与常规数据包的结构相同,均具有报头部分以及数据部分。
报头部分采用的是现有技术中的数据格式,在一个实施例中,报头部分可以包括MAC报头(MAC Hdr),IP报头(IP Hdr),TCP报头(TCP Hdr),以及Hadoop报头(Hadoop Hdr)。本领域技术人员当然可以根据实际需要采用其它类型的报头,在此不做赘述。
数据部分则包括如下字段:
类型字段(TYPE),通过其中所记载的数据包标识信息来表示数据包的类型,在一个具体的实施例中,先导数据包标识信息是01,用于表示该数据包是先导数据包,当然,本领域技术人员也可采用其它字符来区分先导数据包与常规数据包。
汇总运算类型字段(D1),表示常规数据包中相应位置处的数据可进行合并操作的类型。例如,类型#1,表示求和。对于D1,本领域技术人员对于不同的实施例可以得知其所对应的具体内容。
标签字段(TAG),在Hadoop中用于表示该数据包所对应的某个应用,TAG是可选的字段。
序列号字段(ID),表示该数据包的序列号。
和校验字段(CRC),用于进行和校验的字段。
合并总数字段(TN),是合并后的数据包所对应着被合并的数据包的数目。
上述信息需要在Mapper以及Reducer端进行一致的定义,作为两者能够在数据包的发送与接收中的通信协议。
图3B示出的是一个常规数据包的格式。在其数据部分的类型字段记载了常规数据包标识信息,只要该字段所记载的信息不同于先导数据包标识信息即可通过该字段标识出常规数据包。
现在参看图4,其示出根据本发明一个实施例的在交换机中对所接收到多个数据包进行合并的方法的流程图。如图4所示,该方法包括:
在步骤401中,接收数据包,根据所述数据包中的类型字段判断该数据包的类型。在一个具体的实施方式中,响应于该数据包中的类型字段包括先导数据包标识信息,确定该数据包是先导数据包;响应于该数据包中的类型字段未包括先导数据包标识信息,确定该数据包是常规数据包。
响应于所述数据包是先导数据包,则进入步骤402,解析该先导数据包,以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型。在一个实施例中,是根据预定义的运算规则库(Predefined Operation Pool)的内容来分析先导数据包得知数据包格式,其中,所述运算规则库包括前述对数据包中各种字段的定义。
在步骤403中,确定出与所述先导数据包相对应的多个常规数据包。
在一个实施方式中,可以对进行合并的多个数据包的数量进行任意设定。接下来,还描述步骤了403的另一个具体的实现方式,其具体可以包括子步骤403A以及步骤403B。
响应于该数据包是常规数据包,则进入步骤403A,将该常规数据包放入交换机的缓存中。
一个先导数据包的后面会跟随着多个相应的常规数据包,通常是在交换机的缓存中收集常规数据包进入。根据所解析的与该常规数据包相对应的先导数据包可以得知这些常规数据包的格式,以及进行汇总的字段及汇总的类型。
在步骤403B,判断计时器是否计满,如果不是则返回步骤401中继续接收数据包,如果计时器满,则进入步骤404进行数据包的合并。
当多个常规数据包在交换机中进行合并时,还需要确定出进行合并的常规数据包的个数。由于mapper的结果并不是同时到交换机中,选取得过多,可能造成等待的时间比较长,如果选取得过少,则性能优化提高不明显,因此,在一个改进的实施例中可设定一个时间窗口,可以预设或者由用户指定该时间窗口大小,当超过该时间窗口大小时,则对已经收集到的常规数据包进行合并。藉此,通过计时器协助判断窗口期:从缓存第一个常规数据包开始计时,累积到预设的数值时进入步骤403。
在步骤404中,根据所述解析结果对所述多个常规数据包进行合并。在该步骤中,是在数据包层级将后续多个数据包中与该规则标志字段所对应的数据进行合并。
接下来以图5对步骤404进行详细的说明。在图5中,数据包1以及数据包2中的字段“35”与字段“56”求和之后为“91”,字段“84”与“4”求和之后为“88”。数据包3是合并之后的数据包,其中TN字段的数值为“02”,表示该数据包是由两个常规数据包合并而成,TN可用于校验是否有丢包。在一个实施例中,如果发生了丢包,则重新发送数据包。还包括重新对合并后的数据包进行编号,例如,“0x01”标识合并后的数据包的编号,可以取代之前被合并的数据包的编号。
在步骤405中,发送合并后的数据包以替换所述多个常规数据包。
当对多个mapper结果进行合并以减少网络传输,在哪一层做非常重要,现有技术的做法是在应用层做,这样,每一个mapper的结果首先经历了7层(osimodel)网络打包过程,然后又经历了7层解包过程,当合并完成后,需要再经历7层(osi model)网络打包过程,这其中的开销是非常大的,因为每一层都有特定的操作要做,因此,现有技术存在着开销大的问题。
而现有技术中的交换机仅能进行路由,并没有对数据进行合并可能以及需要。当采用本申请的技术方案时,不需要对数据包的各个层级进行解析,在数据包层级通过简单的判断就能够确定出进行合并的多个常规数据包已经相应的汇总运算类型,因此,采用本申请所提出的方案可以有效的改善对于传输关键的应用的数据传,很大的节省了系统的开销。
基于同一发明构思,本发明的实施例还提供了一种用于计算节点的数据包发送装置。图6示出了根据本发明一个实施例的用于计算节点的数据包发送装置的示意性框图。如图6所示,该装置包括:
数据包确定单元601,配置为确定具有相同目的地并且结构相同的多个常规数据包;汇总运算确定单元602,配置为确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;先导数据包生成单元603,配置为生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型;数据包发送单元604,配置为在发送所述多个常规数据包之前发送所述先导数据包。
在一个实施例中,先导数据包生成单元603还被配置为在所述先导数据包的数据部分包括:记载先导数据包标识信息的类型字段,与所述进行汇总运算的至少一个数据字段相对应的汇总运算类型字段,并通过所述汇总运算类型字段的位置表示所述进行汇总运算的至少一个数据字段的位置信息。
在另一个实施例中,所述相同目的地是具有相同的目的地址和/或相同的目的应用程序。
在一个实施例中,所述汇总运算类型包括以下运算之一:求和、求差、求积、计算最大值、计算最小值。
本发明的实施例还提供了一种用于交换机的数据包处理装置。图7示出了根据本发明一个实施例的用户交换机的数据包处理装置。如图7所以,该装置包括:
数据包接收单元701,配置为接收数据包,根据所述数据包中的类型字段确定数据包的类型;先导数据包解析单元702,配置为响应于所述数据包是先导数据包,解析该先导数据包以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;常规数据包确定单元703,配置为确定出与所述先导数据包相对应的多个常规数据包;数据包合并单元704,配置为根据所述解析结果将所述多个常规数据包中进行合并;数据包发送单元,配置为发送合并后的数据包以替换所述多个常规数据包。
在一个实施例中,还包括:配置为响应于该数据包中的所述第一字段并未记载所述先导数据包标识位,确定该数据包为常规数据包的单元。
根据一个实施例,所述常规数据包确定单元是根据设定的时间窗口确定出与所述先导数据包相对应的多个常规数据包
根据一个实施例,所述先导数据包还包括记载合并数目统计字段,所述装置还包括配置为根据所述合并数目字段检验出丢包时,则重新发送所述多个常规数据包的单元。
以MapReduce编程模型为例,可在任务服务器(Tasktracker)中包括图6中的各个单元,而在交换机包括图7中的各个单元。所述增强的交换机连接多个Mapper节点以及与该多个Mapper节点对应的至少一个Reducer节点。虽然此处MapReduce为例进行说明,但所属领域技术人员明了,任何传输关键的,并且具有连续的结构相同的数据包的计算系统均可采用本申请的技术方案。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (16)

1.一种用于计算节点的数据包发送方法,包括:
确定具有相同目的地并且结构相同的多个常规数据包;
确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;
生成与所述多个常规数据包相对应的并且结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型;
在发送所述多个常规数据包之前发送所述先导数据包。
2.根据权利要求1所述的方法,其中,所述先导数据包的数据部分包括:记载先导数据包标识信息的类型字段,与所述进行汇总运算的至少一个数据字段相对应的汇总运算类型字段,并通过所述汇总运算类型字段的位置表示所述进行汇总运算的至少一个数据字段的位置信息。
3.根据权利要求1所述的方法,其中,所述相同目的地是具有相同的目的地址或相同的目的应用程序。
4.根据权利要求1所述的方法,所述汇总运算类型包括以下运算之一:求和、求差、求积、计算最大值、计算最小值。
5.一种用于交换机的数据包处理方法,包括:
接收数据包,根据所述数据包中的类型字段确定数据包的类型;
响应于所述数据包是先导数据包,解析该先导数据包以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;
确定出与所述先导数据包相对应的多个常规数据包;
根据所述解析结果将所述多个常规数据包进行合并;
发送合并后的数据包以替换所述多个常规数据包。
6.根据权利要求4所述的方法,还包括:
响应于该数据包中的所述第一字段并未记载所述先导数据包标识位,确定该数据包为常规数据包。
7.根据权利要求4所述的方法,根据设定的时间窗口确定出与所述先导数据包相对应的多个常规数据包。
8.根据权利要求4所述的方法,还包括:
所述先导数据包还包括记载合并数目字段;
根据所述合并数目字段检验出丢包时,则重新发送所述多个常规数据包。
9.一种用于计算节点的数据包发送装置,包括:
数据包确定单元,配置为确定具有相同目的地并且结构相同的多个常规数据包;
汇总运算确定单元,配置为确定所述多个常规数据包在汇总节点进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;
先导数据包生成单元,配置为生成与所述多个常规数据包结构相同的先导数据包,在所述先导数据包中记载所确定的所述进行汇总运算的至少一个数据字段的位置信息以及该数据字段的汇总运算类型;
数据包发送单元,配置为在发送所述多个常规数据包之前发送所述先导数据包。
10.根据权利要求9所述的装置,其中,先导数据包生成单元还被配置为在所述先导数据包的数据部分包括:记载先导数据包标识信息的类型字段,与所述进行汇总运算的至少一个数据字段相对应的汇总运算类型字段,并通过所述汇总运算类型字段的位置表示所述进行汇总运算的至少一个数据字段的位置信息。
11.根据权利要求9所述的装置,其中,所述相同目的地是具有相同的目的地址和/或相同的目的应用程序。
12.根据权利要求9所述的装置,所述汇总运算类型包括以下运算之一:求和、求差、求积、计算最大值、计算最小值。
13.一种用于交换机的数据包处理装置,包括:
数据包接收单元,配置为接收数据包,根据所述数据包中的类型字段确定数据包的类型;
先导数据包解析单元,配置为响应于所述数据包是先导数据包,解析该先导数据包以确定出与该先导数据包相对应的多个常规数据包之间进行汇总运算的至少一个数据字段以及该数据字段的汇总运算类型;
常规数据包确定单元,配置为确定出与所述先导数据包相对应的多个常规数据包;
数据包合并单元,配置为根据所述解析结果将所述多个常规数据包进行合并;
发送单元,配置为发送合并后的数据包以替换所述多个常规数据包。
14.根据权利要求13所述的装置,还包括:
配置为响应于该数据包中的所述第一字段并未记载所述先导数据包标识位,确定该数据包为常规数据包的单元。
15.根据权利要求13所述的装置,所述常规数据包确定单元是根据设定的时间窗口确定出与所述先导数据包相对应的多个常规数据包。
16.根据权利要求13所述的装置,其中,所述先导数据包还包括记载合并数目统计字段,所述装置还包括配置为根据所述合并数目字段检验出丢包时,则重新发送所述多个常规数据包的单元。
CN201310064524.2A 2013-02-28 2013-02-28 数据包传输方法和装置 Expired - Fee Related CN104023039B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310064524.2A CN104023039B (zh) 2013-02-28 2013-02-28 数据包传输方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310064524.2A CN104023039B (zh) 2013-02-28 2013-02-28 数据包传输方法和装置

Publications (2)

Publication Number Publication Date
CN104023039A true CN104023039A (zh) 2014-09-03
CN104023039B CN104023039B (zh) 2018-02-02

Family

ID=51439608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310064524.2A Expired - Fee Related CN104023039B (zh) 2013-02-28 2013-02-28 数据包传输方法和装置

Country Status (1)

Country Link
CN (1) CN104023039B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019205878A1 (zh) * 2018-04-23 2019-10-31 华为技术有限公司 发送报文的方法和发送报文的装置
CN111615840A (zh) * 2017-08-11 2020-09-01 苹果公司 用于视频和其他应用程序的关键数据处理
CN111723088A (zh) * 2019-03-20 2020-09-29 北京沃东天骏信息技术有限公司 一种推送汇总层表的方法和装置
CN111756636A (zh) * 2019-03-29 2020-10-09 杭州海康威视数字技术股份有限公司 数据包处理方法、装置及设备、存储介质
WO2021103207A1 (zh) * 2019-11-25 2021-06-03 中国科学院计算技术研究所 基于在网计算的分布式信息检索方法、系统与装置
CN113098773A (zh) * 2018-03-05 2021-07-09 华为技术有限公司 数据处理方法、装置及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5260942A (en) * 1992-03-06 1993-11-09 International Business Machines Corporation Method and apparatus for batching the receipt of data packets
DE60310728T2 (de) * 2003-11-19 2007-10-11 Sony Deutschland Gmbh Kommunikationssubsystemgesteuerte Informationsverteilung
JP4546413B2 (ja) * 2006-03-17 2010-09-15 富士通株式会社 並列計算機のリダクション処理方法及び並列計算機
CN101232538A (zh) * 2007-12-28 2008-07-30 华为技术有限公司 业务数据合并的方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111615840A (zh) * 2017-08-11 2020-09-01 苹果公司 用于视频和其他应用程序的关键数据处理
CN113098773A (zh) * 2018-03-05 2021-07-09 华为技术有限公司 数据处理方法、装置及系统
US11522789B2 (en) 2018-03-05 2022-12-06 Huawei Technologies Co., Ltd. Data processing method, apparatus, and system for combining data for a distributed calculation task in a data center network
CN113098773B (zh) * 2018-03-05 2022-12-30 华为技术有限公司 数据处理方法、装置及系统
US11855880B2 (en) 2018-03-05 2023-12-26 Huawei Technologies Co., Ltd. Data processing method, apparatus, and system for combining data for a distributed calculation task in a data center network
WO2019205878A1 (zh) * 2018-04-23 2019-10-31 华为技术有限公司 发送报文的方法和发送报文的装置
US11190979B2 (en) 2018-04-23 2021-11-30 Huawei Technologies Co., Ltd. Methods and apparatus for forwarding packets between child nodes and parent nodes
CN111723088A (zh) * 2019-03-20 2020-09-29 北京沃东天骏信息技术有限公司 一种推送汇总层表的方法和装置
CN111723088B (zh) * 2019-03-20 2024-04-05 北京沃东天骏信息技术有限公司 一种推送汇总层表的方法和装置
CN111756636A (zh) * 2019-03-29 2020-10-09 杭州海康威视数字技术股份有限公司 数据包处理方法、装置及设备、存储介质
CN111756636B (zh) * 2019-03-29 2022-05-31 杭州海康威视数字技术股份有限公司 数据包处理方法、装置及设备、存储介质
WO2021103207A1 (zh) * 2019-11-25 2021-06-03 中国科学院计算技术研究所 基于在网计算的分布式信息检索方法、系统与装置

Also Published As

Publication number Publication date
CN104023039B (zh) 2018-02-02

Similar Documents

Publication Publication Date Title
CN104023039A (zh) 数据包传输方法和装置
TWI234371B (en) A method of performing iSCSI commands and a data processing system using the method
CN104579727B (zh) 一种管理网络节点的网络连接的方法和装置
CN106502335B (zh) 用于配置一或多个伺服器的机架系统与其配置方法
CN104038401A (zh) 用于分布式覆盖虚拟环境的互操作性
CN103856480A (zh) 虚拟机迁移中的用户数据报协议分组迁移
CN104423889A (zh) 一种多路径管理方法和系统
CN104811392A (zh) 用于处理网络中的资源访问请求的方法和系统
CN104516767A (zh) 设置虚拟机迁移过程中应用客户端的重传时间的方法和系统
CN107193499A (zh) 一种容器数据卷的迁移方法及装置
CN104516730A (zh) 一种数据处理方法和装置
CN106878181A (zh) 一种报文传输方法和装置
CN104247322B (zh) 促进计算环境中的通信的方法、系统和计算机可读介质
CN104239352A (zh) 一种用于加载网页的方法和系统
CN109039959A (zh) 一种sdn网络规则的一致性判断方法及相关装置
CN115333958A (zh) 软件定义网络性能预测方法、装置、电子设备及存储介质
CN105518610B (zh) 处理操作请求的存储系统、方法及装置
US9032063B2 (en) Dynamic port naming in a chassis
CN106789446A (zh) 一种节点对等的集群分布式测试框架和方法
CN104219159A (zh) 基于虚拟局域网的虚拟接口进行链路聚合方法和装置
US8032826B2 (en) Structure-position mapping of XML with fixed length data
EP3660690A1 (en) Calculation unit, calculation system and control method for calculation unit
CN103890750B (zh) 具有持久状态流控制的高性能虚拟融合增强型以太网
CN107086960A (zh) 一种报文传输方法和装置
CN108989311A (zh) 生成输入参数的方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180202

Termination date: 20210228

CF01 Termination of patent right due to non-payment of annual fee