CN108028788B - 在lan接口重置期间活动的链路 - Google Patents

在lan接口重置期间活动的链路 Download PDF

Info

Publication number
CN108028788B
CN108028788B CN201680055812.3A CN201680055812A CN108028788B CN 108028788 B CN108028788 B CN 108028788B CN 201680055812 A CN201680055812 A CN 201680055812A CN 108028788 B CN108028788 B CN 108028788B
Authority
CN
China
Prior art keywords
link
link partner
ethernet
partner
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680055812.3A
Other languages
English (en)
Other versions
CN108028788A (zh
Inventor
E.塔米尔
B-Z.弗里德曼
I.莱文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN108028788A publication Critical patent/CN108028788A/zh
Application granted granted Critical
Publication of CN108028788B publication Critical patent/CN108028788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/143Termination or inactivation of sessions, e.g. event-controlled end of session
    • H04L67/145Termination or inactivation of sessions, e.g. event-controlled end of session avoiding end of session, e.g. keep-alive, heartbeats, resumption message or wake-up for inactive or interrupted session
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/26Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
    • H04L47/266Stopping or restarting the source, e.g. X-on or X-off
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/30Flow control; Congestion control in combination with information about buffer occupancy at either end or at transit nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • H04L49/9063Intermediate storage in different physical parts of a node or terminal
    • H04L49/9068Intermediate storage in different physical parts of a node or terminal in the network interface card
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/24Negotiation of communication capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/323Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the physical layer [OSI layer 1]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/324Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the data link layer [OSI layer 2], e.g. HDLC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

用于在LAN接口重置和重新配置期间支持活动链路状态的方法和装置。在一种方法下,响应于链路重置事件,对于NIC的传送(TX)队列被暂缓并且TX管道被排空。PHY“暂停”分组被发送到NIC的链路伙伴,并且该NIC等待用于暂停分组的Ack并等待NIC的接收(RX)管道排空。链路暂停状态被报告至软件(例如操作系统或NIC设备驱动器),其通知软件不要使链路停机。执行(重新)配置更新过程,并且向链路伙伴和软件报告指示暂停已经结束的信息。

Description

在LAN接口重置期间活动的链路
背景技术
以太网协议和相关联设备的使用对于计算机连网是普遍存在的。例如,大多数局域网(LAN)采用有线或无线以太网链路,如分别由基于IEEE 802.3和IEEE 802.11的标准所定义的。有时,对于重新配置一个或多个以太网设备是必要的。对于许多以太网设备,存在针对硬件需要重置的配置变化。经常这样做以确保对于新设置存在干净的配置(cleanconfiguration)。固件更新也典型地要求设备重置。
当前,硬件重置将导致PHY(物理层)连同剩余的硬件一起被重置。这将导致链路停机(down),引起不活动链路状态。在某些情况下,可花费若干秒来使链路再次开机(up)(即返回到活动状态)。链路丢失将中断用户的工作,因此尽可能多地最小化链路停机的时间是合乎需要的。在许多实例中,软件的行为在感应到链路正在停机或变得不可用时使问题更糟。例如,运行Microsoft Windows操作系统的计算机将丢失的链路看作对所有TCP连接的远端休息(far end rest)。此外,一旦链路被重置,在一些情况下(类似对于IEEE802.310GBASE-KR)可要求额外过程以便使链路再次开机。例如,可重复自动协商或链路伙伴并行检测,引起耗用额外时间。
通常,当重置以太网设备时使链路停机的主要原因是当MAC(媒体访问通道层)正被重置和重新配置时该设备不能够处置PHY将接收的任何业务。以太网数据通过MAC层(层2)作为以太网帧来发送,带有正通过PHY发送的对应电子数据信号。因此,数据作为电子信号的流(或对于多线路链路并行的多个信号流)由PHY所接收,并且PHY对电子信号执行一系列处理以输出数据比特流。该数据比特流在以太网帧的序列中被逻辑上划分。MAC层负责生成用于出网(outbound)数据转移的以太网帧,以及解封装包含在用于入网(inbound)数据的以太网帧中的数据。在接收侧上,当MAC不可用(由于被重置或重新配置)时,由PHY所输出的数据比特流丢失,因为不存在空间用于缓冲数据。典型地当链路停机时,传送器获悉此情况并且将制止传送并将向SW指示该情况,该SW将把连接标记为不可用并制止排队更多数据通过该链路。
附图说明
当结合附图来时,通过参考下文详细描述,本发明的前述方面和许多伴随的优势将变得更容易领会并同样变得更好理解,在附图中,除非另外指定,否则贯穿各种视图的类似参考数号指类似部件。
图1是根据一个实施例,图示用于重新配置和/或重置链路同时保持活动状态的过程的流程图;
图2是根据实现链路流控制和按优先级流控制的实施例,图示用于重新配置和/或重置链路同时保持活动状态的过程的流程图;以及
图3是其中可实现本文描述的实施例的方面的网络节点的框示意性架构图。
具体实施方式
本文描述了用于在LAN接口重置和重新配置期间支持活动链路状态的方法和装置的实施例。在下文描述中,阐明了众多特定细节以提供本发明的实施例的通透理解。然而,相关领域技术人员将意识到本发明能不通过所述特定细节中的一个或多个特定细节或通过其它方法、组件、材料等来实践。在其它实例中,没有详细地示出或描述公知的结构、材料或操作,以避免混淆本发明的方面。
贯穿该说明书对“一个实施例”或“实施例”的引用意味着联系实施例所描述的特定特征、结构或特性被包含在本发明的至少一个实施例中。因此,短语“在一个实施例中”或“在实施例中”在贯穿该说明书各种地方的出现不必要全都指同一实施例。此外,特定特征、结构或特性可以任何合适的方式来组合在一个或多个实施例中。
为了清楚,本文附图中的各个组件还可通过其附图中标注来引用,而不是通过特定参考数字。此外,引用特定类型的组件(对照特定组件)的参考数字可通过后面有“(typ)”(意味着“典型的”)的参考数字来示出。将理解的是,这些组件的配置将是相似组件的典型,所述相似组件可能存在但未被示出在附图中(为了简洁和清楚)或者在其它方面是未标注有单独参考数字的相似组件。相反地,“(typ)”不要被直译为意味着将组件、元素等典型地用于其公开的功能、实现、目的等。
依照本文公开的实施例,提供了使以太网链路能够在局域网(LAN)接口重置和诸如此类期间维持活动的技术。并非使链路整个停机以执行重新配置或重置操作,而是链路被“暂停”,从运行在主机设备(其中实现或安装了以太网设备(例如网络接口控制器(NIC)))上的软件的角度让链路处于活动的状态。
在第一方法下,高级别协议实现于NIC和交换机之间。NIC经由“暂停”分组告知交换机:“我准备为了重新配置而停机,所以暂时暂停通过链路发送业务。”交换机和NIC二者均保持PHY链路开机,同时发送空闲符号或需要被完成的任何其它东西来保持链路处于活动状态。LAN中的交换机可将链路看作逻辑上停机,但还可高速缓存旧配置中的某些。例如,“停机”或链路“暂停”分组可能包含关于什么能被安全地高速缓存的提示;例如:MAC地址、IP地址等。
在一些数据中心环境中,NIC和交换机可配置成实现数据中心桥接(DCB)。DCB是对以太网LAN的基于标准的增强的集合,其通常被用于集群和存储域网络(SAN),但也可被用于其它目的。DCB标准包含基于优先级的流控制(PFC):IEEE 802.1Qbb;增强型传送选择(ETS):IEEE 802.1Qaz;以及拥塞通知:IEEE 802.Qau。
如果DCB被配置,在一个实施例中NIC能发送禁止其同伴传送非丢弃业务类别(TC's)的数据的DCB消息。NIC还可丢弃准许分组的丢弃的TC's的可丢弃分组。如果暂停能力曾对于该链路被协商,则NIC能发送暂停帧,同时MAC正被重新配置并制止实际重置PHY。
如果前述没有可用的,则MAC能保持链路开机同时丢弃所有入局分组。在某些情况下完全使链路停机仍然是优选的。
当MAC正被重新配置时,NIC不传送任何数据。这正常可能作为失效链路(或者其它方面某种类型的故障)由操作系统所检测到或被传达到(例如经由NIC设备驱动器)操作系统,引起OS取消用于通过链路传送数据的上层链路连接(例如TCP/IP或另一类型的连接)(以及因此抹杀该链路)。为了避免该情形,在一个实施例中NIC设备驱动器配置成模仿接收对于链路同位体的流控制暂停指示,而不是告知OS该链路停机。
对于入局业务,可实现各种技术。在一些实施例中,入局分组被简单地丢弃,依靠上级别协议来复原丢失的数据(例如通过TCP重传或诸如此类)。可选地,数据可被缓冲。这可能是难处理的,因为大多数缓冲器RAM通常在MAC(其将暂时不可用)中。然而,缓冲器可被设计成在没有MAC或MAC中的扩充逻辑的显式处置的情况下支持入网业务的缓冲。在溢出的事件下,在一个实施例中最旧的数据被丢弃以避免死锁。
存在额外修改可被实现。例如,在一个实施例下,特别的准备可在PHY中实现,诸如MAC重置和PHY重置的分离,以及可能地其它变化,使得MAC重置将不会强制PHY重置。PHY中的额外机制还可被用于支持上文论述的过程的实现。此外,如果PHY在EEE(能量高效以太网)模式中,在一个实施例中,链路在MAC重置的持续期内被强制处于活动模式或低功率模式中。
参考图1的流程图100,根据一个实施例,用于重新配置和/或重置链路同时保持活动状态的过程按照以下方式来操作。在开始框102中,网络接口重新配置事件发生。一般而言,链路重新配置事件包含将促使链路伙伴的网络适配器或其中的电路和/或组件的重置或重新配置的任何事件。例如,在一个实施例中,网络适配器包括NIC,以及网络接口重新配置事件促使NIC被重新配置和/或重置,如下文所描述。为了响应,对于NIC的传送(TX)队列在框104中被暂缓,同时已经在TX管道中的数据在框106中被排空(即,NIC的TX处理框中的数据被发送出网到链路上)。
接下来,在框108中,NIC向其链路伙伴发送PHY暂停分组(例如前述“暂停”分组的实施例)。为了响应,该链路伙伴可返回指示该链路伙伴已经接收暂停分组的Ack(确认)分组。在一个实施例中,框106和108(以及潜在地框110和112)的操作大体上被并行执行,如图1中描绘。NIC等待接收PHY暂停Ack分组,如框110中描绘,同时还等待NIC的接收(Rx)管道排空,如框112中所示。在一个实施例中,正常暂停分组不被确认,而提议的特别分组被确认。
在框114中,NIC(或NIC的代理)向运行在以太网设备或主机设备(其中以太网设备被安装或耦合到其)上的软件(SW)报告链路暂停状态。例如,如果NIC被实现在服务器中,则NIC或代理可向软件代理(例如操作于设备驱动器、操作系统或用户级别处的后台进程或监听器服务)报告暂停链路状态,该软件代理向软件数据提供方(例如生成了出网数据的软件实体)通知链路将暂时不可用。为了响应,软件数据提供方将(优选地)暂停出网数据的生成,或以其它方式在软件级别用此类数据来填充存储器缓冲器以及不推使数据被NIC的TX管道处置。报告暂停状态还可通知软件数据消费方暂时预期不接收任何额外入网数据(在RX管道排空后)。
大多数OS具有用于告知网络堆栈不要在接口上排队更多数据的流控制状态指示器,这对于当CPU比链路更快的时候是有用的,(不要与以太网流控制混淆,这是OS内的逻辑SW机制)。在一个实施例中,“队列已满”指示被用于防止OS排队更多数据而不报告链路停机。
在过程框116中,执行配置更新过程。取决于要被执行的重新配置或重置的类型,特定过程可不同。例如,由于固件更新引起的重新配置将不同于由于检测到链路上过多数据错误引起的重新配置。在某些状况下,配置更新过程可包含重置NIC的MAC层(例如重置配置成实现NIC的MAC层的NIC上的逻辑和/或电路)。如参考图3在下文描述,在一些实施例中,实现到MAC和PHY层电路的功率,使得MAC和PHY电路包括能被独立控制的分离功率域,使MAC电路能够在不重置PHY电路的情况下被重置。
在完成框116的配置更新过程后,指示暂停已经结束的指示被发送到链路伙伴和软件二者,以及在NIC的TX端口处的TX业务的传送被恢复。例如,在一个实施例中,“暂停结束”分组被发送到NIC的链路伙伴。如之前,NIC或其代理能将指示暂停已经结束的数据发送到软件代理或诸如此类。这引起链路返回至其正常数据转移模式,并完结过程,如由结束框120所描绘。
图2示出流程图200,其图示与采用用于在LAN接口重置期间支持活动链路功能性的流控制(FC)的其它实施例有关的操作和逻辑。图2还示出当另一侧(即链路伙伴)是传统设备时以太网设备如何行动。如之前,过程开始于网络接口重新配置事件,如开始框202中所示。在框203中TX队列被暂缓,以及在框206中NIC等待TX管道排空。在一个实施例中,框206的操作与流程图200中的后续操作并行被执行。
接下来,在判定框208中,对在使用的是什么类型的协商FC控制方法作出确定。如果配置链路FC,则逻辑继续进行框210,其中NIC开始将以太网暂停帧发送到链路伙伴。如由IEEE 802.3标准定义,以太网暂停帧能被用于告知链路伙伴在预定时间量内暂停通过链路传送数据。在框212中,NIC等待往返程等待时间来接收来自链路伙伴的Ack,以及等待NIC的RX管道排空。在未从链路伙伴发送确认(意味着确认将不会被接收)的情况下,仅等待往返程等待时间。在框214中,NIC向软件代理(OS或另一软件实体)报告链路暂停状态。然后执行配置更新过程(在框216中),继之以向软件报告暂停的结束(在框218中)。链路被返回回到其活动数据转移模式,其包含恢复TX业务,这对应于过程中的最后操作,如由结束框232描绘。
返回到判定框208,如果按优先级FC(PFC)被配置,则逻辑继续进行框220,其中PFC消息针对非丢弃TC's被发送到链路伙伴。如上文论述,DCB消息(其包含PFC消息)被用于禁止同伴(例如网络中其它节点)将数据传送到PFC消息中标识的节点(例如在该示例中的NIC)。一般而言,PFC消息能配置成在单独流的基础上在预定时间量内禁止同伴将数据传送到特定目的地(使用发送方的地址,该发送方在此情况下是NIC)。这使NIC能够暂时禁止去往NIC的对应于非丢弃业务类别的流。
交换机在框222中配置成丢弃去往网络节点的属于可丢弃的业务类别的入局分组。框220的操作的效果是正常将被转发到网络节点的属于丢弃TC的分组在交换机处被丢弃。
在框224中,NIC等待链路往返程等待时间以及等待NIC的RX管道排空。然后向软件(例如软件代理或诸如此类)报告TX“队列已满”状态(在框226中)。这向软件通知TX队列是满的,其将引起软件不会将额外分组添加到TX队列直到TX队列状态改变为止。然后执行对于NIC的配置更新过程(在框228中)。这相似于上文论述的框116的配置更新过程。
在配置更新过程完成时,向软件报告TX队列空间可用状态,以及交换机配置成停止丢弃属于可丢弃TC's的分组,如框230中所示。这引起链路伙伴中的每个链路伙伴返回到其在网络接口重新配置事件前相应的操作状态,使TX业务能够被恢复。相似地,网络节点被使能恢复接收RX业务。
注意的是,流程图100和200中所示的由TX和RX侧所执行的一些操作可在操作的持续期中的至少一部分内并行或以其它方式并发执行。例如,可并行/并发执行TX管道排空和RX管道排空操作,以及诸如上文所论述的其它操作。
示例性网络节点和交换机
图3根据本文公开的实施例方面示出采用配置成执行链路操作的网络芯片302(例如NIC)的网络节点300的架构。网络芯片302包括PHY电路304,其包含物理编码子层(PCS)模块305、Reed-Solomon前向纠错(RS-FEC)模块306、物理介质附连(PMA)模块307、PMD模块308以及包含自动协商模块310的配置逻辑309。网络芯片302包含网络端口311,其包括包含传送器电路313的传送器(TX)312和包含接收器电路315的接收器314。网络端口311还被描绘为包含TX队列316和RX队列317。如进一步示出,端口311可支持1-4条线路,取决于所支持的PHY和以太网链路的特定类型。例如,25GBASE-KR PHY或25GBASE-CR PHY采用单条线路,而100GBASE-KR PHY或100GBASE-CR PHY采用四条线路。
网络芯片302还包含DMA(直接存储器访问)接口318、外设组件互连高速(PCIe)接口319、MAC电路和逻辑320、调和子层(Reconciliation Sublayer)(RS)模块321、暂停逻辑322、缓冲器323以及功率控制块325和327。如将由以太网领域技术人员所理解,各种现存和未来以太网PHY和MAC可包含与图3中所示的模块和子层不同的模块和子层,以及图3中图示的块和组件是示例性且非限制性的。
网络节点300还包括芯片上系统(SoC)324,其包含具有一个或多个处理器核的中央处理单元(CPU)326,该CPU 326经由互连332耦合到存储器接口328和PCIe接口330。存储器接口328还被描绘为耦合到存储器334。在一种配置下,网络芯片302、SoC 304和存储器334将被安装在电路板336上或者以其它方式操作地耦合到电路板336,该电路板336包含用于在通信中耦合这些组件的布线迹线,如由将DMA 318连接到存储器334以及在PCIe端口338将PCIe接口319连接到PCIe接口330的单条线所描绘。作为可选配置,对于SoC 324和网络芯片302所描绘的组件可被组合在SoC、多芯片模块或具有相似设备包装的设备上。在一个实施例中,网络节点包括服务器片(blade)或服务器模块。作为仍有的另一选项,对于网络芯片302所图示的组件可被实现在包含被安装在主机服务器的PCIe槽中的NIC的网卡上。
在一个实施例中,MAC电路和逻辑320配置成实现本领域公知的所执行的MAC层操作的方面。相似地,RS模块321配置成实现调和子层操作。MAC电路和逻辑320图示了MAC层电路和逻辑,其响应于本文描述的网络接口重新配置事件来重新配置/更新。
各种软件352被加载到存储器334中以及被执行于处理器核中的一个或多个上。软件352包含具有NIC设备驱动器356和网络堆栈358的操作系统354、以及在软件架构中的用户级别处操作的用户应用360。一般而言,用户应用中的一个或多个将是采用网络堆栈358来经由网络芯片302发送和接收数据的数据生产方和/或耗用方。NIC设备驱动器356提供操作系统354与网络芯片302之间的接口,使OS和其它软件组件能够与网络芯片302通信。
在链路初始化期间以及在后续数据转移操作期间,数据在网络节点300的PHY传送器和接收器312和314与网络节点300的链路伙伴之间交换,如由链路伙伴344所描绘。在图示的实施例中,链路伙伴344是包含耦合到交叉开关346的多个端口345的交换机。可选地,链路伙伴344可以是另一网络节点或另一类型的链路端点设备。每个端口345包含接收器347和传送器348,其中端口之一的接收器和传送器经由以太网链路350来链接在与传送器312和接收器314的通信中。链路伙伴344还包含暂停逻辑351。
在链路暂停操作期间,暂停逻辑322和暂停逻辑351中的嵌入式逻辑被部分实现以执行本文论述以及如图1和2中所示的各种实施例的暂停操作。如图示,暂停逻辑的部分被实现为PHY电路304的一部分,而另一部分被实现于MAC电路和逻辑320中。本领域技术人员将认识到暂停逻辑可被实现为网络芯片302的硅中的一个或多个逻辑块。相似地,暂停逻辑可被实现于交换机中,作为交换机芯片中的嵌入式逻辑或者在交换机中的逻辑组件中。
网络芯片302的新颖方面在于,其采用分叉的功率设计,在该设计下,到PHY电路和MAC电路的功率输入能经由功率控制块325和327来分离地控制。有效地,MAC电路和PHY电路具有分离的功率域。这使MAC电路能够通过功率循环或诸如此类来被重置,同时并发地维持到PHY电路的功率。此外,网络芯片302包含胶合逻辑(glue logic)(未示出),其允许缓冲器323当它们被接通时从两个功率域是可访问的,以及当MAC电路功率域被关断时从PHY电路功率域是可访问的。这使PHY电路能够在MAC电路正被重置时缓冲所接收的以太网帧数据。
在当前网络芯片设计下,MAC和PHY电路共享同一功率输入,以及因此用也重置PHY的功率循环来重置MAC电路,其后续要求当PHY的功率被带回开工时链路被再训练(retrain)。在本文公开的新颖方法下,当MAC电路正被重置时PHY处于活动,以及因此链路在MAC重置之后能恢复业务的传送而无须再训练该链路。
在各种实施例下,网络芯片302包括以下项中的一项:采用25GBASE-KR PHY或25GBASE-CR PHY的25 Gb/s以太网网络接口控制器(NIC)芯片、或者采用100GBASE-KR PHY或100GBASE-CR PHY的100 Gb/s以太网NIC芯片。更一般而言,网络芯片302包括具有使用任何现存或未来协议的信令速率(诸如且不限于25 Gb/s、50 Gb/s或100 Gb/s及以上)的接口。然而,网络芯片302的电路和组件还可被实现于其它类型的芯片和组件(包含SoC、多芯片模块和NIC芯片)中,其包含对于多个网络接口(例如有线和无线)的支持。相似方案还可被应用于其它连网和构造类型,诸如InfiniBand等。
本文描述的主题的另外方面在下文编号的条款中被陈述:
1. 一种方法,包括:
通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务;
暂停通过所述以太网链路传送业务,同时保持所述以太网链路的物理层(PHY)是活动的;
更新所述第一链路伙伴的配置,同时暂停通过所述以太网链路传送的业务,并且所述以太网链路的所述PHY是活动的;以及
恢复通过所述以太网链路传送业务。
2. 如条款1所述的方法,还包括:
响应于网络接口重新配置事件,
将第一消息从所述第一链路伙伴发送到所述第二链路伙伴以暂停所述链路;以及
在所述第一链路伙伴的所述配置已经被更新之后,
将第二消息从所述第一链路伙伴发送到所述第二链路伙伴以结束暂停所述链路。
3. 如条款2所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述方法还包括:
向运行在所述主机设备上的软件报告链路暂停状态。
4. 如条款3所述的方法,其中,所述第一链路伙伴包含一个或多个传送队列并采用用于传送分组的传送管道,所述方法还包括:
响应于所述网络接口重新配置事件,
暂缓所述一个或多个传送队列;以及
在更新所述第一链路伙伴的所述配置之前,等待传送管道排空。
5. 如条款3或4所述的方法,还包括:
在所述第一链路伙伴配置已经被更新后,向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
6. 如前述条款中任一项所述的方法,其中,所述第一和第二链路伙伴中的每个支持链路流控制,并且由所述第一链路伙伴使用接收管道来处理接收的分组,所述方法还包括:
将以太网暂停帧从所述第一链路伙伴发送到所述第二链路伙伴;以及
在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
7. 如条款6所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告链路暂停状态;以及
在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
8. 如前述条款中任一项所述的方法,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
9. 如前述条款中任一项所述的方法,其中,所述第二链路伙伴包括以太网交换机。
10. 如前述条款中任一项所述的方法,其中,更新所述第一链路伙伴的所述配置包括重新配置所述第一链路伙伴的媒体访问通道(MAC)层。
11. 如条款10所述的方法,其中,重新配置所述第一链路伙伴的所述MAC层包括重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分。
12. 一种方法,包括:
通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务,其中,所述第一和第二链路伙伴中的每个支持基于优先级的流控制,并且所述第二链路伙伴是交换机,并且其中,所述业务包含一个或多个可丢弃业务类别;
响应于网络接口重新配置事件,
将所述交换机配置成丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组;
更新所述第一链路伙伴的配置,同时所述交换机配置成丢弃属于所述一个或多个可丢弃业务类别并去往所述第一链路伙伴的入局分组;以及
在所示第一链路伙伴的所述配置被更新后,将所述交换机配置成停止丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组。
13. 如条款12所述的方法,其中,所述业务包含一个或多个非丢弃业务类别,所述方法还包括:
从所述第一链路伙伴向所述交换机发送针对所述一个或多个非丢弃业务类别的优先级流控制消息,以禁止属于所述一个或多个非丢弃业务类别的分组传送到所述第一链路伙伴。
14. 如条款12或13所述的方法,其中,由所述第一链路伙伴使用接收管道来处理接收的分组,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
15. 如条款12-14中任一项所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,并且其中,所述网络设备包含接收队列,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告传送队列已满状态;以及,
在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告传送队列可用状态。
16. 如条款12-15中任一项所述的方法,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
17. 如条款12-16中任一项所述的方法,其中,所述第二链路伙伴包括以太网交换机。
18. 如条款12-17中任一项所述的方法,其中,更新所述第一链路伙伴的所述配置包括重新配置所述第一链路伙伴的媒体访问通道(MAC)层。
19. 如条款18所述的方法,其中,重新配置所述第一链路伙伴的所述MAC层包括重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分。
20. 一种以太网装置,包括:
配置成实现物理层(PHY)的PHY电路和逻辑,包含,
对于一个或多个线路中的每个,
传送器;以及
接收器;
一个或多个传送队列,操作地耦合到所述传送器;
一个或多个接收队列,操作地耦合到所述接收器;以及
配置成实现媒体访问控制(MAC)层的MAC电路和逻辑,
其中,所述以太网装置当经由以太网链路耦合到链路伙伴时,配置成:
通过所述以太网链路来将业务传送到所述链路伙伴;
暂停通过所述以太网链路传送业务,同时保持所述PHY是活动的;
更新所述MAC层的配置,同时暂停通过所述以太网链路所传送的业务并且所述PHY是活动的;以及
在所述MAC层的所述配置的所述更新后,恢复通过所述以太网链路将业务传送到所述链路伙伴。
21. 如条款20所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴时,还配置成:
响应于网络接口重新配置事件,
将第一消息传送到所述链路伙伴以暂停所述以太网链路;以及
在所述MAC层的所述配置已经被更新后,
将第二消息传送到所述链路伙伴以结束暂停所述以太网链路。
22. 如条款21所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴并安装在所述主机设备中时,还配置成:
将PHY暂停分组传送到所述链路伙伴,所述PHY暂停分组包括到所述链路伙伴用于暂停所述以太网链路的所述第一消息;以及
接收从所述链路伙伴发送的PHY暂停确认分组;以及。
23. 如条款21或22所述的以太网装置,其中,所述以太网装置配置成安装在主机设备中,当经由所述以太网链路耦合到所述链路伙伴并安装在所述主机设备中时,所述以太网装置还配置成:
向运行在所述主机设备上的软件报告链路暂停状态。
24. 如条款23所述的以太网装置,其中,所述以太网装置采用用于接收分组的接收管道,当经由所述以太网链路耦合到所述链路伙伴时,所述以太网装置还配置成:
在向运行在所述第一链路伙伴上的软件报告链路暂停状态之前,等待所述接收管道排空。
25. 如条款23或24所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴时,还配置成:
在所述MAC层的所述配置已经被更新后,向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
26. 如条款20-25中任一项所述的以太网装置,其中,更新所述MAC层的配置同时暂停通过所述以太网链路所传送的业务包含重置所述MAC电路和逻辑的至少一部分。
27. 如条款26所述的以太网装置,其中,分离的MAC和PHY功率域被实现以用于所述MAC电路和逻辑以及所述PHY电路和逻辑,并且其中,重置所述MAC电路和逻辑的至少一部分包括将循环功率供电到所述MAC功率域同时维持到所述PHY功率域的功率。
28. 如条款20-27中任一项所述的以太网装置,其中,所述以太网装置和所述链路伙伴中的每个支持链路流控制,并且其中,由所述以太网装置使用接收管道来处理接收的分组,当经由所述以太网链路耦合到所述链路伙伴时,所述以太网装置还配置成:
将以太网暂停帧传送到所述链路伙伴;以及
在更新所述MAC层的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
29. 如条款28所述的以太网装置,其中,所述以太网装置配置成安装主机设备,当经由所述以太网链路耦合到所述链路伙伴并安装在所述主机设备中时,所述以太网装置还配置成:
在更新所述MAC层的所述配置之前,
向运行在所述主机设备上的软件报告链路暂停状态;以及
在所述MAC层的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
30. 如条款20-29中任一项所述的以太网装置,其中,所述以太网装置包括以太网网络接口控制器(NIC)。
31. 如条款20-30中任一项所述的以太网装置,其中,配置成实现物理层(PHY)的所述电路和逻辑配置成实现以下项中的一项:25GBASE-KR PHY、25GBASE-CR PHY、100GBASE-KR PHY或者l00GBASE-CR PHY。
32. 一种以太网装置,包括:
配置成实现物理层(PHY)的PHY电路和逻辑,包含,
对于一个或多个线路中的每个,
传送器;以及
接收器;
一个或多个传送队列,操作地耦合到所述传送器;
一个或多个接收队列,操作地耦合到所述接收器;
配置成实现媒体访问控制(MAC)层的MAC电路和逻辑;以及
用于支持基于优先级的流控制的逻辑;
其中,当经由以太网链路耦合到支持基于优先级的流控制的交换机时,所述以太网装置配置成:
通过以太网将业务传送到所述交换机并从所述交换机接收业务,其中,所述业务包含一个或多个可丢弃业务类别;
将数据发送到所述交换机,以将所述交换机配置成丢弃去往所述以太网装置的属于所述一个或多个可丢弃业务类别的入局分组;以及
更新所述MAC电路和逻辑的配置,同时所述交换机配置成丢弃属于所述一个或多个可丢弃业务类别并去往所述以太网装置的入局分组;以及
在所述MAC电路和逻辑的所述配置被更新后,促使所述交换机停止丢弃去往所述以太网装置的属于所述一个或多个可丢弃业务类别的入局分组。
33. 如条款32所述的以太网装置,其中,所述业务包含一个或多个非丢弃业务类别,当经由所述以太网链路耦合到所述交换机时,所述以太网装置还配置成:
向所述交换机发送针对所述一个或多个非丢弃业务类别的优先级流控制消息,以禁止属于所述一个或多个非丢弃业务类别的分组传送到所述以太网装置。
34. 如条款32或33所述的以太网装置,其中,由所述以太网装置使用接收管道来处理接收的分组,当经由所述以太网链路耦合到所述交换机时,所述以太网装置还配置成:
在更新所述MAC电路和逻辑的所述配置之前,
等待数据传送到所述交换机并回到所述以太网装置的链路往返程等待时间;以及
等待所述接收管道排空。
35. 如条款32-34中任一项所述的以太网装置,其中,所述以太网装置配置成安装在主机设备中,当经由所述以太网链路耦合到所述交换机并安装在所述主机设备中时,所述以太网装置还配置成:
在更新所述MAC电路和逻辑的所述配置之前,
向运行在所述主机设备上的软件报告传送队列已满状态;以及
在所述MAC电路和逻辑的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告传送队列可用状态。
36. 如条款32-25中任一项所述的以太网装置,其中,更新所述MAC电路和逻辑的配置包括重置所述MAC电路和逻辑的至少一部分。
37. 如条款36所述的以太网装置,其中,分离的MAC和PHY功率域被实现以用于所述MAC电路和逻辑以及所述PHY电路和逻辑,并且其中,重置所述MAC电路和逻辑的至少一部分包括将循环功率供电到所述MAC功率域同时维持到所述PHY功率域的功率。
38. 如条款32-27中任一项所述的以太网装置,其中,所述以太网装置包括以太网网络接口控制器(NIC)。
39. 如条款32-38中任一项所述的以太网装置,其中,所述PHY电路和逻辑配置成实现以下项中的一项:25GBASE-KR PHY、25GBASE-CR PHY、100GBASE-KR PHY或者l00GBASE-CR PHY。
虽然参考特定实现已经描述了一些实施例,但是其它实现根据一些实施例是可能的。此外,附图中图示的和/或本文描述的元素或其它特征元素的布置和/或顺序不一定要以图示的和描述的特定方式来布置。许多其它布置根据一些实施例是可能的。
在图中示出的每个系统中,某些情况下的元素可各自具有相同参考数字或不同参考数字以暗示表示的元素能是不同的和/或相似的。然而,元素可足够灵活以具有不同的实现并与本文示出或描述的某些或所有系统一起工作。图中示出的各种元素可以是相同的或不同的。哪一个称为第一元素以及哪一个称为第二元素是任意的。
在描述和权利要求中,术语“耦合”和“连接”连同其派生词可被使用。应该理解的是,这些术语不旨在作为对于彼此的同义词。相反,在特定实施例中,“连接”可被用于指示两个或更多元素与彼此有直接物理或电接触。“耦合”可意味着两个或更多元素有直接物理或电接触。然而,“耦合”还可意味着两个或更多元素与彼此没有直接接触,但仍然与彼此协作或交互。
实施例是本发明的实现或示例。在本说明书中对“实施例”、“一个实施例”、“一些实施例”或“其它实施例”的引用意味着联系实施例来描述的特定特征、结构或特性被包含在本发明的至少一些实施例(但不必要是所有实施例)中。各种出现“实施例”、“一个实施例”或“一些实施例”不必要都指同一实施例。
本文描述和图示的所有组件、特征、结构、特性等不一定要包含在特定一个或多个实施例中。例如,如果本说明书声明组件、特征、结构或特性“可”、“可能”、“能”或“能够”被包含,则特定组件、特征、结构或特性不要求被包含。如果本说明书或权利要求涉及“一(aor an)”元素,则那不意味着存在仅一个该元素。如果本说明书或权利要求涉及“一额外”元素,则那不排除存在多于一个该额外元素。
如上文所论述,本文实施例的各种方面可由对应软件和/或固件组件和应用(诸如由嵌入式处理器或诸如此类来执行的软件和/或固件)来促进。因此,本发明的实施例可被使用为或用于支持软件程序,软件模块,固件和/或在某种形式的处理器、处理核或嵌入式逻辑上执行的分布式软件,在处理器或核上运行或以其它方式在计算机可读或机器可读非暂态存储介质上或内实现或实行的虚拟机。计算机可读或机器可读非暂态存储介质包含用于以由机器(例如计算机)可读的形式来存储或传送信息的任何机制。例如,计算机可读或机器可读非暂态存储介质包含以由计算机或计算机器(例如计算设备、电子系统等)可访问的形式(诸如可记录/非可记录介质(例如只读存储器(ROM)、随机访问存储器(RAM)、磁盘存储介质、光存储介质、闪速存储器设备等))来提供(即存储和/或传送)信息的任何机制。内容可以是直接可执行的(“对象”或“可执行”形式)、源代码或差分代码(“增量(delta)”或“修补(patch)”码)。计算机可读或机器可读非暂态存储介质还可包含能从其中下载内容的存储装置或数据库。计算机可读或机器可读非暂态存储介质还可包含在销售或交付期具有存储于其上的内容的设备或产品。因此,交付其中存储了内容或者为了通过通信介质下载来供应内容的设备可被理解为:提供包括具有本文描述的此类内容的计算机可读或机器可读非暂态存储介质的制品。
涉及上文作为本文描述的过程、服务器或工具的各种组件可以是用于执行描述的功能的部件。由本文描述的各种组件执行的操作和功能可通过运行在处理元素上的软件经由嵌入式硬件或诸如此类或硬件和软件的任何组合来实现。此类组件可被实现为软件模块、硬件模块、专用硬件(例如专用硬件、ASIC、DSP等)、嵌入式控制器、硬连线电路、硬件逻辑等。软件内容(例如数据、指令、配置信息等)可经由包含计算机可读或机器可读非暂态存储介质的制品来提供,其提供表示能被执行的指令的内容。所述内容可引起计算机执行本文描述的各种功能/操作。
如本文所使用,由术语“中的至少一个”联接的项的列表能意味着所列的术语的任何组合。例如,短语“A、B或C中的至少一个”能意味着:A;B;C;A和B;A和C;B和C;或A、B和C。
本发明的图示实施例的上文描述(包含说明书摘要中所描述的)不旨在是彻底的或将本发明限制于所公开的精确形式。虽然本发明的特定实施例和示例在本文中出于图示的目的来描述,但各种等效修改在本发明的范畴内是可能的,如本领域技术人员将领会的。
根据上文详细描述能对本发明作出这些修改。随附权利要求中所使用的术语不应该被直译成将本发明限制于本说明书和附图中所公开的特定实施例。相反,本发明的范畴要由随附权利要求来整体确定,所述随附权利要求要依照权利要求解译的建立的原则来直译。

Claims (51)

1.一种方法,包括:
通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务;
暂停通过所述以太网链路传送业务,同时保持所述以太网链路的物理层(PHY)是活动的;
更新所述第一链路伙伴的配置,同时暂停通过所述以太网链路传送的业务,并且所述以太网链路的所述PHY是活动的;以及
恢复通过所述以太网链路传送业务。
2.如权利要求1所述的方法,还包括:
响应于网络接口重新配置事件,
将第一消息从所述第一链路伙伴发送到所述第二链路伙伴以暂停所述链路;以及
在所述第一链路伙伴的所述配置已经被更新之后,
将第二消息从所述第一链路伙伴发送到所述第二链路伙伴以结束暂停所述链路。
3.如权利要求2所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述方法还包括:
向运行在所述主机设备上的软件报告链路暂停状态。
4.如权利要求3所述的方法,其中,所述第一链路伙伴包含一个或多个传送队列并采用用于传送分组的传送管道,所述方法还包括:
响应于所述网络接口重新配置事件,
暂缓所述一个或多个传送队列;以及
在更新所述第一链路伙伴的所述配置之前,等待传送管道排空。
5.如权利要求3所述的方法,还包括:
在所述第一链路伙伴配置已经被更新后,向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
6.如权利要求1所述的方法,其中,所述第一和第二链路伙伴中的每个支持链路流控制,并且由所述第一链路伙伴使用接收管道来处理接收的分组,所述方法还包括:
将以太网暂停帧从所述第一链路伙伴发送到所述第二链路伙伴;以及
在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
7.如权利要求6所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告链路暂停状态;以及
在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
8.如权利要求1所述的方法,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
9.如权利要求1所述的方法,其中,所述第二链路伙伴包括以太网交换机。
10.如权利要求1所述的方法,其中,更新所述第一链路伙伴的所述配置包括重新配置所述第一链路伙伴的媒体访问通道(MAC)层。
11.如权利要求10所述的方法,其中,重新配置所述第一链路伙伴的所述MAC层包括重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分。
12.一种方法,包括:
通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务,其中,所述第一和第二链路伙伴中的每个支持基于优先级的流控制,并且所述第二链路伙伴是交换机,并且其中,所述业务包含一个或多个可丢弃业务类别;
响应于网络接口重新配置事件,
将所述交换机配置成丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组;
更新所述第一链路伙伴的配置,同时所述交换机配置成丢弃属于所述一个或多个可丢弃业务类别并去往所述第一链路伙伴的入局分组;以及
在所示第一链路伙伴的所述配置被更新后,将所述交换机配置成停止丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组。
13.如权利要求12所述的方法,其中,所述业务包含一个或多个非丢弃业务类别,所述方法还包括:
从所述第一链路伙伴向所述交换机发送针对所述一个或多个非丢弃业务类别的优先级流控制消息,以禁止属于所述一个或多个非丢弃业务类别的分组传送到所述第一链路伙伴。
14.如权利要求12所述的方法,其中,由所述第一链路伙伴使用接收管道来处理接收的分组,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
15.如权利要求12所述的方法,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,并且其中,所述网络设备包含接收队列,所述方法还包括:
在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告传送队列已满状态;以及,
在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告传送队列可用状态。
16.如权利要求12所述的方法,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
17.如权利要求12所述的方法,其中,所述第二链路伙伴包括以太网交换机。
18.如权利要求12所述的方法,其中,更新所述第一链路伙伴的所述配置包括重新配置所述第一链路伙伴的媒体访问通道(MAC)层。
19.如权利要求18所述的方法,其中,重新配置所述第一链路伙伴的所述MAC层包括重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分。
20.一种以太网装置,包括:
配置成实现物理层(PHY)的PHY电路和逻辑,包含,
对于一个或多个线路中的每个,
传送器;以及
接收器;
一个或多个传送队列,操作地耦合到所述传送器;
一个或多个接收队列,操作地耦合到所述接收器;以及
配置成实现媒体访问控制(MAC)层的MAC电路和逻辑,
其中,所述以太网装置当经由以太网链路耦合到链路伙伴时,配置成:
通过所述以太网链路来将业务传送到所述链路伙伴;
暂停通过所述以太网链路传送业务,同时保持所述PHY是活动的;
更新所述MAC层的配置,同时暂停通过所述以太网链路所传送的业务并且所述PHY是活动的;以及
在所述MAC层的所述配置的所述更新后,恢复通过所述以太网链路将业务传送到所述链路伙伴。
21.如权利要求20所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴时,还配置成:
响应于网络接口重新配置事件,
将第一消息传送到所述链路伙伴以暂停所述以太网链路;以及
在所述MAC层的所述配置已经被更新后,
将第二消息传送到所述链路伙伴以结束暂停所述以太网链路。
22.如权利要求21所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴并安装在主机设备中时,还配置成:
将PHY暂停分组传送到所述链路伙伴,所述PHY暂停分组包括到所述链路伙伴用于暂停所述以太网链路的所述第一消息;以及
接收从所述链路伙伴发送的PHY暂停确认分组。
23.如权利要求21所述的以太网装置,其中,所述以太网装置配置成安装在主机设备中,当经由所述以太网链路耦合到所述链路伙伴并安装在所述主机设备中时,所述以太网装置还配置成:
向运行在所述主机设备上的软件报告链路暂停状态。
24.如权利要求23所述的以太网装置,其中,所述以太网装置采用用于接收分组的接收管道,当经由所述以太网链路耦合到所述链路伙伴时,所述以太网装置还配置成:
在向运行在所述主机设备上的软件报告链路暂停状态之前,等待所述接收管道排空。
25.如权利要求23所述的以太网装置,当经由所述以太网链路耦合到所述链路伙伴时,还配置成:
在所述MAC层的所述配置已经被更新后,向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
26.如权利要求20所述的以太网装置,其中,更新所述MAC层的配置同时暂停通过所述以太网链路所传送的业务包含重置所述MAC电路和逻辑的至少一部分。
27.如权利要求26所述的以太网装置,其中,分离的MAC和PHY功率域被实现以用于所述MAC电路和逻辑以及所述PHY电路和逻辑,并且其中,重置所述MAC电路和逻辑的至少一部分包括将循环功率供电到所述MAC功率域同时维持到所述PHY功率域的功率。
28.如权利要求20所述的以太网装置,其中,所述以太网装置和所述链路伙伴中的每个支持链路流控制,并且其中,由所述以太网装置使用接收管道来处理接收的分组,当经由所述以太网链路耦合到所述链路伙伴时,所述以太网装置还配置成:
将以太网暂停帧传送到所述链路伙伴;以及
在更新所述MAC层的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空。
29.如权利要求28所述的以太网装置,其中,所述以太网装置配置成安装主机设备,当经由所述以太网链路耦合到所述链路伙伴并安装在所述主机设备中时,所述以太网装置还配置成:
在更新所述MAC层的所述配置之前,
向运行在所述主机设备上的软件报告链路暂停状态;以及
在所述MAC层的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告链路暂停状态的结束。
30.如权利要求20所述的以太网装置,其中,所述以太网装置包括以太网网络接口控制器(NIC)。
31.一种设备,包括:
用于通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务的部件;
用于暂停通过所述以太网链路传送业务,同时保持所述以太网链路的物理层(PHY)是活动的部件;
用于更新所述第一链路伙伴的配置,同时暂停通过所述以太网链路传送的业务,并且所述以太网链路的所述PHY是活动的部件;以及
用于恢复通过所述以太网链路传送业务的部件。
32.如权利要求31所述的设备,还包括:
用于响应于网络接口重新配置事件,
将第一消息从所述第一链路伙伴发送到所述第二链路伙伴以暂停所述链路的部件;以及
用于在所述第一链路伙伴的所述配置已经被更新之后,
将第二消息从所述第一链路伙伴发送到所述第二链路伙伴以结束暂停所述链路的部件。
33.如权利要求32所述的设备,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述设备还包括:
用于向运行在所述主机设备上的软件报告链路暂停状态的部件。
34.如权利要求33所述的设备,其中,所述第一链路伙伴包含一个或多个传送队列并采用用于传送分组的传送管道,所述设备还包括:
用于响应于所述网络接口重新配置事件,
暂缓所述一个或多个传送队列;以及
在更新所述第一链路伙伴的所述配置之前,等待传送管道排空的部件。
35.如权利要求33所述的设备,还包括:
用于在所述第一链路伙伴配置已经被更新后,向运行在所述主机设备上的所述软件报告链路暂停状态的结束的部件。
36.如权利要求31所述的设备,其中,所述第一和第二链路伙伴中的每个支持链路流控制,并且由所述第一链路伙伴使用接收管道来处理接收的分组,所述设备还包括:
用于将以太网暂停帧从所述第一链路伙伴发送到所述第二链路伙伴的部件;以及
用于在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空的部件。
37.如权利要求36所述的设备,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,所述设备还包括:
用于在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告链路暂停状态的部件;以及
用于在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告链路暂停状态的结束的部件。
38.如权利要求31所述的设备,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
39.如权利要求31所述的设备,其中,所述第二链路伙伴包括以太网交换机。
40.如权利要求31所述的设备,其中,用于更新所述第一链路伙伴的所述配置的部件包括用于重新配置所述第一链路伙伴的媒体访问通道(MAC)层的部件。
41.如权利要求40所述的设备,其中,用于重新配置所述第一链路伙伴的所述MAC层的部件包括用于重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分的部件。
42.一种设备,包括:
用于通过将第一链路伙伴耦合到第二链路伙伴的以太网链路来传送业务的部件,其中,所述第一和第二链路伙伴中的每个支持基于优先级的流控制,并且所述第二链路伙伴是交换机,并且其中,所述业务包含一个或多个可丢弃业务类别;
用于响应于网络接口重新配置事件,
将所述交换机配置成丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组;
更新所述第一链路伙伴的配置,同时所述交换机配置成丢弃属于所述一个或多个可丢弃业务类别并去往所述第一链路伙伴的入局分组;以及
在所示第一链路伙伴的所述配置被更新后,将所述交换机配置成停止丢弃去往所述第一链路伙伴的属于所述一个或多个可丢弃业务类别的入局分组的部件。
43.如权利要求42所述的设备,其中,所述业务包含一个或多个非丢弃业务类别,所述设备还包括:
用于从所述第一链路伙伴向所述交换机发送针对所述一个或多个非丢弃业务类别的优先级流控制消息,以禁止属于所述一个或多个非丢弃业务类别的分组传送到所述第一链路伙伴的部件。
44.如权利要求42所述的设备,其中,由所述第一链路伙伴使用接收管道来处理接收的分组,所述设备还包括:
用于在更新所述第一链路伙伴的所述配置之前,等待链路往返程等待时间并等待所述接收管道排空的部件。
45.如权利要求42所述的设备,其中,所述第一链路伙伴包括安装在主机设备中的网络设备,并且其中,所述网络设备包含接收队列,所述设备还包括:
用于在更新所述第一链路伙伴的所述配置之前,
向运行在所述主机设备上的软件报告传送队列已满状态的部件;以及,
用于在所述第一链路伙伴的所述配置已经被更新后,
向运行在所述主机设备上的所述软件报告传送队列可用状态的部件。
46.如权利要求42所述的设备,其中,所述第一链路伙伴包括以太网网络接口控制器(NIC)。
47.如权利要求42所述的设备,其中,所述第二链路伙伴包括以太网交换机。
48.如权利要求42所述的设备,其中,用于更新所述第一链路伙伴的所述配置的部件包括用于重新配置所述第一链路伙伴的媒体访问通道(MAC)层的部件。
49.如权利要求48所述的设备,其中,用于重新配置所述第一链路伙伴的所述MAC层的部件包括用于重置用于实现所述MAC层的所述第一链路伙伴上的电路的至少一部分的部件。
50.一种已在其上存储有指令的计算机可读介质,所述指令在被执行时促使计算装置执行根据权利要求1-11中任一项所述的方法。
51.一种已在其上存储有指令的计算机可读介质,所述指令在被执行时促使计算装置执行根据权利要求12-19中任一项所述的方法。
CN201680055812.3A 2015-09-25 2016-09-23 在lan接口重置期间活动的链路 Active CN108028788B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562232798P 2015-09-25 2015-09-25
US62/232,798 2015-09-25
PCT/US2016/053398 WO2017053770A1 (en) 2015-09-25 2016-09-23 Active link during lan interface reset

Publications (2)

Publication Number Publication Date
CN108028788A CN108028788A (zh) 2018-05-11
CN108028788B true CN108028788B (zh) 2021-06-08

Family

ID=58387396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680055812.3A Active CN108028788B (zh) 2015-09-25 2016-09-23 在lan接口重置期间活动的链路

Country Status (4)

Country Link
US (1) US11134125B2 (zh)
EP (1) EP3353959A4 (zh)
CN (1) CN108028788B (zh)
WO (1) WO2017053770A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11863468B2 (en) * 2019-04-19 2024-01-02 Marvell Asia Pte Ltd Control of ethernet link-partner GPIO using OAM
CN110072162A (zh) * 2019-04-26 2019-07-30 湖北三江航天万峰科技发展有限公司 一种可靠单模光口通信方法及装置
CN112242914B (zh) * 2019-07-18 2023-10-03 华为技术有限公司 网络异常根因定位方法、装置及系统、计算机存储介质
CN112448900B (zh) * 2019-09-02 2023-05-19 华为技术有限公司 一种数据传输方法及装置
US11226879B2 (en) * 2020-05-08 2022-01-18 International Business Machines Corporation Fencing non-responding ports in a network fabric
US11909590B2 (en) * 2021-11-18 2024-02-20 Hewlett Packard Enterprise Development Lp Configuring a network interface card

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370909A (zh) * 2011-06-22 2013-10-23 瑞典爱立信有限公司 Phy到mac装置互连的运行时间重新指定的装置、系统和方法
CN104081797A (zh) * 2012-07-10 2014-10-01 英特尔公司 被配置为用于在数据模式期间对前向纠错进行解析的网络系统
US8943490B1 (en) * 2012-09-28 2015-01-27 Juniper Networks, Inc. Intelligent non-stop software upgrade

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839345B2 (en) 1999-12-17 2005-01-04 Texas Instruments Incorporated MAC/PHY interface
TW595152B (en) 2000-11-30 2004-06-21 Winbond Electronics Corp Control device and method of physical layer signal to generate a specific alarm data selectively
US8089984B2 (en) 2009-06-23 2012-01-03 Broadcom Corporation Method and system for network communications via a configurable multi-use ethernet PHY
US20080205388A1 (en) * 2007-02-22 2008-08-28 Microsoft Corporation Discovery of network devices logically located between a client and a service
US8154996B2 (en) * 2008-09-11 2012-04-10 Juniper Networks, Inc. Methods and apparatus for flow control associated with multi-staged queues
US8107365B2 (en) * 2008-11-24 2012-01-31 Cisco Technology, Inc. Interim PHY solution for LPI compatibility with legacy devices
EP2362578A1 (en) 2010-02-15 2011-08-31 Broadcom Corporation Method and system for managing network power policy and configuration of data center bridging
US20110261686A1 (en) 2010-04-21 2011-10-27 Kotha Saikrishna M Priority Pause (PFC) in Virtualized/Non-Virtualized Information Handling System Environment
US8935550B2 (en) 2011-01-21 2015-01-13 Broadcom Corporation System and method for selectively placing portions of a physical layer into low power mode
US8942144B2 (en) * 2011-05-12 2015-01-27 Micrel, Inc. Adaptive pause time energy efficient ethernet PHY
US8239698B2 (en) * 2011-07-01 2012-08-07 Intel Corporation System and method for maintaining connectivity to remote application servers
US9608918B2 (en) 2013-10-23 2017-03-28 Brocade Communications Systems, Inc. Enabling concurrent operation of tail-drop and priority-based flow control in network devices
EP3100416B1 (en) * 2014-01-29 2019-10-16 Hewlett-Packard Enterprise Development LP Managing a number of ethernet links

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370909A (zh) * 2011-06-22 2013-10-23 瑞典爱立信有限公司 Phy到mac装置互连的运行时间重新指定的装置、系统和方法
CN104081797A (zh) * 2012-07-10 2014-10-01 英特尔公司 被配置为用于在数据模式期间对前向纠错进行解析的网络系统
US8943490B1 (en) * 2012-09-28 2015-01-27 Juniper Networks, Inc. Intelligent non-stop software upgrade

Also Published As

Publication number Publication date
CN108028788A (zh) 2018-05-11
US20180234507A1 (en) 2018-08-16
EP3353959A4 (en) 2019-07-03
EP3353959A1 (en) 2018-08-01
US11134125B2 (en) 2021-09-28
WO2017053770A1 (en) 2017-03-30

Similar Documents

Publication Publication Date Title
CN108028788B (zh) 在lan接口重置期间活动的链路
US20200220816A1 (en) Data center congestion management for non-tcp traffic
US10205667B2 (en) Credit flow control for ethernet
CN101325497B (zh) 在不存在自动协商标准的接口上的自动协商
US7239636B2 (en) Multiple virtual channels for use in network devices
US8885488B2 (en) Reachability detection in trill networks
US8509616B2 (en) Devices, systems and methods for run-time reassignment of a PHY to MAC devices interconnect
CN115152193A (zh) 针对ip路由数据中心网络使用自适应路由和基于拥塞提示的节流改进端到端拥塞反应
KR20140099247A (ko) 동적으로 전력 및 성능 최적화된 서버 상호연결을 위한 시스템 및 방법
WO2006111788A1 (en) Interrupting transmission of low priority ethernet packets
US11283734B2 (en) Minimizing on-die memory in pull mode switches
EP2477364B1 (en) Method and system for low-latency networking
JP5065269B2 (ja) ローカル・エリア・ネットワーク管理
RU2510142C2 (ru) Способ и система для передачи сообщения между дополнительным процессором и переключающей схемой
EP2378715B1 (en) Data transfer device
CN112543128B (zh) 用于指示维护模式操作的双向转发检测控制分组
JP2004289744A (ja) マルチポートスイッチ
CN116805931A (zh) 电子装置及其流量控制方法
EP3725039A1 (en) Remote in-band management of a network interface controller

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant