CN103890750B - 具有持久状态流控制的高性能虚拟融合增强型以太网 - Google Patents

具有持久状态流控制的高性能虚拟融合增强型以太网 Download PDF

Info

Publication number
CN103890750B
CN103890750B CN201280051392.3A CN201280051392A CN103890750B CN 103890750 B CN103890750 B CN 103890750B CN 201280051392 A CN201280051392 A CN 201280051392A CN 103890750 B CN103890750 B CN 103890750B
Authority
CN
China
Prior art keywords
link
packet
equipment
request
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280051392.3A
Other languages
English (en)
Other versions
CN103890750A (zh
Inventor
C.M.德库萨蒂斯
R.B.克里施纳默西
A.拉奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN103890750A publication Critical patent/CN103890750A/zh
Application granted granted Critical
Publication of CN103890750B publication Critical patent/CN103890750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/26Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
    • H04L47/263Rate modification at the source after receiving feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/39Credit based

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

维持服务器与存储阵列之间的链路中的带宽包括设备。所述设备建立所述链路。所述设备从所述链路中识别第一链路。所述第一链路具有高响应时间。所述设备在所述第一链路上传送多个数据分组。每个数据分组与对应的确认(ACK)关联。在不等待所述对应的ACK被接收的情况下执行所述传送。所述设备跟踪响应于每个所传送的数据分组而接收的ACK。所述设备检测所述第一链路的故障。响应于所述检测,所述设备识别无效数据分组。所述无效数据分组包括在所检测的故障之后在所述第一链路上传送的数据分组。

Description

具有持久状态流控制的高性能虚拟融合增强型以太网
技术领域
本发明一般涉及融合增强型以太网(CEE),并且具体涉及持久状态流控制。
背景技术
使用基于CEE的光纤通道连接多个物理数据中心以用于存储备份。对于这种网络,当处置封装的存储业务时,在等待基于信用的流控制中通常存在长延迟。延迟可能由于延长距离的链路(例如,几km或更多)、或者由于其它原因(诸如具有低性能或显著的超额认购(oversubscription)的本地附接的设备)而发生。
发明内容
根据本发明的一个实施例,提供一种用于维持服务器与存储阵列之间的链路中的带宽的方法、系统和程序产品,其包括设备。所述设备建立所述链路。所述设备从所述链路中识别第一链路。所述第一链路具有高响应时间。所述设备在所述第一链路上传送多个数据分组。每个数据分组与对应的确认(ACK)关联。在不等待ACK被接收的情况下执行传送。所述设备跟踪响应于每个所述数据分组而接收的ACK。所述设备检测所述第一链路的故障。响应于检测,所述设备识别无效数据分组。所述无效数据分组包括在所检测的故障之后在所述第一链路上传送的数据分组。
根据本发明的一个实施例,所述多个数据分组包括请求。
根据本发明的一个实施例,所述请求包括命令控制字(CCW)。
根据本发明的一个实施例,所述多个数据分组包括与请求关联的数据。
根据本发明的一个实施例,所述链路是虚拟链路。
根据本发明的一个实施例,响应于所述检测,所述设备重新传送所述无效数据分组。
根据本发明的一个实施例,由用户确定高响应时间。
根据本发明的一个实施例,基于重复传输和数据分组传输的记录确定所述高响应时间。
根据本发明的一个实施例,所述无效数据分组包括在上一次成功传送的数据分组之后传送的数据分组。所述上一次成功传送的数据分组与上一次跟踪的ACK关联。
附图说明
图1图示了根据本发明一个或多个方面的CCW请求的一个实施例。
图2图示了根据本发明的实施例的一个或多个方面的数据磁盘架构记录布局的一个实施例。
图3图示了根据本发明的实施例的一个或多个方面的链路初始化处理的一个实施例。
图4是图示了根据本发明的实施例的一个或多个方面的数据通过网络中的链路的传输的一个实施例。
图5图示了合并本发明的实施例的一个或多个方面的计算机程序产品的一个实施例。
图6图示了可以实践本发明的实施例的计算机系统的一个实施例。
具体实施方式
根据本发明的一个或多个方面,提供了一种方法、系统和计算机程序产品,用于维持网络(例如,融合增强型以太网(CEE)网络、或基于融合增强型以太网的光纤通道(FCoCEE)网络)中的服务器与存储设备之间连接的链路中的带宽。可以例如在CEE交换机中(因为延长距离的链路通常发生在光纤交换机之间)、在服务器主机总线适配器(HBA)处、或者在存储控制单元处,以各种方式实施本发明的一个或多个方面。关于CEE和FCoCEE的具体细节可以在如下文献中找到:IBM红皮书:Srihari Angaluri等人的“Planningfor Converged Fabrics The Next Step in Data Center Evolution”,2010年;CEE作者:Hugh Barass等人的“Proposal for Priority Based Flow Control”,5/8/2008;CEE作者:Manoj Wadekar等人的“Priority Grouping for DCB networks(Enhanced transmission Selection)Rev1.01”;以及CEE作者:Manoj Wadekar等人的“DCB Capability Exchange Protocol Base Specification Rev1.01”(通过引用将全部上述文献合并在此)。
当将ECC或FCoCEE链路内的封装光纤通道/FICON数据附接至长链路时,在等待在层2(L2)和层4处的基于信用的流控制中可能存在长延迟。L2也称为数据链路层。L4也称为传输层。如本领域中已知的,一般地,独立地对待每个I/O请求,等待流控制答复,其可能导致性能下降并限制有用的链路距离。
在优选实施例中,存储控制器内的持久存储器状态记忆哪些链路经历延长的响应时间,这可以基于来自信用确认的响应时间或基于用户输入(例如,通过切换管理系统)。换言之,记忆使连续的请求在网络中(诸如,从服务器至存储设备)按步幅传输(pacing)的L2和L4(诸如光纤通道层2和层4)。这些请求可能是通道命令字(CCW)请求。延长距离的链路也可能是单个位置内的多跳。具有延长的响应时间的链路不限于延长距离的链路。链路可能由于其它原因(例如,具有低性能或显著的超额认购的本地附接的设备)而经历延长的响应时间。一旦被识别,这些链路就不等待每个请求之间的确认(ACK)。数据被简单地流化(stream)到链路上。允许诸如CEE通道的具有高延时的通道传送多于通常量的帧以维持全带宽。帧是数据传送的基本单位并且包括报头、数据有效载荷和尾部。可以采用专门类型的帧作为网络上的控制分组。在网络协议标准的链路层规范中提供了帧结构的细节。此优选实施例可以实现在更长距离的更高性能、更优的网络带宽利用,并使得更长距离变得可行。
在优选实施例中,为了将数据传输通过网络,使用CCW用于请求。CCW指定要执行的命令,并且包括其它字段以控制处理。参考图1描述CCW的一个示例。CCW100例如包括:命令代码102,其指定要执行的命令(例如,读取、反向读取、控制、感测和写入);多个标志104,用于控制I/O操作;对于指定数据的传输的命令,计数字段106,其指定由CCW指派的存储区域中的要传输的字节数目;以及数据地址108,其在采用直接寻址时指向主存储器中的包括数据的位置、或者在采用修改的间接数据寻址时指向要处理的修改的间接数据地址字(MIDAW)的列表(例如,连续列表)。在Brice等人于2006年8月15日提交的编号为11/464,613、标题为“Flexibly Controlling TheTransfer Of Data Between Input/Output Devices And Memory”的美国申请中进一步描述了修改的间接寻址,通过引用将其全文合并在此。
参考图2描述根据本发明的一个或多个方面的磁盘数据架构记录布局的一个实施例。当存在写入命令时,在存储设备中使用此记录布局,并且,当存在读取命令时,在服务器设备中使用此记录布局。在计数密钥数据(CKD)磁盘数据架构中,数据字段201也存储用户数据。因为数据记录可在长度上可变,所以,在CKD中,它们都具有计数报头202,其是指示可变用户数据记录尺寸的关联计数字段。密钥字段203实现对密钥的硬件搜索。硬件搜索用于帮助识别存储数据记录的适当位置。CRC字段204是循环返回检查,其验证数据的比特错误。LRC字段205是用于识别数据的各种类型的问题的返回码。填充字段206用于将空闲字符添加至数据中,使得数据流具有相等长度。在CKD架构中使用CCW以用于管理数据和存储设备。存在大量不同CCW,例如,“定位记录”、“定位磁道(cylinder)”、“读取数据”等。扩展的CKD(ECKD)是CKD磁盘数据架构的变型,其允许FICON通道(光纤通道)接入。
服务器与存储设备之间的链路初始化一般包括服务器向存储设备宣告可用缓冲器信用(例如,用于层4(L4)和层2(L2))。一旦存储设备接收到可用缓冲器信用,它就确定用于发送/接收的最大数据量。存储设备然后以可用存储信用(例如,用于L4和L2)来响应。一旦服务器接收到可用存储信用,就确定用于发送/接收的最大数据量,这完成了初始化。
参考图3描述根据本发明的一个或多个方面的链路初始化处理的一个实施例。该处理可以仅在服务器侧运行。服务器在301中将多次ping(因特网封包探索)网络中的链路以估计该链路的响应延时。存储设备在302中将响应ping并将ping响应返回至服务器。ping响应确认存储设备存在。在一个实施例中,ping响应可以在存储设备存在的确认之外不包含附加数据。如果延时太长,则将执行303、304至309。关于延时是否太长的确定可以基于预定延时值,其可以由用户定义。在304中,开始链路初始化。由服务器宣告可用缓冲器信用(例如,用于L4和L2)。在305中,拦截包括可用缓冲器信用的请求。代替将实际可用缓冲器信用传送至存储设备,生成大信用数目并替代实际可用缓冲器信用。传送大信用数目、而非实际可用缓冲器信用。在306中,存储设备接收大信用数目,存储设备相信该大信用数目是服务器的可用缓冲器信用。基于此大信用数目,存储设备确定用于发送/接收的最大数据量。在307中,存储设备在具有可用存储信用数目(例如,用于L4和L2)的请求中响应回服务器。在308中,服务器拦截包含可用存储信用数目的请求并丢弃它们。在309中,服务器接收在步骤305中生成的大存储信用,并确定用于发送/接收的最大数据量,这完成了链路初始化。在306和309中向服务器和存储设备两者告知它们具有可用信用的非常大的(基本上是无限的)供应量。
在一个实施例中,可以基于带宽与往返延时的乘积来确定图3的305中传送的大信用数目。对于具有延长的响应时间的链路,可以使用基于信用的流控制,并且发送是异步的且流水线式的。为了适当地确定发送缓冲器的尺寸,可以使用带宽与往返延时的乘积。在链路初始化时间期间,远程存储控制器可以是来回式的(例如,几百至1000来回),以获得往返延时的估计。来回(ping-pong)是指ping和确认在链路上来回的交换,以确立两端具有连接设备,例如,服务器设备和存储设备。在一个实施例中,为了适当地识别链路为延长的相应时间,可以存储具有链路、带宽(BW)、传播延迟(光速)和往返延时的表。可以由用户输入传播延迟/BW。BW和往返延时的乘积(例如,在层2或层4)将定义发送缓冲器的尺寸。其必须至少是BW*往返传播延迟。这允许确定发送缓冲器的尺寸。在未从远程存储控制器/设备接收ACK的情况下,不能从设备缓冲器移除任何帧。
在一个实施例中,诸如CEE通道的通道可以仅执行一次链路初始化,然后存储链路步幅(pacing)更新,同时在每个请求或交易期间跳过步幅重新初始化。这样,允许具有高延时的通道传送多于通常量的帧以维持全带宽。这可以实现在更长距离的更高性能、以及更优的网络带宽利用,因此,用于存储备份的更长距离或更大网络可以变得可行。这还可以便利于传统存储向FCoCEE的迁移。
通过网络中的链路(例如,在服务器与存储设备之间)传输数据一般包括从服务器至存储设备的诸如CCW的命令请求。对于读取请求,存储设备接收请求。根据例如用于光纤通道的协议,存储设备可以在发送第一数据块之前确认请求本身。存储设备使用一个服务器缓冲器信用一次一个地将数据块发送至服务器,直到所有服务器缓冲器信用耗尽为止。一旦服务器缓冲器信用耗尽,存储设备就等待。当服务器接收每个数据块时,它将ACK传送回至存储设备。当存储设备接收每个ACK时,补充服务器缓冲器信用。当存在可用服务器缓冲器信用时,如果等待已经发生,则重新开始传送。以此方式的传送依赖于信用的使用和补充、以及ACK的接收。对于写入请求,存储设备接收请求。根据例如用于光纤通道的协议,存储设备可以在接收第一数据块之前确认请求本身。服务器使用一个存储缓冲器信用一次一个地将数据块发送至存储设备,直到所有存储缓冲器信用耗尽为止。一旦存储缓冲器信用耗尽,服务器就等待。当存储设备接收每个数据块时,它将ACK传送回至服务器。当服务器接收每个ACK时,补充存储缓冲器信用。当存在可用存储缓冲器信用时,如果等待已经发生,则重新开始传送。类似于读取请求,以此方式的传送依赖于信用的使用和补充、以及ACK的接收。
参考图4描述根据本发明的一个或多个方面的通过网络中的链路例如在服务器与存储设备之间传输数据的一个实施例。在401中,服务器将诸如CCW请求的读取请求发送至存储设备。存储设备在402中接收请求。根据例如用于光纤通道的协议,存储设备可以在发送第一数据块之前确认请求本身。存储设备然后在403中发送第一数据块并用尽缓冲器信用(例如,用于L2/L4)。存储设备继续发送数据块并使用缓冲器信用(404)。由于图3中讨论的大信用数目,缓冲器信用可能永不会用完。服务器接收第一数据块(405),并将ACK传送回至存储设备(406)。在从存储设备传送每个数据块时,服务器继续接收每个数据块,并且还继续传送对于每个接收的数据块的每个ACK(407)。存储设备接收对于由服务器接收的每个数据块的每个ACK(408)。在无需等待数据块的对应ACK的情况下,连续地流化数据块。在写入请求中,服务器将诸如CCW请求的读取请求发送至存储设备。存储设备接收请求,并且,根据例如用于光纤通道的协议,存储设备可以在接收第一数据块之前确认请求本身。服务器然后发送第一数据块并用尽存储缓冲器信用。服务器继续发送数据块并用尽存储缓冲器信用。由于图3中讨论的大存储缓冲器信用数目,存储缓冲器信用可能永不会用完。存储设备接收第一数据块,并将ACK传送回至服务器。在从服务器传送每个数据块时,存储设备继续接收每个数据块,并且还继续传送对于每个接收的数据块的每个ACK。服务器接收对于由存储设备接收的每个数据块的每个ACK。类似于读取请求,在无需等待数据块的对应ACK的情况下,连续地流化数据块。
在一个实施例中,可以在本地拦截并响应与层2和层4流控制关联的信用(例如,图4中的信用),而不是等待所接收的数据的确认。代替将信用请求发送至链路的远端且等待答复,拦截信用请求。将指示大量信用可用的对答复的响应发送回来。这样,本发明的一个实施例在不禁用现有信用请求处理的情况下起作用。相反,本发明的这一个实施例通过声称实际上已经发生了信用交换且存在大量可用信用而欺骗了链路。
在一个实施例中,跟踪由接收数据块而产生的ACK,使得在链路故障的情况下,自上一次跟踪的ACK之后发送或广播的所有数据可以被声明无效,并且,一旦建立新链路就经受重新传送。可以将所有未确认的分组存储在发送侧(例如,对于写入请求的服务器、或者对于读取请求的存储设备)的重传缓冲器中。一旦接收到对于未确认的分组的ACK,就从重传缓冲器中移除未确认的分组。在链路故障的情况下,停止数据分组传送。数据分组传送可能并非立即停止。发送侧可能需要一些时间来检测链路故障。在重新建立了链路之后,将重传缓冲器中的所有未确认的数据分组进行重传。检测断开链路和重新建立断开链路在本领域中是公知的且在本发明的范围之外。
参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
如本领域技术人员将理解的,本发明的实施例可以实现为系统、方法或计算机程序产品。因此,本发明的实施例可以具体实现为以下形式,即:可以是完全的硬件实施例、也可以是完全的软件实施例(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的实施例的形式,本文一般称为“电路”、“模块”或“系统”。此外,本发明的实施例还可以实现为在任何有形的表达介质中的计算机程序产品的形式,该介质中包含计算机可用的程序代码。
参考图5描述合并本发明的实施例的一个或多个方面的计算机程序产品的一个示例。计算机程序产品500例如包括一个或多个计算机可用介质502以在其上存储计算机可读程序代码部件或逻辑504,从而提供并便利于本发明的实施例的一个或多个方面。可以利用一个或多个计算机可用或计算机可读介质的任何组合。计算机可用或计算机可读介质例如可以是、但不限于电、磁、光、红外或半导体系统、装置或设备。计算机可读介质的更具体示例(非穷举列表)将包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CDROM)、光存储器件、或磁存储器件。在本文件的上下文中,计算机可用或计算机可读介质可以是任何可包含或存储程序的存储介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可以以一种或多种程序设计语言的任何组合来编写用于执行本发明的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”程序设计语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置上,使得在计算机、其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
图6示出了可在其中实施本发明的代表性工作站或服务器硬件系统。系统包括计算机系统601,诸如个人计算机、工作站、服务器、存储设备或主机,包括可选的外围设备。根据已知技术,基本计算机系统601包括一个或多个处理器606以及被用于连接并使能处理器606和系统601的其他组件之间的通信的总线。总线将处理器606连接到存储器605以及可包括例如硬盘驱动器(例如,包括磁介质、CD、DVD和闪存中的任何一个)或磁带驱动器的长期存储器607。系统601也可包括用户接口适配器,其经由总线将微处理器606连接到一个或多个接口设备,诸如键盘604、鼠标603、打印机/扫描仪610和/或其他接口设备,其可以是任何用户接口设备,诸如触摸敏感屏、数字化输入垫(digitized entry pad)等。总线也可经由显示适配器将诸如LCD屏幕或监视器的显示设备602连接到微处理器606。
计算机系统601可通过能与网络609通信1108的网络适配器与其他计算机或计算机网络通信。例如,网络适配器可以包括通信通道、令牌环网、以太网或调制解调器。或者,系统601可使用诸如CDPD(蜂窝数字分组数据)卡的无线接口来通信。系统601可与局域网(LAN)或广域网(WAN)中的这样的其他计算机关联,或系统601可以是与另一个计算机的客户机/服务器安排中的客户机等。所有这些配置以及合适的通信硬件和软件在本领域中是已知的。
通常可以由处理器606从长期存储介质607存取实现本发明的软件编程代码。可以在任何各种已知介质上包含软件编程代码,用于数据处理系统使用,如之前以上参考图5描述的。代码可以分布在这样的介质上,或者可以从一个计算机系统的存储器或存储装置通过至其它计算机系统的网络将代码分发给用户。
替代地,编程代码611可以包含在存储器605中,并且由处理器606使用处理器总线存取。这种编程代码可以包括控制各个计算机组件和一个或多个应用程序612的功能和交互的操作系统。通常可以将程序代码从存储介质607页式存储(page)到存储器605,在存储器605,所述程序代码可用于由处理器606处理。用于将软件编程代码包含在存储器中、物理介质上、以及/或者经由网络分发软件代码的技术和方法是公知的,并且这里将不进一步讨论。计算机程序产品介质通常可以由处理电路读取,优选地,在计算机系统中用于由处理电路执行。
这里描绘的流程图仅仅是示例。在不脱离本发明的精神的情况下,可以对这里说明的图或步骤(或操作)作许多变化。例如,步骤可以以不同的顺序执行,或者可以增加、删除或修改步骤。所有这些变化都被认为是主张权利的发明的一部分。
尽管已经说明了本发明优选的实施例,但应该理解,本领域的技术人员现在和将来都可以进行落在所附权利要求的范围内的各种改进和增强。

Claims (17)

1.一种用于维持服务器与存储阵列之间的链路中的带宽的系统,包括:
设备;
其中,所述系统被配置为执行包括以下步骤的方法:
由所述设备建立所述链路;
由所述设备从所述链路中识别第一链路,所述第一链路具有高响应时间;
由所述设备初始化所述第一链路,所述初始化所述第一链路包括:
拦截包括可用缓冲器信用的请求,所述请求向第二设备发送,并且所述请求包括与所述设备相关的可用缓冲器信用;生成大信用数目;
用所述大信用数目替代所述可用缓冲器信用;
向所述第二设备发送所述请求;
由所述设备在所述第一链路上传送多个数据分组,每个数据分组与对应的确认ACK关联,在不等待所述ACK被接收的情况下执行所述传送;
由所述设备跟踪响应于每个所传送的数据分组而接收的所述ACK;
由所述设备检测所述第一链路的故障;以及
响应于所述检测,由所述设备识别无效数据分组,所述无效数据分组包括在所检测的故障之后在所述第一链路上传送的数据分组。
2.如权利要求1所述的系统,其中所述多个数据分组包括请求。
3.如权利要求2所述的系统,其中所述请求包括命令控制字CCW。
4.如权利要求1所述的系统,其中所述多个数据分组包括与请求关联的数据。
5.如权利要求1所述的系统,其中所述链路是虚拟链路。
6.如权利要求1所述的系统,包括:
响应于所述检测,由所述设备重传所述无效数据分组。
7.如权利要求1所述的系统,其中由用户确定所述高响应时间。
8.如权利要求1所述的系统,其中基于数据分组传输的记录和重复传输确定所述高响应时间。
9.如权利要求1所述的系统,其中所述无效数据分组包括在上一次成功传送的数据分组之后传送的数据分组,所述上一次成功传送的数据分组与上一次跟踪的ACK关联。
10.一种用于维持包括设备的网络中的链路中的带宽的方法,所述方法包括:
由所述设备建立所述链路;
由所述设备从所述链路中识别第一链路,所述第一链路具有高响应时间;
由所述设备初始化所述第一链路,所述初始化所述第一链路包括:
拦截包括可用缓冲器信用的请求,所述请求向第二设备发送,并且所述请求包括与所述设备相关的可用缓冲器信用;
生成大信用数目;
用所述大信用数目替代所述可用缓冲器信用;
向所述第二设备发送所述请求;
由所述设备在所述第一链路上传送多个数据分组,每个数据分组与对应的确认ACK关联,在不等待所述ACK被接收的情况下执行所述传送;
由所述设备跟踪响应于每个所传送的数据分组而接收的所述ACK;
由所述设备检测所述第一链路的故障;以及
响应于所述检测,由所述设备识别无效数据分组,所述无效数据分组包括在所检测的故障之后在所述第一链路上传送的数据分组。
11.如权利要求10所述的方法,其中所述多个数据分组包括请求。
12.如权利要求11所述的方法,其中所述请求包括命令控制字CCW。
13.如权利要求10所述的方法,其中所述多个数据分组包括与请求关联的数据。
14.如权利要求10所述的方法,包括:
响应于所述检测,由所述设备重传所述无效数据分组。
15.如权利要求10所述的方法,其中由用户确定所述高响应时间。
16.如权利要求10所述的方法,其中基于数据分组传输的记录和重复传输确定所述高响应时间。
17.如权利要求10所述的方法,其中所述无效数据分组包括在上一次成功传送的数据分组之后传送的数据分组,所述上一次成功传送的数据分组与上一次跟踪的ACK关联。
CN201280051392.3A 2011-10-25 2012-10-24 具有持久状态流控制的高性能虚拟融合增强型以太网 Active CN103890750B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/280,437 2011-10-25
US13/280,437 US8868994B2 (en) 2011-10-25 2011-10-25 High performance virtual Converged Enhanced Ethernet with persistent state flow control
PCT/CN2012/083417 WO2013060266A1 (en) 2011-10-25 2012-10-24 High performance virtual converged enhanced ethernet with persistent state flow control

Publications (2)

Publication Number Publication Date
CN103890750A CN103890750A (zh) 2014-06-25
CN103890750B true CN103890750B (zh) 2016-08-31

Family

ID=48136980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280051392.3A Active CN103890750B (zh) 2011-10-25 2012-10-24 具有持久状态流控制的高性能虚拟融合增强型以太网

Country Status (4)

Country Link
US (2) US8868994B2 (zh)
CN (1) CN103890750B (zh)
DE (1) DE112012004138T5 (zh)
WO (1) WO2013060266A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6324319B2 (ja) 2012-01-09 2018-05-16 サムスン エレクトロニクス カンパニー リミテッド ロギング方法及び装置
CN107306149B (zh) * 2016-04-19 2020-06-26 航迅信息技术有限公司 一种航空通信方法及系统
US10235082B1 (en) * 2017-10-18 2019-03-19 EMC IP Holding Company LLC System and method for improving extent pool I/O performance by introducing disk level credits on mapped RAID
CN111600802B (zh) * 2020-04-14 2022-09-02 中国电子科技集团公司第二十九研究所 一种基于信用量的端系统发送控制方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1996275A (zh) * 2006-11-09 2007-07-11 中兴通讯股份有限公司 10位寻址模式i2c控制器访问大容量存储器的方法
CN101064668A (zh) * 2006-04-29 2007-10-31 上海博达数据通信有限公司 一种分布式路由子系统在ipv6协议栈的实现方法
CN101223759A (zh) * 2005-07-08 2008-07-16 富士通株式会社 发送装置、接收装置、信息通信方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5526484A (en) 1992-12-10 1996-06-11 International Business Machines Corporation Method and system for pipelining the processing of channel command words
US6343067B1 (en) * 1997-08-29 2002-01-29 Intel Corporation Method and apparatus for failure and recovery in a computer network
US6330585B1 (en) 1998-10-14 2001-12-11 International Business Machines Corporation Transfer information using optical fiber connections
US7010590B1 (en) * 1999-09-15 2006-03-07 Datawire Communications Networks, Inc. System and method for secure transactions over a network
US7500030B2 (en) 2006-08-30 2009-03-03 International Business Machines Corporation Control of information units in fibre channel communications
US20100217889A1 (en) * 2009-02-26 2010-08-26 Honeywell International Inc. Accelerated block option for trivial file transfer protocol (tftp)
US20110134930A1 (en) * 2009-12-09 2011-06-09 Mclaren Moray Packet-based networking system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101223759A (zh) * 2005-07-08 2008-07-16 富士通株式会社 发送装置、接收装置、信息通信方法
CN101064668A (zh) * 2006-04-29 2007-10-31 上海博达数据通信有限公司 一种分布式路由子系统在ipv6协议栈的实现方法
CN1996275A (zh) * 2006-11-09 2007-07-11 中兴通讯股份有限公司 10位寻址模式i2c控制器访问大容量存储器的方法

Also Published As

Publication number Publication date
WO2013060266A1 (en) 2013-05-02
US8874984B2 (en) 2014-10-28
US20130114396A1 (en) 2013-05-09
US20130103999A1 (en) 2013-04-25
CN103890750A (zh) 2014-06-25
DE112012004138T5 (de) 2014-06-26
US8868994B2 (en) 2014-10-21

Similar Documents

Publication Publication Date Title
US11640269B2 (en) Solid-state drive with initiator mode
US7133902B2 (en) Transmitting acknowledgements using direct memory access
CN104239256B (zh) 通过sas的pcie隧穿
TWI234371B (en) A method of performing iSCSI commands and a data processing system using the method
US9804788B2 (en) Method and apparatus for transferring information between different streaming protocols at wire speed
WO2018137217A1 (zh) 一种数据处理的系统、方法及对应装置
TWI444833B (zh) Sas擴充器之資料預取
CN103890750B (zh) 具有持久状态流控制的高性能虚拟融合增强型以太网
CN103441948B (zh) 一种数据访问方法、网卡及存储系统
CN107728936A (zh) 用于传输数据处理请求的方法和装置
CN104811392A (zh) 用于处理网络中的资源访问请求的方法和系统
KR970029126A (ko) 멀티프로세서 시스템
CN102446073A (zh) 延迟对操作的确认直至操作完成的方法和系统
CN106034084A (zh) 一种数据传输方法及装置
US7631313B2 (en) System and method for transferring data
CN105472023A (zh) 一种远程直接存储器存取的方法及装置
CN103368703B (zh) 数据包重传方法、数据包接收方法及装置
CN107295030A (zh) 一种数据写入方法、装置、数据处理方法、装置及系统
CN100452795C (zh) 利用iSCSI协议访问逻辑设备的方法
CN107783728A (zh) 数据存储方法、装置和设备
CN105335217B (zh) 一种服务器静默方法与系统
CN101355483A (zh) 一种多网口发送数据包的方法和设备
CN102480516A (zh) 网际网络小型电脑界面的数据单元的解析方法
CN107273318A (zh) 并行处理设备和通信控制方法
CN104243540B (zh) 数据传送方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant