CN110677278A - 一种消息处理机 - Google Patents

一种消息处理机 Download PDF

Info

Publication number
CN110677278A
CN110677278A CN201910853039.0A CN201910853039A CN110677278A CN 110677278 A CN110677278 A CN 110677278A CN 201910853039 A CN201910853039 A CN 201910853039A CN 110677278 A CN110677278 A CN 110677278A
Authority
CN
China
Prior art keywords
message
ports
network
network ports
engines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910853039.0A
Other languages
English (en)
Inventor
卢宏生
曹志强
牟华先
任秀江
冯冬明
周舟
周建毅
斯添浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Jiangnan Computing Technology Institute
Original Assignee
Wuxi Jiangnan Computing Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Jiangnan Computing Technology Institute filed Critical Wuxi Jiangnan Computing Technology Institute
Priority to CN201910853039.0A priority Critical patent/CN110677278A/zh
Publication of CN110677278A publication Critical patent/CN110677278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/18End to end

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Multi Processors (AREA)

Abstract

本发明涉及消息处理技术领域,特别涉及一种消息处理机。包括多个网络端口、多个消息引擎和多个控制端口;所述多个消息引擎与所述多个控制端口全交叉互连,以通过所述控制端口供主机处理器访问;所述多个消息引擎与所述多个网络端口全交叉互连,以通过所述网络端口发送数据。通过多控制通道、多消息引擎、多网络端口的交叉互连,可以提升消息的性能和可靠性。

Description

一种消息处理机
技术领域
本发明涉及消息处理技术领域,特别涉及一种消息处理机。
背景技术
随着集成电路的发展,计算节点性能提升远大于消息性能提升,高性能计算系统对消息通信性能提升的需求更为迫切。
消息处理架构是消息机制的基础,决定了互连网络通信中的基本规则。按功能模块划分,消息处理机可以分为控制接口、消息引擎、网络端口三大部分。控制接口是处理器主机连接控制消息处理机的入口,也是软硬件交互接口,控制接口的设计在一定程度上能够影响消息机制的性能;消息引擎是消息机制实现的核心,它的结构决定了消息的主要处理流程,消息类型的支持的丰富程度决定了消息引擎的设计复杂度;网络端口是消息处理机与互连网络的接口,它决定了数据发送上网的粒度,同时承担与互连网络的信用交互和流量控制等功能。
控制端口与消息引擎直接连接,主机处理器通过控制端口向消息引擎提交消息请求,消息引擎将消息拆分为若干网络数据包,通过网络端口发送后,再通过控制端口通知主机处理器消息传输完成。在常用的网卡设备中,控制端口、消息引擎和网络端口均为一一对应关系,这种绑定方式易于实现消息级重传的容错方式。但这种方式的缺点也是明显的,三个模块中只要有一个发生错误,则该消息处理机均不能工作。这种紧耦合架构缺陷对芯片制造成品率要求较高,增加了消息处理机芯片的实现风险。
发明内容
本发明旨在提供一种包含多控制通道、多消息引擎、多网络端口的面向高性能计算的消息处理芯片的架构,通过多控制通道、多消息引擎、多网络端口的交叉互连,可以提升消息的性能和可靠性。
一种消息处理机,其特征在于:
包括多个网络端口、多个消息引擎和多个控制端口;
所述多个消息引擎与所述多个控制端口全交叉互连,以通过所述控制端口供主机处理器访问;
所述多个消息引擎与所述多个网络端口全交叉互连,以通过所述网络端口发送数据。
上述技术方案中,每个控制端口可以访问任意一个消息引擎,每个消息引擎可以使用任意一个网络端口发送数据。该消息处理机具备较好的容错性能,任何一个功能模块损坏,都可以交叉互连切换到其他同级模块上执行。
作为优选,所述多个消息引擎通过第一交叉开关与所述多个控制端口全交叉互连。
作为优选,所述多个消息引擎通过第二交叉开关与所述多个网络端口全交叉互连。
作为优选,所述消息引擎将不同的消息经不同的所述网络端口发送。
作为优选,所述消息引擎将不同的数据包经不同的所述网络端口发送。
作为优选,至少两个所述网络端口连接至互连网络的不同路径节点。增加了消息的传输路径的多样性。
作为优选,所述消息引擎将同一消息的数据包通过两个连接至互连网络的不同路径节点的所述网络端口发送到目标节点。可提高系统互连的健壮性以及消息引擎的处理效率。
作为优选,至少两个所述网络端口连接至不同的网络中。
作为优选,所述消息引擎配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。便于对消息引擎进行故障监控和管理。
作为优选,所述网络端口配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。便于对网络端口进行故障监控和管理。
本发明具有下述有益效果:
1、多个控制端口与多个消息引擎全交叉连接,提高消息处理机的容错性。
2、多个网络端口与多个消息引擎全交叉连接,消息数据包可选传输路径增多,提高了消息传输的容错性。
3、一个消息可使用多个网络端口传输,能够提高数据传输性能,同时也有利于保持各网络通路的负载均衡。
附图说明
图 1是本发明实施例的消息处理机的消息处理架构框图。
具体实施方式
这里使用的术语仅用于描述特定实施例的目的,而不意图限制本发明。 除非另外定义,否则本文使用的所有术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。 将进一步理解的是,常用术语应该被解释为具有与其在相关领域和本公开内容中的含义一致的含义。本公开将被认为是本发明的示例,并且不旨在将本发明限制到特定实施例。
实施例一
如图1所示为本实施例的消息处理机的消息处理架构框图。如图所示,该消息处理机包括X个网络端口(X大于1)、Y个消息引擎(Y大于1)、Z个控制端口(Z大于1)。其中,Y个消息引擎与X个网络端口之间采用第二交叉开关全交叉互连,以使得各Y消息引擎能够通过任意一个网络端口发送数据。Y个消息引擎与Z个控制端口之间采用第一交叉开关全交叉互连,以使得各消息引擎能够通过任意一个控制端口被主机处理器访问。全交叉互连是指,消息处理机的每个控制端口可以访问任意一个消息引擎,消息处理机的每个消息引擎可以使用任意一个网络端口发送数据。在本实施例的消息处理架构下,对于主机处理器来说具备Y个消息引擎,可以通过Z个控制端口访问所有Y个消息引擎。对消息引擎来说,消息数据都可以通过X个网络端口发送。根据不同的交叉策略,网络端口间的切换可以是消息级:即消息引擎将不同的消息选择经不同的网络端口发送。网络端口间的切换也可以是数据包级:即消息引擎可以将同一个消息的不同数据包选择经不同的网络端口发送。
本实施例的消息处理机具备较好的容错性能,任何一个功能模块(网络端口/消息引擎/控制端口)损坏,都可以通过交叉开关的切换操作快速迁移到其他同级模块上执行。作为本实施例的优选,至少两个网络端口连接至互连网络的两个不同路径节点。或者作为本实施例的另一优选,至少两个网络端口连接至两个不同的网络中。这两种优选方式增加了消息的传输路径多样性,同一个消息的数据包可通过不同网络端口选择不同路径发送到目标节点,可提高系统互连的健壮性,这一点在大规模互连系统中尤为重要。多个网络路径的存在,还可提高消息引擎的处理效率,消息引擎发送的数据包不依赖某固定网络端口的拥塞情况,对均衡网络流量有较大好处。
消息引擎配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。网络端口也相应配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。例如控制端口0固定管理消息引擎0和网络端口0的状态,消息引擎0和网络端口0发生故障时将固定通过控制端口0通知主机处理器。
虽然描述了本发明的实施方式,但是本领域普通技术人员可以在所附权利要求的范围内做出各种变形或修改。

Claims (10)

1.一种消息处理机,其特征在于:
包括多个网络端口、多个消息引擎和多个控制端口;
所述多个消息引擎与所述多个控制端口全交叉互连,以通过所述控制端口供主机处理器访问;
所述多个消息引擎与所述多个网络端口全交叉互连,以通过所述网络端口发送数据。
2.根据权利要求1所述的一种消息处理机,其特征在于:
所述多个消息引擎通过第一交叉开关与所述多个控制端口全交叉互连。
3.根据权利要求1所述的一种消息处理机,其特征在于:
所述多个消息引擎通过第二交叉开关与所述多个网络端口全交叉互连。
4.根据权利要求1所述的一种消息处理机,其特征在于:
所述消息引擎将不同的消息经不同的所述网络端口发送。
5.根据权利要求1所述的一种消息处理机,其特征在于:
所述消息引擎将不同的数据包经不同的所述网络端口发送。
6.根据权利要求1所述的一种消息处理机,其特征在于:
至少两个所述网络端口连接至互连网络的不同路径节点。
7.根据权利要求6所述的一种消息处理机,其特征在于:
所述消息引擎将同一消息的数据包通过两个连接至互连网络的不同路径节点的所述网络端口发送到目标节点。
8.根据权利要求1所述的一种消息处理机,其特征在于:
至少两个所述网络端口连接至不同的网络中。
9.根据权利要求1所述的一种消息处理机,其特征在于:
所述消息引擎配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。
10.根据权利要求1所述的一种消息处理机,其特征在于:
所述网络端口配置有对应的控制端口,用于在故障时通过对应的控制端口通知主机处理器。
CN201910853039.0A 2019-09-10 2019-09-10 一种消息处理机 Pending CN110677278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910853039.0A CN110677278A (zh) 2019-09-10 2019-09-10 一种消息处理机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910853039.0A CN110677278A (zh) 2019-09-10 2019-09-10 一种消息处理机

Publications (1)

Publication Number Publication Date
CN110677278A true CN110677278A (zh) 2020-01-10

Family

ID=69077186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910853039.0A Pending CN110677278A (zh) 2019-09-10 2019-09-10 一种消息处理机

Country Status (1)

Country Link
CN (1) CN110677278A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758053A (en) * 1992-07-22 1998-05-26 Hitachi, Ltd. Fault handling and recovery for system having plural processors
US6751698B1 (en) * 1999-09-29 2004-06-15 Silicon Graphics, Inc. Multiprocessor node controller circuit and method
US20060143357A1 (en) * 2004-12-29 2006-06-29 Hewlett-Packard Development Company, L.P. Multiple cell computer systems and methods
CN108734286A (zh) * 2017-04-24 2018-11-02 英特尔公司 在推断期间中对图形处理器的协调和增加利用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758053A (en) * 1992-07-22 1998-05-26 Hitachi, Ltd. Fault handling and recovery for system having plural processors
US6751698B1 (en) * 1999-09-29 2004-06-15 Silicon Graphics, Inc. Multiprocessor node controller circuit and method
US20060143357A1 (en) * 2004-12-29 2006-06-29 Hewlett-Packard Development Company, L.P. Multiple cell computer systems and methods
CN108734286A (zh) * 2017-04-24 2018-11-02 英特尔公司 在推断期间中对图形处理器的协调和增加利用

Similar Documents

Publication Publication Date Title
US11178001B2 (en) Multi-stage switch fabric fault detection and handling
EP1982447B1 (en) System and method for detecting and recovering from virtual switch link failures
CN108306777B (zh) 基于sdn控制器的虚拟网关主备切换方法及装置
US7876764B2 (en) Multiple aggregation protocol sessions in a daisy chain network
US9300574B2 (en) Link aggregation emulation for virtual NICs in a cluster server
US8769459B2 (en) High-end fault-tolerant computer system and method for same
JP2004062535A (ja) マルチプロセッサシステムの障害処理方法、マルチプロセッサシステム及びノード
CN102387084A (zh) 基于RapidIO协议包交换的系统结构
JP2014096682A (ja) 通信システムおよびネットワーク中継装置
CN101895423A (zh) 以太网中的数据传输方法和系统
CN103136141A (zh) 一种多控制器间的高速互联方法
JP2006087102A (ja) スイッチ装置の透過的回復のための装置および方法
CN113300952A (zh) 一种用于云安全资源池的分布式引流系统及其引流方法
CN102763087B (zh) Cpu间互联容错的实现方法及系统
US7346050B2 (en) Method, system, and storage medium for delay optimization for scheduling in bufferless crossbar switches
CN100420217C (zh) 框间互连的通信系统及其数据交换方法
CN105610614A (zh) 高可用访问系统以及高可用故障切换方法
CN110677278A (zh) 一种消息处理机
KR100207598B1 (ko) 상호연결망으로서 파이브 채널을 사용한 클러스터시스템
CN102880583A (zh) 一种多路服务器动态链路配置装置和方法
US20190140862A1 (en) Method for exchanging data in cluster server system
WO2017157116A1 (zh) 一种流量拥塞控制方法、装置及存储介质
RU186862U1 (ru) Абонентское сетевое устройство с виртуализированными сетевыми функциями
EP2621129B1 (en) Data forwarding method and router
CN113132260B (zh) 一种多业务虚拟网络系统及多业务分离并行通信的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110