CN217606351U - 硬件集群装置 - Google Patents

硬件集群装置 Download PDF

Info

Publication number
CN217606351U
CN217606351U CN202220093004.9U CN202220093004U CN217606351U CN 217606351 U CN217606351 U CN 217606351U CN 202220093004 U CN202220093004 U CN 202220093004U CN 217606351 U CN217606351 U CN 217606351U
Authority
CN
China
Prior art keywords
hosts
host
power
hardware cluster
cable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202220093004.9U
Other languages
English (en)
Inventor
张弛
安义凡
王新华
郑磊
蔡剑峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202220093004.9U priority Critical patent/CN217606351U/zh
Application granted granted Critical
Publication of CN217606351U publication Critical patent/CN217606351U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Power Sources (AREA)

Abstract

本实用新型实施例提供了一种硬件集群装置,包括至少两个主机,其中,主机中包括算力卡,相邻两个主机中的算力卡之间通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。通过本实用新型,解决了相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。

Description

硬件集群装置
技术领域
本实用新型实施例涉及存储技术领域,具体而言,涉及一种硬件集群装置。
背景技术
在相关技术中,算力池概念局限于服务器主板上,或在某台服务器上,设备通过网络实现算力池化的概念,即多个设备通过网络连接,实现算力池化,然而,当多个设备中的某个设备的主控故障时,会导致该设备的算力卡无法继续使用。
由此可知,相关技术中存在集群设备中算力卡利用率低的问题。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
实用新型内容
本实用新型实施例提供了一种硬件集群装置,以至少解决相关技术中存在的集群设备中算力卡利用率低的问题。
根据本实用新型的一个实施例,提供了一种硬件集群装置,包括至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。
通过本实用新型,在硬件集群装置中,包括至少两个主机,每个主机中均包括算力卡,相邻两个主机中的算力卡通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。由于各个主机中的算力卡可以通过线缆连接,当硬件集群装置中的某个主机的主控出现故障时,其他主机可以通过线缆接管出现故障的主机的算力卡,因此,可以解决相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。
附图说明
图1是根据本实用新型实施例的环形连接示意图;
图2是根据本实用新型实施例的两两连接示意图;
图3是根据本实用新型实施例的线型连接示意图;
图4是根据本实用新型具体实施例的硬件集群装置示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本实用新型的实施例。
需要说明的是,本实用新型的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
在本实施例中提供了一种硬件集群装置,该装置包括:
至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。
在上述实施例中,主机可以为服务器,硬件集群装置可以是包括多个服务器的设备,每个主机中可以包括多个算力卡,算力卡用于执行各类运算。每两个主机的算力卡可以通过线缆连接,线缆可以包括双绞线、光缆等,本实用新型对此不做限制。
在上述实施例中,各个主机的算力卡可以通过预定连接方式连接,预定连接方式可以是预先确定的连接方式。
在上述实施例中,当各个主机的算力卡通过线缆连接后,当某个主机的主控出现故障时,其他主机可以通过线缆控制该主机的算力卡继续工作,以提高算力卡的利用率。其中,其他主机可以是与故障主机相邻的主机。当故障主机存在多个相邻主机时,可以从多个相邻主机中随机指定一个主机作为接管主机。
通过本实用新型,在硬件集群装置中,包括至少两个主机,每个主机中均包括算力卡,相邻两个主机中的算力卡通过线缆连接,至少两个主机的算力卡通过线缆按照预定连接方式连接。由于各个主机中的算力卡可以通过线缆连接,当硬件集群装置中的某个主机的主控出现故障时,其他主机可以通过线缆接管出现故障的主机的算力卡,因此,可以解决相关技术中存在的集群设备中算力卡利用率低的问题,提高了集群设备中算力卡利用率。
在一个示例性实施例中,至少两个所述主机的所述算力卡环形连接。在本实施例中,预定连接方式可以是是至少两个主机的算力卡环形连接,其中,环形连接示意图可参见附图1,如图1所示,硬件集群装置中可以包括4个主机(该取值仅是一种示例性说明,主机的个数还是为3个,5个,10个等,本实用新型对此不做限制),4个主机通过线缆连接成环形。
在一个示例性实施例中,至少两个所述主机的所述算力卡中包括任意两个算力卡均通过所述线缆两两连接。在本实施例中,预定连接方式还可以是两两连接,两两连接示意图可参见附图2,如图2所示,至少两个主机中包括的每个主机均与至少两个主机中包括的其他主机连接。实现了每个主机都可以接管其他主机的算力卡的功能。
在一个示例性实施例中,至少两个所述主机的所述算力卡依次连接。在本实施例中,预定连接方式还可以是线型连接,线型连接示意图可参见附图3,如图3所示,每个主机的算力卡依次连接,连接成线型。
在一个示例性实施例中,所述主机还包括处理器,所述处理器位于所述背板中,所述处理器用于接收位于主控模块发送的控制指令,并基于所述控制指令调用所述主机中的算力卡。在本实施例中,主机中还可以包括处理器,处理器可以安装在背板中,处理器可以接收安装在主板中的主控模块发送的控制指令,并根据控制指令调用主机中的算力卡。即,在调用算力卡时,可以是主控模块通过处理器调用算力卡。
在一个示例性实施例中,至少两个所述主机中的任意两个主机之间通过网络连接。在本实施例中,多个主机中包括的任意两个主机之间可以通过网络连接,主机之间可以通过网络发送心跳指令,互相检测是否出现故障。在通过网络检测到至少两个主机中包括的目标主机出现故障的情况下,控制至少两个主机中包括的与目标主机的算力卡连接的算力卡所在的主机接管目标主机的算力卡,即当检测到目标主机出现故障的情况下,可以控制与目标主力的算力卡连接的算力卡所在的主机接收目标主机的算力卡。
在一个示例性实施例中,所述主机还包括主控模块,至少两个所述主机中所分别包括的所述主控模块之间通过网络连接。在本实施例中,主机还包括主控模块,主机之间可以通过主控模块进行网络连接。
在一个示例性实施例中,所述主机还包括主板,所述主控模块位于所述主板中。在本实施例中,主控模块可以安装在主板上。
在一个示例性实施例中,所述线缆包括以下至少之一:光缆、电缆。在本实施例中,连接算力卡的线缆可以是光缆,也可以是电缆,也可以选择部分算力卡之间通过光缆连接,部分算力卡之间通过电缆连接。
在一个示例性实施例中,在通过网络检测到至少两个所述主机中包括的目标主机的目标主控模块出现故障的情况下,控制所述相邻主机的主控模块接管所述目标主机的算力卡。在本实施例中,当目标主控模块出现故障的情况下,可以控制接管主机的主控模块接管目标主机的算力卡。
在一个示例性实施例中,所述主控模块还用于在确定所述主机中包括的算力卡的占用量小于预定阈值的情况下,向至少两个所述主机中包括的与所述主机的算力卡连接的算力卡所在的其他主机发送目标指令,其中,所述目标指令用于指示所述主机允许承接所述其他主机的算力任务。在本实施例中,当主控模块确定主机的算力卡的占用量小于预定阈值的情况下,可以向与该主机的算力卡连接的算力卡所在的其他主机发送目标指令,目标指令用于指示该主机允许承接其他主机的算力任务。即,当主机A算力空余,即对两侧交接算力,算力卡设备被两侧的主机接管,实现算力池高效利用。
下面解决具体实施方式对硬件集群装置进行说明:
图4是根据本实用新型具体实施例的硬件集群装置示意图,如图4所示,主机架构为传统的主板+背板,算力卡坐在硬盘盒里放置在背板中,平时工作时由主控通过处理器去调用算力卡的算力,当主机A算力空余,即对两侧交接算力,算力卡设备被两侧的主机接管,实现算力池高效利用,并且由于路径减少,降低了故障出现,而且,当主机A的主控挂死时,算力被接管且不会浪费。环形连接的算力池化,通过硬件接口,降低了通过网络接口连接导致的稳定性问题,减少了主板失控时的算力浪费问题,同样实现了硬件集群不能做到的算力集群。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
显然,本领域的技术人员应该明白,上述的本实用新型的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本实用新型不限制于任何特定的硬件和软件结合。
以上所述仅为本实用新型的优选实施例而已,并不用于限制本实用新型,对于本领域的技术人员来说,本实用新型可以有各种更改和变化。凡在本实用新型的原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。

Claims (10)

1.一种硬件集群装置,其特征在于,包括至少两个主机,其中,所述主机中包括算力卡,相邻两个所述主机中的所述算力卡之间通过线缆连接,至少两个所述主机的所述算力卡通过线缆按照预定连接方式连接。
2.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡环形连接。
3.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡中包括任意两个算力卡均通过所述线缆两两连接。
4.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机的所述算力卡依次连接。
5.根据权利要求1所述的硬件集群装置,其特征在于,所述主机包括背板,所述算力卡位于在所述背板中。
6.根据权利要求5所述的硬件集群装置,其特征在于,所述主机还包括处理器,所述处理器位于所述背板中,所述处理器用于接收主控模块发送的控制指令,并基于所述控制指令调用所述主机中的算力卡。
7.根据权利要求1所述的硬件集群装置,其特征在于,至少两个所述主机中的任意两个主机之间通过网络连接。
8.根据权利要求7所述的硬件集群装置,其特征在于,所述主机还包括主控模块,至少两个所述主机中所分别包括的所述主控模块之间通过网络连接。
9.根据权利要求8所述的硬件集群装置,其特征在于,所述主机还包括主板,所述主控模块位于所述主板中。
10.根据权利要求1所述的硬件集群装置,其特征在于,所述线缆包括以下至少之一:光缆、电缆。
CN202220093004.9U 2022-01-13 2022-01-13 硬件集群装置 Active CN217606351U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202220093004.9U CN217606351U (zh) 2022-01-13 2022-01-13 硬件集群装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202220093004.9U CN217606351U (zh) 2022-01-13 2022-01-13 硬件集群装置

Publications (1)

Publication Number Publication Date
CN217606351U true CN217606351U (zh) 2022-10-18

Family

ID=83561230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202220093004.9U Active CN217606351U (zh) 2022-01-13 2022-01-13 硬件集群装置

Country Status (1)

Country Link
CN (1) CN217606351U (zh)

Similar Documents

Publication Publication Date Title
EP2590068A2 (en) Server direct attached storage shared through virtual SAS expanders
GB2468137A (en) Blade server with on board battery power
CN103076869A (zh) 一种rack机柜系统带电维护的设计方法
CN102724093A (zh) 一种atca机框及其ipmb连接方法
CN1322422C (zh) 在可修复的故障后使群集器系统自动投入运行的方法和设备
CN214851260U (zh) 智能网卡带外连接系统
CN217606351U (zh) 硬件集群装置
CN112702350B (zh) 带外管理方法及装置、电子设备、可读介质
US10539992B2 (en) Redundant power extender
US7881064B2 (en) Flexible paddle card for installation on a motherboard of a computing system
CN109684136A (zh) 一种灵活配置主控的通信架构系统
CN109491867A (zh) 一种通讯自动恢复方法和装置
CN107359938B (zh) 数据中心传输系统、系统中控制的实现方法和装置
CN104503871A (zh) 一种基于小型机系统全冗余模型的实现方法
US11366696B2 (en) System, board card and electronic device for data accelerated processing
CN113190184B (zh) 一种硬件集群装置及一种存储设备管理方法
CN113051209A (zh) 一种电子设备、电子设备的通信方法
CN113535471A (zh) 集群服务器
CN106294062A (zh) 一种将服务器中计算功能和管理功能分离设计的方法
CN107659413B (zh) 小型通信设备
CN113190183B (zh) 一种存储集群装置及设备挂载方法
CN110391929A (zh) 一种容错控制方法、装置及容错构件
CN107122268A (zh) 一种基于numa多物理层分区处理系统
CN111083003A (zh) 监控系统及方法、存储介质、处理器
CN215987302U (zh) 国产高性能的水声信息处理设备

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant