CN107729151A - 一种集群管理fpga资源的方法 - Google Patents

一种集群管理fpga资源的方法 Download PDF

Info

Publication number
CN107729151A
CN107729151A CN201710977589.4A CN201710977589A CN107729151A CN 107729151 A CN107729151 A CN 107729151A CN 201710977589 A CN201710977589 A CN 201710977589A CN 107729151 A CN107729151 A CN 107729151A
Authority
CN
China
Prior art keywords
fpga
resource
cpu
cluster
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710977589.4A
Other languages
English (en)
Inventor
姜凯
于治楼
王子彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Hi Tech Investment and Development Co Ltd
Original Assignee
Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Hi Tech Investment and Development Co Ltd filed Critical Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority to CN201710977589.4A priority Critical patent/CN107729151A/zh
Publication of CN107729151A publication Critical patent/CN107729151A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

本发明公开一种集群管理FPGA资源的方法,涉及FPGA设计领域,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,利用CGroup技术将FPGA虚拟为字符类型设备,并将FPGA的虚拟字符类型设备与CPU的核心进行绑定运行,从而达到在基于FPGA的异构计算集群环境中,通过管理固定CPU核心来管理FPGA资源,并可调度FPGA Kernel进行高性能计算,实现了大规模集群环境中集群软件对FPGA的资源管理。

Description

一种集群管理FPGA资源的方法
技术领域
本发明涉及FPGA设计领域,具体的说是一种集群管理FPGA资源的方法。
背景技术
FPGA(Field Programmable Gate Array),即现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。
采用CPU+FPGA的可重构架构的异构计算具有很多优势,例如:较高的性能、较大的灵活性、较低的功耗特性、天生的容错特性,以及能够大大缩减产品开发周期等优点。采用FPGA来替代GPU作为未来高性能计算的加速器,是现阶段的FPGA异构计算发展的主旋律。但是针对FPGA的异构计算集群中多个服务器节点,集群软件对FPGA资源管理缺乏高效管理机制。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种集群管理FPGA资源的方法。
本发明所述一种集群管理FPGA资源的方法,解决上述技术问题采用的技术方案如下:所述集群管理FPGA资源的方法,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,具体流程包括:
步骤一,将每块FPGA硬件独立虚拟为一个字符类型设备;
步骤二,将FPGA的虚拟字符类型设备与CPU的核心进行绑定运行。
进一步,所述步骤一:
利用CGroup技术中的devices子系统,将FPGA虚拟为字符类型设备,允许或拒绝CGroup中的进程访问设备。
进一步,步骤二:
在CPU端通过CGroup技术进行物理隔离CPU核心,使FPGA的虚拟字符类型设备与固定CPU核心进行绑定运行。
本发明所述一种集群管理FPGA资源的方法,与现有技术相比具有的有益效果是:本发明利用CGroup技术将FPGA虚拟为字符类型设备,并将设备与CPU的核心进行绑定运行,从而达到在基于FPGA的异构计算集群环境中,通过管理固定CPU核心来管理FPGA资源,并可调度FPGA Kernel进行高性能计算;实现了大规模集群环境中集群软件对FPGA的资源管理。
附图说明
为了更清楚的说明本发明实施例或现有技术中的技术内容,下面对本发明实施例或现有技术中所需要的附图做简单介绍。显而易见的,下面所描述附图仅仅是本发明的一部分实施例,对于本领域技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,但均在本发明的保护范围之内。
附图1为实施例1集群管理FPGA资源的方法的示意图。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清查、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下获得的所有实施例,都在本发明的保护范围之内。
实施例1:
本实施例提出一种集群管理FPGA资源的方法,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,具体流程包括:
步骤一,将每块FPGA硬件独立虚拟为一个字符类型设备;
步骤二,将FPGA的虚拟字符类型设备与CPU的核心进行绑定运行。
本实施例集群管理FPGA资源的方法,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,每块FPGA硬件将独立虚拟为一个字符类型设备,并将FPGA的虚拟字符类型设备与CPU核心进行绑定运行;从而达到在集群环境中,通过管理固定CPU核心来管理FPGA资源的目的。
实施例2:
本实施例提出的一种集群管理FPGA资源的方法,在实施例1的基础上,详细给出步骤一、步骤二的一种技术方案,更加详尽的介绍本发明的技术内容和技术有点,增加了本发明技术方案的可行性和实用性。
实施例2所述集群管理FPGA资源的方法,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,利用CGroup技术将FPGA虚拟为一个字符类型设备,并将GPGA的虚拟字符类型设备与CPU的核心进行绑定运行;实现在大规模集群环境中集群软件对FPGA的资源管理;如附图1所示。
实施例2所述集群管理FPGA资源的方法,具体实现流程包括:
步骤一,利用CGroup技术中的devices子系统,将FPGA虚拟为字符类型设备,可以允许或拒绝CGroup中的进程访问设备;
步骤二,在Host端(CPU端)通过CGroup进行物理隔离CPU核心,使FPGA的虚拟字符类型设备与固定CPU核心进行绑定运行。
本实施例集群管理FPGA资源的方法,基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,每块FPGA硬件将独立虚拟为一个字符类型设备,并对应为1个devices子系统;并将FPGA的虚拟字符类型设备与CPU的核心进行绑定运行,从而达到在集群环境中,通过管理固定CPU核心来管理FPGA资源,并可调度FPGA Kernel进行高性能计算。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容,并不用于限制本发明的保护范围,本发明的技术方案不限制于上述具体实施方式内。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (3)

1.一种集群管理FPGA资源的方法,其特征在于, 基于FPGA的异构计算集群中,集群系统中单节点存在多块FPGA硬件,具体流程包括:
步骤一,将每块FPGA硬件独立虚拟为一个字符类型设备;
步骤二,将FPGA的虚拟字符类型设备与CPU的核心进行绑定运行。
2.根据权利要求1所述一种集群管理FPGA资源的方法,其特征在于,所述步骤一:
利用CGroup技术中的devices子系统,将FPGA虚拟为字符类型设备,允许或拒绝CGroup中的进程访问设备。
3.根据权利要求2所述一种集群管理FPGA资源的方法,其特征在于,所述步骤二:
在CPU端通过CGroup技术进行物理隔离CPU核心,使FPGA的虚拟字符类型设备与固定CPU核心进行绑定运行。
CN201710977589.4A 2017-10-19 2017-10-19 一种集群管理fpga资源的方法 Pending CN107729151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710977589.4A CN107729151A (zh) 2017-10-19 2017-10-19 一种集群管理fpga资源的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710977589.4A CN107729151A (zh) 2017-10-19 2017-10-19 一种集群管理fpga资源的方法

Publications (1)

Publication Number Publication Date
CN107729151A true CN107729151A (zh) 2018-02-23

Family

ID=61211988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710977589.4A Pending CN107729151A (zh) 2017-10-19 2017-10-19 一种集群管理fpga资源的方法

Country Status (1)

Country Link
CN (1) CN107729151A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144722A (zh) * 2018-07-20 2019-01-04 上海研鸥信息科技有限公司 一种多应用高效共用fpga资源的管理系统及方法
CN110781129A (zh) * 2019-09-12 2020-02-11 苏州浪潮智能科技有限公司 一种fpga异构加速卡集群中的资源调度方法、设备及介质
CN111431749A (zh) * 2020-03-27 2020-07-17 重庆海云捷迅科技有限公司 一种fpga云服务器管理平台及其使用方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484540A (zh) * 2016-10-20 2017-03-08 腾讯科技(深圳)有限公司 一种资源配置方法及装置
CN106598724A (zh) * 2015-10-14 2017-04-26 三星电子株式会社 用于在计算系统中管理内存的方法
CN106603592A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 一种用于基于服务模型的应用集群迁移的方法和迁移装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106598724A (zh) * 2015-10-14 2017-04-26 三星电子株式会社 用于在计算系统中管理内存的方法
CN106603592A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 一种用于基于服务模型的应用集群迁移的方法和迁移装置
CN106484540A (zh) * 2016-10-20 2017-03-08 腾讯科技(深圳)有限公司 一种资源配置方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴文哲: "基于YARN的FPGA异构集群系统研究", 《万方数据库:D.WANFANGDATA.COM.CN/THESIS/D01075845》 *
赵琳: "基于Storm的物联网数据处理框架的研究与实现", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144722A (zh) * 2018-07-20 2019-01-04 上海研鸥信息科技有限公司 一种多应用高效共用fpga资源的管理系统及方法
CN109144722B (zh) * 2018-07-20 2020-11-24 上海研鸥信息科技有限公司 一种多应用高效共用fpga资源的管理系统及方法
CN110781129A (zh) * 2019-09-12 2020-02-11 苏州浪潮智能科技有限公司 一种fpga异构加速卡集群中的资源调度方法、设备及介质
CN110781129B (zh) * 2019-09-12 2022-02-22 苏州浪潮智能科技有限公司 一种fpga异构加速卡集群中的资源调度方法、设备及介质
CN111431749A (zh) * 2020-03-27 2020-07-17 重庆海云捷迅科技有限公司 一种fpga云服务器管理平台及其使用方法
CN111431749B (zh) * 2020-03-27 2022-10-14 重庆海云捷迅科技有限公司 一种fpga云服务器管理平台及其使用方法

Similar Documents

Publication Publication Date Title
CN104536937B (zh) 基于cpu‑gpu异构集群的大数据一体机实现方法
DE102018006546A1 (de) Plattformschnittstellenschicht und protokoll für beschleuniger
CN103797462B (zh) 一种创建虚拟机的方法和装置
CN107729151A (zh) 一种集群管理fpga资源的方法
US9367359B2 (en) Optimized resource management for map/reduce computing
US20210044503A1 (en) Oversubscribable resource allocation
CN106033476A (zh) 一种云计算环境中分布式计算模式下的增量式图计算方法
CN105262680A (zh) 一种应用于云存储系统的多线程nas网关
CN106775993A (zh) 一种物理机迁移至云计算平台的方法及系统
CN103336672A (zh) 数据读取方法、装置及计算设备
CN104767741A (zh) 一种基于轻型虚拟机的计算服务分离与安全保护系统
CN102625144A (zh) 基于局域网云网络的并行视频处理方法
DE102021131090A1 (de) Intelligenter und redundanter luftgekühlter kühlkreislauf für rechenzentrum-kühlsysteme
DE102022101525A1 (de) Intelligenter kühlmittelunterstützter flüssigkeit-zu-luftwärmetauscher für kühlsysteme in einem rechenzentrum
CN110505655A (zh) 数据指令处理方法、存储介质及蓝牙盾
Barlas et al. An analytical approach to the design of parallel block cipher encryption/decryption: A CPU/GPU case study
CN106897118A (zh) 一种虚拟机内存快照创建方法及系统
Willcock et al. Active pebbles: a programming model for highly parallel fine-grained data-driven computations
CN105653347A (zh) 一种服务器、资源管理方法及虚拟机管理器
CN103312808B (zh) 一种云操作系统总线及通信方法
CN103067450B (zh) 用于云环境的应用程序控制方法和系统
CN105183692A (zh) 一种集群系统设备间数据通信方法与系统
CN103763399A (zh) 基于xen虚拟化架构的云服务器运营支撑系统
CN104657797A (zh) 移动互联网电子政务平台系统
Milutinović et al. Accelerating program execution using hybrid control flow and dataflow architectures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180223

RJ01 Rejection of invention patent application after publication