CN113064722A - 一种显卡资源分配切换方法及系统 - Google Patents

一种显卡资源分配切换方法及系统 Download PDF

Info

Publication number
CN113064722A
CN113064722A CN202110273741.7A CN202110273741A CN113064722A CN 113064722 A CN113064722 A CN 113064722A CN 202110273741 A CN202110273741 A CN 202110273741A CN 113064722 A CN113064722 A CN 113064722A
Authority
CN
China
Prior art keywords
firmware version
resource allocation
chip
switching
firmware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110273741.7A
Other languages
English (en)
Inventor
刘永敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110273741.7A priority Critical patent/CN113064722A/zh
Publication of CN113064722A publication Critical patent/CN113064722A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种显卡资源分配切换方法及系统,所述方法包括:基板管理控制器接收资源分配模式信息,获取待应用的交换芯片固件版本信息;基板管理控制器从扩展芯片中读取当前交换芯片的固件版本;判断待应用的固件版本与当前的固件版本是否相同;若固件版本不同,通知交换芯片切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。所述系统包括基板管理控制器、扩展芯片和交换芯片。本发明能够使系统资源在不同模式下切换,实现资源的合理分配,充分发挥系统性能。

Description

一种显卡资源分配切换方法及系统
技术领域
本发明涉及服务器管理领域,具体涉及一种显卡资源分配切换方法及系统。
背景技术
近年来随着人工智能(Artificial Intelligence,AI)技术的发展,图形和图形相关的运算处理日益增多,使得服务器支持多显卡的的需求也日益迫切。
由于中央处理器(Central Processing Unit,CPU)的任务繁多,不仅要支持显卡的运算处理工作,还要做内存管理、输入响应等非3D图形处理工作,因此在实际进行图形运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况。
另一方面,图形处理器(Graphics Processing Unit,GPU)是显卡的“大脑”,进行了一部分原本由CPU完成的工作,使显卡减少了对CPU的依赖,在3D图形处理时的作用尤其明显。因此,对于多显卡的服务器中如何分配多个显卡的资源,使显卡与CPU之间在处理任务时达到最大程度的快读与使用显得尤为重要。
发明内容
为了解决上述技术问题,本发明提出了一种显卡资源分配切换方法及系统,能够将系统硬件资源利用率最大化。
为实现上述目的,本发明采用以下技术方案:
一种显卡资源分配切换方法,包括:
基板管理控制器接收资源分配模式信息,获取待应用的交换芯片固件版本信息;
基板管理控制器从扩展芯片中读取当前交换芯片的固件版本;
判断待应用的固件版本与当前的固件版本是否相同;
若固件版本不同,通知交换芯片切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。
进一步地,所述资源分配模式为多个显卡从属于一个中央处理器。
进一步地,所述资源分配模式为将多个显卡平均分配至每个中央处理器下。
进一步地,所述扩展芯片带有带电可擦可编程只读存储器。
进一步地,所述方法还包括:当系统在固件版本切换过程中断电时,扩展芯片记录断电前的设置值;当系统再次上电时,读取记录的设置值,继续完成切换。
进一步地,所述资源分配模式根据硬件驱动初始化后的资源分配情况确定。
本发明还提出了一种显卡资源分配切换系统,包括:
基板管理控制器,用于接收资源分配模式信息,获取待应用的交换芯片固件版本信息;从扩展芯片中读取当前交换芯片的固件版本;判断待应用的固件版本与当前的固件版本是否相同,若固件版本不同,向交换芯片发出通知;
扩展芯片,用于记录当前交换芯片的固件版本;
交换芯片,用于根据通知将固件版本切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。
进一步地,所述扩展芯片带有带电可擦可编程只读存储器。
本发明的有益效果是:
本发明通过提出一种显卡资源分配切换方法及系统,使系统资源可以在不同模式下切换,实现资源的合理分配,充分发挥系统性能。而且,扩展芯片具有记忆功能,当系统异常掉电后,信息不会丢失,再次上电后仍然可以继续完成切换动作。
附图说明
图1是本发明实施例显卡资源分配切换方法流程示意图。
图2是本发明实施例显卡资源分配切换系统结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明实施例公开了一种显卡资源分配切换方法,包括:
基板管理控制器(Baseboard Management Controller,BMC)接收资源分配模式信息,获取待应用的交换芯片固件版本信息;
基板管理控制器从扩展芯片(Expander芯片)中读取当前交换芯片(Switch芯片)的固件版本(Firmware,FW);
判断待应用的固件版本与当前的固件版本是否相同;
若固件版本不同,通知交换芯片切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器(Central Processing Unit,CPU)之间PCIE端口的上下行设置。
本发明实施例所述显卡资源分配切换方法的一种具体的实现方式如下:
S1)系统上电后,在启动过程中,BIOS进行硬件驱动的初始化,根据目前资源的分配情况,确定最优的工作模式,将此信息传递给BMC;
S2)BMC接到指令后,首先从具有记忆功能的Expander芯片中读取当前的SwitchFW,如果与最优工作模式设置的FW相同,则直接返回,否则进行步骤3);
S3)BMC通过控制具有记忆功能的Expander的I/O Port,通知给Switch FW,使其实现对PCIE不同端口的上下行设置,从而实现显卡资源的不同分配。
所述扩展芯片优选带有带电可擦可编程只读存储器(Electrically ErasableProgrammable Read Only Memory,EEPROM),当系统在固件版本切换过程中断电时,可以记录上次设置的值,即使在切换过程中出现故障,再次上电后仍然可以继续实现切换。
所述资源分配模式包括平衡模式和级联模式。平衡模式是指将多个显卡平均分配至每个中央处理器下;级联模式是指多个显卡从属于一个中央处理器。级联模式用于执行某些特殊任务。实践证明对于深度学习中不同算法模型在不同的资源分配模式下,表现出不同的性能。
如图2所示,本发明实施例还公开了一种显卡资源分配切换系统,包括:
基板管理控制器,用于接收资源分配模式信息,获取待应用的交换芯片固件版本信息;从扩展芯片中读取当前交换芯片的固件版本;判断待应用的固件版本与当前的固件版本是否相同,若固件版本不同,向交换芯片发出通知;
扩展芯片,用于记录当前交换芯片的固件版本;
交换芯片,用于根据通知将固件版本切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。
所述扩展芯片带有带电可擦可编程只读存储器。
本发明实施例所述显卡资源分配切换系统既可以在启动过程中自动实现切换步骤,无需用户干预,也可以在服务器正常运行时,由用户通过向BMC发送指令实现资源分配模式的切换。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种显卡资源分配切换方法,其特征在于,包括:
基板管理控制器接收资源分配模式信息,获取待应用的交换芯片固件版本信息;
基板管理控制器从扩展芯片中读取当前交换芯片的固件版本;
判断待应用的固件版本与当前的固件版本是否相同;
若固件版本不同,通知交换芯片切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。
2.根据权利要求1所述的显卡资源分配切换方法,其特征在于,所述资源分配模式为多个显卡从属于一个中央处理器。
3.根据权利要求1所述的显卡资源分配切换方法,其特征在于,所述资源分配模式为将多个显卡平均分配至每个中央处理器下。
4.根据权利要求1所述的显卡资源分配切换方法,其特征在于,所述扩展芯片带有带电可擦可编程只读存储器。
5.根据权利要求4所述的显卡资源分配切换方法,其特征在于,所述方法还包括:当系统在固件版本切换过程中断电时,扩展芯片记录断电前的设置值;当系统再次上电时,读取记录的设置值,继续完成切换。
6.根据权利要求1所述的显卡资源分配切换方法,其特征在于,所述资源分配模式根据硬件驱动初始化后的资源分配情况确定。
7.一种显卡资源分配切换系统,其特征在于,包括:
基板管理控制器,用于接收资源分配模式信息,获取待应用的交换芯片固件版本信息;从扩展芯片中读取当前交换芯片的固件版本;判断待应用的固件版本与当前的固件版本是否相同,若固件版本不同,向交换芯片发出通知;
扩展芯片,用于记录当前交换芯片的固件版本;
交换芯片,用于根据通知将固件版本切换为待应用的固件版本,根据该固件版本的设置,修改显卡和中央处理器之间PCIE端口的上下行设置。
8.根据权利要求7所述的显卡资源分配切换系统,其特征在于,所述扩展芯片带有带电可擦可编程只读存储器。
CN202110273741.7A 2021-03-12 2021-03-12 一种显卡资源分配切换方法及系统 Pending CN113064722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110273741.7A CN113064722A (zh) 2021-03-12 2021-03-12 一种显卡资源分配切换方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110273741.7A CN113064722A (zh) 2021-03-12 2021-03-12 一种显卡资源分配切换方法及系统

Publications (1)

Publication Number Publication Date
CN113064722A true CN113064722A (zh) 2021-07-02

Family

ID=76560622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110273741.7A Pending CN113064722A (zh) 2021-03-12 2021-03-12 一种显卡资源分配切换方法及系统

Country Status (1)

Country Link
CN (1) CN113064722A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10419641B1 (en) * 2018-04-13 2019-09-17 Lexmark International, Inc. Chip and supply item for imaging device, including communication
CN110515638A (zh) * 2019-07-19 2019-11-29 苏州浪潮智能科技有限公司 一种用于更新交换机的固件的方法和装置
CN110780932A (zh) * 2019-09-26 2020-02-11 苏州浪潮智能科技有限公司 一种pcie切换芯片的工作模式切换方法与装置
CN112073263A (zh) * 2020-08-28 2020-12-11 苏州浪潮智能科技有限公司 白盒交换机可靠性测试监测方法、系统、设备及介质
CN112118132A (zh) * 2020-09-11 2020-12-22 苏州浪潮智能科技有限公司 一种交换机固件的升级方法、装置、设备及可读介质
CN112269584A (zh) * 2020-10-19 2021-01-26 苏州浪潮智能科技有限公司 一种PCIe Switch固件更新方法、装置、电子设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10419641B1 (en) * 2018-04-13 2019-09-17 Lexmark International, Inc. Chip and supply item for imaging device, including communication
CN110515638A (zh) * 2019-07-19 2019-11-29 苏州浪潮智能科技有限公司 一种用于更新交换机的固件的方法和装置
CN110780932A (zh) * 2019-09-26 2020-02-11 苏州浪潮智能科技有限公司 一种pcie切换芯片的工作模式切换方法与装置
CN112073263A (zh) * 2020-08-28 2020-12-11 苏州浪潮智能科技有限公司 白盒交换机可靠性测试监测方法、系统、设备及介质
CN112118132A (zh) * 2020-09-11 2020-12-22 苏州浪潮智能科技有限公司 一种交换机固件的升级方法、装置、设备及可读介质
CN112269584A (zh) * 2020-10-19 2021-01-26 苏州浪潮智能科技有限公司 一种PCIe Switch固件更新方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
US9413683B2 (en) Managing resources in a distributed system using dynamic clusters
AU2011323985B2 (en) Application lifetime management
JP5532271B2 (ja) 低減された電力消費状態においてコンピュータタスクを行う方法およびシステム
US10089266B2 (en) Power saving feature for storage subsystems
WO2016165597A1 (zh) 数据存储的处理方法及装置
KR20210095690A (ko) 리소스 관리 방법과 장치, 전자 디바이스 및 기록 매체
US20120239952A1 (en) Information processing apparatus, power control method, and recording medium
US20210042045A1 (en) Storage system and resource allocation control method
CN106572137B (zh) 一种分布式服务资源管理方法和装置
WO2022041507A1 (zh) 3d渲染方法及系统
TWI705324B (zh) 動態地分配和優化電力資源的方法及系統、以及非暫態性機器可讀媒體
US10846138B2 (en) Allocating resources of a memory fabric
CN112912743B (zh) 算力的控制方法、装置、设备及存储介质
CN113064722A (zh) 一种显卡资源分配切换方法及系统
CN110221902B (zh) 一种基于虚拟机的数据传输方法及相关装置
CN109558210B (zh) 一种虚拟机应用主机gpu设备的方法及系统
CN114265742A (zh) 虚拟终端的管控方法及装置、系统、电子设备、存储介质
WO2023287407A1 (en) Hardware component initialization
CN110968258B (zh) 存储盘的控制方法及设备
CN113253938A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN108304200B (zh) 一种驱动程序升级的方法、装置以及电子设备
US20230259186A1 (en) Power consumption management method and apparatus
CN112269542B (zh) 一种nvme硬盘存储空间分配方法、装置及存储介质
CN116112299B (zh) 一种poe系统热重启场景的配置方法、设备及介质
CN103562869B (zh) 虚拟化环境下的音频处理方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210702