CN112558507A - 频率自适应方法和装置、数据处理设备、介质和产品 - Google Patents

频率自适应方法和装置、数据处理设备、介质和产品 Download PDF

Info

Publication number
CN112558507A
CN112558507A CN201910912685.XA CN201910912685A CN112558507A CN 112558507 A CN112558507 A CN 112558507A CN 201910912685 A CN201910912685 A CN 201910912685A CN 112558507 A CN112558507 A CN 112558507A
Authority
CN
China
Prior art keywords
value
preset
frequency
force
computing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910912685.XA
Other languages
English (en)
Other versions
CN112558507B (zh
Inventor
郑勇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bitmain Technologies Inc
Original Assignee
Bitmain Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bitmain Technologies Inc filed Critical Bitmain Technologies Inc
Priority to CN201910912685.XA priority Critical patent/CN112558507B/zh
Publication of CN112558507A publication Critical patent/CN112558507A/zh
Application granted granted Critical
Publication of CN112558507B publication Critical patent/CN112558507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0423Input/output
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/25Pc structure of the system
    • G05B2219/25257Microcontroller

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Power Sources (AREA)
  • Supply And Installment Of Electrical Components (AREA)

Abstract

本公开提供了一种频率自适应方法和装置、数据处理设备、介质和产品,其中,频率自适应方法包括:检测到数据处理设备进入用户模式;每隔预设时间采集数据处理设备的每个算力板的失效芯片;统计在预设时间内每个算力板的失效芯片的数量;根据失效芯片的数量调整每个算力板的运行频率值。本公开的频率自适应方法、装置和数据处理设备,可以提高设备生产效率,更加适应实际运行环境。

Description

频率自适应方法和装置、数据处理设备、介质和产品
技术领域
本公开涉及数字凭证处理设备制造技术领域,尤其是涉及一种频率自适应方法,以及频率自适应装置和数据处理设备,及计算机可读存储介质和计算机程序产品。
背景技术
为了发挥数据处理设备的最优性能,扫频是不可获缺的一环,目前主要的扫频方案有单板扫频、单芯片扫频,单板扫频可以找到单个算力板的最佳工作频率,单芯片扫频可以找到单个芯片的最佳工作频率。扫频过程可以在算力板测试阶段完成,也可以在整机测试阶段完成,在两个测试阶段的扫频过程都以模式为发起点,先从工作正常的数据处理设备上抓取正确的检测输入信号-检测输出信号对,处理后制作成模式文件,在不同的频率下发送给每个芯片,以此来验证每颗芯片可以工作的最佳频率,记录下每颗芯片的最佳频率后,存储到算力板的PIC(Programmable Interrupt Controller,可编程中断控制器)中,程序重启进入用户模式,读取存储的最佳频率初始化芯片,使得数字凭证处理设备工作在该最佳频率。
但是,采用上面的方案,设备生产效率低、不能适用数据处理设备的实际工作环境。
发明内容
本公开旨在至少解决现有技术中存在的技术问题之一。为此,本公开的一个目的在于提出一种频率自适应方法,该频率自适应方法,可以提高设备生产效率,适应设备的实际工作环境。
本公开的第二个目的在于提出一种频率自适应装置。
本公开的第三个目的在于提出一种数据处理设备。
本公开的第四个目的在于提出一种计算机可读存储介质。
本公开的第五个目的在于提出一种计算机程序产品。
为了达到上述目的,本公开第一方面实施例提出一种频率自适应方法,包括:
检测到数据处理设备进入用户模式;
每隔预设时间采集所述数据处理设备的每个算力板的失效芯片;
统计在所述预设时间内每个所述算力板的所述失效芯片的数量;
根据所述失效芯片的数量调整每个所述算力板的运行频率值。
本公开实施例的频率自适应方法,在用户模式下,根据预设时间内每个算力板的失效芯片的数量调整每个算力板的运行频率值,即在数据处理设备的数据处理过程中进行频率自适应,可以使数据处理设备工作在实际运行环境下的最佳运行频率值,获得理想的算力,相较于在数据处理设备的测试阶段进行扫频,可以减少占用PCBA时间以及无需设置单独的扫频程序,提高设备生产效率;以及在数据处理设备进行数据处理过程中进行扫频,相较于调取预存的最佳运行频率值,更加适用于实际运行环境。
在一些实施例中,所述根据所述失效芯片的数量调整每个所述算力板的运行频率值,包括:确定所述失效芯片的数量大于单板失效芯片数量阈值,则标记对应的所述算力板为重启算力板;根据所述重启算力板的数量调整每个所述算力板的运行频率值。
在一些实施例中,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值包括:判断所述重启算力板的数量是否大于预设重启算力板阈值;如果是,降低每个所述算力板在所述预设时间内的最大运行频率值,且降低幅度为第一预设频率值;如果否,降低所述重启算力板在所述预设时间内的最大运行频率值,且降低幅度为第二预设频率值。
在一些实施例中,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值,还包括:采集所述数据处理设备的环境温度,获取所述算力板的类型;根据所述环境温度和所述算力板的类型确定所述第一预设频率值或所述第二预设频率值。
在一些实施例中,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值,还包括:
采集所述数据处理设备的工作电压和环境温度;
计算在所述预设时间内所述工作电压的变化值,以及,计算在所述预设时间内所述环境温度的变化值;
判断所述工作电压的变化值是否大于预设电压值,以及,判断所述环境温度的变化值是否大于预设温度值;
如果所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值小于所述预设温度值是,根据所述工作电压确定所述第一预设频率值或所述第二预设频率值;
如果否所述工作电压的变化值小于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述环境温度确定所述第一预设频率值或所述第二预设频率值;
如果所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述工作电压获得第一参考频率值,并根据所述环境温度获得第二参考频率值,计算所述第一参考频率值与所述第二参考频率值的平均值,以作为所述第一预设频率值或所述第二预设频率值。
在一些实施例中,所述根据所述失效芯片的数量调整每个所述算力板的运行频率值,还包括:确定所述失效芯片的数量小于或等于所述单板失效芯片数量阈值;记录所述失效芯片的数量小于或等于所述单板失效芯片阈值的持续时间;判断所述持续时间是否达到设定时间阈值;如果是,获取所述数据处理设备在所述设定时间阈值内的平均算力、每个所述算力板在所述设定时间阈值内的最小运行频率;判断所述平均算力是否小于预设算力阈值,且所述最小运行频率是否小于预设频率阈值;如果是,提高所述最小运行频率小于所述预设频率阈值的所述算力板的运行频率值,且提高幅度为第三预设频率值。
在一些实施例中,所述频率自适应方法还包括:响应于初始化指令,检测上一次下电前每个所述算力板的历史运行频率值;判断是否检测到所述历史运行频率值;如果是,控制每个所述算力板分别以对应的所述历史运行频率值进行初始化运行;如果否,控制每个所述算力板分别以预设频率值进行初始化运行。
为了达到上述目的,本公开第二方面实施例提出一种频率自适应装置,所述频率自适应装置包括:第一检测模块,配置为检测到数据处理设备进入用户模式;采集模块,配置为每隔预设时间检测数据处理设备的每个算力板的失效芯片;统计模块,配置为统计在所述预设时间内每个所述算力板的所述失效芯片的数量;调整模块,配置为根据所述失效芯片的数量调整每个所述算力板的运行频率值。
本公开实施例的频率自适应装置,在用户模式下,根据预设时间内每个算力板的失效芯片的数量调整每个算力板的运行频率值,即在数据处理设备的数据处理过程中进行频率自适应,可以使数据处理设备工作在实际运行环境下的最佳运行频率值,获得理想的算力,相较于在数据处理设备的测试阶段进行扫频,可以减少占用PCBA时间以及无需设置单独的扫频程序,提高设备生产效率;以及在数据处理设备进行数据处理过程中进行扫频,相较于调取预存的最佳运行频率值,更加适用于实际运行环境。
在一些实施例中,所述调整模块包括:第一确定单元,配置为确定所述失效芯片的数量大于单板失效芯片数量阈值;标记单元,配置为标记重启算力板,所述重启算力板的所述失效芯片的数量大于所述单板失效芯片数量阈值;调整单元,配置为根据所述重启算力板的数量调整每个所述算力板的运行频率值。
在一些实施例中,所述调整单元进一步包括:
第一判断子单元,配置为判断所述重启算力板的数量是否大于预设重启算力板阈值,如果是,输出第一降低信号,如果否,输出第二降低信号;
第一降低子单元,配置为响应于所述第一降低信号,降低每个所述算力板在所述预设时间内的最大运行频率值,且降低幅度为第一预设频率值;
第二降低子单元,配置为响应于所述第二降低信号,降低所述重启算力板在所述预设时间内的最大运行频率,且降低幅度为第二预设频率值。
在一些实施例中,所述调整单元还包括:
第一采集子单元,配置为采集所述数据处理设备的环境温度;
获取子单元,配置为获取所述算力板的类型;
第一确定子单元,配置为根据所述环境温度和所述算力板的类型确定所述第一预设频率值或所述第二预设频率值。
在一些实施例中,所述调整单元还包括:
第二采集子单元,配置为采集所述数据处理设备的工作电压和环境温度;
计算子单元,配置为计算在所述预设时间内所述工作电压的变化值,以及,计算在所述预设时间内所述环境温度的变化值;
判断子单元,配置为判断所述工作电压的变化值是否大于预设电压值,以及,判断所述环境温度的变化值是否大于预设温度值;
第二确定子单元,配置为在所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值小于所述预设温度值时,根据所述工作电压确定所述第一预设频率值或所述第二预设频率值,或者,在所述工作电压的变化值小于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述环境温度确定所述第一预设频率值或所述第二预设频率值,或者,在所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值大于所述预设温度值时,根据所述工作电压获得第一参考频率值,并根据所述环境温度获得第二参考频率值,计算所述第一参考频率值与所述第二参考频率值的平均值,以作为所述第一预设频率值或所述第二预设频率值。
在一些实施例中,所述调整模块还包括:
第二确定单元,配置为确定所述失效芯片的数量小于或等于单板失效芯片阈值;
记录单元,配置为记录所述失效芯片的数量小于或等于所述单板失效芯片阈值的持续时间;
第一判断单元,配置为判断所述持续时间是否达到设定时间阈值,如果是,输出获取信号;
获取单元,配置为响应于所述获取信号,获取所述数据处理设备在所述设定时间阈值内的平均算力、每个所述算力板在所述设定时间阈值内的最小运行频率;
第二判断单元,配置为判断所述平均算力是否小于预设算力阈值且所述最小运行频率是否小于预设频率阈值,如果是,输出提高信号;
提高单元,配置为响应于所述提高信号,提高所述最小运行频率小于所述预设频率阈值的所述算力板的运行频率值,且提高幅度为第三预设频率值。
在一些实施例中,所述频率自适应装置还包括:
第二检测模块,配置为响应于初始化指令检测上一次下电前每个所述算力板的历史运行频率值;
判断模块,配置为判断是否检测到所述历史运行频率值,如果是,输出第一初始化触发信号,如果否,输出第二初始化触发信号;
第一控制模块,配置为响应于所述第一初始化触发信号,控制每个所述算力板分别以对应的所述历史运行频率值进行初始化运行;
第二控制模块,配置为响应于所述第二初始化触发信号,控制每个所述算力板分别以预设频率值进行初始化运行。
为了达到上述目的,本公开第三方面实施例提出一种数据处理设备,包括:多个算力板,每个所述算力板包括多个芯片;所述的频率自适应装置。
本公开实施例的数据处理设备,通过采用上面实施例的频率自适应装置,可以减少占用PCBA时间以及无需设置单独的扫频程序,提高设备生产效率;以及在数据处理设备进行数据处理过程中进行扫频,相较于调取预存的最佳运行频率值,更加适用于实际运行环境。
本公开第四方面实施例的数据处理设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器执行所述的频率自适应方法。
本公开第五方面实施例的计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令设置为执行所述的频率自适应方法。
本公开第六方面实施例的计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行所述的频率自适应方法。
本公开的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本公开的一个实施例的数据处理设备的功能框图;
图2是根据本公开的一个实施例的频率自适应方法的流程图;
图3是根据本公开的一个实施例的根据失效芯片的数量调节运行频率的流程图;
图4是根据本公开的一个实施例的数据处理设备的框图;
图5是根据本公开的一个实施例的数据处理设备的框图;
图6是根据本公开的另一个实施例的数据处理设备的框图。
具体实施方式
下面详细描述本公开的实施例,参考附图描述的实施例是示例性的,下面详细描述本公开的实施例。
图1是根据本公开的一个实施例的数据处理设备的功能框图,如图1所示,本公开实施例的数据处理设备100包括电源板10、主控制板20、多个算力板30、至少一个处理器40例如MCU(Microcontroller Unit,微控制单元)、与至少一个处理器40通信连接的存储器50例如EEPROM(Electrically Erasable Programmable read only memory,带电可擦可编程只读存储器)。
其中,每个算力板30包括多个芯片,多个芯片进行数据处理。如图1所示,电源板10上可以设置输入、PFC(Power Factor Correction,功率因数校正)、驱动等回路、风扇(用于散热)、整流电路等,AC(Alternating Current,交流电)输入至电源板 10,通过PFC进行功率因数校正以提高电力效能,以及通过整流电路后输出直流例如12V,并通过DC-DC回路转换为算力板30所需的电压,以提供给算力板30。主控制板20发出主控指令给算力板30,以控制算力板30的运行状态。主控制板20上可以设置网口,通过网口可以与网络中节点上的其他数据处理设备进行通信,主控制板20上还可以设置状态指示灯例如LED、内存卡座例如TF卡座等,以提示运行状态。存储器50存储有可被至少一个处理器40执行的指令,指令被至少一个处理器40执行时,可以调整算力板 30的运行参数或者运行流程等。
应当理解的是,图1只是本公开的数据处理设备100的一个示例,本公开的数据处理设备100的组件可以比图示具有更多或更少的组件,或者具有不同的组件配置。
在本公开的实施例中,数据处理设备100可以进行数据处理,数据处理可以包括基于数据或对数据进行的设置、计算、判断、传输、存储、管理等至少之一,例如数据处理设备100可以是服务器、计算机设备,数据处理设备100设置在网络节点上,并可以与网络中其他节点的设备进行通信。作为一个实施例,数据处理装置100可以进行与数字凭证相关的数据处理,数字凭证可以通过数据处理得到,数据处理设备100可以是数字凭证处理设备。
数据处理设备100进行数据处理可以包括供电、数据处理过程和计算结果反馈过程。其中,在供电过程中,电源板10通过输入电路接收供电电源提供的AC信号,并通过对输入的AC信号处理以及PFC功率校正,以及通过整流电路将AC信号转换为算力板30 需要的DC信号,并将DC信号提供给算力板30,同时,电源板10为主控制板20供电,实现主控制板20和算力板30的供电。
在数据处理过程中,主控制板20可以通过网口与数据处理网络建立连接,并轮询数据处理节点上分配的数据处理任务,将数据处理任务存储在存储器50中,处理器40获取数据处理任务,并根据数据处理任务的难度以及各个算力板30的算力,将数据处理任务进行拆分,将拆分的数据处理任务分别下发给对应的算力板30,并控制算力板的运行频率,以使得算力板30可以提供最优算力,快速地获得对应于数据处理任务的计算结果。
在计算结果反馈过程中,算力板30将计算结果反馈给处理器40,处理器40根据计算结果生成反馈信息,并将反馈信息上传给主控制板20,进而主控制板20通过网口将反馈信息反馈给数据处理网络,数据处理网络会根据接收到的反馈信息进行收益奖励,并将收益奖励再通过网口下发给主控制器20,完成整个数据处理过程。
在实际应用中,数据处理设备算力板的芯片进行数据处理,工作频率对其数据处理的影响比较大,因此,通过扫频获得最佳工作频率,使得数据处理设备工作在最佳工作频率,可以提高算力。但是,在设备出厂前的测试阶段进行扫频以获得最佳工作频率,并将最佳工作频率保存在存储器中,在使用数据处理设备时调用该最佳工作频率,由于实际工况下,温度、湿度等环境因素的影响,采用在固定实验环境下存储的最佳工作频率,往往不能使得设备真正工作在当前环境下的最佳工作频率,即存储的实验环境下的最佳工作频率不能适用实际工作环境,进而还可能造成芯片故障。以及,在数据处理设备的测试阶段进行扫频,需要抓取正确的检测输入信号-检测输出信号对,并在处理后制作成模式文件,还需要开发单独的扫频程序,设备生产工作繁琐,再就是,在测试阶段扫频,需要占用更多的PCBA(Printed Circuit Board+Assembly)时间,造成设备生产效率低下。
为了解决上面的技术问题,本公开实施例提出了频率自适应方法,可以使数据处理设备在实际运行环境具有较优的算力,进行快速、准确的数据处理。以及,扫频过程无需占用出厂前的测试阶段,提高设备生产效率。
下面参照附图2和图3描述根据本公开实施例的频率自适应方法。
图2是根据本公开的一个实施例的频率自适应方法的流程图,如图2所示,本公开实施例的频率自适应方法至少包括步骤S1、步骤S2、步骤S3、步骤S4。
步骤S1,检测到数据处理设备进入用户模式。
具体地,在数据处理设备出厂之前,需要对设备进行各种测试,可以认为设备工作在测试模式。用户选购数据处理设备后,使用数据处理设备,数据处理设备进行数据处理,认为设备工作在用户模式。
其中,用户模式可以在设备出厂前由工程师设置,或者在完成测试程序后,设备自动跳转至用户模式,又或者,可以在设备上设置模式选择单元,通过模式选择单元选择用户模式。在用户模式下,数据处理设备可以接收用户的操作和设置等。
步骤S2,每隔预设时间采集数据处理设备的每个算力板的失效芯片。
具体地,数据处理设备包括多个算力板,每个算力板包括多个芯片,数据处理设备接收到数据处理任务后,将数据处理任务分发给每个算力板的芯片,芯片根据数据处理任务进行数据处理,并对每个芯片的运行状态进行监控,每隔预设时间例如1分钟或3 分钟或5分钟,判断每个算力板的是否有失效芯片。
例如,在正常情况下,频率自适应装置通过采集模块每隔预设时间检测数据处理设备的每隔算力板的失效芯片,每个算力板的芯片会反馈任务处理结果给数据处理设备的采集模块,如果采集模块不能够接收到芯片的任务处理结果,则认为该芯片为失效芯片。例如,根据数据处理任务给到芯片的运行频率值超过其最高允许频率时,该芯片会进入自保护模式,并停止工作,则采集模块也不会获得该芯片的任务反馈结果,认为该芯片为失效芯片。
步骤S3,统计在预设时间内每个算力板的失效芯片的数量。
以三个算力板board1、board2、board3、每个算力板包括10个芯片为例,分别统计5分钟内三个算力板的失效芯片,例如,算力板board1在该5分钟内有1个失效芯片,算力板board2在该5分钟内有3个失效芯片,算力板board3在该5分钟内有0个失效芯片。
步骤S4,根据失效芯片的数量调整每个算力板的运行频率值。
具体地,可以在频率自适应装置的频率自适应程序中,设置每个算力板的单板失效芯片数量阈值,单板失效芯片数量阈值可以是单个算力板的允许失效芯片数量的最大值,例如上面三个算力板施例示例,设置单板失效芯片数量阈值为2个,该允许失效芯片数量的最大值可以理解为,如果单个算力板的失效芯片的数量大于该值,例如board2,则算力板的算力大大降低,影响数据处理的速度,则认为给到该算力板的运行频率值偏离其在当前运行环境下的最佳运行频率值较大,可以通过降低算力板的运行频率值,使得失效芯片恢复算力;如果单个算力板的失效芯片的数量小于或等于该值,例如board1、 board3,则认为给到该算力板的运行频率值与其在当前运行环境下的最佳运行频率相当或比较接近,可以获得较理想的算力。由此,可以使得数据处理设备寻找到其在实际运行环境下的最佳运行频率,在算力板或芯片失效时可以自动恢复,获得当前运行工况下的理想算力。
本公开实施例的频率自适应方法,在用户模式下,根据预设时间内每个算力板的失效芯片的数量调整每个算力板的运行频率值,即在数据处理设备的数据处理过程中进行频率自适应,可以使数据处理设备工作在实际运行环境下的最佳运行频率值,获得理想的算力,相较于在数据处理设备的测试阶段进行扫频,可以减少占用PCBA时间以及无需设置单独的扫频程序,提高设备生产效率;以及在数据处理设备进行数据处理过程中进行扫频,相较于调取预存的最佳运行频率值,更加适用于实际运行环境。
进一步地,在实施例中,如图3所示是根据本公开的一个实施例的根据失效芯片的数量调整每个算力板的运行频率值的流程图。
步骤S41,判断每个算力板的失效芯片的数量是否大于单板失效芯片数量阈值。
具体地,如上面所说,可以设置每个算力板的单板失效芯片数量阈值,单板失效芯片数量阈值可以是单个算力板的允许失效芯片数量的最大值,每个算力板的单板失效芯片数量阈值可以相同或不同,并将每个算力板的失效芯片的数量与其对应的单板失效芯片数量阈值进行比较,执行步骤S42或者步骤S45。
步骤S42,确定失效芯片的数量大于单板失效芯片数量阈值。
步骤S43,标记重启算力板,重启算力板的失效芯片的数量大于单板失效芯片数量阈值。
具体地,算力板的失效芯片的数量大于其对应的单板失效芯片,则认为该算力板以其当前的运行频率值运行,使得较多的芯片失效例如运行频率值过高而进入自保护,进而降低了该算力板的算力,影响数据处理设备的数据处理,而将该算力板标记为重启算力板,重启算力板可以理解为,将会重新下发运行频率值给该算力板并控制该算力板重启程序。
步骤S44,根据重启算力板的数量调整每个算力板的运行频率值。
如果标记的重启算力板的数量较多,则认为提供给算力板的运行频率值不合适;如果标记的重启算力板的数量在数据处理设备的容忍范围内,认为当前的运行频率值适用于大部分的算力板。
具体地,可以预设重启算力板阈值,该预设重启算力板阈值可以是数据处理设备可容忍的重启算力板的数量的最大限值或者根据需要设定的阈值。
判断重启算力板的数量是否大于预设重启算力板阈值,如果是,降低每个算力板在预设时间内的最大运行频率值,且降低幅度为第一预设频率值;如果否,降低重启算力板在预设时间内的最大运行频率值,且降低幅度为第二预设频率值。其中,第一预设频率值、第二预设频率值可以相等或不相等。
举例说明,以三个算力板为例,每隔5分钟采集每个算力板的失效芯片,并统计在该5分钟内每个算力板的失效芯片的数量,如果算力板的失效芯片数量大于单板失效芯片数量阈值,则标记为重启算力板。如果重启算力板的数量大于1个例如标记了两个重启算力板,则认为给到算力板的运行频率值不合理,例如运行频率值偏高,导致算力板的芯片自保而停止工作,则将三个算力板在该5分钟内的最大运行频率值降低25Mhz,即所有算力板从当前运行频率值M下降到M-25Mhz,更新扫频数据并重启程序,以恢复算力板的算力。如果标记的重启算力板只有1个,则将该重启算力板在该5分钟内的最大运行频率值降低25Mhz,即在重启算力板的数量小于阈值时,仅将标记的重启算力板的运行频率值进行调整,并更新扫频数据以及重启程序、初始化该算力板,以恢复该算力板的算力。
步骤S45,确定失效芯片的数量小于或等于单板失效芯片数量阈值,则认为当前运行频率值适用于大部分的芯片,对数据处理影响不大,则执行步骤S46。
步骤S46,维持每个算力板当前的运行频率值。
也就是说,如果标记重启算力板的数量为0个,则不做操作,维持每个算力板的当前运行状态。
在实施例中,有些类型的算力板的芯片,对于环境因素的变化非常敏感,但是在某几个固定的运行频率运行比较稳定,因此,可以预存对应不同类型的算力板的芯片的稳定运行频率间的频率差值,在调整算力板的运行频率值时,以该频率差值为调整幅度进行调整,以使得芯片运行稳定。
具体地,在根据重启算力板的数量调整每个算力板的运行频率值时,还可以包括:采集数据处理设备的环境温度;获取算力板的类型;根据环境温度和算力板的类型确定第一预设频率值或第二预设频率值。在前期,可以通过测试实验获得不同类型算力板在不同环境温度下的稳定运行频率的变化值,并将算力板类型、环境温度和频率值对应进行保存。
其中,在重启算力板的数量大于预设重启算力板阈值时,根据环境温度和算力板的类型确定第一预设频率值,进而,在降低每个算力板在预设时间内的最大运行频率值时,降低第一预设频率值,既可以恢复重启算力板的算力,又可以保证算力板运行稳定。
同理地,在重启算力板的数量小于预设重启算力板阈值时,根据环境温度和算力板的类型确定第二预设频率值,进而,在降低重启算力板在预设时间内的最大运行频率值时,降低第二预设频率值,既可以恢复重启算力板的算力,又可以保证算力板运行稳定。
在实施例中,第一预设频率值与第二预设频率值可以相等也可以不相等,在选择相同的第一预设频率值和第二预设频率值时,根据环境温度和算力板的类型确定其中的一个预设频率值即可。
举例说明,A类型算力板的芯片,其对于环境温度的变化比较敏感,但在50度时,以频率89Hz运行比较稳定,在40度时以频率75Hz运行稳定,在30度时以频率40Hz 运行稳定,在20度时以25Hz运行比较稳定,在环境温度变化时,则芯片的运行频率将对应温度变化降低或提高至比较稳定的运行频率,例如,温度从20度上升至30度,则芯片的运行频率降低至75Hz时才运行稳定。因而,对于对环境温度变化敏感的算力板,可以预存不同类型的算力板的芯片的调节频率幅度值,进而,在环境温度变化时,根据环境温度和算力板的类型确定频率调节的幅度即第一预设频率值或第二预设频率值,从而可以针对不同类型的算力板可以个性化选取调节频率幅度,以保证温度敏感的芯片运行稳定。
例如,在5分钟内环境温度从30度降低至20度,则对于A类型的算力板,在重启算力板的数量大于预设重启算力板阈值时,可以选择第一预设频率值=40-25Hz=15Hz,即将每个算力板在5分钟内的最大运行频率值降低15Hz,即可以使得失效芯片恢复算力又可以使得芯片稳定运行。
在另一些实施例中,受到环境温度以及工作电压的变化,会造成芯片的失效。在不同的环境温度或工作电压下,算力板最大运行频率或稳定运行频率也存在不同,在调整运行频率时,可以根据工作电压和环境温度的具体情况来选择调节频率的幅度,即选择第一预设频率阈值或第二频率阈值。
具体地,采集数据处理设备的工作电压和环境温度;计算在预设时间内工作电压的变化值,以及,计算在预设时间内环境温度的变化值;判断工作电压的变化值是否大于预设电压值,以及,判断环境温度的变化值是否大于预设温度值。
如果工作电压的变化值大于预设电压值,且环境温度的变化值小于预设温度值,根据工作电压确定第一预设频率值或第二预设频率值。
如果工作电压的变化值小于预设电压值,且环境温度的变化值大于预设温度值,根据环境温度确定第一预设频率值或第二预设频率值。
如果工作电压的变化值大于预设电压值,且环境温度的变化值大于预设温度值,根据工作电压获得第一参考频率值,并根据环境温度获得第二参考频率值,计算第一参考频率值与第二参考频率值的平均值,以作为第一预设频率值或第二预设频率值。
在本实施例中,第一预设频率阈值和第二预设频率阈值可以相同也可以不同。其中,在重启算力板的数量大于预设重启算力板阈值时,根据环境温度和算力板的类型确定第一预设频率值,在重启算力板的数量小于预设重启算力板阈值时,根据环境温度和算力板的类型确定第二预设频率值。
举例说明,预存不同温度下的第一预设频率值或第二预设频率值或者参考频率值,以及预存不同工作电压下的第一预设频率值或第二预设频率值或者参考频率值。假设预设温度值为2度,预设电压值为2V。
例如,在5分钟内,环境温度升高3度,工作电压几乎没有变化即变化值为0或者0.2v,环境温度的变化值大于预设温度值,并且此时重启算力板的数量大于预设重启算力板阈值,则根据环境温度确定对应的第一预设频率值,例如通过查询预存的温度-频率幅度对应表格来确定第一预设频率值或者,如果此时重启算力板的数量小于预设重启算力板阈值,则根据环境温度确定对应的第二预设频率值。
再例如,在5分钟内,环境温度升高1度,工作电压降低了3V,工作电压的变化值大于预设电压值,并且此时重启算力板的数量大于预设重启算力板阈值,则根据工作电压确定对应的第一预设频率值,或者,此时重启算力板的数量小于预设重启算力板阈值,则根据工作电压确定对应的第二预设频率值。
再例如,在5分钟内,环境温度升高3度,工作电压降低3V,两者都超过了预设值,则分别根据环境温度和工作电压选择参考频率,并计算两个参考频率值得均值,如果此时重启算力板的数量大于预设重启算力板阈值,则将该均值作为第一预设频率值;或者,此时重启算力板的数量小于预设重启算力板阈值,则将该均值作为第二预设频率值。
考虑具体运行环境的环境温度或者工作电压,来确定频率调节幅度,更加适应具体运行情况,达到频率自适应的效果,可以提高算力板实际运行环境下的算力。
进一步地,如图3所示,在确定失效芯片的数量小于或等于单板失效芯片数量阈值时,进一步还包括:
步骤S47,记录失效芯片的数量小于或等于单板失效芯片阈值的持续时间。
步骤S48,判断持续时间是否达到设定时间阈值,如果是,执行步骤S49,如果否,则返回步骤S47。
步骤S49,获取数据处理设备在设定时间阈值内的平均算力、每个算力板在设定时间阈值内的最小运行频率。
每个算力板的芯片以当前运行频率值运行达到设定时间阈值,认为当前运行频率值可以使得算力板的大部分芯片处于稳定的运行状态,为了确定数据处理设备当前提供的算力是否理想,能否进一步提高数据处理设备的算力,可以通过算力板的算力和运行频率进行判断。
具体地,获取每个算力板在该设定时间阈值内的算力,并获得所有算力板的整体的平均算力,例如将所有算力板的算力求和,并将算力和值除以算力板的数量,获得平均算力;以及,算力板在运行期间,会因为干扰因素的影响产生运行频率的起伏,获取在该设定时间阈值内每个算力板的最小运行频率,并执行步骤S50。
步骤S50,判断平均算力是否小于预设算力阈值且最小运行频率是否小于预设频率阈值。
其中,预设算力阈值可以是数据处理设备的理想算力范围的下限值或者根据数据处理设备具体情况设定的算力值,预设频率阈值可以是算力板最大允许频率值,或者根据算力板具体情况设定的频率值。
具体地,如果每个算力板的最小运行频率接近于或达到预设频率阈值,通常平均算力会大于预设算力阈值;如果平均算力小于预设算力阈值且最小运行频率小于预设频率阈值,则算力板的运行频率还可以进一步提高也不会造成芯片失效,可以通过提高运行频率来提高一定的算力,即执行步骤S52。如果不满足上述条件,则执行步骤S51。
步骤S51,维持当前状态。
步骤S52,提高最小运行频率小于预设频率阈值的算力板的运行频率值,且提高幅度为第三预设频率值。
仍然以三个算力板board1、board2、board3为例,其中,每个算力板均没有失效芯片或失效芯片的数量小于或等于单板失效芯片数量阈值,在当前运行频率下持续时间达到了设定时间阈值例如30分钟,并且在该30分钟内三个算力板的整体的平均算力为A、board1的最小运行频率为120Mhz、board2的最小运行频率为90Mhz、board3的最小运行频率为93Mhz,算力A小于预设算力阈值例如B,且预设频率阈值为100Mhz,则提高算力板board2和board3的运行频率值,例如提高15Mhz,并重新初始化该算力板,以提高算力板board2和board3的算力。
通过上面过程,根据失效芯片的数量调整算力板的运行频率值,可以使得算力较低的算力板逐渐寻找到理想的运行频率值、达到最高的算力,而算力较高的算力板则可以处于稳定的状态中,
进一步地,数据处理设备响应于下电的控制信号,会保存下电前的扫频结果,例如将下电前一刻的每个算力板的运行频率值保存在存储器;或者,每次扫频后都将扫频结果保存到存储器,并进行更新,即保存最新的扫频结果。
在上电后,在初始化阶段,数据处理设备响应于初始化指令,检测上一次下电前每个算力板的历史运行频率值,即保存的下电前一刻的扫频结果。并判断是否检测到历史运行频率值,如果检测到每个算力板的历史运行频率值,则控制每个算力板分别以对应的历史运行频率值进行初始化运行;如果没有检测到历史运行频率值,例如本次为首次上电,则控制每个算力板分别以预设频率值进行初始化运行。然后进入设备检测状态,在系统检测状态,设备会每隔两分钟记录一次关键数据,以进行故障和通信检测,以保证设备的正常运行。在设备运行时,将会按照上面实施例进行频率自适应操作,以使得数据处理设备在实际运行环境下以较佳运行频率运行,保证数据处理速度。
基于上面实施例的频率自适应方法,数据处理设备可以设置频率自适应装置,其中,频率自适应装置可以是单独设置的模块,也可以通过如图1所示的处理器例如MCU以及存储器例如EEPROM的形式实现。
图4是根据本公开的一个实施例的数据处理设备的框图,如图4所示,数据处理设备100包括至少一个处理器40、与至少一个处理器40通信连接的存储器50;其中,存储器50存储有可被至少一个处理器40执行的指令,指令被至少一个处理器40执行时,使至少一个处理器执行上面实施例的频率自适应方法。
以一个处理器40为例,还可以包括通信接口(Communication Interface)60和总线70。其中,处理器40、通信接口60、存储器50可以通过总线70完成相互间的通信。通信接口60可以用于信息传输。处理器40可以调用存储器50中的逻辑指令,以执行上述实施例的频率自适应方法。
此外,上述的存储器50中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
存储器50作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器40通过运行存储在存储器50中的软件程序、指令以及模块,从而执行功能应用以及数据处理,即实现上述方法实施例中的频率自适应方法。
存储器50可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器50可以包括高速随机存取存储器,还可以包括非易失性存储器。
本公开实施例的计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令设置为执行上面实施例公开的频率自适应方法。
本公开实施例的技术方案可以以计算机程序产品的形式体现出来,该计算机程序产品存储在一个存储介质中,包括存储在计算机可读存储介质上的计算机程序,计算机程序包括一个或多个程序指令,当程序指令被计算机执行时,可使得计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM, Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
在一些实施例中,如图5所示,数据处理设备100包括多个算力板30和频率自适应装置60,每个算力板30包括多个芯片,频率自适应装置60可以实现上面实施例的频率自适应方法,以使得每个算力板30运行在最佳运行频率。
如图5所示,本公开实施例的频率自适应装置60包括第一检测模块61、采集模块62、统计模块63、调整模块64。
其中,第一检测模块61配置为检测到数据处理设备进入用户模式,其中,在数据处理设备出厂之前,需要对设备进行各种测试,可以认为设备工作在测试模式。用户选购数据处理设备后,使用数据处理设备,数据处理设备进行数据处理,认为设备工作在用户模式。具体地,用户模式可以在设备出厂前由工程师设置,或者在完成测试程序后,设备自动跳转至用户模式,又或者,可以在设备上设置模式选择单元,通过模式选择单元选择用户模式。在用户模式下,数据处理设备可以接收用户的操作和设置等。
采集模块62配置为每隔预设时间检测数据处理设备的每个算力板的失效芯片。例如,在正常情况下,芯片会反馈任务处理结果给数据处理设备的采集模块62,如果采集模块62不能够接收到芯片的任务处理结果,则认为该芯片为失效芯片。例如,处理器40根据数据处理任务给到芯片的运行频率值超过其最高允许频率时,该芯片会进入自保护模式,并停止工作,则采集模块62也不会获得该芯片的任务反馈结果,认为该芯片为失效芯片。
统计模块63配置为统计在预设时间内每个算力板的失效芯片的数量;调整模块64配置为根据失效芯片的数量调整每个算力板的运行频率值。
本公开实施例的频率自适应装置60,在用户模式下,通过采集模块62采集每个算力板30的失效芯片,调整模块64根据预设时间内每个算力板30的失效芯片的数量调整每个算力板30的运行频率值,即在数据处理设备的数据处理过程中进行频率自适应,可以使数据处理设备工作在实际运行环境下的最佳运行频率值,获得理想的算力,相较于在数据处理设备的测试阶段进行扫频,可以减少占用PCBA时间以及无需设置单独的扫频程序,提高设备生产效率;以及在数据处理设备进行数据处理过程中进行扫频,相较于调取预存的最佳运行频率值,更加适用于实际运行环境。
进一步地,如图5所示,调整模块64包括第一确定单元641、标记单元642、调整单元643,其中,第一确定单元641配置为确定失效芯片的数量大于单板失效芯片数量阈值;标记单元642配置为标记重启算力板,重启算力板的失效芯片的数量大于单板失效芯片数量阈值;调整单元643配置为根据重启算力板的数量调整每个算力板30的运行频率值。
调整单元643进一步包括第一判断子单元6431、第一降低子单元6432、第二降低子单元6433。其中,第一判断子单元6431配置为判断重启算力板的数量是否大于预设重启算力板阈值,如果是,输出第一降低信号,如果否,输出第二降低信号;第一降低子单元6432配置为响应于第一降低信号,降低每个算力板30在预设时间内的最大运行频率值,且降低幅度为第一预设频率值;第二降低子单元6433配置为响应于第二降低信号,降低重启算力板在预设时间内的最大运行频率,且降低幅度为第二预设频率值。
以三个算力板为例,采集模块62每隔5分钟采集每个算力板30的失效芯片,统计模块63统计在该5分钟内每个算力板30的失效芯片的数量,如果算力板30的失效芯片数量大于单板失效芯片数量阈值,则标记为重启算力板。如果重启算力板的数量大于 1个例如标记了两个重启算力板,则认为给到算力板30的运行频率值不合理,例如运行频率值偏高,导致算力板30的芯片自保而停止工作,则第一降低子单元6432将三个算力板30在该5分钟内的最大运行频率值降低25Mhz,即所有算力板30从当前运行频率值M下降到M-25Mhz,更新扫频数据并重启程序,以恢复算力板的算力。如果标记的重启算力板只有1个,则第二降低子单元6433将该重启算力板在该5分钟内的最大运行频率值降低25Mhz,即在重启算力板的数量小于阈值时,仅将标记的重启算力板的运行频率值进行调整,并更新扫频数据以及重启程序、初始化该算力板,以恢复该算力板30 的算力。
进一步地,在一些实施例中,如图5所示,调整单元643还包括第一采集子单元6434、获取子单元6435和第一确定子单元6436。其中,第一采集子单元6434配置为采集数据处理设备的环境温度;获取子单元6435配置为获取算力板的类型;第一确定子单元6436 配置为根据环境温度和算力板的类型确定第一预设频率值或第二预设频率值。在前期,可以通过测试实验获得不同类型算力板30在不同环境温度下的稳定运行频率的变化值,并将算力板类型、环境温度和频率值对应进行保存,例如保存在存储器50中。对于运行频率对环境温度比较敏感的算力板30,可以适应不同的环境温度选择不同的频率调节幅度,更好地适应实际运行环境。
其中,在重启算力板的数量大于预设重启算力板阈值时,第一确定子单元6436根据环境温度和算力板30的类型确定第一预设频率值,进而,在第一降低子单元6432降低每个算力板30在预设时间内的最大运行频率值时,降低第一预设频率值,既可以恢复重启算力板的算力,又可以保证算力板30运行稳定。
同理地,在重启算力板的数量小于预设重启算力板阈值时,第一确定子单元6436根据环境温度和算力板30的类型确定第二预设频率值,进而,在第二降低子单元6433 降低重启算力板在预设时间内的最大运行频率值时,降低第二预设频率值,既可以恢复重启算力板的算力,又可以保证算力板30运行稳定。
在实施例中,第一预设频率值与第二预设频率值可以相等也可以不相等,在选择相同的第一预设频率值和第二预设频率值时,第一确定子单元6436根据环境温度和算力板的类型确定其中的一个预设频率值即可。
例如,在5分钟内环境温度从30度降低至20度,则对于A类型的算力板,在重启算力板的数量大于预设重启算力板阈值时,第一确定子单元6436可以选择第一预设频率值=40-25Hz=15Hz,即第一降低子单元6432将每个算力板30在5分钟内的最大运行频率值降低15Hz,既可以使得失效芯片恢复算力又可以使得芯片稳定运行。
在另一些实施例中,可以根据环境温度和工作电压来确定频率调节幅度,如图6所示,调整单元643还包括第二采集子单元6437、计算子单元6438、判断子单元6439、第二确定子单元6440。其中,第二采集子单元6437配置为采集数据处理设备的工作电压和环境温度;计算子单元6438配置为计算在预设时间内工作电压的变化值,以及,计算在预设时间内环境温度的变化值;判断子单元6439配置为判断工作电压的变化值是否大于预设电压值,以及,判断环境温度的变化值是否大于环境温度的变化值预设温度值;第二确定子单元6440配置为在工作电压的变化值大于预设电压值,且环境温度的变化值小于预设温度值时,根据工作电压确定第一预设频率值或第二预设频率值,或者,在工作电压的变化值小于预设电压值,且环境温度的变化值大于预设温度值,根据环境温度确定第一预设频率值或第二预设频率值,或者,在工作电压的变化值大于预设电压值,且环境温度的变化值大于预设温度值时,根据工作电压获得第一参考频率值,并根据环境温度获得第二参考频率值,计算第一参考频率值与第二参考频率值的平均值,以作为第一预设频率值或第二预设频率值。从而,可以适应于设备运行的实际环境,提高实际环境下运行时的算力。
在本实施例中,第一预设频率阈值和第二预设频率阈值可以相同也可以不同。其中,在重启算力板的数量大于预设重启算力板阈值时,第二确定子单元6440根据环境温度和算力板30的类型确定第一预设频率值,在重启算力板的数量小于预设重启算力板阈值时,第二确定子单元6440根据环境温度和算力板30的类型确定第二预设频率值。
举例说明,例如在存储器50中,预存不同温度下的第一预设频率值或第二预设频率值或者参考频率值,以及预存不同工作电压下的第一预设频率值或第二预设频率值或者参考频率值。假设预设温度值为2度,预设电压值为2V。
例如,在5分钟内,环境温度升高3度,工作电压几乎没有变化即变化值为0或者0.2v,环境温度的变化值大于预设温度值,并且此时重启算力板的数量大于预设重启算力板阈值,则第二确定子单元6440根据环境温度确定对应的第一预设频率值,例如通过查询预存的温度-频率幅度对应表格来确定第一预设频率值;或者,如果此时重启算力板的数量小于预设重启算力板阈值,则第二确定子单元6440根据环境温度确定对应的第二预设频率值。
在实施例中,如图5或图6所示,调整模块64还包括第二确定单元644、记录单元645、第一判断单元646、获取单元647、第二判断单元648、提高单元649。其中,第二确定单元644配置为确定失效芯片的数量小于或等于单板失效芯片阈值;记录单元 645配置为记录失效芯片的数量小于或等于单板失效芯片阈值的持续时间;第一判断单元646配置为判断持续时间是否达到设定时间阈值,如果是,输出获取信号;获取单元 647配置为响应于获取信号,获取数据处理设备100在设定时间阈值内的平均算力、每个算力板在设定时间阈值内的最小运行频率;第二判断单元648配置为判断平均算力是否小于预设算力阈值且最小运行频率是否小于预设频率阈值,如果是,输出提高信号;提高单元649配置为响应于提高信号,提高最小运行频率小于预设频率阈值的算力板30 的运行频率值,且提高幅度为第三预设频率值。
仍然以三个算力板board1、board2、board3为例,其中,每个算力板均没有失效芯片或失效芯片的数量小于或等于单板失效芯片数量阈值,在当前运行频率下持续时间达到了设定时间阈值例如30分钟,并且在该30分钟内三个算力板的整体的平均算力为A、board1的最小运行频率为120Mhz、board2的最小运行频率为90Mhz、board3的最小运行频率为93Mhz,算力A小于预设算力阈值例如B,且预设频率阈值为100Mhz,则提高算力板board2和board3的运行频率值,例如提高15Mhz,并重新初始化该算力板,以提高算力板board2和board3的算力。
通过上面过程,调整模块64根据失效芯片的数量调整算力板的运行频率值,可以使得算力较低的算力板逐渐寻找到理想的运行频率值、达到最高的算力,而算力较高的算力板则可以处于稳定的状态中,
进一步地,数据处理设备100响应于下电的控制信号,会保存下电前的扫频结果,例如将下电前一刻的每个算力板30的运行频率值保存在存储器;或者,每次扫频后都将扫频结果保存到存储器,并进行更新,即保存最新的扫频结果。
在实施例中,如图5所示,频率自适应装置60还包括第二检测模块65、判断模块66、第一控制模块67、第二控制模块68。
其中,第二检测模块65配置为响应于初始化指令检测上一次下电前每个算力板30的历史运行频率值;判断模块66配置为判断是否检测到历史运行频率值,如果是,输出第一初始化触发信号,如果否,输出第二初始化触发信号;第一控制模块67配置为响应于第一初始化触发信号,控制每个算力板30分别以对应的历史运行频率值进行初始化运行;第二控制模块68配置为响应于第二初始化触发信号,控制每个算力板30分别以预设频率值进行初始化运行。然后进入设备检测状态,在系统检测状态,设备会每隔两分钟记录一次关键数据,以进行故障和通信检测,以保证设备的正常运行。在设备运行时,将会按照上面实施例进行频率自适应操作,以使得数据处理设备在实际运行环境下以较佳运行频率运行,保证数据处理速度。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。
尽管已经示出和描述了本公开的实施例,本领域的普通技术人员可以理解:在不脱离本公开的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本公开的范围由权利要求及其等同物限定。

Claims (18)

1.一种频率自适应方法,其特征在于,所述频率自适应方法包括:
检测到数据处理设备进入用户模式;
每隔预设时间采集所述数据处理设备的每个算力板的失效芯片;
统计在所述预设时间内每个所述算力板的所述失效芯片的数量;
根据所述失效芯片的数量调整每个所述算力板的运行频率值。
2.根据权利要求1所述的频率自适应方法,其特征在于,所述根据所述失效芯片的数量调整每个所述算力板的运行频率值,包括:
确定所述失效芯片的数量大于单板失效芯片数量阈值,则标记对应的所述算力板为重启算力板;
根据所述重启算力板的数量调整每个所述算力板的运行频率值。
3.根据权利要求2所述的频率自适应方法,其特征在于,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值包括:
判断所述重启算力板的数量是否大于预设重启算力板阈值;
如果是,降低每个所述算力板在所述预设时间内的最大运行频率值,且降低幅度为第一预设频率值;
如果否,降低所述重启算力板在所述预设时间内的最大运行频率值,且降低幅度为第二预设频率值。
4.根据权利要求3所述的频率自适应方法,其特征在于,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值,还包括:
采集所述数据处理设备的环境温度;
获取所述算力板的类型;
根据所述环境温度和所述算力板的类型确定所述第一预设频率值或所述第二预设频率值。
5.根据权利要求3所述的频率自适应方法,其特征在于,所述根据所述重启算力板的数量调整每个所述算力板的运行频率值,还包括:
采集所述数据处理设备的工作电压和环境温度;
计算在所述预设时间内所述工作电压的变化值,以及,计算在所述预设时间内所述环境温度的变化值;
判断所述工作电压的变化值是否大于预设电压值,以及,判断所述环境温度的变化值是否大于预设温度值;
如果所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值小于所述预设温度值,根据所述工作电压确定所述第一预设频率值或所述第二预设频率值;
如果所述工作电压的变化值小于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述环境温度确定所述第一预设频率值或所述第二预设频率值;
如果所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述工作电压获得第一参考频率值,并根据所述环境温度获得第二参考频率值,计算所述第一参考频率值与所述第二参考频率值的平均值,以作为所述第一预设频率值或所述第二预设频率值。
6.根据权利要求2所述的频率自适应方法,其特征在于,所述根据所述失效芯片的数量调整每个所述算力板的运行频率值,还包括:
确定所述失效芯片的数量小于或等于所述单板失效芯片数量阈值;
记录所述失效芯片的数量小于或等于所述单板失效芯片数量阈值的持续时间;
判断所述持续时间是否达到设定时间阈值;
如果是,获取所述数据处理设备在所述设定时间阈值内的平均算力、每个所述算力板在所述设定时间阈值内的最小运行频率;
判断所述平均算力是否小于预设算力阈值,且所述最小运行频率是否小于预设频率阈值;
如果是,提高所述最小运行频率小于所述预设频率阈值的所述算力板的运行频率值,且提高幅度为第三预设频率值。
7.根据权利要求1-6任一项所述的频率自适应方法,其特征在于,所述频率自适应方法还包括:
响应于初始化指令,检测上一次下电前每个所述算力板的历史运行频率值;
判断是否检测到所述历史运行频率值;
如果是,控制每个所述算力板分别以对应的所述历史运行频率值进行初始化运行;
如果否,控制每个所述算力板分别以预设频率值进行初始化运行。
8.一种频率自适应装置,其特征在于,所述频率自适应装置包括:
第一检测模块,配置为检测到数据处理设备进入用户模式;
采集模块,配置为每隔预设时间检测数据处理设备的每个算力板的失效芯片;
统计模块,配置为统计在所述预设时间内每个所述算力板的所述失效芯片的数量;
调整模块,配置为根据所述失效芯片的数量调整每个所述算力板的运行频率值。
9.根据权利要求8所述的频率自适应装置,其特征在于,所述调整模块包括:
第一确定单元,配置为确定所述失效芯片的数量大于单板失效芯片数量阈值;
标记单元,配置为标记重启算力板,所述重启算力板的所述失效芯片的数量大于所述单板失效芯片数量阈值;
调整单元,配置为根据所述重启算力板的数量调整每个所述算力板的运行频率值。
10.根据权利要求9所述的频率自适应装置,其特征在于,所述调整单元进一步包括:
第一判断子单元,配置为判断所述重启算力板的数量是否大于预设重启算力板阈值,如果是,输出第一降低信号,如果否,输出第二降低信号;
第一降低子单元,配置为响应于所述第一降低信号,降低每个所述算力板在所述预设时间内的最大运行频率值,且降低幅度为第一预设频率值;
第二降低子单元,配置为响应于所述第二降低信号,降低所述重启算力板在所述预设时间内的最大运行频率,且降低幅度为第二预设频率值。
11.根据权利要求10所述的频率自适应装置,其特征在于,所述调整单元还包括:
第一采集子单元,配置为采集所述数据处理设备的环境温度;
获取子单元,配置为获取所述算力板的类型;
第一确定子单元,配置为根据所述环境温度和所述算力板的类型确定所述第一预设频率值或所述第二预设频率值。
12.根据权利要求10所述的频率自适应装置,其特征在于,所述调整单元还包括:
第二采集子单元,配置为采集所述数据处理设备的工作电压和环境温度;
计算子单元,配置为计算在所述预设时间内所述工作电压的变化值,以及,计算在所述预设时间内所述环境温度的变化值;
判断子单元,配置为判断所述工作电压的变化值是否大于预设电压值,以及,判断所述环境温度的变化值是否大于预设温度值;
第二确定子单元,配置为在所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值小于所述预设温度值时,根据所述工作电压确定所述第一预设频率值或所述第二预设频率值,或者,在所述工作电压的变化值小于所述预设电压值,且所述环境温度的变化值大于所述预设温度值,根据所述环境温度确定所述第一预设频率值或所述第二预设频率值,或者,在所述工作电压的变化值大于所述预设电压值,且所述环境温度的变化值大于所述预设温度值时,根据所述工作电压获得第一参考频率值,并根据所述环境温度获得第二参考频率值,计算所述第一参考频率值与所述第二参考频率值的平均值,以作为所述第一预设频率值或所述第二预设频率值。
13.根据权利要求9所述的频率自适应装置,其特征在于,所述调整模块还包括:
第二确定单元,配置为确定所述失效芯片的数量小于或等于单板失效芯片阈值;
记录单元,配置为记录所述失效芯片的数量小于或等于所述单板失效芯片阈值的持续时间;
第一判断单元,配置为判断所述持续时间是否达到设定时间阈值,如果是,输出获取信号;
获取单元,配置为响应于所述获取信号,获取所述数据处理设备在所述设定时间阈值内的平均算力、每个所述算力板在所述设定时间阈值内的最小运行频率;
第二判断单元,配置为判断所述平均算力是否小于预设算力阈值且所述最小运行频率是否小于预设频率阈值,如果是,输出提高信号;
提高单元,配置为响应于所述提高信号,提高所述最小运行频率小于所述预设频率阈值的所述算力板的运行频率值,且提高幅度为第三预设频率值。
14.根据权利要求8-13任一项所述的频率自适应装置,其特征在于,所述频率自适应装置还包括:
第二检测模块,配置为响应于初始化指令,检测上一次下电前每个所述算力板的历史运行频率值;
判断模块,配置为判断是否检测到所述历史运行频率值,如果是,输出第一初始化触发信号,如果否,输出第二初始化触发信号;
第一控制模块,配置为响应于所述第一初始化触发信号,控制每个所述算力板分别以对应的所述历史运行频率值进行初始化运行;
第二控制模块,配置为响应于所述第二初始化触发信号,控制每个所述算力板分别以预设频率值进行初始化运行。
15.一种数据处理设备,其特征在于,包括:
多个算力板,每个所述算力板包括多个芯片;
如权利要求8-14任一项所述的频率自适应装置。
16.一种数据处理设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器执行权利要求1-7任一项所述的频率自适应方法。
17.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令设置为执行如权利要求1-7任一项所述的频率自适应方法。
18.一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1-7任一项所述的频率自适应方法。
CN201910912685.XA 2019-09-25 2019-09-25 频率自适应方法和装置、数据处理设备、介质和产品 Active CN112558507B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910912685.XA CN112558507B (zh) 2019-09-25 2019-09-25 频率自适应方法和装置、数据处理设备、介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910912685.XA CN112558507B (zh) 2019-09-25 2019-09-25 频率自适应方法和装置、数据处理设备、介质和产品

Publications (2)

Publication Number Publication Date
CN112558507A true CN112558507A (zh) 2021-03-26
CN112558507B CN112558507B (zh) 2022-03-01

Family

ID=75029542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910912685.XA Active CN112558507B (zh) 2019-09-25 2019-09-25 频率自适应方法和装置、数据处理设备、介质和产品

Country Status (1)

Country Link
CN (1) CN112558507B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115113675A (zh) * 2022-08-25 2022-09-27 深圳比特微电子科技有限公司 一种电源电压控制方法、装置、区块链服务器和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1501463A (zh) * 2002-11-12 2004-06-02 联想(北京)有限公司 芯片频率调整的方法
CN1818829A (zh) * 2006-03-10 2006-08-16 浙江大学 内核动态调节处理器频率的节能方法
CN103376859A (zh) * 2012-04-26 2013-10-30 华为技术有限公司 芯片性能的控制方法及装置
CN104850805A (zh) * 2015-05-29 2015-08-19 北京华大信安科技有限公司 一种保护芯片系统敏感信息的装置及方法
US20160321082A1 (en) * 2013-12-30 2016-11-03 Sanechips Technology Co., Ltd. Chip starting method, multi-core processor chip and storage medium
CN106210895A (zh) * 2016-07-08 2016-12-07 乐视控股(北京)有限公司 处理器频率控制方法、装置及终端
CN108170257A (zh) * 2018-03-21 2018-06-15 苏州芯算力智能科技有限公司 一种动态电压调整系统及调整方法
CN109086130A (zh) * 2018-06-06 2018-12-25 北京嘉楠捷思信息技术有限公司 计算设备的芯片调频方法、装置、算力板、计算设备及存储介质
CN109240880A (zh) * 2018-08-27 2019-01-18 北京比特大陆科技有限公司 一种数字货币挖矿机的控制方法、装置及相关设备
CN109324902A (zh) * 2018-09-21 2019-02-12 深圳市中科明望通信软件有限公司 一种调整移动终端工作频率的方法、移动终端及存储介质
CN109510621A (zh) * 2017-09-15 2019-03-22 福州瑞芯微电子股份有限公司 一种自适应电压频率调节方法和装置
CN111856245A (zh) * 2020-07-13 2020-10-30 上海聪链信息科技有限公司 区块链服务器芯片动态变频方法及其系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1501463A (zh) * 2002-11-12 2004-06-02 联想(北京)有限公司 芯片频率调整的方法
CN1818829A (zh) * 2006-03-10 2006-08-16 浙江大学 内核动态调节处理器频率的节能方法
CN103376859A (zh) * 2012-04-26 2013-10-30 华为技术有限公司 芯片性能的控制方法及装置
US20130293269A1 (en) * 2012-04-26 2013-11-07 Huawei Technologies Co., Ltd. Method and apparatus for controlling chip performance
US20160321082A1 (en) * 2013-12-30 2016-11-03 Sanechips Technology Co., Ltd. Chip starting method, multi-core processor chip and storage medium
CN104850805A (zh) * 2015-05-29 2015-08-19 北京华大信安科技有限公司 一种保护芯片系统敏感信息的装置及方法
CN106210895A (zh) * 2016-07-08 2016-12-07 乐视控股(北京)有限公司 处理器频率控制方法、装置及终端
CN109510621A (zh) * 2017-09-15 2019-03-22 福州瑞芯微电子股份有限公司 一种自适应电压频率调节方法和装置
CN108170257A (zh) * 2018-03-21 2018-06-15 苏州芯算力智能科技有限公司 一种动态电压调整系统及调整方法
CN109086130A (zh) * 2018-06-06 2018-12-25 北京嘉楠捷思信息技术有限公司 计算设备的芯片调频方法、装置、算力板、计算设备及存储介质
CN109240880A (zh) * 2018-08-27 2019-01-18 北京比特大陆科技有限公司 一种数字货币挖矿机的控制方法、装置及相关设备
CN109324902A (zh) * 2018-09-21 2019-02-12 深圳市中科明望通信软件有限公司 一种调整移动终端工作频率的方法、移动终端及存储介质
CN111856245A (zh) * 2020-07-13 2020-10-30 上海聪链信息科技有限公司 区块链服务器芯片动态变频方法及其系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨斌等: "数字芯片低功耗的电压时钟设计研究", 《集成电路应用》 *
许少尉等: "多核处理器系统节能调度技术研究", 《航空计算技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115113675A (zh) * 2022-08-25 2022-09-27 深圳比特微电子科技有限公司 一种电源电压控制方法、装置、区块链服务器和存储介质
CN115113675B (zh) * 2022-08-25 2022-11-18 深圳比特微电子科技有限公司 一种电源电压控制方法、装置、区块链服务器和存储介质

Also Published As

Publication number Publication date
CN112558507B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
US8729733B2 (en) Power control apparatus, image forming apparatus, and power control program product
CN109188247B (zh) 一种电子系统异常状态检测系统及方法
CN112558507B (zh) 频率自适应方法和装置、数据处理设备、介质和产品
CN111158447A (zh) 服务器散热参数调控方法、装置、设备及可读存储介质
CN109857000B (zh) 一种自动开机控制方法、装置及遥控器
WO2024045540A1 (zh) 一种芯片频率控制方法、装置、区块链服务器和存储介质
CN110173802B (zh) 空调器及其通信控制方法、装置和电子设备
CN108800458A (zh) 一种控制空调中压缩机的频率的方法及装置
CN111122957B (zh) 过电压检测电路、过电压检测方法、逆变器及空气调节器
US10935578B1 (en) Electronic apparatus, voltage detector and voltage detection method thereof
US8504851B2 (en) Electronic device having power consumption adjusting feature
US10289135B2 (en) Control electronics for a process device and method for operation therefor
CN111664543A (zh) 一种空调器及其控制方法
CN101232246B (zh) 电力供应装置和通信设备
US9996134B2 (en) Method to avoid over-rebooting of power supply device
JP4643375B2 (ja) 電圧制御システム
JP4935379B2 (ja) 電源装置および通信機器
CN109951134A (zh) 一种电机的控制方法及装置
WO2015185163A1 (en) Printer power usage
CN101105974A (zh) 非挥发性储存装置及其控制方法
EP2829946A1 (en) Device and method for system power supply management and system having power supply energy-saving management function
JP6325217B2 (ja) 回路装置および回路装置の復旧方法
JP6818240B2 (ja) 電源装置および画像形成装置
CN115347808A (zh) 一种控制方法、设备、系统及存储介质
CN115864499A (zh) 供能控制方法、装置、供能系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant