CN111709623A - 高性能计算环境评价方法、装置、电子设备及存储介质 - Google Patents
高性能计算环境评价方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111709623A CN111709623A CN202010499068.4A CN202010499068A CN111709623A CN 111709623 A CN111709623 A CN 111709623A CN 202010499068 A CN202010499068 A CN 202010499068A CN 111709623 A CN111709623 A CN 111709623A
- Authority
- CN
- China
- Prior art keywords
- evaluation
- operation data
- model
- data
- computing environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Computer Hardware Design (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了高性能计算环境评价方法、装置、电子设备及存储介质,该方法通过一个主模型和若干子模型实现,该方法包括:各个子模型分别自动获取对应节点单位的用于评价的计算运行数据;主模型获取各子模型的所述计算运行数据;主模型根据所述计算运行数据确定计算环境综合评价值;并根据所述计算环境综合评价值确定高性能计算环境发展水平。本申请的有益效果在于,通过主模型和子模型的配合,能够自动、实时地对各个高性能计算节点单位的计算运行数据进行统计和查询,从而实现了对高性能计算环境的实时动态监测以及智能分析研判,在节省大量人力工作的同时,显著提高了高性能计算环境评价的准确性,极大地促进了高性能计算资源的优化配置。
Description
技术领域
本申请涉及计算机技术领域,具体涉及高性能计算环境评价方法、装置、电子设备及存储介质。
背景技术
高性能计算资源作为科技创新的重要手段,对高性能计算环境作系统的评价能够支持和引导用户合理使用计算资源,形成全局统筹的资源布局。现有技术高性能计算环境评价的一般流程为:建立评价模型、发布调查问卷、数据人工填报、线下算法分析、完成评价报告编写,评价报告中可以通过形成柱状图、饼状图等图标展示统计数据,折线图展示评价指标变化趋势等。
但是现有的高性能计算环境评价方法存在很多不足之处,如目前数据采集工作为人工采集,数据采集的时效性和准确性都无法保证,甚至会出现很大偏差,常常造成对计算环境发展水平评价的偏颇;又如目前的评价方法需要人力完成,工作量非常大,因此做一次评价需要较长时间,使得评价周期很长,每年评价次数非常有限,不能及时反映各个节点单位乃至全国范围的大型计算资源的应用状态。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的高性能计算环境评价方法、装置、电子设备及存储介质。
依据本申请的一方面,提供了一种高性能计算环境评价方法,该方法通过一个主模型和若干子模型实现,其中,主模型设置于高性能计算环境评价单位,各子模型分别设置于各个高性能计算环境评价节点单位,该方法包括:
各个子模型分别自动获取对应节点单位的用于评价的计算运行数据;
主模型获取各子模型的所述计算运行数据;
主模型根据所述计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;
主模型根据所述计算环境综合评价值确定高性能计算环境发展水平。
可选的,在上述方法中,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型根据第一预设周期和/或响应于数据获取指令获取用于评价的计算运行原始数据,其中,计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;
对计算运行原始数据进行预处理,得到所述计算运行数据。
可选的,在上述方法中,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型根据获取时间的先后顺序,将与各个单项评价指标相对应的计算运行数据分别储存于指定区域。
可选的,在上述方法中,主模型与各所述子模型间分别建立有通信信道,主模型获取各子模型的所述计算运行数据包括:
主模型根据预设的获取时间和/或第二预设时间周期,根据通信信道从相应子模型的指定区域获取计算运行数据;和/或,
主模型响应于数据获取指令,根据通信信道从相应子模型的指定区域获取计算运行数据。
可选的,在上述方法中,主模型获取各子模型的计算运行数据还包括:
在主模型所在的服务器的资源利用率小于预设阈值时,主模型主动获取计算运行数据;
和/或,
主模型被动接收各子模型的计算运行数据,计算运行数据是各子模型在子模型所在的服务器的资源利用率小于预设阈值时主动发送的。
可选的,在上述方法中,主模型获取各子模型的计算运行数据还包括:
在通过通信信道获取计算运行数据失败的情况下,主模型通过邮件和/或网页接收各子模型发送的计算运行数据。
可选的,在上述方法中,主模型获取各子模型的计算运行数据还包括:
主模型记录通过通信信道获取计算运行数据失败的日志;
主模型在通过邮件和/或网页接收到计算运行数据后,根据接收到的计算运行数据的来源信息与日志进行匹配,根据匹配结果生成数据回执信息,并通过预设的反馈接口反馈给相应子模型。
可选的,在上述方法中,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型分别确定计算运行数据与对应基准运行数据的比值,在该比值的模大于预设比值的情况下,重新获取用于评价的计算运行数据。
可选的,在上述方法中,主模型根据计算运行数据确定多个单项评价指标的值包括:
主模型将计算运行数据进行无量纲化处理;
根据无量纲化处理后的计算运行数据确定各个单项评价指标的初始值;
根据各个单项评价指标的初始值和权重,确定各个单项评价指标的值。
可选的,上述方法还包括:
主模型在目标单项评价指标的值小于与该目标单项评价指标对应的基准阈值的情况时,启动警报系统;
和/或,
主模型在计算环境综合评价值小于综合评价基准阈值的情况下,启动警报系统。
可选的,在上述方法中,主模型根据计算环境综合评价值确定高性能计算环境发展水平还包括:
主模型基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的单项评价指标预测值;
和/或,
主模型基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值。
可选的,在上述方法中,系统能力评价指标包括以下所述中的至少一项:计算能力指标、存储能力指标、通信能力指标;
所述服务能力评价指标包括以下所述中的至少一项:网络环境指标、系统在线情况指标、开通用户账号数指标、服务单位用户数指标、用户培训人数指标;
所述人员能力评价指标包括以下所述中的至少一项:专职人员指标、学生培养指标、国际学术交流指标;
所述超级计算应用能力评价指标以下所述中的至少一项:平台应用能力指标、高性能应用获奖指标、服务科研项目指标、国家及地方政府投入资金指标、用户发表论文指标、社会效益指标。
依据本申请的另一方面,提供了一种高性能计算环境评价装置,该评价装置包括一个主装置和若干子装置,主装置设置于高性能计算环境评价单位,若干子装置分别设置于各个高性能计算环境评价节点单位;
所述子装置用于自动获取对应节点单位的用于评价的计算运行数据;
所述主装置包括:
获取单元,用于获取或接收所述计算运行数据;
数据处理单元,用于根据所述计算运行数据确定多个单项评价指标,并根据确定的多个单项评价指标确定计算环境综合评价指标,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;
评价单元,用于根据所述计算环境综合评价指标确定高性能计算环境发展水平。
可选的,在上述装置中,各个子装置,用于根据第一预设周期和/或响应于数据获取指令获取用于评价的计算运行原始数据,其中,计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;并用于对计算运行原始数据进行预处理,得到所述计算运行数据。
可选的,在上述装置中,各个子装置,用于根据获取时间的先后顺序,将与各个单项评价指标相对应的计算运行数据分别储存于指定区域。
可选的,在上述装置中,主装置的获取单元与各所述子装置间分别建立有通信信道,用于根据预设的获取时间和/或第二预设时间周期,根据通信信道从相应子装置的指定区域获取计算运行数据;和/或,用于响应于数据获取指令,根据通信信道从相应子装置的指定区域获取计算运行数据。
可选的,在上述装置中,主装置的获取单元,用于在其所在的服务器的资源利用率小于预设阈值时,主动获取计算运行数据;和/或,用于被动接收各子装置的计算运行数据,计算运行数据是各子装置在子装置所在的服务器的资源利用率小于预设阈值时主动发送的。
可选的,在上述装置中,主装置的获取单元,用于在通过通信信道获取计算运行数据失败的情况下,通过邮件和/或网页接收各子装置发送的计算运行数据。
可选的,在上述装置中,主装置的获取单元,用于记录通过通信信道获取计算运行数据失败的日志;在通过邮件和/或网页接收到计算运行数据后,根据接收到的计算运行数据的来源信息与日志进行匹配,根据匹配结果生成数据回执信息,并通过预设的反馈接口反馈给相应子装置。
可选的,在上述装置中,各个子装置,用于分别确定计算运行数据与对应基准运行数据的比值,在该比值的模大于预设比值的情况下,重新获取用于评价的计算运行数据。
可选的,在上述装置中,主装置的数据处理单元,用于将计算运行数据进行无量纲化处理;用于根据无量纲化处理后的计算运行数据确定各个单项评价指标的初始值;并用于根据各个单项评价指标的初始值和权重,确定各个单项评价指标的值。
可选的,上述装置中,主装置的数据处理单元,还用于在目标单项评价指标的值小于与该目标单项评价指标对应的基准阈值的情况时,启动警报系统;和/或,主装置用于在计算环境综合评价值小于综合评价基准阈值的情况下,启动警报系统。
可选的,在上述装置中,主装置的评价单元,还用于基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的单项评价指标预测值;和/或,主装置用于基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值。
可选的,在上述装置中,系统能力评价指标包括以下所述中的至少一项:计算能力指标、存储能力指标、通信能力指标;所述服务能力评价指标包括以下所述中的至少一项:网络环境指标、系统在线情况指标、开通用户账号数指标、服务单位用户数指标、用户培训人数指标;所述人员能力评价指标包括以下所述中的至少一项:专职人员指标、学生培养指标、国际学术交流指标;所述超级计算应用能力评价指标以下所述中的至少一项:平台应用能力指标、高性能应用获奖指标、服务科研项目指标、国家及地方政府投入资金指标、用户发表论文指标、社会效益指标。
依据本申请的又一方面,提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。
依据本申请的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。
由上述可知,本申请的技术方案,通过一个主模型和若干子模型实现,其中,主模型设置于高性能计算环境评价单位,各子模型分别设置于各个高性能计算环境评价节点单位,该方法包括:各个子模型分别自动获取对应节点单位的用于评价的计算运行数据;主模型获取各子模型的所述计算运行数据;主模型根据所述计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;主模型根据所述计算环境综合评价值确定高性能计算环境发展水平。本申请的有益效果在于,通过主模型和子模型的配合,能够自动、实时地对各个高性能计算节点单位的计算运行数据进行统计和查询,从而实现了对高性能计算环境的实时动态监测以及智能分析研判,在节省大量人力工作的同时,显著提高了高性能计算环境评价的准确性,极大地促进了高性能计算资源的优化配置。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请一个实施例的高性能计算环境评价方法的流程示意图;
图2示出了根据本申请另一个实施例的高性能计算环境评价方法的流程示意图;
图3示出了根据本申请一个实施例的高性能计算环境评价装置的结构示意图;
图4示出了根据本申请一个实施例的电子设备的结构示意图;
图5示出了根据本申请一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
本申请的构思在于:通过在高性能计算环境评价单位设置主模型,在各个高性能计算环境节点单位设置子模型,子模型可用来收集所在节点单位的计算运行数据,以供主模型随时使用,这样通过主模型与各个子模型的配合,实现了主动获取各个节点单位计算运行数据,并对其计算环境的实时动态监测,在节省大量人力的同时,能够显著提高采集数据的可靠性和时效性,从而实现对高性能计算环境科学、客观、全面的综合评价。
图1示出了根据本申请一个实施例的高性能计算环境评价方法的流程示意图,该方法通过一个主模型和若干子模型实现,其中,主模型设置于高性能计算环境评价单位,各子模型分别设置于各个高性能计算环境评价节点单位,该方法包括:
步骤S110,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据。
本申请旨在提供一种评价全国范围内的高性能计算环境发展水平的方法,数据采集对象为面向全国与超级计算环境发展相关的高校、超算中心、科研院所等众多单位,上述单位称为高性能计算环境节点单位,下文简称为节点单位。
计算运行数据可以包括各个节点单位运用高性能计算机时实时产生的数据,具体的,包括但不限于各个节点单位的CPU计算能力值、协处理器计算能力值、内存总容量值、在线存储总容量值、I/O聚合宽带值、互联网接入国家网格环境的带宽值等等;也可以包括存储于各个节点单位高性能计算机指定区域中的数据或者计算机内运行的第三方的程序内的数据,具体的,包括但不限于高级职称职工占总职工人数的百分比、具有博士学位职工占总职工人数的百分比、当年培养硕士毕业人数总量、举办国际会议次数等等。由此可见,计算运行数据是多维度、大量、繁冗的数据。
各子模型设置于各个节点单位,用于自动获取所在节点单位的上述数据,对于,计算机实时产生的数据,子模型可根据计算机的运行情况直接进行抓取;存储于计算机指定区域内的数据,可预先在子模型内输入路径,以使子模型能够按照路径提取数据;对于计算机内运行的第三方的程序内的数据,可以将第三方程序与子模型设置一个接口,子模型可通过该结构获取相应的数据,如节点单位的人员管理系统,子模型可在这里获取到高级职称职工占总职工人数的百分比、具有博士学位职工占总职工人数的百分比等数据。
对于子模型采集数据的采集时间或者周期,都可以按照需要提前预设,本申请不做限制。
步骤S120,主模型获取各子模型的所述计算运行数据。
在高性能计算环境评价单位设置主模型,在主模型与子模型之间建立一种通信联系,基于这种通信联系,可以使得主模型与子模型之间的数据交互。
本申请最大的优势是通过设置主模型和子模型,实现了自动、主动获取各个节点单位的用于评价的计算运行数据,整个过程不需要各节点单位工作人员的人工录入,不仅节省了大量的人工成本,而且显著提高了数据采集的准确性和实效性,也可以随时响应数据获取的指令,从而实现各节点单位计算运行数据的获取。
步骤S130,主模型根据计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标。
对于各个评价指标的计算主要集成于主模型之中,主模型在获取到计算运行数据后,对计算运行数据按照预定规则进行运算,最终可得到计算环境综合评价值。
关于具体计算的过程现举例如下,可先对从各个节点单位获取的计算运行数据进行预处理,对某些数据进行求和运算,得到相应的累计值,如将各个节点单位的CPU计算能力值加和,得到CPU计算能力累计值,同理,可以得到协处理器计算能力累计值、内存总容量累计值等等;又如对某些数据进行求取平均数运算,得到相应的平均值,如求取所有节点单位高级职称职工占总职工人数的百分比平均值,还有其他预处理方法,可根据需要进行设置,在此不再赘述。
根据预定规则可以根据经过预处理的计算运行数据确定各个单项评价指标的值,单项评价指标包括但不限于系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标。以系统能力评价指标为例,其可以衡量高性能计算环境的硬件基础的发展状况。系统能力评价指标的值可以由但不限于以下数值组成:CPU计算能力累计值、协处理器计算能力累计值、内存总容量累计值、在线存储总容量累计值、I/O聚合带宽平均值、每个计算节点时间的点点通信带宽平均值,可将上述数值求和,从而到的系统能力评价指标的值。
通过对计算运行数据的处理,可以得到多个单项评价指标的值中的至少一项,多个单项评价指标的值包括但不限于:系统能力评价指标的值、服务能力评价指标的值、人员能力评价指标的值、超级计算应用能力评价指标的值,再由上述四个值中的一个或几个根据预设规则经过运算得到计算环境综合评价值。
步骤S140,主模型根据计算环境综合评价值确定高性能计算环境发展水平。
最后,主模型根据计算环境综合评价值来确定高性能计算环境发展水平,根据预设规则的不同,高性能计算环境发展水平的评价方法也不同,通常来讲,计算环境综合评价值越高,说明高性能计算环境发展水平越高。
进一步的,还可以根据计算环境综合评价值,对高性能计算环境发展水平进行分级,如90-100分为一级;70-90为二级;60-70为三级,以便对高性能计算环境发展水平有更加直观的感受。
由图1所示的方法可以看出,本申请通过主模型和子模型的配合,能够自动、实时地对各个高性能计算节点单位的计算运行数据进行统计和查询,从而实现了对高性能计算环境的实时动态监测以及智能分析研判,在节省大量人力工作的同时,显著提高了高性能计算环境评价的准确性,极大地促进了高性能计算资源的优化配置。本申请提供的高性能计算环境评价方法具有可采集、可计算、可查询、以及可导出的特性,可以科学的衡量和测度高性能计算环境的发展水平及变化趋势,借此评价高性能计算环境的发展状况,为今后制定高性能计算环境发展战略规划提供决策参考。
在本申请的一个实施例中,在上述方法中,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:各个子模型根据第一预设周期和/或响应于数据获取指令获取用于评价的计算运行原始数据,其中,计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;对计算运行原始数据进行预处理,得到所述计算运行数据。
子模型一方面可以根据预设的时间周期获取计算运行原始数据,具体的,可以为待预设时间周期一结束,即刻抓取数据,预设的时间周期可根据子模型计算能力以及评价精度进行设置,例如但不限于5ms-1h中的任一数值,采用本实施例的方法,采集数据密度可以很大,通过将预设时间周期设置较小即可实现,而现有技术中采用人工采集的方式,采集周期非常长,大约在一周到一个月时间,甚至更久。因此,采用本申请的采集办法能够显著缩短数据采集的周期,增大数据采集的密度。
在某些情况下,未到预设的时间周期,但是需要对高性能计算环境进行评价,这时,子模型也可以响应于人为发出的数据获取指令,对计算运行原始数据进行采集。
计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;对计算运行原始数据进行预处理,得到所述计算运行数据。
由于数据繁冗,如果将其全部在主模型处理,不仅造成传输量特别大,而且对主模型的计算能力提出了很大的挑战,本实施例推荐将计算运行的原始数据在子模型处进行预处理,将预处理后的数据作为计算运行数据,供主模型使用作为一种优选方式,具体的处理方式包括但不限于:求取某个指标在预设时间段的平均值,求取某个指标在预设时间段的累计值等,如根据预设周期,子模型在1个小时之内获取到20个CPU计算能力值,可以将这20各数值求取平均数,作为CPU计算能力指标在这1个小时内的CPU计算能力值,并将该值供主模型获取。
在本申请的一个实施例中,在上述方法中,各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:各个子模型根据获取时间的先后顺序,将与各个单项评价指标相对应的计算运行数据分别储存于指定区域。
为了便于大量计算运行数据的存储和调用,本实施例提供一种数据存储方法,具体的各个子模型可以根据数据获取时间的先后顺序,将各个与各个单项评价指标相对应的计算运行数据分别储存,如获取的与系统能力运行指标相对应的系统能力运行数据,可以根据获取时间的先后关系,将其依次存储;而不是将系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据笼统地存储在一起。
更进一步的,在各个单项评价指标存在下级数据的情况下,以系统能力运行数据为例,其包括下级数据,可以为但不限于CPU计算能力值、协处理器计算能力值、内存总容量值、在线存储总容量值等等,可以将这些数据中的每一项按照获取时间的先后顺序进行存储,这样在需要某项数据时,可以快速的通过名称和时间的标签找到该项数据,而不需要遍历所有数据,节省了大量的计算时间。
根据本申请的一个实施例,在上述方法中,主模型与各所述子模型间分别建立有通信信道,主模型获取各子模型的所述计算运行数据包括:主模型根据预设的获取时间和/或第二预设时间周期,根据通信信道从相应子模型的指定区域获取计算运行数据;和/或,主模型响应于数据获取指令,根据通信信道从相应子模型的指定区域获取计算运行数据。
在本实施例中,主模型与子模型之间为了实现数据的交互,可以建立一个通信信道,为了节省网络资源的利用率,不要求上述通信信道一直处于连通的状态,只要求在进行数据传输的过程中,该通信信道是连通状态即可。因此,可以预设一个采集和检测的时间周期,即第二预设时间周期,在这个周期结束时,就建立主模型与子模型之间的通信信道,并开始自动获取用于评价的计算运行数据。
在某些情况下,由于网络等原因,可能造成主模型与子模型之间的通信信道出现不能建立或者终端的情况下,主模型不能按照预设的时间周期从子模型获取数据,这时,子模型可将该段时间内的计算运行数据存储于本地指定区域,主模型可根据预设的获取时间对该部分数据进行获取,具体的,可以为主模型读取获取计算运行数据失败的日志,根据日志的时间记录预设数据的获取时间,根据该获取时间主模型从子模型获取该段时间的计算运行数据,该获取时间可以为历史某一时刻的时间。
当然,主模型也可以响应于数据获取指令,根据通信信道从相应子模型的指定区域获取计算运行数据。
由于数据可能在子模型处已经进行预处理,为了节约计算资源,可以对第二预设时间周期的设置稍宽松些,如2h,甚至2天,甚至更大周期。
根据本申请的一个实施例,在上述方法中,主模型获取各子模型的所述计算运行数据还包括:在主模型所在的服务器的资源利用率小于预设阈值时,主模型主动获取所述计算运行数据;和/或,主模型被动接收各子模型的计算运行数据,计算运行数据是各子模型在子模型所在的服务器的资源利用率小于预设阈值时主动发送的。
为了提高主模型和各个子模型之间数据传输的效率,以及最大化资源利用率,可以选择在服务器的资源利用率比较小的时候进行数据的传送,具体的,如在主模型所在服务器的网络宽带利用率小于预设阈值时,主模型主动获取所述计算运行数据。又如,在子模型所在的服务器的网络宽带利用率小于预设阈值时,各子模型主动发送计算运行数据给主模型。
在本申请的一个实施例中,在上述方法中,主模型获取各子模型的计算运行数据还包括:在通过通信信道获取计算运行数据失败的情况下,主模型通过邮件和/或网页接收各子模型发送的计算运行数据。在本实施例中提供一种紧急处理方法,在某些情况下,需要对计算环境进行评价而主模型与子模型之间的通信信道无法建立,且在短时间内难以修复,这时,可采用本实施例推荐的方法作应急处理。具体的,可根据需求,主模型要求各子模型采用邮件和/或网页的方式上报计算机运行数据,并接收各节点单位的子模型上报的计算机运行数据。
若接收的计算机运行数据与主模型所要求的数据格式不匹配,可进行格式转换。
为了节省数据格式的匹配时间,可预先制订一个数据采集标准,并要求各子模型按照该标准进行采集或预处理。
在本申请的一个实施例中,在上述方法中,主模型获取各子模型的计算运行数据还包括:主模型记录通过通信信道获取计算运行数据失败的日志;主模型在通过邮件和/或网页接收到计算运行数据后,根据接收到的计算运行数据的来源信息与日志进行匹配,根据匹配结果生成数据回执信息,并通过预设的反馈接口反馈给相应子模型。
主模型通过邮件和/或网页获取计算运行数据是一种应急预案,该方案与通过高性能计算环境评价模型自动获取计算运行数据是两种完全独立的渠道。因此,为了避免各个节点单位重复上报计算运行数据,在接收到各个节点单位上报的计算运行数据后,可通过给各个节点单位服务器发送回执的方式通知节点单位计算运行数据已收到的消息。
在本申请的一个实施例中,在上述方法中,各子模型自动获取用于评价的计算运行数据包括:子模型确定计算运行数据与对应基准运行数据的比值,在该比值的模大于预设比值的情况下,重新获取用于评价的计算运行数据。
本实施例提供一种检测在自动获取用于评价的计算运行数据的过程中是否存在明显错误的方法。具体的,以一个节点单位的某一项原始数据为例,如CPU计算能力值,子模型可根据该节点单位的该项数据的历史记录,预设一基准CPU计算能力值以及一比值,如设置为该项数据的历史记录在一个自然年中的平均值为基准CPU计算能力值;确定获取的计算运行数据中的CPU计算能力值与其基准运行数据的比值,若该比值的模大于预设比值,则重新获取用于评价的计算运行数据,这样可以控制获取的CPU计算能力值在基准CPU计算能力值上下的一个范围内波动,如果超出了这个范围,说明获取到的CPU计算能力值极有可能存在问题。
进一步的,如果上述步骤执行超过一定次数,如3次,仍然存在上述问题,则可通过人工联系的方式,与节点单位进行确认。在本申请的一个实施例中,在上述方法中,主模型根据计算运行数据确定多个单项评价指标的值包括:主模型将计算运行数据进行无量纲化处理;根据无量纲化处理后的计算运行数据确定各个单项评价指标的初始值;根据各个单项评价指标的初始值和权重,确定各个单项评价指标的值。
各个单项评价指标可能是由下一级指标或者多项的原始数据经过处理得来,每项数据表征着高性能计算机的不同方面的性能或者运行情况,在这些性能和运算情况中会存在主次之分,为了提高高性能计算机环境评价的科学性、合理性,可以对不同的计算运行数据赋予不同的权重,宏观上,体现了对高性能计算环境的不同的性能和运行情况赋予不同的权重,本实施例中给出一种根据计算运行数据确定多个单项评价指标的值的方法作为一种优选方式。
首先,由于各项的计算运行数据的量纲不同,无法直接进行计算,先对其进行无量纲化处理。
然后,对无量纲化后各项的计算运行数据进行初步的运算得到各个单项评价指标的初始值,并且赋予各个单项评价指标不同的权重。
关于权重的赋予方法,本申请推荐采集极值迭代法和德尔菲法相结合的方式作为一种优选方案,步骤可以为:从含有k项数据的数据集中依次遴选出最重要的q个指标,2q个指标,tq个指标,直至下一轮挑选出的数据数量超出总的数据数量,迭代过程终止,其中1≤q<k;计算每项数据在迭代过程中被选中的次数,归一化得到权重。
最后,可根据各个单项评价指标的初始值和权重,进行加权求和运算,确定各个单项评价指标的值。
在本申请的一个实施例中,上述方法还包括:主模型在目标单项评价指标的值小于与该目标单项评价指标对应的基准阈值的情况时,启动警报系统;和/或,主模型在计算环境综合评价值小于综合评价基准阈值的情况下,启动警报系统。
为了促进高性能计算机的合理应用,本实施例中设置了一警报系统,该警报系统在目标评价指标的值小于相应的基准阈值时,会发出警报,警报的形式可以为弹窗或警报声或二者相结合的方式。其中,目标评价指标可以为计算环境综合评价值,也可以为各个单项评价指标,或者各个单项评价指标存在的下级评价指标。
在本申请的一个实施例中,在上述方法中,主模型根据计算环境综合评价值确定高性能计算环境发展水平还包括:基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的评价指标预测值;和/或,主模型基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值。
高性能计算环境评价的一个重要目的就是希望能够对未来的情况作出合理的预测,进而对现有的工作进行指导。
态势感知是一种基于环境的、动态、整体地洞悉安全风险的能力,是以安全大数据为基础,从全局视角提升对安全威胁的发现识别、理解分析、响应处置能力的一种方式,最终是为了决策与行动,是安全能力的落地。态势感知技术目前常用于安全技术领域。
本申请经过研究发现,将态势感知技术用于高性能计算环境评价领域能够对计算环境发展水平做出更精准的预测,相较于现有技术的预测方法,更加快速、准确、以及智能化。
如基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的评价指标预测值。获得的各个单项评价指标是指过去某一段时间内各个单项评价指标的一个或多个实测值,优选多个实测值,态势感知技术可根据多个实测值根据时间的变化趋势或规律,对于未来一段时间内该项单项评价指标给出一预测值,该预测值对现有技术有很大的指导意义。
如计算能力评价指标在过去2年内,每年连续增长40%以上,更具体的计算能力评价指标中的最大并行核数由100万核增长到300万核,态势感知技术可根据此变化、联合国内现有阶段科研水平和科研需要,对未来一年的最大并行核数做出精准预测,各个节点单位可以根据该预测值添购计算机数量。
同理,上述方法同样适用于计算环境综合评价指标。
在本申请的一个实施例中,在上述方法中,系统能力评价指标包括以下所述中的至少一项:计算能力指标、存储能力指标、通信能力指标;服务能力评价指标包括以下所述中的至少一项:网络环境指标、系统在线情况指标、开通用户账号数指标、服务单位用户数指标、用户培训人数指标;人员能力评价指标包括以下所述中的至少一项:专职人员指标、学生培养指标、国际学术交流指标;超级计算应用能力评价指标以下所述中的至少一项:平台应用能力指标、高性能应用获奖指标、服务科研项目指标、国家及地方政府投入资金指标、用户发表论文指标、社会效益指标。
由于计算运行数据庞大而繁杂,表征着高性能计算运行环境的各个方面,而计算环境综合评价值只能对高性能计算环境的发展水平做出整体的评价,各个单项评价指标也过于笼统,因此可以在各个单项评价指标的下层再设置一层或多层评价指标,来对高性能计算环境的发展水平进行表征,可以为但不限于上述举例。需要说明的是,以上所述的关于各个单项评价指标的计算方法或操作均适用于在各个单项评价指标的下层再设置的一层或多层评价指标。
图2示出了根据本申请另一个实施例的高性能计算环境评价方法的流程示意图。
子模型在预设的时间周期结束时,获取与其对应的高性能计算环境节点单位的计算运行原始数据,子模型将获取的计算运行原始数据经过预处理得到计算运行数据。
子模型确定获取的计算运行数据与对应基准运行数据的比值,并比较该比值的模是否大于预设比值,在较该比值的模大于预设比值的情况下,重新获取计算运行数据,在较该比值的模不大于预设比值的情况下,继续执行下一步骤。
建立主模型与子模型之间的通信信道,主模型按照第二预设时间周期从子模型获取计算运行数据。
主模型根据计算运行数据确定各个单项评价指标的值,并判断目标单项评价指标是否小于相应的基准阈值,在目标单项评价指标小于相应的基准阈值的情况下,启动警报系统,提示各节点单位可能出现资源配置不合理情况。
主模型根据各个单项评价指标的值确定计算环境综合评价值,并基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值,根据该预测值,可对现有计算资源配置做出调整。
图3示出了根据本申请一个实施例的高性能计算环境评价装置的结构示意图;该装置300包括一个主装置310和若干子装置320~340,本实施例中为3个子装置,其中,主装置310设置于高性能计算环境评价单位,各子装置320~340分别设置于各个高性能计算环境评价节点单位,
各个子装置320~340,分别用于自动获取对应节点单位的用于评价的计算运行数据。
本申请旨在提供一种评价全国范围内的高性能计算环境发展水平的方法,数据采集对象为面向全国与超级计算环境发展相关的高校、超算中心、科研院所等众多单位,上述单位称为高性能计算环境节点单位,下文简称为节点单位。
计算运行数据可以包括各个节点单位运用高性能计算机时实时产生的数据,具体的,包括但不限于各个节点单位的CPU计算能力值、协处理器计算能力值、内存总容量值、在线存储总容量值、I/O聚合宽带值、互联网接入国家网格环境的带宽值等等;也可以包括存储于各个节点单位高性能计算机指定区域中的数据或者计算机内运行的第三方的程序内的数据,具体的,包括但不限于高级职称职工占总职工人数的百分比、具有博士学位职工占总职工人数的百分比、当年培养硕士毕业人数总量、举办国际会议次数等等。由此可见,计算运行数据是多维度、大量、繁冗的数据。
各子装置设置于各个节点单位,用于自动获取所在节点单位的上述数据,对于,计算机实时产生的数据,子装置可根据计算机的运行情况直接进行抓取;存储于计算机指定区域内的数据,可预先在子装置内输入路径,以使子装置能够按照路径提取数据;对于计算机内运行的第三方的程序内的数据,可以将第三方程序与子装置设置一个接口,子装置可通过该结构获取相应的数据,如节点单位的人员管理系统,子装置可在这里获取到高级职称职工占总职工人数的百分比、具有博士学位职工占总职工人数的百分比等数据。
对于子装置采集数据的采集时间或者周期,都可以按照需要提前预设,本申请不做限制。
主装置310,包括获取单元311,用于获取各子装置320~340的所述计算运行数据。
在高性能计算环境评价单位设置主装置,在主装置与子装置之间建立一种通信联系,基于这种通信联系,可以使得主装置与子装置之间的数据交互。
本申请最大的优势是通过设置主装置和子装置,实现了自动、主动获取各个节点单位的用于评价的计算运行数据,整个过程不需要各节点单位工作人员的人工录入,不仅节省了大量的人工成本,而且显著提高了数据采集的准确性和实效性,也可以随时响应数据获取的指令,从而实现各节点单位计算运行数据的获取。
主装置310,包括数据处理单元312,用于根据计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标。
对于各个评价指标的计算主要集成于主装置之中,主装置在获取到计算运行数据后,对计算运行数据按照预定规则进行运算,最终可得到计算环境综合评价值。
关于具体计算的过程现举例如下,可先对从各个节点单位获取的计算运行数据进行预处理,对某些数据进行求和运算,得到相应的累计值,如将各个节点单位的CPU计算能力值加和,得到CPU计算能力累计值,同理,可以得到协处理器计算能力累计值、内存总容量累计值等等;又如对某些数据进行求取平均数运算,得到相应的平均值,如求取所有节点单位高级职称职工占总职工人数的百分比平均值,还有其他预处理方法,可根据需要进行设置,在此不再赘述。
根据预定规则可以根据经过预处理的计算运行数据确定各个单项评价指标的值,单项评价指标包括但不限于系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标。以系统能力评价指标为例,其可以衡量高性能计算环境的硬件基础的发展状况。系统能力评价指标的值可以由但不限于以下数值组成:CPU计算能力累计值、协处理器计算能力累计值、内存总容量累计值、在线存储总容量累计值、I/O聚合带宽平均值、每个计算节点时间的点点通信带宽平均值,可将上述数值求和,从而到的系统能力评价指标的值。
通过对计算运行数据的处理,可以得到多个单项评价指标的值中的至少一项,多个单项评价指标的值包括但不限于:系统能力评价指标的值、服务能力评价指标的值、人员能力评价指标的值、超级计算应用能力评价指标的值,再由上述四个值中的一个或几个根据预设规则经过运算得到计算环境综合评价值。
主装置310,包括评价单元313,用于根据计算环境综合评价值确定高性能计算环境发展水平。
最后,主装置根据计算环境综合评价值来确定高性能计算环境发展水平,根据预设规则的不同,高性能计算环境发展水平的评价方法也不同,通常来讲,计算环境综合评价值越高,说明高性能计算环境发展水平越高。
进一步的,还可以根据计算环境综合评价值,对高性能计算环境发展水平进行分级,如90-100分为一级;70-90为二级;60-70为三级,以便对高性能计算环境发展水平有更加直观的感受。
由图3所示的装置可以看出,本申请通过主装置310和子装置320~340的配合,能够自动、实时地对各个高性能计算节点单位的计算运行数据进行统计和查询,从而实现了对高性能计算环境的实时动态监测以及智能分析研判,在节省大量人力工作的同时,显著提高了高性能计算环境评价的准确性,极大地促进了高性能计算资源的优化配置。本申请提供的高性能计算环境评价方法具有可采集、可计算、可查询、以及可导出的特性,可以科学的衡量和测度高性能计算环境的发展水平及变化趋势,借此评价高性能计算环境的发展状况,为今后制定高性能计算环境发展战略规划提供决策参考。
在本申请的一个实施例中,在上述装置中,各个子装置320~340,用于根据第一预设周期和/或响应于数据获取指令获取用于评价的计算运行原始数据,其中,计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;并用于对计算运行原始数据进行预处理,得到所述计算运行数据。
在本申请的一个实施例中,在上述装置中,各个子装置320~340,用于根据获取时间的先后顺序,将与各个单项评价指标相对应的计算运行数据分别储存于指定区域。
在本申请的一个实施例中,在上述装置中,主装置的获取单元311与各所述子装置320~340间分别建立有通信信道,用于根据预设的获取时间和/或第二预设时间周期,根据通信信道从相应子装置的指定区域获取计算运行数据;和/或,用于响应于数据获取指令,根据通信信道从相应子装置的指定区域获取计算运行数据。
在本申请的一个实施例中,在上述装置中,主装置的获取单元311,用于在其所在的服务器的资源利用率小于预设阈值时,主动获取计算运行数据;和/或,用于被动接收各子装置的计算运行数据,计算运行数据是各子装置在子装置所在的服务器的资源利用率小于预设阈值时主动发送的。
在本申请的一个实施例中,在上述装置中,主装置的获取单元311,用于在通过通信信道获取计算运行数据失败的情况下,通过邮件和/或网页接收各子装置发送的计算运行数据。
在本申请的一个实施例中,在上述装置中,主装置的获取单元311,用于记录通过通信信道获取计算运行数据失败的日志;在通过邮件和/或网页接收到计算运行数据后,根据接收到的计算运行数据的来源信息与日志进行匹配,根据匹配结果生成数据回执信息,并通过预设的反馈接口反馈给相应子装置。
在本申请的一个实施例中,在上述装置中,各个子装置320~340,用于分别确定计算运行数据与对应基准运行数据的比值,在该比值的模大于预设比值的情况下,重新获取用于评价的计算运行数据。
可选的,在上述装置中,主装置的数据处理单元312,用于将计算运行数据进行无量纲化处理;用于根据无量纲化处理后的计算运行数据确定各个单项评价指标的初始值;并用于根据各个单项评价指标的初始值和权重,确定各个单项评价指标的值。
在本申请的一个实施例中,上述装置中,主装置的数据处理单元312,还用于在目标单项评价指标的值小于与该目标单项评价指标对应的基准阈值的情况时,启动警报系统;和/或,主装置用于在计算环境综合评价值小于综合评价基准阈值的情况下,启动警报系统。
在本申请的一个实施例中,在上述装置中,主装置的评价单元313,还用于基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的单项评价指标预测值;和/或,主装置用于基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值。
在本申请的一个实施例中,在上述装置中,系统能力评价指标包括以下所述中的至少一项:计算能力指标、存储能力指标、通信能力指标;所述服务能力评价指标包括以下所述中的至少一项:网络环境指标、系统在线情况指标、开通用户账号数指标、服务单位用户数指标、用户培训人数指标;所述人员能力评价指标包括以下所述中的至少一项:专职人员指标、学生培养指标、国际学术交流指标;所述超级计算应用能力评价指标以下所述中的至少一项:平台应用能力指标、高性能应用获奖指标、服务科研项目指标、国家及地方政府投入资金指标、用户发表论文指标、社会效益指标。
需要说明的是,上述实施例中的高性能计算机环境评价装置可分别用于执行前述实施例中的高性能计算机环境评价方法,因此不再一一进行具体的说明。
由上述可知,本申请的技术方案,通过一个主模型和若干子模型实现,其中,主模型设置于高性能计算环境评价单位,各子模型分别设置于各个高性能计算环境评价节点单位,该方法包括:各个子模型分别自动获取对应节点单位的用于评价的计算运行数据;主模型获取各子模型的所述计算运行数据;主模型根据所述计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;主模型根据所述计算环境综合评价值确定高性能计算环境发展水平。本申请的有益效果在于,通过主模型和子模型的配合,能够自动、实时地对各个高性能计算节点单位的计算运行数据进行统计和查询,从而实现了对高性能计算环境的实时动态监测以及智能分析研判,在节省大量人力工作的同时,显著提高了高性能计算环境评价的准确性,极大地促进了高性能计算资源的优化配置。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个申请方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,申请方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的高性能计算环境评价装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图4示出了根据本申请一个实施例的电子设备的结构示意图。该电子设备400包括处理器410和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器420。存储器420可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器420具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码431的存储空间430。例如,用于存储计算机可读程序代码的存储空间430可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码431。计算机可读程序代码431可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图5所述的计算机可读存储介质。图5示出了根据本申请一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质500存储有用于执行根据本申请的方法步骤的计算机可读程序代码431,可以被电子设备400的处理器410读取,当计算机可读程序代码431由电子设备400运行时,导致该电子设备400执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码431可以执行上述任一实施例中示出的方法。计算机可读程序代码431可以以适当形式进行压缩。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (15)
1.一种高性能计算环境评价方法,其特征在于,所述方法通过一个主模型和若干子模型实现,其中,主模型设置于高性能计算环境评价单位,各子模型分别设置于各个高性能计算环境评价节点单位,所述方法包括:
各个子模型分别自动获取对应节点单位的用于评价的计算运行数据;
主模型获取各子模型的所述计算运行数据;
主模型根据所述计算运行数据确定多个单项评价指标的值,并根据确定的多项评价指标的值确定计算环境综合评价值,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;
主模型根据所述计算环境综合评价值确定高性能计算环境发展水平。
2.根据权利要求1所述的方法,其特征在于,所述各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型根据第一预设周期和/或响应于数据获取指令获取用于评价的计算运行原始数据,其中,计算运行原始数据包括以下所述中的至少一项:系统能力运行数据、服务能力运行数据、人员能力运行数据、超级计算应用能力运行数据;
对所述计算运行原始数据进行预处理,得到所述计算运行数据。
3.根据权利要求1所述的方法,其特征在于,所述各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型根据获取时间的先后顺序,将与各个单项评价指标相对应的计算运行数据分别储存于指定区域。
4.根据权利要求2所述的方法,其特征在于,所述主模型与各所述子模型间分别建立有通信信道,所述主模型获取各子模型的所述计算运行数据包括:
所述主模型根据预设的获取时间和/或第二预设时间周期,根据所述通信信道从相应子模型的指定区域获取所述计算运行数据;和/或,
所述主模型响应于数据获取指令,根据所述通信信道从相应子模型的指定区域获取所述计算运行数据。
5.根据权利要求1所述的方法,其特征在于,所述主模型获取各子模型的所述计算运行数据还包括:
在所述主模型所在的服务器的资源利用率小于预设阈值时,主模型主动获取所述计算运行数据;
和/或,
所述主模型被动接收各子模型的计算运行数据,所述计算运行数据是各子模型在子模型所在的服务器的资源利用率小于预设阈值时主动发送的。
6.根据权利要求4所述的方法,其特征在于,所述主模型获取各子模型的所述计算运行数据还包括:
在通过所述通信信道获取所述计算运行数据失败的情况下,所述主模型通过邮件和/或网页接收各子模型发送的计算运行数据。
7.根据权利要求6所述的方法,其特征在于,所述主模型获取各子模型的所述计算运行数据还包括:
所述主模型记录通过所述通信信道获取计算运行数据失败的日志;
所述主模型在通过邮件和/或网页接收到计算运行数据后,根据接收到的计算运行数据的来源信息与所述日志进行匹配,根据匹配结果生成数据回执信息,并通过预设的反馈接口反馈给相应子模型。
8.根据权利要求1所述的方法,其特征在于,所述各个子模型分别自动获取对应节点单位的用于评价的计算运行数据包括:
各个子模型分别确定所述计算运行数据与对应基准运行数据的比值,在该比值的模大于预设比值的情况下,重新获取用于评价的计算运行数据。
9.根据权利要求1所述的方法,其特征在于,所述主模型根据所述计算运行数据确定多个单项评价指标的值包括:
主模型将所述计算运行数据进行无量纲化处理;
根据无量纲化处理后的计算运行数据确定各个单项评价指标的初始值;
根据各个单项评价指标的初始值和权重,确定各个单项评价指标的值。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述主模型在目标单项评价指标的值小于与该目标单项评价指标对应的基准阈值的情况时,启动警报系统;
和/或,
所述主模型在所述计算环境综合评价值小于综合评价基准阈值的情况下,启动警报系统。
11.根据权利要求1所述的方法,其特征在于,所述主模型根据所述计算环境综合评价值确定高性能计算环境发展水平还包括:
主模型基于态势感知技术,根据获得的各个单项评价指标确定预设时间段内相应的单项评价指标预测值;
和/或,
主模型基于态势感知技术,根据获得的计算环境综合评价指标确定预设时间段内计算环境综合评价指标预测值。
12.根据权利要求1-11中任一项所述的方法,其特征在于,所述系统能力评价指标包括以下所述中的至少一项:计算能力指标、存储能力指标、通信能力指标;
所述服务能力评价指标包括以下所述中的至少一项:网络环境指标、系统在线情况指标、开通用户账号数指标、服务单位用户数指标、用户培训人数指标;
所述人员能力评价指标包括以下所述中的至少一项:专职人员指标、学生培养指标、国际学术交流指标;
所述超级计算应用能力评价指标以下所述中的至少一项:平台应用能力指标、高性能应用获奖指标、服务科研项目指标、国家及地方政府投入资金指标、用户发表论文指标、社会效益指标。
13.一种高性能计算环境评价装置,其特征在于,所述评价装置包括一个主装置和若干子装置,主装置设置于高性能计算环境评价单位,若干子装置分别设置于各个高性能计算环境评价节点单位;
所述子装置用于自动获取对应节点单位的用于评价的计算运行数据;
所述主装置包括:
获取单元,用于获取或接收所述计算运行数据;
数据处理单元,用于根据所述计算运行数据确定多个单项评价指标,并根据确定的多个单项评价指标确定计算环境综合评价指标,其中,所述单项评价指标包括以下所述中的至少一项:系统能力评价指标、服务能力评价指标、人员能力评价指标、超级计算应用能力评价指标;
评价单元,用于根据所述计算环境综合评价指标确定高性能计算环境发展水平。
14.一种电子设备,其中,该电子设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-12中任一项所述的方法。
15.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如权利要求1-12中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010499068.4A CN111709623A (zh) | 2020-06-04 | 2020-06-04 | 高性能计算环境评价方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010499068.4A CN111709623A (zh) | 2020-06-04 | 2020-06-04 | 高性能计算环境评价方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111709623A true CN111709623A (zh) | 2020-09-25 |
Family
ID=72539596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010499068.4A Pending CN111709623A (zh) | 2020-06-04 | 2020-06-04 | 高性能计算环境评价方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709623A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117130851A (zh) * | 2023-07-26 | 2023-11-28 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1254551A2 (en) * | 2000-02-08 | 2002-11-06 | Harris Corporation | System and method for assesing the security vulnerability of a network |
CN1741631A (zh) * | 2004-08-24 | 2006-03-01 | 华为技术有限公司 | 一种实现多播业务的方法 |
CN101072167A (zh) * | 2006-05-12 | 2007-11-14 | 美国博通公司 | 通过通信系统传输信息的方法和系统 |
CN101977157A (zh) * | 2010-11-24 | 2011-02-16 | 武汉大学 | 一种AdHoc网络异构多播业务流最优资源控制方法 |
US20120327775A1 (en) * | 2011-06-22 | 2012-12-27 | Futurewei Technologies, Inc. | Protocol Independent Multicast with Quality of Service Support |
CN103380608A (zh) * | 2011-03-09 | 2013-10-30 | 中国科学院计算机网络信息中心 | 在计算环境中汇聚队列信息及作业信息的方法 |
CN104380671A (zh) * | 2012-06-01 | 2015-02-25 | 瑞典爱立信有限公司 | 在分级、冗余、多播路由选择中增加失效覆盖 |
CN107992401A (zh) * | 2017-11-29 | 2018-05-04 | 平安科技(深圳)有限公司 | 性能测试评价方法、装置、终端设备及存储介质 |
CN108874640A (zh) * | 2018-05-07 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 一种集群性能的评估方法和装置 |
CN108881110A (zh) * | 2017-05-10 | 2018-11-23 | 全球能源互联网研究院 | 一种安全态势评估与防御策略联合决策方法及系统 |
CN110417591A (zh) * | 2019-07-23 | 2019-11-05 | 中南民族大学 | 投票节点配置方法及系统 |
CN110704542A (zh) * | 2019-10-15 | 2020-01-17 | 南京莱斯网信技术研究院有限公司 | 一种基于节点负载的数据动态分区系统 |
CN111190790A (zh) * | 2019-12-17 | 2020-05-22 | 西安交通大学 | 一种基于峰值预测的云计算集群监控方法及系统 |
-
2020
- 2020-06-04 CN CN202010499068.4A patent/CN111709623A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1254551A2 (en) * | 2000-02-08 | 2002-11-06 | Harris Corporation | System and method for assesing the security vulnerability of a network |
CN1741631A (zh) * | 2004-08-24 | 2006-03-01 | 华为技术有限公司 | 一种实现多播业务的方法 |
CN101072167A (zh) * | 2006-05-12 | 2007-11-14 | 美国博通公司 | 通过通信系统传输信息的方法和系统 |
CN101977157A (zh) * | 2010-11-24 | 2011-02-16 | 武汉大学 | 一种AdHoc网络异构多播业务流最优资源控制方法 |
CN103380608A (zh) * | 2011-03-09 | 2013-10-30 | 中国科学院计算机网络信息中心 | 在计算环境中汇聚队列信息及作业信息的方法 |
US20120327775A1 (en) * | 2011-06-22 | 2012-12-27 | Futurewei Technologies, Inc. | Protocol Independent Multicast with Quality of Service Support |
CN104380671A (zh) * | 2012-06-01 | 2015-02-25 | 瑞典爱立信有限公司 | 在分级、冗余、多播路由选择中增加失效覆盖 |
CN108881110A (zh) * | 2017-05-10 | 2018-11-23 | 全球能源互联网研究院 | 一种安全态势评估与防御策略联合决策方法及系统 |
CN107992401A (zh) * | 2017-11-29 | 2018-05-04 | 平安科技(深圳)有限公司 | 性能测试评价方法、装置、终端设备及存储介质 |
CN108874640A (zh) * | 2018-05-07 | 2018-11-23 | 北京京东尚科信息技术有限公司 | 一种集群性能的评估方法和装置 |
CN110417591A (zh) * | 2019-07-23 | 2019-11-05 | 中南民族大学 | 投票节点配置方法及系统 |
CN110704542A (zh) * | 2019-10-15 | 2020-01-17 | 南京莱斯网信技术研究院有限公司 | 一种基于节点负载的数据动态分区系统 |
CN111190790A (zh) * | 2019-12-17 | 2020-05-22 | 西安交通大学 | 一种基于峰值预测的云计算集群监控方法及系统 |
Non-Patent Citations (1)
Title |
---|
刘永刚;黄振华;: "研究并分析网络安全态势评估与趋势感知" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117130851A (zh) * | 2023-07-26 | 2023-11-28 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
CN117130851B (zh) * | 2023-07-26 | 2024-03-26 | 是石科技(江苏)有限公司 | 一种高性能计算集群运行效率评价方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108665159A (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
CN101421953A (zh) | 控制服务容量 | |
CN108495329B (zh) | 一种基站可靠性的评价方法和装置 | |
CN116523262B (zh) | 基于大数据的生产计划智能规划方法、系统和介质 | |
CN110610431A (zh) | 基于大数据的智能理赔方法及智能理赔系统 | |
CN111181757B (zh) | 信息安全风险预测方法、装置以及计算设备、存储介质 | |
CN109902747A (zh) | 一种身份识别方法、装置、设备及计算机可读存储介质 | |
CN109492863A (zh) | 金融单证的自动生成方法及装置 | |
CN114625406A (zh) | 应用开发管控方法、计算机设备、存储介质 | |
CN114757637A (zh) | 基于决策引擎的信贷审批方法、装置、设备和存储介质 | |
CN107480703B (zh) | 交易故障检测方法及装置 | |
CN110489142A (zh) | 设备软件升级的评估方法及装置、存储介质、终端 | |
CN114138601A (zh) | 一种业务告警方法、装置、设备及存储介质 | |
CN111709623A (zh) | 高性能计算环境评价方法、装置、电子设备及存储介质 | |
CN111882113A (zh) | 一种企业手机银行用户的预测方法和装置 | |
CN116579671A (zh) | 一种自动匹配指标的绩效考核方法、系统、终端及存储介质 | |
CN116187675A (zh) | 任务分配方法、装置、设备及存储介质 | |
CN117455681A (zh) | 业务风险预测方法和装置 | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 | |
CN114707420A (zh) | 一种信贷欺诈行为识别方法、装置、设备及存储介质 | |
CN113052509A (zh) | 模型评估方法、模型评估装置、电子设备和存储介质 | |
CN116957306B (zh) | 基于资源协同互动的用户侧响应潜力评估方法及系统 | |
CN113159915B (zh) | 基于大数据的智能金融信用动态评估方法及系统 | |
CN116993218A (zh) | 基于人工智能的指标分析方法、装置、设备及存储介质 | |
CN116170299A (zh) | 数据采集方法、系统及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |