CN116896591A - 网络数据分析模型调度方法、装置和计算机设备 - Google Patents
网络数据分析模型调度方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN116896591A CN116896591A CN202310871317.1A CN202310871317A CN116896591A CN 116896591 A CN116896591 A CN 116896591A CN 202310871317 A CN202310871317 A CN 202310871317A CN 116896591 A CN116896591 A CN 116896591A
- Authority
- CN
- China
- Prior art keywords
- data analysis
- network data
- task
- model
- scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 19
- 230000015654 memory Effects 0.000 claims description 27
- 238000005259 measurement Methods 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000007619 statistical method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000011897 real-time detection Methods 0.000 description 3
- 238000013468 resource allocation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
- H04L67/61—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种网络数据分析模型调度方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:响应于服务请求方针对网络数据分析任务发起的任务请求,确定任务请求的请求类型;任务请求用于请求网络数据分析服务网元分配模型来处理网络数据分析任务;从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型;目标预测模型用于输出针对网络数据分析任务的运行参数预测结果;运行参数预测结果表征完成网络数据分析任务所需的资源占用信息;按照运行参数预测结果,对各网络数据分析任务进行调度。采用本方法能够提升资源利用率。
Description
技术领域
本申请涉及网络技术与安全技术领域,特别是涉及一种网络数据分析模型调度方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
在5G时代,由于网络业务的多元化以及应用场景的丰富,网络规模日益壮大,网络环境也越发复杂化,为了运营商当前的分析处理能力,3GPP拟将人工智能技术引入5G网络,新增了一个NWDAF(Network Data Analytics Function,网络数据分析功能)网元,借助AI(Artificial Intelligence,人工智能)技术对网络进行自动感知和分析,并参与到网络规划、建设、运维、网优、运营全生命周期中,以便更好地支撑网络按需服务,并提升网络资源利用率,提升客户体验和满意度。
然而,海量异构模型的训练与推理任务使NWDAF网元在效率与资源上面临巨大挑战,目前关于NWDAF的标准没有涉及模型调度相关的板块,而传统的模型调度方法包括:(1)按照接收到的任务先后顺序执行;(2)通过手工配置模型运行参数的经验值来完成调度,上述模型调度方法普遍存在着资源的利用率较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升资源利用率的网络数据分析模型调度方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种网络数据分析模型调度方法。所述方法包括:
响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
在其中一个实施例中,所述方法还包括:
获取所述网络数据分析任务的运行参数实测结果;所述运行参数实测结果表征实时检测到的所述网络数据分析任务在执行过程中的资源占用信息;
在所述运行参数实测结果与所述运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量;所述目标节点包括所述网络数据分析任务所处的所述网络数据分析服务网元中的工作节点。
在其中一个实施例中,所述方法还包括:
在所述运行参数实测结果与所述运行参数预测结果不存在预设偏差,且所述网络数据分析任务执行正常的情况下,将所述备用资源分配到每个所述工作节点。
在其中一个实施例中,所述按照所述运行参数预测结果,对各所述网络数据分析任务进行调度,包括:
获取所述运行参数预测结果中各运行参数对应的目标权重值;
根据所述目标权重值中所体现的优先满足次序,对各所述网络数据分析任务进行调度。
在其中一个实施例中,所述获取所述运行参数预测结果中各运行参数对应的目标权重值,包括:
根据所述网络数据分析任务的业务需求,为各运行参数设定初始权重值;
根据所述网络数据分析服务网元中各项资源的占用比例,对所述初始权重值进行调整,得到所述目标权重值。
在其中一个实施例中,所述方法还包括:
获取满足所述网络数据分析任务对应请求类型的至少两个预测模型;
根据所述网络数据分析任务的特征数据对所述预测模型进行训练;
根据训练后的所述预测模型中预测准确度最高的预测模型,更新所述预测模型匹配库。
第二方面,本申请还提供了一种网络数据分析模型调度装置。所述装置包括:
请求类型确定模块,用于响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
预测模型匹配模块,用于从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
任务调度模块,用于按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
上述网络数据分析模型调度方法、装置、计算机设备、存储介质和计算机程序产品,在接收到服务请求方发起的任务请求之后,网络数据分析服务网元会确定任务请求的请求类型,然后从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型,以输出针对网络数据分析任务的运行参数预测结果,来体现完成网络数据分析任务所需的资源占用信息,最后按照运行参数预测结果,对各网络数据分析任务进行调度,基于异构模型的运行参数预测结果为网络数据分析服务网元的资源调度与任务合理编排提供更精确的依据,确保了请求对时延的要求,提升了网络、算力、存储等多类型资源的利用效率。
附图说明
图1为一个实施例中网络数据分析模型调度方法的应用环境图;
图2为一个实施例中网络数据分析模型调度方法的流程示意图;
图3为另一个实施例中网络数据分析模型调度方法的流程示意图;
图4为一个实施例中网络数据分析模型调度方法的时序图;
图5为另一个实施例中网络数据分析模型调度方法的时序图;
图6为另一个实施例中网络数据分析模型调度方法的原理示意图;
图7为一个实施例中网络数据分析模型调度装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的网络数据分析模型调度方法,可以应用于如图1所示的应用环境中。其中,服务请求方110通过网络与网络数据分析服务网元120进行通信。
其中,服务请求方110可以终端,也可以为服务器。终端包括但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
其中,网络数据分析服务网元为核心网中新增的NWDAF网元,用于接收并处理服务请求方的请求,完成相应的数据分析任务,并返回数据分析结果给服务请求方。
在一个实施例中,如图2所示,提供了一种网络数据分析模型调度方法,以该方法应用于图1中的网络数据分析服务网元120为例进行说明,包括以下步骤:
S210,响应于服务请求方针对网络数据分析任务发起的任务请求,确定任务请求的请求类型;
其中,请求类型包括请求的模型类型和任务类型,模型类型指用来处理网络数据分析任务的模型的类型,比如统计分析类、逻辑计算类、树状类、聚类类、深度网络类;任务类型为网络数据分析任务的类型,如推理类、训练类。
其中,任务请求用于请求网络数据分析服务网元分配模型来处理网络数据分析任务。
S220,从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型;
其中,预测模型匹配库中存储有请求类型和预测模型的映射关系,预测模型匹配库需要在匹配之前完成预更新。
其中,目标预测模型用于输出针对网络数据分析任务的运行参数预测结果;运行参数预测结果表征完成网络数据分析任务所需的资源占用信息。
具体地,运行参数包括但不限于完成时间、存储能力、计算能力、网络资源、内存、服务器数量等,运行参数预测结果可以为“该请求类型对应的任务经预测得到的预计完成时间为1小时、需要占用10GB的存储空间、对计算能力的最低要求是100MIPS”。
示例性地,在模型类型为统计分析类,任务类型为推理类的情况下,匹配到更新时间最近、预测准确率最高的LSTM预测模型。
S230,按照运行参数预测结果,对各网络数据分析任务进行调度。
示例性地,在利用调度算法执行任务调度之前,需要为其设定约束条件,约束条件包括各运行参数的预测值和各运行参数的优先级,因此,在产生每个任务的运行参数预测值后,需要配置每个任务的参数权重,然后调度中心结合实时的网元情况与网络环境,动态调整参数的权重,再进行多个任务间的调度与多个节点资源分配,使得每个工作节点上在时间、存储、算力等负载尽量接近。
上述网络数据分析模型调度方法中,在接收到服务请求方发起的任务请求之后,网络数据分析服务网元会确定任务请求的请求类型,然后从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型,以输出针对网络数据分析任务的运行参数预测结果,来体现完成网络数据分析任务所需的资源占用信息,最后按照运行参数预测结果,对各网络数据分析任务进行调度,基于异构模型的运行参数预测结果为网络数据分析服务网元的资源调度与任务合理编排提供更精确的依据,确保了请求对时延的要求,提升了网络、算力、存储等多类型资源的利用效率。
在一个实施例中,方法还包括:获取网络数据分析任务的运行参数实测结果;在运行参数实测结果与运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量。
其中,运行参数实测结果表征实时检测到的网络数据分析任务在执行过程中的资源占用信息。需要说明的是,运行参数实测结果的作用表现在以下方面:(1)作为实时系统资源等各方面的监控;(2)作为积累历史训练数据给预测模型进行训练,提升预测的准确度;(3)基于预测结果,确定与实际数据的偏差,识别实际情况是否与原来的预设调度有所偏差,进而根据偏差情况进行资源调整。
其中,目标节点包括网络数据分析任务所处的网络数据分析服务网元中的工作节点,具体地,若某任务对应的运行参数的预测结果存在偏差,则该任务在被执行时所处的工作节点即为目标节点。
示例性地,在核心网采用kubernetes进行资源管理的情况下,工作节点即为用于处理具体任务的node节点。
在本实施例中,首先获取网络数据分析任务的运行参数实测结果,然后在运行参数实测结果与运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量,以便能够在预期时间内完成相应任务,提升网络数据分析任务的响应速度。
在一个实施例中,方法还包括:在运行参数实测结果与运行参数预测结果不存在预设偏差,且网络数据分析任务执行正常的情况下,将备用资源分配到每个工作节点。
其中,不存在预设偏差的含义包括预测情况和实测情况相符合,网络数据分析任务执行正常的含义包括任务没有被中断或取消执行。
本实施例中,当运行参数实测结果与运行参数预测结果符合,且网络数据分析任务执行正常,从而实现了在确保各请求模型运行正常情况下,将备用资源释放,平均分发到各个节点加速运行,提升对资源的利用率,保障网元正常运作。
在上述实施例中,通过引入保障机制,避免了因预测偏差以及网络环境的变化造成请求响应不及时等现网故障,考虑到网元实际业务的影响,通过备用资源确保任务按时完成,保障现网的实时性需求,这在未来网元实际运作中具有良好的应用前景和经济效益;另外,本申请提供的网络数据分析模型调度方法,不仅充分合理利用多类资源,而且有效地保障请求服务的时延,有望进一步作为3GPP针对NWDAF部分的内容补充。
在一个实施例中,按照运行参数预测结果,对各网络数据分析任务进行调度,包括:获取运行参数预测结果中各运行参数对应的目标权重值;根据目标权重值中所体现的优先满足次序,对各网络数据分析任务进行调度。
其中,目标权重值为根据实时环境进行调整后的运行参数的权重。
示例性地,若运行参数的权重及其大小关系为:完成时间(权值:10)>存储(权值:5)>算力(权值:4)>网络资源(权值:3),表明在进行任务调度时按照完成时间、存储能力、计算能力、网络资源的顺序判断是否满足条件,以满足条件为目标开展任务调度。
本实施例中,通过获取运行参数预测结果中各运行参数对应的目标权重值,并根据目标权重值中所体现的优先满足次序,对各网络数据分析任务进行调度,明确了调度时的运行参数满足顺序,提升了调度结果对重要指标的依赖程度,提升了调度的质量。
在一个实施例中,获取运行参数预测结果中各运行参数对应的目标权重值,包括:根据网络数据分析任务的业务需求,为各运行参数设定初始权重值;根据网络数据分析服务网元中各项资源的占用比例,对初始权重值进行调整,得到目标权重值。
其中,初始权重值为在调度之前根据业务需求为每个参数预先配置的权重的初始值。
示例性地,网络数据分析任务的业务需求中,模型的完成时间是首要关注的内容,因此可在将完成时间的初始权重值设置为最大值;在实际调度过程中,可以根据存储、算力等因素进行实际调整,比如,当前网元存储较为充裕,算力资源较为短缺,则可以调整为算力>存储。
本实施例中,首先根据网络数据分析任务的业务需求,为各运行参数设定初始权重值,然后根据网络数据分析服务网元中各项资源的占用比例,对初始权重值进行调整,得到目标权重值,同时考虑到了调度前的业务需求和调度时的实测环境对权重的影响,提升了目标权重值的准确性。
在一个实施例中,方法还包括:获取满足网络数据分析任务对应请求类型的至少两个预测模型;根据网络数据分析任务的特征数据对预测模型进行训练;根据训练后的预测模型中预测准确度最高的预测模型,更新预测模型匹配库。
其中,网络数据分析任务的特征数据为用于对预测模型进行训练的数据,比如实时网络环境、数据量规模、模型参数量等特征。
本实施例中,根据请求服务所需的模型类型,通过特征数据分类构建相应的运行参数预测模型,并从中择优选择,有效避免一请求一模型的孤立建模和重复运算造成运算效率低,评估结果更加精确可靠。
另外,采用不同的预测模型分类预估海量的异构模型运行参数,一方面更加准确地评估多类异构模型的运行要求,使请求响应和资源利用率达到最高效;另一方面分类处理可节省计算和传输的资源重复开销,提高运算效率,从而实现对大规模数据请求进行实时地、准确地处理。
在另一个实施例中,如图3所示,提供了一种网络数据分析模型调度方法,以该方法应用于图1中的网络数据分析服务网元120为例进行说明,包括以下步骤:
S301,获取满足网络数据分析任务对应请求类型的至少两个预测模型;
S302,根据网络数据分析任务的特征数据对预测模型进行训练;
S303,根据训练后的预测模型中预测准确度最高的预测模型,更新预测模型匹配库;
S304,从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型;
S305,根据网络数据分析任务的业务需求,为各运行参数设定初始权重值;
S306,根据网络数据分析服务网元中各项资源的占用比例,对初始权重值进行调整,得到目标权重值;
S307,根据目标权重值中所体现的优先满足次序,对各网络数据分析任务进行调度;
S308,获取网络数据分析任务的运行参数实测结果;
S309,在运行参数实测结果与运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量;
S310,在运行参数实测结果与运行参数预测结果不存在预设偏差,且网络数据分析任务执行正常的情况下,将备用资源分配到每个工作节点。
需要说明的是,上述步骤的具体限定可以参见上文对一种网络数据分析模型调度方法的具体限定,在此不再赘述。
在一个实施例中,模型调度方法按照接收到的任务先后顺序执行,在多模型推理与训练任务的场景下,按顺序执行任务往往导致模型一旦运行则需要结束后才能让出资源,容易使得计算资源被大体量模型长时间占用,而优先级高的小体量模型需要等待较长时间,从而无法及时完成推理任务;在另一个实施例中,模型调度方法通过手工配置模型运行参数的经验值来完成调度,通过手工配置模型运行参数,配置后的参数无法实时修改,灵活性较差,无法适用于实时变化的网络环境。
此外,上述两个实施例中的模型调度方法,缺少考量任务模型的结构和复杂程度等因素的差异,往往导致网元的资源利用与分配不均,加之没有加以考虑实际网络环境的变化情况,无法对突发的情况做应对与保障措施,导致无法对任务进行高效调度,从而使得资源的利用效率较低。
基于此,本申请提出了一种网络数据分析模型调度方法,针对NWDAF网元面临大规模分析请求所引起的海量模型的训练与推理对资源、带宽以及时延上的压力,结合网络环境、网元负载情况与业务情况进行参数重要性调整,针对异构模型对网络、算力、内存等资源的预估要求差异,科学、合理、准确、充分地分配与调度NWDAF网元内部的多类资源,将多异构模型推理和训练任务进行组合编排,多维度权衡并行调度,确保不同节点上的任务负载尽量接近,且并行任务可以在同一时刻完成,有效提高资源利用率,满足请求的实时应答。通过NWDAF内部的异构模型调度模块和偏差保障预期模块,实现对网络分析请求的高效响应以及网络、算力、存储等多类型资源的充分利用。
为了便于本领域技术人员的理解,图4实例性提供了一个网络数据分析模型调度方法的时序图;如图4所示,当NWDAF用户发送通信流量预测的推理请求到NWDAF调度中心,NWDAF调度中心识别该分析请求的模型类型,得到该请求的模型为xgboost(eXtremeGradient Boosting,极致梯度提升),属于树状模型的推理任务,NWDAF单位网元则调取树状模型的运行参数预测模型进行推理任务的预测,将此请求任务的参数预测值以及参数的重要性排序发送到NWDAF调度中心,NWDAF调度中心结合实时的网元情况与网络环境,调整参数重要性,基于任务的运行参数预测值进行多个任务间的调度与多个节点资源分配。
在调度的同时,发送检测保障请求到NWDAF保障中心,启动任务检测,当检测到实际运行与预期情况出现偏差时,发送异常通知到调度中心,由调度中心启动备用资源到对应的节点进行资源扩容与动态调整,保证任务的按时完成,最终将分析结果返回给NWDAF用户。
为了便于本领域技术人员的理解,图5实例性提供了另一个网络数据分析模型调度方法的时序图;如图5所示,当NWDAF用户发送网元负载分析的训练请求到NWDAF调度中心,NWDAF调度中心识别该分析请求的模型类型,得到该请求的模型为LSTM(Long Short-Term Memory,长短期记忆网络),属于深度学习类的训练任务,NWDAF单位网元则调取深度学习类模型的运行参数预测模型进行训练任务的预测,将此请求任务的参数预测值以及参数的重要性排序发送到NWDAF调度中心,NWDAF调度中心结合实时的网元情况与网络环境,调整参数重要性,基于任务的运行参数预测值进行多个任务间的调度与多个节点资源分配。
在调度的同时,发送检测保障请求到NWDAF保障中心,启动任务检测,当检测与实际运行符合预期时,发送正常通知到调度中心,由NWDAF调度中心将备用资源平均到每个工作节点上,加速任务的完成,最终将分析结果返回给NWDAF用户。
下面参考图6,以一个具体的实施例详细描述网络数据分析模型调度方法。值得理解的是,下述描述仅是示例性说明,而不是对申请的具体限制。
如图6所示,本申请提供的网络数据分析模型调度方法,包括步骤1至步骤6,具体为:
步骤1:NWDAF网元接收消费者发送的分析服务请求;
步骤2:NWDAF网元识别服务请求是否需要模型的支持;若需要,则进入步骤3,否则,进入步骤6;
步骤3:进入NWDAF网元内部的异构模型的调度与分配;
(1)进入模型池,根据模型的结构与请求类型进行识别与分类;
(2)匹配与模型类型、任务类型相应的预测模型,结合实时的网络与网元环境,进行运行参数的实时预测;
步骤4:结合实时网络环境和网元情况,预留备用资源以及调整参数重要性,基于运行参数的实时预测值,将推理和训练多异构模型任务进行组合编排和并行调度,保证节点间的任务负载均衡,且并行任务在同一时刻完成;
步骤5:在运行前期,做模型任务的偏差检测,识别是否与预期情况相符;
(1)若与预期出现偏差时,启动备用资源动态对应节点的进行扩容与调整;
(2)若一切运行正常,则将释放备用资源到各节点加速运行;
步骤6:将分析结果按时发送到消费者。
其中,在步骤3的模型与任务的分类识别过程中,模型的分类的依据可以是模型的结构,如根据模型结构的不同将模型分为统计分析类、逻辑计算类、树状类、聚类类、深度网络类等类型;具体地,统计分析类包括3sigma、T检验等模型;树状类包括决策树、xgboost等模型;聚类类包括kmeans、SMO、密度聚类等模型;深度网络类包括LSTM、CNN等模型。任务的分类可以根据请求的类型,分为推理类、训练类等,具体地,在图4中,An_M1表示推理模型1,MT_M2表示训练模型2。
其中,在步骤3的预测模型的匹配过程中,“模型类型和任务类型”与“预测模型”是一对一的固定映射关系,该映射关系可以在一定时间后进行更新,也可以在模型重新训练后更新。
其中,在步骤3的运行参数的预测分析过程中,对于步骤3中不同类型的模型任务请求,分别建立不同的预测模型对运行参数进行预测评估,如图4所示,X表示输入项,可包括但不局限于数据规模、模型的复杂度、参数多少、模型类型等;Y表示运行参数的预测值,可包括但不局限于模型的运算开销、存储、算力、网络资源以及所需时间等;预测模型可包括但不局限于LSTM、xgboost等回归型数值预测。
具体地,以模型类型为统计分析类、任务类型为推理类为例,通过收集多个任务的数据通过对多个任务的特征数据训练多个预测模型,通过预测准确性选择最优的模型作为该类任务的最终预测模型,将训练出来的多个预测模型按照准确性排序,选取准确度最高作为该类模型任务请求的最终预测模型。
其中,在步骤4的多模型并行调度过程中,根据模型间的差异性,将任务分为多种类型,对于不同的任务类型,需要采集和检测不同的运行参数,根据运行参数对请求的重要程度依次优先满足,再通过调度算法,如SJF、SRTF等,确保不同的工作节点上在时间、存储、算力等负载尽量接近。在这种设计下,每个工作节点上的任务数量可能不同,执行的模型任务也各有差异,但总的需要时间会更加接近,因此并行任务可以在几乎同一时刻完成,保证满足请求对时间的要求。
具体地,任务的类型包括但不限于深度学习模型训练任务、机器学习训练任务、传统统计计算任务、深度学习模型推理任务、机器学习推理任务、统计推理任务、统计分析任务。
具体地,不同的任务类型需要采集和检测不同的运行参数。比如,对于训练类的深度学习任务,考虑到任务受到通用算力、智能算力等因素的影响,我们需要获取其模型任务运行对内存大小、GPU能力的开销、GPU服务器计算能力、服务器能耗水平、网络功耗条件、存储容量等数据进行采集与预测分析;对于推理类的机器学习任务,考虑任务受到网络、算力效果等因素的影响,我们可以获取网络性能水平、存储系统性能水平、网络基础功耗、CPU利用率、存储容量、地理距离等运行参数和数据进行采集与预测分析。
具体地,运行参数的权值可以表示为:完成时间(权值:10)>存储(权值:5)>算力(权值:4)>网络资源(权值:3)>=内存(权值:2)>=硬件服务器(权值:2)>=GPU能力(权值:2)。
具体地,运行参数的权值可以根据业务的需求、任务对时间的紧急程度、实时的网元情况和网络环境进行配置与调整。一般来说,NWDAF网元对服务请求的第一要素是模型的完成时间,其他如存储、算力等因素可以根据当前的网元资源的实际使用情况与空闲状态做相应的重要性调整。例如,当前网元存储较为充裕,算力资源较为短缺,则可以调整为算力>存储等。
其中,在步骤5的偏差检测识别与保障过程中,由于网元自身资源以及网络环境实时地变化,容易导致运行参数的预测结果与实际运行情况出现偏差,对NWDAF网元服务的提供和正常的运作会造成严重的影响,因此需要引入偏差检测识别与保障机制,具体的机制内容可以为:(1)若检测出实际与预测值出现偏差时,立刻启动备用资源,动态对相应节点的资源进行扩容与调整;(2)若与预期相符且任务运行正常,则将释放备用资源到各节点加速运行。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的网络数据分析模型调度方法的网络数据分析模型调度装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个网络数据分析模型调度装置实施例中的具体限定可以参见上文中对于网络数据分析模型调度方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种网络数据分析模型调度装置,包括:请求类型确定模块701、预测模型匹配模块702、任务调度模块703,其中:
请求类型确定模块701,用于响应于服务请求方针对网络数据分析任务发起的任务请求,确定任务请求的请求类型;任务请求用于请求网络数据分析服务网元分配模型来处理网络数据分析任务;
预测模型匹配模块702,用于从预更新的预测模型匹配库中,匹配得到与请求类型对应的目标预测模型;目标预测模型用于输出针对网络数据分析任务的运行参数预测结果;运行参数预测结果表征完成网络数据分析任务所需的资源占用信息;
任务调度模块703,用于按照运行参数预测结果,对各网络数据分析任务进行调度。
在一个实施例中,装置还用于:获取网络数据分析任务的运行参数实测结果;运行参数实测结果表征实时检测到的网络数据分析任务在执行过程中的资源占用信息;在运行参数实测结果与运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量;目标节点包括网络数据分析任务所处的网络数据分析服务网元中的工作节点。
在一个实施例中,装置还用于:在运行参数实测结果与运行参数预测结果不存在预设偏差,且网络数据分析任务执行正常的情况下,将备用资源分配到每个工作节点。
在一个实施例中,任务调度模块还用于:获取运行参数预测结果中各运行参数对应的目标权重值;根据目标权重值中所体现的优先满足次序,对各网络数据分析任务进行调度。
在一个实施例中,任务调度模块还用于:根据网络数据分析任务的业务需求,为各运行参数设定初始权重值;根据网络数据分析服务网元中各项资源的占用比例,对初始权重值进行调整,得到目标权重值。
在一个实施例中,装置还用于:获取满足网络数据分析任务对应请求类型的至少两个预测模型;根据网络数据分析任务的特征数据对预测模型进行训练;根据训练后的预测模型中预测准确度最高的预测模型,更新预测模型匹配库。
上述网络数据分析模型调度装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储模型及相关数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网络数据分析模型调度方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种网络数据分析模型调度方法,其特征在于,所述方法包括:
响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述网络数据分析任务的运行参数实测结果;所述运行参数实测结果表征实时检测到的所述网络数据分析任务在执行过程中的资源占用信息;
在所述运行参数实测结果与所述运行参数预测结果存在预设偏差的情况下,采用备用资源扩大目标节点的资源容量;所述目标节点包括所述网络数据分析任务所处的所述网络数据分析服务网元中的工作节点。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在所述运行参数实测结果与所述运行参数预测结果不存在预设偏差,且所述网络数据分析任务执行正常的情况下,将所述备用资源分配到每个所述工作节点。
4.根据权利要求1所述的方法,其特征在于,所述按照所述运行参数预测结果,对各所述网络数据分析任务进行调度,包括:
获取所述运行参数预测结果中各运行参数对应的目标权重值;
根据所述目标权重值中所体现的优先满足次序,对各所述网络数据分析任务进行调度。
5.根据权利要求4所述的方法,其特征在于,所述获取所述运行参数预测结果中各运行参数对应的目标权重值,包括:
根据所述网络数据分析任务的业务需求,为各运行参数设定初始权重值;
根据所述网络数据分析服务网元中各项资源的占用比例,对所述初始权重值进行调整,得到所述目标权重值。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述方法还包括:
获取满足所述网络数据分析任务对应请求类型的至少两个预测模型;
根据所述网络数据分析任务的特征数据对所述预测模型进行训练;
根据训练后的所述预测模型中预测准确度最高的预测模型,更新所述预测模型匹配库。
7.一种网络数据分析模型装置,其特征在于,所述装置包括:
请求类型确定模块,用于响应于服务请求方针对网络数据分析任务发起的任务请求,确定所述任务请求的请求类型;所述任务请求用于请求网络数据分析服务网元分配模型来处理所述网络数据分析任务;
预测模型匹配模块,用于从预更新的预测模型匹配库中,匹配得到与所述请求类型对应的目标预测模型;所述目标预测模型用于输出针对所述网络数据分析任务的运行参数预测结果;所述运行参数预测结果表征完成所述网络数据分析任务所需的资源占用信息;
任务调度模块,用于按照所述运行参数预测结果,对各所述网络数据分析任务进行调度。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310871317.1A CN116896591A (zh) | 2023-07-17 | 2023-07-17 | 网络数据分析模型调度方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310871317.1A CN116896591A (zh) | 2023-07-17 | 2023-07-17 | 网络数据分析模型调度方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116896591A true CN116896591A (zh) | 2023-10-17 |
Family
ID=88310430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310871317.1A Pending CN116896591A (zh) | 2023-07-17 | 2023-07-17 | 网络数据分析模型调度方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116896591A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117937474A (zh) * | 2024-03-20 | 2024-04-26 | 保定博堃元信息科技有限公司 | 一种新能源场站储能管理方法及系统 |
-
2023
- 2023-07-17 CN CN202310871317.1A patent/CN116896591A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117937474A (zh) * | 2024-03-20 | 2024-04-26 | 保定博堃元信息科技有限公司 | 一种新能源场站储能管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114721833B (zh) | 一种基于平台业务类型的智能云端协调方法和装置 | |
CN107404523A (zh) | 云平台自适应资源调度系统和方法 | |
CN113037877B (zh) | 云边端架构下时空数据及资源调度的优化方法 | |
CN105700948A (zh) | 一种用于在集群中调度计算任务的方法与设备 | |
CN117909083B (zh) | 一种分布式云容器资源调度方法及系统 | |
CN114915630A (zh) | 基于物联网设备的任务分配方法、网络训练方法及装置 | |
CN115220916B (zh) | 视频智能分析平台的自动算力调度方法、装置及系统 | |
CN109960573A (zh) | 一种基于智能感知的跨域计算任务调度方法及系统 | |
CN116896591A (zh) | 网络数据分析模型调度方法、装置和计算机设备 | |
CN117972367B (zh) | 一种数据存储预测方法、数据存储子系统及智能计算平台 | |
CN116974470A (zh) | 数据迁移方法、装置、设备及存储介质 | |
CN117290090A (zh) | 节点协同资源分配方法、装置、设备及存储介质 | |
CN116866440B (zh) | 一种集群节点选择调度方法、装置、电子设备和存储介质 | |
CN117687774A (zh) | 用于算力调度的任务模型训练方法及算力调度方法和系统 | |
CN117149382A (zh) | 虚拟机调度方法、装置、计算机设备和存储介质 | |
Guo | Ant colony optimization computing resource allocation algorithm based on cloud computing environment | |
CN114978913B (zh) | 一种基于切链的服务功能链跨域部署方法及系统 | |
CN115904708A (zh) | 一种ai平台动态加权调度方法、装置及存储介质 | |
CN118170550B (zh) | Node节点水位线阈值调节方法、装置及相关设备 | |
CN117724853B (zh) | 基于人工智能的数据处理方法及装置 | |
CN117707797B (zh) | 基于分布式云平台的任务调度方法、装置及相关设备 | |
CN118502918A (zh) | 基于人工智能的工作流智能化管理系统 | |
RU162899U1 (ru) | Модель управления сервисами информационной системы | |
CN117215777A (zh) | 算力调度方法和装置 | |
CN117435621A (zh) | 基于电网服务平台的信息应答方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |