CN114996010B - 面向移动边缘环境下的智能服务保障方法 - Google Patents
面向移动边缘环境下的智能服务保障方法 Download PDFInfo
- Publication number
- CN114996010B CN114996010B CN202210632812.2A CN202210632812A CN114996010B CN 114996010 B CN114996010 B CN 114996010B CN 202210632812 A CN202210632812 A CN 202210632812A CN 114996010 B CN114996010 B CN 114996010B
- Authority
- CN
- China
- Prior art keywords
- model
- layer
- candidate
- target
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 239000011159 matrix material Substances 0.000 claims abstract description 193
- 238000012795 verification Methods 0.000 claims description 91
- 238000012549 training Methods 0.000 claims description 47
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013508 migration Methods 0.000 description 31
- 230000005012 migration Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 8
- 238000013136 deep learning model Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了面向移动边缘环境下的智能服务保障方法,其中,对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵;判断目标相对熵是否小于为所述候选模型配置的超参数阈值;若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。采用上述方法,通过将候选模型中差异度较小的两个隐藏层所共同包含的目标模型层从候选模型中删除,有利于减小模型运行时所占用的运行空间。
Description
技术领域
本发明涉及服务计算及人工智能领域,具体而言,涉及面向移动边缘环境下的智能服务保障方法。
背景技术
如今,深度学习模型被广泛应用于各种应用中以对数据进行处理和预测,现有技术中,通常会将模型上传至服务器中,以实现直接在服务器中使用模型进行数据处理。
发明人在研究中发现,由于模型包括大量的计算参数,容易导致在将模型布置于服务器中时,出现由于模型运行时需要较大运行空间,而服务器无法提供足够的计算资源导致模型无法正常运行的情况。
发明内容
有鉴于此,本发明的目的在于提供面向移动边缘环境下的智能服务保障方法,有利于减小模型运行时的运行空间。
第一方面,本申请实施例提供了面向移动边缘环境下的智能服务保障方法,所述方法包括:
对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果;
判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层;
若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
可选地,在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,所述方法还包括:
若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果;
将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果;
判断所述模型准确率是否大于等于第一预设阈值;
若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
可选地,在判断所述模型准确率是否大于等于第一预设阈值后,所述方法还包括:
若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
可选地,在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,所述方法还包括:
使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型;
对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果;
判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层;
若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证;
若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
第二方面,本申请实施例提供了面向移动边缘环境下的智能服务保障装置,所述装置包括:
候选相对熵确定单元,用于对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果;
目标相对熵判断单元,用于判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层;
目标模型确定单元,用于若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
可选地,所述装置还包括:
验证输出结果确定单元,用于在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果;
模型准确率确定单元,用于将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果;
模型准确率判断单元,用于判断所述模型准确率是否大于等于第一预设阈值;
合格模型确定单元,用于若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
可选地,所述装置还包括:
候选模块训练单元,用于在判断所述模型准确率是否大于等于第一预设阈值后,若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
可选地,所述装置还包括:
第二候选模型确定单元,用于在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型;
第二候选相对熵确定单元,用于对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果;
第二目标相对熵判断单元,用于判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层;
第二模型准确率确定单元,用于若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证;
第二合格模型确定单元,用于若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可选地实施方式中所述的面向移动边缘环境下的智能服务保障方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可选地实施方式中所述的面向移动边缘环境下的智能服务保障方法的步骤。
本申请提供的技术方案包括但不限于以下有益效果:
首先,根据候选模型中的每两个相邻模型层之间的隐藏层矩阵的矩阵值确定出每两个相邻隐藏层矩阵之间的散度,由于隐藏层矩阵为将模型输入层的输出输入至相邻模型输入层的输入结果,所以对于每两个相邻隐藏层矩阵之间的散度,该两个相邻隐藏层矩阵之间的散度可以表示两个相邻输入结果之间的差异度,也就是三个相邻模型层中的第一模型层输入至第二模型层的输入结果和第二模型层输入至第三模型层的输入结果之间的差异度,通过上述步骤,可以确定出候选模型中的每两个相邻输入结果之间的差异度,以使能够根据上述每两个相邻输入结果之间的差异度对输入结果包含的模型层的必要性进行确定。
在得到候选模型中的每两个相邻隐藏层矩阵之间的相对熵后,选取出最小相对熵与为该候选模型配置的超参数阈值进行比较,以确定差异度最小的两个隐藏层矩阵的差异程度是否满足预设要求,通过上述步骤,确定出差异度最小的两个相邻隐藏层矩阵,并对该两个相邻隐藏层矩阵的差异程度进行判断,能够确保该两个相邻隐藏层矩阵之间的差异程度满足对模型进行压缩时需要达到的条件。
最后将达到对模型进行压缩的条件的两个相邻隐藏层共同包含的模型层进行删除,采用上述方法,在保证每两个模型层之间的差异度较小的前提下,也就是压缩后的模型能够达到压缩前的模型的相同效果的基础上,有利于减小模型运行时所占用的运行空间。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例一所提供的面向移动边缘环境下的智能服务保障方法的流程图;
图2示出了本发明实施例一所提供的一种目标模型确定方法的示意图;
图3示出了本发明实施例一所提供的一种合格模型确定方法的流程图;
图4示出了本发明实施例一所提供的一种第二合格模型确定方法的流程图;
图5示出了本发明实施例一所提供的一种智能服务保障系统的结构示意图;
图6示出了本发明实施例一所提供的一种服务数据迁移方法的流程图;
图7示出了本发明实施例一所提供的一种智能服务启动方法的流程图;
图8示出了本发明实施例一所提供的一种智能服务保障系统的总体结构图;
图9示出了本发明实施例二所提供的面向移动边缘环境下的智能服务保障装置的结构示意图;
图10示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图;
图11示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图;
图12示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图;
图13示出了本发明实施例三所提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
为便于对本申请进行理解,下面结合图1示出的本发明实施例一所提供的面向移动边缘环境下的智能服务保障方法的流程图描述的内容对本申请实施例一进行详细说明。
参见图1所示,图1示出了本发明实施例一所提供的面向移动边缘环境下的智能服务保障方法的流程图,所述方法包括步骤S101~S103:
S101:对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果。
具体的,在需要对候选模型进行模型压时,首先遍历候选模型中的每两个相邻模型层之间的隐藏层:当该候选模型有n个模型层时,由于每两个相邻的模型层之间存在一个隐藏层,所以可以得到n-1个隐藏层。
当当前模型层为第i层模型层时,第i-1层为第i层的前一层,也就是与第i层相邻的更靠近第一层模型层的模型层,第i+1层为第i层的后一层,也就是与第i层相邻的更靠近最后一层模型层的模型层;第i-1层和第i层模型层之间存在一个隐藏层(第i-1层隐藏层),该隐藏层对应一个隐藏层矩阵(第i-1层隐藏层矩阵),第i-1层隐藏层矩阵用于表征第i-1层输出到第i层的结果,包含第i-1层的输出结果(也就是第i层的输入);第i层和第i+1层模型层之间存在一个隐藏层(第i层隐藏层),该隐藏层对应一个隐藏层矩阵(第i层隐藏层矩阵),第i层隐藏层矩阵用于表征第i层输出到第i+1层的结果,包含第i层的输出结果(也就是第i+1层的输入)。
根据第i-1层隐藏层矩阵中的矩阵值和第i层隐藏层矩阵中的矩阵值,利用KL散度(Kullback-Leibler散度)算法计算第i-1层隐藏层矩阵和第i层隐藏层矩阵之间的KL散度(也就是相对熵),用于描述第i-1层隐藏层矩阵和第i层隐藏层矩阵之间的差异度。
S102:判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层。
具体的,每个候选模型都有自己归属于的模型类别,例如自然语言处理模型,神经网络分类模型等,针对每个模型类别,都会为其预先配置超参数阈值,即在开始学习过程之前设置值的参数阈值,用于判断目标相对熵归属于的相邻两个隐藏层之间的差异度是否满足要求。
在通过步骤S101计算得到每两个相邻隐藏层之间的候选相对熵后(第i-1层隐藏层和第i层隐藏层之间的相对熵),选取所有候选相对熵中的具有最小数值的候选相对熵作为目标相对熵,并将该目标相对熵与根据该候选模型的模型类别为该候选模型配置的超参数阈值进行比较,判断目标相对熵是否小于为所述候选模型配置的超参数阈值。
S103:若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
具体的,若所述目标相对熵的数值小于超参数阈值,且仅存在一个所述目标相对熵对应的候选模型层,则将该候选模型层作为目标模型层从候选模型中删除,以得到由剩余模型层组成的目标模型;若所述目标相对熵的数值小于超参数阈值,且同时存在两个或两个以上与所述目标相对熵对应的候选模型层,则选取更靠近第一层模型层的候选模型层(也就是第i层模型层中的i值更小的模型层)作为目标模型层,并将该目标模型层从候选模型中删除,以得到由剩余模型层组成的目标模型。
为了更好的说明本申请实施例一所提供的面向移动边缘环境下的智能服务保障方法,在这里举一个具体的实例对目标模型的确定过程进行说明,参见图2所示,图2示出了本发明实施例一所提供的一种目标模型确定方法的示意图,其中,假设候选模型中包括4个候选模型层和3个隐藏层,分别为第一层模型层、第二层模型层、第三层模型层和第四层模型层,第一层模型层和第二层模型层之间存在第一层隐藏层、第二层模型层和第三层模型层之间存在第二层隐藏层、第三层模型层和第四层模型层之间存在第三层隐藏层,在得到目标模型层时包括三个步骤:
步骤一:根据第一层隐藏层的隐藏层矩阵的矩阵值和第二层隐藏层的隐藏层矩阵的矩阵值计算第一层隐藏层矩阵和第二层隐藏层矩阵之间的第一相对熵,根据第二层隐藏层的隐藏层矩阵的矩阵值和第三层隐藏层的隐藏层矩阵的矩阵值计算第二层隐藏层矩阵和第三层隐藏层矩阵之间的第二相对熵。
步骤二:判断第一相对熵和第二相对熵哪个为最小相对熵,当第一相对熵小于第二相对熵时,由于所述第一相对熵是所有相对熵中的最小相对熵,所以判断第一相对熵是否小于为该候选模型配置的超参数阈值。
步骤三:若该第一相对熵小于该超参数阈值,则将具有第一相对熵的第一层隐藏层矩阵和第二层隐藏层矩阵共同包含的第二层模型层进行删除,即删除第二层模型层,然后将第一层模型层和第三层模型层进行连接,以得到不包含第二层模型层的,由第一层模型层、第三层模型层和第四层模型层组成的目标模型层。
散度(相对熵)是一种估计矩阵和矩阵之间相似度的损失函数,具有越小相对熵的两个矩阵之间的差异度越小,相似度越高;为了将模型进行轻量化处理,需要降低模型层密度(可以从减小模型层数量实现);而由多个模型层组合后对数据进行处理,达到某个数据处理结果时,多个模型层中的模型层数量越多,模型层越密集,意味这几个模型层之间的相似度越高,在这个基础上,将满足预设条件的,且与前后两层模型层越相似的模型层进行删除后得到的目标模型相对于将相似度跨度较大的模型层进行删除后得到的目标模型,能够最大限度的保证模型中所有模型层之间的整体相似度在轻量化后损失较小,保证模型尽可能的具有与轻量化前的同等效果的数据处理功能。
在一个可行的实施方案中,参见图3所示,图3示出了本发明实施例一所提供的一种合格模型确定方法的流程图,其中,在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,所述方法还包括步骤S301~S304:
S301:若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果。
具体的,在步骤S103判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,若所述目标相对熵大于等于所述超参数阈值,则说明如果对当前的候选模型进行目标模型层删除后,会由于模型层之间的差异度太大,从而导致无法实现同等效果的数据处理结果的情况,所以不能够将目标模型层从所述候选模型中进行删除。
为了验证未进行模型层删除的候选模型的准确率,将将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果,其中,所述至少一个模型验证样本包括但不限于为专门的用于对模型准确率进行验证的模型验证样本集中的验证样本。
S302:将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果。
具体的,统计所有验证输出结果中的与预设的验证标准结果相同的验证输出结果的数量,并将该数量与所有验证输出结果中的验证输出结果的数量相除,其中,预设的验证标准结果可以被提前存储于模型验证样本集中,与验证样本相对应。
S303:判断所述模型准确率是否大于等于第一预设阈值。
具体的,由于模型准确率是用于判断模型是否能够按照预期实现数据预测的衡量指标,准确率越高说明模型对数据的预测越准确,准确率越低说明模型对数据的预测越不准确,所以可以提前根据需求预设一个用于评判模型预测数据准确度的阈值,将计算得到的模型准确率与该阈值进行比较。
S304:若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
具体的,若所述模型准确率大于等于所述第一预设阈值,表明该模型在对数据进行预测的准确度上满足用户需求,则可以将该模型作为能够用于对数据进行预测的合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
在需要使用模型对数据进行处理时,需要考虑该模型的准确率,如果使用准确率不达标的模型对数据进行预测,可能会出现预测不准的情况,所以需要提前使用验证样本对模型的准确率进行验证,以确保实际投入使用的模型的准确率达标,能够准确的对数据进行预测。
在一个可行的实施方案中,在判断所述模型准确率是否大于等于第一预设阈值后,所述方法还包括:
若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
具体的,在步骤S303判断所述模型准确率是否大于等于第一预设阈值后,若所述模型准确率小于所述第一预设阈值,则说明模型还无法按照预期进行数据处理(模型还未达到收敛条件),则需要使用训练样本集中的训练样本对模型进行再一次训练,使用验证样本对再一次训练后得到的模型的模型准确率进行确定,若还不大于等于第一预设阈值,则重复上述训练-验证-准确率比较的过程,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
或者,在步骤S303判断所述模型准确率是否大于等于第一预设阈值后,若所述模型准确率小于所述第一预设阈值,根据模型准确率与第一预设阈值之间的相差值对候选模型的训练次数进行确定,其中,相差值和训练次数成正比,相差值和训练次数的对应关系被提前存储于数据库中;例如,当第一预设阈值为80%时,若当前模型准确率为50%,则相差值为30%,利用查询数据库得到的“30%-3轮训练”的预设信息,可以使用训练样本对该模型再进行3轮训练;若当前模型准确率为70%,则相差值为10%,利用查询数据库得到的“10%-1轮训练”的预设信息,可以使用训练样本对该模型再进行1轮训练。
对尚未训练完成的模型进行再次训练,可以提高模型对数据的处理准确度。
在一个可行的实施方案中,参见图4所示,图4示出了本发明实施例一所提供的一种第二合格模型确定方法的流程图,其中,在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,所述方法还包括步骤S401~S405:
S401:使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型。
S402:对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果。
S403:判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层。
S404:若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证。
S405:若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
具体的,在步骤S103将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,对目标模型按照步骤S401~S405的处理方式进行模型层的删除和模型准确率的判断,直至得到能够用于对数据进行数据预测的第二合格模型。
本申请在判断模型是否需要进行压缩(删除模型层)时,会得到两种情况分别对应两种处理方法,第一是模型不需要压缩,则根据模型的准确率判断模型是否还需要再训练,第二是模型需要压缩,则将指定的模型层进行删除后,再判断压缩后的模型是否需要再压缩,若不需要再压缩,则根据模型的准确率判断模型是否还需要再训练,若需要再压缩,则将指定的模型层进行删除,直至不需要再压缩后根据模型的准确率判断模型是否还需要再训练;在上述两种情况后进行的判断模型是否还需要再训练,若模型需要再训练则使用训练样本对模型进行训练,若模型不需要再训练则将模型进行保存,以在其他应用环境对数据进行处理。
除此之外,本申请还提供了一种智能服务保障系统,所述智能服务保障系统在对模型进行确认时使用到本申请实施例一所提供的面向移动边缘环境下的智能服务保障方法,参见图5所示,图5示出了本发明实施例一所提供的一种智能服务保障系统的结构示意图,其中,所述一种智能服务保障系统500包括区块链网络模块501、IPFS分布式存储模块502、网络模块503、迁移模块504、校验模块505、数据管理模块506和监控模块507,模块之间的连接方式参见图5所示。
所述区块链网络模块501,用于存储服务产生的重要数据。
IPFS分布式存储模块502,所述IPFS(Inter Planetary File System,星际文件系统)分布式存储模块用于存储服务迁移过程中产生的占用内存较大的文件,如服务进程和数据的迁移数据文件、移动终端用户的重要文件等。
网络模块503,用于与IPFS分布式存储模块和区块链网络进行交互。
迁移模块504,用于将服务迁移到新的边缘服务器上。
校验模块505,用于负责计算迁移后的迁移数据文件唯一标识,并与区块链上记录的唯一标识进行比对。
数据管理模块506,用于将边缘服务器上的数据整合处理。
监控模块507,用于监控服务正常运行期间及迁移前后的服务运行状态。
所述区块链网络模块、IPFS分布式存储模块、网络模块、迁移模块、校验模块、数据管理模块和监控模块在所述智能服务保障系统中实现对待迁移服务的迁移数据文件进行服务数据迁移时,参见图6所示,图6示出了本发明实施例一所提供的一种服务数据迁移方法的流程图,其中,所述一种服务数据迁移方法包括步骤S601~S606:
S601:服务迁移前,迁移模块生成待迁移服务的迁移数据文件,即保存了服务进程的迁移数据文件,如通过CRIU(一个软件工具)检查点技术生成的检查点数据。
S602:网络模块将上述迁移数据文件上传至IPFS模块,获取唯一的哈希值,将该哈希值、迁移数据文件的唯一标识(校验码)及服务运行数据文件上传至到区块链节点,区块链共识节点对区块进行共识,将达成共识的新区块写入区块链。
S603:进行正常的服务迁移过程。
S604:服务迁移结束后,校验模块计算迁移数据文件的唯一标识,判断迁移数据文件的唯一标识与区块链上存储的校验值是否一致,若校验码与区块链上的校验值不一致,则继续步骤S605~S607,若校验码与区块链上的校验值一致,则直接继续步骤S607。
S605:从区块链上获取到迁移数据文件的哈希值,通过该哈希值从IPFS中获取完整的迁移数据文件,重新解析该文件,恢复服务的运行。
S606:网络模块从链上获取服务运行数据文件,并与本地服务运行数据进行对比,确保数据的一致性。
S607:结束服务迁移。
在所述智能服务保障系统中实现所述面向移动边缘环境下的智能服务保障方法和所述一种服务数据迁移方法之前,需要启动所述智能服务,参见图7所示,图7示出了本发明实施例一所提供的一种智能服务启动方法的流程图,其中,所述一种智能服务启动方法包括步骤S701~S704:
S701:部署Kubernetes系统(一种用于管理云平台中多个主机上的容器化的应用)到边缘环境。
S702:在Kubernetes系统中安装Prometheus监控(一种开源的系统监控和报警系统)组件。
S703:部署深度学习模型轻量化服务,并启用服务迁移保障机制所需的区块链网络。
S704:深度学习模型轻量化服务和服务迁移保障机制都封装为docker(一个开源的应用容器引擎)镜像,在需要时通过Kubernetes的服务发现技术和负载均衡技术动态的在合适的节点启动并提供服务。
也就是说,所述智能服务保障系统中同时部署了所述面向移动边缘环境下的智能服务保障方法、所述一种服务数据迁移方法和所述一种智能服务启动方法,参见图8所示,图8示出了本发明实施例一所提供的一种智能服务保障系统的总体结构图,所述智能服务保障系统中包括至少一个边缘节点,一个Kubernetes主节点和一个镜像仓库,所述Kubernetes主节点中运行有服务迁移保障机制、服务发现机制和Prometheus监控,所述镜像仓库中部署运行深度学习模型轻量化服务以及其他需要部署的服务,其中,边缘节点通过Kubernetes的服务发现机制获取所需提供的服务镜像并部署在节点中提供服务,Prometheus通过在http(Hyper Text Transfer Protocol,超文本传输协议)实时获取每个节点中各个服务的资源使用情况,当需要进行服务迁移时,服务迁移保障机制就会启动,为服务迁移进行保障,当需要应用深度学习模型轻量化服务时,就会从镜像仓库拉取该服务镜像进行部署,并使用该服务对深度学习模型进行压缩,压缩后的模型可以部署到边缘节点提供对应的服务。
实施例二
参见图9所示,图9示出了本发明实施例二所提供的面向移动边缘环境下的智能服务保障装置的结构示意图,其中,如图9所示,本发明实施例二所提供的面向移动边缘环境下的智能服务保障装置900包括:
候选相对熵确定单元901,用于对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果;
目标相对熵判断单元902,用于判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层;
目标模型确定单元903,用于若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
在一个可行的实施方案中,参见图10所示,图10示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图,其中,如图10所示,本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置1000还包括:
验证输出结果确定单元1001,用于在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果;
模型准确率确定单元1002,用于将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果;
模型准确率判断单元1003,用于判断所述模型准确率是否大于等于第一预设阈值;
合格模型确定单元1004,用于若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
在一个可行的实施方案中,参见图11所示,图11示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图,其中,如图11所示,本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置1100还包括:
候选模块训练单元1101,用于在判断所述模型准确率是否大于等于第一预设阈值后,若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
在一个可行的实施方案中,参见图12所示,图12示出了本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置的结构示意图,其中,如图12所示,本发明实施例二所提供的另一种面向移动边缘环境下的智能服务保障装置1200还包括:
第二候选模型确定单元1201,用于在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型;
第二候选相对熵确定单元1202,用于对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果;
第二目标相对熵判断单元1203,用于判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层;
第二模型准确率确定单元1204,用于若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证;
第二合格模型确定单元1205,用于若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
实施例三
基于同一申请构思,参见图13所示,图13示出了本发明实施例三所提供的一种计算机设备的结构示意图,其中,如图13所示,本申请实施例三所提供的一种计算机设备1300包括:
处理器1301、存储器1302和总线1303,所述存储器1302存储有所述处理器1301可执行的机器可读指令,当计算机设备1300运行时,所述处理器1301与所述存储器1302之间通过所述总线1303进行通信,所述机器可读指令被所述处理器1301运行时执行上述实施例一所示的面向移动边缘环境下的智能服务保障方法的步骤。
实施例四
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例中任一项所述的面向移动边缘环境下的智能服务保障方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例所提供的进行面向移动边缘环境下的智能服务保障方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本发明实施例所提供的面向移动边缘环境下的智能服务保障装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种面向移动边缘环境下的智能服务保障方法,其特征在于,所述智能服务保障方法应用于智能服务保障系统,所述智能服务保障系统通过所述智能服务保障方法对模型进行确认,在所述智能服务保障系统通过所述智能服务保障方法对模型进行确认前,需要启动所述智能服务,启动所述智能服务的方法包括:
部署Kubernetes系统和所述智能服务;
基于所述Kubernetes系统的服务发现技术和负载均衡技术启动所述智能服务;
在所述智能服务保障系统通过所述智能服务保障方法对模型进行确认时,所述方法包括:
对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果;
判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层;
若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
2.根据权利要求1所述的方法,其特征在于,在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,所述方法还包括:
若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果;
将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果;
判断所述模型准确率是否大于等于第一预设阈值;
若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
3.根据权利要求2所述的方法,其特征在于,在判断所述模型准确率是否大于等于第一预设阈值后,所述方法还包括:
若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
4.根据权利要求1所述的方法,其特征在于,在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,所述方法还包括:
使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型;
对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果;
判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层;
若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证;
若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
5.一种面向移动边缘环境下的智能服务保障装置,其特征在于,所述智能服务保障装置部署于智能服务保障系统,所述智能服务保障系统通过所述智能服务保障装置对模型进行确认,所述智能服务保障系统用于:
部署Kubernetes系统和所述智能服务;
基于所述Kubernetes系统的服务发现技术和负载均衡技术启动所述智能服务;
所述智能服务保障装置包括:
候选相对熵确定单元,用于对于候选模型中的每个候选模型层,根据第一模型层和该候选模型层之间的第一隐藏层矩阵的第一矩阵值,以及该候选模型层和第二模型层之间的第二隐藏层矩阵的第二矩阵值确定所述第一隐藏层矩阵和所述第二隐藏层矩阵之间的候选相对熵,其中,所述第一模型层为该候选模型层的输入层,所述第二模型层为该候选模型层的输出层,所述第一隐藏层矩阵为将所述第一模型层的输出作为该候选模型层的输入的第一输入结果,所述第二隐藏层矩阵为将该候选模型层的输出作为所述第二候选模型层的输入的第二输入结果;
目标相对熵判断单元,用于判断目标相对熵是否小于为所述候选模型配置的超参数阈值,其中,所述目标相对熵为第三隐藏层矩阵和第四隐藏层矩阵之间的相对熵,所述第三隐藏层矩阵为第三模型层和目标模型层之间的隐藏层矩阵,所述第四隐藏层矩阵为所述目标模型层和第四模型层之间的隐藏层矩阵,所述目标模型层为所述候选模型中具有最小候选相对熵的两个隐藏层矩阵中共同包含的候选模型层,所述第三模型层为所述目标模型层的输入层,所述第四模型层为所述目标模型层的输出层;
目标模型确定单元,用于若所述目标相对熵小于所述超参数阈值,则将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
验证输出结果确定单元,用于在判断目标相对熵是否小于为所述候选模型配置的超参数阈值后,若所述目标相对熵大于等于所述超参数阈值,则将用于对所述候选模型进行准确度确定的至少一个模型验证样本输入至所述候选模型以得到至少一个验证输出结果;
模型准确率确定单元,用于将合格输出结果的第一数量与所述至少一个验证输出结果中的验证输出结果的第二数量相除,以得到用于描述所述候选模型对数据进行预测的准确度的模型准确率,其中,所述合格输出结果为所述至少一个验证输出结果中的与预设的验证标准结果相同的验证输出结果;
模型准确率判断单元,用于判断所述模型准确率是否大于等于第一预设阈值;
合格模型确定单元,用于若所述模型准确率大于等于所述第一预设阈值,则将所述候选模型作为合格模型进行保存,以使能够通过所述合格模型对数据进行预测。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
候选模块训练单元,用于在判断所述模型准确率是否大于等于第一预设阈值后,若所述模型准确率小于所述第一预设阈值,则使用预设的用于对所述候选模型进行训练的候选模型训练集对所述候选模型进行训练,直至所述候选模型的模型准确率大于等于所述第一预设阈值。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二候选模型确定单元,用于在将所述目标模型层从所述候选模型中删除,以得到不包含所述目标模型层的目标模型后,使用用于对所述目标模型进行模型训练的目标模型训练集对所述目标模型进行训练,以得到第二候选模型;
第二候选相对熵确定单元,用于对于所述第二候选模型中的每个第二候选模型层,根据第五模型层和该第二候选模型层之间的第五隐藏层矩阵的第五矩阵值,以及该第二候选模型层和第六模型层之间的第六隐藏层矩阵的第六矩阵值确定所述第五隐藏层矩阵和所述第六隐藏层矩阵之间的第二候选相对熵,其中,所述第五模型层为该第二候选模型层的输入层,所述第六模型层为该第二候选模型层的输出层,所述第五隐藏层矩阵为将所述第五模型层的输出作为该第二候选模型层的输入的第三输入结果,所述第六隐藏层矩阵为将该第二候选模型层的输出作为所述第六候选模型层的输入的第四输入结果;
第二目标相对熵判断单元,用于判断第二目标相对熵是否小于所述超参数阈值,其中,所述第二目标相对熵为第七隐藏层矩阵和第八隐藏层矩阵之间的相对熵,所述第七隐藏层矩阵为第七模型层和第二目标模型层之间的隐藏层矩阵,所述第八隐藏层矩阵为所述第二目标模型层和第八模型层之间的隐藏层矩阵,所述第二目标模型层为所述第二候选模型中的具有最小候选相对熵的第二候选模型层,所述第七模型层为所述第二目标模型层的输入层,所述第八模型层为所述第二目标模型层的输出层;
第二模型准确率确定单元,用于若所述第二目标相对熵大于等于所述超参数阈值,则根据将至少一个第二模型验证样本输入至所述第二候选模型后得到的至少一个第二验证输出结果确定所述第二候选模型的第二模型准确率,其中,所述第二模型验证样本用于对所述第二候选模型进行准确度验证;
第二合格模型确定单元,用于若所述第二模型准确率大于等于第二预设阈值,则将所述第二候选模型作为第二合格模型进行保存,以使能够通过所述第二合格模型对数据进行预测。
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4中任一所述的面向移动边缘环境下的智能服务保障方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至4中任意一项所述的面向移动边缘环境下的智能服务保障方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210632812.2A CN114996010B (zh) | 2022-06-06 | 2022-06-06 | 面向移动边缘环境下的智能服务保障方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210632812.2A CN114996010B (zh) | 2022-06-06 | 2022-06-06 | 面向移动边缘环境下的智能服务保障方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114996010A CN114996010A (zh) | 2022-09-02 |
CN114996010B true CN114996010B (zh) | 2024-05-24 |
Family
ID=83032694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210632812.2A Active CN114996010B (zh) | 2022-06-06 | 2022-06-06 | 面向移动边缘环境下的智能服务保障方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114996010B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200063041A (ko) * | 2018-11-27 | 2020-06-04 | 한국전자통신연구원 | 아키텍처 변이 기반 비지도 학습 및 선택적 오류 전파 기반 지도 학습을 이용한 신경망 학습 방법 및 장치 |
WO2020214428A1 (en) * | 2019-04-18 | 2020-10-22 | Oracle International Corporation | Using hyperparameter predictors to improve accuracy of automatic machine learning model selection |
KR20200125029A (ko) * | 2019-04-25 | 2020-11-04 | 한국전자통신연구원 | 회귀 분석 방법 및 장치 |
US10832174B1 (en) * | 2019-10-14 | 2020-11-10 | Sas Institute Inc. | Distributed hyperparameter tuning system for active machine learning |
WO2021248140A1 (en) * | 2020-06-05 | 2021-12-09 | Google Llc | Hyperparameter neural network ensembles |
CN114297338A (zh) * | 2021-12-02 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 文本匹配方法、装置、存储介质和程序产品 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11562236B2 (en) * | 2019-08-20 | 2023-01-24 | Lg Electronics Inc. | Automatically labeling capability for training and validation data for machine learning |
-
2022
- 2022-06-06 CN CN202210632812.2A patent/CN114996010B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200063041A (ko) * | 2018-11-27 | 2020-06-04 | 한국전자통신연구원 | 아키텍처 변이 기반 비지도 학습 및 선택적 오류 전파 기반 지도 학습을 이용한 신경망 학습 방법 및 장치 |
WO2020214428A1 (en) * | 2019-04-18 | 2020-10-22 | Oracle International Corporation | Using hyperparameter predictors to improve accuracy of automatic machine learning model selection |
KR20200125029A (ko) * | 2019-04-25 | 2020-11-04 | 한국전자통신연구원 | 회귀 분석 방법 및 장치 |
US10832174B1 (en) * | 2019-10-14 | 2020-11-10 | Sas Institute Inc. | Distributed hyperparameter tuning system for active machine learning |
WO2021248140A1 (en) * | 2020-06-05 | 2021-12-09 | Google Llc | Hyperparameter neural network ensembles |
CN114297338A (zh) * | 2021-12-02 | 2022-04-08 | 腾讯科技(深圳)有限公司 | 文本匹配方法、装置、存储介质和程序产品 |
Non-Patent Citations (1)
Title |
---|
汪洋 ; 郭利进 ; .一种新型DSCNN-GRU结构的减速机轴承故障诊断方法.机械科学与技术.(02),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114996010A (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111709533B (zh) | 机器学习模型的分布式训练方法、装置以及计算机设备 | |
CN111258767B (zh) | 复杂系统仿真应用的云计算资源智能分配方法与装置 | |
US9251156B2 (en) | Information processing devices, method, and recording medium with regard to a distributed file system | |
CN113570064A (zh) | 利用复合机器学习模型来执行预测的方法及系统 | |
CN113961759B (zh) | 基于属性图表示学习的异常检测方法 | |
CN110874744B (zh) | 一种数据异常检测方法及装置 | |
KR102247629B1 (ko) | 기계 학습 기반의 클라우드 가상머신 자원의 최적화 장치 및 방법 | |
CN113610240A (zh) | 利用嵌套机器学习模型来执行预测的方法及系统 | |
CN113869521A (zh) | 构建预测模型的方法、装置、计算设备和存储介质 | |
CN114091610A (zh) | 智能决策方法及装置 | |
CN114780301A (zh) | 支持多云生产环境的容灾方法及系统 | |
CN117318052B (zh) | 发电机组进相试验无功功率预测方法、装置和计算机设备 | |
CN114996010B (zh) | 面向移动边缘环境下的智能服务保障方法 | |
US20160342899A1 (en) | Collaborative filtering in directed graph | |
CN117435999A (zh) | 一种风险评估方法、装置、设备以及介质 | |
CN117221295A (zh) | 一种基于边缘计算和网络切片的低延迟视频传输系统 | |
CN117371508A (zh) | 模型压缩方法、装置、电子设备以及存储介质 | |
WO2024027071A1 (zh) | 一种数据监控方法及系统 | |
CN115883392A (zh) | 算力网络的数据感知方法、装置、电子设备及存储介质 | |
CN115442262B (zh) | 一种资源评估方法、装置、电子设备及存储介质 | |
CN109492844B (zh) | 业务策略的生成方法和装置 | |
EP4258178A1 (en) | Information processing apparatus for improving robustness of deep neural network by using adversarial training and formal method | |
CN113780666B (zh) | 一种缺失值的预测方法及装置、可读存储介质 | |
CN111737319B (zh) | 用户集群的预测方法、装置、计算机设备和存储介质 | |
CN115277249A (zh) | 一种多层异构网络协同的网络安全态势感知方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |