CN110659732B

CN110659732B - 一种智能调节神经网络模型的方法

Info

Publication number: CN110659732B
Application number: CN201910895105.0A
Authority: CN
Inventors: 李程兴; 王海波; 郭继鹏; 景蔚亮; 陈邦明
Original assignee: Shanghai Xinchu Integrated Circuit Co Ltd
Current assignee: Shanghai Xinchu Integrated Circuit Co Ltd
Priority date: 2019-09-20
Filing date: 2019-09-20
Publication date: 2023-07-04
Anticipated expiration: 2039-09-20
Also published as: CN110659732A

Abstract

本发明涉及一种智能调节神经网络模型的方法，设置一服务端以及与服务端远程连接的用户端；服务端内预设一训练完成的具有预设压缩率的神经网络模型；用户端内包括需要应用神经网络模型处理数据的应用程序；方法具体包括：步骤S1，服务端将神经网络模型发送至用户端，用户端应用神经网络模型，通过应用程序对数据进行处理；步骤S2，用户端在预设时段内判断数据的处理结果的正确率是否匹配神经网络模型当前的压缩率：若不匹配，则用户端调整神经网络模型的压缩率，随后转向下一个预设时段，并返回步骤S2；若匹配，则用户端保持神经网络模型当前的压缩率不变，随后退出。可以有效的节省存储器的空间和降低使用神经网络功能时的功耗。

Description

一种智能调节神经网络模型的方法

技术领域

本发明涉及神经网络模型领域，尤其涉及一种智能调节神经网络模型的方法。

背景技术

边缘计算是指在靠近物或数据源头的一侧，采用网络、计算、存储、应用核心能力为一体的开放平台，就近提供最近端服务。其应用程序在边缘侧发起，产生更快的网络服务响应，满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求。边缘计算处于物理实体和工业连接之间，或处于物理实体的顶端。而云端计算，仍然可以访问边缘计算的历史数据；对物联网而言，边缘计算技术取得突破，意味着许多控制将通过本地设备实现而无需交由云端，处理过程将在本地边缘计算层完成。这无疑将大大提升处理效率，减轻云端的负荷。由于更加靠近用户，还可为用户提供更快的响应，将需求在边缘端解决；边缘设备其存储器所能存储的数据容量往往比较小，因此将边缘计算AI软件、神经网络模型在边缘设备中广泛的部署，其软件的容量大小往往成为一个重要问题。

发明内容

本发明的目的在于，提供一种智能调节神经网络模型的方法，解决以上技术问题。

本发明所解决的技术问题可以采用以下技术方案来实现：

一种智能调节神经网络模型的方法，其特征在于，设置一服务端以及与所述服务端远程连接的用户端；

于所述服务端内预设有一训练完成的神经网络模型，所述神经网络模型具有预设的压缩率；

于所述用户端内包括需要应用所述神经网络模型处理数据的应用程序；

所述方法具体包括：

步骤S1，所述服务端将所述神经网络模型发送至所述用户端，所述用户端应用所述神经网络模型，通过所述应用程序对数据进行处理；

步骤S2，所述用户端在预设时段内判断数据的处理结果的正确率是否匹配于所述神经网络模型当前的压缩率：

若不匹配，则所述用户端调整所述神经网络模型的压缩率，随后转向下一个预设时段，并返回所述步骤S2；

若匹配，则所述用户端保持所述神经网络模型当前的压缩率不变，随后退出。

优选地，所述步骤S2具体包括：

步骤S21a，所述用户端在当前的预设时段内判断数据的处理结果的正确率是否不低于一预设的第一更新阈值：

若是，则转向步骤S22a；

若否，则所述用户端保持所述神经网络模型当前的压缩率不变，随后退出；

步骤S22a，所述用户端对所述神经网络模型进行一次压缩，随后转向下一个所述预设时段，并转向步骤S23a；

步骤S23a，所述用户端在当前的所述预设时段内判断所述处理结果的正确率是否不低于一预设的更新阈值：

若是，则返回所述步骤S22a；

若否，则转向步骤S24a；

步骤S24a，所述用户端判断所述处理结果的正确率是否低于一预设的第一下限阈值：

若是，则所述用户端将所述神经网络模型恢复成上一个所述预设时段内应用的压缩率，随后退出；

若否，则所述用户端保持所述神经网络模型当前的压缩率不变，随后退出。

优选地，所述服务端发送给所述用户端的所述神经网络模型未经过压缩。

优选地，预先将所述神经网络模型的压缩率由高至低划分为多个压缩等级；

所述步骤S1中，所述服务端向所述用户端发送的所述神经网络模型拥有最高的压缩等级的压缩率；

所述步骤S2具体包括：

步骤S21b，所述用户端在当前的预设时段内判断数据的处理结果的正确率是否不低于一预设的第二下限阈值：

若是，则所述用户端保持所述神经网络模型当前的压缩率不变，随后退出；

若否，则所述用户端将所述神经网络模型的压缩率调至低一级的压缩等级，随后转向下一个所述预设时段，并返回所述步骤S21b。

优选地，预先将所述神经网络模型的压缩率由高至低划分为多个压缩等级，多个所述压缩等级中包括一中间的压缩等级；

所述步骤S1中，所述服务端向所述用户端发送的所述神经网络模型拥有中间的压缩等级的压缩率；

所述步骤S2具体包括：

步骤S21c，所述用户端在当前的预设时段内判断数据的处理结果的正确率：

若所述正确率不低于一预设的第二更新阈值，则转向步骤S22c；

若所述正确率在所述第二更新阈值和一预设的第三下限阈值之间，则转向步骤S23c；

若所述正确率低于所述第三下限阈值，则转向步骤S24c；

步骤S22c，所述用户端对所述神经网络模型进行一次压缩，随后转向下一个预设时段，并转向步骤S25c；

步骤S23c，所述用户端保持所述神经网络模型当前的压缩率不变，随后退出；

步骤S24c，所述用户端将所述神经网络模型的压缩率调至低一级的压缩等级，随后转向下一个所述预设时段，并转向步骤S26c；

步骤S25c，所述用户端在当前的所述预设时段内再次判断数据的处理结果的正确率：

若所述正确率不低于所述第三下限阈值，则返回所述步骤S22c；

若所述正确率在所述第二更新阈值和一预设的第三下限阈值之间，则返回所述步骤S23c；

若所述正确率低于所述第三下限阈值，则将所述神经网络模型恢复成上一个所述预设时段内应用的压缩率，随后退出；

步骤S26c，所述用户端在当前的所述预设时段内再次判断数据的处理结果的正确率：

若所述正确率低于所述第三下限阈值，则返回所述步骤S24c；

若所述正确率不低于所述第三下限阈值，则保持所述神经网络模型当前的压缩率不变，随后退出。

优选地，所述预设时段为一周或者一个月。

优选地，所述用户端包括便携式电子设备、边缘计算设备。

优选地，所述方法为通过使用不同的变量类型表示神经网络模型的参数。

其有益效果在于：

本发明通过提供一种智能调节神经网络模型的方法可以有效的节省存储器的空间和降低使用神经网络功能时的功耗。

附图说明

图1为本发明的方法流程图；

图2为本发明的未压缩的神经网络模型的方法流程图；

图3为本发明的压缩率最高的神经网络模型的方法流程图；

图4为本发明的压缩率中间的神经网络模型的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

对于边缘计算设备具备可靠性能在离线的情况下完成相应的功能，但是边缘设备往往存储容量不大且需求低功耗，因此可以使用本发明来有效的节省边缘设备的存储空间以及降低使用时的能耗。

如图1所示，一种智能调节神经网络模型的方法，设置一服务端以及与服务端远程连接的用户端；

于服务端内预设有一训练完成的神经网络模型，神经网络模型具有预设的压缩率；于用户端内包括需要应用神经网络模型处理数据的应用程序；

方法具体包括：

步骤S1，服务端将神经网络模型发送至用户端，用户端应用神经网络模型，通过应用程序对数据进行处理；

步骤S2，用户端在预设时段内判断数据的处理结果的正确率是否匹配于神经网络模型当前的压缩率：

若不匹配，则用户端调整神经网络模型的压缩率，随后转向下一个预设时段，并返回步骤S2；

若匹配，则用户端保持神经网络模型当前的压缩率不变，随后退出。

通过这一方法，我们既在保证了正常使用时的正确率又可以降低神经网络模型的占用空间大小也可以有效的降低功耗也可以将不同压缩率的神经网络模型作为初始发送模型。

本发明较佳的实施例中，如图2所示，步骤S2具体包括：

步骤S21a，用户端在当前的预设时段内判断数据的处理结果的正确率是否不低于一预设的第一更新阈值：

若是，则转向步骤S22a；

若否，则用户端保持神经网络模型当前的压缩率不变，随后退出；

步骤S22a，用户端对神经网络模型进行一次压缩，随后转向下一个预设时段，并转向步骤S23a；

步骤S23a，用户端在当前的预设时段内判断处理结果的正确率是否不低于一预设的更新阈值：

若是，则返回步骤S22a；

若否，则转向步骤S24a；

步骤S24a，用户端判断处理结果的正确率是否低于一预设的第一下限阈值：

若是，则用户端将神经网络模型恢复成上一个预设时段内应用的压缩率，随后退出；

若否，则用户端保持神经网络模型当前的压缩率不变，随后退出。

本发明较佳的实施例中，用户端判断处理数据的结果正确率是否不低于第一更新阀值，若不低于神经网络模型进行第一次压缩并转向下一时段，并在当前时段再次判断正确率是否低于预设的更新阀值，若不低于则判断正确率是否低于预设的第一下限阀值，低于则压缩率恢复为上一预设时段的，不低于则保持当前压缩率不变。

本发明较佳的实施例中，如图3所示，步骤S1中，服务端向用户端发送的神经网络模型拥有最高的压缩等级的压缩率；

步骤S2具体包括：

步骤S21b，用户端在当前的预设时段内判断数据的处理结果的正确率是否不低于一预设的第二下限阈值：

若是，则用户端保持神经网络模型当前的压缩率不变，随后退出；

若否，则用户端将神经网络模型的压缩率调至低一级的压缩等级，随后转向下一个预设时段，并返回步骤S21b。

本发明较佳的实施例中，用户判断此时预设时段的数据处理结果的正确率是否不低于预设的第二下限阀值，若是则保持当前的压缩率，若不是则将压缩率调至低一等级的压缩率并转向下一个预设时段。

本发明较佳的实施例中，如图4所示，步骤S1中，服务端向用户端发送的神经网络模型拥有中间的压缩等级的压缩率；

步骤S2具体包括：

步骤S21c，用户端在当前的预设时段内判断数据的处理结果的正确率：

若正确率不低于一预设的第二更新阈值，则转向步骤S22c；

若正确率在第二更新阈值和一预设的第三下限阈值之间，则转向步骤S23c；

若正确率低于第三下限阈值，则转向步骤S24c；

步骤S22c，用户端对神经网络模型进行一次压缩，随后转向下一个预设时段，并转向步骤S25c；

步骤S23c，用户端保持神经网络模型当前的压缩率不变，随后退出；

步骤S24c，用户端将神经网络模型的压缩率调至低一级的压缩等级，随后转向下一个预设时段，并转向步骤S26c；

步骤S25c，用户端在当前的预设时段内再次判断数据的处理结果的正确率：

若正确率不低于第三下限阈值，则返回步骤S22c；

若正确率在第二更新阈值和一预设的第三下限阈值之间，则返回步骤S23c；

若正确率低于第三下限阈值，则将神经网络模型恢复成上一个预设时段内应用的压缩率，随后退出；

步骤S26c，用户端在当前的预设时段内再次判断数据的处理结果的正确率：

若正确率低于第三下限阈值，则返回步骤S24c；

若正确率不低于第三下限阈值，则保持神经网络模型当前的压缩率不变，随后退出。

本发明较佳的实施例中，数据处理结果的正确率分为三种状态，正确率不低于预设的第二更新阈值、正确率在第二更新阈值和预设的第三下限阈值之间、正确率低于第三下限阈值；若正确率不低于预设的第二更新阀值则神经网络模型进行一次压缩并转向下一个预设时段，用户端在下一预设时段再次判断正确率分别为正确率不低于第三下限阈值、正确率在第二更新阈值和一预设的第三下限阈值之间、正确率低于第三下限阈值，若正确率不低于第三下限阈值则对神经网络模型进行再一次压缩并转向下一个预设时段，若正确率在第二更新阈值和一预设的第三下限阈值之间则保持当前压缩率，若正确率低于第三下限阈值则将压缩率调至低一等级并转向下一个预设时段；若正确率在第二更新阈值和一预设的第三下限阈值之间则保持当前压缩率并退出；若正确率在第二更新阈值和预设的第三下限阈值之间则保持当前压缩率不变并退出；若正确率低于第三下限阈值则压缩率调至低一级并转向下一个预设时段，用户在下一预设时段再次判断正确率分别为正确率低于第三下限阈值和正确率不低于第三下限阈值，若正确率低于第三下限阈值则保持当前压缩率不变并退出，若正确率不低于第三下限阈值则将压缩率调至低一级的压缩等级并转向下一预设时段。

本发明较佳的实施例中，预设时段为一周或者一个月。用户端包括便携式电子设备、边缘计算设备。

本发明较佳的实施例中，通过使用不同的变量类型表示神经网络模型的参数。变量的类型可以为双精度64位浮点型、单精度32位浮点型、16位浮点型、8位整型等，变量类型的位数越高所占用的空间容量也就越大但是使用的正确率也会更高。当用户使用的正确率高于更新阈值，则神经网络模型的更新将会依次的从双精度64位浮点型，到单精度32位浮点型，再到16位浮点型，再到8位整型的顺序进行压缩；反之也会按照8位整型，到16位浮点型，再到单精度32位浮点型，再到双精度64位浮点型的顺序进行恢复。

本发明较佳的实施例中，当一个用于语音识别功能的神经网络模型在云端服务器中训练完成达到一个较高的测试正确率后，发送完整的未压缩过的测试正确率最高的64位浮点型的语音识别神经网络模型到用户所使用的智能手机中，在第一个时间周期的使用的过程中统计用户在使用神经网络时的正确率，如用户的语音发音标准，使得语音识别模型的判断正确率高于设置的更新阈值，在下一个时间周期开始前的用户空闲时间中对语音识别模型采用32位浮点型压缩以及进行剪枝以减少语音识别模型的容量。在第二个时间周期中继续统计用户使用此语音识别模型的正确率，如用户的使用的正确率高于更新阈值则再对语音识别模型用16位浮点型以及剪枝进行进一步的压缩以减少存储空间，以此类推。每一个时间周期中都会对用户的使用的正确率进行统计，如果用户使用语音识别模型时使用的正确率低于一个设定的下限阈值时，则语音识别模型将恢复到上一时间周期中所使用的较高位数的变量类型的压缩率较低的压缩状态。如果用户使用语音识别模型的使用的正确率不小于下限阀值而不大于更新阀值时，则会依旧使用当前压缩状态下的语音识别模型不进行更新。在对神经网络进行不同变量类型的压缩以及剪枝的同时由于容量的减少，使用时的能耗也同时减少，此外神经网络模型的计算速度也会加快。

本发明较佳的实施例中，在下棋比赛中，通过对比赛者的下棋技术的判断来进行神经网络模型的压缩；若判断比赛者的技术为初级，则采用低等位的神经网络模型进行压缩；若判断比赛者的技术为中级，则采用中等位的神经网络模型进行压缩；若判断比赛者的技术为高级，则采用高等位的神经网络模型进行压缩。

以上所述仅为本发明较佳的实施例，并非因此限制本发明的实施方式及保护范围，对于本领域技术人员而言，应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案，均应当包含在本发明的保护范围内。

Claims

1.一种智能调节神经网络模型的方法，其特征在于，设置一服务端以及与所述服务端远程连接的用户端；

所述方法具体包括：

若匹配，则所述用户端保持所述神经网络模型当前的压缩率不变，随后退出；

预先将所述神经网络模型的压缩率由高至低划分为多个压缩等级，多个所述压缩等级中包括一中间的压缩等级；

所述步骤S2具体包括：

若所述正确率低于所述第三下限阈值，则转向步骤S24c；

若所述正确率低于所述第三下限阈值，则返回所述步骤S24c；

2.根据权利要求1所述的方法，其特征在于，所述步骤S2具体包括：

若是，则转向步骤S22a；

若是，则返回所述步骤S22a；

若否，则转向步骤S24a；

3.根据权利要求2所述的方法，其特征在于，所述服务端发送给所述用户端的所述神经网络模型未经过压缩。

4.根据权利要求1所述一种智能调节所应用神经网络模型的压缩率的方法，其特征在于，预先将所述神经网络模型的压缩率由高至低划分为多个压缩等级；

所述步骤S2具体包括：

5.根据权利要求1所述的方法，其特征在于，所述预设时段为一周或者一个月。

6.根据权利要求1所述的方法，其特征在于，所述用户端包括便携式电子设备、边缘计算设备。

7.根据权利要求1所述的方法，其特征在于，所述方法为通过使用不同的变量类型表示神经网络模型的参数。