CN113378994A - 一种图像识别方法、装置、设备及计算机可读存储介质 - Google Patents

一种图像识别方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113378994A
CN113378994A CN202110779957.0A CN202110779957A CN113378994A CN 113378994 A CN113378994 A CN 113378994A CN 202110779957 A CN202110779957 A CN 202110779957A CN 113378994 A CN113378994 A CN 113378994A
Authority
CN
China
Prior art keywords
model
global
weight
current
gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110779957.0A
Other languages
English (en)
Other versions
CN113378994B (zh
Inventor
陈珉
毛冰城
金朝汇
谌明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Hithink Royalflush Information Network Co Ltd
Original Assignee
Zhejiang University ZJU
Hithink Royalflush Information Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Hithink Royalflush Information Network Co Ltd filed Critical Zhejiang University ZJU
Priority to CN202110779957.0A priority Critical patent/CN113378994B/zh
Publication of CN113378994A publication Critical patent/CN113378994A/zh
Application granted granted Critical
Publication of CN113378994B publication Critical patent/CN113378994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像识别方法、装置、设备及计算机可读存储介质,方法包括:将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各设备进行训练得到本地模型权重;利用全局权重及本地模型权重计算平均模型伪梯度,利用平均模型伪梯度计算一阶矩估计;根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,执行判断步骤;利用当前全局模型对待识别图像进行识别。本申请公开的技术方案,计算平均模型伪梯度和一阶矩估计将一阶矩估计参与到全局权重中,以减少数据分布差异带来的影响,提高全局模型的准确性,从而提高图像识别的准确性。

Description

一种图像识别方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及图像识别技术领域,更具体地说,涉及一种图像识别方法、装置、设备及计算机可读存储介质。
背景技术
目前,多利用深度学习模型进行图像识别,以提高图像识别的效率和准确性等。其中,在利用深度学习模型进行图像识别时,需要先对模型进行训练。
现有在进行图像识别时,是先利用各分布设备上的数据集进行训练,并直接将训练得到的模型进行综合,以得到全局模型,然后,利用得到的全局模型进行图像识别,但是,由于各分布设备上的数据分布存在差异,因此,利用各分布设备上的数据集进行模型训练并直接进行综合的方式会导致最终得到的全局模型的准确性比较低,从而会降低图像识别的准确性。
综上所述,如何提高图像识别的准确性,是目前本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请的目的是提供一种图像识别方法、装置、设备及计算机可读存储介质,用于提高图像识别的准确性。
为了实现上述目的,本申请提供如下技术方案:
一种图像识别方法,包括:
将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各所述设备利用本地图像集对全局模型进行训练,得到本地模型权重;所述全局模型为带有所述全局权重的全局模型框架;
利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度,并利用所述平均模型伪梯度计算一阶矩估计;
根据所述一阶矩估计得到当前全局权重,根据所述当前全局权重得到当前全局模型,将所述当前全局权重发送至各所述设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止;
获取待识别图像,利用所述当前全局模型对待识别图像进行识别。
优选的,在利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度时,还包括:
利用所述全局权重及各所述目标设备的本地模型权重,计算平均绝对模型伪梯度,利用所述平均绝对模型伪梯度计算二阶矩估计;
相应地,根据所述一阶矩估计得到当前全局权重,包括:
根据所述一阶矩估计和所述二阶矩估计得到所述当前全局权重。
优选的,利用所述全局权重及各所述目标设备的本地模型权重,计算平均绝对模型伪梯度,利用所述平均绝对模型伪梯度计算二阶矩估计,包括:
利用
Figure BDA0003156204780000021
计算所述平均绝对模型伪梯度Δ't;其中,t为当前迭代轮次,St为当前迭代轮次中参与训练的设备的集合,|St|为St中包含的设备的个数,
Figure BDA0003156204780000022
为模型伪梯度,
Figure BDA0003156204780000023
Figure BDA0003156204780000024
的绝对值,
Figure BDA0003156204780000025
Figure BDA0003156204780000026
为第i个设备在当前迭代轮次得到的本地模型权重,wt-1为上一迭代轮次的全局权重;
利用
Figure BDA0003156204780000027
计算二阶矩估计vt;其中,vt-1为上一迭代轮次得到的二阶矩估计,β2为二阶矩估计的系数。
优选的,根据所述一阶矩估计和所述二阶矩估计得到当前全局权重,包括:
利用
Figure BDA0003156204780000028
计算当前全局权重wt;其中,η0为全局学习率,γ为全局学习率递减系数,mt为当前迭代轮次得到的一阶矩估计,ζ为调节系数且大于0。
优选的,在确定所述全局模型不收敛或所述迭代次数未达到最大迭代次数时,还包括:
从各所述设备中选择目标设备,其中,所述目标设备的数量小于所述设备的总数量。
优选的,从各所述设备中选择目标设备,包括:
从各所述设备中随机选择所述目标设备。
优选的,在将全局模型框架及全局权重发送至各设备之前,还包括:
对所述全局模型框架及所述全局权重进行加密。
一种图像识别装置,包括:
第一发送模块,用于将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各所述设备利用本地图像集对全局模型进行训练,得到本地模型权重;所述全局模型为带有所述全局权重的全局模型框架;
第一计算模块,用于利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度,并利用所述平均模型伪梯度计算一阶矩估计;
第二发送模块,用于根据所述一阶矩估计得到当前全局权重,根据所述当前全局权重得到当前全局模型,将所述当前全局权重发送至各所述设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止;
识别模块,用于获取待识别图像,利用所述当前全局模型对待识别图像进行识别。
一种图像识别设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的图像识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的图像识别方法的步骤。
本申请提供了一种图像识别方法、装置、设备及计算机可读存储介质,其中,该方法包括:将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各设备利用本地图像集对全局模型进行训练,得到本地模型权重;全局模型为带有全局权重的全局模型框架;利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度,并利用平均模型伪梯度计算一阶矩估计;根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至当前全局模型收敛或迭代轮次达到最大迭代次数为止;获取待识别图像,利用当前全局模型对待识别图像进行识别。
本申请公开的上述技术方案,在利用各设备训练全局模型的过程中,获取各设备的本地模型权重,并利用本地模型权重及全局权重计算平均模型伪梯度和一阶矩估计,通过计算平均模型伪梯度和一阶矩估计并将一阶矩估计参与到全局权重中来减少不同设备中图像集分布差异带来的影响,从而提高最终得到的全局模型的准确性,进而在利用最终得到的全局模型进行图像识别时则可以提高图像识别的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种图像识别方法的流程图;
图2为本申请实施例提供的另一种图像识别方法的流程图;
图3为本申请实施例提供的一种图像识别装置的结构示意图;
图4为本申请实施例提供的一种图像识别设备的结构示意图。
具体实施方式
现有技术中,不同设备间的图像集可能存在较大的差异,由于一些图像集是不允许汇总在一起进行集中建模和图像识别的,因此,现有是采用由各设备利用各自的图像集进行训练和建模,然后,由中心设备直接将这些模型综合在一起而得到全局模型,而这则会使全局模型受不同设备间图像集分布的差异而存在准确性比较低的问题,从而会导致利用该全局模型进行图像识别的准确性比较低。
为此,本申请提供一种图像识别方法、装置、设备及计算机可读存储介质,用于提高图像识别的准确性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,其示出了本申请实施例提供的一种图像识别方法的流程图,本申请实施例提供的一种图像识别方法,可以包括:
S11:将全局模型框架及全局权重发送至各设备。
S12:判断全局模型是否收敛或迭代次数是否达到最大迭代次数;若否,由设备利用本地图像集对全局模型进行训练,得到本地模型权重;全局模型为带有全局权重的全局模型框架。
中心节点设备(包含但不限于服务器或其他计算终端)初始化一个神经网络模型作为全局模型框架,并设置最大迭代次数T,初始化当前迭代次数t=1,且初始化全局权重和一阶矩估计(其中,初始化的一阶矩估计可以等于0)。其中,设置最大迭代次数T的目的是为了避免因得到的全局模型不收敛而一直处于迭代中,从而降低计算资源的消耗。然后,中心节点设备将初始化的全局模型框架、初始化的全局权重及上述提及的其他初始化的相关参数发送至设备列表中包含的各设备中,以便于设备为模型训练做准备,并便于进行相关信息的同步。其中,设备列表包含与中心节点设备存在连接关系且合法的设备且设备包含但不限于服务器或者其他计算终端设备,如手机、PC机(Personal Computer,个人计算机)、边缘设备等。
然后,中心节点设备判断带有全局权重的全局模型框架(即此时对应的全局模型)是否收敛或t是否等于T+1,若全局模型未收敛且t不等于T+1,则中心节点设备可以给各设备发送训练指令,由各设备利用本地图像集对全局模型进行训练,以得到本地模型,然后,各设备根据本地模型得到本地模型权重,并将本地模型权重发送至中心节点设备。需要说明的是,这里提及的本地图像集具体可以为医学图像集(即内部包含的是医学图像),当然,也可以为其他类型的本地图像集,本申请对本地图像集的类型不做任何限定。
S13:利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度,并利用平均模型伪梯度计算一阶矩估计。
中心节点设备在得到各设备发送的本地模型权重之后,利用全局权重及各设备的本地模型权重计算平均模型伪梯度,具体地:
利用
Figure BDA0003156204780000061
计算所述平均模型伪梯度Δt;其中,t为当前迭代轮次,St为当前迭代轮次中参与训练的设备的集合,|St|为St中包含的设备的个数,
Figure BDA0003156204780000062
为模型伪梯度,
Figure BDA0003156204780000063
Figure BDA0003156204780000064
为第i个设备在当前迭代轮次得到的本地模型权重,wt-1为上一迭代轮次的全局权重。
通过上述过程可知,中心节点设备计算各设备的模型伪梯度,并将各设备的模型伪梯度进行平均,以平衡因各设备间图像集分布存在差异而带来的影响,即通过计算平均模型伪梯度来考虑整体水平情况,以尽量减少设备间图像集存在差异而带来的影响。
在计算出平均模型伪梯度之后,利用平均模型伪梯度计算全局模型的一阶矩估计,具体地:
利用mt=β1mt-1+(1-β1t计算全局模型的一阶矩估计mt;其中,β1为一阶矩估计的系数(决定上一轮估计结果的权重),mt-1为上一迭代轮次得到的一阶矩估计。
通过上述计算公式可知,本申请通过计算全局模型的一阶矩估计而将之前迭代轮次中计算得到的一阶矩估计(实际上为平均模型伪梯度)考虑在内,以保留之前迭代轮次的信息,同时,又将当前迭代轮次中对应的平均模型伪梯度包含在内,以降低图像集分布差异、本地模型差异带来的影响。
S14:根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至当前全局模型收敛或迭代轮次达到最大迭代次数为止。
在计算出一阶矩估计之后,可以根据一阶矩估计得到全局模型的当前权重,具体地,可以利用
Figure BDA0003156204780000065
计算全局模型的当前全局权重wt,其中,η0为全局学习率,γ为全局学习率递减系数,即在进行全局权重更新时,将步骤S13计算出的与当前迭代次数对应的一阶矩估计考虑在内,以便于降低目标设备间图像集分布差异带来的影响。之后,则将得到的当前全局权重带入到全局模型框架中,以得到当前全局模型。
然后,则将t+1赋值给t(即令t=t+1),且中心节点设备可以同时将计算出的当前全局权重发送至各设备,以对各设备的当前全局权重进行更新,从而便于进行相关信息的同步,并便于从中选择设备而进行模型训练。之后,中心节点设备返回执行步骤S12,即重复执行上述相关步骤,若在执行过程中,出现当前全局模型收敛或t等于T+1,则结束模型训练。由于在进行判断之前,已经将当前全局权重发送至各设备,因此,各设备可以利用最新接收到的当前全局权重以及之前接收到的全局模型框架来得到对应的当前全局模型,并利用当前全局模型对自身存储或获取到的待识别图像进行识别。
S15:获取待识别图像,利用当前全局模型对待识别图像进行识别。
在确定得到的当前全局模型收敛或迭代轮次达到最大迭代次数时,中心节点设备可以获取待识别图像,并利用最终得到的全局模型来对待识别图像进行识别
由于在当前全局模型获取的过程中,本申请是将各设备计算的本地模型权重及全局权重计算平均模型伪梯度和一阶矩估计,因此,则可以减弱因各设备中的图像集存在差异而对全局模型带来的影响,从而提高最终得到的全局模型的准确性,进而提高图像识别的准确性。
本申请公开的上述技术方案,在利用各设备训练全局模型的过程中,获取各设备的本地模型权重,并利用本地模型权重及全局权重计算平均模型伪梯度和一阶矩估计,通过计算平均模型伪梯度和一阶矩估计并将一阶矩估计参与到全局权重中来减少不同设备中图像集分布差异带来的影响,从而提高最终得到的全局模型的准确性,进而在利用最终得到的全局模型进行图像识别时则可以提高图像识别的准确性。
参见图2,其示出了本申请实施例提供的另一种图像识别方法的流程图,本申请实施例提供的一种图像识别方法,在利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度时,还可以包括:
利用全局权重及各目标设备的本地模型权重,计算平均绝对模型伪梯度,利用平均绝对模型伪梯度计算二阶矩估计;
相应地,根据一阶矩估计得到当前全局权重,可以包括:
根据一阶矩估计和二阶矩估计得到当前全局权重。
在本申请中,在利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度时,中心节点设备还可以执行“偏离抵抗聚合”,具体地,可以同时利用全局权重及各目标设备的本地模型权重计算平均绝对模型伪梯度,利用平均绝对模型伪梯度计算二阶矩估计,相应地,在根据一阶矩估计得到当前全局权重时,可以根据一阶矩估计和二阶矩估计得到当前全局权重,其中,加入二阶矩估计的计算和将其参与到当前全局权重更新中可以进一步降低目标设备间图像集分布差异带来的影响,而且通过加入二阶据估计可以加快全局模型收敛速度,以便于缩短模型训练时间,提高模型训练效率,进而便于及时对图像识别做出响应,提高图像识别效率。
本申请实施例提供的一种图像识别方法,利用全局权重及各目标设备的本地模型权重,计算平均绝对模型伪梯度,利用平均绝对模型伪梯度计算二阶矩估计,可以包括:
利用
Figure BDA0003156204780000081
计算平均绝对模型伪梯度Δ't;其中,t为当前迭代轮次,St为当前迭代轮次中参与训练的设备的集合,|St|为St中包含的设备的个数,
Figure BDA0003156204780000082
为模型伪梯度,
Figure BDA0003156204780000083
Figure BDA0003156204780000084
的绝对值,
Figure BDA0003156204780000085
Figure BDA0003156204780000086
为第i个设备在当前迭代轮次得到的本地模型权重,wt-1为上一迭代轮次的全局权重;
利用
Figure BDA0003156204780000087
计算二阶矩估计vt;其中,vt-1为上一迭代轮次得到的二阶矩估计,β2为二阶矩估计的系数。
在本申请中,具体可以利用上述公式计算平均绝对模型伪梯度Δ't和二阶矩估计vt,以提高平均绝对模型伪梯度Δ't和二阶矩估计vt计算的准确性,从而便于提高最终得到的全局模型的准确性,进而便于提高图像识别的准确性。
本申请实施例提供的一种图像识别方法,根据一阶矩估计和二阶矩估计得到当前全局权重,可以包括:
利用
Figure BDA0003156204780000091
计算全局模型的当前全局权重wt;其中,η0为全局学习率,γ为全局学习率递减系数,mt为当前迭代轮次得到的一阶矩估计,ζ为调节系数且大于0。
在根据一阶矩估计和二阶矩估计得到全局模型的当前全局权重时,具体可以利用上述公式计算全局模型的当前全局权重wt,其中,ζ为一个正数,以防止分母出现0的情况,且通常将其设置为1e-6(即1*10-6),以减少对模型的影响。
通过上述公式可以准确地计算出当前全局权重wt,从而便于提高最终得到的全局模型的准确性,进而便于提高图像识别的准确性。
本申请实施例提供的一种图像识别方法,在确定全局模型不收敛或迭代次数未达到最大迭代次数时,还可以包括:
从各设备中选择目标设备,其中,目标设备的数量小于设备的总数量。
在本申请中,在确定全局模型不收敛或迭代次数未达到最大迭代次数时,可以从各设备中选择目标设备,其中,所选择的目标设备的数量小于设备的总数量,然后,只由所选目标设备利用本地图像集对全局模型进行训练,以缩短训练时间,从而便于提高模型获取效率,进而便于提高图像识别的效率。需要说明的是,在此基础上,St即为当前迭代轮次中被选择的目标计算设备的集合。
本申请实施例提供的一种图像识别方法,从各设备中选择目标设备,可以包括:
从各设备中随机选择目标设备。
在从各设备中选择目标设备时,可以从各设备中随机选择目标设备,以提高设备被选择的公平性,降低数据分布差异,从而便于提高全局模型的准确性,进而便于提高图像识别的准确性。
当然,在从各设备中选择目标设备时,也可以采用如下方式进行实现:获取各设备被选中的次数,然后,中心节点设备在进行目标设备选择时,按照各设备被选中次数从小到大的原则来从各设备中选择目标设备,以避免某些经常被选中的设备一直被选中,从而尽量减少图像集分布差异带来的影响,进而便于提高图像识别的准确性。
本申请实施例提供的一种图像识别方法,在将全局模型框架及全局权重发送至各设备之前,还可以包括:
对全局模型及全局权重进行加密。
在将全局模型及全局权重发送至各设备之前,中心节点设备可以对全局模型及全局权重进行加密,然后,设备在利用时对其进行解密,以保证数据传输的可靠性和安全性,从而便于提高图像识别的可靠性和安全性。
当然,中心节点设备在将当前全局权重发送至各设备之前,同样也可以对当前全局权重进行加密,且在将当前全局模型发送至各设备之前,也可以对当前全局模型进行加密,以保证数据传输的可靠性和安全性。
本申请实施例提供的一种图像识别装置,参见图3,其示出了本申请实施例提供的一种图像识别装置的结构示意图,可以包括:
第一发送模块31,用于将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各设备利用本地图像集对全局模型进行训练,得到本地模型权重;全局模型为带有全局权重的全局模型框架;
第一计算模块32,用于利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度,并利用平均模型伪梯度计算一阶矩估计;
第二发送模块33,用于根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至当前全局模型收敛或迭代轮次达到最大迭代次数为止;
识别模块34,用于获取待识别图像,利用当前全局模型对待识别图像进行识别。
本申请实施例提供的一种图像识别装置,还可以包括:
第二计算模块,用于在利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度时,利用全局权重及各目标设备的本地模型权重,计算平均绝对模型伪梯度,利用平均绝对模型伪梯度计算二阶矩估计;
相应地,第二发送模块可以包括:
得到权重单元,用于根据一阶矩估计和二阶矩估计得到当前全局权重。
本申请实施例提供的一种图像识别装置,第二计算模块可以包括:
第一计算单元,用于利用
Figure BDA0003156204780000111
计算平均绝对模型伪梯度Δ't;其中,t为当前迭代轮次,St为当前迭代轮次中参与训练的设备的集合,|St|为St中包含的设备的个数,
Figure BDA0003156204780000112
为模型伪梯度,
Figure BDA0003156204780000113
Figure BDA0003156204780000114
的绝对值,
Figure BDA0003156204780000115
Figure BDA0003156204780000116
为第i个设备在当前迭代轮次得到的本地模型权重,wt-1为上一迭代轮次的全局权重;
第二计算单元,用于利用
Figure BDA0003156204780000117
计算二阶矩估计vt;其中,vt-1为上一迭代轮次得到的二阶矩估计,β2为二阶矩估计的系数。
本申请实施例提供的一种图像识别装置,得到权重单元可以包括:
计算子单元,用于利用
Figure BDA0003156204780000118
计算全局模型的当前全局权重wt;其中,η0为全局学习率,γ为全局学习率递减系数,mt为当前迭代轮次得到的一阶矩估计,ζ为调节系数且大于0。
本申请实施例提供的一种图像识别装置,还可以包括:
选择模块,用于在确定全局模型不收敛或迭代次数未达到最大迭代次数时,从各设备中选择目标设备,其中,目标设备的数量小于设备的数量。
本申请实施例提供的一种图像识别装置,选择模块可以包括:
选择单元,用于从各设备中随机选择目标设备。
本申请实施例提供的一种图像识别装置,还可以包括:
加密模块,用于在将全局模型框架及全局权重发送至各设备之前,对全局模型及全局权重进行加密。
本申请实施例还提供了一种图像识别设备,参见图4,其示出了本申请实施例提供的一种图像识别设备的结构示意图,可以包括:
存储器41,用于存储计算机程序;
处理器42,用于执行存储器41存储的计算机程序时可实现如下步骤:
将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各设备利用本地图像集对全局模型进行训练,得到本地模型权重;全局模型为带有全局权重的全局模型框架;利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度,并利用平均模型伪梯度计算一阶矩估计;根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至当前全局模型收敛或迭代轮次达到最大迭代次数为止;获取待识别图像,利用当前全局模型对待识别图像进行识别。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各设备利用本地图像集对全局模型进行训练,得到本地模型权重;全局模型为带有全局权重的全局模型框架;利用全局权重及各目标设备的本地模型权重,计算平均模型伪梯度,并利用平均模型伪梯度计算一阶矩估计;根据一阶矩估计得到当前全局权重,根据当前全局权重得到当前全局模型,将当前全局权重发送至各设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至当前全局模型收敛或迭代轮次达到最大迭代次数为止;获取待识别图像,利用当前全局模型对待识别图像进行识别。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的一种图像识别装置、设备及计算机可读存储介质中相关部分的说明可以参见本申请实施例提供的一种图像识别方法中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各所述设备利用本地图像集对全局模型进行训练,得到本地模型权重;所述全局模型为带有所述全局权重的全局模型框架;
利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度,并利用所述平均模型伪梯度计算一阶矩估计;
根据所述一阶矩估计得到当前全局权重,根据所述当前全局权重得到当前全局模型,将所述当前全局权重发送至各所述设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止;
获取待识别图像,利用所述当前全局模型对待识别图像进行识别。
2.根据权利要求1所述的图像识别方法,其特征在于,在利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度时,还包括:
利用所述全局权重及各所述目标设备的本地模型权重,计算平均绝对模型伪梯度,利用所述平均绝对模型伪梯度计算二阶矩估计;
相应地,根据所述一阶矩估计得到当前全局权重,包括:
根据所述一阶矩估计和所述二阶矩估计得到所述当前全局权重。
3.根据权利要求2所述的图像识别方法,其特征在于,利用所述全局权重及各所述目标设备的本地模型权重,计算平均绝对模型伪梯度,利用所述平均绝对模型伪梯度计算二阶矩估计,包括:
利用
Figure FDA0003156204770000011
计算所述平均绝对模型伪梯度Δ't;其中,t为当前迭代轮次,St为当前迭代轮次中参与训练的设备的集合,|St|为St中包含的设备的个数,
Figure FDA0003156204770000012
为模型伪梯度,
Figure FDA0003156204770000013
Figure FDA0003156204770000014
的绝对值,
Figure FDA0003156204770000015
Figure FDA0003156204770000016
为第i个设备在当前迭代轮次得到的本地模型权重,wt-1为上一迭代轮次的全局权重;
利用
Figure FDA0003156204770000017
计算二阶矩估计vt;其中,vt-1为上一迭代轮次得到的二阶矩估计,β2为二阶矩估计的系数。
4.根据权利要求3所述的图像识别方法,其特征在于,根据所述一阶矩估计和所述二阶矩估计得到当前全局权重,包括:
利用
Figure FDA0003156204770000021
计算当前全局权重wt;其中,η0为全局学习率,γ为全局学习率递减系数,mt为当前迭代轮次得到的一阶矩估计,ζ为调节系数且大于0。
5.根据权利要求1所述的图像识别方法,其特征在于,在确定所述全局模型不收敛或所述迭代次数未达到最大迭代次数时,还包括:
从各所述设备中选择目标设备,其中,所述目标设备的数量小于所述设备的总数量。
6.根据权利要求5所述的图像识别方法,其特征在于,从各所述设备中选择目标设备,包括:
从各所述设备中随机选择所述目标设备。
7.根据权利要求1至6任一项所述的图像识别方法,其特征在于,在将全局模型框架及全局权重发送至各设备之前,还包括:
对所述全局模型框架及所述全局权重进行加密。
8.一种图像识别装置,其特征在于,包括:
第一发送模块,用于将全局模型框架及全局权重发送至各设备,判断全局模型是否收敛或迭代次数是否达到最大迭代次数,若否,由各所述设备利用本地图像集对全局模型进行训练,得到本地模型权重;所述全局模型为带有所述全局权重的全局模型框架;
第一计算模块,用于利用所述全局权重及各所述目标设备的本地模型权重,计算平均模型伪梯度,并利用所述平均模型伪梯度计算一阶矩估计;
第二发送模块,用于根据所述一阶矩估计得到当前全局权重,根据所述当前全局权重得到当前全局模型,将所述当前全局权重发送至各所述设备,并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤,直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止;
识别模块,用于获取待识别图像,利用所述当前全局模型对待识别图像进行识别。
9.一种图像识别设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的图像识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的图像识别方法的步骤。
CN202110779957.0A 2021-07-09 2021-07-09 一种图像识别方法、装置、设备及计算机可读存储介质 Active CN113378994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110779957.0A CN113378994B (zh) 2021-07-09 2021-07-09 一种图像识别方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110779957.0A CN113378994B (zh) 2021-07-09 2021-07-09 一种图像识别方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113378994A true CN113378994A (zh) 2021-09-10
CN113378994B CN113378994B (zh) 2022-09-02

Family

ID=77581608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110779957.0A Active CN113378994B (zh) 2021-07-09 2021-07-09 一种图像识别方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113378994B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681973A (zh) * 2023-08-03 2023-09-01 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质
CN116704296A (zh) * 2023-08-04 2023-09-05 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582410A (zh) * 2020-07-16 2020-08-25 平安国际智慧城市科技股份有限公司 图像识别模型训练方法、装置、计算机设备及存储介质
CN111723947A (zh) * 2020-06-19 2020-09-29 深圳前海微众银行股份有限公司 一种联邦学习模型的训练方法及装置
CN111768008A (zh) * 2020-06-30 2020-10-13 平安科技(深圳)有限公司 联邦学习方法、装置、设备和存储介质
CN111814985A (zh) * 2020-06-30 2020-10-23 平安科技(深圳)有限公司 联邦学习网络下的模型训练方法及其相关设备
US20210049473A1 (en) * 2019-08-14 2021-02-18 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Robust Federated Training of Neural Networks
US20210065002A1 (en) * 2018-05-17 2021-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concepts for distributed learning of neural networks and/or transmission of parameterization updates therefor
US20210073639A1 (en) * 2018-12-04 2021-03-11 Google Llc Federated Learning with Adaptive Optimization
CN112949837A (zh) * 2021-04-13 2021-06-11 中国人民武装警察部队警官学院 一种基于可信网络的目标识别联邦深度学习方法
CN113033652A (zh) * 2021-03-23 2021-06-25 电子科技大学 一种基于区块链与联邦学习的图像识别系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210065002A1 (en) * 2018-05-17 2021-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concepts for distributed learning of neural networks and/or transmission of parameterization updates therefor
US20210073639A1 (en) * 2018-12-04 2021-03-11 Google Llc Federated Learning with Adaptive Optimization
US20210049473A1 (en) * 2019-08-14 2021-02-18 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Robust Federated Training of Neural Networks
CN111723947A (zh) * 2020-06-19 2020-09-29 深圳前海微众银行股份有限公司 一种联邦学习模型的训练方法及装置
CN111768008A (zh) * 2020-06-30 2020-10-13 平安科技(深圳)有限公司 联邦学习方法、装置、设备和存储介质
CN111814985A (zh) * 2020-06-30 2020-10-23 平安科技(深圳)有限公司 联邦学习网络下的模型训练方法及其相关设备
CN111582410A (zh) * 2020-07-16 2020-08-25 平安国际智慧城市科技股份有限公司 图像识别模型训练方法、装置、计算机设备及存储介质
CN113033652A (zh) * 2021-03-23 2021-06-25 电子科技大学 一种基于区块链与联邦学习的图像识别系统及方法
CN112949837A (zh) * 2021-04-13 2021-06-11 中国人民武装警察部队警官学院 一种基于可信网络的目标识别联邦深度学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MICHAEL ZHANG 等: "Personalized Federated Learning with First Order Model Optimization", 《ARXIV:2012.08565》 *
MINGCHEN 等: "FedSA: A staleness-aware asynchronous Federated Learning algorithm with non-IID data", 《FUTURE GENERATION COMPUTER SYSTEMS》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681973A (zh) * 2023-08-03 2023-09-01 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质
CN116681973B (zh) * 2023-08-03 2023-11-03 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质
CN116704296A (zh) * 2023-08-04 2023-09-05 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质
CN116704296B (zh) * 2023-08-04 2023-11-03 浪潮电子信息产业股份有限公司 一种图像处理方法、装置、系统、设备及计算机存储介质

Also Published As

Publication number Publication date
CN113378994B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN113378994B (zh) 一种图像识别方法、装置、设备及计算机可读存储介质
CN111091199B (zh) 一种基于差分隐私的联邦学习方法、装置及存储介质
WO2021233030A1 (en) Methods and apparatuses for federated learning
WO2015103964A1 (en) Method, apparatus, and device for determining target user
JP2019528502A (ja) パターン認識に適用可能なモデルを最適化するための方法および装置ならびに端末デバイス
CN111444009A (zh) 一种基于深度强化学习的资源分配方法及装置
CN101782805A (zh) 信息处理设备、信息处理方法和程序
US9436907B2 (en) Method and system for calculating value of website visitor
CN108074016B (zh) 基于位置社交网络的用户关系强度预测方法、装置及设备
CN112465043B (zh) 模型训练方法、装置和设备
CN105869022B (zh) 一种应用流行度预测方法和装置
US20220237508A1 (en) Servers, methods and systems for second order federated learning
CN111144566A (zh) 神经网络权重参数的训练方法、特征分类方法及对应装置
CN111428639A (zh) 手势识别模型的训练方法、手势识别方法及装置
CN110874638B (zh) 面向行为分析的元知识联邦方法、装置、电子设备及系统
CN113051486A (zh) 基于交友场景的推荐模型的训练方法、装置、电子设备和计算机可读存储介质
CN115359334A (zh) 多任务学习深度网络的训练方法及目标检测方法、装置
CN111222553A (zh) 机器学习模型的训练数据处理方法、装置和计算机设备
CN107728772B (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN110349571B (zh) 一种基于连接时序分类的训练方法及相关装置
JP6969678B2 (ja) 画像判定システム、画像判定方法および画像判定プログラム
CN108429771B (zh) 基于突变理论的软件定义网络安全状态评估方法及装置
CN116467747A (zh) 一种联邦学习隐私保护方法及系统
CN115146788A (zh) 分布式机器学习模型的训练方法、装置、电设备存储介质
CN112116024B (zh) 用户分类模型的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant