CN113239879A

CN113239879A - 联邦模型训练、证件检测方法、装置、设备及介质

Info

Publication number: CN113239879A
Application number: CN202110611228.4A
Authority: CN
Inventors: 李泽远; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-06-01
Filing date: 2021-06-01
Publication date: 2021-08-10
Anticipated expiration: 2041-06-01
Also published as: CN113239879B

Abstract

本发明涉及人工智能的检测模型技术领域，提供一种联邦模型训练、证件检测方法、装置、设备及介质，方法包括：通过获取参与方全集初始证件联邦模型；并按照预设筛选方案，从参与方全集中筛选出合格参与方子集；向参与终端发送初始证件联邦模型；接收回传的模型参数和性能消耗参数；运用Fedavg算法，对模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据模型迭代参数和模型参数以及性能消耗参数，确定贡献度和激励值；在检测未达到预设的收敛条件时，更新合格参与方子集，并根据模型迭代参数迭代更新初始证件联邦模型，直至收敛获得证件检测模型。本发明实现了通过贡献度和激励值来激励终端参与模型训练，提高了联邦学习的效率和准确性。

Description

联邦模型训练、证件检测方法、装置、设备及介质

技术领域

本发明涉及人工智能的检测模型技术领域，尤其涉及一种联邦模型训练、证件检测方法、装置、计算机设备及存储介质。

背景技术

随着机器学习的日益普及，大数据驱动的智能应用将很快应用于我们日常生活的各个方面，包括智能语音，医疗，交通等等。但是，在传统的机器学习方法中，保障训练模型的精确性的关键是收集足够数量的数据，而数据之中可能包含有关个人的私人信息，例如证件照片等，这引发了公众对于个人隐私受到损害的种种担忧。

最近，联邦学习因其在隐私保护方面的显着优势受到越来越多的广泛应用，但是，大多数现有联邦学习系统都乐观地假设有足够的用户愿意参加联邦学习，实际上，由于参与终端需要耗费大量计算与通信资源，并需要贡献出本地的数据，参与终端就缺乏主动或者没有动力加入联邦学习过程中，导致不利于联邦学习的训练和推广，模型训练的准确率不高，以及训练的周期长。

发明内容

本发明提供一种联邦模型训练、证件检测方法、装置、计算机设备及存储介质，实现了根据合格参与方子集中的各参与终端回传的模型参数和性能消耗参数，运用Fedavg算法计算出模型迭代参数，以及通过贡献激励模型，确定出各个参与终端的贡献度和激励值，通过贡献度和激励值来激励终端参与模型训练，弥补了联邦学习的主动性和有效性的缺陷，提高了联邦学习的效率和准确性。

一种联邦模型训练方法，包括：

获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集；

向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型；

接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得；所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标；

运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值；

在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。

一种证件检测方法，包括：

接收识别指令，获取所述识别指令中的待检测证件照；

将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型；

通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取，根据提取的所述证件特征输出所述待检测证件照的识别结果；所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对应的证件照片。

一种联邦模型训练装置，包括：

获取模块，用于获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集；

发送模块，用于向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型；

接收回传模块，用于接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得；所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标；

聚合模块，用于运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值；

训练模块，用于在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。

一种证件检测装置，包括：

接收模块，用于接收识别指令，获取所述识别指令中的待检测证件照；

输入模块，用于将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型；

检测模块，用于通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取，根据提取的所述证件特征输出所述待检测证件照的识别结果；所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对应的证件照片。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述联邦模型训练方法的步骤，或者所述处理器执行所述计算机程序时实现上述证件检测方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序被处理器执行时实现上述联邦模型训练方法的步骤，或者所述计算机程序被处理器执行所述计算机程序时实现上述证件检测方法的步骤。

本发明提供的联邦模型训练方法、装置、计算机设备及存储介质，通过获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集；向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型；接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值；在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型，如此，实现了通过筛选方案，筛选出合格参与方子集，根据合格参与方子集中的各参与终端回传的模型参数和性能消耗参数，运用Fedavg算法计算出模型迭代参数，以及通过贡献激励模型，确定出各个参与终端的贡献度和激励值，通过贡献度和激励值来激励终端参与模型训练，弥补了联邦学习的主动性和有效性的缺陷，提高了联邦学习的效率和准确性。

本发明提供的证件检测方法、装置、计算机设备及存储介质，通过获取所述识别指令中的待检测证件照，通过上述基于激励的联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型提取与预设证件标签对应的证件特征，根据提取的所述证件特征输出所述待检测证件照的识别结果，通过训练完成的证件检测模型能够快速地及准确地识别出是否为预设证件标签的证件照片，提高了识别的准确率和质量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中联邦模型训练方法或证件检测方法的应用环境示意图；

图2是本发明一实施例中联邦模型训练方法的流程图；

图3是本发明一实施例中联邦模型训练方法的步骤S40的流程图；

图4是本发明另一实施例中联邦模型训练方法的步骤S40的流程图；

图5是本发明一实施例中证件检测方法的流程图；

图6是本发明一实施例中联邦模型训练装置的原理框图；

图7是本发明一实施例中证件检测装置的原理框图；

图8是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的联邦模型训练方法，可应用在如图1的应用环境中，其中，客户端(计算机设备)通过网络与服务器进行通信。其中，客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种联邦模型训练方法，其技术方案主要包括以下步骤S10-S50：

S10，获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集。

可理解地，所述参与方全集为同意参与训练的终端或者客户端的全集，所述初始证件联邦模型为将要进行联邦学习训练的模型，所述初始证件联邦模型为从联邦模型库中迁移的历史训练完成的神经网络模型，所述预设筛选方案可根据需求设定，比如预设筛选方案为在所述参与方全集中随机选择，或者依据一定的规则选取终端或客户端，或者在所述参与方全集中选择同一以及相邻的集群下的客户端等，其中，一定的规则可以设定为选取终端响应时长低于阈值的规则，因为某一客户端的终端响应时长大于或者等于阈值，说明该客户端的网络信号不稳定或者带宽受限，对于联邦学习的效率存在影响，所以选取终端响应时长低于阈值的客户端，有利于所述初始证件联邦模型的联邦学习，所述参与方子集为参与所述初始证件联邦模型的本轮的联邦学习的终端或者客户端，所述参与方子集后续会根据各个参与训练的终端或者客户端的激励情况进行更新。

在一实施例中，所述步骤S10之前，即所述获取参与方全集和用于识别证件标签的初始证件联邦模型之前，包括：

S101，接收训练任务请求，获取所述训练任务请求中的证件数据和集群清单；所述证件数据包括证件描述和证件格式。

可理解地，所述证件数据为与需要识别的证件相关的数据，所述证件数据包括所述证件描述和所述证件格式，所述证件描述为对需要识别的证件的描述，所述证件格式为存储的数据格式，例如jpg格式，png格式等等，所述集群清单为当前集群下接收服务的所有终端或者客户端的清单。

S102，通过证件类型识别模型对所述证件格式进行格式识别，得到与所述证件数据对应的所述证件类型。

可理解地，所述证件类型识别模型为用于识别输入的数据格式的证件类型，所述格式识别的方式可以通过查找与所述证件格式匹配的格式名，再根据该格式名映射出证件类型，也可以通过打开所述证件格式的打开方式确定出证件类型的识别过程。

其中，所述证件类型包括图像、文本和表格等等。

S103，提取所述证件描述中的关键特征，并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型，将获取的所述初始化联邦模型记录为所述初始证件联邦模型。

可理解地，通过关键提取模型提取所述证件描述中的所述关键特征，所述关键提取模型为训练完成的用于提取输入的内容中的关键特征并识别出关键词的神经网络模型，所述关键特征为所述证件描述中的关键描述信息的特征，根据提取的所述关键特征识别出所述证件描述中的所有关键词，根据所有所述关键词，从所述联邦模型库中获取出与其匹配的所述初始化联邦模型，所述联邦模型库中存储了所有所述初始化联邦模型，一个所述初始联邦模型与多个模型关键词关联，所述初始化联邦模型为包含初始参数信息和必要参数的基于联邦学习的神经网络模型，例如初始参数信息为数据格式，层数，单元数，损失函数，学习率和激活函数；必要参数为申请期限，开始时间T，每轮训练将会选择的参与者数量k等等，将获取的所述初始联邦模型记录为所述初始证件联邦模型，从而完成迁移操作。

在一实施例中，所述步骤S103中，即所述提取所述证件描述中的关键特征，并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型，将获取的所述初始化联邦模型记录为所述初始证件联邦模型，包括：

S1031，运用爬取技术，爬取与所述证件描述匹配的证件信息。

可理解地，所述爬取技术为运用网络爬虫技术从互联网中爬取与所述证件描述匹配的相关描述的相关网站，从相关网站中的相关描述进行汇总提取出关键词及各个关键词的出现次数，将提取的关键词和所述证件描述进行聚合，即将所述证件描述中赋予与提取的关键词相同的词语进行加权，通过加权可以将所述证件描述中的重要的词语进行重点关注的对象的技术，将重点关注的对象作为与所述证件描述匹配的所述证件信息，例如：证件描述为含有人脸头像、18位字符的矩形证件，通过爬取技术，从互联网中爬取到矩形证件，并对人脸头像、18位字符和矩形进行了加权，将其确定为证件信息。

S1032，通过信息提取模型对所有所述证件信息进行关键特征提取，并根据提取的所述关键特征输出关键信息结果；所述关键信息结果包括所述证件标签和模型标签；

可理解地，所述信息提取模型为训练完成且用于识别适用的关键信息结果的神经网络模型，所述关键特征提取为与证件类型相关的特征，提取所述关键特征的过程为将所述证件信息进行词嵌入向量转换，将所述证件信息转换成相应的词向量，将转换后的词向量进行卷积，卷积出各证件类型的相关向量特征的过程，对卷积获得的向量特征进行两条支路的分类，一条支路为证件类型的分类任务，一条支路为适用于该证件类型的模型类型的分类任务，即从证件类型的分类任务中分出模型类型的映射关系分类的任务，从而将概率值最大的证件类型确定为所述关键信息结果中的所述证件标签，并根据该概率值最大的证件类型结合卷积获得的向量特征进行映射分类，确定出所述关键信息结果中的所述模型标签，所述证件标签包括身份证标签、护照标签、驾驶证标签和工作证标签等等，所述模型标签包括身份证件检测模型、护照证件检测模型、驾驶证件检测模型和个性化证件检测模型等等。

S1033，通过迁移学习技术，从联邦模型库中迁移与所述模型标签匹配的初始化联邦模型，将迁移的所述初始化联邦模型记录为用于识别所述证件标签的所述初始证件联邦模型。

可理解地，所述迁移学习技术为将训练完成的与所述模型标签匹配的初始化联邦模型中的所有参数迁移至该初始证件联邦模型中的技术，所述联邦模型库中存储了所有所述初始化联邦模型，一个所述初始联邦模型与多个模型关键词关联，从所述联邦模型库中查找到与所述模型标签匹配的所述初始化联邦模型，其匹配的方式可以根据需求设定，比如采用余弦文本相似度算法，计算所述模型标签和与各所述初始化联邦模型关联的模型关键词的相似度值，根据一个所述初始化联邦模型关联的各模型关键词的相似度值，确定出所述模型标签与该初始化联邦模型的相似度，从而获取与最大的相似度对应的所述初始化联邦模型确定为需要迁移的初始化联邦模型，运用迁移学习技术，迁移至初始证件联邦模型中，迁移完成后将其记录为用于识别所述证件标签的所述初始证件联邦模型。

本发明实现了通过运用爬取技术，爬取与所述证件描述匹配的证件信息；通过信息提取模型对所有所述证件信息进行关键特征提取，并根据提取的所述关键特征输出包含有证件标签和模型标签的关键信息结果；通过迁移学习技术，从联邦模型库中迁移与所述模型标签匹配的初始化联邦模型，将迁移的所述初始化联邦模型记录为用于识别所述证件标签的所述初始证件联邦模型，如此，实现了通过运用爬取技术、信息提取模型的关键特征提取及识别和运用迁移学习技术，能够自动从联邦模型库中迁移最为适用于证件描述的识别的初始证件联邦模型，减少了人工识别初始证件联邦模型的过程，便于后续联邦学习，减少联邦学习的学习迭代次数，能够为后续的联邦学习提高效率。

S104，向所述集群清单中的终端发送参与请求。

可理解地，向与所述集群清单中的IP地址对应的终端或者客户端发送所述参与请求，所述参与请求为邀请终端或者客户端参与本轮的联邦学习的请求。

S105，接收来自所述终端返回的同意通知；所述同意通知表明了接收所述参与请求后的所述终端同意参与训练。

可理解地，所述终端可以根据需求设定，例如：有需求的企业用户、个人用户等，所述终端将会根据自身情况权衡，决定是否参与该训练任务，愿意参与的所述终端将返回所述同意通知，所述同意通知表明了接收所述参与请求后的所述终端同意参与训练。

S106，将返回所述同意通知的所述终端记录为所述参与终端，并根据所有所述参与终端确定为所述参与方全集。

可理解地，接收到同意参与训练的所述终端(也可称为客户端)返回的所述同意通知之后，将该终端标记为所述参与终端，将在预设时间段内收集到的所有所述参与终端确定为所述参与方全集。

本发明实现了接收训练任务请求，获取所述训练任务请求中的证件数据和集群清单；所述证件数据包括证件描述和证件格式；通过证件类型识别模型对所述证件格式进行格式识别，得到与所述证件数据对应的所述证件类型；提取所述证件描述中的关键特征，并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型，将获取的所述初始化联邦模型记录为所述初始证件联邦模型；向所述集群清单中的终端发送参与请求；接收来自所述终端返回的同意通知；所述同意通知表明了接收所述参与请求后的所述终端同意参与训练；将返回所述同意通知的所述终端记录为所述参与终端，并根据所有所述参与终端确定为所述参与方全集，如此，实现了自动识别证件类型和提取关键特征，从联邦模型库中自动匹配出初始证件联邦模型，有利于后续联邦学习的训练过程，以及自动收集同意参与训练的终端，得到参与方全集，有利于后续联邦学习中获取有用的训练参数，避免不同意参与训练的终端反馈的无用信息。

S20，向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型。

可理解地，发送的方式可以根据需求设定，比如通过Docker镜像推送技术，向各所述参与终端发送所述初始证件联邦模型，所述Docker镜像推送技术为将所述初始证件联邦模型传输至Docker容器(为一个开源的应用容器引擎)，该Docker容器将其转成镜像文件，再将该镜像文件通过该Docker容器推送至各个参与终端，提高了传输速度和保证了初始证件联邦模型的安全性、完整性及正确性。

S30，接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得；所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标。

可理解地，所述参与终端根据接收到的所述初始证件联邦模型，在所述参与终端的存储数据中查找与所述证件类型对应的所述本地证件数据，查找的过程可以根据需求设定，比如人为选择，或者通过自然语言识别模型检索所有存储数据中与所述证件类型相似的所述本地证件数据，所述本地证件数据为存储在该参与终端中的符合所述证件类型的存储数据，通过将查找到的所有所述本地证件数据输入该初始证件联邦模型中，对该初始证件联邦模型进行训练学习，学习获得该参与终端的所述模型参数，以及回传所述模型参数的同时回传计算数据量fn、基站分配信道情况An带宽w、传输功率pn等信息，作为所述性能消耗参数。

其中，所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得；所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标。

S40，运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值。

可理解地，所述Fedavg算法为通过迭代，对各个所述参与终端增加计算超参数以增加该参与终端添加训练过程中的权重，所述超参数为所述参与终端参与训练的本地证件数据占所有参与终端训练过程中的占比等相关参数，运用所述Fedavg算法，能够更加宏观地衡量出各所述参与终端的所述模型参数的有效占比，从而进行聚合后得到所述模型迭代参数。

所述贡献激励模型实现了自动识别出本次训练过程中各个所述参与终端的所述贡献度和所述激励值，所述贡献度为一个参与终端在本次训练中消耗的所述性能参数和模型参数对所述模型迭代参数的贡献程度，所述激励值为一个参与终端在本次训练中获得的激励或奖励程度，首先，通过总通信消耗函数，根据与所述参与终端对应的所述通信传输参数和所述更新容量，计算出与所述参与终端对应的总通信消耗值；将与所述参与终端对应的所述资源消耗值和所述总通信消耗值输入总资源消耗函数中，计算出与该参与终端对应的总资源消耗值；其次，运用合作博弈论算法，将所述模型迭代参数和与所述参与终端对应的所述模型参数输入评估模型中，通过评估模型评估出与所述参与终端对应的所述贡献度；最后，根据与所述参与终端对应的总资源消耗值和所述贡献度，确定与所述参与终端对应的所述激励值。

在一实施例中，如图3所示，所述步骤S40中，即所述运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，包括：

S401，获取所有所述参与终端权重；所述合格参与方子集还包括与各所述参与终端对应的参与终端权重。

可理解地，所述参与终端权重为根据所述参与终端的性能而赋予的权重值，所述合格参与方子集还包括与各所述参与终端一一对应的所述参与终端权重。

S402，运用所述Fedavg算法，根据所有所述参与终端权重，对所有所述模型参数进行分层分布及聚合，得到与所述初始证件联邦模型中的各层对应的平均参数子集。

可理解地，根据回传的所述模型参数，运用所述Fedavg算法进行聚合，所有所述模型参数进行分层分布及聚合的处理过程为将每个所述参与终端回传的所述模型参数中各层在联邦学习后获得的平均值，与该参与终端的参与终端权重进行加权，再将加权后的值求和得到初始证件联邦模型中各层的参数值，将其确定为与所述初始证件联邦模型中的各层对应的平均参数子集，

其中，所述Fedavg算法为运用Fedavg公式计算的算法，所述Fedavg公式为：

其中，

为第k个参与终端训练后的模型数据的各层平均值，i的范围为1至 I，I为所有参与终端的数量总和；

n_i为第i个参与终端的参与终端权重；

w_t为平均参数子集。

S403，将所有所述平均参数子集确定为所述模型迭代参数。

可理解地，将所有所述平均参数子集记录为所述模型迭代参数，所述模型迭代参数为本轮联邦学习后需要迭代初始证件联邦模型的各层参数。

本发明实现了获取所有所述参与终端权重；所述合格参与方子集还包括与各所述参与终端的参与终端权重；运用所述Fedavg算法，根据所有所述参与终端权重，对所有所述模型参数进行分层分布及聚合，得到与所述初始证件联邦模型中的各层对应的平均参数子集；将所有所述平均参数子集确定为所述模型迭代参数，如此，实现了运用Fedavg算法，自动将收集到的所有参与中单回传的模型参数科学地输出需要迭代的模型迭代参数，提高了联邦学习的效率和准确率。

在一实施例中，如图4所示，所述步骤S40中，即所述通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值，包括：

S404，通过总通信消耗函数，根据与所述参与终端对应的所述通信传输参数和所述更新容量，计算出与所述参与终端对应的总通信消耗值；所述性能消耗参数包括资源消耗值、通信传输参数和更新容量。

可理解地，所述总通信消耗函数为计算各个参与终端在通信过程中消耗的指标的一系列公式的函数，包括一次参与终端迭代的单个资源消耗值的计算公式，通信速率的计算公式，在一次迭代中更新初始证件联邦模型的传输时间的计算公式以及总通信消耗值的计算公式等等，所述通信传输参数包括贡献计算数据量、CPU周期数、链路带宽、天线数量、传输功率、信道增益和环境噪声等与通信传输相关的参数。

其中，第i个参与终端为该参与终端中的模型训练贡献的贡献计算数据量 fi，ci表示第i个参与终端在本地训练中执行一个数据样本所需的CPU周期数，因此，一次参与终端迭代的第i个参与终端的单个资源消耗值表示为

考虑基于OFDMA(正交频分多址，Orthogonal Frequency Division Multiple Access)的蜂窝系统的上行链路传输，w代表链路带宽，Ai 用于代表第i个参与终端所处的基站向其分配的天线数量，pi是传输功率，hi 是第i个参与终端与基站之间对等链路的信道增益，N0是环境噪声，因此，第i各参与终端的通信速率ri可以表示为：

，因此，在一次迭代中更新初始证件联邦模型的传输时间为：

，其中，σ用于表示本轮训练中初始证件联邦模型更新的数据大小，即所述更新容量，因此，在一次全局迭代中，第i个参与终端的总通信消耗值

表示为：

，如此，可获得与所述参与终端对应的总通信消耗值。

S405，根据与所述参与终端对应的所述资源消耗值和所述总通信消耗值，确定与所述参与终端对应的总资源消耗值。

可理解地，运用总资源消耗公式，计算在一次全局迭代中，参与终端i 的总资源消耗值，所述总资源消耗公式为：

其中，

为第i个参与终端的总资源消耗值；

为第i个参与终端的单个资源消耗值；

为第i个参与终端的总通信消耗值。

S406，运用合作博弈论算法，根据所述模型迭代参数和与所述参与终端对应的所述模型参数，评估出与所述参与终端对应的所述贡献度。

可理解地，所述合作博弈论算法又称shapleyvalue算法，在合作赢取奖励的场景中，有n个参与终端参与，集合N＝{x1,x2,…,xn}用于表示x1-xn参与终端的全集，函数v用于给出包含一定参与终端后的协作所能获得的奖励，或可以被理解为这些参与终端的贡献。令S为N的子集，则对于协作场景(N， v)，我们可以使用下列公式来计算参与终端i能获得的奖励，即Shapley值。

Shapley Value可以被理解为求边际贡献的均值。例如A单独工作产生价值v(A)，A和B共同工作之后共同产生价值v(A,B)，那么B的贡献为 v(A,B)-v(A)。如果拓展到3个参与方的情况，则思路是枚举所有全集的子集序列(共N！个)，然后计算其中每个元素的边际贡献，最后再求均值。例如对于参与方A，B，C，如果目前要计算A的贡献，则枚举所有子集{A}{B}{C}{A,B}{A,C}{B,C}，其中排除A参与方的子集有{B}{C}{B,C}，用 S代表这一类子集，计算子集包含参与方A与不包含A的差值即对于该子集 A的边际贡献，最后求平均，即，计算边际值 (v(AB)-V(B)),(V(AC)-V(C)),(V(ABC)-V(BC))并求平均。

在联邦学习服务方案对本次参与训练的客户端的贡献进行评估时，假设该次训练选择下发模型给n个参与终端，每个参与终端提交回来的模型为xi，集合N＝{x1,x2,…,xn}用于表示x1-xn参与终端提交的模型的全集。服务方将对客户端节点回传的模型用预留的标准数据集进行测试验证，得到回传模型的精度，用函数v表示。

对于协作场景(n，v)，服务方使用下列公式来计算第i个参与终端在本轮训练中的贡献度。

其中，v(S∪i)代表将S子集与i聚合之后得到的模型用标准测试数据集测试的精度结果，v(S)代表S子集得到的模型用标准测试数据集测试的精度结果。

S407，根据与所述参与终端对应的总资源消耗值和所述贡献度，确定与所述参与终端对应的所述激励值。

可理解地，根据与所述参与终端对应的总资源消耗值和所述贡献度确定两个奖励池的大小，一个为补偿成本的奖励池A，一个为奖励参与贡献的奖励池B。针对每个参与终端，服务方同时计算两种奖励，

为总资源消耗值，

为贡献度，激励的原则是，如果参与终端参与训练付出的总资源消耗值高于预设消耗阈值，则贡献度会覆盖其总资源消耗值，因此，最终的激励值为

第i个参与终端

的计算：

第i个参与终端

的计算：

本发明实现了通过总通信消耗函数，根据与所述参与终端对应的所述通信传输参数和所述更新容量，计算出与所述参与终端对应的总通信消耗值；所述性能消耗参数包括资源消耗值、通信传输参数和更新容量；根据与所述参与终端对应的所述资源消耗值和所述总通信消耗值，确定与所述参与终端对应的总资源消耗值；运用合作博弈论算法，根据所述模型迭代参数和与所述参与终端对应的所述模型参数，评估出与所述参与终端对应的所述贡献度；根据与所述参与终端对应的总资源消耗值和所述贡献度，确定与所述参与终端对应的所述激励值，如此，实现了通过贡献激励模型，科学地、准确地确定出各个参与终端的贡献度和激励值，通过贡献度和激励值来激励参与终端参与模型训练，弥补了联邦学习的主动性和有效性的缺陷，提高了联邦学习的效率和准确性。

S50，在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。

可理解地，在检测到所述模型迭代参数未达到预设的收敛条件时，所述收敛条件可以根据需求设定，比如所述模型迭代参数的精度达到预设阈值，或者迭代的次数达到预设次数等等，根据所有所述贡献度和所述激励值更新所述合格参与方子集，即根据各自的贡献度筛选出贡献度大于预设贡献阈值的参与终端，将其确定为更新后的所述合格参与方子集，表明下一次训练的参与终端可以与本次训练的参与终端不相同，根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，重复后续步骤直到所述模型迭代参数达到所述预设的收敛条件时，停止训练，将收敛之后的所述初始证件联邦模型记录为训练完成的所述证件检测模型。

本发明实现了通过获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集；向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型；接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值；在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型，如此，实现了通过筛选方案，筛选出合格参与方子集，根据合格参与方子集中的各参与终端回传的模型参数和性能消耗参数，运用Fedavg算法计算出模型迭代参数，以及通过贡献激励模型，确定出各个参与终端的贡献度和激励值，通过贡献度和激励值来激励终端参与模型训练，弥补了联邦学习的主动性和有效性的缺陷，提高了联邦学习的效率和准确性。

本发明提供的证件检测方法，可应用在如图1的应用环境中，其中，客户端(计算机设备)通过网络与服务器进行通信。其中，客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图5所示，提供一种证件检测方法，其技术方案主要包括以下步骤S100-S300：

S100，接收识别指令，获取所述识别指令中的待检测证件照。

可理解地，所述待检测证件照为需要识别的证件照片，在需要对所述待检测证件照进行识别时触发所述识别指令。

S200，将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型。

可理解地，所述证件检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型，所述证件检测模型为用于识别预设证件标签的模型，该预设证件标签为选取的证件的类型，该预设证件标签可以为通过上述联邦模型训练方法中对需识别的证件的描述中提取及识别，例如：预设证件标签为身份证标签。

S300，通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取，根据提取的所述证件特征输出所述待检测证件照的识别结果；所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对应的证件照片。

可理解地，与所述预设证件标签对应的证件特征为训练完成的所述证件检测模型在训练过程中学习的与所述预设证件标签相关的特征，通过所述证件检测模型对提取的所述证件特征进行识别，可以识别出所述待检测证件照是否为所述预设证件标签的所述识别结果，所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对应的证件照片。

本发明实现了通过获取所述识别指令中的待检测证件照，通过上述基于激励的联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型提取与预设证件标签对应的证件特征，根据提取的所述证件特征输出所述待检测证件照的识别结果，通过训练完成的证件检测模型能够快速地及准确地识别出是否为预设证件标签的证件照片，提高了识别的准确率和质量。

在一实施例中，提供一种联邦模型训练装置，该联邦模型训练装置与上述实施例中联邦模型训练方法一一对应。如图6所示，该联邦模型训练装置包括获取模块11、发送模块12、接收回传模块13、聚合模块14和训练模块15。各功能模块详细说明如下：

获取模块11，用于获取参与方全集和用于识别证件标签的初始证件联邦模型；并按照预设筛选方案，从所述参与方全集中筛选出合格参与方子集；

发送模块12，用于向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型；

接收回传模块13，用于接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数；所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得；所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标；

聚合模块14，用于运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，同时通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值；

训练模块15，用于在检测到所述模型迭代参数未达到预设的收敛条件时，根据所有所述贡献度和所述激励值更新所述合格参与方子集，并根据所述模型迭代参数迭代更新初始证件联邦模型，以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤，直至所述模型迭代参数达到所述预设的收敛条件时，将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。

关于联邦模型训练装置的具体限定可以参见上文中对于联邦模型训练方法的限定，在此不再赘述。上述联邦模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一实施例中，提供一种证件检测装置，该证件检测装置与上述实施例中证件检测方法一一对应。如图7所示，该证件检测装置包括接收模块101 输入模块102和检测模块103。各功能模块详细说明如下：

接收模块101，用于接收识别指令，获取所述识别指令中的待检测证件照；

输入模块102，用于将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型；

检测模块103，用于通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取，根据提取的所述证件特征输出所述待检测证件照的识别结果；所述识别结果表征了所述待检测证件照是否为与预设所述证件标签对应的证件照片。

关于证件检测装置的具体限定可以参见上文中对于证件检测方法的限定，在此不再赘述。上述证件检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种联邦模型训练方法，或者证件检测方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中联邦模型训练方法，或者处理器执行计算机程序时实现上述实施例中证件检测方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中联邦模型训练方法，或者计算机程序被处理器执行时实现上述实施例中证件检测方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM (DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM (DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种联邦模型训练方法，其特征在于，包括：

2.如权利要求1所述的联邦模型训练方法，其特征在于，所述获取参与方全集和用于识别证件标签的初始证件联邦模型之前，包括：

接收训练任务请求，获取所述训练任务请求中的证件数据和集群清单；所述证件数据包括证件描述和证件格式；

通过证件类型识别模型对所述证件格式进行格式识别，得到与所述证件数据对应的所述证件类型；

提取所述证件描述中的关键特征，并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型，将获取的所述初始化联邦模型记录为所述初始证件联邦模型；

向所述集群清单中的终端发送参与请求；

接收来自所述终端返回的同意通知；所述同意通知表明了接收所述参与请求后的所述终端同意参与训练；

将返回所述同意通知的所述终端记录为所述参与终端，并根据所有所述参与终端确定为所述参与方全集。

3.如权利要求2所述的联邦模型训练方法，其特征在于，所述提取所述证件描述中的关键特征，并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型，将获取的所述初始化联邦模型记录为所述初始证件联邦模型，包括：

运用爬取技术，爬取与所述证件描述匹配的证件信息；

通过信息提取模型对所有所述证件信息进行关键特征提取，并根据提取的所述关键特征输出关键信息结果；所述关键信息结果包括所述证件标签和模型标签；

通过迁移学习技术，从联邦模型库中迁移与所述模型标签匹配的初始化联邦模型，将迁移的所述初始化联邦模型记录为用于识别所述证件标签的所述初始证件联邦模型。

4.如权利要求1所述的联邦模型训练方法，其特征在于，所述运用Fedavg算法，对各个所述参与终端的所述模型参数进行聚合，得到模型迭代参数，包括：

获取所有所述参与终端权重；所述合格参与方子集还包括与各所述参与终端对应的参与终端权重；

运用所述Fedavg算法，根据所有所述参与终端权重，对所有所述模型参数进行分层分布及聚合，得到与所述初始证件联邦模型中的各层对应的平均参数子集；

将所有所述平均参数子集确定为所述模型迭代参数。

5.如权利要求1所述的联邦模型训练方法，其特征在于，所述通过贡献激励模型，根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数，确定与各个所述参与终端对应的贡献度和激励值，包括：

通过总通信消耗函数，根据与所述参与终端对应的所述通信传输参数和所述更新容量，计算出与所述参与终端对应的总通信消耗值；所述性能消耗参数包括资源消耗值、通信传输参数和更新容量；

根据与所述参与终端对应的所述资源消耗值和所述总通信消耗值，确定与所述参与终端对应的总资源消耗值；

运用合作博弈论算法，根据所述模型迭代参数和与所述参与终端对应的所述模型参数，评估出与所述参与终端对应的所述贡献度；

根据与所述参与终端对应的总资源消耗值和所述贡献度，确定与所述参与终端对应的所述激励值。

6.一种证件检测方法，其特征在于，包括：

接收识别指令，获取所述识别指令中的待检测证件照；

将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过如权利要求1至5任一项所述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型；

7.一种联邦模型训练装置，其特征在于，包括：

8.一种证件检测装置，其特征在于，包括：

输入模块，用于将所述待检测证件照输入证件检测模型中，所述证件检测模型为通过如权利要求1至5任一项所述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型；

检测模块，用于通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取，根据提取的所述证件特征输出所述待检测证件照的识别结果；所述识别结果表征了所述待检测证件照是否为与预设所述证件标签对应的证件照片。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述联邦模型训练方法，或者所述处理器执行所述计算机程序时实现如权利要求6所述证件检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述联邦模型训练方法，或者所述处理器执行所述计算机程序时实现如权利要求6所述证件检测方法。