CN113239879A - 联邦模型训练、证件检测方法、装置、设备及介质 - Google Patents
联邦模型训练、证件检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113239879A CN113239879A CN202110611228.4A CN202110611228A CN113239879A CN 113239879 A CN113239879 A CN 113239879A CN 202110611228 A CN202110611228 A CN 202110611228A CN 113239879 A CN113239879 A CN 113239879A
- Authority
- CN
- China
- Prior art keywords
- model
- certificate
- parameters
- federal
- participant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 108
- 238000001514 detection method Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 67
- 230000005284 excitation Effects 0.000 claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 238000012216 screening Methods 0.000 claims abstract description 22
- 230000004931 aggregating effect Effects 0.000 claims abstract description 9
- 230000006854 communication Effects 0.000 claims description 27
- 238000004891 communication Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 19
- 238000005516 engineering process Methods 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 230000009193 crawling Effects 0.000 claims description 8
- 238000013508 migration Methods 0.000 claims description 8
- 230000005012 migration Effects 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000000638 stimulation Effects 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能的检测模型技术领域,提供一种联邦模型训练、证件检测方法、装置、设备及介质,方法包括:通过获取参与方全集初始证件联邦模型;并按照预设筛选方案,从参与方全集中筛选出合格参与方子集;向参与终端发送初始证件联邦模型;接收回传的模型参数和性能消耗参数;运用Fedavg算法,对模型参数进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据模型迭代参数和模型参数以及性能消耗参数,确定贡献度和激励值;在检测未达到预设的收敛条件时,更新合格参与方子集,并根据模型迭代参数迭代更新初始证件联邦模型,直至收敛获得证件检测模型。本发明实现了通过贡献度和激励值来激励终端参与模型训练,提高了联邦学习的效率和准确性。
Description
技术领域
本发明涉及人工智能的检测模型技术领域,尤其涉及一种联邦模型训练、 证件检测方法、装置、计算机设备及存储介质。
背景技术
随着机器学习的日益普及,大数据驱动的智能应用将很快应用于我们日 常生活的各个方面,包括智能语音,医疗,交通等等。但是,在传统的机器 学习方法中,保障训练模型的精确性的关键是收集足够数量的数据,而数据 之中可能包含有关个人的私人信息,例如证件照片等,这引发了公众对于个 人隐私受到损害的种种担忧。
最近,联邦学习因其在隐私保护方面的显着优势受到越来越多的广泛应 用,但是,大多数现有联邦学习系统都乐观地假设有足够的用户愿意参加联 邦学习,实际上,由于参与终端需要耗费大量计算与通信资源,并需要贡献 出本地的数据,参与终端就缺乏主动或者没有动力加入联邦学习过程中,导 致不利于联邦学习的训练和推广,模型训练的准确率不高,以及训练的周期 长。
发明内容
本发明提供一种联邦模型训练、证件检测方法、装置、计算机设备及存 储介质,实现了根据合格参与方子集中的各参与终端回传的模型参数和性能 消耗参数,运用Fedavg算法计算出模型迭代参数,以及通过贡献激励模型, 确定出各个参与终端的贡献度和激励值,通过贡献度和激励值来激励终端参 与模型训练,弥补了联邦学习的主动性和有效性的缺陷,提高了联邦学习的 效率和准确性。
一种联邦模型训练方法,包括:
获取参与方全集和用于识别证件标签的初始证件联邦模型;并按照预设 筛选方案,从所述参与方全集中筛选出合格参与方子集;
向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型;
接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性 能消耗参数;所述模型参数为接收到所述初始证件联邦模型的所述参与终端 根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征 训练获得;所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终 端在训练获得所述模型参数及回传过程中消耗的性能指标;
运用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合,得到 模型迭代参数,同时通过贡献激励模型,根据所述模型迭代参数和各个所述 参与终端的所述模型参数以及所述性能消耗参数,确定与各个所述参与终端 对应的贡献度和激励值;
在检测到所述模型迭代参数未达到预设的收敛条件时,根据所有所述贡 献度和所述激励值更新所述合格参与方子集,并根据所述模型迭代参数迭代 更新初始证件联邦模型,以及执行向与所述合格参与方子集中的各个参与方 对应的参与终端发送所述初始证件联邦模型的步骤,直至所述模型迭代参数 达到所述预设的收敛条件时,将收敛之后的所述初始证件联邦模型记录为训 练完成的用于识别所述证件标签的证件检测模型。
一种证件检测方法,包括:
接收识别指令,获取所述识别指令中的待检测证件照;
将所述待检测证件照输入证件检测模型中,所述证件检测模型为通过上 述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型;
通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对 应的证件特征提取,根据提取的所述证件特征输出所述待检测证件照的识别 结果;所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对 应的证件照片。
一种联邦模型训练装置,包括:
获取模块,用于获取参与方全集和用于识别证件标签的初始证件联邦模 型;并按照预设筛选方案,从所述参与方全集中筛选出合格参与方子集;
发送模块,用于向与所述合格参与方子集中的各个参与终端发送所述初 始证件联邦模型;
接收回传模块,用于接收各个所述参与终端针对所述初始证件联邦模型 回传的模型参数和性能消耗参数;所述模型参数为接收到所述初始证件联邦 模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证 件数据提取证件特征训练获得;所述性能消耗参数为接收到所述初始证件联 邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指 标;
聚合模块,用于运用Fedavg算法,对各个所述参与终端的所述模型参数 进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭代 参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与各 个所述参与终端对应的贡献度和激励值;
训练模块,用于在检测到所述模型迭代参数未达到预设的收敛条件时, 根据所有所述贡献度和所述激励值更新所述合格参与方子集,并根据所述模 型迭代参数迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集 中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所 述模型迭代参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联 邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。
一种证件检测装置,包括:
接收模块,用于接收识别指令,获取所述识别指令中的待检测证件照;
输入模块,用于将所述待检测证件照输入证件检测模型中,所述证件检 测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签 的证件检测模型;
检测模块,用于通过所述证件检测模型对所述待检测证件照进行与所述 预设证件标签对应的证件特征提取,根据提取的所述证件特征输出所述待检 测证件照的识别结果;所述识别结果表征了所述待检测证件照是否为与所述 预设证件标签对应的证件照片。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在 所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上 述联邦模型训练方法的步骤,或者所述处理器执行所述计算机程序时实现上 述证件检测方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序, 其中,所述计算机程序被处理器执行时实现上述联邦模型训练方法的步骤, 或者所述计算机程序被处理器执行所述计算机程序时实现上述证件检测方法 的步骤。
本发明提供的联邦模型训练方法、装置、计算机设备及存储介质,通过 获取参与方全集和用于识别证件标签的初始证件联邦模型;并按照预设筛选 方案,从所述参与方全集中筛选出合格参与方子集;向与所述合格参与方子 集中的各个参与方对应的参与终端发送所述初始证件联邦模型;接收各个所 述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数;运 用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合,得到模型迭 代参数,同时通过贡献激励模型,根据所述模型迭代参数和各个所述参与终 端的所述模型参数以及所述性能消耗参数,确定与各个所述参与终端对应的 贡献度和激励值;在检测到所述模型迭代参数未达到预设的收敛条件时,根 据所有所述贡献度和所述激励值更新所述合格参与方子集,并根据所述模型 迭代参数迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集中 的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所述 模型迭代参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联邦 模型记录为训练完成的用于识别所述证件标签的证件检测模型,如此,实现 了通过筛选方案,筛选出合格参与方子集,根据合格参与方子集中的各参与 终端回传的模型参数和性能消耗参数,运用Fedavg算法计算出模型迭代参数, 以及通过贡献激励模型,确定出各个参与终端的贡献度和激励值,通过贡献 度和激励值来激励终端参与模型训练,弥补了联邦学习的主动性和有效性的 缺陷,提高了联邦学习的效率和准确性。
本发明提供的证件检测方法、装置、计算机设备及存储介质,通过获取 所述识别指令中的待检测证件照,通过上述基于激励的联邦模型训练方法进 行训练完成的用于识别预设证件标签的证件检测模型提取与预设证件标签对 应的证件特征,根据提取的所述证件特征输出所述待检测证件照的识别结果, 通过训练完成的证件检测模型能够快速地及准确地识别出是否为预设证件标 签的证件照片,提高了识别的准确率和质量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中联邦模型训练方法或证件检测方法的应用环境 示意图;
图2是本发明一实施例中联邦模型训练方法的流程图;
图3是本发明一实施例中联邦模型训练方法的步骤S40的流程图;
图4是本发明另一实施例中联邦模型训练方法的步骤S40的流程图;
图5是本发明一实施例中证件检测方法的流程图;
图6是本发明一实施例中联邦模型训练装置的原理框图;
图7是本发明一实施例中证件检测装置的原理框图;
图8是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创 造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的联邦模型训练方法,可应用在如图1的应用环境中,其中, 客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机 设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、 摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器 组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种联邦模型训练方法,其技术方案 主要包括以下步骤S10-S50:
S10,获取参与方全集和用于识别证件标签的初始证件联邦模型;并按照 预设筛选方案,从所述参与方全集中筛选出合格参与方子集。
可理解地,所述参与方全集为同意参与训练的终端或者客户端的全集, 所述初始证件联邦模型为将要进行联邦学习训练的模型,所述初始证件联邦 模型为从联邦模型库中迁移的历史训练完成的神经网络模型,所述预设筛选 方案可根据需求设定,比如预设筛选方案为在所述参与方全集中随机选择, 或者依据一定的规则选取终端或客户端,或者在所述参与方全集中选择同一 以及相邻的集群下的客户端等,其中,一定的规则可以设定为选取终端响应 时长低于阈值的规则,因为某一客户端的终端响应时长大于或者等于阈值,说明该客户端的网络信号不稳定或者带宽受限,对于联邦学习的效率存在影 响,所以选取终端响应时长低于阈值的客户端,有利于所述初始证件联邦模 型的联邦学习,所述参与方子集为参与所述初始证件联邦模型的本轮的联邦 学习的终端或者客户端,所述参与方子集后续会根据各个参与训练的终端或 者客户端的激励情况进行更新。
在一实施例中,所述步骤S10之前,即所述获取参与方全集和用于识别 证件标签的初始证件联邦模型之前,包括:
S101,接收训练任务请求,获取所述训练任务请求中的证件数据和集群 清单;所述证件数据包括证件描述和证件格式。
可理解地,所述证件数据为与需要识别的证件相关的数据,所述证件数 据包括所述证件描述和所述证件格式,所述证件描述为对需要识别的证件的 描述,所述证件格式为存储的数据格式,例如jpg格式,png格式等等,所述 集群清单为当前集群下接收服务的所有终端或者客户端的清单。
S102,通过证件类型识别模型对所述证件格式进行格式识别,得到与所 述证件数据对应的所述证件类型。
可理解地,所述证件类型识别模型为用于识别输入的数据格式的证件类 型,所述格式识别的方式可以通过查找与所述证件格式匹配的格式名,再根 据该格式名映射出证件类型,也可以通过打开所述证件格式的打开方式确定 出证件类型的识别过程。
其中,所述证件类型包括图像、文本和表格等等。
S103,提取所述证件描述中的关键特征,并从联邦模型库中获取与提取 的所述关键特征匹配的初始化联邦模型,将获取的所述初始化联邦模型记录 为所述初始证件联邦模型。
可理解地,通过关键提取模型提取所述证件描述中的所述关键特征,所 述关键提取模型为训练完成的用于提取输入的内容中的关键特征并识别出关 键词的神经网络模型,所述关键特征为所述证件描述中的关键描述信息的特 征,根据提取的所述关键特征识别出所述证件描述中的所有关键词,根据所 有所述关键词,从所述联邦模型库中获取出与其匹配的所述初始化联邦模型, 所述联邦模型库中存储了所有所述初始化联邦模型,一个所述初始联邦模型 与多个模型关键词关联,所述初始化联邦模型为包含初始参数信息和必要参 数的基于联邦学习的神经网络模型,例如初始参数信息为数据格式,层数, 单元数,损失函数,学习率和激活函数;必要参数为申请期限,开始时间T, 每轮训练将会选择的参与者数量k等等,将获取的所述初始联邦模型记录为 所述初始证件联邦模型,从而完成迁移操作。
在一实施例中,所述步骤S103中,即所述提取所述证件描述中的关键特 征,并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型, 将获取的所述初始化联邦模型记录为所述初始证件联邦模型,包括:
S1031,运用爬取技术,爬取与所述证件描述匹配的证件信息。
可理解地,所述爬取技术为运用网络爬虫技术从互联网中爬取与所述证 件描述匹配的相关描述的相关网站,从相关网站中的相关描述进行汇总提取 出关键词及各个关键词的出现次数,将提取的关键词和所述证件描述进行聚 合,即将所述证件描述中赋予与提取的关键词相同的词语进行加权,通过加 权可以将所述证件描述中的重要的词语进行重点关注的对象的技术,将重点 关注的对象作为与所述证件描述匹配的所述证件信息,例如:证件描述为含 有人脸头像、18位字符的矩形证件,通过爬取技术,从互联网中爬取到矩形 证件,并对人脸头像、18位字符和矩形进行了加权,将其确定为证件信息。
S1032,通过信息提取模型对所有所述证件信息进行关键特征提取,并根 据提取的所述关键特征输出关键信息结果;所述关键信息结果包括所述证件 标签和模型标签;
可理解地,所述信息提取模型为训练完成且用于识别适用的关键信息结 果的神经网络模型,所述关键特征提取为与证件类型相关的特征,提取所述 关键特征的过程为将所述证件信息进行词嵌入向量转换,将所述证件信息转 换成相应的词向量,将转换后的词向量进行卷积,卷积出各证件类型的相关 向量特征的过程,对卷积获得的向量特征进行两条支路的分类,一条支路为 证件类型的分类任务,一条支路为适用于该证件类型的模型类型的分类任务, 即从证件类型的分类任务中分出模型类型的映射关系分类的任务,从而将概 率值最大的证件类型确定为所述关键信息结果中的所述证件标签,并根据该 概率值最大的证件类型结合卷积获得的向量特征进行映射分类,确定出所述 关键信息结果中的所述模型标签,所述证件标签包括身份证标签、护照标签、 驾驶证标签和工作证标签等等,所述模型标签包括身份证件检测模型、护照 证件检测模型、驾驶证件检测模型和个性化证件检测模型等等。
S1033,通过迁移学习技术,从联邦模型库中迁移与所述模型标签匹配的 初始化联邦模型,将迁移的所述初始化联邦模型记录为用于识别所述证件标 签的所述初始证件联邦模型。
可理解地,所述迁移学习技术为将训练完成的与所述模型标签匹配的初 始化联邦模型中的所有参数迁移至该初始证件联邦模型中的技术,所述联邦 模型库中存储了所有所述初始化联邦模型,一个所述初始联邦模型与多个模 型关键词关联,从所述联邦模型库中查找到与所述模型标签匹配的所述初始 化联邦模型,其匹配的方式可以根据需求设定,比如采用余弦文本相似度算 法,计算所述模型标签和与各所述初始化联邦模型关联的模型关键词的相似 度值,根据一个所述初始化联邦模型关联的各模型关键词的相似度值,确定 出所述模型标签与该初始化联邦模型的相似度,从而获取与最大的相似度对 应的所述初始化联邦模型确定为需要迁移的初始化联邦模型,运用迁移学习 技术,迁移至初始证件联邦模型中,迁移完成后将其记录为用于识别所述证 件标签的所述初始证件联邦模型。
本发明实现了通过运用爬取技术,爬取与所述证件描述匹配的证件信息; 通过信息提取模型对所有所述证件信息进行关键特征提取,并根据提取的所 述关键特征输出包含有证件标签和模型标签的关键信息结果;通过迁移学习 技术,从联邦模型库中迁移与所述模型标签匹配的初始化联邦模型,将迁移 的所述初始化联邦模型记录为用于识别所述证件标签的所述初始证件联邦模 型,如此,实现了通过运用爬取技术、信息提取模型的关键特征提取及识别 和运用迁移学习技术,能够自动从联邦模型库中迁移最为适用于证件描述的 识别的初始证件联邦模型,减少了人工识别初始证件联邦模型的过程,便于 后续联邦学习,减少联邦学习的学习迭代次数,能够为后续的联邦学习提高 效率。
S104,向所述集群清单中的终端发送参与请求。
可理解地,向与所述集群清单中的IP地址对应的终端或者客户端发送所 述参与请求,所述参与请求为邀请终端或者客户端参与本轮的联邦学习的请 求。
S105,接收来自所述终端返回的同意通知;所述同意通知表明了接收所 述参与请求后的所述终端同意参与训练。
可理解地,所述终端可以根据需求设定,例如:有需求的企业用户、个 人用户等,所述终端将会根据自身情况权衡,决定是否参与该训练任务,愿 意参与的所述终端将返回所述同意通知,所述同意通知表明了接收所述参与 请求后的所述终端同意参与训练。
S106,将返回所述同意通知的所述终端记录为所述参与终端,并根据所 有所述参与终端确定为所述参与方全集。
可理解地,接收到同意参与训练的所述终端(也可称为客户端)返回的 所述同意通知之后,将该终端标记为所述参与终端,将在预设时间段内收集 到的所有所述参与终端确定为所述参与方全集。
本发明实现了接收训练任务请求,获取所述训练任务请求中的证件数据 和集群清单;所述证件数据包括证件描述和证件格式;通过证件类型识别模 型对所述证件格式进行格式识别,得到与所述证件数据对应的所述证件类型; 提取所述证件描述中的关键特征,并从联邦模型库中获取与提取的所述关键 特征匹配的初始化联邦模型,将获取的所述初始化联邦模型记录为所述初始 证件联邦模型;向所述集群清单中的终端发送参与请求;接收来自所述终端 返回的同意通知;所述同意通知表明了接收所述参与请求后的所述终端同意 参与训练;将返回所述同意通知的所述终端记录为所述参与终端,并根据所 有所述参与终端确定为所述参与方全集,如此,实现了自动识别证件类型和 提取关键特征,从联邦模型库中自动匹配出初始证件联邦模型,有利于后续 联邦学习的训练过程,以及自动收集同意参与训练的终端,得到参与方全集, 有利于后续联邦学习中获取有用的训练参数,避免不同意参与训练的终端反 馈的无用信息。
S20,向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦 模型。
可理解地,发送的方式可以根据需求设定,比如通过Docker镜像推送技 术,向各所述参与终端发送所述初始证件联邦模型,所述Docker镜像推送技 术为将所述初始证件联邦模型传输至Docker容器(为一个开源的应用容器引 擎),该Docker容器将其转成镜像文件,再将该镜像文件通过该Docker容器 推送至各个参与终端,提高了传输速度和保证了初始证件联邦模型的安全性、 完整性及正确性。
S30,接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数 和性能消耗参数;所述模型参数为接收到所述初始证件联邦模型的所述参与 终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件 特征训练获得;所述性能消耗参数为接收到所述初始证件联邦模型的所述参 与终端在训练获得所述模型参数及回传过程中消耗的性能指标。
可理解地,所述参与终端根据接收到的所述初始证件联邦模型,在所述 参与终端的存储数据中查找与所述证件类型对应的所述本地证件数据,查找 的过程可以根据需求设定,比如人为选择,或者通过自然语言识别模型检索 所有存储数据中与所述证件类型相似的所述本地证件数据,所述本地证件数 据为存储在该参与终端中的符合所述证件类型的存储数据,通过将查找到的 所有所述本地证件数据输入该初始证件联邦模型中,对该初始证件联邦模型 进行训练学习,学习获得该参与终端的所述模型参数,以及回传所述模型参 数的同时回传计算数据量fn、基站分配信道情况An带宽w、传输功率pn等 信息,作为所述性能消耗参数。
其中,所述模型参数为接收到所述初始证件联邦模型的所述参与终端根 据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训 练获得;所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端 在训练获得所述模型参数及回传过程中消耗的性能指标。
S40,运用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合, 得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭代参数和各个 所述参与终端的所述模型参数以及所述性能消耗参数,确定与各个所述参与 终端对应的贡献度和激励值。
可理解地,所述Fedavg算法为通过迭代,对各个所述参与终端增加计算 超参数以增加该参与终端添加训练过程中的权重,所述超参数为所述参与终 端参与训练的本地证件数据占所有参与终端训练过程中的占比等相关参数, 运用所述Fedavg算法,能够更加宏观地衡量出各所述参与终端的所述模型参 数的有效占比,从而进行聚合后得到所述模型迭代参数。
所述贡献激励模型实现了自动识别出本次训练过程中各个所述参与终端 的所述贡献度和所述激励值,所述贡献度为一个参与终端在本次训练中消耗 的所述性能参数和模型参数对所述模型迭代参数的贡献程度,所述激励值为 一个参与终端在本次训练中获得的激励或奖励程度,首先,通过总通信消耗 函数,根据与所述参与终端对应的所述通信传输参数和所述更新容量,计算 出与所述参与终端对应的总通信消耗值;将与所述参与终端对应的所述资源 消耗值和所述总通信消耗值输入总资源消耗函数中,计算出与该参与终端对 应的总资源消耗值;其次,运用合作博弈论算法,将所述模型迭代参数和与 所述参与终端对应的所述模型参数输入评估模型中,通过评估模型评估出与 所述参与终端对应的所述贡献度;最后,根据与所述参与终端对应的总资源 消耗值和所述贡献度,确定与所述参与终端对应的所述激励值。
在一实施例中,如图3所示,所述步骤S40中,即所述运用Fedavg算法, 对各个所述参与终端的所述模型参数进行聚合,得到模型迭代参数,包括:
S401,获取所有所述参与终端权重;所述合格参与方子集还包括与各所 述参与终端对应的参与终端权重。
可理解地,所述参与终端权重为根据所述参与终端的性能而赋予的权重 值,所述合格参与方子集还包括与各所述参与终端一一对应的所述参与终端 权重。
S402,运用所述Fedavg算法,根据所有所述参与终端权重,对所有所述 模型参数进行分层分布及聚合,得到与所述初始证件联邦模型中的各层对应 的平均参数子集。
可理解地,根据回传的所述模型参数,运用所述Fedavg算法进行聚合, 所有所述模型参数进行分层分布及聚合的处理过程为将每个所述参与终端回 传的所述模型参数中各层在联邦学习后获得的平均值,与该参与终端的参与 终端权重进行加权,再将加权后的值求和得到初始证件联邦模型中各层的参 数值,将其确定为与所述初始证件联邦模型中的各层对应的平均参数子集,
其中,所述Fedavg算法为运用Fedavg公式计算的算法,所述Fedavg公 式为:
其中,
ni为第i个参与终端的参与终端权重;
wt为平均参数子集。
S403,将所有所述平均参数子集确定为所述模型迭代参数。
可理解地,将所有所述平均参数子集记录为所述模型迭代参数,所述模 型迭代参数为本轮联邦学习后需要迭代初始证件联邦模型的各层参数。
本发明实现了获取所有所述参与终端权重;所述合格参与方子集还包括 与各所述参与终端的参与终端权重;运用所述Fedavg算法,根据所有所述参 与终端权重,对所有所述模型参数进行分层分布及聚合,得到与所述初始证 件联邦模型中的各层对应的平均参数子集;将所有所述平均参数子集确定为 所述模型迭代参数,如此,实现了运用Fedavg算法,自动将收集到的所有参 与中单回传的模型参数科学地输出需要迭代的模型迭代参数,提高了联邦学 习的效率和准确率。
在一实施例中,如图4所示,所述步骤S40中,即所述通过贡献激励模 型,根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性 能消耗参数,确定与各个所述参与终端对应的贡献度和激励值,包括:
S404,通过总通信消耗函数,根据与所述参与终端对应的所述通信传输 参数和所述更新容量,计算出与所述参与终端对应的总通信消耗值;所述性 能消耗参数包括资源消耗值、通信传输参数和更新容量。
可理解地,所述总通信消耗函数为计算各个参与终端在通信过程中消耗 的指标的一系列公式的函数,包括一次参与终端迭代的单个资源消耗值的计 算公式,通信速率的计算公式,在一次迭代中更新初始证件联邦模型的传输 时间的计算公式以及总通信消耗值的计算公式等等,所述通信传输参数包括 贡献计算数据量、CPU周期数、链路带宽、天线数量、传输功率、信道增益 和环境噪声等与通信传输相关的参数。
其中,第i个参与终端为该参与终端中的模型训练贡献的贡献计算数据量 fi,ci表示第i个参与终端在本地训练中执行一个数据样本所需的CPU周期数, 因此,一次参与终端迭代的第i个参与终端的单个资源消耗值表示为考虑基于OFDMA(正交频分多址,Orthogonal Frequency Division Multiple Access)的蜂窝系统的上行链路传输,w代表链路带宽,Ai 用于代表第i个参与终端所处的基站向其分配的天线数量,pi是传输功率,hi 是第i个参与终端与基站之间对等链路的信道增益,N0是环境噪声,因此, 第i各参与终端的通信速率ri可以表示为:
,因此,在一次迭代中更新初始证件联邦模型的传输时间为:
,如此,可获得与所述参与终端对应的总通信消耗值。
S405,根据与所述参与终端对应的所述资源消耗值和所述总通信消耗值, 确定与所述参与终端对应的总资源消耗值。
可理解地,运用总资源消耗公式,计算在一次全局迭代中,参与终端i 的总资源消耗值,所述总资源消耗公式为:
其中,
S406,运用合作博弈论算法,根据所述模型迭代参数和与所述参与终端 对应的所述模型参数,评估出与所述参与终端对应的所述贡献度。
可理解地,所述合作博弈论算法又称shapleyvalue算法,在合作赢取奖励 的场景中,有n个参与终端参与,集合N={x1,x2,…,xn}用于表示x1-xn参与终 端的全集,函数v用于给出包含一定参与终端后的协作所能获得的奖励,或 可以被理解为这些参与终端的贡献。令S为N的子集,则对于协作场景(N, v),我们可以使用下列公式来计算参与终端i能获得的奖励,即Shapley值。
Shapley Value可以被理解为求边际贡献的均值。例如A单独工作产生价 值v(A),A和B共同工作之后共同产生价值v(A,B),那么B的贡献为 v(A,B)-v(A)。如果拓展到3个参与方的情况,则思路是枚举所有全集的子集 序列(共N!个),然后计算其中每个元素的边际贡献,最后再求均值。例如 对于参与方A,B,C,如果目前要计算A的贡献,则枚举所有子集{A}{B}{C}{A,B}{A,C}{B,C},其中排除A参与方的子集有{B}{C}{B,C},用 S代表这一类子集,计算子集包含参与方A与不包含A的差值即对于该子集 A的边际贡献,最后求平均,即,计算边际值 (v(AB)-V(B)),(V(AC)-V(C)),(V(ABC)-V(BC))并求平均。
在联邦学习服务方案对本次参与训练的客户端的贡献进行评估时,假设 该次训练选择下发模型给n个参与终端,每个参与终端提交回来的模型为xi, 集合N={x1,x2,…,xn}用于表示x1-xn参与终端提交的模型的全集。服务方将对 客户端节点回传的模型用预留的标准数据集进行测试验证,得到回传模型的 精度,用函数v表示。
对于协作场景(n,v),服务方使用下列公式来计算第i个参与终端在本 轮训练中的贡献度。
其中,v(S∪i)代表将S子集与i聚合之后得到的模型用标准测试数据集测 试的精度结果,v(S)代表S子集得到的模型用标准测试数据集测试的精度结果。
S407,根据与所述参与终端对应的总资源消耗值和所述贡献度,确定与 所述参与终端对应的所述激励值。
可理解地,根据与所述参与终端对应的总资源消耗值和所述贡献度确定 两个奖励池的大小,一个为补偿成本的奖励池A,一个为奖励参与贡献的奖 励池B。针对每个参与终端,服务方同时计算两种奖励,为总资源消耗值, 为贡献度,激励的原则是,如果参与终端参与训练付出的总资源消耗值高 于预设消耗阈值,则贡献度会覆盖其总资源消耗值,因此,最终的激励值为
本发明实现了通过总通信消耗函数,根据与所述参与终端对应的所述通 信传输参数和所述更新容量,计算出与所述参与终端对应的总通信消耗值; 所述性能消耗参数包括资源消耗值、通信传输参数和更新容量;根据与所述 参与终端对应的所述资源消耗值和所述总通信消耗值,确定与所述参与终端 对应的总资源消耗值;运用合作博弈论算法,根据所述模型迭代参数和与所 述参与终端对应的所述模型参数,评估出与所述参与终端对应的所述贡献度; 根据与所述参与终端对应的总资源消耗值和所述贡献度,确定与所述参与终 端对应的所述激励值,如此,实现了通过贡献激励模型,科学地、准确地确 定出各个参与终端的贡献度和激励值,通过贡献度和激励值来激励参与终端 参与模型训练,弥补了联邦学习的主动性和有效性的缺陷,提高了联邦学习 的效率和准确性。
S50,在检测到所述模型迭代参数未达到预设的收敛条件时,根据所有所 述贡献度和所述激励值更新所述合格参与方子集,并根据所述模型迭代参数 迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集中的各个参 与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所述模型迭代 参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联邦模型记录 为训练完成的用于识别所述证件标签的证件检测模型。
可理解地,在检测到所述模型迭代参数未达到预设的收敛条件时,所述 收敛条件可以根据需求设定,比如所述模型迭代参数的精度达到预设阈值, 或者迭代的次数达到预设次数等等,根据所有所述贡献度和所述激励值更新 所述合格参与方子集,即根据各自的贡献度筛选出贡献度大于预设贡献阈值 的参与终端,将其确定为更新后的所述合格参与方子集,表明下一次训练的 参与终端可以与本次训练的参与终端不相同,根据所述模型迭代参数迭代更 新初始证件联邦模型,以及执行向与所述合格参与方子集中的各个参与方对 应的参与终端发送所述初始证件联邦模型的步骤,重复后续步骤直到所述模 型迭代参数达到所述预设的收敛条件时,停止训练,将收敛之后的所述初始 证件联邦模型记录为训练完成的所述证件检测模型。
本发明实现了通过获取参与方全集和用于识别证件标签的初始证件联邦 模型;并按照预设筛选方案,从所述参与方全集中筛选出合格参与方子集; 向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件 联邦模型;接收各个所述参与终端针对所述初始证件联邦模型回传的模型参 数和性能消耗参数;运用Fedavg算法,对各个所述参与终端的所述模型参数 进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭代 参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与各 个所述参与终端对应的贡献度和激励值;在检测到所述模型迭代参数未达到 预设的收敛条件时,根据所有所述贡献度和所述激励值更新所述合格参与方 子集,并根据所述模型迭代参数迭代更新初始证件联邦模型,以及执行向与 所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦 模型的步骤,直至所述模型迭代参数达到所述预设的收敛条件时,将收敛之 后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件 检测模型,如此,实现了通过筛选方案,筛选出合格参与方子集,根据合格 参与方子集中的各参与终端回传的模型参数和性能消耗参数,运用Fedavg算 法计算出模型迭代参数,以及通过贡献激励模型,确定出各个参与终端的贡 献度和激励值,通过贡献度和激励值来激励终端参与模型训练,弥补了联邦 学习的主动性和有效性的缺陷,提高了联邦学习的效率和准确性。
本发明提供的证件检测方法,可应用在如图1的应用环境中,其中,客 户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设 备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、 摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器 组成的服务器集群来实现。
在一实施例中,如图5所示,提供一种证件检测方法,其技术方案主要 包括以下步骤S100-S300:
S100,接收识别指令,获取所述识别指令中的待检测证件照。
可理解地,所述待检测证件照为需要识别的证件照片,在需要对所述待 检测证件照进行识别时触发所述识别指令。
S200,将所述待检测证件照输入证件检测模型中,所述证件检测模型为 通过上述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检 测模型。
可理解地,所述证件检测模型为通过上述联邦模型训练方法进行训练完 成的用于识别预设证件标签的证件检测模型,所述证件检测模型为用于识别 预设证件标签的模型,该预设证件标签为选取的证件的类型,该预设证件标 签可以为通过上述联邦模型训练方法中对需识别的证件的描述中提取及识别, 例如:预设证件标签为身份证标签。
S300,通过所述证件检测模型对所述待检测证件照进行与所述预设证件 标签对应的证件特征提取,根据提取的所述证件特征输出所述待检测证件照 的识别结果;所述识别结果表征了所述待检测证件照是否为与所述预设证件 标签对应的证件照片。
可理解地,与所述预设证件标签对应的证件特征为训练完成的所述证件 检测模型在训练过程中学习的与所述预设证件标签相关的特征,通过所述证 件检测模型对提取的所述证件特征进行识别,可以识别出所述待检测证件照 是否为所述预设证件标签的所述识别结果,所述识别结果表征了所述待检测 证件照是否为与所述预设证件标签对应的证件照片。
本发明实现了通过获取所述识别指令中的待检测证件照,通过上述基于 激励的联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测 模型提取与预设证件标签对应的证件特征,根据提取的所述证件特征输出所 述待检测证件照的识别结果,通过训练完成的证件检测模型能够快速地及准 确地识别出是否为预设证件标签的证件照片,提高了识别的准确率和质量。
在一实施例中,提供一种联邦模型训练装置,该联邦模型训练装置与上 述实施例中联邦模型训练方法一一对应。如图6所示,该联邦模型训练装置 包括获取模块11、发送模块12、接收回传模块13、聚合模块14和训练模块15。各功能模块详细说明如下:
获取模块11,用于获取参与方全集和用于识别证件标签的初始证件联邦 模型;并按照预设筛选方案,从所述参与方全集中筛选出合格参与方子集;
发送模块12,用于向与所述合格参与方子集中的各个参与终端发送所述 初始证件联邦模型;
接收回传模块13,用于接收各个所述参与终端针对所述初始证件联邦模 型回传的模型参数和性能消耗参数;所述模型参数为接收到所述初始证件联 邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地 证件数据提取证件特征训练获得;所述性能消耗参数为接收到所述初始证件 联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能 指标;
聚合模块14,用于运用Fedavg算法,对各个所述参与终端的所述模型参 数进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭 代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与 各个所述参与终端对应的贡献度和激励值;
训练模块15,用于在检测到所述模型迭代参数未达到预设的收敛条件时, 根据所有所述贡献度和所述激励值更新所述合格参与方子集,并根据所述模 型迭代参数迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集 中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所 述模型迭代参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联 邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。
关于联邦模型训练装置的具体限定可以参见上文中对于联邦模型训练方 法的限定,在此不再赘述。上述联邦模型训练装置中的各个模块可全部或部 分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立 于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储 器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供一种证件检测装置,该证件检测装置与上述实施例 中证件检测方法一一对应。如图7所示,该证件检测装置包括接收模块101 输入模块102和检测模块103。各功能模块详细说明如下:
接收模块101,用于接收识别指令,获取所述识别指令中的待检测证件照;
输入模块102,用于将所述待检测证件照输入证件检测模型中,所述证件 检测模型为通过上述联邦模型训练方法进行训练完成的用于识别预设证件标 签的证件检测模型;
检测模块103,用于通过所述证件检测模型对所述待检测证件照进行与所 述预设证件标签对应的证件特征提取,根据提取的所述证件特征输出所述待 检测证件照的识别结果;所述识别结果表征了所述待检测证件照是否为与预 设所述证件标签对应的证件照片。
关于证件检测装置的具体限定可以参见上文中对于证件检测方法的限定, 在此不再赘述。上述证件检测装置中的各个模块可全部或部分通过软件、硬 件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中 的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处 理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器, 其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理 器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计 算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。 该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为 非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设 备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种联邦模型训练方法,或者证件检测方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储 在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实 现上述实施例中联邦模型训练方法,或者处理器执行计算机程序时实现上述 实施例中证件检测方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机 程序,计算机程序被处理器执行时实现上述实施例中联邦模型训练方法,或 者计算机程序被处理器执行时实现上述实施例中证件检测方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储 于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如 上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对 存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失 性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、 电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易 失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为 说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM (DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、 增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、 存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM (DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以 上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而 将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划 分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参 照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技 术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱 离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之 内。
Claims (10)
1.一种联邦模型训练方法,其特征在于,包括:
获取参与方全集和用于识别证件标签的初始证件联邦模型;并按照预设筛选方案,从所述参与方全集中筛选出合格参与方子集;
向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型;
接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数;所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得;所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标;
运用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与各个所述参与终端对应的贡献度和激励值;
在检测到所述模型迭代参数未达到预设的收敛条件时,根据所有所述贡献度和所述激励值更新所述合格参与方子集,并根据所述模型迭代参数迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所述模型迭代参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。
2.如权利要求1所述的联邦模型训练方法,其特征在于,所述获取参与方全集和用于识别证件标签的初始证件联邦模型之前,包括:
接收训练任务请求,获取所述训练任务请求中的证件数据和集群清单;所述证件数据包括证件描述和证件格式;
通过证件类型识别模型对所述证件格式进行格式识别,得到与所述证件数据对应的所述证件类型;
提取所述证件描述中的关键特征,并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型,将获取的所述初始化联邦模型记录为所述初始证件联邦模型;
向所述集群清单中的终端发送参与请求;
接收来自所述终端返回的同意通知;所述同意通知表明了接收所述参与请求后的所述终端同意参与训练;
将返回所述同意通知的所述终端记录为所述参与终端,并根据所有所述参与终端确定为所述参与方全集。
3.如权利要求2所述的联邦模型训练方法,其特征在于,所述提取所述证件描述中的关键特征,并从联邦模型库中获取与提取的所述关键特征匹配的初始化联邦模型,将获取的所述初始化联邦模型记录为所述初始证件联邦模型,包括:
运用爬取技术,爬取与所述证件描述匹配的证件信息;
通过信息提取模型对所有所述证件信息进行关键特征提取,并根据提取的所述关键特征输出关键信息结果;所述关键信息结果包括所述证件标签和模型标签;
通过迁移学习技术,从联邦模型库中迁移与所述模型标签匹配的初始化联邦模型,将迁移的所述初始化联邦模型记录为用于识别所述证件标签的所述初始证件联邦模型。
4.如权利要求1所述的联邦模型训练方法,其特征在于,所述运用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合,得到模型迭代参数,包括:
获取所有所述参与终端权重;所述合格参与方子集还包括与各所述参与终端对应的参与终端权重;
运用所述Fedavg算法,根据所有所述参与终端权重,对所有所述模型参数进行分层分布及聚合,得到与所述初始证件联邦模型中的各层对应的平均参数子集;
将所有所述平均参数子集确定为所述模型迭代参数。
5.如权利要求1所述的联邦模型训练方法,其特征在于,所述通过贡献激励模型,根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与各个所述参与终端对应的贡献度和激励值,包括:
通过总通信消耗函数,根据与所述参与终端对应的所述通信传输参数和所述更新容量,计算出与所述参与终端对应的总通信消耗值;所述性能消耗参数包括资源消耗值、通信传输参数和更新容量;
根据与所述参与终端对应的所述资源消耗值和所述总通信消耗值,确定与所述参与终端对应的总资源消耗值;
运用合作博弈论算法,根据所述模型迭代参数和与所述参与终端对应的所述模型参数,评估出与所述参与终端对应的所述贡献度;
根据与所述参与终端对应的总资源消耗值和所述贡献度,确定与所述参与终端对应的所述激励值。
6.一种证件检测方法,其特征在于,包括:
接收识别指令,获取所述识别指令中的待检测证件照;
将所述待检测证件照输入证件检测模型中,所述证件检测模型为通过如权利要求1至5任一项所述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型;
通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取,根据提取的所述证件特征输出所述待检测证件照的识别结果;所述识别结果表征了所述待检测证件照是否为与所述预设证件标签对应的证件照片。
7.一种联邦模型训练装置,其特征在于,包括:
获取模块,用于获取参与方全集和用于识别证件标签的初始证件联邦模型;并按照预设筛选方案,从所述参与方全集中筛选出合格参与方子集;
发送模块,用于向与所述合格参与方子集中的各个参与终端发送所述初始证件联邦模型;
接收回传模块,用于接收各个所述参与终端针对所述初始证件联邦模型回传的模型参数和性能消耗参数;所述模型参数为接收到所述初始证件联邦模型的所述参与终端根据与所述初始证件联邦模型的证件类型对应的本地证件数据提取证件特征训练获得;所述性能消耗参数为接收到所述初始证件联邦模型的所述参与终端在训练获得所述模型参数及回传过程中消耗的性能指标;
聚合模块,用于运用Fedavg算法,对各个所述参与终端的所述模型参数进行聚合,得到模型迭代参数,同时通过贡献激励模型,根据所述模型迭代参数和各个所述参与终端的所述模型参数以及所述性能消耗参数,确定与各个所述参与终端对应的贡献度和激励值;
训练模块,用于在检测到所述模型迭代参数未达到预设的收敛条件时,根据所有所述贡献度和所述激励值更新所述合格参与方子集,并根据所述模型迭代参数迭代更新初始证件联邦模型,以及执行向与所述合格参与方子集中的各个参与方对应的参与终端发送所述初始证件联邦模型的步骤,直至所述模型迭代参数达到所述预设的收敛条件时,将收敛之后的所述初始证件联邦模型记录为训练完成的用于识别所述证件标签的证件检测模型。
8.一种证件检测装置,其特征在于,包括:
接收模块,用于接收识别指令,获取所述识别指令中的待检测证件照;
输入模块,用于将所述待检测证件照输入证件检测模型中,所述证件检测模型为通过如权利要求1至5任一项所述联邦模型训练方法进行训练完成的用于识别预设证件标签的证件检测模型;
检测模块,用于通过所述证件检测模型对所述待检测证件照进行与所述预设证件标签对应的证件特征提取,根据提取的所述证件特征输出所述待检测证件照的识别结果;所述识别结果表征了所述待检测证件照是否为与预设所述证件标签对应的证件照片。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述联邦模型训练方法,或者所述处理器执行所述计算机程序时实现如权利要求6所述证件检测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述联邦模型训练方法,或者所述处理器执行所述计算机程序时实现如权利要求6所述证件检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611228.4A CN113239879B (zh) | 2021-06-01 | 2021-06-01 | 联邦模型训练、证件检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611228.4A CN113239879B (zh) | 2021-06-01 | 2021-06-01 | 联邦模型训练、证件检测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113239879A true CN113239879A (zh) | 2021-08-10 |
CN113239879B CN113239879B (zh) | 2023-07-04 |
Family
ID=77136292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110611228.4A Active CN113239879B (zh) | 2021-06-01 | 2021-06-01 | 联邦模型训练、证件检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239879B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569151A (zh) * | 2021-09-18 | 2021-10-29 | 平安科技(深圳)有限公司 | 基于人工智能的数据推荐方法、装置、设备及介质 |
CN117521783A (zh) * | 2023-11-23 | 2024-02-06 | 北京天融信网络安全技术有限公司 | 联邦机器学习方法、装置、存储介质及处理器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108964996A (zh) * | 2018-07-04 | 2018-12-07 | 航天神舟智慧系统技术有限公司 | 城乡一体化信息栅格系统及基于其的信息共享方法 |
CN110378488A (zh) * | 2019-07-22 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 客户端变化的联邦训练方法、装置、训练终端及存储介质 |
CN111967610A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 基于区块链的联邦学习激励方法、装置、设备及存储介质 |
CN112784994A (zh) * | 2020-12-31 | 2021-05-11 | 浙江大学 | 基于区块链的联邦学习数据参与方贡献值计算和激励方法 |
-
2021
- 2021-06-01 CN CN202110611228.4A patent/CN113239879B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108964996A (zh) * | 2018-07-04 | 2018-12-07 | 航天神舟智慧系统技术有限公司 | 城乡一体化信息栅格系统及基于其的信息共享方法 |
CN110378488A (zh) * | 2019-07-22 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 客户端变化的联邦训练方法、装置、训练终端及存储介质 |
CN111967610A (zh) * | 2020-08-18 | 2020-11-20 | 中国银行股份有限公司 | 基于区块链的联邦学习激励方法、装置、设备及存储介质 |
CN112784994A (zh) * | 2020-12-31 | 2021-05-11 | 浙江大学 | 基于区块链的联邦学习数据参与方贡献值计算和激励方法 |
Non-Patent Citations (3)
Title |
---|
原吕泽芮;顾洁;金之俭;: "基于云-边-端协同的电力物联网用户侧数据应用框架", 电力建设, no. 07, pages 1 - 3 * |
李梦霄;顾心诚;裴佳翔;邢腾飞;郑小云;: "深度学习在银行业的应用", 中国金融电脑, no. 09, pages 1 - 5 * |
李进华;: "大数据时代公共危机决策:演进趋势、决策困境与可能出路", 改革与战略, no. 02, pages 1 - 4 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569151A (zh) * | 2021-09-18 | 2021-10-29 | 平安科技(深圳)有限公司 | 基于人工智能的数据推荐方法、装置、设备及介质 |
CN117521783A (zh) * | 2023-11-23 | 2024-02-06 | 北京天融信网络安全技术有限公司 | 联邦机器学习方法、装置、存储介质及处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN113239879B (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829020B (zh) | 地点资源数据推送方法、装置、计算机设备和存储介质 | |
CN109816200B (zh) | 任务推送方法、装置、计算机设备和存储介质 | |
CN110781379A (zh) | 信息推荐方法、装置、计算机设备和存储介质 | |
CN110119477B (zh) | 一种信息推送方法、装置和存储介质 | |
CN110414581B (zh) | 图片检测方法和装置、存储介质及电子装置 | |
CN110782318A (zh) | 基于音频交互的营销方法、装置以及存储介质 | |
CN109766454A (zh) | 一种投资者分类方法、装置、设备及介质 | |
CN110674144A (zh) | 用户画像生成方法、装置、计算机设备和存储介质 | |
CN113011646B (zh) | 一种数据处理方法、设备以及可读存储介质 | |
CN113239879B (zh) | 联邦模型训练、证件检测方法、装置、设备及介质 | |
CN111259952B (zh) | 异常用户识别方法、装置、计算机设备及存储介质 | |
CN112905876B (zh) | 基于深度学习的信息推送方法、装置和计算机设备 | |
CN113204660B (zh) | 多媒体数据处理方法、标签识别方法、装置及电子设备 | |
CN112035611B (zh) | 目标用户推荐方法、装置、计算机设备和存储介质 | |
CN113256335B (zh) | 数据筛选方法、多媒体数据的投放效果预测方法及装置 | |
CN113869931A (zh) | 广告投放策略确定方法、装置、计算机设备和存储介质 | |
CN113706211A (zh) | 基于神经网络的广告点击率预测方法及系统 | |
CN114742520A (zh) | 岗位匹配方法、装置、设备及存储介质 | |
CN114329028A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN113707296B (zh) | 医疗方案数据处理方法、装置、设备及存储介质 | |
CN115204436A (zh) | 检测业务指标异常原因的方法、装置、设备及介质 | |
CN115879819A (zh) | 企业信用评估方法及装置 | |
US20240267300A1 (en) | Dimensioning of telecommunication infrastructure | |
CN114741540A (zh) | 一种多媒体序列推荐方法、操作预测模型训练方法、装置、设备及存储介质 | |
CN111598390B (zh) | 服务器高可用性评估方法、装置、设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |