CN113177543B - 证件识别方法、装置、设备及存储介质 - Google Patents
证件识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113177543B CN113177543B CN202110592843.5A CN202110592843A CN113177543B CN 113177543 B CN113177543 B CN 113177543B CN 202110592843 A CN202110592843 A CN 202110592843A CN 113177543 B CN113177543 B CN 113177543B
- Authority
- CN
- China
- Prior art keywords
- target
- certificate
- learner
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 36
- 239000013598 vector Substances 0.000 claims description 86
- 238000013507 mapping Methods 0.000 claims description 44
- 238000001514 detection method Methods 0.000 claims description 24
- 238000012216 screening Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims 2
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能,提供一种证件识别方法、装置、设备及存储介质。该方法能够从服务器中获取目标学习器,提取电子设备中的证件数据,基于证件数据对目标学习器进行调整,得到初始模型,计算证件数据的第一数量,从服务器中确定与电子设备联盟的终端作为特征终端,获取与目标学习器对应的证件识别模型,计算特征终端调整目标学习器的训练数据的第二数量,根据第一数量、第二数量、初始模型的第一参数值、证件识别模型的第二参数值生成目标模型,根据证件识别请求及目标模型生成证件信息。本发明能够在确保证件数据安全的前提下,提高证件识别的通用性及准确性。此外,本发明还涉及区块链技术,所述证件信息可存储于区块链中。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种证件识别方法、装置、设备及存储介质。
背景技术
在目前的OCR证件识别方式中,为了确保识别准确性,通常是对每种类型的证件数据进行单独训练,以生成相应类型的识别模型,然而,这种方式训练得到的识别模型通用性较差,不利于对多种不同类型的证件进行识别。为了提高识别模型的通用性及识别效率,通常将证件数据上传至服务器中,服务器再利用获取到的多类型证件数据进行模型训练,然而,将证件数据上传到服务器中容易造成用户的隐私数据的泄露,从而使得证件数据的安全性低下。
因此,在确保证件数据安全的前提下,如何构建出通用性及准确性兼具的证件识别方案,成了有待解决的技术问题。
发明内容
鉴于以上内容,有必要提供一种证件识别方法、装置、设备及存储介质,能够在确保证件数据安全的前提下,提高证件识别的通用性及准确性。
一方面,本发明提出一种证件识别方法,应用于电子设备,所述电子设备与服务器相通信,所述证件识别方法包括:
当接收到证件识别请求时,根据所述证件识别请求确定请求类型;
若所述请求类型为图像识别类型,根据所述图像识别类型从所述服务器中获取目标学习器;
从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型;
根据所述证件识别请求及所述目标模型生成证件信息。
根据本发明优选实施例,所述根据所述证件识别请求确定请求类型包括:
解析所述证件识别请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示位置的信息作为存储路径,并从所述数据信息中获取指示对象的信息作为对象编号;
获取预设查询模板,并从所述预设查询模板中确定查询对象的填充位置;
将所述对象编号写入所述填充位置,得到查询语句;
在所述存储路径中运行所述查询语句,得到待识别对象;
获取所述待识别对象的对象信息,并将与所述对象信息对应的类型确定为所述请求类型。
根据本发明优选实施例,所述根据所述图像识别类型从所述服务器中获取目标学习器包括:
获取所述服务器中存储学习器的路径作为目标路径,并获取所述图像识别类型的类型编号;
根据所述类型编号从所述目标路径中获取初筛学习器,并获取所述初筛学习器的生成时间;
获取所述证件识别请求的接收时间;
将所述生成时间与所述接收时间的时间差最小的初筛学习器确定为所述目标学习器。
根据本发明优选实施例,在基于所述证件数据对所述目标学习器进行调整,得到初始模型之前,所述方法还包括:
对所述证件数据进行证件类别标注;
计算每一证件类别中证件数据的数量作为类别数量;
若所述类别数量小于预设数量阈值,将与所述类别数量对应的证件类别确定为目标类别;
基于扰动法增加所述目标类别中证件数据的数量。
根据本发明优选实施例,所述基于所述证件数据对所述目标学习器进行调整,得到初始模型包括:
所述证件数据包括证件图像及图像文本;
获取所述证件图像的图像像素,并根据所述图像像素对所述证件图像进行向量化处理,得到所述证件图像的图像向量;
获取所述目标学习器中的文本映射表,并基于所述文本映射表对所述图像文本进行编码处理,得到文本向量;
将所述图像向量输入至所述目标学习器中,得到输出向量,并根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值,所述目标学习器中包含初始学习率;
根据所述初始学习率及预设值更新所述目标学习器,包括:根据所述初始学习率及预设值生成设定学习率,并将所述目标学习器中的所述初始学习率更新为所述设定学习率,得到更新学习器,并根据所述图像向量、所述文本向量计算所述更新学习器的第二损失值,重复根据所述初始学习率及预设值更新所述目标学习器,直至所述第二损失值不再降低,将所述更新学习器确定为所述初始模型。
根据本发明优选实施例,所述根据所述证件识别请求及所述目标模型生成证件信息包括:
获取所述待识别对象的对象像素;
根据所述图像像素确定所述图像向量的生成方式,并根据所述生成方式对所述对象像素进行向量化处理,得到对象向量;
从所述目标模型中获取位置检测网络及文本识别网络;
将所述对象向量输入至所述位置检测网络,得到多个检测框及每个检测框的位置信息;
根据所述位置信息从所述对象像素中提取每个检测框的目标像素信息;
将所述目标像素信息输入至所述文本识别网络中,得到信息向量;
根据所述文本映射表对所述信息向量进行映射处理,得到所述证件信息。
根据本发明优选实施例,所述根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型包括:
计算所述第一数量与所述第二数量的总和,得到总数量;
将所述第一数量除以所述总数量,得到所述电子设备的第一权值,并将所述第二数量除以所述总数量,得到所述特征终端的第二权值;
根据预设标签从所述初始模型中提取所述第一参数值,并根据所述预设标签从所述证件识别模型中提取所述第二参数值;
计算所述第一权值与所述第一参数值的乘积,得到第一运算值,并计算所述第二权值与所述第二参数值的乘积,得到第二运算值;
计算所述第一运算值与所述第二运算值的总和,得到所述预设标签的目标参数值;
根据所述目标参数值更新所述目标学习器中与所述预设标签对应的参数值,得到所述目标模型。
另一方面,本发明还提出一种证件识别装置,运行于电子设备,所述证件识别装置包括:
确定单元,用于当接收到证件识别请求时,根据所述证件识别请求确定请求类型;
获取单元,用于若所述请求类型为图像识别类型,根据所述图像识别类型从所述服务器中获取目标学习器;
提取单元,用于从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
计算单元,用于基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
所述获取单元,还用于根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
所述计算单元,还用于根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
生成单元,用于根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型;
所述生成单元,还用于根据所述证件识别请求及所述目标模型生成证件信息。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述证件识别方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述证件识别方法。
由以上技术方案可以看出,本发明通过所述配置库中的证件数据调整所述目标学习器,进而根据所述初始模型中的所述第一参数值以及直接从所述特征终端中获取到的所述第二参数值生成所述目标模型,由于无需将证件数据上传到服务器中进行模型训练,因此,能够确保所述证件数据的安全性,同时,通过多类证件的训练数据对所述目标学习器进行调整,能够确保所述目标模型的识别通用性。此外,由于所述目标模型是根据所述电子设备及所述特征终端中的证件数据以及所述生成器生成的,因此,能够避免单一终端对所述目标模型的影响,从而提高所述目标模型的识别准确性。
附图说明
图1是本发明证件识别方法的较佳实施例的流程图。
图2是本发明证件识别装置的较佳实施例的功能模块图。
图3是本发明实现证件识别方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明证件识别方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述证件识别方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
在本发明的至少一个实施例中,所述电子设备与服务器相通信。
S10,当接收到证件识别请求时,根据所述证件识别请求确定请求类型。
在本发明的至少一个实施例中,所述证件识别请求中携带的信息包括,但不限于:请求编号、存储路径及对象编号等。
所述请求类型是指所述证件识别请求所对应的类型,例如,所述请求类型可以是图像识别类型,所述请求类型也可以是文本查询类型。
在本发明的至少一个实施例中,所述电子设备根据所述证件识别请求确定请求类型包括:
解析所述证件识别请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示位置的信息作为存储路径,并从所述数据信息中获取指示对象的信息作为对象编号;
获取预设查询模板,并从所述预设查询模板中确定查询对象的填充位置;
将所述对象编号写入所述填充位置,得到查询语句;
在所述存储路径中运行所述查询语句,得到待识别对象;
获取所述待识别对象的对象信息,并将与所述对象信息对应的类型确定为所述请求类型。
其中,所述数据信息包括,但不限于:所述存储路径、所述对象编号等。
所述存储路径中存储有多个对象及每个对象的属性信息。
所述对象编号是指能够从所述存储路径中唯一识别出所述待识别对象的编号。
所述预设查询模板中包括指示所述查询对象的标签,所述预设查询模板可以是结构化查询语句。
所述待识别对象是指需要进行识别的对象,所述待识别对象可以是图像。
所述对象信息是指所述待识别对象的属性信息,例如,所述对象信息可以是PNG格式。
通过解析所述报文,能够快速获取到所述数据信息,进一步地,由于所述待识别对象是在所述存储路径中确定出的,因此通过所述对象编号及所述存储路径能够快速确定出所述待识别对象,同时根据所述对象编号与对象的映射关系,通过所述对象编码及所述存储路径还能够准确的确定出所述待识别对象,此外,由于所述对象信息与类型存在关联关系,因此,通过所述对象信息能够准确的确定出所述请求类型。
S11,若所述请求类型为图像识别类型,根据所述图像识别类型从所述服务器中获取目标学习器。
在本发明的至少一个实施例中,所述图像识别类型所对应的识别领域包括,但不限于:对带有银行卡的图像的识别,对带有身份证号的图像的识别等。
在本发明的至少一个实施例中,所述电子设备根据所述图像识别类型从所述服务器中获取目标学习器包括:
获取所述服务器中存储学习器的路径作为目标路径,并获取所述图像识别类型的类型编号;
根据所述类型编号从所述目标路径中获取初筛学习器,并获取所述初筛学习器的生成时间;
获取所述证件识别请求的接收时间;
将所述生成时间与所述接收时间的时间差最小的初筛学习器确定为所述目标学习器。
其中,所述目标路径中存储有多个类型对应的学习器及每个学习器的生成时间。需要说明的是,每个类型对应有多个学习器,每个类型中的学习器是根据所述电子设备当前存储的证件数据及所述特征终端当前存储的证件数据训练得到的。
所述类型编号是指能够唯一指示所述图像识别类型的编号。
所述初筛学习器是指与所述图像识别类型对应的学习器,所述初筛学习器能够识别出图像中的文本信息。
所述生成时间是指生成所述初筛学习器的时间。
所述接收时间是指所述电子设备接收到所述证件识别请求的时间。
通过所述类型编号能够准确的从所述目标路径中获取到与所述图像识别类型对应的初筛学习器,进而根据所述接收时间与所述生成时间的对比,能够准确的从所述初筛学习器中确定出所述目标学习器。
S12,从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据。
在本发明的至少一个实施例中,所述配置库中存储有路径映射表及所述路径映射表中的所有图像。
进一步地,所述路径映射表中存储有所述配置库中所有编号与路径的映射关系。
所述证件数据中包括多类证件的训练数据,例如,所述证件数据中包含银行卡类的数据、身份证卡类的数据等。
在本发明的至少一个实施例中,所述电子设备从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据包括:
获取所述配置库中的路径映射表;
从所述路径映射表中获取与所述类型编号对应的信息作为图像存储路径;
从所述图像存储路径中获取所有信息作为所述证件数据。
通过所述路径映射表能够准确的确定出所述图像存储路径,并根据所述图像存储路径能够快速获取到所述证件数据。
S13,基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量。
在本发明的至少一个实施例中,所述初始模型是指在所述目标学习器的调整过程中,损失值不再降低时的目标学习器。
所述第一数量是指所述电子设备根据所述目标学习器生成所述初始模型时使用的证件数据的数量。
在本发明的至少一个实施例中,在基于所述证件数据对所述目标学习器进行调整,得到初始模型之前,所述方法还包括:
对所述证件数据进行证件类别标注;
计算每一证件类别中证件数据的数量作为类别数量;
若所述类别数量小于预设数量阈值,将与所述类别数量对应的证件类别确定为目标类别;
基于扰动法增加所述目标类别中证件数据的数量。
其中,所述预设数量阈值可以根据所述目标模型的识别精度确定。
通过上述实施方式,若某一证件类别中证件数据的数量小于所述预设数量阈值,可以采用扰动法对该类别的证件数据进行扰动,以此来增加该类别中证件数据的数量,避免由于某一证件类别的样本数量不足,导致训练得到的初始模型对该证件类别的泛化能力较差。
在本发明的至少一个实施例中,所述电子设备基于所述证件数据对所述目标学习器进行调整,得到初始模型包括:
所述证件数据包括证件图像及图像文本;
获取所述证件图像的图像像素,并根据所述图像像素对所述证件图像进行向量化处理,得到所述证件图像的图像向量;
获取所述目标学习器中的文本映射表,并基于所述文本映射表对所述图像文本进行编码处理,得到文本向量;
将所述图像向量输入至所述目标学习器中,得到输出向量,并根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值,所述目标学习器中包含初始学习率;
根据所述初始学习率及预设值更新所述目标学习器,包括:根据所述初始学习率及预设值生成设定学习率,并将所述目标学习器中的所述初始学习率更新为所述设定学习率,得到更新学习器,并根据所述图像向量、所述文本向量计算所述更新学习器的第二损失值,重复根据所述初始学习率及预设值更新所述目标学习器,直至所述第二损失值不再降低,将所述更新学习器确定为所述初始模型。
其中,所述图像像素是指所述证件图像中每个像素点的像素值。
所述图像向量能够表征出所述证件图像中的像素信息。
所述文本映射表中存储有文本信息与编码值的映射关系。
所述预设值可以根据需求设定,例如,所述预设值可以设定为0.1。
通过所述图像像素能够准确的确定出所述图像向量,并通过所述目标学习器上的文本映射表能够从与所述输出向量的同一维度上确定出所述文本向量,避免不同维度产生的向量对所述第一损失值的干扰,从而能够提高所述初始模型的识别准确性。
具体地,所述电子设备基于所述文本映射表对所述图像文本进行编码处理,得到文本向量包括:
获取所述图像文本中的文本字符,并确定所述文本字符在所述图像文本中的字符位置;
从所述文本映射表中获取与所述文本字符对应的字符编码,并根据所述字符位置拼接所述字符编码,得到所述文本向量。
具体地,所述电子设备根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值包括:
计算所述文本向量与所述输出向量的相似度;
计算配置值与所述相似度的差值,得到所述第一损失值。
相应地,所述电子设备所述图像向量、所述文本向量计算所述更新学习器的第二损失值的方式与所述电子设备根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值的方式相同,本发明对此不再赘述。
S14,根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型。
在本发明的至少一个实施例中,所述特征终端是指在所述服务器中基于所述图像识别类型与所述电子设备联盟的其他联盟成员。
在本发明的至少一个实施例中,所述电子设备根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端包括:
获取所述电子设备的设备编号;
获取所述图像识别类型的类型标识;
根据所述设备编号及所述类型标识从所述服务器中筛选出所述特征终端。
S15,根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量。
在本发明的至少一个实施例中,所述第二数量是指所述特征终端在根据所述目标学习器生成所述证件识别模型时所使用的训练数据的数量。
在本发明的至少一个实施例中,所述电子设备根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量包括:
获取所述目标学习器的目标标识,并根据所述目标标识及预设调整标识从所述特征终端的日志库中筛选目标日志;
从所述目标日志中选取数据编号,并计算所述数据编号的数量作为所述第二数量。
其中,所述目标标识用于指示所述目标学习器。
所述预设调整标识用于指示调整模型的标识。
通过所述目标标识及所述预设调整标识能够准确的从所述特征终端中筛选出所述目标日志,进而根据所述目标日志能够准确的确定出所述第二数量。
S16,根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型。
在本发明的至少一个实施例中,所述目标模型是指结合所述初始模型及所述证件识别模型而生成的模型。
在本发明的至少一个实施例中,所述电子设备根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型包括:
计算所述第一数量与所述第二数量的总和,得到总数量;
将所述第一数量除以所述总数量,得到所述电子设备的第一权值,并将所述第二数量除以所述总数量,得到所述特征终端的第二权值;
根据预设标签从所述初始模型中提取所述第一参数值,并根据所述预设标签从所述证件识别模型中提取所述第二参数值;
计算所述第一权值与所述第一参数值的乘积,得到第一运算值,并计算所述第二权值与所述第二参数值的乘积,得到第二运算值;
计算所述第一运算值与所述第二运算值的总和,得到所述预设标签的目标参数值;
根据所述目标参数值更新所述目标学习器中与所述预设标签对应的参数值,得到所述目标模型。
其中,所述总数量是指所述电子设备及所述特征终端训练所述目标学习器的证件数据的总量。
所述预设标签可以用来指示需要用户初始设定的参数,例如,所述预设标签可以用来指示学习率,所述预设标签也可以用来指示偏置值等。
通过结合所述电子设备对所述目标学习器的调整情况以及所述特征终端对所述目标学习器的调整情况确定所述目标模型,能够提高所述目标模型的识别准确性。
S17,根据所述证件识别请求及所述目标模型生成证件信息。
在本发明的至少一个实施例中,所述证件信息是指从所述证件识别请求中的所述待识别对象中所识别出的信息。例如,所述待识别对象是带有身份证的图像,相应地,所述证件信息包括:姓名、身份证号、有效期限等。
需要强调的是,为进一步保证上述证件信息的私密和安全性,上述证件信息还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述电子设备根据所述证件识别请求及所述目标模型生成证件信息包括:
获取所述待识别对象的对象像素;
根据所述图像像素确定所述图像向量的生成方式,并根据所述生成方式对所述对象像素进行向量化处理,得到对象向量;
从所述目标模型中获取位置检测网络及文本识别网络;
将所述对象向量输入至所述位置检测网络,得到多个检测框及每个检测框的位置信息;
根据所述位置信息从所述对象像素中提取每个检测框的目标像素信息;
将所述目标像素信息输入至所述文本识别网络中,得到信息向量;
根据所述文本映射表对所述信息向量进行映射处理,得到所述证件信息。
其中,所述位置检测网络能够从所述待识别对象中检测出文本所在的检测框。
所述文本识别网络能够根据像素信息识别出相应的文本信息。
通过所述目标模型能够准确的确定出所述信息向量,进而根据所述信息向量与所述文本映射表能够准确的确定出所述证件信息。
由以上技术方案可以看出,本发明通过所述配置库中的证件数据调整所述目标学习器,进而根据所述初始模型中的所述第一参数值以及直接从所述特征终端中获取到的所述第二参数值生成所述目标模型,由于无需将证件数据上传到服务器中进行模型训练,因此,能够确保所述证件数据的安全性,同时,通过多类证件的训练数据对所述目标学习器进行调整,能够确保所述目标模型的识别通用性。此外,由于所述目标模型是根据所述电子设备及所述特征终端中的证件数据以及所述生成器生成的,因此,能够避免单一终端对所述目标模型的影响,从而提高所述目标模型的识别准确性。
如图2所示,是本发明证件识别装置的较佳实施例的功能模块图。所述证件识别装置11包括确定单元110、获取单元111、提取单元112、计算单元113、生成单元114及标注单元115。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
在本发明的至少一个实施例中,所述电子设备与服务器相通信。
当接收到证件识别请求时,确定单元110根据所述证件识别请求确定请求类型。
在本发明的至少一个实施例中,所述证件识别请求中携带的信息包括,但不限于:请求编号、存储路径及对象编号等。
所述请求类型是指所述证件识别请求所对应的类型,例如,所述请求类型可以是图像识别类型,所述请求类型也可以是文本查询类型。
在本发明的至少一个实施例中,所述确定单元110根据所述证件识别请求确定请求类型包括:
解析所述证件识别请求的报文,得到所述报文携带的数据信息;
从所述数据信息中获取指示位置的信息作为存储路径,并从所述数据信息中获取指示对象的信息作为对象编号;
获取预设查询模板,并从所述预设查询模板中确定查询对象的填充位置;
将所述对象编号写入所述填充位置,得到查询语句;
在所述存储路径中运行所述查询语句,得到待识别对象;
获取所述待识别对象的对象信息,并将与所述对象信息对应的类型确定为所述请求类型。
其中,所述数据信息包括,但不限于:所述存储路径、所述对象编号等。
所述存储路径中存储有多个对象及每个对象的属性信息。
所述对象编号是指能够从所述存储路径中唯一识别出所述待识别对象的编号。
所述预设查询模板中包括指示所述查询对象的标签,所述预设查询模板可以是结构化查询语句。
所述待识别对象是指需要进行识别的对象,所述待识别对象可以是图像。
所述对象信息是指所述待识别对象的属性信息,例如,所述对象信息可以是PNG格式。
通过解析所述报文,能够快速获取到所述数据信息,进一步地,由于所述待识别对象是在所述存储路径中确定出的,因此通过所述对象编号及所述存储路径能够快速确定出所述待识别对象,同时根据所述对象编号与对象的映射关系,通过所述对象编码及所述存储路径还能够准确的确定出所述待识别对象,此外,由于所述对象信息与类型存在关联关系,因此,通过所述对象信息能够准确的确定出所述请求类型。
若所述请求类型为图像识别类型,获取单元111根据所述图像识别类型从所述服务器中获取目标学习器。
在本发明的至少一个实施例中,所述图像识别类型所对应的识别领域包括,但不限于:对带有银行卡的图像的识别,对带有身份证号的图像的识别等。
在本发明的至少一个实施例中,所述获取单元111根据所述图像识别类型从所述服务器中获取目标学习器包括:
获取所述服务器中存储学习器的路径作为目标路径,并获取所述图像识别类型的类型编号;
根据所述类型编号从所述目标路径中获取初筛学习器,并获取所述初筛学习器的生成时间;
获取所述证件识别请求的接收时间;
将所述生成时间与所述接收时间的时间差最小的初筛学习器确定为所述目标学习器。
其中,所述目标路径中存储有多个类型对应的学习器及每个学习器的生成时间。需要说明的是,每个类型对应有多个学习器,每个类型中的学习器是根据所述电子设备当前存储的证件数据及所述特征终端当前存储的证件数据训练得到的。
所述类型编号是指能够唯一指示所述图像识别类型的编号。
所述初筛学习器是指与所述图像识别类型对应的学习器,所述初筛学习器能够识别出图像中的文本信息。
所述生成时间是指生成所述初筛学习器的时间。
所述接收时间是指所述电子设备接收到所述证件识别请求的时间。
通过所述类型编号能够准确的从所述目标路径中获取到与所述图像识别类型对应的初筛学习器,进而根据所述接收时间与所述生成时间的对比,能够准确的从所述初筛学习器中确定出所述目标学习器。
提取单元112从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据。
在本发明的至少一个实施例中,所述配置库中存储有路径映射表及所述路径映射表中的所有图像。
进一步地,所述路径映射表中存储有所述配置库中所有编号与路径的映射关系。
所述证件数据中包括多类证件的训练数据,例如,所述证件数据中包含银行卡类的数据、身份证卡类的数据等。
在本发明的至少一个实施例中,所述提取单元112从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据包括:
获取所述配置库中的路径映射表;
从所述路径映射表中获取与所述类型编号对应的信息作为图像存储路径;
从所述图像存储路径中获取所有信息作为所述证件数据。
通过所述路径映射表能够准确的确定出所述图像存储路径,并根据所述图像存储路径能够快速获取到所述证件数据。
计算单元113基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量。
在本发明的至少一个实施例中,所述初始模型是指在所述目标学习器的调整过程中,损失值不再降低时的目标学习器。
所述第一数量是指所述计算单元113根据所述目标学习器生成所述初始模型时使用的证件数据的数量。
在本发明的至少一个实施例中,在基于所述证件数据对所述目标学习器进行调整,得到初始模型之前,标注单元115对所述证件数据进行证件类别标注;
所述计算单元113计算每一证件类别中证件数据的数量作为类别数量;
若所述类别数量小于预设数量阈值,所述确定单元110将与所述类别数量对应的证件类别确定为目标类别;
所述计算单元113基于扰动法增加所述目标类别中证件数据的数量。
其中,所述预设数量阈值可以根据所述目标模型的识别精度确定。
通过上述实施方式,若某一证件类别中证件数据的数量小于所述预设数量阈值,可以采用扰动法对该类别的证件数据进行扰动,以此来增加该类别中证件数据的数量,避免由于某一证件类别的样本数量不足,导致训练得到的初始模型对该证件类别的泛化能力较差。
在本发明的至少一个实施例中,所述计算单元113基于所述证件数据对所述目标学习器进行调整,得到初始模型包括:
所述证件数据包括证件图像及图像文本;
获取所述证件图像的图像像素,并根据所述图像像素对所述证件图像进行向量化处理,得到所述证件图像的图像向量;
获取所述目标学习器中的文本映射表,并基于所述文本映射表对所述图像文本进行编码处理,得到文本向量;
将所述图像向量输入至所述目标学习器中,得到输出向量,并根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值,所述目标学习器中包含初始学习率;
根据所述初始学习率及预设值更新所述目标学习器,包括:根据所述初始学习率及预设值生成设定学习率,并将所述目标学习器中的所述初始学习率更新为所述设定学习率,得到更新学习器,并根据所述图像向量、所述文本向量计算所述更新学习器的第二损失值,重复根据所述初始学习率及预设值更新所述目标学习器,直至所述第二损失值不再降低,将所述更新学习器确定为所述初始模型。
其中,所述图像像素是指所述证件图像中每个像素点的像素值。
所述图像向量能够表征出所述证件图像中的像素信息。
所述文本映射表中存储有文本信息与编码值的映射关系。
所述预设值可以根据需求设定,例如,所述预设值可以设定为0.1。
通过所述图像像素能够准确的确定出所述图像向量,并通过所述目标学习器上的文本映射表能够从与所述输出向量的同一维度上确定出所述文本向量,避免不同维度产生的向量对所述第一损失值的干扰,从而能够提高所述初始模型的识别准确性。
具体地,所述计算单元113基于所述文本映射表对所述图像文本进行编码处理,得到文本向量包括:
获取所述图像文本中的文本字符,并确定所述文本字符在所述图像文本中的字符位置;
从所述文本映射表中获取与所述文本字符对应的字符编码,并根据所述字符位置拼接所述字符编码,得到所述文本向量。
具体地,所述计算单元113根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值包括:
计算所述文本向量与所述输出向量的相似度;
计算配置值与所述相似度的差值,得到所述第一损失值。
相应地,所述计算单元113所述图像向量、所述文本向量计算所述更新学习器的第二损失值的方式与所述计算单元113根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值的方式相同,本发明对此不再赘述。
所述获取单元111根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型。
在本发明的至少一个实施例中,所述特征终端是指在所述服务器中基于所述图像识别类型与所述电子设备联盟的其他联盟成员。
在本发明的至少一个实施例中,所述获取单元111根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端包括:
获取所述电子设备的设备编号;
获取所述图像识别类型的类型标识;
根据所述设备编号及所述类型标识从所述服务器中筛选出所述特征终端。
所述计算单元113根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量。
在本发明的至少一个实施例中,所述第二数量是指所述特征终端在根据所述目标学习器生成所述证件识别模型时所使用的训练数据的数量。
在本发明的至少一个实施例中,所述计算单元113根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量包括:
获取所述目标学习器的目标标识,并根据所述目标标识及预设调整标识从所述特征终端的日志库中筛选目标日志;
从所述目标日志中选取数据编号,并计算所述数据编号的数量作为所述第二数量。
其中,所述目标标识用于指示所述目标学习器。
所述预设调整标识用于指示调整模型的标识。
通过所述目标标识及所述预设调整标识能够准确的从所述特征终端中筛选出所述目标日志,进而根据所述目标日志能够准确的确定出所述第二数量。
生成单元114根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型。
在本发明的至少一个实施例中,所述目标模型是指结合所述初始模型及所述证件识别模型而生成的模型。
在本发明的至少一个实施例中,所述生成单元114根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型包括:
计算所述第一数量与所述第二数量的总和,得到总数量;
将所述第一数量除以所述总数量,得到所述电子设备的第一权值,并将所述第二数量除以所述总数量,得到所述特征终端的第二权值;
根据预设标签从所述初始模型中提取所述第一参数值,并根据所述预设标签从所述证件识别模型中提取所述第二参数值;
计算所述第一权值与所述第一参数值的乘积,得到第一运算值,并计算所述第二权值与所述第二参数值的乘积,得到第二运算值;
计算所述第一运算值与所述第二运算值的总和,得到所述预设标签的目标参数值;
根据所述目标参数值更新所述目标学习器中与所述预设标签对应的参数值,得到所述目标模型。
其中,所述总数量是指所述电子设备及所述特征终端训练所述目标学习器的证件数据的总量。
所述预设标签可以用来指示需要用户初始设定的参数,例如,所述预设标签可以用来指示学习率,所述预设标签也可以用来指示偏置值等。
通过结合所述电子设备对所述目标学习器的调整情况以及所述特征终端对所述目标学习器的调整情况确定所述目标模型,能够提高所述目标模型的识别准确性。
所述生成单元114根据所述证件识别请求及所述目标模型生成证件信息。
在本发明的至少一个实施例中,所述证件信息是指从所述证件识别请求中的所述待识别对象中所识别出的信息。例如,所述待识别对象是带有身份证的图像,相应地,所述证件信息包括:姓名、身份证号、有效期限等。
需要强调的是,为进一步保证上述证件信息的私密和安全性,上述证件信息还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述生成单元114根据所述证件识别请求及所述目标模型生成证件信息包括:
获取所述待识别对象的对象像素;
根据所述图像像素确定所述图像向量的生成方式,并根据所述生成方式对所述对象像素进行向量化处理,得到对象向量;
从所述目标模型中获取位置检测网络及文本识别网络;
将所述对象向量输入至所述位置检测网络,得到多个检测框及每个检测框的位置信息;
根据所述位置信息从所述对象像素中提取每个检测框的目标像素信息;
将所述目标像素信息输入至所述文本识别网络中,得到信息向量;
根据所述文本映射表对所述信息向量进行映射处理,得到所述证件信息。
其中,所述位置检测网络能够从所述待识别对象中检测出文本所在的检测框。
所述文本识别网络能够根据像素信息识别出相应的文本信息。
通过所述目标模型能够准确的确定出所述信息向量,进而根据所述信息向量与所述文本映射表能够准确的确定出所述证件信息。
由以上技术方案可以看出,本发明通过所述配置库中的证件数据调整所述目标学习器,进而根据所述初始模型中的所述第一参数值以及直接从所述特征终端中获取到的所述第二参数值生成所述目标模型,由于无需将证件数据上传到服务器中进行模型训练,因此,能够确保所述证件数据的安全性,同时,通过多类证件的训练数据对所述目标学习器进行调整,能够确保所述目标模型的识别通用性。此外,由于所述目标模型是根据所述电子设备及所述特征终端中的证件数据以及所述生成器生成的,因此,能够避免单一终端对所述目标模型的影响,从而提高所述目标模型的识别准确性。
如图3所示,是本发明实现证件识别方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如证件识别程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成确定单元110、获取单元111、提取单元112、计算单元113、生成单元114及标注单元115。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种证件识别方法,所述处理器13可执行所述计算机可读指令从而实现:
当接收到证件识别请求时,根据所述证件识别请求确定请求类型;
若所述请求类型为图像识别类型,根据所述图像识别类型从服务器中获取目标学习器;
从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型;
根据所述证件识别请求及所述目标模型生成证件信息。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
当接收到证件识别请求时,根据所述证件识别请求确定请求类型;
若所述请求类型为图像识别类型,根据所述图像识别类型从服务器中获取目标学习器;
从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型;
根据所述证件识别请求及所述目标模型生成证件信息。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (8)
1.一种证件识别方法,其特征在于,应用于电子设备,所述电子设备与服务器相通信,所述证件识别方法包括:
当接收到证件识别请求时,根据所述证件识别请求确定请求类型,包括:解析所述证件识别请求的报文,得到所述报文携带的数据信息;从所述数据信息中获取指示位置的信息作为存储路径,并从所述数据信息中获取指示对象的信息作为对象编号;获取预设查询模板,并从所述预设查询模板中确定查询对象的填充位置;将所述对象编号写入所述填充位置,得到查询语句;在所述存储路径中运行所述查询语句,得到待识别对象;获取所述待识别对象的对象信息,并将与所述对象信息对应的类型确定为所述请求类型;
若所述请求类型为图像识别类型,根据所述图像识别类型从所述服务器中获取目标学习器;
从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型,包括:计算所述第一数量与所述第二数量的总和,得到总数量;将所述第一数量除以所述总数量,得到所述电子设备的第一权值,并将所述第二数量除以所述总数量,得到所述特征终端的第二权值;根据预设标签从所述初始模型中提取所述第一参数值,并根据所述预设标签从所述证件识别模型中提取所述第二参数值;计算所述第一权值与所述第一参数值的乘积,得到第一运算值,并计算所述第二权值与所述第二参数值的乘积,得到第二运算值;计算所述第一运算值与所述第二运算值的总和,得到所述预设标签的目标参数值;根据所述目标参数值更新所述目标学习器中与所述预设标签对应的参数值,得到所述目标模型;
根据所述证件识别请求及所述目标模型生成证件信息。
2.如权利要求1所述的证件识别方法,其特征在于,所述根据所述图像识别类型从所述服务器中获取目标学习器包括:
获取所述服务器中存储学习器的路径作为目标路径,并获取所述图像识别类型的类型编号;
根据所述类型编号从所述目标路径中获取初筛学习器,并获取所述初筛学习器的生成时间;
获取所述证件识别请求的接收时间;
将所述生成时间与所述接收时间的时间差最小的初筛学习器确定为所述目标学习器。
3.如权利要求1所述的证件识别方法,其特征在于,在基于所述证件数据对所述目标学习器进行调整,得到初始模型之前,所述方法还包括:
对所述证件数据进行证件类别标注;
计算每一证件类别中证件数据的数量作为类别数量;
若所述类别数量小于预设数量阈值,将与所述类别数量对应的证件类别确定为目标类别;
基于扰动法增加所述目标类别中证件数据的数量。
4.如权利要求1所述的证件识别方法,其特征在于,所述基于所述证件数据对所述目标学习器进行调整,得到初始模型包括:
所述证件数据包括证件图像及图像文本;
获取所述证件图像的图像像素,并根据所述图像像素对所述证件图像进行向量化处理,得到所述证件图像的图像向量;
获取所述目标学习器中的文本映射表,并基于所述文本映射表对所述图像文本进行编码处理,得到文本向量;
将所述图像向量输入至所述目标学习器中,得到输出向量,并根据所述文本向量及所述输出向量计算所述目标学习器的第一损失值,所述目标学习器中包含初始学习率;
根据所述初始学习率及预设值更新所述目标学习器,包括:根据所述初始学习率及预设值生成设定学习率,并将所述目标学习器中的所述初始学习率更新为所述设定学习率,得到更新学习器,并根据所述图像向量、所述文本向量计算所述更新学习器的第二损失值,重复根据所述初始学习率及预设值更新所述目标学习器,直至所述第二损失值不再降低,将所述更新学习器确定为所述初始模型。
5.如权利要求2至4中任意一项所述的证件识别方法,其特征在于,所述根据所述证件识别请求及所述目标模型生成证件信息包括:
获取所述待识别对象的对象像素;
根据所述图像像素确定所述图像向量的生成方式,并根据所述生成方式对所述对象像素进行向量化处理,得到对象向量;
从所述目标模型中获取位置检测网络及文本识别网络;
将所述对象向量输入至所述位置检测网络,得到多个检测框及每个检测框的位置信息;
根据所述位置信息从所述对象像素中提取每个检测框的目标像素信息;
将所述目标像素信息输入至所述文本识别网络中,得到信息向量;
根据所述文本映射表对所述信息向量进行映射处理,得到所述证件信息。
6.一种证件识别装置,其特征在于,运行于电子设备,所述电子设备与服务器相通信,所述证件识别装置包括:
确定单元,用于当接收到证件识别请求时,根据所述证件识别请求确定请求类型,包括:解析所述证件识别请求的报文,得到所述报文携带的数据信息;从所述数据信息中获取指示位置的信息作为存储路径,并从所述数据信息中获取指示对象的信息作为对象编号;获取预设查询模板,并从所述预设查询模板中确定查询对象的填充位置;将所述对象编号写入所述填充位置,得到查询语句;在所述存储路径中运行所述查询语句,得到待识别对象;获取所述待识别对象的对象信息,并将与所述对象信息对应的类型确定为所述请求类型;
获取单元,用于若所述请求类型为图像识别类型,根据所述图像识别类型从所述服务器中获取目标学习器;
提取单元,用于从配置库中提取与所述图像识别类型对应的数据作为所述电子设备中的证件数据,所述证件数据包括多类证件的训练数据;
计算单元,用于基于所述证件数据对所述目标学习器进行调整,得到初始模型,并计算所述证件数据的数量作为第一数量;
所述获取单元,还用于根据所述图像识别类型从所述服务器中确定与所述电子设备联盟的终端作为特征终端,并从所述特征终端中获取与所述目标学习器对应的证件识别模型;
所述计算单元,还用于根据所述证件识别模型计算所述特征终端调整所述目标学习器的训练数据的数量作为第二数量;
生成单元,用于根据所述第一数量、所述第二数量、所述初始模型的第一参数值、所述证件识别模型的第二参数值生成所述目标学习器的目标模型,包括:计算所述第一数量与所述第二数量的总和,得到总数量;将所述第一数量除以所述总数量,得到所述电子设备的第一权值,并将所述第二数量除以所述总数量,得到所述特征终端的第二权值;根据预设标签从所述初始模型中提取所述第一参数值,并根据所述预设标签从所述证件识别模型中提取所述第二参数值;计算所述第一权值与所述第一参数值的乘积,得到第一运算值,并计算所述第二权值与所述第二参数值的乘积,得到第二运算值;计算所述第一运算值与所述第二运算值的总和,得到所述预设标签的目标参数值;根据所述目标参数值更新所述目标学习器中与所述预设标签对应的参数值,得到所述目标模型;
所述生成单元,还用于根据所述证件识别请求及所述目标模型生成证件信息。
7. 一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至5中任意一项所述的证件识别方法。
8.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至5中任意一项所述的证件识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110592843.5A CN113177543B (zh) | 2021-05-28 | 2021-05-28 | 证件识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110592843.5A CN113177543B (zh) | 2021-05-28 | 2021-05-28 | 证件识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113177543A CN113177543A (zh) | 2021-07-27 |
CN113177543B true CN113177543B (zh) | 2024-01-23 |
Family
ID=76927801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110592843.5A Active CN113177543B (zh) | 2021-05-28 | 2021-05-28 | 证件识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113177543B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114327671A (zh) * | 2021-12-03 | 2022-04-12 | 北京达佳互联信息技术有限公司 | 参数配置方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874922A (zh) * | 2015-12-11 | 2017-06-20 | 腾讯科技(深圳)有限公司 | 一种确定业务参数的方法及装置 |
CN108388890A (zh) * | 2018-03-26 | 2018-08-10 | 南京邮电大学 | 一种基于面部表情识别的新生儿疼痛程度评估方法及系统 |
CN109766914A (zh) * | 2018-12-14 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于图像识别的物品识别方法、装置、设备及存储介质 |
CN110378487A (zh) * | 2019-07-18 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 横向联邦学习中模型参数验证方法、装置、设备及介质 |
CN111639284A (zh) * | 2020-05-29 | 2020-09-08 | 深圳壹账通智能科技有限公司 | 网页标注方法、装置、电子设备及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102481885B1 (ko) * | 2017-09-08 | 2022-12-28 | 삼성전자주식회사 | 클래스 인식을 위한 뉴럴 네트워크 학습 방법 및 디바이스 |
-
2021
- 2021-05-28 CN CN202110592843.5A patent/CN113177543B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874922A (zh) * | 2015-12-11 | 2017-06-20 | 腾讯科技(深圳)有限公司 | 一种确定业务参数的方法及装置 |
CN108388890A (zh) * | 2018-03-26 | 2018-08-10 | 南京邮电大学 | 一种基于面部表情识别的新生儿疼痛程度评估方法及系统 |
CN109766914A (zh) * | 2018-12-14 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于图像识别的物品识别方法、装置、设备及存储介质 |
CN110378487A (zh) * | 2019-07-18 | 2019-10-25 | 深圳前海微众银行股份有限公司 | 横向联邦学习中模型参数验证方法、装置、设备及介质 |
CN111639284A (zh) * | 2020-05-29 | 2020-09-08 | 深圳壹账通智能科技有限公司 | 网页标注方法、装置、电子设备及介质 |
Non-Patent Citations (1)
Title |
---|
多标签数据挖掘技术:研究综述;李思男;李宁;李战怀;;计算机科学(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113177543A (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020098250A1 (zh) | 字符识别方法、服务器及计算机可读存储介质 | |
WO2021196468A1 (zh) | 标签建立方法、装置、电子设备及介质 | |
WO2021151270A1 (zh) | 图像结构化数据提取方法、装置、设备及存储介质 | |
CN108053545B (zh) | 证件验真方法和装置、服务器、存储介质 | |
CN111739016B (zh) | 目标检测模型训练方法、装置、电子设备及存储介质 | |
CN112541443B (zh) | 发票信息抽取方法、装置、计算机设备及存储介质 | |
CN113656547B (zh) | 文本匹配方法、装置、设备及存储介质 | |
CN113449725B (zh) | 对象分类方法、装置、设备及存储介质 | |
CN112668453B (zh) | 视频识别方法及相关设备 | |
CN112580108B (zh) | 签名和印章完整性验证方法及计算机设备 | |
WO2022126917A1 (zh) | 基于深度学习的人脸图像评估方法、装置、设备及介质 | |
CN113064973A (zh) | 文本分类方法、装置、设备及存储介质 | |
CN112651392A (zh) | 证件信息的获取方法及装置、存储介质、计算机设备 | |
CN110781856A (zh) | 异质人脸识别模型训练方法、人脸识别方法及相关装置 | |
CN113705468B (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
CN113536770B (zh) | 基于人工智能的文本解析方法、装置、设备及存储介质 | |
CN117036184A (zh) | 图像合成方法、装置、电子设备及存储介质 | |
CN113177543B (zh) | 证件识别方法、装置、设备及存储介质 | |
CN113269179B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113313114B (zh) | 证件信息获取方法、装置、设备以及存储介质 | |
CN113343970B (zh) | 文本图像检测方法、装置、设备及存储介质 | |
CN111639903A (zh) | 一种针对架构变更的评审处理方法及相关设备 | |
CN113486680B (zh) | 文本翻译方法、装置、设备及存储介质 | |
CN112819486B (zh) | 用于身份证明的方法和系统 | |
CN112989820B (zh) | 法律文书定位方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |