CN111798250A - 用于确定官方文档的真实性的方法和系统 - Google Patents

用于确定官方文档的真实性的方法和系统 Download PDF

Info

Publication number
CN111798250A
CN111798250A CN202010602879.2A CN202010602879A CN111798250A CN 111798250 A CN111798250 A CN 111798250A CN 202010602879 A CN202010602879 A CN 202010602879A CN 111798250 A CN111798250 A CN 111798250A
Authority
CN
China
Prior art keywords
score
official document
neural network
document
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010602879.2A
Other languages
English (en)
Inventor
徐炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ant Shield Co ltd
Original Assignee
Alipay Labs Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Labs Singapore Pte Ltd filed Critical Alipay Labs Singapore Pte Ltd
Publication of CN111798250A publication Critical patent/CN111798250A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

一种用于确定官方文档的真实性的方法包括接收官方文档的单个图像的文档图像数据和背景图像数据。应用经训练的第一残差神经网络,以从文档图像数据和背景图像数据中提取官方文档的全局特征并且计算指示官方文档的正常度的第一得分和指示官方文档的异常度的至少一个第二得分。应用经训练的第二残差神经网络,以仅从所述文档图像数据中提取官方文档的局部特征并且计算指示官方文档的异常度的至少一个第三得分。该方法还包括基于第一得分与至少一个第二得分以及至少一个第三得分之间的比较来确定所述官方文档是否是真实的。

Description

用于确定官方文档的真实性的方法和系统
技术领域
本公开广泛但非排他地涉及用于确定官方文档的真实性的方法和系统。
背景技术
了解你的顾客(Know Your Customer,KYC)是企业在顾客/客户开始与其开展业务之前或期间,为了验证其顾客/客户的真实性、身份、风险等而做的尽职调查的形式。电子了解你的顾客(eKYC)或数字KYC是由企业通常通过使用计算机执行的无纸处理,并且有时可以由顾客发起。在eKYC处理中,存在包括扫描身份(ID)卡和检测活体人脸的典型步骤。在扫描ID卡的处理中,通常需要检查ID卡的真实性。
在现有技术中已经提出了检测伪ID卡的技术。一种先前的伪ID卡检测方法涉及检测诸如防伪标志(landmarks)或全息图的安全特征,以验证ID卡的真实性。在这种方法中,需要从多个不同的角度捕获ID卡图像,然后验证不同的颜色变化以识别ID卡的真实性。这种和其他传统方法在拍摄ID卡图像时通常需要用户合作。例如,当从不同角度拍摄ID卡的若干图像时,ID卡需要精确地位于预定义的用户界面(UI)框中。上述处理被认为过于繁琐,并且可能使用户体验不愉快。
因此,需要提供可以改进对异常ID卡的检测的方法和设备。
发明内容
本公开的实施例提供了一种用于确定官方文档的真实性的方法。所述方法包括:接收官方文档的单个图像的文档图像数据和背景图像数据;应用经训练的第一残差神经网络,以从所述文档图像数据和所述背景图像数据中提取所述官方文档的全局特征并且计算指示所述官方文档的正常度的第一得分和指示所述官方文档的异常度的至少一个第二得分;应用经训练的第二残差神经网络,以仅从所述文档图像数据中提取所述官方文档的局部特征并且计算指示所述官方文档的异常度的至少一个第三得分;以及基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
本公开的另一个实施例提供了一种用于确定官方文档的真实性的系统。该系统包括处理器以及计算机可读存储器,该计算机可读存储器耦接到处理器并且其上存储有指令。所述指令可由所述处理器执行以进行以下操作:识别所述官方文档的单个图像的文档图像数据和背景图像数据;应用经训练的第一残差神经网络,以从所述文档图像数据和所述背景图像数据中提取所述官方文档的全局特征并且计算指示所述官方文档的正常度的第一得分和指示所述官方文档的异常度的至少一个第二得分;应用经训练的第二残差神经网络,以仅从所述文档图像数据中提取所述官方文档的局部特征并且计算指示所述官方文档的异常度的至少一个第三得分;以及基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
本公开的另一实施例提供了一种装置,包括:输入设备,其被配置为接收官方文档的单个图像的文档图像数据和背景图像数据;以及处理设备,其被配置为将所述数据分别馈送至经训练的第一残差神经网络和经训练的第二残差神经网络。所述经训练的第一残差神经网络包括从文档图像数据和背景图像数据中提取官方文档的全局特征并且计算指示官方文档的正常度的第一得分和指示官方文档的异常度的至少一个第二得分的算法。所述经训练的第二残差神经网络包括仅从文档图像数据提取官方文档的局部特征并且计算指示官方文档的异常度的至少一个第三得分的算法。所述处理装置还被配置为基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
附图说明
从以下书面描述中,仅通过示例的方式并结合附图,本公开的实施例对于本领域普通技术人员将被更好地理解并得以显现,在附图中:
图1示出了说明根据实施例的用于确定官方文档的真实性的方法的流程图。
图2示出了说明图1的方法的详细示例实现的流程图。
图3示出了用于实现图1的方法的装置的示意图。
图4示出了说明用于实现图1的方法的计算机系统的示意图。
所属领域的技术人员将了解,附图中的元件是为了简单和清楚起见而示出的,且未必按比例绘制。例如,相对于其他元件,可以放大图示、框图或流程图中的一些元件的尺寸,以帮助改善对本文实施例的理解。
具体实施方式
本公开提供了用于基于官方文档(诸如身份证)的单个图像来确定该官方文档是否真实的方法和设备。在本公开中,应当认识到,伪造的官方文档可以广义地分类为物理上不存在(例如,正在使用屏幕截图或复印)的文档或者具有非常规特征(例如,篡改迹象或被遮挡、擦除、位置失调等特征)的文档。通过利用由神经网络提取的全局特征和局部特征,本方法和设备可以识别各种类型的伪造文档,从而将真实文档与伪造文档区分开。例如,在eKYC应用的上下文中,本方法和设备可以帮助确定(1)用户(例如顾客)是否实际拥有所需的官方文档,(2)正在被提交以用于验证的官方文档是否是真实的。
将参照附图以仅作为示例的方式描述实施方式。附图中相同的附图标记和字符指代相同的元件或等同物。
以下描述的一些部分根据计算机存储器内的数据操作的算法和功能或符号表示而被显式地或隐式地呈现。这些算法描述和功能或符号表示是数据处理领域的技术人员用来将其工作的实质最有效地传达给本领域的其他技术人员的手段。算法在这里一般地被认为是导致期望结果的步骤的自洽序列。这些步骤需要物理操作物理量,例如能够被存储、转移、组合、比较、和以其他方式操作的电信号、磁信号或光信号。
除非另有具体说明,并且从以下内容显现,否则将理解,贯穿本说明书的利用如“扫描”、“计算”、“确定”、“应用”、“提取”、“生成”、“初始化”、“输出”等术语的讨论是指计算机系统或类似电子设备的动作和处理,该动作和处理将计算机系统内表示为物理量的数据操作和转换成类似地在计算机系统或其他信息存储、传输或显示设备内表示为物理量的其他数据。
本说明书还公开了用于执行这些方法的操作的装置。这样的装置可以为了所需目的而专门构造,或者可以包括计算机或者由存储在计算机中的计算机程序选择性地激活或重新配置的其他设备。本文中所呈现的算法和显示并非固有地涉及任何特定计算机或其他设备。不同机器可以与根据本文的教导的程序一起使用。可替代地,用以执行所需方法步骤的更专用设备的构造可能是合适的。从以下描述中将显现常规计算机的结构。
此外,本说明书还隐含公开了一种计算机程序,因为对于本领域技术人员而显现的是,本文所描述的方法的各个步骤可以通过计算机代码来实现。计算机程序无意限于任何特定的编程语言及其实现方式。应当理解,各种编程语言及其编码可以用于实现本文所包含的本公开的教导。此外,计算机程序无意限于任何特定的控制流。存在计算机程序的许多其他变体,这些变体可以使用不同的控制流而不脱离本公开的范围。
此外,可以并行而不是顺序地执行计算机程序的一个或多个步骤。这样的计算机程序可以存储在任何计算机可读介质上。计算机可读介质可包含例如磁盘或光盘、存储器芯片的存储装置,或适于与计算机对接的其他存储装置。计算机可读介质还可以包括诸如在互联网系统中例示的硬连线介质或诸如在GSM、GPRS、3G、4G或5G移动电话系统中例示的无线介质以及诸如蓝牙、ZigBee、Wi-Fi的其他无线系统。当在这样的计算机上加载和执行计算机程序时,所述计算机程序有效地导致实现优选方法的步骤的装置。
本公开还可被实现为硬件元件。更具体地,在硬件意义上,元件是被设计成与其他部件或元件一起使用的功能性硬件单元。例如,可以使用分立的电子部件来实现元件,或者它可以形成整个电子电路的一部分,诸如专用集成电路(ASIC)或现场可编程门阵列(FPGA)。存在许多其他可能性。本领域技术人员将理解,该系统还可被实现为硬件和软件元件的组合。
根据各实施例,“电路”可以被理解为任何类型的逻辑实现实体,其可以是专用电路或执行存储在存储器、固件或其任何组合中的软件的处理器。因此,在实施例中,“电路”可以是硬接线逻辑电路或可编程逻辑电路,如可编程处理器,例如微处理器(例如,复杂指令集计算机(CISC)处理器或精简指令集计算机(RISC)处理器)。“电路”还可以是执行软件的处理器,例如,诸如使用虚拟机代码(如Java)的计算机程序的任何类型的计算机程序。根据替代实施例,在本文中更详细描述的各个功能的任何其他种类的实施方式还可以被理解为“电路”。
图1示出了根据替代实施例的用于确定官方文档的真实性的方法的流程图100。
在步骤102,接收官方文档的单个图像的文档图像数据和背景图像数据。例如,官方文档可以是例如以下参考图2进一步详细讨论的身份证。官方文档的其他适当的非限制性示例包括护照、驾照、社会安全保障卡、证书(出生证书、婚姻证书、教育证书等)。通常,官方文档可被扫描或拍摄,并被提供为包括文档和背景两者的图像。通常可以将背景图像数据与文档图像数据区分开。
在步骤104,应用经训练的第一残差神经网络,以从文档图像数据和背景图像数据中提取官方文档的全局特征并且计算指示官方文档的正常度的第一得分和指示官方文档的异常度的至少一个第二得分。如以下进一步详细讨论的,全局特征包括由全局神经网络分类器提取的特征,该全局神经网络分类器是基于具有背景的官方文档图像来预先训练的。至少一个第二得分可以包括指示官方文档在物理上不存在(例如正在使用屏幕截图或复印)的得分。
在步骤106,应用经训练的第二残差神经网络,以仅从文档图像数据提取官方文档的局部特征并且计算指示官方文档的异常度的至少一个第三得分。如下面进一步详细讨论的,局部特征包括由局部神经网络分类器提取的特征,该局部神经网络分类器是基于无背景的官方文档图像被预先训练的。至少一个第三得分可以包括指示官方文档具有一个或多个非常规特征的得分。这样的非常规特征的示例包括但不限于篡改迹象或被遮挡、缺失、形状失调、位置失调等的特征。
在步骤108,基于第一得分与至少一个第二得分以及至少一个第三得分之间的比较,确定官方文档是否是真实的。例如,如果第一得分大于至少一个第二得分和至少一个第三得分的集合中的最大值,则确定官方文档是真实的。相反,如果第一得分小于至少一个第二得分和至少一个第三得分的集合中的最大值,则确定官方文档是不真实的。
换言之,高的第一得分指示官方文档是真实的。另一方面,如果其他得分中的任何一个更高,则认为官方文档是不真实的。
图2示出了说明图1的方法的详细的示例性实施方式的流程图200。在该示例中,官方文档是身份证(在下文中可互换地称为ID卡),但是本领域技术人员将理解,该方法可以类似地应用于其他类型的官方文档。
在步骤202,提供ID卡图像I1,该ID卡图像可以是由用户通过使用例如具备相机功能的蜂窝电话拍摄的照片。通常,用户仅需要在单个角度拍摄一张ID卡图像I1。例如,如果ID卡被放置在桌子上,则ID卡图像I1可包括ID卡和作为背景的桌子表面。或者,在其他实施例中,ID卡图像I1可以是从扫描仪获得的扫描件。在步骤204,原始ID卡图像I1被提供给全局神经网络(Net_Global),以通过利用ID卡的全局特征来识别诸如屏幕截图或复印件的伪造ID卡。
在此示例中,全局神经网络(Net_Global)经设计和训练以预测正常/异常ID卡的概率。作为非限制性示例,全局神经网络(Net_Global)包含4个残差块。对于每个块,网络利用跳跃连接来跳过三层,并且包含层间的非线性(ReLU)和批归一化。此外,使用附加的权重矩阵来学习跳跃权重。此残差神经网络是利用所收集的包括被标记的带背景ID卡图像的大规模数据而预先训练的。全局神经网络分类器可识别的全局特征的一些示例包括但不限于图像中的卡的反射率、图像中的卡的形状以及卡的深度/厚度。
为了计算所述概率,采用预处理步骤将原始ID卡图像I1从像素值0~255归一化为(-1)~1。当原始ID卡图像I1被馈送到全局神经网络(Net_Global)时,网络能够提取ID卡的全局特征,并且在步骤206预测概率,所述概率包括分别对应于正常ID卡、屏幕截图的ID卡和复印的ID卡的score1、score2和score3。
另外,局部神经网络(Net_Local)用于从ID卡图像I1提取局部特征以识别伪造ID卡,例如被篡改的ID卡或被遮挡的ID卡。局部神经网络(Net_Local)也包含残差块并且被设计成用于从ID卡中提取局部特征。此局部残差神经网络是利用所收集的包括被标记的无背景ID卡图像的大规模数据而预先训练的。局部神经网络分类器可识别的局部特征的一些示例包括但不限于文本字段的位置、生物特征数据或人脸照片的存在/不存在、以及卡的颜色。
为了获得局部特征,首先对卡图像I1进行背景去除。这里,在步骤208检测ID卡的四个角C1、C2、C3、C4,并且在步骤210,通过移除背景,仅检测到ID卡部分I2。在步骤212,所提取的ID卡部分I2仅包含ID卡信息,并且被馈送到局部残差神经网络(Net_Local)以提取局部特征。然后,在步骤214,局部神经网络(Net_Local)预测概率,所述概率包括分别对应于被篡改的ID卡和被遮挡的ID卡的score4和score5。
在示例性实施方式中,可以使用用于快速特征嵌入(CAFFE)框架的卷积架构的元素来计算得分(score1、score2、score3、score4和score5)。将认识到,在替代实施例中可以使用其他深度学习框架。
在步骤216,基于以下公式计算最终得分:
F(score)=max(score1,max(score2,score3,score4,score5))
在该示例中,如果score1>max(score2,score3,score4,score5),这意味着F(score)=score1,ID卡被确定为是真实的(即,正常ID卡)。另一方面,如果score1<max(score2,score3,score4,score5),这意味着F(score)=max(score2,score3,score4,score5),ID卡被确定为是不真实的(即,异常ID卡)。此外,在后一种情况下,例如,如果max(score2,score3,score4,score5)=score2,则可以确定ID卡是屏幕截图。类似地,如果最终得分对应于另一类别的得分,则可以识别出该另一类别的伪造ID卡。
图3示出了适于实现图1的方法的装置300的示意图。装置300包括输入设备302和处理设备304。输入设备302被配置为接收官方文档的单个图像的文档图像数据和背景图像数据。处理设备304被配置为将数据分别馈送到经训练的第一残差神经网络306和经训练的第二残差神经网络308。经训练的第一残差神经网络306包括用于从文档图像数据和背景图像数据提取官方文档的全局特征并且计算指示官方文档的正常度的第一得分310和指示官方文档的异常度的至少一个第二得分312的算法。经训练的第二残差神经网络308包括用于仅从文档图像数据提取官方文档的局部特征并且计算指示官方文档的异常度的至少一个第三得分314、316的算法。处理设备304还被配置为基于第一得分310与至少一个第二得分312以及至少一个第三得分314、316之间的比较来确定官方文档是否是真实的。
在以上示例中,第一和第二残差神经网络被描述为相应的神经网络,并且全局特征是与局部特征分开学习的。然而,本领域技术人员将理解,在替代实施例中,第一和第二残差神经网络可被实现为能够同时联合学习全局特征和局部特征的同一神经网络的相应分支。
与需要用户合作来以多个角度拍摄ID卡图像(因此用户体验不令人愉悦并且EKYC处理不高效)的传统技术相比,本公开中描述的方法不需要用户拍摄多个图像。相反,仅一张具有法线角度(normal angle)的ID卡图像足以同时提取全局和局部特征。换言之,本公开不需要肯定地检测特定特征,诸如安全特征或防伪标志,这些特征有时在物理上是模糊的,因此难以检测。取而代之的是,同时获得并比较若干不同的得分,每个得分指示或代表真实性结果。因而,可以减少输入和处理ID卡图像所花费的时间,从而提高用户体验和整体效率。此外,通过使用本公开中的全局特征和局部特征两者的组合,可以以高精度将真实的ID卡与不真实的ID卡区分开并识别各种类型的伪造ID卡,诸如屏幕截图的ID卡、复印的ID卡、被篡改的ID卡、被遮挡的ID卡等。
图4描绘了示例性计算设备400,在下文中可互换地称为计算机系统400,其中一个或多个这样的计算设备400可以用于装置300。以下对计算设备400的描述以仅作为示例的方式提供,并且不旨在是限制性的。
如图4所示,示例计算设备400包括用于执行软件例程的处理器404。尽管为了清楚起见示出了单个处理器,但是计算设备400也可以包括多处理器系统。处理器404连接到用于与计算设备400的其他组件通信的通信基础设施406。通信基础设施406可以包括例如通信总线、交叉线或网络。
计算设备400进一步包括例如,随机存取存储器(RAM)的主存储器408和次存储器410。次存储器410可以包括例如硬盘驱动器412和/或可移动存储驱动器414,其可以包括软盘驱动器、磁带驱动器、光盘驱动器等。可移动存储驱动器414以公知的方式从可移动存储单元418读取和/或写入到可移动存储单元418。可移动存储单元418可以包括由可移动存储驱动器414读取和写入的软盘、磁带、光盘等。如相关领域的技术人员将理解的,可移动存储单元418包括其中存储有计算机可执行的程序代码指令和/或数据的计算机可读存储介质。
在替代实施例中,次存储器410可另外或替代地包括用于允许计算机程序或其他指令加载到计算设备400中的其他类似装置。这样的装置可以包括例如可移动存储单元422和接口420。可移动存储单元422和接口420的实例包括程序盒式存储器和盒式接口(诸如在视频游戏控制台设备中发现的)、可移动存储器芯片(诸如EPROM或PROM)和相关联的插槽、以及允许软件和数据从可移动存储单元422被传送到计算机系统400的其他可移动存储单元422和接口420。
计算设备400还包括至少一个通信接口424。通信接口424允许软件和数据经由通信路径426在计算设备400和外部设备之间传送。在本公开的不同实施例中,通信接口424允许在计算设备400与诸如公共数据通信网络或私有数据通信网络的数据通信网络之间传输数据。通信接口424可以用于在不同计算设备400之间交换数据,这些计算设备400形成互连的计算机网络的一部分。通信接口424的示例可以包括调制解调器、网络接口(诸如以太网卡)、通信端口、具有相关电路的天线等。通信接口424可以是有线的或可以是无线的。经由通信接口424传输的软件和数据是呈信号的形式,这些信号可以是电子、电磁、光学或能够由通信接口424接收的其他信号。这些信号经由通信路径426被提供给通信接口424。
如图4所示,计算设备400还包括执行用于将图像渲染到相关联的显示器430的操作的显示器接口402以及用于执行经由相关联的扬声器434播放音频内容的操作的音频接口432。
如在此所使用的,术语“计算机程序产品”可以部分地指代可移动存储单元418、可移动存储单元422、安装在硬盘驱动器412中的硬盘、或者在到通信接口424的通信路径426(无线链路或电缆)上承载软件的载波。计算机可读存储介质是指向计算设备400提供所记录的指令和/或数据以供执行和/或处理的任何非暂时性有形存储介质。此类存储介质的示例包括软盘、磁带、CD-ROM、DVD、蓝光TM盘、硬盘驱动器、ROM或集成电路、USB存储器、磁光盘或诸如PCMCIA卡等的计算机可读卡,无论此类设备是在计算设备400的内部还是外部。同样可以参与向计算设备400提供软件、应用程序、指令和/或数据的暂时性或非有形计算机可读传输介质的示例包括无线电或红外传输信道以及到另一计算机或联网设备的网络连接,以及包括记录在网站等上的电子邮件传输和信息的互联网或内联网。
计算机程序(也称为计算机程序代码)存储在主存储器408和/或次存储器410中。计算机程序还可经由通信接口424接收。这样的计算机程序在被执行时使得计算设备400能够执行本文所讨论的实施例的一个或多个特征。在各种实施例中,计算机程序在被执行时使处理器404能够执行上述实施例的特征。因而,这样的计算机程序表示计算机系统400的控制器。
软件可被存储在计算机程序产品中并使用可移动存储驱动器414、硬盘驱动器412或接口420加载到计算设备400中。替代地,计算机程序产品可通过通信路径426下载到计算机系统400。软件在由处理器404执行时,促使计算设备400执行本文描述的实施例的功能。
应当理解,图4的实施例以仅作为示例的方式呈现。因此,在一些实施例中,可以省略计算设备400的一个或多个特征。此外,在一些实施例中,计算设备400的一个或多个特征可以组合在一起。另外,在一些实施例中,计算设备400的一个或多个特征可以被分割成一个或多个组成部分。
应当理解,图4所示的元件用于提供执行如以上实施例中所描述的服务器的不同功能和操作的装置。
在一实施方式中,服务器可被一般地描述为包括至少一个处理器和至少一个存储器的物理设备,所述存储器包括计算机程序代码。至少一个存储器和计算机程序代码被配置为利用至少一个处理器促使物理设备执行必要的操作。
本领域技术人员将理解,在不脱离如广泛描述的本公开的范围的情况下,可以对如具体实施例中所示的本公开进行许多变化和/或修改。例如,可基于性能来适配或优化残差神经网络的结构。得分的数量可以基于可能伪造的官方文档的属性而变化。因此,本文的实施例在所有方面都被认为是说明性的而不是限制性的。

Claims (20)

1.一种用于确定官方文档的真实性的方法,所述方法包括:
接收官方文档的单个图像的文档图像数据和背景图像数据;
应用经训练的第一残差神经网络,以从所述文档图像数据和所述背景图像数据中提取所述官方文档的全局特征并且计算指示所述官方文档的正常度的第一得分和指示所述官方文档的异常度的至少一个第二得分;
应用经训练的第二残差神经网络,以仅从所述文档图像数据中提取所述官方文档的局部特征并且计算指示所述官方文档的异常度的至少一个第三得分;以及
基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
2.如权利要求1所述的方法,其中,如果所述第一得分大于所述至少一个第二得分和所述至少一个第三得分的集合中的最大值,则确定所述官方文档是真实的。
3.如权利要求1所述的方法,其中,如果所述第一得分小于所述至少一个第二得分和所述至少一个第三得分的集合中的最大值,则确定所述官方文档是不真实的。
4.如前述权利要求中任一项所述的方法,其中,所述官方文档包括身份证。
5.如前述权利要求中任一项所述的方法,其中,所述至少一个第二得分包括指示所述官方文档物理上不存在的得分。
6.如前述权利要求中任一项所述的方法,其中,所述至少一个第三得分包括指示所述官方文档具有一个或多个非常规特征的得分。
7.如前述权利要求中任一项所述的方法,其中,所述第一残差神经网络是基于多个被标记的带背景的官方文档图像来训练的。
8.如前述权利要求中任一项所述的方法,其中,所述第二残差神经网络是基于多个被标记的无背景的官方文档图像来训练的。
9.如前述权利要求中任一项所述的方法,其中,所述经训练的第一残差神经网络和所述经训练的第二残差神经网络包括同一神经网络的相应分支。
10.一种用于确定官方文档的真实性的系统,包括:
处理器;以及
计算机可读存储器,其耦接到所述处理器且其上存储有指令,所述指令能够由所述处理器执行以:
识别所述官方文档的单个图像的文档图像数据和背景图像数据;
应用经训练的第一残差神经网络,以从所述文档图像数据和所述背景图像数据中提取所述官方文档的全局特征并且计算指示所述官方文档的正常度的第一得分和指示所述官方文档的异常度的至少一个第二得分;
应用经训练的第二残差神经网络,以仅从所述文档图像数据中提取所述官方文档的局部特征并且计算指示所述官方文档的异常度的至少一个第三得分;以及
基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
11.如权利要求10所述的系统,其中,所述指令能够由所述处理器执行以便如果所述第一得分大于所述至少一个第二得分和所述至少一个第三得分的集合的最大值,则确定所述官方文档是真实的。
12.如权利要求10所述的系统,其中,所述指令能够由所述处理器执行以便如果所述第一得分小于所述至少一个第二得分和所述至少一个第三得分的集合中的最大值,则确定所述官方文档是不真实的。
13.如权利要求10至12中任一项所述的系统,其中,所述官方文档包括身份证。
14.如权利要求10至13中任一项所述的系统,其中,所述至少一个第二得分包括指示所述官方文档物理上不存在的得分。
15.如权利要求10至14中任一项所述的系统,其中,所述至少一个第三得分包括指示所述官方文档具有一个或多个非常规特征的得分。
16.如权利要求10至15中任一项所述的系统,其中,所述第一残差神经网络包括基于多个被标记的带背景的官方文档图像来训练的神经网络。
17.如权利要求10至16中任一项所述的系统,其中,所述第二残差神经网络包括基于多个被标记的无背景的官方文档图像训练的神经网络。
18.如权利要求10至17中任一项所述的系统,其中,所述经训练的第一残差神经网络和所述经训练的第二残差神经网络包括同一神经网络的相应分支。
19.一种装置,包括:
输入装置,其被配置为接收官方文档的单个图像的文档图像数据和背景图像数据;并且
处理装置,其被配置为将所述数据分别馈送至经训练的第一残差神经网络和经训练的第二残差神经网络,
其中,所述经训练的第一残差神经网络包括用于从所述文档图像数据和所述背景图像数据中提取所述官方文档的全局特征并且计算指示所述官方文档的正常度的第一得分和指示所述官方文档的异常度的至少一个第二得分的算法;
所述经训练的第二残差神经网络包括用于仅从所述文档图像数据中提取所述官方文档的局部特征并且计算指示所述官方文档的异常度的至少一个第三得分;并且
所述处理设备进一步被配置为基于所述第一得分与所述至少一个第二得分以及所述至少一个第三得分之间的比较来确定所述官方文档是否是真实的。
20.如权利要求19所述的装置,其中,所述经训练的第一残差神经网络和所述经训练的第二残差神经网络包括同一神经网络的相应分支。
CN202010602879.2A 2019-12-31 2020-06-29 用于确定官方文档的真实性的方法和系统 Pending CN111798250A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SG10201913966TA SG10201913966TA (en) 2019-12-31 2019-12-31 Method And System For Determining Authenticity Of An Official Document
SG10201913966T 2019-12-31

Publications (1)

Publication Number Publication Date
CN111798250A true CN111798250A (zh) 2020-10-20

Family

ID=70615285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010602879.2A Pending CN111798250A (zh) 2019-12-31 2020-06-29 用于确定官方文档的真实性的方法和系统

Country Status (2)

Country Link
CN (1) CN111798250A (zh)
SG (1) SG10201913966TA (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229344A (zh) * 2017-12-19 2018-06-29 深圳市商汤科技有限公司 图像处理方法和装置、电子设备、计算机程序和存储介质
US20190197642A1 (en) * 2016-10-17 2019-06-27 Facebook, Inc. Classification and authentication of identification documents using a convolutional neural network
CN110222746A (zh) * 2019-05-24 2019-09-10 北京字节跳动网络技术有限公司 训练分类器的方法、装置、电子设备和计算机可读存储介质
CN110222736A (zh) * 2019-05-20 2019-09-10 北京字节跳动网络技术有限公司 训练分类器的方法、装置、电子设备和计算机可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190197642A1 (en) * 2016-10-17 2019-06-27 Facebook, Inc. Classification and authentication of identification documents using a convolutional neural network
CN108229344A (zh) * 2017-12-19 2018-06-29 深圳市商汤科技有限公司 图像处理方法和装置、电子设备、计算机程序和存储介质
CN110222736A (zh) * 2019-05-20 2019-09-10 北京字节跳动网络技术有限公司 训练分类器的方法、装置、电子设备和计算机可读存储介质
CN110222746A (zh) * 2019-05-24 2019-09-10 北京字节跳动网络技术有限公司 训练分类器的方法、装置、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
SG10201913966TA (en) 2020-03-30

Similar Documents

Publication Publication Date Title
US9946865B2 (en) Document authentication based on expected wear
CN110851835B (zh) 图像模型检测方法、装置、电子设备及存储介质
US20190392196A1 (en) Within document face verification
EP3526781A1 (en) Tamper detection for identification documents
CN108229499A (zh) 证件识别方法及装置、电子设备和存储介质
KR20200118842A (ko) 신원 인증 방법 및 장치, 전자 기기 및 저장 매체
CN107609364B (zh) 用户身份确认方法和装置
CN113642639B (zh) 活体检测方法、装置、设备和存储介质
CN112990166B (zh) 一种人脸真伪的识别方法、识别装置及电子设备
Sari et al. The effect of error level analysis on the image forgery detection using deep learning
EP4274156A1 (en) Systems and methods for token authentication
CN110008942B (zh) 证件验证方法、装置、服务器及存储介质
CN113269123B (zh) 证件识别方法和系统
CN111798250A (zh) 用于确定官方文档的真实性的方法和系统
CN113077355B (zh) 保险理赔方法、装置、电子设备及存储介质
CN115775409A (zh) 一种人脸图像防篡改融合检测方法
CN111639718B (zh) 分类器应用方法及装置
CN112597810A (zh) 身份证明文件认证方法和系统
CN112613345A (zh) 用户认证方法和系统
CN111767845A (zh) 证件识别方法及装置
CN114694196A (zh) 活体分类器建立方法、人脸活体检测方法及装置
Saleem et al. Credibility assessment of social media images shared during disasters
US11250254B2 (en) Methods and systems for detecting photograph replacement in a photo identity document
CN112613497A (zh) 用于确定官方文件的真实性的方法和系统
JP6865797B2 (ja) 真贋判定方法、情報処理装置、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20240919

Address after: 128 Meizhi Road, Singapore, Guohao Times City # 20-01189773

Applicant after: Ant Shield Co.,Ltd.

Country or region after: Singapore

Address before: 45-01 Anson Building, 8 Shanton Avenue, Singapore

Applicant before: Alipay laboratories (Singapore) Ltd.

Country or region before: Singapore