CN111242932A - 一种卡片样式的校验方法及装置 - Google Patents

一种卡片样式的校验方法及装置 Download PDF

Info

Publication number
CN111242932A
CN111242932A CN202010044226.7A CN202010044226A CN111242932A CN 111242932 A CN111242932 A CN 111242932A CN 202010044226 A CN202010044226 A CN 202010044226A CN 111242932 A CN111242932 A CN 111242932A
Authority
CN
China
Prior art keywords
information
card
determining
image information
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010044226.7A
Other languages
English (en)
Inventor
费志军
邱雪涛
李晴川
徐梓原
钱秦篆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN202010044226.7A priority Critical patent/CN111242932A/zh
Publication of CN111242932A publication Critical patent/CN111242932A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/0006Industrial image inspection using a design-rule based approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种卡片样式的校验方法及装置,其中方法为:根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。

Description

一种卡片样式的校验方法及装置
技术领域
本发明涉及图像识别领域,尤其涉及一种卡片样式的校验方法及装置。
背景技术
刷卡行为贯穿着人们生产发展的各方面,举例来说,用户通过银行卡进行刷卡支付。然而,一类卡片在发卡之前是需要校验的,在校验后确定这类卡片的样卡满足机构要求后,才可使用该样卡的样式进行发卡。
目前的样卡校验完全依靠人工完成,这样的工作模式不仅对审卡业务人员要求高,而且效率低、错漏率高,更不符合当前科技服务中自动化、智能化的趋势。因此,目前没有自动校验样卡的方法,是一个亟待解决的问题。
发明内容
本申请提供一种卡片样式的校验方法及装置,解决了现有技术中没有自动校验样卡的方法的问题。
第一方面,本申请提供一种卡片样式的校验方法,包括:根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
上述方法中,根据卡片的图像信息,实现自动确定所述卡片中各元素在所述卡片中的位置信息,并确定所述各元素的图像信息,进一步地,可以实现自动校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
一种可选实施方式中,所述根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息之前,还包括:将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息;所述根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;包括:将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。
上述方法中,在根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息之前,先将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,训练出一个应用图像物体定位模型;通过机器学习训练,可以学习到训练数据集中的知识,从而将所述各元素的图像信息作为所述应用图像物体定位模型的输入后,可以根据卡片的图像信息,更加智能化地确定所述卡片中各元素在所述卡片中的位置信息。
一种可选实施方式中,所述校验所述各元素的图像信息是否符合所述卡片的样式要求,包括:将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息;所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息;针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求;所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
上述方法中,所述预训练机器学习模型至少包括文本识别模型,所述文本识别模型可以学习到所述第二样本数据集的知识,因此将所述各元素的图像信息输入预训练机器学习模型,可以自动提取所述各元素中每个元素中包含的文本信息;之后,针对所述各元素中每个元素,可以自动确定所述元素是否满足预设条件,并进一步确定所述元素的图像信息是否符合所述卡片的样式要求。
一种可选实施方式中,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息;所述元素的关键信息还包括:所述元素的类别信息;所述元素分类模型是根据第三样本数据集进行机器学习训练确定的;所述第三样本数据集中每条样本数据至少包括:元素的图像信息;元素的类别信息;所述预设条件还包括:所述元素中包含的文本信息与所述元素的类别信息匹配。
上述方式下,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息,而所述元素分类模型是通过机器学习训练学习了第三样本数据集得到的,可以更加智能化地判定各元素的类别信息,并结合所述元素中包含的文本信息与所述元素的类别信息是否匹配来校验图像信息,从而更加精确、严密地确定所述图像信息是否符合所述卡片的样式要求。
一种可选实施方式中,所述校验所述各元素的位置信息是否符合所述卡片的样式要求,包括:针对所述各元素中每个元素,若确定所述元素的位置信息在所述元素的预设位置范围内,则确定所述元素的位置信息符合所述卡片的样式要求;否则,确定所述元素的位置信息不符合所述卡片的样式要求。
上述方式下,针对所述各元素中每个元素,根据所述元素的位置信息是否在所述元素的预设位置范围内,确定所述元素的位置信息是否符合所述卡片的样式要求,从而提供了一种自动校验元素的位置信息是否符合所述卡片的样式要求的方法。
第二方面,本申请提供一种卡片样式的校验装置,包括:确定单元,用于根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;校验单元,用于校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
一种可选实施方式中,所述确定单元还用于:将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息;所述确定单元具体用于:将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。
一种可选实施方式中,所述校验具体用于:将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息;所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息;针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求;所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
一种可选实施方式中,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息;所述元素的关键信息还包括:所述元素的类别信息;所述元素分类模型是根据第三样本数据集进行机器学习训练确定的;所述第三样本数据集中每条样本数据至少包括:元素的图像信息;元素的类别信息;所述预设条件还包括:所述元素中包含的文本信息与所述元素的类别信息匹配。
一种可选实施方式中,所述校验单元具体用于:针对所述各元素中每个元素,若确定所述元素的位置信息在所述元素的预设位置范围内,则确定所述元素的位置信息符合所述卡片的样式要求;否则,确定所述元素的位置信息不符合所述卡片的样式要求。
上述第二方面及第二方面各个实施方式的有益效果,可以参考上述第一方面及第一方面各个实施方式的有益效果,这里不再赘述。
第三方面,本申请提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
第四方面,本申请提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行上述第一方面及第一方面各个实施方式的方法。
附图说明
图1为本申请实施例提供的一种卡片样式的校验方法可应用的架构示意图;
图2为本申请实施例提供的一种卡片样式的校验方法的步骤流程示意图;
图3为本申请实施例提供的一种卡片样式中图像物体定位模型定位卡片元素的过程示意图;
图4为本申请实施例提供的一种卡片样式中文本识别模型识别文字的过程示意图;
图5为本申请实施例提供的一种卡片样式的校验装置的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互结合。
本申请中涉及到的缩略语如表1所示:
Figure BDA0002368798890000061
表1
如图1所示,为本申请提供的一种卡片样式的校验方法可应用的架构示意图。需要说明的是,该架构适用于各种卡片,如银行卡等,再次不做限定。卡片样式包括银行卡设计图样、数字等各种元素,元素即为一项独立表征所述卡片一项独立信息的模块,举例来说,银行卡号是一个元素、开户行是一个元素。该架构包括3个模块:定位模块、识别模块和校验模块。下面分别介绍3个模块。
定位模块:定位模块对可以对卡片中各元素进行定位。对于各元素中任一元素,可以先在卡片检测出目标元素的相对区域,减少干扰像素。需要说明的是,定位模块是针对卡面的标识元素(如标识客户等级的图案)和部分文本元素进行粗略定位。对于文本元素的精确定位,可以通过各元素的位置信息送入后续识别模块来实现。
识别模块:识别模块包括元素识别部分和文本识别部分。其中,元素识别部分可以通过训练大量样本数据对定位后的各元素实现分类。文本识别部分使用单独训练的文本识别模型,对卡片包含的中文、英文及数字等各种文本信息进行识别,并输出文本信息。
校验模块:校验模块可以进行以下三类校验。第一类是对各元素进行元素识别后,将文本元素的分类结果与文本识别结果进行验证;第二类是依据预设实体名称列表对文本信息进行核对校准,提升识别准确度;第三类是规则信息校验:依据卡片的设计规则(如预先设置的元素预设范围)对识别出的卡片各元素的位置信息进行合规判断,并反馈判别结果。
下面结合图2,详细说明本申请提供的一种卡片样式的校验方法。
步骤201:根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息。
所述各元素中每个元素都表征了所述卡片一项独立的信息。
步骤202:根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息。
步骤203:校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
步骤201之前的一种可选实施方式中,第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息。
需要说明的是,初始图像物体定位模型为图像物体定位模型的训练之前的初始状态,应用图像物体定位模型为图像物体定位模型的训练结束状态。图像物体定位模型可以为Faster R-CNN。具体来说,基于Faster R-CNN网络和迁移学习实现卡面元素的定位和检测。通过卷积层提取图像特征,并将图像特征用于候选区域生成网络(RPN)和目标区池化(RoI池)。RPN网络用于生成区域候选图像块,实现各元素的区域定位。RoI池收集输入的图像特征和候选的目标区域,提取目标区域的图像特征,并通过全连接层判定目标类别。
步骤201具体可以按照以下方式执行:
将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。步骤201按上述可选实施方式执行后的效果如图3所示。
上述可选实施方式中,在根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息之前,先将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,训练出一个应用图像物体定位模型;通过机器学习训练,可以学习到训练数据集中的知识,从而将所述各元素的图像信息作为所述应用图像物体定位模型的输入后,可以根据卡片的图像信息,更加智能化地确定所述卡片中各元素在所述卡片中的位置信息。
步骤201具体还可以按照以下方式执行:
将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息。
其中,所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息。步骤201按上述可选实施方式执行后的效果如图4所示。
基于步骤201的上述可选实施方式,步骤203具体还可以按照以下方式执行:
针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求。
所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
具体来说,由于基于Faster R-CNN的目标定位识别模型难以精确定位卡片上的文字元素,因此通过采用渐进式扩展网络(PSENet)完成文本元素定位后,再通过文本识别模型来完成文字识别。文本识别模型在此不做限定,举例来说文本识别模型为CRNN网络。需要说明的是,其中PSENet采用基于分割的方法,精确检测任意形状的文本实例,并通过渐进的尺度扩展算法,将文本实例有效分离。CRNN基于序列预测,使用CNN、RNN、CTC结构,使用CNN将图片的特征提取出来,采用RNN对序列进行预测,最后通过CTC的翻译层得到识别结果。
需要说明的是,文字识别模型在识别发卡行名称时难免会出现错漏,而且采用文本分技术进行“命名实体”识别也无法有效处理。因此,预设条件中设置了所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。举例来说,卡片为银行卡,发卡行名称是银行卡样卡审核流程中的重要信息,发卡行名称为A1,预设实体名称列表中的实体名称为A,而A与A1、A2和A3都有映射关系,因此当文字识别到发卡行名称为A1时,仍然认为是符合预设条件。本申请中,通过将发卡行名称识别结果与“预设实体名称列表”进行检索比对(检索比对方法可以为:Jaro-Winkler、编辑距离、最长公共子串、余弦相似度等),有效解决了发卡行名称识别出现错误的情况,提升发卡行名称识别准确度。
另外,上述可选实施方式中,所述预训练机器学习模型至少包括文本识别模型,所述文本识别模型可以学习到所述第二样本数据集的知识,因此将所述各元素的图像信息输入预训练机器学习模型,可以自动提取所述各元素中每个元素中包含的文本信息;之后,针对所述各元素中每个元素,可以自动确定所述元素是否满足预设条件,并进一步确定所述元素的图像信息是否符合所述卡片的样式要求。
基于上述可选实施方式,在上述可选方式中,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息;所述元素的关键信息还包括:所述元素的类别信息;所述元素分类模型是根据第三样本数据集进行机器学习训练确定的;所述第三样本数据集中每条样本数据至少包括:元素的图像信息;元素的类别信息;所述预设条件还包括:所述元素中包含的文本信息与所述元素的类别信息匹配。
该方式下,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息,而所述元素分类模型是通过机器学习训练学习了第三样本数据集得到的,可以更加智能化地判定各元素的类别信息,并结合所述元素中包含的文本信息与所述元素的类别信息是否匹配来校验图像信息,从而更加精确、严密地确定所述图像信息是否符合所述卡片的样式要求。
在步骤203的另一种可选实施方式中,所述校验所述各元素的位置信息是否符合所述卡片的样式要求,包括:针对所述各元素中每个元素,若确定所述元素的位置信息在所述元素的预设位置范围内,则确定所述元素的位置信息符合所述卡片的样式要求;否则,确定所述元素的位置信息不符合所述卡片的样式要求。
举例来说,对于元素1,预设的区域范围为L_1,元素1的位置信息L_0。如果L_1包含L_0,则确定元素1的位置信息符合所述卡片的样式要求;否则,确定元素2的位置信息不符合所述卡片的样式要求。
上述方式下,针对所述各元素中每个元素,根据所述元素的位置信息是否在所述元素的预设位置范围内,确定所述元素的位置信息是否符合所述卡片的样式要求,从而提供了一种自动校验元素的位置信息是否符合所述卡片的样式要求的方法。
步骤201~步骤203所述的方法中,根据卡片的图像信息,实现自动确定所述卡片中各元素在所述卡片中的位置信息,并确定所述各元素的图像信息,进一步地,可以实现自动校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
如图5所示,本申请提供一种卡片样式的校验装置,包括:确定单元501,用于根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;校验单元502,用于校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
一种可选实施方式中,所述确定单元501还用于:将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息;所述确定单元501具体用于:将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。
一种可选实施方式中,所述校验单元502具体用于:将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息;所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息;针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求;所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
一种可选实施方式中,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息;所述元素的关键信息还包括:所述元素的类别信息;所述元素分类模型是根据第三样本数据集进行机器学习训练确定的;所述第三样本数据集中每条样本数据至少包括:元素的图像信息;元素的类别信息;所述预设条件还包括:所述元素中包含的文本信息与所述元素的类别信息匹配。
一种可选实施方式中,所述校验单元502具体用于:针对所述各元素中每个元素,若确定所述元素的位置信息在所述元素的预设位置范围内,则确定所述元素的位置信息符合所述卡片的样式要求;否则,确定所述元素的位置信息不符合所述卡片的样式要求。
本申请实施例提供一种计算机设备,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种卡片样式的校验方法及任一可选方法。
本申请实施例提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种卡片样式的校验方法及任一可选方法。
最后应说明的是:本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (10)

1.一种卡片样式的校验方法,其特征在于,包括:
根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;
根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;
校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
2.如权利要求1所述的方法,其特征在于,所述根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息之前,还包括:
将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息;
所述根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;包括:
将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。
3.如权利要求1所述的方法,其特征在于,所述校验所述各元素的图像信息是否符合所述卡片的样式要求,包括:
将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息;所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息;
针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求;所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
4.如权利要求3所述的方法,其特征在于,所述预训练机器学习模型还包括元素分类模型;所述元素分类模型用于确定所述各元素中每个元素的类别信息;所述元素的关键信息还包括:所述元素的类别信息;所述元素分类模型是根据第三样本数据集进行机器学习训练确定的;所述第三样本数据集中每条样本数据至少包括:元素的图像信息;元素的类别信息;所述预设条件还包括:所述元素中包含的文本信息与所述元素的类别信息匹配。
5.如权利要求1-4任一所述的方法,其特征在于,所述校验所述各元素的位置信息是否符合所述卡片的样式要求,包括:
针对所述各元素中每个元素,若确定所述元素的位置信息在所述元素的预设位置范围内,则确定所述元素的位置信息符合所述卡片的样式要求;否则,确定所述元素的位置信息不符合所述卡片的样式要求。
6.一种卡片样式的校验装置,其特征在于,包括:
确定单元,用于根据卡片的图像信息,确定所述卡片中各元素在所述卡片中的位置信息;所述各元素中每个元素都表征了所述卡片一项独立的信息;根据所述各元素在所述卡片中的位置信息,确定所述各元素的图像信息;
校验单元,用于校验所述各元素的位置信息和\或图像信息是否符合所述卡片的样式要求。
7.如权利要求6所述的装置,其特征在于,所述确定单元还用于:
将第一样本数据集作为训练数据集,对初始图像物体定位模型进行机器学习训练,获得应用图像物体定位模型;所述第一样本数据集中每条样本数据至少包括:元素的图像信息;元素的位置信息;
所述确定单元具体用于:
将所述各元素的图像信息作为所述应用图像物体定位模型的输入,通过所述应用图像物体定位模型,确定所述卡片中各元素在所述卡片中的位置信息。
8.如权利要求6所述的装置,其特征在于,所述校验具体用于:
将所述各元素的图像信息输入预训练机器学习模型,从而提取所述各元素中每个元素的关键信息;所述预训练机器学习模型至少包括文本识别模型;所述文本识别模型用于提取所述元素中包含的文本信息;所述元素的关键信息至少包括:所述元素中包含的文本信息;所述文本识别模型是根据第二样本数据集训练确定的;所述第二样本数据集中每条样本数据包括:元素的图像信息;元素中包含的文本信息;
针对所述各元素中每个元素,确定所述元素是否满足预设条件;若是,则确定所述元素的图像信息符合所述卡片的样式要求;否则,确定所述元素的图像信息不符合所述卡片的样式要求;所述预设条件至少包括:所述元素的文本信息与所述预设实体名称列表里的实体名称匹配。
9.一种计算机设备,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
10.一种存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,如权利要求1至5中任意一项所述的方法被执行。
CN202010044226.7A 2020-01-15 2020-01-15 一种卡片样式的校验方法及装置 Pending CN111242932A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010044226.7A CN111242932A (zh) 2020-01-15 2020-01-15 一种卡片样式的校验方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010044226.7A CN111242932A (zh) 2020-01-15 2020-01-15 一种卡片样式的校验方法及装置

Publications (1)

Publication Number Publication Date
CN111242932A true CN111242932A (zh) 2020-06-05

Family

ID=70864027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010044226.7A Pending CN111242932A (zh) 2020-01-15 2020-01-15 一种卡片样式的校验方法及装置

Country Status (1)

Country Link
CN (1) CN111242932A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2221768A1 (en) * 2007-12-14 2010-08-25 Panasonic Corporation Image judgment device
CN104217203A (zh) * 2013-06-03 2014-12-17 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN108399386A (zh) * 2018-02-26 2018-08-14 阿博茨德(北京)科技有限公司 饼图中的信息提取方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2221768A1 (en) * 2007-12-14 2010-08-25 Panasonic Corporation Image judgment device
CN104217203A (zh) * 2013-06-03 2014-12-17 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN108399386A (zh) * 2018-02-26 2018-08-14 阿博茨德(北京)科技有限公司 饼图中的信息提取方法及装置

Similar Documents

Publication Publication Date Title
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
Sun et al. Chinese street view text: Large-scale chinese text reading with partially supervised learning
US20190213408A1 (en) Document authenticity determination
Dibeklioglu et al. 3D facial landmarking under expression, pose, and occlusion variations
CN110147786A (zh) 用于检测图像中的文本区域的方法、装置、设备以及介质
CN109766885A (zh) 一种文字检测方法、装置、电子设备及存储介质
CN109376717A (zh) 人脸对比的身份识别方法、装置、电子设备及存储介质
CN111242124A (zh) 一种证件分类方法、装置及设备
CN112766255A (zh) 一种光学文字识别方法、装置、设备及存储介质
KR102206604B1 (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
US20230084845A1 (en) Entry detection and recognition for custom forms
CN110795561A (zh) 一种电子卷宗材料类型自动识别系统及其自主学习方法
KR102351578B1 (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
Zuo et al. An intelligent knowledge extraction framework for recognizing identification information from real-world ID card images
CN113505716B (zh) 静脉识别模型的训练方法、静脉图像的识别方法及装置
CN111242932A (zh) 一种卡片样式的校验方法及装置
CN113361666B (zh) 一种手写字符识别方法、系统及介质
Deshpande et al. MINU-EXTRACTNET: automatic latent fingerprint feature extraction system using deep convolutional neural network
Ng et al. An intelligent banknote recognition system by using machine learning with assistive technology for visually impaired people
CN112287763A (zh) 图像处理方法、装置、设备及介质
Nisa et al. Annotation of struck-out text in handwritten documents
Kurnaz et al. Offline Signature Identification System to Retrieve personal information from cloud
Lim et al. Definition and Automatic Extraction Performance Analysis of Stroke Elements in the English Alphabet
Li et al. A Survey of Text Detection Algorithms in Images Based on Deep Learning
JP3487400B2 (ja) 文字認識装置、文字認識方法、及び、記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination