CN111340078B - 证件信息自动归类的方法、装置、介质及电子设备 - Google Patents

证件信息自动归类的方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN111340078B
CN111340078B CN202010098470.1A CN202010098470A CN111340078B CN 111340078 B CN111340078 B CN 111340078B CN 202010098470 A CN202010098470 A CN 202010098470A CN 111340078 B CN111340078 B CN 111340078B
Authority
CN
China
Prior art keywords
image
region
definition
pixel
divided
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010098470.1A
Other languages
English (en)
Other versions
CN111340078A (zh
Inventor
王威
蒋晖
韩茂琨
刘玉宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010098470.1A priority Critical patent/CN111340078B/zh
Publication of CN111340078A publication Critical patent/CN111340078A/zh
Application granted granted Critical
Publication of CN111340078B publication Critical patent/CN111340078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本公开提供了一种证件信息自动归类的方法、装置、介质及电子设备。本公开涉及智能决策中的分类模型。该方法通过将图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素,针对每个划分区域确定的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像,将该像素调整后图像变换成基准尺寸的图像,基于划分区域对应的模板,从划分区域中提取信息到相应类别的信息存储库,从而在整体上识别出目标证件的信息,并且方便不同证件的识别和提高不同证件的识别效率。

Description

证件信息自动归类的方法、装置、介质及电子设备
技术领域
本发明涉及智能决策中的分类模型,特别涉及一种证件信息自动归类的方法、装置、介质及电子设备。
背景技术
在相关技术中,对证件上所有的区域采用同样的识别精确度进行识别,发现当满足文字的识别精确度时,照片的识别精确度不高。另外,同证件扫描采用的光线不同,导致部分证件无法识别,识别的局限性较大。
发明内容
本公开旨在提供一种证件信息自动归类的方法、装置、介质及电子设备,其能够针对不同证件共用同一识别精度,并且方便不同证件的识别和提高不同证件的识别效率,从而提高证件识别的通用性和准确度。
根据本公开的一方面,提供了一种证件信息自动归类的方法,包括:获取目标证件的图像;将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素;针对每个划分区域,确定该划分区域中的像素值最大值;基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;将该像素调整后图像变换成所述基准尺寸的图像;基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库。
在一个实施例中,所述获取目标证件的图像,包括:
将所述目标证件图像输入清晰度判定模型,由所述清晰度判定模型输出所述目标证件图像的清晰度;
若所述清晰度低于预定清晰度阀值,则放弃所述目标证件图像。
在一个实施例中,所述清晰度判定模型通过以下方式预先训练而成:
获取图像样本集合,所述图像样本中的每个图像样本具有贴好的清晰度标签;
将所述图像样本中的每个图像样本输入清晰度判定模型,由清晰度判定模型输出判定的图像清晰度,将图像清晰度与贴好的图像清晰度标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像清晰度与贴好的清晰度区域标签对应。
在一个实施例中,所述区域划分模型通过以下方式预先训练而成:
获取图像样本集合,所述图像样本中的每个图像样本具有贴好的图像区域标签;
将所述图像样本中的每个图像样本输入区域划分模型,由区域划分模型输出判定的图像区域,将图像区域与贴好的图像区域标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像区域与贴好的图像区域标签对应。
在一个实施例中,所述针对每个划分区域,确定该划分区域中的像素值最大值,包括:
遍历每个所述划分区域,获取所述划分区域对应的像素值;
汇总对应的所述像素值,建立像素值直方图;
从所述像素值直方图中抽取最大的像素值,以确定该划分区域中的像素值最大值。
根据本公开的一方面,提供了一种证件信息自动归类的装置,包括:
获取模块,用于获取目标证件的图像;
划分模块,用于将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素;
确定模块,用于针对每个划分区域,确定该划分区域中的像素值最大值;
查找模块,用于基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
调整模块,用于将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;
变换模块,用于将该像素调整后图像变换成所述基准尺寸的图像;
提取模块,用于基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库。
根据本公开的一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据第一方面所述的方法。
根据本公开的一方面,提供了一种电子装置,包括:
处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求第一方面所述的方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,通过将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素,针对每个划分区域,确定该划分区域中的像素值最大值,基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸,将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像,将该像素调整后图像变换成所述基准尺寸的图像,基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库,从而在整体上识别出目标证件的信息,另外,对每个区设置不同的像素值基准,按照该像素值基准调节亮度,从而达到什么样的光线都不影响识别的目的,其中,对于每个区域转化为统一的基准尺寸的图像,从而每个区域的识别就能够满足该区域对应的信息的精度识别要求,使得针对不同证件共用同一识别精度,并且方便不同证件的识别和提高不同证件的识别效率,进而提高证件识别的通用性和准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种证件信息自动归类的方法的流程图。
图2是根据一示例性实施例示出的所述获取目标证件的图像的详细流程图。
图3是根据一示例性实施例示出的的所述清晰度判定模型的详细流程图。
图4是根据一示例性实施例示出的的所述区域划分模型的详细流程图。
图5是根据一示例性实施例示出的的确定该划分区域中的像素值最大值的详细流程图。
图6是根据一示例性实施例示出的一种证件信息自动归类的装置的框图。
图7是根据一示例性实施例示出的一种电子装置的硬件图。
图8是根据一示例性实施例示出的一种证件信息自动归类的方法的计算机可读存储介质。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。附图所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
根据本公开的一个实施例,提供了证件信息自动归类的方法。该证件信息是指证件上的各个区域的信息,如个人名称、住址、身份证号码、肖像信息等,通过对证件上的各个区域的有效采集,并进一步地提高各个区域的识别精度,使得证件信息的自动归类更加方便,提高工作效率。
如图1所示,该证件信息自动归类的方法包括:
步骤S110、获取目标证件的图像;
步骤S120、将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素;
步骤S130、针对每个划分区域,确定该划分区域中的像素值最大值;
步骤S140、基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
步骤S150、将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;
步骤S160、将该像素调整后图像变换成所述基准尺寸的图像;
步骤S170、基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库。
在本发明的一些实施例中,基于前述方案,通过将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素,针对每个划分区域,确定该划分区域中的像素值最大值,基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸,将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像,将该像素调整后图像变换成所述基准尺寸的图像,基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库,从而在整体上识别出目标证件的信息,另外,对每个区设置不同的像素值基准,按照该像素值基准调节亮度,从而达到什么样的光线都不影响识别的目的,其中,对于每个区域转化为统一的基准尺寸的图像,从而每个区域的识别就能够满足该区域对应的信息的精度识别要求,使得针对不同证件共用同一识别精度,并且方便不同证件的识别和提高不同证件的识别效率,进而提高证件识别的通用性和准确度。
下面对这些步骤进行详细描述。
在步骤S110中,获取目标证件的图像。
本公开实施例可以用于证件识别、出入关卡识别的应用,也可以用于证件识别的软件。证件可以为驾驶证、身份证等,并不局限于此。通过对证件的各个区域进行划分,使得每个区域对应着不同的信息,从而通过各个区域的识别进行不同信息有效的归集,并且提高各个区域的识别精度和识别效率,进而避免因证件上不同区域的差异导致识别困难。
获取目标证件的图像的方式具有多种,可选的,手机拍摄、电子传输等。目标证件的图像存在多种信息集合,并且相关的信息集合具有明显的间隔。
另外,如图2所示,在步骤S110中,所述获取目标证件的图像,包括:
步骤S111、将所述目标证件图像输入清晰度判定模型,由所述清晰度判定模型输出所述目标证件图像的清晰度;
步骤S112、若所述清晰度低于预定清晰度阀值,则放弃所述目标证件图像。
在步骤S111中,所述目标证件图像的获取方式具有多种,所述目标证件图像的清晰度与所述目标证件图像的识别息息相关,通过保证信息的准确性,所述目标证件图像的清晰度需要满足所述区域划分模型能够识别的清晰度,故同通过所述清晰度判定模型对所述目标证件图像的清晰度实现判定,避免所述区域划分模型的错误地识别。
另外,所述清晰度判定模型通过预设清晰度阀值,并依据所述目标证件图像的清晰度与所述清晰度阀值进行对比,若所述清晰度低于预定清晰度阀值,则放弃所述目标证件图像,从而对所述目标证件图像进行清晰度筛选,降低识别的出错率。
如图3所示,所述清晰度判定模型通过以下方式预先训练而成:
步骤S1111、获取图像样本集合,所述图像样本中的每个图像样本具有贴好的清晰度标签;
步骤S1112、将所述图像样本中的每个图像样本输入清晰度判定模型,由清晰度判定模型输出判定的图像清晰度,将图像清晰度与贴好的图像清晰度标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像清晰度与贴好的清晰度区域标签对应。
在步骤S1111中,人为的将图像样本与对应的清晰度标签实现排列,使得形成已知的图像样本与清晰度标签的对应关系,并且收集大量的数据,以形成数据集合,从而方便数据集合的运算,为机器学习模型的训练提供必要的数据支撑。其中,由图像样本与对应的清晰度标签形成的数据集合视为机器学习模型的训练样本。
在步骤S1122中,基于训练样本构建出机器学习模型,并由机器学习模型输出判定的图像清晰度,其中,机器学习模型在训练的过程中逐一进行调整,具体的,结合图像样本调整对应的图像清晰度,使得机器学习模型所输出的图像清晰度为贴好的清晰度区域标签,从而调整机器学习模型的训练,提高机器学习模型的输出的准确性,另外,通过调整所述清晰度判定模型的系数,所述清晰度判定模型所判断的图像清晰度更加贴合于贴好的图像清晰度标签,使得判定的图像区域与贴好的图像清晰度标签对应,从而提高所述清晰度判定模型识别准确度。
在步骤S112中,由于在所述清晰度判定模型预设清晰度阀值,使得经所述清晰度判定模型所判定的目标证件图像的清晰度与该清晰度阀值进行对比,其中,该清晰度阀值为识别所述目标证件图像的最低清晰度。若所述目标证件图像的清晰度低于预定清晰度阀值,则放弃所述目标证件图像。若所述目标证件图像的清晰度高于预定清晰度阀值,则对所述目标证件图像进行下一步的处理。
在步骤S120中,通过所述清晰度判定模型实现所述目标证件图像的筛选,对清晰度高于所述清晰度判定模型预设的清晰度阀值的所述目标证件图像进行区域划分,并主要通过所述区域划分模型进行处理。
针对步骤S120中将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素;
区域划分模型主要用于划分待输入的证件的区域,由于证件具有统一性,针对不同类别的证件具有对应的规律的区域情况,区域划分模型能够通过大量的数据进行调试,使得区域划分模型能够划分待输入的证件的区域,每个区域包括一种特定类型的图像元素,从而保证划分的区域在信息上具有规律性,提高信息与信息类型的对应性。通过区域划分模型能够快速知晓证件类型及其对应的各个区域,且该区域包括一种特定类型的图像元素,从而实现证件的信息独立识别。
如图4所示,所述区域划分模型通过以下方式预先训练而成:
步骤S1201、获取图像样本集合,所述图像样本中的每个图像样本具有贴好的图像区域标签;
步骤S1202、将所述图像样本中的每个图像样本输入区域划分模型,由区域划分模型输出判定的图像区域,将图像区域与贴好的图像区域标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像区域与贴好的图像区域标签对应。
在步骤S1201中,人为的将图像样本与对应的图像区域标签实现排列,使得形成已知的图像样本与图像区域标签的对应关系,并且收集大量的数据,以形成数据集合,从而方便数据集合的运算,为机器学习模型的训练提供必要的数据支撑。其中,由图像样本与对应的图像区域标签形成的数据集合视为机器学习模型的训练样本。
在步骤S1202中,基于训练样本构建出机器学习模型,并由机器学习模型输出判定的图像区域,其中,机器学习模型在训练的过程中逐一进行调整,具体的,结合图像样本调整对应的图像区域标签,使得机器学习模型所输出的图像区域为对应的图像区域标签,从而调整机器学习模型的训练,提高机器学习模型的输出的准确性,另外,通过调整所述区域划分模型的系数,所述区域划分模型所判断的图像区域更加贴合于贴好的图像区域标签,使得判定的图像区域与贴好的图像区域标签对应,从而提高所述区域划分模型的识别准确度。
如图5所示,在步骤130中,针对每个划分区域,确定该划分区域中的像素值最大值。
通过所述区域划分模型对目标证件的图像进行区域分割,而不同的区域在拍摄的过程中具有不同的像素值,即每个区域具有不同的最大像素值,然而区域的像素差异性对识别造成一定误判,故需要针对各个区域查找出对应的区域的像素最大值,方便对各个区域的像素值进行下一步的处理。
其中,对于每个区域的像素值的对比可从该区域中亮度较大的区域进行查找,从而提高获得最大像素值的效率,通过局部区域的依次对比,进而快速缩小最大亮度值的范围,并快速获得每个区域中最大像素值。另外,获取最大像素值的过程中可采用滤波筛选、坐标系筛选。
另外,在步骤S1300中,所述获取目标证件的图像,包括:
步骤S1301、遍历每个所述划分区域,获取所述划分区域对应的像素值;
步骤S1302、汇总对应的所述像素值,建立像素值直方图;
步骤S1303、从所述像素值直方图中抽取最大的像素值,以确定该划分区域中的像素值最大值。
在步骤S1201中,针对每个所述划分区域采用遍历法,防止所述划分区域中漏测,并且每个所述划分区域中最大值的分布比较广,而差异值比较小,故采用遍历法对每个所述划分区域进行逐一排查,从而获取对应的像素值,此时,每一所述划分区域中对应的像素值比较多。
在步骤S1302中,基于每一所述划分区域中对应的像素值比较多,将众多的像素值进行对应汇总,使得每一所述划分区域具有对应的像素值集群,通过对像素值集群的分类,避免各所述划分区域之间的交叉影响,保证获取对应的像素值的精准度。所述像素值集群中像素值转化为对应的数据点,且将该数据点逐一分布在坐标系上,以建立像素值直方图。
在步骤S1303中,在像素值直方图中,纵坐标为像素值,通过像素值直方图能够较快得出最大的像素值,而最大的像素值为位于纵坐标最高的位置上,从而提高像素值中最大值的获取效率。
在步骤140中,基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
图像元素类型是指划分出的区域对应的标识元素,由于每个证件中的信息集具有一定连续性,且在词义上需要匹配,通过图像元素类型标记该区域主要体现的信息集,从而方便证件信息的归类,另外,有效地利用到信息集,避免识别出来的信息无法对应。
在步骤150中,将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像。
基准像素是适合图像识别的像素值,该基准像素可以依据人为的经验进行设定,也可以通过大量的数据推断得出,具有一定的基准性。基于步骤120中获得每个划分区域的像素值最大值,通过每个划分区域的像素值最大值对基准像素进行比例元素,即将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子。
由于该像素值调整因子基于每个区域的最大值获得的,故该像素值调整因子均能对对应区域的所有像素值进行统一调整,通过像素值调整因子统一处理每个区域的所有像素值,消除每个区域中极端的像素值,使得每个区域的所有像素值趋于平均,进而方便图像的识别,避免因光线原因导致区域部分无法识别。
在步骤160中,将该像素调整后图像变换成所述基准尺寸的图像。
基于步骤140中获得每个区域的基准尺寸,并结合步骤150中经像素值调整因子处理的区域,使得每个区域都便于识别,可是每个区域的尺寸并非达到统一,对于图像识别来讲,需要多做运算方才能多各种尺寸的区域进行识别,降低了区域是被的工作效率。
针对每个区域的尺寸进行调整成统一基准尺寸的图像,并且像素维持在经像素值调整因子处理过的像素值,即在像素值不变的情况下实现尺寸的统一化,从而每个区域识别的尺寸均为一致,省去图像识别中尺寸变化的运算,进一步地提高图像识别的效率和准确度。
在步骤170中,基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库。
通过所述区域划分模型所划分的区域均具有对应的界面元素,而该界面元素对应的是信息的类型,针对每个区域进行有效的识别,并依次输出对应的信息,该信息对应于界面元素,使得该信息的类型被明确得知。其中,对于每个区域的识别采用了像素调整结合尺寸调整技术,使得每个区域的信息识别相对地具有较高准确度,对于信息的归类能够依据对应的界面元素进行得出,另外,将该信息与对应的信息类型实现连接,并共同存储于对应的信息存储库,使得该信息对应于界面元素所展示的信息类型,也对应对于信息存储库的信息类型,实现信息分类的高度统一性,并有效分离出类似的信息。
在本发明的一些实施例所提供的技术方案中,通过将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素,针对每个划分区域,确定该划分区域中的像素值最大值,基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸,将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像,将该像素调整后图像变换成所述基准尺寸的图像,基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库,从而在整体上识别出目标证件的信息,另外,对每个区设置不同的像素值基准,按照该像素值基准调节亮度,从而达到什么样的光线都不影响识别的目的,其中,对于每个区域转化为统一的基准尺寸的图像,从而每个区域的识别就能够满足该区域对应的信息的精度识别要求,使得针对不同证件共用同一识别精度,并且方便不同证件的识别和提高不同证件的识别效率,进而提高证件识别的通用性和准确度。
如图6所示,在一个实施例中,所述证件信息自动归类的装置200还包括:
获取模块210,用于获取目标证件的图像;
划分模块220,用于将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括一种特定类型的图像元素;
确定模块230,用于针对每个划分区域,确定该划分区域中的像素值最大值;
查找模块240,用于基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
调整模块250,用于将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;
变换模块260,用于将该像素调整后图像变换成所述基准尺寸的图像;
提取模块270,用于基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库。
下面参照图7来描述根据本发明的这种实施方式的电子设备40。图4显示的电子设备40仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备40以通用计算设备的形式表现。电子设备40的组件可以包括但不限于:上述至少一个处理单元41、上述至少一个存储单元42、连接不同系统组件(包括存储单元42和处理单元41)的总线43。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元41执行,使得所述处理单元41执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元42可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)421和/或高速缓存存储单元422,还可以进一步包括只读存储单元(ROM)423。
存储单元42还可以包括具有一组(至少一个)程序模块425的程序/实用工具424,这样的程序模块425包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线43可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备40也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备40交互的设备通信,和/或与使得该电子设备40能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口45进行。并且,电子设备40还可以通过网络适配器46与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器46通过总线43与电子设备40的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备40使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
根据本公开一个实施例,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品50,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (6)

1.一种证件信息自动归类的方法,其特征在于,包括:
获取目标证件的图像;
将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括图像元素类型,所述图像元素类型是指划分出的区域对应的标识元素;
针对每个划分区域,确定该划分区域中的像素值最大值;
基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;
将该像素调整后图像变换成所述基准尺寸的图像;
基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库;
其中,所述获取目标证件的图像,包括:将所述目标证件图像输入清晰度判定模型,由所述清晰度判定模型输出所述目标证件图像的清晰度;若所述清晰度低于预定清晰度阀值,则放弃所述目标证件图像;
所述清晰度判定模型通过以下方式预先训练而成:获取图像样本集合,所述图像样本中的每个图像样本具有贴好的清晰度标签;将所述图像样本中的每个图像样本输入清晰度判定模型,由清晰度判定模型输出判定的图像清晰度,将图像清晰度与贴好的图像清晰度标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像清晰度与贴好的清晰度区域标签对应。
2.根据权利要求1所述的方法,其特征在于,所述区域划分模型通过以下方式预先训练而成:
获取图像样本集合,所述图像样本中的每个图像样本具有贴好的图像区域标签;
将所述图像样本中的每个图像样本输入区域划分模型,由区域划分模型输出判定的图像区域,将图像区域与贴好的图像区域标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像区域与贴好的图像区域标签对应。
3.根据权利要求1所述的方法,其特征在于,所述针对每个划分区域,确定该划分区域中的像素值最大值,包括:
遍历每个所述划分区域,获取所述划分区域对应的像素值;
汇总对应的所述像素值,建立像素值直方图;
从所述像素值直方图中抽取最大的像素值,以确定该划分区域中的像素值最大值。
4.一种证件信息自动归类的装置,其特征在于,包括:
获取模块,用于获取目标证件的图像;
划分模块,用于将所述图像输入用于划分区域的区域划分模型,由区域划分模型输出划分区域后的图像,每个区域包括图像元素类型,所述图像元素类型是指划分出的区域对应的标识元素;
确定模块,用于针对每个划分区域,确定该划分区域中的像素值最大值;
查找模块,用于基于每个划分区域对应的图像元素类型,查找该图像元素类型对应的基准像素最大值和基准尺寸;
调整模块,用于将确定的划分区域中的像素值最大值除以该图像元素类型对应的基准像素最大值得到该划分区域的像素值调整因子,用该像素值调整因子乘以该划分区域的每个像素值,得到该划分区域的像素调整后图像;
变换模块,用于将该像素调整后图像变换成所述基准尺寸的图像;
提取模块,用于基于所述划分区域对应的模板,从所述划分区域中提取信息到相应类别的信息存储库;
其中,所述获取目标证件的图像,包括:将所述目标证件图像输入清晰度判定模型,由所述清晰度判定模型输出所述目标证件图像的清晰度;若所述清晰度低于预定清晰度阀值,则放弃所述目标证件图像;
所述清晰度判定模型通过以下方式预先训练而成:获取图像样本集合,所述图像样本中的每个图像样本具有贴好的清晰度标签;将所述图像样本中的每个图像样本输入清晰度判定模型,由清晰度判定模型输出判定的图像清晰度,将图像清晰度与贴好的图像清晰度标签对应,如不一致,则调整所述区域划分模型的系数,使得判定的图像清晰度与贴好的清晰度区域标签对应。
5.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据权利要求1至3中任一项所述的方法。
6.一种电子装置,其特征在于,包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至3任一项所述的方法。
CN202010098470.1A 2020-02-18 2020-02-18 证件信息自动归类的方法、装置、介质及电子设备 Active CN111340078B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010098470.1A CN111340078B (zh) 2020-02-18 2020-02-18 证件信息自动归类的方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010098470.1A CN111340078B (zh) 2020-02-18 2020-02-18 证件信息自动归类的方法、装置、介质及电子设备

Publications (2)

Publication Number Publication Date
CN111340078A CN111340078A (zh) 2020-06-26
CN111340078B true CN111340078B (zh) 2024-03-01

Family

ID=71185150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010098470.1A Active CN111340078B (zh) 2020-02-18 2020-02-18 证件信息自动归类的方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN111340078B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004266669A (ja) * 2003-03-03 2004-09-24 Sony Corp 監視カメラ並びに撮像方法
CN104574455A (zh) * 2013-10-29 2015-04-29 华为技术有限公司 图像重建方法及装置
CN106296621A (zh) * 2015-05-22 2017-01-04 腾讯科技(深圳)有限公司 图像处理方法和装置
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN107657251A (zh) * 2016-07-26 2018-02-02 阿里巴巴集团控股有限公司 确定身份证件显示表面的设备及方法,图像识别方法
CN107977659A (zh) * 2016-10-25 2018-05-01 北京搜狗科技发展有限公司 一种文字识别方法、装置及电子设备
CN109377240A (zh) * 2018-08-21 2019-02-22 中国平安人寿保险股份有限公司 基于神经网络的商户管理方法、装置、计算机设备及存储介质
CN109961101A (zh) * 2019-03-29 2019-07-02 京东方科技集团股份有限公司 货架状态确定方法及装置、电子设备、存储介质
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
US20050265600A1 (en) * 2004-06-01 2005-12-01 Xerox Corporation Systems and methods for adjusting pixel classification using background detection

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004266669A (ja) * 2003-03-03 2004-09-24 Sony Corp 監視カメラ並びに撮像方法
CN104574455A (zh) * 2013-10-29 2015-04-29 华为技术有限公司 图像重建方法及装置
CN106296621A (zh) * 2015-05-22 2017-01-04 腾讯科技(深圳)有限公司 图像处理方法和装置
CN107657251A (zh) * 2016-07-26 2018-02-02 阿里巴巴集团控股有限公司 确定身份证件显示表面的设备及方法,图像识别方法
CN107977659A (zh) * 2016-10-25 2018-05-01 北京搜狗科技发展有限公司 一种文字识别方法、装置及电子设备
CN107563377A (zh) * 2017-08-30 2018-01-09 江苏实达迪美数据处理有限公司 一种利用边缘和文字区域的证件关键区域检测定位方法
CN109377240A (zh) * 2018-08-21 2019-02-22 中国平安人寿保险股份有限公司 基于神经网络的商户管理方法、装置、计算机设备及存储介质
CN109961101A (zh) * 2019-03-29 2019-07-02 京东方科技集团股份有限公司 货架状态确定方法及装置、电子设备、存储介质
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN111340078A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
US8666168B2 (en) Methods and apparatus for providing a scalable identification of digital video sequences
US10438050B2 (en) Image analysis device, image analysis system, and image analysis method
US11176677B2 (en) Deep interactive learning for image segmentation models
WO2020253127A1 (zh) 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
KR100836740B1 (ko) 영상 데이터 처리 방법 및 그에 따른 시스템
CN110929780A (zh) 视频分类模型构建、视频分类的方法、装置、设备及介质
WO2022042123A1 (zh) 图像识别模型生成方法、装置、计算机设备和存储介质
CN111651636A (zh) 视频相似片段搜索方法及装置
CN108229481B (zh) 屏幕内容分析方法、装置、计算设备及存储介质
US9025889B2 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN111368878B (zh) 一种基于ssd目标检测的优化方法、计算机设备和介质
EP3620982B1 (en) Sample processing method and device
CN111209431A (zh) 一种视频搜索方法、装置、设备及介质
CN108764084A (zh) 基于空域分类网络和时域分类网络融合的视频分类方法
CN111368632A (zh) 一种签名识别方法及设备
CN111353062A (zh) 一种图像检索方法、装置以及设备
CN108615006A (zh) 用于输出信息的方法和装置
CN116543261A (zh) 用于图像识别的模型训练方法、图像识别方法设备及介质
CN110781849A (zh) 一种图像处理方法、装置、设备及存储介质
CN112966687B (zh) 图像分割模型训练方法、装置及通信设备
CN111340078B (zh) 证件信息自动归类的方法、装置、介质及电子设备
CN111797772A (zh) 发票图像自动分类方法、系统、装置
CN114741697B (zh) 恶意代码分类方法、装置、电子设备和介质
CN110728316A (zh) 一种课堂行为检测方法、系统、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40032029

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant