CN114445437A - 一种证照图片的图像压缩剪裁方法及存储介质 - Google Patents

一种证照图片的图像压缩剪裁方法及存储介质 Download PDF

Info

Publication number
CN114445437A
CN114445437A CN202111681570.8A CN202111681570A CN114445437A CN 114445437 A CN114445437 A CN 114445437A CN 202111681570 A CN202111681570 A CN 202111681570A CN 114445437 A CN114445437 A CN 114445437A
Authority
CN
China
Prior art keywords
license
picture
key information
identifying
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111681570.8A
Other languages
English (en)
Inventor
吴迪
刘斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Huizhengtong Information Technology Co ltd
Original Assignee
Fujian Huizhengtong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Huizhengtong Information Technology Co ltd filed Critical Fujian Huizhengtong Information Technology Co ltd
Priority to CN202111681570.8A priority Critical patent/CN114445437A/zh
Publication of CN114445437A publication Critical patent/CN114445437A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种证照图片的图像压缩剪裁方法及存储介质,所述方法包括以下步骤:对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;根据标出的边框对证照进行裁剪及关键信息识别;对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。

Description

一种证照图片的图像压缩剪裁方法及存储介质
技术领域
本申请涉及图像处理领域,具体涉及一种证照图片的图像压缩剪裁方法及存储介质。
背景技术
证照,是证件和执照的统称,证件是用来证明身份、经历等的证书和文件,如身份证、护照、工作证、学生证及毕业证等,执照是由主管机关发给的准许做某项工作或活动的资格证明,如营业执照、施工执照和驾驶执照等。
而现有很多政务场景中,需要用户上传其证照图片,同时对于用户上传的证照图片具有一定的要求,所以当用户上传证照图片时,需要对证照图片进行裁剪和压缩,然后对于用户来说,对于证照图片的剪裁压缩步骤繁琐,同时对于证照图片在压缩后,证件图片变得模糊,无法满足使用。
发明内容
鉴于上述问题,本申请提供了一种证照图片的图像压缩剪裁方法及存储介质,解决现有证照图片的裁剪压缩需要用户手段裁剪压缩的步骤繁琐给用户带来不便以及压缩后容易造成证照图片模糊的问题。
为实现上述目的,发明人提供了一种证照图片的图像压缩剪裁方法,包括以下步骤:
对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
根据标出的边框对证照进行裁剪及关键信息识别;
对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
进一步优化,所述步骤“对上传的证照图像进行证照的边界识别”之前还包括以下步骤:
对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式。
进一步优化,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向。
进一步优化,所述步骤“对上传的证照图片的方向进行识别”具体包括以下步骤:
通过文本方向检测模型识别证照图片中的文本的方向;
根据证照图片中文本的方向确定证照图片的方向。
进一步优化,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
通过数据增强技术对证照图片进行数据增强,所述数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。
进一步优化,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的表框对证照进行裁剪,去除证照图片中非证照的部分图像;
对裁剪后的证照图片中的证照的关键信息进行识别,得到证照中的具有关键信息图像区域。
进一步优化,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的边框对证照图片中的边框内的证照的关键信息进行识别,得到具有关键信息的图像区域;
根据边框对证照图片中的证照进行裁剪,除证照图片中非证照的部分图像。
进一步优化,所述步骤“对上传的证照图片进行证照的边界识别”具体包括以下步骤:
通过使用DBnet检测模型对上传的证照图片进行证照的边界进行识别。
进一步优化,所述步骤“关键信息识别”具体包括以下步骤:
通过CRNN模型结合ctc算法识别出证照中的文本内容;
通过霍夫变换,提取证照中的印章或头像。
还提供了另一个技术方案:一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器运行时执行如上述所述证照图片的图像压缩剪裁方法的步骤。
区别于现有技术,上述技术方案,当用户需要对证照图片进行裁剪压缩时,将需要裁剪压缩的证照图片上传,当接收到用户上传的证照图片后,首先对上传的证照图片中对证照的边界进行识别,并根据识别的边界标出证照的边框;然后根据标出的边框对证照进行裁剪和关键信息识别,裁剪掉证照图片中非证照部分的图片,同时识别出证照上的关键信息对应的图像区域;然后对证照图片中的证照上非关键信息的部分进行图像像素压缩,得到裁剪压缩后的证照图片;自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。
上述发明内容相关记载仅是本申请技术方案的概述,为了让本领域普通技术人员能够更清楚地了解本申请的技术方案,进而可以依据说明书的文字及附图记载的内容予以实施,并且为了让本申请的上述目的及其它目的、特征和优点能够更易于理解,以下结合本申请的具体实施方式及附图进行说明。
附图说明
附图仅用于示出本申请具体实施方式以及其他相关内容的原理、实现方式、应用、特点以及效果等,并不能认为是对本申请的限制。
在说明书附图中:
图1为具体实施方式所述证照图片的图像压缩剪裁方法的一种流程示意图;
图2为具体实施方式所述证照图片的图像压缩剪裁方法的另一种流程示意图;
图3为具体实施方式所述证照图片的图像压缩剪裁方法的另一种流程示意图;
图4为具体实施方式所述步骤S310的一种流程示意图;
图5为具体实施方式所述图像裁剪步骤的一种流程示意图;
图6为具体实施方式所述关键信息步骤的一种流程示意图;
图7为具体实施方式所述证照图片的图像压缩剪裁方法的另一种流程示意图;
图8为具体实施方式所述存储介质的一种结构示意图。
上述各附图中涉及的附图标记说明如下:
810、存储介质。
具体实施方式
为详细说明本申请可能的应用场景,技术原理,可实施的具体方案,能实现目的与效果等,以下结合所列举的具体实施例并配合附图详予说明。本文所记载的实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中各个位置出现的“实施例”一词并不一定指代相同的实施例,亦不特别限定其与其它实施例之间的独立性或关联性。原则上,在本申请中,只要不存在技术矛盾或冲突,各实施例中所提到的各项技术特征均可以以任意方式进行组合,以形成相应的可实施的技术方案。
除非另有定义,本文所使用的技术术语的含义与本申请所属技术领域的技术人员通常理解的含义相同;本文中对相关术语的使用只是为了描述具体的实施例,而不是旨在限制本申请。
在本申请的描述中,用语“和/或”是一种用于描述对象之间逻辑关系的表述,表示可以存在三种关系,例如A和/或B,表示:存在A,存在B,以及同时存在A和B这三种情况。另外,本文中字符“/”一般表示前后关联对象是一种“或”的逻辑关系。
在本申请中,诸如“第一”和“第二”之类的用语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何实际的数量、主次或顺序等关系。
在没有更多限制的情况下,在本申请中,语句中所使用的“包括”、“包含”、“具有”或者其他类似的表述,意在涵盖非排他性的包含,这些表述并不排除在包括所述要素的过程、方法或者产品中还可以存在另外的要素,从而使得包括一系列要素的过程、方法或者产品中不仅可以包括那些限定的要素,而且还可以包括没有明确列出的其他要素,或者还包括为这种过程、方法或者产品所固有的要素。
与《审查指南》中的理解相同,在本申请中,“大于”、“小于”、“超过”等表述理解为不包括本数;“以上”、“以下”、“以内”等表述理解为包括本数。此外,在本申请实施例的描述中“多个”的含义是两个以上(包括两个),与之类似的与“多”相关的表述亦做此类理解,例如“多组”、“多次”等,除非另有明确具体的限定。
在本申请实施例的描述中,所使用的与空间相关的表述,诸如“中心”“纵向”“横向”“长度”“宽度”“厚度”“上”“下”“前”“后”“左”“右”“竖直”“水平”“垂直”“顶”“底”“内”“外”“顺时针”“逆时针”“轴向”“径向”“周向”等,所指示的方位或位置关系是基于具体实施例或附图所示的方位或位置关系,仅是为了便于描述本申请的具体实施例或便于读者理解,而不是指示或暗示所指的装置或部件必须具有特定的位置、特定的方位、或以特定的方位构造或操作,因此不能理解为对本申请实施例的限制。
除非另有明确的规定或限定,在本申请实施例的描述中,所使用的“安装”“相连”“连接”“固定”“设置”等用语应做广义理解。例如,所述“连接”可以是固定连接,也可以是可拆卸连接,或成一体设置;其可以是机械连接,也可以是电连接,也可以是通信连接;其可以是直接相连,也可以通过中间媒介间接相连;其可以是两个元件内部的连通或两个元件的相互作用关系。对于本申请所属技术领域的技术人员而言,可以根据具体情况理解上述用语在本申请实施例中的具体含义。
请参阅图1,本实施例提供了一种证照图片的图像压缩剪裁方法,包括以下步骤:
步骤S110:对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
步骤S120:根据标出的边框对证照进行裁剪及关键信息识别;
步骤S130:对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
当用户需要对证照图片进行裁剪压缩时,将需要裁剪压缩的证照图片上传,当接收到用户上传的证照图片后,首先对上传的证照图片中对证照的边界进行识别,并根据识别的边界标出证照的边框;然后根据标出的边框对证照进行裁剪和关键信息识别,裁剪掉证照图片中非证照部分的图片,同时识别出证照上的关键信息对应的图像区域;然后对证照图片中的证照上非关键信息的部分进行图像像素压缩,得到裁剪压缩后的证照图片;自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。其中,对于证照的非关键信息部分进行像素压缩可以将非关键信息的图像区域压缩至最低像素,也可以根据实际需要设置压缩程度,根据预设的压缩比例对对证照的非关键信息部分进行像素压缩。
请参阅图2,在某些实施例中,所述步骤“对上传的证照图像进行证照的边界识别”之前还包括以下步骤:
步骤S210:对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式。
图片文件格式通常有JPEG、TIFF、RAW、BMP、GIF、PNG等。其中,PNG格式支持高级别无损耗压缩,支持alpha通道透明度等优点。当用户上传证照图片后,首先识别上传的证照图片的格式,自动将非PNG格式的证照图片同一换成PNG格式的图片。
请参阅图3-4,在某些实施例中,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
步骤S310:对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向。
由于用户在拍摄证照图片时以及在上传证照图片时,证照图片上的证照方向不都是正方向图片,如朝左、朝右或倒立等;故在对证照图片进行裁剪压缩前,首先识别证照图片的方向,将证照图片的方向同一旋转成对应证照的正方向。其中,通过识别证照上文字的方向进行判断证照图片的方向,具体的,所述步骤“对上传的证照图片的方向进行识别”具体包括以下步骤:
通过文本方向检测模型识别证照图片中的文本的方向;
根据证照图片中文本的方向确定证照图片的方向。
通过使用文本方向检测模型进行识别证照图片中的文本的字体方向,自动检测识别正、倒立、或者朝左、朝右的文本,将证照图片同一旋转成对应证照的正方向。便于后期的图像的裁剪和压缩。在其他会实施例,也可以通过识别证照图片中人脸的方向、印章方向等方式进行判断证照图片的方向。
在某些实施例中,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
通过数据增强技术对证照图片进行数据增强,所述数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。
在对证照图片进行裁剪压缩前,通过采用图像增强技术对证照图片进行图像增强,其中,数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。高斯模糊,也叫高斯平滑,高斯模式是用于计算机视觉算法中预先处理阶段,以增强图像在不同比例大小下的图像效果。同态滤波是一种广泛用于信号和图像处理的技术,将原本的信号经由非线性映射,转换到可以使用线性滤波器的不同域,做完运算后再映射回原始域;同态滤波利用去除乘性噪声(multiplicative noise),可以同时增加对比度以及标准化亮度,借此达到图像增强的目的。椒盐噪声也称为脉冲噪声,是图像中经常见到的一种噪声,它是一种随机出现的白点或者黑点,可能是亮的区域有黑色像素或是在暗的区域有白色像素(或是两者皆有);椒盐增噪,即通过对图像进行增加椒盐噪声,然后通再通过高斯模糊去除椒盐噪声进行图像增强。
请参阅图5-6,在某些实施例中,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
图像裁剪步骤:根据标出的表框对证照进行裁剪,去除证照图片中非证照的部分图像;
关键信息识别步骤:对裁剪后的证照图片中的证照的关键信息进行识别,得到证照中的具有关键信息图像区域。
首先根据识别的证照的边界,对证照图片中的证照部分B进行裁剪,去除证照图片中非证照部分A的背景图像,然后再对裁剪后的证照图片中证照部分B的关键信息进行识别,其中,关键信息包括头像、文字及印章等,得到证照中具有关键信息的图像区域B1以及非关键信息的图像区域B2,只需要对非关键信息图像区域B2进行图像压缩,而不对图像区域B1进行压缩;先对证照图片中的证照进行裁剪,然后再进行关键信息进行识别,可以减少关键信息识别难度。
在某些实施例中,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的边框对证照图片中的边框内的证照的关键信息进行识别,得到具有关键信息的图像区域;
根据边框对证照图片中的证照进行裁剪,去除证照图片中非证照的部分图像。
在识别出证照图片内证照的边界后,先对边界内的证照中的关键信息进行识别,识别出证照中的关键信息,得到证照中的关键信息对应的图像区域,然后在根据证照图片中证照的边界,再对证照进行识别,去除证照图片中非证照部分的图像。
在某些实施例中,所述步骤“对上传的证照图片进行证照的边界识别”具体包括以下步骤:
通过使用DBnet检测模型对上传的证照图片进行证照的边界进行识别。
DBnet(Differentiable Binarization Network,可微分的二值化网络),dbnet算法是一种基于图片分割的方法设计的文本分割模型使用,DBnet检测模型,通过算法DBnet,将二值化进行近似,使其可导,从而获取更准确的边界。具体的,由于,证照上有具有文本说明,通过DBnet检测模型检测出证照上的文本内容及文本区域,然后根据文本内容得到证照的类型,根据证照的类型及该类型中文本区域在该类型证照的位置对应关系,可以通过检测出的文本区域计算得到证照的边界位置,既可以识别出证照图片中的证照的边界。
在某些实施例中,所述步骤“关键信息识别”具体包括以下步骤:
通过CRNN模型结合ctc算法识别出证照中的文本内容;
通过霍夫变换,提取证照中的印章或头像。
根据不同的场景配置,提取图片关键信息,使用CRNN模型,并结合ctc算法,识别图片中的文本内容;使用霍夫变换,提取图片的印章、头像等,以进行独立处理,即确定关键信息所在证照中的图像区域,只需要对证照中非关键信息的图像区域进行像素压缩,保证关键信息的图像区域的数据完整性,同时减少整个证照图片的大小。
请参阅图7,另一实施例中,一种证照图片的图像压缩剪裁方法,包括以下步骤:
步骤S210:对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式;图片文件格式通常有JPEG、TIFF、RAW、BMP、GIF、PNG等。其中,PNG格式支持高级别无损耗压缩,支持alpha通道透明度等优点。当用户上传证照图片后,首先识别上传的证照图片的格式,自动将非PNG格式的证照图片同一换成PNG格式的图片。
步骤S310:对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向;由于用户在拍摄证照图片时以及在上传证照图片时,证照图片上的证照方向不都是正方向图片,如朝左、朝右或倒立等;故在对证照图片进行裁剪压缩前,首先识别证照图片的方向,将证照图片的方向同一旋转成对应证照的正方向。
步骤S110:对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
步骤S120:根据标出的边框对证照进行裁剪及关键信息识别;
步骤S130:对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
当用户需要对证照图片进行裁剪压缩时,将需要裁剪压缩的证照图片上传,当接收到用户上传的证照图片后,首先对上传的证照图片中对证照的边界进行识别,并根据识别的边界标出证照的边框;然后根据标出的边框对证照进行裁剪和关键信息识别,裁剪掉证照图片中非证照部分的图片,同时识别出证照上的关键信息对应的图像区域;然后对证照图片中的证照上非关键信息的部分进行图像像素压缩,得到裁剪压缩后的证照图片;自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。其中,对于证照的非关键信息部分进行像素压缩可以将非关键信息的图像区域压缩至最低像素,也可以根据实际需要设置压缩程度,根据预设的压缩比例对对证照的非关键信息部分进行像素压缩。
请参阅图8,另一实施例中,一种存储介质810,所述存储介质810存储有计算机程序,所述计算机程序被处理器运行时执行以下的步骤:
对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
根据标出的边框对证照进行裁剪及关键信息识别;
对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
当用户需要对证照图片进行裁剪压缩时,将需要裁剪压缩的证照图片上传,当接收到用户上传的证照图片后,首先对上传的证照图片中对证照的边界进行识别,并根据识别的边界标出证照的边框;然后根据标出的边框对证照进行裁剪和关键信息识别,裁剪掉证照图片中非证照部分的图片,同时识别出证照上的关键信息对应的图像区域;然后对证照图片中的证照上非关键信息的部分进行图像像素压缩,得到裁剪压缩后的证照图片;自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。其中,对于证照的非关键信息部分进行像素压缩可以将非关键信息的图像区域压缩至最低像素,也可以根据实际需要设置压缩程度,根据预设的压缩比例对对证照的非关键信息部分进行像素压缩。
在某些实施例中,所述处理器根据所述计算机程序执行步骤“对上传的证照图像进行证照的边界识别”之前还执行以下步骤:
对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式。
图片文件格式通常有JPEG、TIFF、RAW、BMP、GIF、PNG等。其中,PNG格式支持高级别无损耗压缩,支持alpha通道透明度等优点。当用户上传证照图片后,首先识别上传的证照图片的格式,自动将非PNG格式的证照图片同一换成PNG格式的图片。
请参阅图4,在某些实施例中,所述处理器根据所述计算机程序执行步骤“对上传的证照图像进行证照的边界识别”之前还执行以下步骤
对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向。
由于用户在拍摄证照图片时以及在上传证照图片时,证照图片上的证照方向不都是正方向图片,如朝左、朝右或倒立等;故在对证照图片进行裁剪压缩前,首先识别证照图片的方向,将证照图片的方向同一旋转成对应证照的正方向。其中,通过识别证照上文字的方向进行判断证照图片的方向,具体的,所述步骤“对上传的证照图片的方向进行识别”具体包括以下步骤:
通过文本方向检测模型识别证照图片中的文本的方向;
根据证照图片中文本的方向确定证照图片的方向。
通过使用文本方向检测模型进行识别证照图片中的文本的字体方向,自动检测识别正、倒立、或者朝左、朝右的文本,将证照图片同一旋转成对应证照的正方向。便于后期的图像的裁剪和压缩。在其他会实施例,也可以通过识别证照图片中人脸的方向、印章方向等方式进行判断证照图片的方向。
在某些实施例中,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
通过数据增强技术对证照图片进行数据增强,所述数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。
在对证照图片进行裁剪压缩前,通过采用图像增强技术对证照图片进行图像增强,其中,数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。高斯模糊,也叫高斯平滑,高斯模式是用于计算机视觉算法中预先处理阶段,以增强图像在不同比例大小下的图像效果。同态滤波是一种广泛用于信号和图像处理的技术,将原本的信号经由非线性映射,转换到可以使用线性滤波器的不同域,做完运算后再映射回原始域;同态滤波利用去除乘性噪声(multiplicative noise),可以同时增加对比度以及标准化亮度,借此达到图像增强的目的。椒盐噪声也称为脉冲噪声,是图像中经常见到的一种噪声,它是一种随机出现的白点或者黑点,可能是亮的区域有黑色像素或是在暗的区域有白色像素(或是两者皆有);椒盐增噪,即通过对图像进行增加椒盐噪声,然后通再通过高斯模糊去除椒盐噪声进行图像增强。
在某些实施例中,所述处理器执行步骤“根据标出的边框对证照进行裁剪及关键信息识别”时具体执行以下步骤:
图像裁剪步骤:根据标出的表框对证照进行裁剪,去除证照图片中非证照的部分图像;
关键信息识别步骤:对裁剪后的证照图片中的证照的关键信息进行识别,得到证照中的具有关键信息图像区域。
首先根据识别的证照的边界,对证照图片中的证照部分B进行裁剪,去除证照图片中非证照部分A的背景图像,然后再对裁剪后的证照图片中证照部分B的关键信息进行识别,其中,关键信息包括头像、文字及印章等,得到证照中具有关键信息的图像区域B1以及非关键信息的图像区域B2,只需要对非关键信息图像区域B2进行图像压缩,而不对图像区域B1进行压缩;先对证照图片中的证照进行裁剪,然后再进行关键信息进行识别,可以减少关键信息识别难度。
在某些实施例中,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的边框对证照图片中的边框内的证照的关键信息进行识别,得到具有关键信息的图像区域;
根据边框对证照图片中的证照进行裁剪,去除证照图片中非证照的部分图像。
在识别出证照图片内证照的边界后,先对边界内的证照中的关键信息进行识别,识别出证照中的关键信息,得到证照中的关键信息对应的图像区域,然后在根据证照图片中证照的边界,再对证照进行识别,去除证照图片中非证照部分的图像。
在某些实施例中,所述步骤“对上传的证照图片进行证照的边界识别”具体包括以下步骤:
通过使用DBnet检测模型对上传的证照图片进行证照的边界进行识别。
DBnet(Differentiable Binarization Network,可微分的二值化网络),dbnet算法是一种基于图片分割的方法设计的文本分割模型使用,DBnet检测模型,通过算法DBnet,将二值化进行近似,使其可导,从而获取更准确的边界。具体的,由于,证照上有具有文本说明,通过DBnet检测模型检测出证照上的文本内容及文本区域,然后根据文本内容得到证照的类型,根据证照的类型及该类型中文本区域在该类型证照的位置对应关系,可以通过检测出的文本区域计算得到证照的边界位置,既可以识别出证照图片中的证照的边界。
在某些实施例中,所述步骤“关键信息识别”具体包括以下步骤:
通过CRNN模型结合ctc算法识别出证照中的文本内容;
通过霍夫变换,提取证照中的印章或头像。
根据不同的场景配置,提取图片关键信息,使用CRNN模型,并结合ctc算法,识别图片中的文本内容;使用霍夫变换,提取图片的印章、头像等,以进行独立处理,即确定关键信息所在证照中的图像区域,只需要对证照中非关键信息的图像区域进行像素压缩,保证关键信息的图像区域的数据完整性,同时减少整个证照图片的大小。
另一实施例中,一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器运行时执行以下的步骤
对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式;
对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向;
对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
根据标出的边框对证照进行裁剪及关键信息识别;
对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
图片文件格式通常有JPEG、TIFF、RAW、BMP、GIF、PNG等。其中,PNG格式支持高级别无损耗压缩,支持alpha通道透明度等优点;当用户需要对证照图片进行裁剪压缩时,将需要裁剪压缩的证照图片上传,当接收到用户上传的证照图片后,首先识别上传的证照图片的格式,自动将非PNG格式的证照图片同一换成PNG格式的图片。由于用户在拍摄证照图片时以及在上传证照图片时,证照图片上的证照方向不都是正方向图片,如朝左、朝右或倒立等;故在对证照图片进行裁剪压缩前,首先识别证照图片的方向,将证照图片的方向同一旋转成对应证照的正方向。接着对上传的证照图片中对证照的边界进行识别,并根据识别的边界标出证照的边框;然后根据标出的边框对证照进行裁剪和关键信息识别,裁剪掉证照图片中非证照部分的图片,同时识别出证照上的关键信息对应的图像区域;然后对证照图片中的证照上非关键信息的部分进行图像像素压缩,得到裁剪压缩后的证照图片;自动对用户上传的证照图片进行裁剪压缩,无需用户进行手动裁剪压缩,减少给用户带来的不便,同时压缩的过程,只对证照图片中非关键信息的那一部分图像进行像素压缩,保证了压缩证照图片的过程中保证了证照的清晰度,同时经过压缩后的证照图片,降低了图片大小,优化了图片的存储空间以及查看速度。其中,对于证照的非关键信息部分进行像素压缩可以将非关键信息的图像区域压缩至最低像素,也可以根据实际需要设置压缩程度,根据预设的压缩比例对对证照的非关键信息部分进行像素压缩。
最后需要说明的是,尽管在本申请的说明书文字及附图中已经对上述各实施例进行了描述,但并不能因此限制本申请的专利保护范围。凡是基于本申请的实质理念,利用本申请说明书文字及附图记载的内容所作的等效结构或等效流程替换或修改产生的技术方案,以及直接或间接地将以上实施例的技术方案实施于其他相关的技术领域等,均包括在本申请的专利保护范围之内。

Claims (10)

1.一种证照图片的图像压缩剪裁方法,其特征在于,包括以下步骤:
对上传的证照图片进行证照的边界识别,并根据识别的边界标出证照的边框;
根据标出的边框对证照进行裁剪及关键信息识别;
对证照的非关键信息部分进行像素压缩,得到压缩后的证照图片。
2.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“对上传的证照图像进行证照的边界识别”之前还包括以下步骤:
对上传的证照图片的格式进行识别,将非预设格式的证照图片转换成预设格式的证照图片,所述预设格式为PNG格式。
3.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
对上传的证照图片的方向进行识别,根据识别的方向将证照图片旋转至正方向。
4.根据权利要求3所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“对上传的证照图片的方向进行识别”具体包括以下步骤:
通过文本方向检测模型识别证照图片中的文本的方向;
根据证照图片中文本的方向确定证照图片的方向。
5.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“对上传的证照图片进行证照的边界识别”之前还包括以下步骤:
通过数据增强技术对证照图片进行数据增强,所述数据增强技术为高斯模糊、同态滤波和椒盐增噪中的一种或者多种。
6.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的表框对证照进行裁剪,去除证照图片中非证照的部分图像;
对裁剪后的证照图片中的证照的关键信息进行识别,得到证照中的具有关键信息图像区域。
7.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“根据标出的边框对证照进行裁剪及关键信息识别”具体包括以下步骤:
根据标出的边框对证照图片中的边框内的证照的关键信息进行识别,得到具有关键信息的图像区域;
根据边框对证照图片中的证照进行裁剪,除证照图片中非证照的部分图像。
8.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“对上传的证照图片进行证照的边界识别”具体包括以下步骤:
通过使用DBnet检测模型对上传的证照图片进行证照的边界进行识别。
9.根据权利要求1所述的证照图片的图像压缩剪裁方法,其特征在于,所述步骤“关键信息识别”具体包括以下步骤:
通过CRNN模型结合ctc算法识别出证照中的文本内容;
通过霍夫变换,提取证照中的印章或头像。
10.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行如权利要求1-9任意一项所述证照图片的图像压缩剪裁方法的步骤。
CN202111681570.8A 2021-12-29 2021-12-29 一种证照图片的图像压缩剪裁方法及存储介质 Pending CN114445437A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111681570.8A CN114445437A (zh) 2021-12-29 2021-12-29 一种证照图片的图像压缩剪裁方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111681570.8A CN114445437A (zh) 2021-12-29 2021-12-29 一种证照图片的图像压缩剪裁方法及存储介质

Publications (1)

Publication Number Publication Date
CN114445437A true CN114445437A (zh) 2022-05-06

Family

ID=81366779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111681570.8A Pending CN114445437A (zh) 2021-12-29 2021-12-29 一种证照图片的图像压缩剪裁方法及存储介质

Country Status (1)

Country Link
CN (1) CN114445437A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640754A (zh) * 2008-07-30 2010-02-03 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
US20110093720A1 (en) * 2009-10-16 2011-04-21 Brocade Communications Systems, Inc. Storage of KeyID in Customer Data Area
CN106210338A (zh) * 2016-07-25 2016-12-07 乐视控股(北京)有限公司 证件照片的生成方法及装置
CN108549881A (zh) * 2018-05-02 2018-09-18 杭州创匠信息科技有限公司 证件文字的识别方法和装置
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110310343A (zh) * 2019-05-28 2019-10-08 西安万像电子科技有限公司 图像处理方法及装置
CN111340022A (zh) * 2020-02-24 2020-06-26 深圳市华云中盛科技股份有限公司 身份证信息识别方法、装置、计算机设备及存储介质
CN111448587A (zh) * 2018-08-16 2020-07-24 华为技术有限公司 一种广告图片的显示方法、上传方法及装置
CN112750113A (zh) * 2021-01-14 2021-05-04 深圳信息职业技术学院 基于深度学习和直线检测的玻璃瓶缺陷检测方法及装置
CN112990227A (zh) * 2021-02-08 2021-06-18 中国铁建重工集团股份有限公司 掌子面地质检测方法
CN113642562A (zh) * 2021-08-30 2021-11-12 平安医疗健康管理股份有限公司 基于图像识别的数据解读方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640754A (zh) * 2008-07-30 2010-02-03 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
US20110093720A1 (en) * 2009-10-16 2011-04-21 Brocade Communications Systems, Inc. Storage of KeyID in Customer Data Area
CN106210338A (zh) * 2016-07-25 2016-12-07 乐视控股(北京)有限公司 证件照片的生成方法及装置
CN108549881A (zh) * 2018-05-02 2018-09-18 杭州创匠信息科技有限公司 证件文字的识别方法和装置
CN111448587A (zh) * 2018-08-16 2020-07-24 华为技术有限公司 一种广告图片的显示方法、上传方法及装置
CN109919147A (zh) * 2019-03-04 2019-06-21 上海宝尊电子商务有限公司 服装吊牌图像中文本识别的方法
CN110310343A (zh) * 2019-05-28 2019-10-08 西安万像电子科技有限公司 图像处理方法及装置
CN111340022A (zh) * 2020-02-24 2020-06-26 深圳市华云中盛科技股份有限公司 身份证信息识别方法、装置、计算机设备及存储介质
CN112750113A (zh) * 2021-01-14 2021-05-04 深圳信息职业技术学院 基于深度学习和直线检测的玻璃瓶缺陷检测方法及装置
CN112990227A (zh) * 2021-02-08 2021-06-18 中国铁建重工集团股份有限公司 掌子面地质检测方法
CN113642562A (zh) * 2021-08-30 2021-11-12 平安医疗健康管理股份有限公司 基于图像识别的数据解读方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US7899258B2 (en) Systems and methods to convert images into high-quality compressed documents
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及系统
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
CN1080059C (zh) 删简格式文件图象压缩方法及生成压缩图象的方法和装置
US8417029B2 (en) Image processing apparatus and method, including fill-up processing
CN104200209A (zh) 一种图像文字检测方法
CN109255752B (zh) 图像自适应压缩方法、装置、终端及存储介质
CN113688838B (zh) 红色笔迹提取方法、系统、可读存储介质及计算机设备
US20210174119A1 (en) Systems and methods for digitized document image data spillage recovery
CN112839167B (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN112218005B (zh) 一种基于人工智能的视频剪辑方法
CN112508024A (zh) 一种变压器电气铭牌钢印字体智能识别方法
CN101320425A (zh) 图像处理装置及方法、图像形成装置、图像处理系统
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
US6985629B2 (en) Image processing method, relative density detecting method and image processing apparatus
CN110807747B (zh) 一种基于前景蒙版的文档图像降噪方法
CN114519788A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN112668567A (zh) 一种基于深度学习的图像裁剪算法
CN114445437A (zh) 一种证照图片的图像压缩剪裁方法及存储介质
CN110930358A (zh) 一种基于自适应算法的太阳能面板图像处理方法
CN110070103A (zh) 身份证识别的方法及终端设备
CN113947529B (zh) 图像增强方法、模型训练方法、构件识别方法及相关设备
CN102567982A (zh) 一种视频节目特定信息的提取系统及其方法、移动终端
CN114446447A (zh) 一种染色体核型图像数据的半自动标注方法
Subramani et al. A novel binarization method for degraded tamil palm leaf images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination