CN111553364B - 图片处理方法及装置 - Google Patents

图片处理方法及装置 Download PDF

Info

Publication number
CN111553364B
CN111553364B CN202010349644.7A CN202010349644A CN111553364B CN 111553364 B CN111553364 B CN 111553364B CN 202010349644 A CN202010349644 A CN 202010349644A CN 111553364 B CN111553364 B CN 111553364B
Authority
CN
China
Prior art keywords
picture
target
cutting
row
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010349644.7A
Other languages
English (en)
Other versions
CN111553364A (zh
Inventor
陈科舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010349644.7A priority Critical patent/CN111553364B/zh
Publication of CN111553364A publication Critical patent/CN111553364A/zh
Application granted granted Critical
Publication of CN111553364B publication Critical patent/CN111553364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Abstract

本说明书一个或多个实施例公开了一种图片处理方法及装置,用以解决现有图片切割方法不准确、容易导致图片信息被破坏的问题。所述方法包括:根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,所述初始切割信息包括切割次数和/或初始切割位置。分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率。根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。

Description

图片处理方法及装置
技术领域
本说明书涉及图片处理技术领域,尤其涉及一种图片处理方法及装置。
背景技术
目前,在一些领域中需要对图片内容进行审核,如审核图片中是否有违禁物品之类的不合规内容。通常情况下,需要投入大量的人力对图片进行肉眼分辨。而随着AI(Artificial Intelligence,人工智能)技术的进步,OCR(Optical CharacterRecognition,光学字符识别)算法和图像识别算法等技术被广泛地应用于图像的智能审核,但这两种算法大多都是采用监督学习算法训练模型,因此对审核的输入图像的质量都有一定的要求,例如审核图像的长宽比。通常训练图像具有特定的大小,测试图像会被缩放到和训练图像同等像素大小进行测试,所以长宽比越接近于训练图像的测试图像在缩放的过程中失真更小,效果往往更好。为了避免对长宽比差距太大的图像直接缩放,导致其中的图像和文字失真,从而影响算法效果,算法往往会对测试图像长宽比做一些限制,例如规定测试图像高大于400像素,高宽比不大于2.5。但是,广告图片特别是手机端的广告图片由于手机屏幕的限制,长宽比往往远远超出此要求,直接缩放后失真的图像显然会影响OCR或目标检测的效果。
为解决上述问题,现有技术采用对图片进行切割的方法,即将一张长图分割成几部分短图,再进行后续算法检测。但是随意切割会造成图片中的文字或图像信息被破坏,如完整的文字被分到两块子图中,从而严重影响后续算法效果。
发明内容
一方面,本说明书一个或多个实施例提供一种图片处理方法,包括:根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,所述初始切割信息包括切割次数和/或初始切割位置。分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率。根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
另一方面,本说明书一个或多个实施例提供一种图片处理装置,包括:第一确定模块,根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,所述初始切割信息包括切割次数和/或初始切割位置。分析模块,分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息。第一计算模块,根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率。第二确定模块,根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
再一方面,本说明书一个或多个实施例提供一种图片处理设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,所述初始切割信息包括切割次数和/或初始切割位置。分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率。根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
再一方面,本说明书一个或多个实施例提供一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,所述初始切割信息包括切割次数和/或初始切割位置。分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率。根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种图片处理方法的示意性流程图;
图2是根据本说明书一实施例的一种图片处理结果的示意性界面图;
图3是根据本说明书另一实施例的一种图片处理方法的示意性流程图;
图4是根据本说明书另一实施例的一种图片处理结果的示意性界面图;
图5是根据本说明书再一实施例的一种图片处理结果的示意性界面图;
图6(a)和图6(b)是根据本说明书再一实施例的一种图片处理结果的示意性界面图;
图7是根据本说明书一实施例的一种图片处理装置的示意性框图;
图8是根据本说明书一实施例的一种图片处理设备的示意性框图。
具体实施方式
本说明书一个或多个实施例提供一种图片处理方法及装置,用以解决现有图片切割方法不准确、容易导致图片信息被破坏的问题。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书一个或多个实施例保护的范围。
图1是根据本说明书一实施例的一种图片处理方法的示意性流程图,如图1所示,该方法包括:
S102,根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对目标图片进行切割的初始切割信息。
其中,初始切割信息包括切割次数和/或初始切割位置。
若目标图片的第一图片尺寸与预先确定的第二图片尺寸不相匹配,则需对目标图片进行切割,切割次数至少为1。若目标图片的第一图片尺寸与预先确定的第二图片尺寸相匹配,则无需对目标图片进行切割。基于此,在一个实施例中,若目标图片的第一图片尺寸与预先确定的第二图片尺寸不相匹配,则执行S102,即确定对目标图片进行切割的初始切割信息。
其中,第二图片尺寸可根据具体应用场景中的后续算法对图片长宽比的要求预先计算得到。在图片审核场景的相关实施例中,若使用OCR算法或图像识别算法对图片进行智能审核,则第二图片尺寸可根据OCR算法或图像识别算法对图片长宽比的要求预先计算得到。例如,假设OCR算法或图像识别算法对图片长宽比的要求为长宽比不大于2.5,则第二图片尺寸可由此确定为长宽比不大于2.5的尺寸。
在一个实施例中,切割次数及初始切割位置可根据第一图片尺寸与第二图片尺寸之间的大小关系来确定,其中,切割次数可根据第二图片尺寸与第一图片尺寸的商值来确定,初始切割位置可按照平均切割规则来确定。例如,第二图片尺寸为:最大长宽比不超过2:1,若第一图片尺寸为长宽比5:1,则可确定切割次数为2,即对目标图片切割2次可使切割后的每张子图片尺寸满足最大长宽比不超过2:1。按照平均切割规则,可确定初始切割位置为目标图片的长边的1/3和2/3处。
S104,分析目标图片中各行的像素值,以确定各行分别对应的像素分布信息。
其中,像素分布信息可包括像素分布混乱程度。由于大多数图片的背景由单一纯色构成,即像素分布较单一;而前景图片、文字等颜色的像素值分布则较为混乱,因此,像素分布混乱程度可作为判断图片前景或背景的依据。图片中某一行的像素分布越混乱,说明该行属于前景的概率越大;反之,图片中某一行的像素分布越单一,说明该行属于背景的概率越大。
S106,根据像素分布信息及初始切割信息,计算各行分别对应的可切割概率。
S108,根据各行分别对应的可切割概率,确定目标图片对应的目标切割位置。
其中,可切割概率用于表征对应行属于目标切割位置的概率。即,可切割概率越大,对应行属于目标切割位置的概率也就越大。在确定目标图片对应的目标切割位置后,在目标切割位置处对目标图片进行切割,即可使目标图片被切割为多个子图片,且每个子图片的图片尺寸均符合预先确定的第二图片尺寸。
采用本说明书一个或多个实施例的技术方案,在确定目标图片的初始切割信息(包括切割次数和/或初始切割位置)后,通过分析目标图片中各行的像素分布信息,并根据该像素分布信息计算各行的可切割概率,进而根据的可切割概率确定目标图片对应的目标切割位置。使得对目标图片的切割能够充分考虑到图片内容的像素分布信息,从而避免切割到图片前景内容(如图片中的文字内容或前景图片)的情况,大大降低了图片信息被破坏的概率,确保图片切割后图片内容的关联性和完整性。并且,这种切割图片的方法无需任何训练过程,不依赖于图片样本分布情况,因此能够适用于任何图片的切割,泛化性能极强。
在一个实施例中,像素分布信息包括像素分布混乱程度。基于此,可按照如下方式分析各行分别对应的像素分布信息:
首先,根据各行的像素值,分别计算各行的像素标准差。
其次,根据各行的像素标准差,确定各行分别对应的像素分布混乱程度,其中,像素标准差与像素分布混乱程度之间正相关。
此外,为了排除图片颜色对像素分布信息的影响,在计算像素标准差之前,可首先对目标图片进行灰度化,进而再计算灰度化之后的目标图片中各行的像素标准差,从而提升对像素分布信息的分析准确度。
按照上述方法,基于目标图片中的每一行的像素值计算像素标准差后,可得到像素标准差集合S={S1,S2…SL},其中,L为目标图片的行数。SL表示第L行的像素标准差。
本实施例中,通过计算各行的像素标准差来确定各行的像素分布混乱程度,能够反应出各行的像素变化情况。具体的,若某一行的像素标准差越小,说明该行的像素值变化较小(即像素分布混乱程度越低),则该行属于图片背景的概率越大。若某一行的像素标准差越大,说明该行的像素值变化较大(即像素分布混乱程度越高),则该行属于图片前景的概率越大。
在一个实施例中,在确定出目标图片的初始切割信息和各行的像素分布信息后,可按照如下方式计算各行分别对应的可切割概率:
首先,确定各行和与各行对应的初始切割位置之间的第一距离。
其中,与各行对应的初始切割位置即为:与各行距离最近的初始切割位置。第一距离可采用行距的绝对值或平方的方式表示。例如,若采用行距绝对值的方式表示,那么对于第100行,其对应的初始切割位置为第150行所在位置,则该行与其对应的初始切割位置之间的第一距离为50。若采用行距平方的方式标识,那么第100行与初始切割位置(第150行)之间的第一距离为2500。
其次,根据上述第一距离、各行的像素标准差、以及第一距离和像素标准差分别对应的权重,计算各行分别对应的可切割概率。
其中,可切割概率与第一距离或像素标准差之间负相关。即,某一行和与其对应的初始切割位置之间的距离越小,该行的可切割概率越大,属于目标切割位置的概率也就越大。某一行的像素标准差越小,说明该行的可切割概率越大,属于目标切割位置的概率也就越大。第一距离和像素标准差分别对应的权重可根据使用场景灵活确定。
在一个实施例中,考虑到仅依靠各行的像素标准差很难完全反应图片前景和背景信息,例如在实际操作中会遇到前景图中有多行连续文字介绍,文字之间有空白行,空白行的标准差较小,若以此作为切割位置,则会造成连续的文字描述被分割到两张子图片中,从而对语意理解造成偏差。如图2所示,图片200中包含产品A的图片以及对产品A的文字介绍,如果仅依靠各行的像素标准差,可能就会产生图2中所示的切割位置210。由图2可看出,切割位置210对应的像素标准差也是很小的,但其实际上是连续的文字描述中间的空行,如果在切割位置210处切割图片,显然会将对产品A的文字介绍部分分割开,效果并不理想。
因此,不仅要考虑各行的像素标准差,也要考虑相邻行之间的信息,选取稳定的图片背景。
基于上述考虑,在计算各行对应的可切割概率之前,可对目标图片中相邻行间的像素标准差进行高斯平滑处理。
具体的,首先,确定对目标图片进行高斯平滑的加权半径。对于每一行,可选择该行前后的m行作为加权半径,例如,m=10。其次,根据加权半径及指定类高斯函数,对像素标准差进行加权平均计算,得到高斯平滑后的像素标准差。
通过对目标图片中各相邻行间的像素标准差进行高斯平滑处理,可得到目标图片对应的高斯平滑后的像素标准差集合。在高斯平滑后的像素标准差集合中,各元素实际为未平滑处理的像素标准差集合中的每个元素为中心加权半径内的相邻点标准差。
可选的,选取正态分布下的高斯函数(即均值为0、标准差为1的高斯函数)为上述指定类函数,以对像素标准差进行平滑,这样不仅降低运算复杂度,将二维滤波变成一维,且能够利用对前景背景区分更鲁棒的标准差信息。如下述公式(1)所示:
Figure BDA0002471482080000071
对目标图片中相邻行间的像素标准差进行高斯平滑处理后,即可根据高斯平滑后的像素标准差计算各行分别对应的可切割概率。
在一个实施例中,可切割概率P(h)可按照如下公式(2)计算:
P(h)=(H-k1*sGh-k2(h-bk)2)/H (2)
在公式(2)中,H为目标图片总行数,k1为像素标准差对应的权重,k2为上述第一距离对应的权重,h为行数,bk为初始切割位置。
本实施例中,由于考虑到图片边缘、图片噪声、文字空隙等被识别为图片背景而被误切割的情况,采用对目标图片中相邻行间的像素标准差进行高斯平滑处理的方式,从而排除了图片边缘和空隙等因素对切割的影响,避免无效切割。
在一个实施例中,各初始切割位置分别对应一个初始切割集,各初始切割集包括多行。通常情况下,可根据临近原则将初始切割位置附近的多行划分至该初始切割位置对应的初始切割集中。因此,基于各行分别对于的可切割概率,可按照如下步骤A1-A3确定出目标图片对应的目标切割位置。
步骤A1,根据所述各行与各所述初始切割位置之间的距离,确定各行分别对应的初始切割集。
可选的,可按照临近原则为每一行分配对应的初始切割集,即,行与哪个初始切割位置之间的距离最近,该行就被划分到哪个初始切割位置对应的初始切割位置集中。
例如,目标图片的初始切割位置包括b1、b2两个位置,分别对应图片长边的1/3和2/3处。其中,初始切割位置b1对应的初始切割集记为N1,初始切割位置b2对应的初始切割集记为N2,则按照临近原则,目标图片上半部分的行数位于初始切割集N1中,而目标图片下半部分的行数则位于初始切割集N2中。假设目标图片的大小为行500像素及列100像素,则初始切割集N1={1,2,…,250},初始切割集N2={251,252,…,500}。
需要说明的是,本说明书实施例对于将各行划分至对应的初始切割集的执行顺序不作限定,例如,可在执行S102后就将各行划分至对应的初始切割集,或者,也可在执行S104后将各行划分至对应的初始切割集。
步骤A2,根据各行分别对应的可切割概率,确定各初始切割集中的最大可切割概率对应的目标行。
即,针对每个初始切割集,根据其中各行对应的可切割概率,从中筛选出最大可切割概率对应的行,即为目标行。例如,初始切割集N1={1,2,…,250},假设其中第100行对应的可切割概率最大,则第100行即为初始切割集N1对应的目标行。
步骤A3,判断目标行对应的可切割概率是否大于预设阈值。若是,则确定目标行所在的位置为目标切割位置;若否,则确定目标行对应的初始切割集中不存在目标切割位置。
对于不存在目标切割位置的初始切割集,将该初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与第二图片尺寸相匹配。
本实施例中,若目标行对应的初始切割集中不存在目标切割位置,则说明该初始切割集中包含的多行可能全部是图片前景,不适合切割,此时可直接对这部分图片进行缩放,以使这部分图片的尺寸与预先确定的第二图片尺寸相匹配。因此,本实施例的技术方案能够最大程度地使切割后的子图片均与预先确定的第二图片尺寸相匹配。
图3是根据本说明书另一实施例的一种图片处理方法的示意性流程图,如图3所示,该方法包括:
S301,当目标图片的第一图片尺寸与预先确定的第二图片尺寸不相匹配时,确定对目标图片进行切割的切割次数和初始切割位置。
其中,切割次数可根据第二图片尺寸与第一图片尺寸的商值来确定,初始切割位置可按照平均切割规则来确定。第二图片尺寸可根据具体应用场景中的后续算法对图片长宽比的要求预先计算得到。在图片审核场景的相关实施例中,若使用OCR算法或图像识别算法对图片进行智能审核,则第二图片尺寸可根据OCR算法或图像识别算法对图片长宽比的要求预先计算得到。
例如,第二图片尺寸为:最大长宽比不超过2:1,若第一图片尺寸为长宽比5:1,则可确定切割次数为2,即对目标图片切割2次可使切割后的每张子图片尺寸满足最大长宽比不超过2:1。按照平均切割规则,可确定初始切割位置为目标图片的长边的1/3和2/3处。
如图4所示,对目标图片400的切割次数为2,初始切割位置基于平均切割规则确定,分别对应图4中所示的切割位置410和切割位置420。其中,切割位置410为目标图片400的长边的1/3处位置,切割位置420为目标图片400的长边的2/3处位置。显然,在初始切割位置处切割目标图片会将目标图片中的重要内容(如产品A的图片、文字内容)破坏。
S302,根据目标图片中的各行与各初始切割位置之间的距离,将各行分别划分至对应的初始切割集中。
其中,各初始切割位置分别对应一个初始切割集。根据临近原则将初始切割位置附近的多行划分至该初始切割位置对应的初始切割集中,即,行与哪个初始切割位置之间的距离最近,该行就被划分到哪个初始切割位置对应的初始切割位置集中。
例如,初始切割位置记为b1、b2,分别对应目标图片长边的1/3和2/3处。其中,初始切割位置b1对应的初始切割集记为N1,初始切割位置b2对应的初始切割集记为N2,则按照临近原则,目标图片上半部分的行数位于初始切割集N1中,而目标图片下半部分的行数则位于初始切割集N2中。假设目标图片的大小为行500像素及列100像素,则初始切割集N1={1,2,…,250},初始切割集N2={251,252,…,500}。
S303,将目标图片进行灰度处理,并根据灰度处理后的目标图片中各行的像素值,计算各行分别对应的像素标准差。
本实施例中,各行分别对应的像素标准差组成集合,得到像素标准差集合S={S1,S2…SL},其中,L为目标图片的行数。SL表示第L行的像素标准差。
S304,对像素标准差进行高斯平滑处理,得到高斯平滑后的像素标准差。
其中,可选择正态分布下的高斯函数(如上述公式(1))对像素标准差进行平滑,得到高斯平滑后的像素标准差集合Sg={S1g,S2g…SLg},其中,SLg表示高斯平滑后的第L行的像素标准差。
S305,确定各行和与各行对应的初始切割位置之间的第一距离。
其中,与某一行对应的初始切割位置即为该行所在的初始切割集对应的初始切割位置。例如,初始切割集N1={1,2,…,250}中的行1至行250对应的初始切割位置均为b1,初始切割集N2={251,252,…,500}中的行251至行500对应的初始切割位置均为b2。
S306,根据各行对应的第一距离、高斯平滑后的像素标准差,以及第一距离和像素标准差分别对应的权重,计算各行分别对应的可切割概率。
其中,可切割概率与第一距离或像素标准差之间负相关。第一距离和像素标准差分别对应的权重可根据使用场景灵活确定。
可选的,可按照上述公式(2)计算各行分别对应的可切割概率。
S307,确定各初始切割集中的最大可切割概率对应的目标行。
沿用上述举例,初始切割集包括N1和N2,则需要分别确定出N1和N2中的目标行。对于初始切割集N1={1,2,…,250},假设其中第100行对应的可切割概率最大,则第100行即为初始切割集N1对应的目标行。
S308,判断目标行对应的可切割概率是否大于预设阈值。若是,则执行S309;若否,则执行S310。
S309,确定目标行所在的位置为目标切割位置。
S310,确定目标行对应的初始切割集中不存在目标切割位置。
S311,将初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与第二图片尺寸相匹配。
沿用上述举例,假设预设阈值为0.7,初始切割集N1={1,2,…,250}对应的目标行(假设为行100)的可切割概率为0.8,即大于0.7,则行100所在的位置即为目标切割位置。初始切割集N2={251,252,…,500}对应的目标行的可切割概率为0.6,即小于0.7,则说明初始切割集N2中不存在目标切割位置,初始切割集N2对应的图片区域不可切割,此时可对初始切割集N2对应的图片区域进行缩放,以使缩放后的图片尺寸与第二图片尺寸相匹配。
根据上述实施例的技术方案,可确定出目标图片的目标切割位置,如图5所示,目标切割位置510属于目标图片500的背景行,且不会破坏目标图片500中的重要内容(如产品A的图片、文字内容)。切割后得到的子图片如图6(a)和图6(b)所示,从而便于分别对各子图片进行图片处理(如图片审核)。
可见,本实施例的技术方案通过准确区分图片的前景和背景,能够避免切割到图片前景内容(如图片中的文字内容或前景图片)的情况,大大降低了图片信息被破坏的概率,确保图片切割后图片内容的关联性和完整性。并且,这种切割图片的方法无需任何训练过程,不依赖于图片样本分布情况,因此能够适用于任何图片的切割,泛化性能极强。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的图片处理方法,基于同样的思路,本说明书一个或多个实施例还提供一种图片处理装置。
图7是根据本说明书一实施例的一种图片处理装置的示意性框图,如图7所示,该装置包括:
第一确定模块710,根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析模块720,分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;
第一计算模块730,根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
第二确定模块740,根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
在一个实施例中,所述像素分布信息包括像素分布混乱程度;
所述分析模块720包括:
第三计算单元,根据所述各行的像素值,分别计算所述各行的像素标准差;
第五确定单元,根据所述各行的像素标准差,确定所述各行分别对应的所述像素分布混乱程度;其中,所述像素标准差与所述像素分布混乱程度之间正相关。
在一个实施例中,所述第一计算模块730包括:
第一确定单元,确定所述各行和与所述各行对应的所述初始切割位置之间的第一距离;
第一计算单元,根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率;其中,所述可切割概率与所述第一距离或所述像素标准差之间负相关。
在一个实施例中,所述装置还包括:
第三确定模块,在所述根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率之前,确定对所述目标图片进行高斯平滑的加权半径;
第二计算模块,根据所述加权半径及指定类高斯函数,对所述像素标准差进行加权平均计算,得到高斯平滑后的像素标准差;
所述第一计算模块730包括:
第二计算单元,根据所述第一距离、所述高斯平滑后的像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率。
在一个实施例中,各所述初始切割位置分别对应一个初始切割集;各所述初始切割集包括多行;
所述第二确定模块740包括:
第二确定单元,根据所述各行与各所述初始切割位置之间的距离,确定所述各行分别对应的初始切割集;
第三确定单元,根据所述各行分别对应的所述可切割概率,确定各所述初始切割集中的最大可切割概率对应的目标行;
判断单元,判断所述目标行对应的所述可切割概率是否大于预设阈值;
第四确定单元,若所述目标行对应的所述可切割概率大于所述预设阈值,则确定所述目标行所在的位置为所述目标切割位置。
在一个实施例中,所述装置还包括:
第四确定模块,在所述判断所述目标行对应的所述可切割概率是否大于预设阈值之后,若所述目标行对应的所述可切割概率小于或等于所述预设阈值,则确定所述目标行对应的所述初始切割集中不存在所述目标切割位置;
缩放模块,对于不存在所述目标切割位置的所述初始切割集,将所述初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与所述第二图片尺寸相匹配。
在一个实施例中,所述第一确定模块710包括:
第四计算单元,计算所述第一图片尺寸与所述第二图片尺寸的商值;
第六确定单元,根据所述商值,确定对所述目标图片进行切割的所述切割次数和/或所述初始切割位置。
在一个实施例中,所述第一确定模块710包括:
第七确定单元,若所述目标图片的第一图片尺寸与所述第二图片尺寸不相匹配,则确定所述对所述目标图片进行切割的初始切割信息。
采用本说明书一个或多个实施例的装置,在确定目标图片的初始切割信息(包括切割次数和/或初始切割位置)后,通过分析目标图片中各行的像素分布信息,并根据该像素分布信息计算各行的可切割概率,进而根据的可切割概率确定目标图片对应的目标切割位置。使得对目标图片的切割能够充分考虑到图片内容的像素分布信息,从而避免切割到图片前景内容(如图片中的文字内容或前景图片)的情况,大大降低了图片信息被破坏的概率,确保图片切割后图片内容的关联性和完整性。并且,这种切割图片的方法无需任何训练过程,不依赖于图片样本分布情况,因此能够适用于任何图片的切割,泛化性能极强。
本领域的技术人员应可理解,上述图片处理装置能够用来实现前文所述的图片处理方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种图片处理设备,如图8所示。图片处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对图片处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在图片处理设备上执行存储器802中的一系列计算机可执行指令。图片处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
具体在本实施例中,图片处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对图片处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;
根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
可选地,所述像素分布信息包括像素分布混乱程度;
计算机可执行指令在被执行时,还可以使所述处理器:
根据所述各行的像素值,分别计算所述各行的像素标准差;
根据所述各行的像素标准差,确定所述各行分别对应的所述像素分布混乱程度;其中,所述像素标准差与所述像素分布混乱程度之间正相关。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
确定所述各行和与所述各行对应的所述初始切割位置之间的第一距离;
根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率;其中,所述可切割概率与所述第一距离或所述像素标准差之间负相关。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
确定对所述目标图片进行高斯平滑的加权半径;
根据所述加权半径及指定类高斯函数,对所述像素标准差进行加权平均计算,得到高斯平滑后的像素标准差;
根据所述第一距离、所述高斯平滑后的像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率。
可选地,各所述初始切割位置分别对应一个初始切割集;各所述初始切割集包括多行;计算机可执行指令在被执行时,还可以使所述处理器:
根据所述各行与各所述初始切割位置之间的距离,确定所述各行分别对应的初始切割集;
根据所述各行分别对应的所述可切割概率,确定各所述初始切割集中的最大可切割概率对应的目标行;
判断所述目标行对应的所述可切割概率是否大于预设阈值;
若是,则确定所述目标行所在的位置为所述目标切割位置。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
若所述目标行对应的所述可切割概率小于或等于所述预设阈值,则确定所述目标行对应的所述初始切割集中不存在所述目标切割位置;
对于不存在所述目标切割位置的所述初始切割集,将所述初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与所述第二图片尺寸相匹配。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
计算所述第一图片尺寸与所述第二图片尺寸的商值;
根据所述商值,确定对所述目标图片进行切割的所述切割次数和/或所述初始切割位置。
可选地,计算机可执行指令在被执行时,还可以使所述处理器:
若所述目标图片的第一图片尺寸与所述第二图片尺寸不相匹配,则确定所述对所述目标图片进行切割的初始切割信息。
本说明书一个或多个实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述图片处理方法,并具体用于执行:
根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;
根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。

Claims (15)

1.一种图片处理方法,包括:
根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;所述像素分布信息包括像素分布混乱程度;
根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
2.根据权利要求1所述的方法,所述根据所述目标图片中各行的像素值,分析所述各行分别对应的像素分布信息,包括:
根据所述各行的像素值,分别计算所述各行的像素标准差;
根据所述各行的像素标准差,确定所述各行分别对应的所述像素分布混乱程度;其中,所述像素标准差与所述像素分布混乱程度之间正相关。
3.根据权利要求1所述的方法,所述根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率,包括:
确定所述各行和与所述各行对应的所述初始切割位置之间的第一距离;
根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率;其中,所述可切割概率与所述第一距离或所述像素标准差之间负相关。
4.根据权利要求3所述的方法,所述根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率之前,还包括:
确定对所述目标图片进行高斯平滑的加权半径;
根据所述加权半径及指定类高斯函数,对所述像素标准差进行加权平均计算,得到高斯平滑后的像素标准差;
所述根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率,包括:
根据所述第一距离、所述高斯平滑后的像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率。
5.根据权利要求3所述的方法,各所述初始切割位置分别对应一个初始切割集;各所述初始切割集包括多行;
所述根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置,包括:
根据所述各行与各所述初始切割位置之间的距离,确定所述各行分别对应的初始切割集;
根据所述各行分别对应的所述可切割概率,确定各所述初始切割集中的最大可切割概率对应的目标行;
判断所述目标行对应的所述可切割概率是否大于预设阈值;
若是,则确定所述目标行所在的位置为所述目标切割位置。
6.根据权利要求5所述的方法,所述判断所述目标行对应的所述可切割概率是否大于预设阈值之后,还包括:
若所述目标行对应的所述可切割概率小于或等于所述预设阈值,则确定所述目标行对应的所述初始切割集中不存在所述目标切割位置;
对于不存在所述目标切割位置的所述初始切割集,将所述初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与所述第二图片尺寸相匹配。
7.根据权利要求1所述的方法,所述根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息,包括:
计算所述第一图片尺寸与所述第二图片尺寸的商值;
根据所述商值,确定对所述目标图片进行切割的所述切割次数和/或所述初始切割位置。
8.根据权利要求1所述的方法,所述确定对所述目标图片进行切割的初始切割信息,包括:
若所述目标图片的第一图片尺寸与所述第二图片尺寸不相匹配,则确定所述对所述目标图片进行切割的初始切割信息。
9.一种图片处理装置,包括:
第一确定模块,根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析模块,分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;所述像素分布信息包括像素分布混乱程度;
第一计算模块,根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
第二确定模块,根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
10.根据权利要求9所述的装置,所述第一计算模块包括:
第一确定单元,确定所述各行和与所述各行对应的所述初始切割位置之间的第一距离;
第一计算单元,根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率;其中,所述可切割概率与所述第一距离或所述像素标准差之间负相关。
11.根据权利要求10所述的装置,还包括:
第三确定模块,在所述根据所述第一距离、所述像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率之前,确定对所述目标图片进行高斯平滑的加权半径;
第二计算模块,根据所述加权半径及指定类高斯函数,对所述像素标准差进行加权平均计算,得到高斯平滑后的像素标准差;
所述第一计算模块包括:
第二计算单元,根据所述第一距离、所述高斯平滑后的像素标准差、以及所述第一距离和所述像素标准差分别对应的权重,计算所述各行分别对应的可切割概率。
12.根据权利要求10所述的装置,各所述初始切割位置分别对应一个初始切割集;各所述初始切割集包括多行;
所述第二确定模块包括:
第二确定单元,根据所述各行与各所述初始切割位置之间的距离,确定所述各行分别对应的初始切割集;
第三确定单元,根据所述各行分别对应的所述可切割概率,确定各所述初始切割集中的最大可切割概率对应的目标行;
判断单元,判断所述目标行对应的所述可切割概率是否大于预设阈值;
第四确定单元,若所述目标行对应的所述可切割概率大于所述预设阈值,则确定所述目标行所在的位置为所述目标切割位置。
13.根据权利要求12所述的装置,还包括:
第四确定模块,在所述判断所述目标行对应的所述可切割概率是否大于预设阈值之后,若所述目标行对应的所述可切割概率小于或等于所述预设阈值,则确定所述目标行对应的所述初始切割集中不存在所述目标切割位置;
缩放模块,对于不存在所述目标切割位置的所述初始切割集,将所述初始切割集对应的图片区域进行缩放,以使缩放后的图片尺寸与所述第二图片尺寸相匹配。
14.一种图片处理设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;所述像素分布信息包括像素分布混乱程度;
根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
15.一种存储介质,用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
根据目标图片的第一图片尺寸及预先确定的第二图片尺寸,确定对所述目标图片进行切割的初始切割信息;所述初始切割信息包括切割次数和/或初始切割位置;
分析所述目标图片中各行的像素值,以确定所述各行分别对应的像素分布信息;所述像素分布信息包括像素分布混乱程度;
根据所述像素分布信息及所述初始切割信息,计算所述各行分别对应的可切割概率;
根据所述各行分别对应的所述可切割概率,确定所述目标图片对应的目标切割位置。
CN202010349644.7A 2020-04-28 2020-04-28 图片处理方法及装置 Active CN111553364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010349644.7A CN111553364B (zh) 2020-04-28 2020-04-28 图片处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010349644.7A CN111553364B (zh) 2020-04-28 2020-04-28 图片处理方法及装置

Publications (2)

Publication Number Publication Date
CN111553364A CN111553364A (zh) 2020-08-18
CN111553364B true CN111553364B (zh) 2022-10-11

Family

ID=72004197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010349644.7A Active CN111553364B (zh) 2020-04-28 2020-04-28 图片处理方法及装置

Country Status (1)

Country Link
CN (1) CN111553364B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113269541B (zh) * 2021-07-21 2021-11-02 深圳市启程教育科技有限公司 基于互联网的人才线上面试数据分析系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017202232A1 (zh) * 2016-05-24 2017-11-30 腾讯科技(深圳)有限公司 名片内容识别方法、电子设备和存储介质
CN109299718A (zh) * 2018-09-21 2019-02-01 新华三信息安全技术有限公司 一种字符识别方法及装置
WO2020034663A1 (en) * 2018-08-13 2020-02-20 The Hong Kong Polytechnic University Grid-based image cropping

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899853B (zh) * 2014-03-04 2019-12-06 腾讯科技(深圳)有限公司 图像区域的划分方法及装置
US9626584B2 (en) * 2014-10-09 2017-04-18 Adobe Systems Incorporated Image cropping suggestion using multiple saliency maps

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017202232A1 (zh) * 2016-05-24 2017-11-30 腾讯科技(深圳)有限公司 名片内容识别方法、电子设备和存储介质
WO2020034663A1 (en) * 2018-08-13 2020-02-20 The Hong Kong Polytechnic University Grid-based image cropping
CN109299718A (zh) * 2018-09-21 2019-02-01 新华三信息安全技术有限公司 一种字符识别方法及装置

Also Published As

Publication number Publication date
CN111553364A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
US11861816B2 (en) System and method for detecting image forgery through convolutional neural network and method for providing non-manipulation detection service using the same
CN108805131B (zh) 文本行检测方法、装置及系统
US20230081645A1 (en) Detecting forged facial images using frequency domain information and local correlation
US10664687B2 (en) Rule-based video importance analysis
CN109960980B (zh) 动态手势识别方法及装置
CN115063875B (zh) 模型训练方法、图像处理方法、装置和电子设备
CN109858427A (zh) 一种语料提取方法、装置及终端设备
KR20100076015A (ko) 향상된 이미지 식별
CN111178133A (zh) 一种基于剪枝深度模型用于自然场景图像文本识别方法
CN111523429A (zh) 基于深度学习的堆钢识别方法
CN111062854A (zh) 检测水印的方法、装置、终端及存储介质
CN111553364B (zh) 图片处理方法及装置
CN114005019B (zh) 一种翻拍图像识别方法及其相关设备
CN114429637A (zh) 一种文档分类方法、装置、设备及存储介质
US9424484B2 (en) Feature interpolation
CN113435531A (zh) 零样本图像分类方法、系统、电子设备及存储介质
CN111444834A (zh) 图像文本行检测方法、装置、设备及存储介质
CN111369489A (zh) 一种图像识别方法、装置及终端设备
CN113486881B (zh) 一种文本识别方法、装置、设备及介质
KR20200046182A (ko) 딥러닝 기반 이미지 보정 탐지 시스템 및 이를 이용하여 무보정 탐지 서비스를 제공하는 방법
CN113807407B (zh) 目标检测模型训练方法、模型性能检测方法及装置
CN112801960B (zh) 图像处理方法及装置、存储介质、电子设备
CN115004245A (zh) 目标检测方法、装置、电子设备和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant