CN116051581A - 一种图像处理方法、装置及存储介质 - Google Patents

一种图像处理方法、装置及存储介质 Download PDF

Info

Publication number
CN116051581A
CN116051581A CN202211486535.5A CN202211486535A CN116051581A CN 116051581 A CN116051581 A CN 116051581A CN 202211486535 A CN202211486535 A CN 202211486535A CN 116051581 A CN116051581 A CN 116051581A
Authority
CN
China
Prior art keywords
target
combination
intersection point
image
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211486535.5A
Other languages
English (en)
Inventor
邹兴财
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Pantum Electronics Co Ltd
Original Assignee
Zhuhai Pantum Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Pantum Electronics Co Ltd filed Critical Zhuhai Pantum Electronics Co Ltd
Priority to CN202211486535.5A priority Critical patent/CN116051581A/zh
Publication of CN116051581A publication Critical patent/CN116051581A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像处理方法、装置及存储介质,该方法包括:获取待处理图像,待处理图像包含第一处理区域以及第二处理区域;基于目标神经网络模型输出待处理图像的二值边缘图,其中,目标神经网络是基于第一处理区域以及第二处理区域合成的样本图训练得到;基于二值边缘图进行直线检测以检测二值边缘图中的直线组合,对直线组合进行重复直线合并以输出二值边缘图中的目标直线组合;确定目标直线组合中每任意两条直线在二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定第一交点组合中的目标交点组合;基于目标交点组合确定待处理图像的目标区域边缘,并返回处理结果。采用本发明实施例,可以提高对目标区域边缘的识别准确率。

Description

一种图像处理方法、装置及存储介质
【技术领域】
本发明涉及图像处理领域,尤其涉及一种确定目标区域边缘的图像处理方法、装置及存储介质。
【背景技术】
目前,用户经常会使用手机拍下卡片或纸质文档用于存档或打印,但手机拍摄得到的图像有很多不需要的区域,且由于场景复杂多样大多数算法对卡片(或纸质文档等)位置的识别准确率不够高,与理想中的位置难免会有些差距,如何提高目标物体位置的识别准确率是一个具有较大挑战的任务。
现有技术中针对如何提高目标物体位置轮廓的识别准确率的解决办法通常使用神经网络来实现,这类神经网络采取端到端的模式直接计算出各个角点,因此该类神经网络计算角点的准确性较低,缺少针对异常情况,如计算出的角点少于四个角点的情况处理。
【发明内容】
本发明实施例提供了一种图像处理方法、装置及存储介质,能够针对不同的异常情况进行分类处理,进而提高了图像处理的准确率。
本发明实施例一方面提供了一种图像处理方法,该方法包括:
获取待处理图像,所述待处理图像包含第一处理区域以及第二处理区域;
基于目标神经网络模型输出所述待处理图像的二值边缘图,其中,所述目标神经网络基于所述第一处理区域以及所述第二处理区域合成的样本图训练得到;
基于所述二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,对所述直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合;
确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合;
基于所述目标交点组合确定所述待处理图像的目标区域边缘,并返回处理结果。
其中,该方法还包括:
获取所述前景图的合集与所述背景图的合集,将所述前景图的合集中的任一一张前景图与所述背景图的合集中的任一一张背景图进行合成,得到训练样本图;
利用所述训练样本图对所述目标神经网络模型进行训练。
其中,该方法还包括:
利用所述目标神经网络模型对所述图像进行n次运算,其中,前n-1次运算包括多次卷积+激活和一次池化,第n次运算包括多次卷积+激活,且第一次运算的输入是所述待处理图像,下一次运算的输入是上一次运算的输出;
提取每次运算过程中最后一次卷积+激活得到的一组矩阵;
对n组矩阵分别进行转置卷积,其中,转置卷积后的所述n组矩阵所对应的图像的尺寸相同;
将转置卷积后的所述n组矩阵连接后进行卷积,得到预设形状的各个边缘区域。
其中,该方法还包括:
将所述二值边缘图进行直线检测后检测出的直线组合进行极坐标变换,以确定所述直线组合中每任意两条直线的角度之差以及半径之差;
确定预设的角度阈值与半径阈值,将所述直线组合中每任意两条直线的角度之差小于等于角度阈值,或所述直线组合中每任意两条直线的半径之差小于等于半径阈值的两条直线合并成同一直线;
输出对所述直线组合进行重复直线合并后的目标直线组合。
其中,所述二值边缘图包含第三处理区域以及第四处理区域,其中,所述第三处理区域为所述二值边缘图的前景图,所述第四处理区域为所述二值边缘图的背景图,该方法还包括:
基于所述目标直线组合中每任意两条直线确定在所述二值边缘图中的第二交点组合,其中,所述第二交点组合中的交点位于所述二值边缘图中的第三处理区域以及第四处理区域;
将所述第一交点组合中位于所述二值边缘图的第四处理区域的交点进行排除,以确定所述目标直线组合中每任意两条直线在所述二值边缘图的第三处理区域的第三交点组合;
将所述第三交点组合中任意两个交点之间的距离小于等于预设的距离阈值的交点合并为一个交点,以确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合。
其中,该方法还包括:
确定所述第一交点组合中交点的个数N,其中,N为大于等于0的正整数;
当N大于等于1时,基于所述第一交点组合中的N个交点确定M个可疑四边形交点组合,其中,M为大于等于0的正整数;
基于四边形的结构特征规则对所述M个可疑四边形交点组合中确定的可疑四边形进行合理值计算,将所述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合,其中,所述四边形的结构特征规则包括四边形的边长规则以及四边形的角度规则。
其中,该方法还包括:
当N等于3时,基于所述N个交点确定目标三角形,并基于所述目标三角形确定角度值最大的第一交点;
基于所述第一交点以及平行四边形规则确定所述第一交点的对角第二交点,并将所述目标三角形中的三个交点以及第二交点确定为目标交点组合。
其中,该方法还包括:
当N等于2时,确定所述二值边缘图的中心点位置;
基于所述N个交点确定目标边缘线段,并基于所述目标边缘线段以及所述二值边缘图的中心点位置确定第四交点以及第五交点;
将所述N个交点中的2个交点以及所述第四交点以及第五交点确定为所述第一交点组合中的目标交点组合。
其中,该方法还包括:
当N小于等于1时,基于所述二值边缘图的边长以及预设的比例阈值确定确定四个默认交点,并将所述四个默认交点确定为所述第一交点组合中的目标交点组合。
本发明实施例另一方面还提供了一种图像处理装置,该装置包括:
获取模块,用于获取待处理图像,所述待处理图像包含第一处理区域以及第二处理区域;
输出模块,用于基于目标神经网络模型输出所述待处理图像的二值边缘图,其中,所述目标神经网络基于所述第一处理区域以及所述第二处理区域合成的样本图训练得到;
检测模块,用于基于所述二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,对所述直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合;
第一确定模块,用于确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合;
第二确定模块,用于基于所述目标交点组合确定所述待处理图像的目标区域边缘,并返回处理结果。
本发明实施例还提供一种电子装置,包括:包括存储器,处理器以及计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现上述任意一项所述的方法。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现上述任意一项所述方法的步骤。
通过本发明的实施例可以通过获取待处理图像,基于目标神经网络模型输出所述待处理图像的二值边缘图,并对二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,再对直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合,然后确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合,最后基于所述目标交点组合确定所述待处理图像的目标边缘图像,并返回处理结果。可见,在确定目标边缘图像的过程中会对目标神经网络模型输出的二值边缘图进行会直线检测,再通过目标直线组合基于特定的四边形的结构特征规则来确定目标交点组合,这里,在确定目标交点组合的过程中考虑了特定的四边形的结构特征规则,因此会排除掉不合理的四边形的情形,减少了异常情况的发生,从而提高了对目标边缘图像的识别准确率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1a为本发明实施例提供的一种网络架构示例图;
图1b为本发明实施例提供的一种待处理图像的示例图;
图1c为本发明实施例提供的一种目标边缘图像的示例图;
图1d为本发明实施例提供的一种二值边缘图的示例图;
图1e为本发明实施例提供的一种基于目标交点组合确定的裁剪后的目标区域的示例图;
图2是本发明实施例提供的一种图像处理方法流程示例图;
图2a是本发明实施例提供的一种直线检测后的二值边缘图的示例图;
图3是本发明实施例提供的另一种图像处理方法流程示例图;
图4是本发明实施例提供的一种四边形的角度对应关系的示例图;
图5是本发明实施例提供的一种计算边缘概率值的图形位置示例图;
图6为图6是本发明实施例提供的一种图像处理装置的结构示例图;
图7为本发明实施例提供的另一种电子装置的结构示例图。
【具体实施方式】
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1a,是本发明实施例提供的一种网络架构示意图。该网络架构可以包括服务器200以及终端设备100。其中,服务器200可以通过网络与终端设备100进行数据传输,该终端设备100可以安装图像处理类应用(实现对拍照获取的图片进行目标区域的边缘确定,方便用户使用该边缘确定的目标区域进行打印等操作),服务器200可以为图像处理类应用对应的后台服务器,因此终端设备100可以通过该图像处理类应用对应的客户端与服务器200进行数据传输。可选的,服务器200可以获取来自终端设备100发送的如图1b所示的待处理图像,其中,这里的待处理图像可以是预先拍摄好存储在终端设备100中的待处理图像,也可以是从网络或者其他终端设备接收到的待处理图像,或者还可以是终端设备100实时拍摄的待处理图像,这里不作限定。如图1所示,当服务器200获取到待处理图像后,基于目标神经网络模型输出上述待处理图像的二值边缘图,随后服务器200对二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,再对直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合,然后由服务器200确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合,最后服务器200基于所述目标交点组合确定如图1c所示的包括四个顶点边缘的图像,并将上述如图1c所示的图像返回至终端100,用户可以在终端100上查看到处理后的如图1c所示的包含目标区域111边缘的图像。其中,上述终端设备可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)。
可选的,在本申请中上述由服务器200实施的方法还可以由终端设备100来执行,当该方法应用于终端设备中时,由于终端的内存和运行速度有限,需要对神经网络算法进行优化。在可选的实施例中,由于上述目标神经网络算法基于TensorFlow框架搭建(也可以使用tensorflow、pytorch、paddlepaddle等框架搭建),而本实施例中的目标神经网络模型是目的是实现目标区域边缘的边缘检测,因此可以对框架中神经网络算法没有使用的模块进行删除,只保留目标神经网络实现目标区域边缘检测的使用到的模块,这样既可以减少目标神经网络模型的大小,也可以减少对终端设备内存的占用,以提高终端设备的运行速度。
其中,该方法应用于服务器200中时也可以做上述优化,本申请实施例在此不作限定。
请参见图2,是本发明实施例提供的一种图像处理方法流程示意图。该方法可以包括:
步骤S101,获取待处理图像,上述待处理图像包含第一处理区域以及第二处理区域。
具体的,当上述待处理图像为从网络或者其他终端设备接收到的图像时,这里的待处理图像可以为如图1b所示的图像。如图1b所示,上述待处理图像包括第一处理区域10a以及第二处理区域10b,其中,这里的第一处理区域10a也就是上述待处理图像的前景图,这里的第二处理区域10b也就是上述待处理图像的背景图。
步骤S102,基于目标神经网络模型输出上述待处理图像的二值边缘图,其中,上述目标神经网络是基于上述第一处理区域以及上述第二处理区域合成的样本图训练得到。
具体的,上述目标神经网络可以为VGG16卷积神经网络,其中,VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用最大池化(Max-pooling)分开,所有隐层的激活单元都采用ReLU函数,并用池化层作为分界。VGG16卷积神经网络共有6个块结构,每个块结构的最后一层卷积后添加一个侧输出(Side-output),且每个结构中的通道数相同,因为卷积层和全连接层都有权重系数,也被成为权重层,其中卷积层13层,全连接层3层,池化层不涉及权重,所以共有16层。对于VGG16卷积神经网络而言,其13层卷积层和5层池化层负责进行特征的提取,最后的3层全连接层负责完成分类的任务。在本申请可选的实施例中,去掉了最后一个池化层以及后面的全连接层,保留了前面5个模块。因此在上述5个块结构中,每个模块中所有的1X1X21卷积输出进行元素相加操作得到一个复合特征。通过将卷积层后引出的5个侧输出以及5个侧输出经过融合层后的结果同时进行训练,并计算6个损失函数,得到训练后的目标神经网络。
在本申请可选的实施例中,将不同的图像按照目标图像边缘剪裁出作为前景图(如10a),将不同的图像作为背景图(如10b),其中上述前景图可以为待处理图像的第一处理区域,上述背景图可以为待处理图像的第二处理区域。在训练上述目标神经网络模型的时候,获取上述前景图的合集与上述背景图的合集,将上述前景图的合集中的任意一张前景图与上述背景图的合集中的任意一张背景图进行合成(可进行透视变换来模拟扭曲场景),得到训练样本图,同时记录前景图在背景图中的位置,并生成一张黑白的含有前景图的轮廓的标注图。通过利用前景图和背景图合成得到训练样本图,由于前景图的边缘区域是已知的,所以可以避免人工标注时工作量大的问题。不过由于上述得到的训练样本集都是基于一定算法大批量生成的,因此可能对于真实场景下的训练样本集来说存在一定差距,所以为了能够得到更多真实的训练样本集,将整个功能完善之后进行批量测试,并通过人工筛选测试结果,将准确的数据一并加入到训练样本集中。这里的准确的数据是通过计算得到的准确的目标交点组合与之输入的训练样本合成的数据集。在本申请可选的实施例中,基于TensorFlow搭建神经网络模型,将上述制作好的训练样本集作为模型的输入,对上述神经网络进行不少于一万轮的训练,得到训练好的神经网络模型。在训练后对上述目标神经网络模型进行测试,若没有达到足够的准确率,则再次进行训练。其中,再次训练时筛选出正确的输入数据作为新的训练样本集,并再次进行训练。这里的筛选出的正确的输入数据是通过计算得到的准确的目标交点组合与之输入的训练样本合成的数据集。其中,制作新的训练样本集时,将计算结果(四个交点)画出一个四边形,将其当做输入训练样本图的目标区域边缘,由此得到一个样本数据加入到新的样本训练集中。
在本申请可选的实施例中,在上述目标神经网络训练完后,将待处理图像(如图1b)输入进目标神经网络中,利用上述目标神经网络对其进行n次运算,其中,前n-1次运算包括多次卷积+激活和一次池化,第n次运算包括多次卷积+激活,且第一次运算的输入是上述待处理图像(如图1b),那么下一次运算的输入是上一次运算的输出,提取每次运算过程中最后一次卷积+激活得到的一组矩阵,对n组矩阵分别进行转置卷积。其中,转置卷积后的n组矩阵所对应的图像尺寸相同。将转置卷积后的n组矩阵连接后进行卷积,输出上述待处理图像(如图1b)的二值边缘图(如图1d)。其中,n的取值等于选取的神经网络算法的运算次数。可选的,当上述目标神经网络为VGG网络时,VGG网络的运算次数为5,因此这里的n可以为5。
步骤S103,基于上述二值边缘图进行直线检测以检测上述二值边缘图中的直线组合,对上述直线组合进行重复直线合并,以输出上述二值边缘图中的目标直线组合。
可选的,对上述目标神经网络输出的二值边缘图进行直线检测。其中,这里的直线检测可以是霍夫变换进行的直线检测也可以是LSD直线检测。LSD直线检测时通过对图像局部分析,得出直线的像素点集,再通过假设参数进行验证求解,将像素点集合与误差控制集合合并,进而自适应控制误检的数量。而这里的霍夫变换是一种特征提取,其被广泛应用在图像分析以及计算机视觉等领域,它是用来辨别找出物体中的特征(例如线条)。其算法流程大致如下:给定一个要辨别形状的种类,其算法会在参数空间中执行投票来决定物体的形状,而这是由累加空间里的局部最大值来决定。因此霍夫变换就是把图像空间中的直线检测问题转换到参数空间中对点的检测问题,通过在参数空间里寻找峰值来完成直线检测任务,也即把检测整体特性转化为检测局部特性。
具体的,在进行霍夫变换时,将图像空间中经过某一点的所有直线用极坐标r=xcos(θ)+ysin(θ)(其中,r为原点到直线的距离,θ为原点与直线的垂线与x轴的夹角)表示,此时映射到参数空间后为一条正弦曲线。参数空间某一点经过的正弦曲线数量越多时,表示越多点处于该条直线,因此可以设定一定的阈值,当数量高于某个值的时候表示在图像空间中存在一条对应的直线。例如,由原理可知,某一点经过的正弦曲线的数量表示了该直线的强度,数量越多表示强度越大。因此为了区分某一点的范围是多少,可以将坐标离散化(例如角度取0°、1°、2°...,或者距离r取1、2、3...),离散化后会存在角度分辨率和距离分辨率两个参数。参数空间中某一点的正弦曲线数量反应的是直线的强度,根据该点的正弦曲线的角度参数累加阈值或者距离参数累加阈值,来确定高于该值时存在的对应直线。如图2a所示,图2a为进行霍夫变换后的二值边缘图中的直线组合,其中上述参数阈值越宽松,得到的直线将会越多,因此可以只取前几条直线(例如只使用检测出来的前10条直线,其检测出来的多条直线已按照一定的可能性排序,第一条直线的可能性最高)。
可选的,在上述直线检测检测出二值边缘图中的直线组合后可以对上述直线组合进行重复直线合并以输出上述二值边缘图中的目标直线组合。基于对上述直线组合进行极坐标变换后的表达式,确定上述直线组合中每任意两条直线的角度之差以及半径之差,确定预设的角度阈值与半径阈值,将上述直线组合中每任意两条直线的角度之差小于等于角度阈值,以及将上述直线组合中每任意两条直线的半径之差小于等于半径阈值的两条直线合并成同一直线。具体的,由于图像存在噪点和边缘存在毛边,霍夫直线检测算法有可能会对同一实体线检测出多条相近的直线,其代表的均为同一条直线,但角度和半径略有误差,因此在极坐标下可以认为角度θ和半径r都相近的线为同一直线。因此定义两线角度之差为Δθ,半径之差为Δr,并分别给定预设的阈值,上述角度之差与半径之差在预设的阈值内的两条直线合并为同一直线。
步骤S104,确定上述目标直线组合中每任意两条直线在上述二值边缘图的第一交点组合,并基于四边形的结构特征规则确定上述第一交点组合中的目标交点组合。
其中,步骤S104的具体实现过程可以参见下述图3所对应实施例中对步骤S204-步骤S207的描述,这里不作赘述。
步骤S105,基于上述目标交点组合确定所述待处理图像的目标区域边缘,并返回处理结果。
具体的,基于上述目标交点组合中的四个交点确定一四边形,进一步地将上述四边形区域确定为上述待处理图像的目标区域,将四边形的边缘作为目标区域的边缘,将上述目标区域边缘返回至用户终端,因此用户可以在终端上查看到进行处理后的图像(如图1c)。
可选的,当上述待处理图像是通过手机的摄像头拍照获取时,可以对上述拍摄的待处理图像进行自动存储,当需要返回处理后的图像时,手机的图像处理类应用程序调用边缘识别接口API(Application Programming Interface)(该接口的输入参数为待处理图像的存储路径),图像处理类应用程序从边缘识别接口获取上述确定的目标交点组合中的四个交点,通过图像实际像素比例以及实际显示的像素比例将四个交点映射到手机显示屏幕上,用户确认后调用裁剪的接口API(该接口的输入参数为待处理图像的存储路径以及目标四边形的四个交点)获取目标区域并显示在终端设备上。显示的裁剪之后的图像效果如图1e所示,其中最终裁剪后给予用户展示的图1e没有了不相关的非目标区域112,可以使用户确定准确的目标区域111,方面用户进一步打印或者扫描获取目标图像,得到最理想的打印、拍照扫描效果。
在本申请中,首先通过目标神经网络模型来输出待处理图像的目标区域边缘,而这一步骤在传统方法中可以通过Canny算法实现,只是使用效果不如通过神经网络来实现的效果好,且本申请在目标神经网络的训练部分也采用了一种边训练边测试的策略,为了能够得到更多真实的训练样本集,将整个功能完善之后进行批量测试,并通过人工筛选测试结果,将准确的数据一并加入到训练样本集中。这里的准确的数据是通过计算得到的准确的目标交点组合与之输入的训练样本合成的数据集。这类通过人工测试、筛选结果、二次训练的策略能够有效的提升模型的性能以及准确性。
请参见图3,是本发明实施例提供的另一种图像处理方法流程示意图。该方法可以包括:
步骤S201,获取待处理图像,上述待处理图像包含第一处理区域以及第二处理区域。
其中,步骤S201的具体实现过程可以参见上述图2所对应实施例中对步骤S101的描述,这里不作赘述。
步骤S202,基于目标神经网络模型输出上述待处理图像的二值边缘图,其中,上述目标神经网络是基于所述第一处理区域以及所述第二处理区域合成的样本图训练得到。
其中,步骤S202的具体实现过程可以参见上述图2所对应实施例中对步骤S102的描述,这里不作赘述。
步骤S203,基于上述二值边缘图进行直线检测以检测上述二值边缘图中的直线组合,对上述直线组合进行重复直线合并以输出上述二值边缘图中的目标直线组合。
其中,步骤S203的具体实现过程可以参见上述图2所对应实施例中对步骤S103的描述,这里不作赘述。
步骤S204,确定上述目标直线组合中每任意两条直线在上述二值边缘图中的第一交点组合。
具体的,基于上述目标直线组合中每任意两条直线确定在上述二值边缘图中的第二交点组合,其中,上述第二交点组合中的交点位于二值边缘图中的第三处理区域以及第四处理区域。这里的第三处理区域即为二值边缘图的前景图,这里的第四处理区域即为二值边缘图的背景图。将上述第一交点组合中位于二值边缘图的第四处理区域的交点进行排除,以确定目标直线组合中每任意两条直线在所述二值边缘图的第三处理区域的第三交点组合。将上述第三交点组合中任意两个交点之间的距离小于等于预设的距离阈值的交点合并为一个交点,以确定目标直线组合中每任意两条直线在二值边缘图中的第一交点组合。
步骤S205,确定上述第一交点组合中交点的个数N,其中N为大于等于0的正整数;当N大于等于1时,基于上述第一交点组合中的N个交点确定M个可疑四边形交点组合,其中,M为大于等于0的正整数。
具体的,确定出在二值边缘图的前景图的区域内的第一交点组合后,再确定出第一交点组合中的交点个数。然后开始寻找四边形,按照每四个点组合成一个四边形,共可组合成M个可疑四边形,其中,这里的可疑四边形并不一定是合理的四边形。例如,当第一交点组合中的交点个数N为3个或2个时,则不存在合理的四边形,因此此时可基于第一交点组合中的N个交点组成1个可疑的四边形,后续再去判断其合理性。当N大于4时,可基于排序算法对N个交点生成M个可疑四边形,此时的M大于等于1,然后再去判断这M个可疑四边形的合理性。
步骤S206,基于四边形的结构特征规则对上述M个可疑四边形交点组合中确定的可疑四边形进行合理值计算,将上述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合,其中,上述四边形的结构特征规则包括四边形的边长规则以及四边形的角度规则。
具体的,当N大于等于1时,基于四边形的结构特征规则对上述N个交点组成的M个可疑四边形交点组合中确定的可疑四边形进行合理值计算。
其中,当N大于等于4时,可将每四个点组成一个四边形,并通过四边形的边长规则以及四边形的角度规则去判断组成的四边是否类似矩形。如图4所示,图4为一种四边形的角度对应关系的示例图。在计算角度或边长的时候由于四个点的顺序不能确定,例如在计算图4中P1对应的角度时需要考虑是计算∠P2P1P3还是∠P2P1P4或者其他情况。因此此处还需要对四个点进行排序,以确保计算出的边长以及角度的正确性。在进行排序时,考虑到输入的四个点有种可能,因此将输入的四个点(无序)P={A,B,C,D}计算中心坐标P,在中心坐标处建立坐标系,并计算每一个点与坐标原点的角度θ={θA,θB,θC,θD}(其中,θ∈[0°,180°]),然后从小到大排序,以得到有顺序的角度序列θ′={θA,θB,θC,θD},因此按照其对应的点得到有序点P′={A,B,C,D}。其中这里的点A、点B、点C、点D分别对应图4中的点P1、点P2、点P3、点P4
可选的,在对四边形的四个点进行排序处理后就可以开始依据相应规则来计算可疑四边形的合理性,其中,这里的四边形的边长规则即指通过边长来计算四边形的面积,并考虑到四边形的面积与二值边缘图像的面积之比,如果该比例值非常小,那么说明该可疑四边形非常小,就算是有实际的目标区域边缘,也应该认为是不合理不存在的,因此可以通过此种情况将合理的可疑四边形筛选出来。另外,这里的四边形的角度规则即指若一个四边形有多接近矩形,那么其四边形中可以构成的三角形就有多接近直角三角形,因此通过四边形中的三角形的角度来判断其可疑四边形的合理性。可选的,如图4所示,首先计算出各个点对应的角度值θ={θ1,θ2,θ3,θ4},其中,θ1对应图4中P1点对应的角度值,其他以此类推。其中,θ1是通过相邻两点P2和P3与P1连线,再根据公式P1P2·P3P4=|P1P2|·|P1P3|·cosθ1计算出来,其余各角的角度值也依据此原理计算得到。可选的,计算出各个角的角度后,再计算出该角的角度概率值:
其中,i∈[1,4],且由四边形的性质可知,θi∈[0°,180°],当存在θi趋近于0°时,则其他角度值也趋近与0°或180°,则Pθ趋近于0;当θi趋近于90°,Pθ趋近于1,因此Pθ∈(0,1]。但从角度观察考虑,当θi大于120°或小于60°时(此时Pθ可能大部分取(0,0.666)),视觉效果较差,得到的四边形大多数情况已经不满足要求,因此可以限定Pθ在区间(0.3,1]范围内认为是合理的,其中的0.3为经验确定。
可选的,在通过边长规则来计算四边形合理性的情况下,首先计算出如图4中的四边形面积SP1,P2,P3,P4,并计算出二值边缘图的面积S=height*width,然后再计算出面积概率值:
其中,该特性决定了四边形的大小,因此通常需要由经验来设定,可选的,该面积概率值Ps的合理区间为[0.015625,1),其中0.015625由经验决定(即对应1/64)。可选的,对于计算SP1,P2,P3,P4,可以将该四边形分解为两个三角形,由于得到的是四个点是计算排序后的有序点,因此很容易将其切分为两个三角形,即可划分为△P1,P2,P4和△P1,P3,P4,再根据海伦公式即可计算出三角形面积从而计算出四边形的面积。根据上述两个规则即可在N大于等于4时,排除掉不合理的四边形。
具体的,排除掉不合理的四边形后,将依据合理值的计算来选出最合理的四边形,并将合理值排名最高的四边形的四个交点确定为目标交点组合。
其中,合理值的计算公式为:
P=λ×Pθ+αPs+βPA
其中,Pθ表示角度概率值,Ps表示面积概率值,PA表示边缘概率值,且上述三个系数满足:
λ+α+β=1
具体的,当Pθ=0或Ps=0或PA=0时,上述合理值P=0,可选的,上述Pθ、Ps存在一定的合理区间(Pθ在区间(0.3,1],Ps的区间为[0.015625,1)),若不在合理区间,则将上述合理值P赋值为0。可选的,合理值P的取值范围理论上为[0,1],这需要视其系数而定,系数根据经验而定,通常可取λ=0.2,α=0.3,β=0.5。
其中,这里的角度概率值与面积概率值的计算公式跟上述是一致的,而边缘概率值为计算边缘所占的比例。因为在实际情况中在通过角度概率值与面积概率值计算合理性时,如图5所示,四边形P0P1P4P3的角度概率值和面积概率值都更大,但其所在直线与目标区域的边缘差别较大,而目标区域边缘对应的四边形P2P4P5P3却是所需要的,因此为了量化此类情况还需加入一个边缘概率值的概念。在计算的过程中,算法会统计边缘像素点的数量,这类边缘像素点指的是区分边缘和非边缘的像素值的个数,如上图中白色实线即为目标神经网络模型所计算出来的边缘,因此,将统计白色实线像素点的数量。
具体的,如图5所示,统计二值边缘图像上所有边缘像素点的数量,设为Smax,再统计四边形各边上边缘像素点的数量,设为S;再由四边形某一顶点出发,沿着某一边顺时针或逆时针前进,每隔固定长度统计一次局部的边缘像素点数量,设为Si,该长度设为2r。从P0点出发,沿P0->P1->P4->P3->P0方向逐渐步在局部点的半径为r范围内统计边缘像素点的数量(要注意,此处亦可以统计距离直线垂直距离r范围内,此时并非是作圆)即有S=∑Si。因为每一步所统计的点都不同,即相同点仅统计一次,因此S≤Smax,即有边缘概率值公式:
其中,该边缘概率值的取值范围为[0,1]通常,该概率值大部分正确情况都不会为1,也不会为0,大多数情况取中间范围,因此该概率值的系数需要偏大一些。
具体的,在计算完上述筛选后的合理四边形后,再计算出上述合理四边形的角度概率值、面积概率值以及边缘概率值后就可以对上述合理四边形进行合理值排序,并将上述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合。
可选的,当N等于3时,此时将不存在合理的四边形,因此可以执行基于寻找合理三角形来确定第四个交点。当N等于3时,基于3个交点确定目标三角形,并基于目标三角形确定角度值最大的第一交点。基于第一交点以及平行四边形规则确定第一交点的对角第二交点,并将目标三角形中的三个交点以及第二交点确定为目标交点组合。或者当N大于等于4时,经过合理值计算后并不存在合理的四边形时,也可以将任意三个点之间组成三角形来寻找合理的三角形,并通过合理的三角形来确定第四个交点进而确定新的合理的四边形。
具体的,将任意三点之间组成三角形,设顶点为A、B、C,其对应的角度就为θA,θB,θC,这里依旧依照四边形的角度规则以及面积规则来寻找合理的三角形,此时角度概率值:
其中,max{θA,θB,θC,}∈[60°,180°),当max{θA,θB,θC,}=90°时为标准三角形,但要注意该值不以90°为中心。max{θA,θB,θC,}>120°的情况存在,且会有少数符合真实场景,可选的,由经验设定max{θA,θB,θC,}∈[60°,150°]认为是合理值,此时Pθ∈[2/3,1]。
其中,此时面积概率值:
其中,height*width为二值边缘图的面积,这里对三角形的面积求取了两倍值,计算的是其对应的平行四边形的面积,因此该面积概率值与前面所提到的四边形的面积概率值类似,可选的,依照经验设定这里的面积概率值范围为[0.015625,1)。
可选的,在筛选出合理三角形后,还需要推测出第四个点。设顶点为A(x0,y0)、B(x1,y1)、C(x2,y2),所需推测的点为D(x3,y3),根据向量规则和平行四边形规则推测第四个点,但前提是先确定角度值最大的点。例如,当点A对应的角度值最大时,可通过向量AB=DC列出等式关系,并求出对应点。即有:
x1-x0=x2-x3
因此,可以得出:
x3=x0+x2-x1
同理:
y3=y0+y2-y1
因此,当知道筛选出合理三角形后基于确定的三角形中的三个点的位置就能推导出第四个点的位置,并将这四个点确定为目标交点组合。
可选的,当N等于2时,确定二值边缘图的中心点位置,基于N个交点确定目标边缘线段,并基于目标边缘线段以及述二值边缘图的中心点位置确定第四交点以及第五交点,将N个交点中的2个交点以及第四交点以及第五交点确定为第一交点组合中的目标交点组合。
具体的,当N等于2时,可以基于两个点确定构成四边形的剩下两个点,因为任意两点必定可以构成一个矩形,但考虑多数情况是三条直线在图像中相交于两点,且该两点所在直线通常为目标区域的边缘,而该两点通常是目标区域边缘的顶点,因此可以以该两点所连线段作为边,并以此计算剩下的两点。基于确定的两点可以推测剩下的两点的延伸方向应当是指向二值边缘图中心,因此需要先确定好二值边缘图的中心。在计算时设设A(x0,y0)、B(x1,y1)、C(x2,y2)、D(x3,y3),即已知A、B两点,C、D为待求,求C点时,根据向量性质:
AB·BC=0
|BC|=L
其中,L为已知量,即预先设定的延伸长度。根据上述两条性质得出关系式:
(x2-x1)2+(y2-y1)2=L2
(x1-x0)×(x2-x1)+(y1-y0)×(y2-y1)=0
其中,该两个等式可求得两组解,C和C’两点。同理,在求取D时,亦能获得两组解。由于延伸方向应当指向中心,因此需要排除另一个解,即保留更靠近中心坐标的解即可。例如在获得两组解(C和C’)后,计算各点到二值边缘图的中心坐标O(width/2,height/2)的距离,设为doc和doc’,当doc,>doc时,此时点C为正解,根据上述方法同理可求得点D的正解。确定好剩下两个点后就可以将此时的四个点确定为目标交点组合。
步骤S207,当N小于等于1时,基于上述二值边缘图的边长以及预设的比例阈值确定确定四个默认交点,并将上述四个默认交点确定为上述第一交点组合中的目标交点组合。
具体的,当确定出的N的数量小于等于1的时候,也就是N等于1或0的时候,此时需要对第一交点组合进行交点校正,虽然此种情况较少,但也需要考虑。可选的,基于上述二值边缘图的边长以及预设的比例阈值确定确定四个默认交点,并将上述四个默认交点确定为上述第一交点组合中的目标交点组合。在进行交点校正的时候直接给予默认的关键点,并返回结果。例如,可以基于二值边缘图的边长以及预设的比例阈值返回(width*0.1,height*0.1)、(width*0.9,height*0.1)、(width*0.1,height*0.9)、(width*0.9,height*0.9)四个交点,并以此四个默认交点确定为目标交点组合。
可选的,在确定上述目标交点组合的时候还可以基于Harris角点检测来实现,此时就不需要使用直线检测检测出直线再通过直线的交点去确定目标交点组合了,因为在一些异常情况下,如果目标神经网络模型检测出的目标区域边缘的断裂部分较多,即线段的连续性不高的时候,仅使用直线检测得到的直线可能效果较差,因此在此种情况下可以使用Harris角点检测来确定目标交点组合。
步骤S208,基于目标交点组合确定待处理图像的目标区域边缘,并返回处理结果。
其中,步骤S208的具体实现过程可以参见上述图2所对应实施例中对步骤S105的描述,这里不作赘述。
在本申请中,通过目标神经网络输出二值边缘图后,可以通过直线检测检测出目标直线组合,并基于目标直线组合的交点确定第一交点组合,再根据第一交点组合中的交点数量确定不同的处理方法,并通过四边形的结构特征规则解决了如何确定目标交点组合的问题,例如提出了角度概率值、面积概率值、边缘概率值的概念,通过上述方法来对四边形进行合理性判断,以筛选出最优的目标交点组合,进而确定出准确性更高的目标区域边缘。同时针对异常情况的处理中,考虑了使用默认点以及推测第三以及第四个点的方法对交点进行校正,可以提升整体方案的准确率以及视觉效果。
请参见图6,图6是本发明实施例提供的一种图像处理装置的结构示意图,如图6所示,该图像处理装置可以包括:获取模块101、输出模块102、检测模块103、第一确定模块104、第二确定模块105;
获取模块101,用于获取待处理图像,待处理图像包含第一处理区域以及第二处理区域;
输出模块102,用于基于目标神经网络模型输出待处理图像的二值边缘图,其中,目标神经网络基于第一处理区域以及第二处理区域合成的样本图训练得到;
检测模块103,用于基于二值边缘图进行直线检测以检测二值边缘图中的直线组合,对直线组合进行重复直线合并以输出二值边缘图中的目标直线组合;
第一确定模块104,用于确定目标直线组合中每任意两条直线在二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定第一交点组合中的目标交点组合;
第二确定模块105,用于基于目标交点组合确定待处理图像的目标区域边缘,并返回处理结果。
其中,获取模块101、输出模块102、检测模块103、第一确定模块104、第二确定模块105的具体功能实现方式请参见图2对应的实施例中的步骤S101-步骤S105,这里不再进行赘述。
请参见图7,是本发明实施例提供的另一种电子装置的结构示意图。如图7所示,所述电子装置1000可以包括:处理器1001,网络接口1004和存储器1005,此外,所述电子装置1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图7所示的电子装置1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序。
应当理解,本发明实施例中所描述电子装置1000可执行前文图2、图3中任一个所对应实施例中对所述图像处理方法的描述,也可执行前文图6所对应实施例中对所述图像处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机可读存储介质,且所述计算机可读存储介质中存储有前文提及的图像处理装置所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图2、图3中任一个所对应实施例中对所述数据操作方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖范围。

Claims (12)

1.一种图像处理方法,其特征在于,包括:
获取待处理图像,所述待处理图像包含第一处理区域以及第二处理区域;
基于目标神经网络模型输出所述待处理图像的二值边缘图,其中,所述目标神经网络是基于所述第一处理区域以及所述第二处理区域合成的样本图训练得到;
基于所述二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,对所述直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合;
确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合;
基于所述目标交点组合确定所述待处理图像的目标区域边缘,并返回处理结果。
2.根据权利要求1所述的图像处理方法,其特征在于,所述第一处理区域为所述待处理图像中的前景图,所述第二处理区域为所述待处理图像中的背景图,所述基于目标神经网络模型输出所述待处理图像的二值边缘图之前,还包括:
获取所述前景图的合集与所述背景图的合集,将所述前景图的合集中的任意一张前景图与所述背景图的合集中的任意一张背景图进行合成,得到训练样本图;
利用所述训练样本图对所述目标神经网络模型进行训练。
3.根据权利要求1所述的图像处理方法,其特征在于,所述基于目标神经网络模型输出所述待处理图像的二值边缘图,包括:
利用所述目标神经网络模型对所述待处理图像进行n次运算,其中,前n-1次运算包括多次卷积+激活和一次池化,第n次运算包括多次卷积+激活,且第一次运算的输入是所述待处理图像,下一次运算的输入是上一次运算的输出;
提取每次运算过程中最后一次卷积+激活得到的一组矩阵;
对n组矩阵分别进行转置卷积,其中,转置卷积后的所述n组矩阵所对应的图像的尺寸相同;
将转置卷积后的所述n组矩阵连接后进行卷积,输出所述待处理图像的二值边缘图。
4.根据权利要求1所述的图像处理方法,其特征在于,所述对所述直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合,包括:
将所述二值边缘图进行直线检测后检测出的直线组合进行极坐标变换,以确定所述直线组合中每任意两条直线的角度之差以及半径之差;
确定预设的角度阈值与半径阈值,将所述直线组合中每任意两条直线的角度之差小于等于角度阈值,以及将所述直线组合中每任意两条直线的半径之差小于等于半径阈值的两条直线合并成同一直线;
输出对所述直线组合进行重复直线合并后的目标直线组合。
5.根据权利要求1、2所述的图像处理方法,其特征在于,所述二值边缘图包含第三处理区域以及第四处理区域,其中,所述第三处理区域为所述二值边缘图的前景图,所述第四处理区域为所述二值边缘图的背景图,所述确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,包括:
基于所述目标直线组合中每任意两条直线确定在所述二值边缘图中的第二交点组合,其中,所述第二交点组合中的交点位于所述二值边缘图中的第三处理区域以及第四处理区域;
将所述第一交点组合中位于所述二值边缘图的第四处理区域的交点进行排除,以确定所述目标直线组合中每任意两条直线在所述二值边缘图的第三处理区域的第三交点组合;
将所述第三交点组合中任意两个交点之间的距离小于等于预设的距离阈值的交点合并为一个交点,以确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合。
6.根据权利要求1所述的方法,其特征在于,所述基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合,包括:
确定所述第一交点组合中交点的个数N,其中,N为大于等于0的正整数;
当N大于等于1时,基于所述第一交点组合中的N个交点确定M个可疑四边形交点组合,其中,M为大于等于0的正整数;
基于四边形的结构特征规则对所述M个可疑四边形交点组合中确定的可疑四边形进行合理值计算,将所述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合,其中,所述四边形的结构特征规则包括四边形的边长规则以及四边形的角度规则。
7.根据权利要求6所述的方法,其特征在于,所述基于四边形的结构特征规则对所述M个可疑四边形交点组合中确定的可疑四边形进行合理值计算,将所述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合,包括:
当N等于3时,基于所述N个交点确定目标三角形,并基于所述目标三角形确定角度值最大的第一交点;
基于所述第一交点以及平行四边形规则确定所述第一交点的对角第二交点,并将所述目标三角形中的三个交点以及第二交点确定为目标交点组合。
8.根据权利要求6所述的方法,其特征在于,所述基于四边形的结构特征规则对所述M个可疑四边形交点组合中确定的可疑四边形进行合理值计算,将所述合理值大于预设的合理值阈值且排名最高的四边形的4个交点确定为目标交点组合,还包括:
当N等于2时,确定所述二值边缘图的中心点位置;
基于所述N个交点确定目标边缘线段,并基于所述目标边缘线段以及所述二值边缘图的中心点位置确定第四交点以及第五交点;
将所述N个交点中的2个交点以及所述第四交点以及第五交点确定为所述第一交点组合中的目标交点组合。
9.根据权利要求6所述的方法,其特征在于,所述基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合,还包括:
当N小于等于1时,基于所述二值边缘图的边长以及预设的比例阈值确定确定四个默认交点,并将所述四个默认交点确定为所述第一交点组合中的目标交点组合。
10.一种图像处理装置,其特征在于,包括:
获取模块,用于获取待处理图像,所述待处理图像包含第一处理区域以及第二处理区域;
输出模块,用于基于目标神经网络模型输出所述待处理图像的二值边缘图,其中,所述目标神经网络基于所述第一处理区域以及所述第二处理区域合成的样本图训练得到;
检测模块,用于基于所述二值边缘图进行直线检测以检测所述二值边缘图中的直线组合,对所述直线组合进行重复直线合并以输出所述二值边缘图中的目标直线组合;
第一确定模块,用于确定所述目标直线组合中每任意两条直线在所述二值边缘图中的第一交点组合,并基于四边形的结构特征规则确定所述第一交点组合中的目标交点组合;
第二确定模块,用于基于所述目标交点组合确定所述待处理图像的目标区域边缘,并返回处理结果。
11.一种电子装置,其特征在于,包括存储器,处理器以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-9中任意一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现权利要求1-9任意一项所述方法的步骤。
CN202211486535.5A 2022-11-24 2022-11-24 一种图像处理方法、装置及存储介质 Pending CN116051581A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211486535.5A CN116051581A (zh) 2022-11-24 2022-11-24 一种图像处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211486535.5A CN116051581A (zh) 2022-11-24 2022-11-24 一种图像处理方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN116051581A true CN116051581A (zh) 2023-05-02

Family

ID=86122582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211486535.5A Pending CN116051581A (zh) 2022-11-24 2022-11-24 一种图像处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116051581A (zh)

Similar Documents

Publication Publication Date Title
CN112884064B (zh) 一种基于神经网络的目标检测与识别方法
CN112348815B (zh) 图像处理方法、图像处理装置以及非瞬时性存储介质
KR102319177B1 (ko) 이미지 내의 객체 자세를 결정하는 방법 및 장치, 장비, 및 저장 매체
CN108520247B (zh) 对图像中的对象节点的识别方法、装置、终端及可读介质
CN110866871A (zh) 文本图像矫正方法、装置、计算机设备及存储介质
CN106845338B (zh) 视频流中行人检测方法与系统
CN112101359B (zh) 文本公式的定位方法、模型训练方法及相关装置
CN113498520B (zh) 文字识别方法、文字识别装置和存储介质
CN111899270A (zh) 卡片边框检测方法、装置、设备及可读存储介质
US20200005078A1 (en) Content aware forensic detection of image manipulations
CN111191582A (zh) 三维目标检测方法、检测装置、终端设备及计算机可读存储介质
CN115578616A (zh) 多尺度物体实例分割模型的训练方法、分割方法和装置
CN114399781A (zh) 文档图像处理方法及装置、电子设备、存储介质
CN115937552A (zh) 一种基于融合手工特征与深度特征的图像匹配方法
CN110516731B (zh) 一种基于深度学习的视觉里程计特征点检测方法及系统
WO2022222036A1 (zh) 车位确定方法及装置
CN114067273A (zh) 一种夜间机场航站楼热成像显著人体分割检测方法
CN112785595B (zh) 目标属性检测、神经网络训练及智能行驶方法、装置
Osuna-Coutiño et al. Structure extraction in urbanized aerial images from a single view using a CNN-based approach
CN112785651A (zh) 用于确定相对位姿参数的方法和装置
CN114511862B (zh) 表格识别方法、装置及电子设备
CN115619678A (zh) 一种图像变形的矫正方法、装置、计算机设备及存储介质
CN116051581A (zh) 一种图像处理方法、装置及存储介质
CN113947529B (zh) 图像增强方法、模型训练方法、构件识别方法及相关设备
CN112699898B (zh) 一种基于多层特征融合的图像方向识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination