CN113780275A - 图像中的目标区域确定方法、装置、存储介质与电子设备 - Google Patents

图像中的目标区域确定方法、装置、存储介质与电子设备 Download PDF

Info

Publication number
CN113780275A
CN113780275A CN202111026363.9A CN202111026363A CN113780275A CN 113780275 A CN113780275 A CN 113780275A CN 202111026363 A CN202111026363 A CN 202111026363A CN 113780275 A CN113780275 A CN 113780275A
Authority
CN
China
Prior art keywords
target area
straight line
image
area
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111026363.9A
Other languages
English (en)
Inventor
邹帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202111026363.9A priority Critical patent/CN113780275A/zh
Publication of CN113780275A publication Critical patent/CN113780275A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本公开提供一种图像中的目标区域确定方法、装置、计算机可读存储介质与电子设备,涉及图像与视频处理技术领域。该图像中的目标区域确定方法包括:获取待处理图像中的模糊目标区域;将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线;根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域。本公开能够提高在图像中确定目标区域的准确性。

Description

图像中的目标区域确定方法、装置、存储介质与电子设备
技术领域
本公开涉及图像与视频处理技术领域,尤其涉及一种图像中的目标区域确定方法、图像中的目标区域确定装置、计算机可读存储介质与电子设备。
背景技术
在图像处理任务中,经常需要从图像中确定目标区域,目标区域一般是指图像中特定目标所在的区域,如文档区域、车辆区域、建筑物区域等。
目前,一些电子设备(如智能手机、数码相机)的拍照或者图像处理应用中具有确定目标区域的功能。然而,由于图像内容存在多样性与复杂性,导致所确定的目标区域的准确性较差。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域技术人员已知的现有技术的信息。
发明内容
本公开提供一种图像中的目标区域确定方法、图像中的目标区域确定装置、计算机可读存储介质与电子设备,进而至少在一定程度上解决相关技术所确定的目标区域的准确性较差的问题。
根据本公开的第一方面,提供一种图像中的目标区域检测方法,包括:获取待处理图像中的模糊目标区域;将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线;根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域。
根据本公开的第二方面,提供一种图像中的目标区域检测装置,包括:模糊目标区域处理模块,被配置为获取待处理图像中的模糊目标区域;候选直线确定模块,被配置为将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线;精确目标区域处理模块,被配置为根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域。
根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的图像中的目标区域确定方法及其可能的实现方式。
根据本公开的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面的图像中的目标区域确定方法及其可能的实现方式。
本公开的技术方案具有以下有益效果:
在模糊目标区域的基础上确定候选直线,并根据候选直线形成的多边形区域确定并输出精确目标区域。一方面,本方案通过获取模糊目标区域锁定目标区域的大致范围,进而再根据该范围内的直线确定精确目标区域,实现了确定目标区域的两阶段处理,提高了目标区域的准确性。另一方面,本方案通过检测候选直线以及对候选直线的处理确定精确目标区域,而直线是图像中较为明显的特征,因此降低了图像内容多样性与复杂性为确定目标区域带来的不利影响,提高了方案的鲁棒性。再一方面,本方案所需的计算量较低,有利于部署在移动终端等轻量化场景中,实用性较高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式中一种系统架构的示意图;
图2示出本示例性实施方式中一种电子设备的结构示意图;
图3示出本示例性实施方式中一种图像中的目标区域确定方法的流程图;
图4示出本示例性实施方式中一种区域选择操作的示意图;
图5示出本示例性实施方式中另一种区域选择操作的示意图;
图6示出本示例性实施方式中模糊目标区域的示意图;
图7示出本示例性实施方式中检测候选直线的流程图;
图8示出本示例性实施方式中直线与模糊目标区域的位置关系示意图;
图9示出本示例性实施方式中根据候选直线确定精确目标区域的流程图;
图10示出本示例性实施方式中通过检测直线来确定精确目标区域的流程图;
图11示出现有技术输出的目标区域图像与本方案输出的目标区域图像对比;
图12示出本示例性实施方式中图像中的目标区域确定方法的示意性流程图;
图13示出本示例性实施方式中一种图像中的目标区域确定装置的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
在图像中确定目标区域,可以进一步将目标区域截取出来并做后续处理。例如,确定图像中的文档区域后,将文档区域截取出来,并进行形状校正处理等,得到矩形的纯文档图像。因此,准确确定图像中的目标区域,是进行后续处理的前提。
本公开的示例性实施方式提供一种图像中的目标区域确定方法。下面结合图1对本示例性实施方式运行环境的系统架构与应用场景进行示例性说明。
图1示出了系统架构的示意图,该系统架构100可以包括终端110与服务器120。其中,终端110可以是智能手机、平板电脑、台式电脑、笔记本电脑等终端设备,服务器120泛指提供本示例性实施方式中图像处理相关服务的后台系统,可以是一台服务器或多台服务器形成的集群。终端110与服务器120之间可以通过有线或无线的通信链路形成连接,以进行数据交互。
终端110可以拍摄待处理图像。如图1所示,终端110可以对实际场景130进行拍照,得到待处理图像140,其中包括键盘、数据线、茶杯、笔、书。此外,终端110也可以通过其他方式获取待处理图像,如用户在相册中选择一张图像作为待处理图像,或者将从互联网上获取的图像作为待处理图像等。
在一种实施方式中,可以由终端110执行图像中的目标区域确定方法。例如,用户使用终端110拍摄待处理图像140后,终端110执行图像中的目标区域确定方法,确定以书为目标对象的区域,截取并输出该区域的图像。
在一种实施方式中,可以由服务器120可以执行图像中的目标区域确定方法。例如,终端110将待处理图像140上传至服务器120,由服务器120执行图像中的目标区域确定方法,确定以书为目标对象的区域,向终端110返回结果。
由上可知,本示例性实施方式中,图像中的目标区域确定方法的执行主体可以是上述终端110或服务器120,本公开对此不做限定。
本公开的示例性实施方式还提供一种用于执行上述方法的电子设备,该电子设备可以是上述终端110或服务器120。一般的,该电子设备可以包括处理器与存储器,存储器用于存储处理器的可执行指令,处理器配置为经由执行可执行指令来执行上述方法。
下面以图2中的移动终端200为例,对该电子设备的构造进行示例性说明。本领域技术人员应当理解,除了特别用于移动目的的部件之外,图2中的构造也能够应用于固定类型的设备。
如图2所示,移动终端200具体可以包括:处理器201、存储器202、总线203、移动通信模块204、天线1、无线通信模块205、天线2、显示屏206、传感器模块207、音频模块208、电源模块209与摄像模块210。
处理器201可以包括一个或多个处理单元,例如:处理器210可以包括AP(Application Processor,应用处理器)、调制解调处理器、GPU(Graphics ProcessingUnit,图形处理器)、ISP(Image Signal Processor,图像信号处理器)、控制器、编码器、解码器、DSP(Digital Signal Processor,数字信号处理器)、基带处理器和/或NPU(Neural-Network Processing Unit,神经网络处理器)等。本示例性实施方式中,图像中的目标区域确定方法可以由AP、GPU或DSP等来执行,当方法涉及到神经网络相关的处理时,可以由NPU来执行,例如NPU可以加载神经网络参数并执行神经网络相关的算法指令。
编码器可以对图像或视频进行编码(即压缩),以减小数据大小,便于存储或发送。解码器可以对图像或视频的编码数据进行解码(即解压缩),以还原出图像或视频数据。移动终端200可以支持一种或多种编码器和解码器。这样,移动终端200可以处理多种编码格式的图像或视频,例如:JPEG(Joint Photographic Experts Group,联合图像专家组)、PNG(Portable Network Graphics,便携式网络图形)、BMP(Bitmap,位图)等图像格式,MPEG(Moving Picture Experts Group,动态图像专家组)1、MPEG2、H.263、H.264、HEVC(HighEfficiency Video Coding,高效率视频编码)等视频格式。
处理器201可以通过总线203与存储器202或其他部件形成连接。
存储器202可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器201通过运行存储在存储器202的指令,执行移动终端200的各种功能应用以及数据处理。存储器202还可以存储应用数据,例如存储图像,视频等文件。
移动终端200的通信功能可以通过移动通信模块204、天线1、无线通信模块205、天线2、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。移动通信模块204可以提供应用在移动终端200上2G、3G、4G、5G等移动通信解决方案。无线通信模块205可以提供应用在移动终端200上的无线局域网、蓝牙、近场通信等无线通信解决方案。
显示屏206用于实现显示功能,如显示用户界面、图像、视频等。传感器模块207用于实现各种感应检测功能,如可以压力传感器、陀螺仪传感器等,以实现触控压力、设备位姿的检测。音频模块208用于实现音频功能,如播放音频,采集语音等。电源模块209用于实现电源管理功能,如为电池充电、为设备供电、监测电池状态等。
摄像模块210可以包括镜头2101、图像传感器2102、光学防抖系统2103等组件。镜头2101用于成像以及调节光路;图像传感器2102用于采集光信号并转换为数字信号,该数字信号可以进一步传输至ISP进行处理;光学防抖系统2103用于稳定镜头2101,以防止成像抖动,提高图像质量。
下面结合图3对本示例性实施方式的图像中的目标区域确定方法进行说明,图3示出了该目标区域确定方法的示例性流程,可以包括:
步骤S310,获取待处理图像中的模糊目标区域;
步骤S320,将待处理图像中位于模糊目标区域内的直线确定为候选直线;
步骤S330,根据候选直线形成的多边形区域,确定待处理图像中的精确目标区域。
其中,模糊目标区域与精确目标区域是待处理图像中针对同一目标对象的局部区域,模糊目标区域的准确性一般较低,精确目标区域的准确性较高。本示例性实施方式可以输出精确目标区域作为最终确定的目标区域。
需要说明的是,本文中的直线是指图像中连续的像素点形成的近似无弯曲的图形,其具有端点,端点一般是直线两端的像素点,即本文中的并不是一般意义上可无限延伸的直线。
基于上述方法,在模糊目标区域的基础上确定候选直线,并根据候选直线形成的多边形区域确定并输出精确目标区域。一方面,本方案通过获取模糊目标区域锁定目标区域的大致范围,进而再根据该范围内的直线确定精确目标区域,实现了确定目标区域的两阶段处理,提高了目标区域的准确性。另一方面,本方案通过检测候选直线以及对候选直线的处理确定精确目标区域,而直线是图像中较为明显的特征,因此降低了图像内容多样性与复杂性为确定目标区域带来的不利影响,提高了方案的鲁棒性。再一方面,本方案所需的计算量较低,有利于部署在移动终端等轻量化场景中,实用性较高。
下面对图3中的每个步骤进行具体说明。
参考图3,在步骤S310中,获取待处理图像中的模糊目标区域。
本公开对于待处理图像的来源不做限定,例如可以是当前拍摄的图像,或者用户从相册中选取的图像,或者用户截屏生成的图像等。
模糊目标区域是较为粗略的目标区域。可以预先确定目标对象,例如用户预先选定某一类物体为目标对象,或者用户在拍照时选定某一类物体为目标对象,或者系统将默认的一类物体作为目标对象等,图像中目标对象所在的局部区域为目标区域。模糊目标区域可以由用户手动确定,也可以有系统自动确定。
在一种实施方式中,上述获取待处理图像中的模糊目标区域,可以包括:
根据接收到的区域选择操作确定模糊目标区域。
其中,区域选择操作是用户输入的,用于确定模糊目标区域的操作。用户拍摄或选取待处理图像后,可以通过区域选择操作确定模糊目标区域。例如,在拍摄待处理图像后,显示待处理图像的编辑界面,或者通过显示提示信息,提示用户已进入待处理图像的可编辑状态,用户通过触控操作或鼠标操作等在图像中选取模糊目标区域。
图4示出了一种区域选择操作的示意图,用户可以在待处理图像中选择三个或三个以上顶点,如可以单击一次确定一个顶点,系统按照用户选择的先后顺序连接这些顶点,形成模糊目标区域。
图5示出了另一种区域选择操作的示意图,用户可以在待处理图像中选择三条或三条以上直线,如可以滑动一次确定一条直线,系统将这些直线围成的区域确定为模糊目标区域。
图4与图5均示出了模糊目标区域为四边形区域,此外也可以是其他形状的区域。图6示出了模糊目标区域为五边形区域、六边形区域或椭圆形区域。应当理解,用户可以通过任意操作方式选择任意形状的区域,作为模糊目标区域。
在一种实施方式中,上述获取待处理图像中的模糊目标区域,可以包括:
检测待处理图像中的全部直线,根据所检测的直线形成的多边形区域确定模糊目标区域。
其中,检测待处理图像中的直线可以通过边缘检测等方式实现,本公开对此不做限定。在检测出待处理图像中的全部直线后,将这些直线进行组合,形成多个多边形区域,从中确定模糊目标区域。示例性的,可以将形状最接近目标对象的多边形区域确定为模糊目标区域,也可以对待处理图像进行目标检测,将检测到的目标对象所在的多边形区域确定为模糊目标区域。
在一种实施方式中,获取模糊目标区域后,为提高模糊目标区域的模糊性,保证目标对象处于模糊目标区域内,可以将模糊目标区域进行扩展。一般的,可以以模糊目标区域的中心点为基准,均匀地向所有方向进行等比例扩展,该比例可以是1.1、1.2等任意预设扩展系数,也可以对不同方向进行不同比例的扩展。举例来说,在确定图4或图5中的四边形模糊目标区域后,将该区域的每个顶点沿该顶点与区域中心点的连线方向向外移动,使得移动后的连线长度为移动前的连线长度的1.1倍,连接移动后的顶点,得到经过扩展的模糊目标区域。
继续参考图3,在步骤S320中,将待处理图像中位于模糊目标区域内的直线确定为候选直线。
其中,候选直线是后续确定精确模糊区域所用的直线。可以建立待处理图像中全部直线的子集,将位于模糊目标区域内的直线加入该子集中,以作为候选直线;也可以对位于模糊目标区域内的直线添加特殊标记,以表示其为候选直线。
在一种实施方式中,参考图7所示,上述将待处理图像中位于模糊目标区域内的直线确定为候选直线,可以包括以下步骤S710与S720:
步骤S710,检测待处理图像中完全位于模糊目标区域内的直线,以确定为候选直线;
步骤S720,检测待处理图像中部分位于模糊目标区域内的直线,当该直线位于模糊目标区域内的部分长度与总长度的比值达到预设比例阈值时,将该直线确定为候选直线。
图8示出了直线AB与模糊目标区域的四种位置关系:
(1)直线AB完全位于模糊目标区域内,即直线AB中的每个点均位于模糊目标区域内,则直线AB是候选直线;
(2)直线AB完全位于模糊目标区域外,即直线AB中的每个点均位于模糊目标区域内,则直线AB不是候选直线;
(3)直线AB的一个端点A位于模糊目标区域内,另一个端点B位于模糊目标区域外,则直线AB与模糊目标区域存在一个交点C,直线AB可被划分为AC与CB两段,AC位于模糊目标区域内,CB位于模糊目标区域外;
(4)直线AB的端点A和B均位于模糊目标区域外,但是直线AB与模糊目标区域相交,则存在两个交点C和D,直线AB可被划分为AC、CD与DB三段,CD位于模糊目标区域内,AC和DB位于模糊目标区域外。
上述情况(3)和(4)是直线部分位于模糊目标区域内的情况,对此,可以计算直线位于模糊目标区域内的部分长度与总长度的比值,例如在情况(3)中计算AC/AB,在情况(4)中计算CD/AB。当该比值大于或等于预设比例阈值时,视为该直线位于模糊目标区域内,将该直线确定为候选直线。预设比例阈值可以根据经验、实际场景等确定,如可以是0.5。例如,图8的情况(3)中,AC/AB>0.5,则直线AB是候选直线;情况(4)中,CD/AB<0.5,则直线AB不是候选直线。
在一种实施方式中,可能存在直线与模糊目标区域相切的情况,相切即指直线与模糊目标区域的边界重合,可以认为重合的部分位于模糊目标区域内,通过图7的方法步骤判断其是否为候选直线。
由于模糊目标区域带有一定的模糊性,某些实际属于目标区域的直线可能部分地位于模糊目标区域外,通过图7所示的方法步骤,可以将这些直线纳入到候选直线中,有利于提高目标区域的准确性。
继续参考图3,在步骤S330中,根据候选直线形成的多边形区域,确定待处理图像中的精确目标区域。
本示例性实施方式中,确定精确目标区域,实际上是在候选直线中寻找精确目标区域的边界线。在步骤S320中将位于模糊目标区域内的直线作为候选直线,通常包括非边界线,因此不同候选直线可以形成多个多边形区域,进而在其中确定精确目标区域。
在一种实施方式中,参考图9所示,上述根据候选直线形成的多边形区域,确定待处理图像中的精确目标区域,可以包括以下步骤S910与S920:
步骤S910,根据候选直线形成一个或多个多边形区域。
一般的,多条候选直线存在封闭相交的关系,即可形成一个多边形区域。举例来说,四条候选直线中,直线1与直线2相交,直线2与直线3相交,直线3与直线4相交,则四条候选直线围成一个四边形区域。
由于图像内容的不确定性以及图像中可能存在的噪点等缺陷的影响,两条实际相交的候选直线可能在待处理图像中未严格相交(如在相交处存在图像模糊)的情况。对此,在一种实施方式中,可以将候选直线适当延伸,例如可以按照1.1、1.2等长度比例对候选直线两端进行延伸,并根据延伸后的候选直线形成封闭的多边形区域。
在一种实施方式中,上述根据候选直线形成一个或多个多边形区域,可以包括以下步骤:
从候选直线中获取多个直线组合;
如果直线组合中的候选直线满足预设位置关系,则删除该直线组合;
将每个直线组合形成对应的一个多边形区域。
其中,每个直线组合中候选直线的数量可以根据目标对象的预设形状来确定。举例来说,预先获取目标对象的类别,假设为书本类,书本一般为四边形,则确定目标对象的预设形状为四边形。也就是说,需要确定的多边形区域可以是四边形区域;相应的,每个直线组合中候选直线的数量为4。应当理解,由于拍摄角度以及图像内容的不确定性,目标对象的预设形状不限于一种形状,如可以包括三角形、四边形与五边形,则每个直线组合中候选直线的数量可以是3、4或5。
根据上述每个直线组合中候选直线的数量,对候选直线进行任意组合,得到多个直线组合,例如在步骤S320中确定6条候选直线,预设每个直线组合中候选直线的数量为4,则可以得到
Figure BDA0003243468080000101
个直线组合。
上述直线组合中可能存在无法有效形成多边形区域的直线组合,可以通过直线组合中的候选直线是否满足预设位置关系来进行判断,本示例性实施方式中,候选直线满足预设位置关系表示该直线组合无法有效形成多边形区域,进而需要将该直线组合删除。预设位置关系可以根据经验、实际场景来确定,针对不同形状的多边形区域,可以设置不同的预设位置关系。
下面以多边形区域是四边形区域为例说明。如上所述,每个直线组合包括四条候选直线。在一种实施方式中,上述如果直线组合中的候选直线满足预设位置关系,可以包括以下两方面条件:
如果直线组合中的至少三条候选直线平行,则显然该直线组合中的四条候选直线无法围成四边形区域,删除该直线组合;
如果直线组合中存在两条相交的候选直线其夹角超出预设范围,则删除该直线组合。其中,预设范围是指多边形区域的正常角度范围,可以根据经验、实际场景来确定,如可以是[30,150]。如果两条相交的候选直线的夹角超出预设范围,说明该直线组合中的四条候选直线围成的四边形区域会存在较为严重的形变,因此可以删除该直线组合。
应当理解,可以仅采用上述任一方面条件,例如仅采用上述第一方面的条件时,仅需要判断直线组合中是否存在至少三条候选直线平行,无需判断是否存在两条相交的候选直线的夹角超出预设范围;也可以同时采用上述两方面条件,即判断直线组合中存在至少三条候选直线平行或者存在两条相交的候选直线的夹角超出预设范围时,删除该直线组合。
通过对直线组合进行筛选,能够减少直线组合以及所形成的多边形区域的数量,降低后续的计算量,提高效率。
步骤S920,将面积最大的多边形区域确定为精确目标区域。
一般的,面积最大的多边形区域覆盖目标对象的概率最高,因此将其作为精确目标区域,具有较高的可靠性。
在一种实施方式中,也可以计算每个多边形区域与模糊目标区域的面积交并比,将面积交并比最大的多边形区域确定为精确目标区域。
图10示出了通过检测候选直线确定精确目标区域的示意图。首先获取待处理图像与模糊目标区域;然后检测待处理图像中的直线;接下来将位于模糊目标区域内的直线确定为候选直线;最后根据候选直线确定精确目标区域。
在一种实施方式中,在根据接收到的区域选择操作确定所述模糊目标区域前,图像中的目标区域确定方法还可以包括以下步骤:
在待处理图像中检测初始目标区域;
当初始目标区域不满足预设条件时,执行根据接收到的区域选择操作确定模糊目标区域。
其中,初始目标区域可以是系统在无模糊目标区域这一信息的情况下所自动检测的目标区域。本公开对于检测初始目标区域的具体方式不做限定。例如,可以通过预先训练的机器学习模型(如目标检测网络、语义分割网络)检测待处理图像中的目标对象,输出目标对象所在的区域信息,以得到初始目标区域;也可以检测出待处理图像中的全部直线,将这些直线进行组合以形成多个多边形区域,从中确定初始目标区域,如将形状最接近目标对象的多边形区域确定为初始目标区域,等等。
在一种实施方式中,可以在待处理图像中检测目标对象,如通过目标检测网络、语义分割网络等进行检测,得到目标对象的区域;进而根据位于目标对象的区域内的直线,确定初始目标区域。具体实现方式可以参考步骤S330,根据这些直线形成一个或多个多边形区域,在其中确定一个初始目标区域。
预设条件是衡量初始目标区域是否准确的条件,可以根据经验、实际场景来确定,本公开对其具体内容不做限定。
在一种实施方式中,初始目标区域不满足预设条件,可以包括:针对初始目标区域的用户反馈信息为不接受。具体来说,在检测初始目标区域后可以进行显示,并显示是否接受的选项信息以供用户选择,用户可以观看初始目标区域后选择是否接受,用户选择的信息即为用户反馈信息,用户反馈信息为不接受,表示初始目标区域不满足预设条件,即初始目标区域不准确。
在一种实施方式中,初始目标区域不满足预设条件,可以包括:初始目标区域的图像包含目标对象的概率小于预设概率阈值。预设概率阈值用于衡量初始目标区域的图像中是否包含目标对象,如可以是70%等经验数值。可以通过预先训练的机器学习模型(如分类网络或回归模型)检测初始目标区域的图像中包含目标对象的概率,当其小于预设概率阈值时,表示初始目标区域不满足预设条件,即初始目标区域不准确。
当初始目标区域不满足预设条件时,可以显示待处理图像的编辑界面,或者通过显示提示信息,提示用户已进入待处理图像的可编辑状态,用户通过触控操作或鼠标操作等输入区域选择操作,在待处理图像中选择模糊目标区域。区域选择操作可以参考上述图4或图5的相关内容。进一步的,可以执行图3的方法步骤,以确定精确目标区域。
在一种实施方式中,图像中的目标区域确定方法还可以包括以下步骤:
当初始目标区域满足预设条件时,将初始目标区域作为精确目标区域。
例如,针对初始目标区域的用户反馈信息为接受,或者初始目标区域的图像包含目标对象的概率大于或等于预设概率阈值,表示初始目标区域不满足预设条件,即初始目标区域准确。此时可以直接将初始目标区域作为精确目标区域进行输出,无需再执行图3的方法步骤,从而节约算力资源,提高效率。
在确定精确目标区域后,可以输出精确目标区域的信息,如可以输出精确目标区域在待处理图像中的掩膜(mask),也可以截取精确目标区域的图像并进行输出。
在一种实施方式中,可以从待处理图像中截取精确目标区域的图像,并将其校正为矩形图像加以输出。图11示出了现有技术所输出的图像与本方案所输出的目标区域图像的对比。可以看出,现有技术中,由于所确定的目标区域不准确,其中包含了目标对象(书)以外的背景图像内容,截取出目标区域图像并进行校正后,虽然将图像校正为矩形,但目标对象存在较为明显的形状畸变;相比之下,本方案所确定的目标区域较为准确,对截取的目标区域图像进行校正,等同于对目标对象进行校正,因此最终输出的图像效果较好。
图12示出了图像中的目标区域确定方法的示意性流程,包括:
步骤S1210,输入待处理图像;
步骤S1220,在待处理图像中确定初始目标区域;
步骤S1230,判断初始目标区域是否满足预设条件,若是,则执行步骤S1240,若否,则执行步骤S1250;
步骤S1240,将初始目标区域作为精确目标区域,并继续执行步骤S1280;
步骤S1250,放弃初始目标区域,由用户通过输入区域选择操作来选择模糊目标区域;
步骤S1260,将待处理图像中位于模糊目标区域内的直线确定为候选直线;
步骤S1270,根据候选直线形成的多边形区域确定精确目标区域;
步骤S1280,输出精确目标区域,由此完成在待处理图像中确定目标区域的流程。
本公开的示例性实施方式还提供一种图像中的目标区域检测装置。参考图13所示,该图像中的目标区域检测装置1300可以包括:
模糊目标区域处理模块1310,被配置为获取待处理图像中的模糊目标区域;
候选直线确定模块1320,被配置为将待处理图像中位于模糊目标区域内的直线确定为候选直线;
精确目标区域处理模块1330,被配置为根据候选直线形成的多边形区域,确定待处理图像中的精确目标区域。
在一种实施方式中,候选直线确定模块1320,被配置为:
检测待处理图像中完全位于模糊目标区域内的直线,以确定为候选直线;
检测待处理图像中部分位于模糊目标区域内的直线,当直线位于模糊目标区域内的部分长度与总长度的比值达到预设比例阈值时,将直线确定为候选直线。
在一种实施方式中,精确目标区域处理模块1330,被配置为:
根据候选直线形成一个或多个多边形区域;
将面积最大的多边形区域确定为精确目标区域。
在一种实施方式中,上述根据候选直线形成一个或多个多边形区域,可以包括:
从候选直线中获取多个直线组合;
如果直线组合中的候选直线满足预设位置关系,则删除直线组合;
将每个直线组合形成对应的一个多边形区域。
在一种实施方式中,上述多边形区域为四边形区域,直线组合包括四条候选直线;上述如果直线组合中的候选直线满足预设位置关系,则删除直线组合,可以包括:
如果直线组合中的至少三条候选直线平行,则该删除直线组合;及/或
如果直线组合中存在两条相交的候选直线其夹角超出预设范围,则删除该直线组合。
在一种实施方式中,模糊目标区域处理模块1310,被配置为:
根据接收到的区域选择操作确定模糊目标区域。
在一种实施方式中,模糊目标区域处理模块1310,被配置为:
在待处理图像中检测初始目标区域;
当初始目标区域不满足预设条件时,执行根据接收到的区域选择操作确定模糊目标区域。
在一种实施方式中,精确目标区域处理模块1330,还被配置为:
当初始目标区域满足预设条件时,将初始目标区域作为精确目标区域。
在一种实施方式中,上述初始目标区域不满足预设条件,可以包括:
针对初始目标区域的用户反馈信息为不接受。
上述装置中各部分的具体细节在方法部分实施方式中已经详细说明,未披露的细节内容可以参见方法部分的实施方式内容,因而不再赘述。
本公开的示例性实施方式还提供了一种计算机可读存储介质,可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。在一种可选的实施方式中,该程序产品可以实现为便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在电子设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。

Claims (12)

1.一种图像中的目标区域检测方法,其特征在于,包括:
获取待处理图像中的模糊目标区域;
将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线;
根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域。
2.根据权利要求1所述的方法,其特征在于,所述将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线,包括:
检测所述待处理图像中完全位于所述模糊目标区域内的直线,以确定为候选直线;
检测所述待处理图像中部分位于所述模糊目标区域内的直线,当所述直线位于所述模糊目标区域内的部分长度与总长度的比值达到预设比例阈值时,将所述直线确定为候选直线。
3.根据权利要求2所述的方法,其特征在于,所述根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域,包括:
根据所述候选直线形成一个或多个多边形区域;
将面积最大的所述多边形区域确定为所述精确目标区域。
4.根据权利要求3所述的方法,其特征在于,所述根据所述候选直线形成一个或多个多边形区域,包括:
从所述候选直线中获取多个直线组合;
如果所述直线组合中的所述候选直线满足预设位置关系,则删除所述直线组合;
将每个所述直线组合形成对应的一个所述多边形区域。
5.根据权利要求4所述的方法,其特征在于,所述多边形区域为四边形区域,所述直线组合包括四条所述候选直线;所述如果所述直线组合中的所述候选直线满足预设位置关系,则删除所述直线组合,包括:
如果所述直线组合中的至少三条所述候选直线平行,则删除所述直线组合;及/或
如果所述直线组合中存在两条相交的所述候选直线其夹角超出预设范围,则删除所述直线组合。
6.根据权利要求1所述的方法,其特征在于,所述获取待处理图像中的模糊目标区域,包括:
根据接收到的区域选择操作确定所述模糊目标区域。
7.根据权利要求6所述的方法,其特征在于,在根据接收到的区域选择操作确定所述模糊目标区域前,所述方法还包括:
在所述待处理图像中检测初始目标区域;
当所述初始目标区域不满足预设条件时,执行根据接收到的区域选择操作确定所述模糊目标区域。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当所述初始目标区域满足所述预设条件时,将所述初始目标区域作为所述精确目标区域。
9.根据权利要求7所述的方法,其特征在于,所述初始目标区域不满足预设条件,包括:
针对所述初始目标区域的用户反馈信息为不接受。
10.一种图像中的目标区域检测装置,其特征在于,包括:
模糊目标区域处理模块,被配置为获取待处理图像中的模糊目标区域;
候选直线确定模块,被配置为将所述待处理图像中位于所述模糊目标区域内的直线确定为候选直线;
精确目标区域处理模块,被配置为根据所述候选直线形成的多边形区域,确定所述待处理图像中的精确目标区域。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9任一项所述的方法。
12.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至9任一项所述的方法。
CN202111026363.9A 2021-09-02 2021-09-02 图像中的目标区域确定方法、装置、存储介质与电子设备 Pending CN113780275A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111026363.9A CN113780275A (zh) 2021-09-02 2021-09-02 图像中的目标区域确定方法、装置、存储介质与电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111026363.9A CN113780275A (zh) 2021-09-02 2021-09-02 图像中的目标区域确定方法、装置、存储介质与电子设备

Publications (1)

Publication Number Publication Date
CN113780275A true CN113780275A (zh) 2021-12-10

Family

ID=78840848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111026363.9A Pending CN113780275A (zh) 2021-09-02 2021-09-02 图像中的目标区域确定方法、装置、存储介质与电子设备

Country Status (1)

Country Link
CN (1) CN113780275A (zh)

Similar Documents

Publication Publication Date Title
CN108038422B (zh) 摄像装置、人脸识别的方法及计算机可读存储介质
CN111598776B (zh) 图像处理方法、图像处理装置、存储介质与电子设备
CN113096185B (zh) 视觉定位方法、视觉定位装置、存储介质与电子设备
CN112270755B (zh) 三维场景构建方法、装置、存储介质与电子设备
CN112767295A (zh) 图像处理方法、图像处理装置、存储介质与电子设备
CN110855957B (zh) 图像处理方法及装置、存储介质和电子设备
CN112802033B (zh) 图像处理方法及装置、计算机可读存储介质和电子设备
CN113920195A (zh) 距离检测方法、控制方法、装置、存储介质与电子设备
CN112767294A (zh) 深度图像的增强方法、装置、电子设备以及存储介质
CN115222974A (zh) 特征点匹配方法及装置、存储介质及电子设备
CN114494942A (zh) 视频分类方法及装置、存储介质及电子设备
CN113205011A (zh) 图像掩膜确定方法及装置、存储介质和电子设备
CN113312949B (zh) 视频数据处理方法、视频数据处理装置和电子设备
CN113780275A (zh) 图像中的目标区域确定方法、装置、存储介质与电子设备
CN115379128A (zh) 曝光控制方法及装置、计算机可读介质和电子设备
CN112861687B (zh) 用于门禁系统的口罩佩戴检测方法、装置、设备和介质
CN114627014A (zh) 图像处理方法、图像处理装置、存储介质与电子设备
CN114240750A (zh) 视频分辨率提升方法及装置、存储介质及电子设备
CN114612341A (zh) 图像畸变校正方法及装置、计算机可读介质和电子设备
CN113658073A (zh) 图像去噪处理方法、装置、存储介质与电子设备
CN113409209A (zh) 图像去模糊方法、装置、电子设备与存储介质
US8571334B2 (en) Image compression device, image compression method, and image compression program
CN113781336B (zh) 图像处理的方法、装置、电子设备与存储介质
CN114612324B (zh) 用于畸变校正的图像处理方法、装置、介质与电子设备
CN112911186B (zh) 图像存储方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination