CN109034136A - 图像处理方法、装置、摄像设备及存储介质 - Google Patents

图像处理方法、装置、摄像设备及存储介质 Download PDF

Info

Publication number
CN109034136A
CN109034136A CN201811039245.XA CN201811039245A CN109034136A CN 109034136 A CN109034136 A CN 109034136A CN 201811039245 A CN201811039245 A CN 201811039245A CN 109034136 A CN109034136 A CN 109034136A
Authority
CN
China
Prior art keywords
interest
area
frame picture
present frame
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811039245.XA
Other languages
English (en)
Other versions
CN109034136B (zh
Inventor
杨文龙
P·尼古拉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ecarx Hubei Tech Co Ltd
Original Assignee
Hubei Ecarx Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Ecarx Technology Co Ltd filed Critical Hubei Ecarx Technology Co Ltd
Priority to CN201811039245.XA priority Critical patent/CN109034136B/zh
Publication of CN109034136A publication Critical patent/CN109034136A/zh
Application granted granted Critical
Publication of CN109034136B publication Critical patent/CN109034136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/588Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Abstract

本发明实施例提出了一种图像处理方法、装置、摄像设备及存储介质,涉及图像处理领域,该方法包括:确定出当前帧图片中的路面区域;提取当前帧图片中的感兴趣区域,其中,感兴趣区域中包含有路面区域;判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值;当感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率,其中,调整后的分辨率小于调整前的分辨率;依据预设的深度学习模型对调整分辨率后的感兴趣区域进行处理。本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。

Description

图像处理方法、装置、摄像设备及存储介质
技术领域
本发明涉及图像处理领域,具体而言,涉及一种图像处理方法、装置、摄像设备及存储介质。
背景技术
在辅助驾驶及自动驾驶等领域,需要进行物体检测、交通红绿灯识别、可行驶区域检测等视觉检测任务,但是受制于处理器计算量及功耗的限制,无法将图像原图直接送到模型中去处理,一般都需要降低图片的分辨率后(比如一般1080P的图片都要缩小到416x416大小的图片,才能够实时处理)再对图片进行处理。
并且,随着摄像头分辨率的增减增大,目前大于等于800万像素的摄像头慢慢开始流行,可以极大的拓宽视觉算法可以检测的距离和精度,但是这会给处理器的处理性能带来更大的压力。
发明内容
本发明的目的在于提供一种图像处理方法、装置、摄像设备及存储介质,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种图像处理方法,所述方法包括:确定出当前帧图片中的路面区域;提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
第二方面,本发明实施例提供了一种图像处理装置,所述装置包括:路面区域识别模块,用于确定出当前帧图片中的路面区域;感兴趣区域提取模块,用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;判断模块,用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;分辨率调整模块,用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;图像处理模块,用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
第三方面,本发明实施例提供了一种摄像设备,所述摄像设备包括存储器,用于存储一个或多个程序;处理器。当所述一个或多个程序被所述处理器执行时,实现上述的图像处理方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的图像处理方法。
相对于现有技术,本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1示出了本发明实施例所提供的一种摄像设备的一种示意性结构图;
图2示出了本发明实施例所提供的一种图像处理方法的一种示意性流程图;
图3为辅助驾驶时摄像设备拍摄的图片示意图;
图4为图2中步骤S100的子步骤的一种示意性流程图;
图5为语义分割示意图;
图6为图2中步骤S200的子步骤的一种示意性流程图;
图7为感兴趣区域的提取步骤示意图;
图8为多个子兴趣区域的生成示意图;
图9示出了本发明实施例所提供的一种图像处理装置的一种示意性结构图;
图10示出了本发明实施例所提供的一种图像处理装置的路面区域识别模块的一种示意性结构图;
图11示出了本发明实施例所提供的一种图像处理装置的感兴趣区域提取模块的一种示意性结构图。
图中:10-摄像设备;110-存储器;120-处理器;130-存储控制器;140-外设接口;150-射频单元;160-通讯总线/信号线;170-摄像单元;200-图像处理装置;210-路面区域识别模块;211-语义分割处理单元;212-路面区域确定单元;220-感兴趣区域提取模块;221-感兴趣区域选定单元;222-感兴趣区域更新单元;230-判断模块;240-分辨率调整模块;250-图像处理模块;260-子兴趣区域生成模块;270-目标兴趣区域确定模块;280-图像融合模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
基于上述现有技术的缺陷,本发明实施例所提供的一种改进方式为:提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理。
请参阅图1,图1示出了本发明实施例所提供的一种摄像设备10的一种示意性结构图,在本发明实施例中,所述摄像设备10包括存储器110、存储控制器130,一个或多个(图中仅示出一个)处理器120、外设接口140、射频单元150、摄像单元170等。这些组件通过一条或多条通讯总线/信号线160相互通讯。
存储器110可用于存储软件程序以及模组,如本发明实施例所提供的图像处理装置200对应的程序指令/模组,处理器120通过运行存储在存储器110内的软件程序以及模组,从而执行各种功能应用以及图像处理,如本发明实施例所提供的图像处理方法。
其中,所述存储器110可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器120可以是一种集成电路芯片,具有信号处理能力。上述的处理器120可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)、语音处理器以及视频处理器等;还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器120也可以是任何常规的处理器等。
外设接口140将各种输入/输入装置耦合至处理器120以及存储器110。在一些实施例中,外设接口140,处理器120以及存储控制器130可以在单个芯片中实现。在本发明其他的一些实施例中,他们还可以分别由独立的芯片实现。
射频单元150用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。
摄像单元170用于拍摄照片,以使处理器120对拍摄的照片进行处理。
可以理解,图1所示的结构仅为示意,摄像设备10可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参阅图2,图2示出了本发明实施例所提供的一种图像处理方法的一种示意性流程图,在本发明实施例中,该图像处理方法包括以下步骤:
步骤S100,确定出当前帧图片中的路面区域。
目前在视频检测领域,高像素图片都是经过调整降低图片的分辨率后,整图送到预设的深度学习模型中进行图像处理,但实际上针对辅助驾驶的情况,深度学习模型处理的图片中,包含有大片区域的无用信息。
比如,请参阅图3,图3为辅助驾驶时摄像设备10拍摄的图片示意图,在辅助驾驶过程中,实际上只有图3下半部分中路面区域包含的信息对汽车的辅助驾驶是有用的,上半部分中天空区域包含的信息对汽车的辅助驾驶是无用的,因此,在辅助驾驶过程中,实际上如图3中上半部分的天空是不需要进行处理的。
因此,在本发明实施例中,首先确定出当前帧图片中的路面区域,进而确定出当前帧图片中包含有对辅助驾驶有用信息的区域。
可选地,作为一种实施方式,确定出当前帧图片中的路面区域的方式可以为:根据当前帧图片中每个像素点各自的坐标以及每个像素点各自的像素值大小,来区别出当前帧图片中的天空区域及路面区域;或者是,还可以采用kmeans等聚类分析算法进行路面区域的识别。
可选地,作为另一种实施方式,确定出当前帧图片中的路面区域还可以采用语义分割的技术实现。请参阅图4,图4为图2中步骤S100的子步骤的一种示意性流程图,在本发明实施例中,步骤S100包括以下子步骤:
子步骤S110,得到当前帧图片的语义分割结果。
目前,语义分割(Full-Resolution Residual Networks,FRRN)技术广泛应用于自动驾驶及辅助驾驶领域。图像语义分割的目的是为了处理设备能够自动分割并识别图像中的内容,比如,请参阅图5,图5为语义分割示意图,图5(1)为原图,图5(2)为语义分割得到的结果示意图,将原图5(1)中的天空、路面、车辆以及建设等采用不同的色彩来表示,进而得到图5(2)的语义分割结果示意图。
同理,在确定出当前帧图片的路面区域时,首先依据摄像设备10中预设的语义分割算法,得到当前帧图片的语义分割结果。
子步骤S120,依据上一帧图片中的语义分割结果,确定出当前帧图片的语义分割结果中的路面区域。
可以理解,在摄像设备10中,还存储有上一帧图片的语义分割结果,上一帧图片的语义分割结果为摄像设备10按照预设的语义分割算法对上一帧图片进行处理时所得到的结果。
摄像设备10依据上一帧图片的语义分割结果,能够获悉语义分割结果中各自用于表示天空、路面、车辆以及建设等的色彩。相应地,依据上一帧图片的语义分割结果,即表示天空、路面、车辆以及建设等各自的色彩,即可在当前帧图片的语义分割结果中,确定出当前帧图片中的路面区域。
步骤S200,提取当前帧图片中的感兴趣区域。
如上所述,在辅助驾驶时,摄像设备10拍摄的当前帧图片中,路面区域为包含的有对辅助驾驶有用信息的区域,因此,摄像设备10依据路面区域,提取当前帧图片中的感兴趣区域(region of interest,ROI)。
可选地,作为一种实施方式,请参阅图6,图6为图2中步骤S200的子步骤的一种示意性流程图,在本发明实施例中,步骤S200包括以下子步骤:
子步骤S210,依据预设的生成方式,选定路面区域占当前帧图片中的所有区域作为感兴趣区域。
在提取当前帧图片中的感兴趣区域时,在当前帧图片中,按照预设的生成方式,选定路面区域占当前帧图片中的所有区域作为感兴趣区域。
例如,请参阅图7,图7为感兴趣区域的提取步骤示意图,在图7(1)所示的示意图中,利用矩形框,在当前帧图片中选定所有的路面区域,即矩形框的范围内必须包含有所有的路面区域,进而将矩形框所包含的所有区域作为感兴趣区域。
可选地,作为一种实施方式,步骤S200还包括以下子步骤:
子步骤S220,依据预设的缩放比例调整感兴趣区域的范围,以更新感兴趣区域。
为了排除车辆或者是建筑等障碍物遮挡造成路面区域被缩小的情况,对获取到的感兴趣区域,采用预设的缩放比例来调整感兴趣区域的范围,以对感兴趣区域做冗余处理,进而更新感兴趣区域,确保路面区域完全被感兴趣区域所包围,进而确保能够覆盖住路面区域上出现的车辆高度。
比如,图7(2)即为在图7(1)的基础上,将选取感兴趣区域的矩形框按照预设的缩放比例扩大(比如说扩大10%)后的结果,图7(2)所示的感兴趣区域为在图7(1)所示的感兴趣区域的基础上进行冗余处理的结果,再将图7(2)的感兴趣区域进行剪切处理,即得到如图7(3)所示的用于深度学习模型进行处理的图像数据。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过将感兴趣区域按照预设的缩放比例进行调整更新的方式进行冗余处理,确保路面区域完全被感兴趣区域所包围。
步骤S300,判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值?当为是时,执行步骤S413;当为否时,执行步骤S421。
在当前帧图片中存在有大面积的遮挡时,比如摄像设备10前方有一辆大卡车或者是其他的障碍物时,可能会导致摄像设备10所拍摄到的路面区域很小,比如路面区域完全被遮挡等,进而导致所得到的感兴趣区域较小,影响深度学习模型对感兴趣区域的检测精度。
因此,在得到当前帧图片中的感兴趣区域后,依据感兴趣区域和当前帧图片各自的范围大小,判断感兴趣区域的范围占当前帧图片的比例是否大于第一预设值。当感兴趣区域的范围占当前帧图片的比例大于第一预设值时,表征感兴趣区域在当前帧图片上所占的区域足够大,能够满足深度学习模型对感兴趣区域的检测精度要求,此时执行步骤S413;反之,当感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,表征感兴趣区域在当前帧图片上所占的区域比较小,不能够满足深度学习模型对感兴趣区域的检测精度要求,此时即执行步骤S421。
步骤S413,调整感兴趣区域的分辨率。
在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,摄像设备10即判定感兴趣区域在当前帧图片上所占的区域足够大,此时,即调整感兴趣区域的分辨率,以将调整分辨率后的感兴趣区域输入到预设的深度学习模型中进行检测处理,其中,感兴趣区域调整后的分辨率小于调整前的分辨率。
步骤S414,依据预设的深度学习模型对调整分辨率后的感兴趣区域进行处理。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源。
作为一种实施方式,请继续参阅图2,在本发明实施例中,在执行步骤S413之前,该图像处理方法还包括以下步骤:
步骤S411,依据感兴趣区域,按照预设的缩放方式生成多个子兴趣区域。
由于在选取感兴趣区域时,是直接按照路面区域的范围进行选取得到的,但路面区域上存在的目标检测物体(比如说其他的汽车等)距离辅助驾驶汽车较远,这就导致目标检测物体在感兴趣区域上所占范围较小,成为“小物体”,导致目标检测物体的识别精度下降,从而使摄像设备10可能识别不出来“小物体”。
因此,对于提取到的感兴趣区域,按照预设的缩放方式,先生成多个子兴趣区域,其中,该多个子兴趣区域具有相同的缩放点。
比如,请参阅图8,图8为多个子兴趣区域的生成示意图,最外层的矩形框所包围的区域为选取的感兴趣区域,将路面两边的边线进行延伸后得到的交点作为缩放点,再按照预设的缩放方式,比如按照不同的缩放比例连续缩放最外层的矩形框,得到多个矩形框,每个矩形框各自所包围的区域均为一个子兴趣区域。
当然,可以理解,在本发明实施例其他的一些实施方式中,还可以采用其他的方式选定缩放点,比如现在感兴趣区域一条边线的中点或者是端点等,只要能够确定出缩放点即可,比如,缩放点还可以为预设的固定点或者是中点再往上调整一定的距离得到。
步骤S412,确定出多个子兴趣区域中的目标子兴趣区域。
在依据感兴趣区域得到多个子兴趣区域后,再根据摄像设备10所需要检测的目标检测物体,在多个子兴趣区域中确定出目标子兴趣区域,进而以该目标子兴趣区域作为步骤S413中用于调整分辨率的感兴趣区域,其中,目标子兴趣区域为多个子兴趣区域中包含有目标检测物体的最小区域。
可选地,作为一种实施方式,确定多个子兴趣区域中的目标子兴趣区域的方式可以为:遍历所有的子兴趣区域,找到所有识别出目标检测物体的子兴趣区域作为备选子兴趣区域,然后在所有备选子兴趣区域中,根据识别目标检测物体的目标识别框与每个子兴趣区域的交叠区域占目标识别框的比例大小,选定目标子兴趣区域。比如说,在备选子兴趣区域中相邻的两个子兴趣区域中,当目标识别框被较小的子兴趣区域完全包围时,则以较小的子兴趣区域作为目标子兴趣区域;当目标识别框没有被较小的子兴趣区域完全包围,且目标识别框与较小的子兴趣区域存在交叠区域,并且交叠区域占目标识别框的比例大于第二预设值,则此时选择相邻的两者中较小的子兴趣区域作为目标子兴趣区域;而当标识别框没有被较小的子兴趣区域完全包围,且目标识别框与较小的子兴趣区域存在交叠区域,并且交叠区域占目标识别框的比例小于或等于第二预设值时,则选择相邻的两者中较大的子兴趣区域作为目标子兴趣区域。
基于上述设计,本发明实施例所提供的一种图像处理方法,通过在以预设的缩放方式将感兴趣区域缩放后得到的多个子兴趣区域中确定出的目标子兴趣区域作为图像处理的感兴趣区域,使得目标检测物体在感兴趣区域中的像素比例得到放大,提高了目标检测物体的检测识别率。
请继续参阅图2,在本发明实施例中,当依据步骤S300判定感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,该图像处理方法还包括以下步骤:
步骤S421,调整当前帧图片的分辨率。
也就是说,当依据步骤S300判定感兴趣区域的范围占当前帧图片的比例小于或等于第一预设值时,则摄像设备10判定感兴趣区域在当前帧图片上所占的区域范围比较小,此时即以当前帧图片整体作为感兴趣区域,调整当前帧图片的分辨率,以将调整分辨率后的当前帧图片输入到预设的深度学习模型中进行检测处理,其中,调整后的分辨率小于调整前的分辨率。
步骤S422,依据预设的深度学习模型对调整分辨率后的当前帧图片进行处理。
上述步骤S414中依据预设的深度学习模型进行处理的感兴趣区域仅为当前帧图片的一部分,但由于摄像设备10展示给用户的图片一般为完整的当前帧图片,并且在目标物体连续追踪时,也需要连续的完整图片来进行追踪,因此,作为一种实施方式,请继续参阅图2,在本发明实施例中,该图像处理方法还包括以下步骤:
步骤S500,恢复处理后的感兴趣区域的分辨率至调整前的分辨率。
步骤S600,将恢复分辨率后的感兴趣区域与当前帧图片融合。
恢复分辨率后的感兴趣区域与当前帧图片的分辨率相同,此时,将恢复分辨率后的感兴趣区域与当前帧图片进行融合后,即可实现连续的多帧图像中对目标检测物体的连续识别。也就是说,摄像设备10在对图像进行处理的过程中,从第一帧图片到第N帧图片的处理过程中,在处理第一帧图片时,即将由第一帧图片中提取出来的感兴趣区域融合回第一帧图片中;从第N帧图片中提取出来的感兴趣区域则融合回第N帧图片中。即:由那一帧图片提取出的感兴趣区域,则将提取出的感兴趣区域融合回相应的那一帧图片中。
请参阅图9,图9示出了本发明实施例所提供的一种图像处理装置200的一种示意性结构图,在本发明实施例中,该图像处理装置200包括路面区域识别模块210、感兴趣区域提取模块220、判断模块230、分辨率调整模块240及图像处理模块250。
路面区域识别模块210用于确定出当前帧图片中的路面区域。
可选地,作为一种实施方式,请参阅图10,图10示出了本发明实施例所提供的一种图像处理装置200的路面区域识别模块210的一种示意性结构图,在本发明实施例中,该路面区域识别模块210包括语义分割处理单元211及路面区域确定单元212。
语义分割处理单元211用于得到所述当前帧图片的语义分割结果。
路面区域确定单元212用于依据上一帧图片中的语义分割结果,确定出所述当前帧图片的语义分割结果中的路面区域。
请继续参阅图9,感兴趣区域提取模块220用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域。
可选地,作为一种实施方式,请参阅图11,图11示出了本发明实施例所提供的一种图像处理装置200的感兴趣区域提取模块220的一种示意性结构图,在本发明实施例中,该感兴趣区域提取模块220包括感兴趣区域选定单元221及感兴趣区域更新单元222。
感兴趣区域选定单元221用于依据预设的生成方式,选定所述路面区域占所述当前帧图片中的所有区域作为感兴趣区域。
感兴趣区域更新单元222用于依据预设的缩放比例调整所述感兴趣区域的范围,以更新所述感兴趣区域。
请继续参阅图9,判断模块230用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值。
分辨率调整模块240用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率。
图像处理模块250用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
作为一种实施方式,请继续参阅图9,所述分辨率调整模块240还用于,当所述感兴趣区域的范围占所述当前帧图片的比例小于或等于所述第一预设值时,调整所述当前帧图片的分辨率。
所述图像处理模块250还用于依据预设的深度学习模型对所述调整分辨率后的当前帧图片进行处理。
作为一种实施方式,请继续参阅图9,该图像处理装置200还包括子兴趣区域生成模块260及目标兴趣区域确定模块270。
子兴趣区域生成模块260用于依据所述感兴趣区域,按照预设的缩放方式生成多个子兴趣区域,其中,所述多个子兴趣区域具有相同的缩放点。
目标兴趣区域确定模块270用于确定出所述多个子兴趣区域中的目标子兴趣区域,其中,所述目标子兴趣区域为所述多个子兴趣区域中包含有目标检测物体的最小区域,且所述目标子兴趣区域为所述调整所述感兴趣区域的分辨率的步骤中的子兴趣区域。
作为一种实施方式,请继续参阅图9,在本发明实施例中,该图像处理装置200还包括图像融合模块280。
所述分辨率调整模块240还用于恢复所述处理后的感兴趣区域的分辨率至所述调整前的分辨率。
所述图像融合模块280用于将所述恢复分辨率后的感兴趣区域与所述当前帧图片融合。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本发明实施例所提供的一种图像处理方法、装置、摄像设备及存储介质,通过提取获得当前帧图片中的感兴趣区域,并在判定感兴趣区域的范围占当前帧图片的比例大于第一预设值时,调整感兴趣区域的分辨率后送入到预设的深度学习模型中进行处理,相比于现有技术,能够减小在处理高分辨率图片时的计算量,提升计算速度,节约计算资源;还通过在以预设的缩放方式将感兴趣区域缩放后得到的多个子兴趣区域中确定出的目标子兴趣区域作为图像处理的感兴趣区域,使得目标检测物体在感兴趣区域中的像素比例得到放大,提高了目标检测物体的检测识别率;还通过将感兴趣区域按照预设的缩放比例进行调整更新的方式进行冗余处理,确保路面区域完全被感兴趣区域所包围。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其它的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种图像处理方法,其特征在于,所述方法包括:
确定出当前帧图片中的路面区域;
提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;
判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;
当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;
依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
2.如权利要求1所述的方法,其特征在于,所述确定出当前帧图片中的路面区域的步骤,包括:
得到所述当前帧图片的语义分割结果;
依据上一帧图片中的语义分割结果,确定出所述当前帧图片的语义分割结果中的路面区域。
3.如权利要求1所述的方法,其特征在于,所述提取所述当前帧图片中的感兴趣区域的步骤,包括:
依据预设的生成方式,选定所述路面区域占所述当前帧图片中的所有区域作为感兴趣区域。
4.如权利要求3所述的方法,其特征在于,所述提取所述当前帧图片中的感兴趣区域的步骤,还包括:
依据预设的缩放比例调整所述感兴趣区域的范围,以更新所述感兴趣区域。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述感兴趣区域的范围占所述当前帧图片的比例小于或等于所述第一预设值时,调整所述当前帧图片的分辨率;
依据预设的深度学习模型对所述调整分辨率后的当前帧图片进行处理。
6.如权利要求1所述的方法,其特征在于,在所述调整所述感兴趣区域的分辨率的步骤之前,所述方法还包括:
依据所述感兴趣区域,按照预设的缩放方式生成多个子兴趣区域,其中,所述多个子兴趣区域具有相同的缩放点;
确定出所述多个子兴趣区域中的目标子兴趣区域,其中,所述目标子兴趣区域为所述多个子兴趣区域中包含有目标检测物体的最小区域,且所述目标子兴趣区域为所述调整所述感兴趣区域的分辨率的步骤中的子兴趣区域。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
恢复所述处理后的感兴趣区域的分辨率至所述调整前的分辨率;
将所述恢复分辨率后的感兴趣区域与所述当前帧图片融合。
8.一种图像处理装置,其特征在于,所述装置包括:
路面区域识别模块,用于确定出当前帧图片中的路面区域;
感兴趣区域提取模块,用于提取所述当前帧图片中的感兴趣区域,其中,所述感兴趣区域中包含有所述路面区域;
判断模块,用于判断所述感兴趣区域的范围占所述当前帧图片的比例是否大于第一预设值;
分辨率调整模块,用于当所述感兴趣区域的范围占所述当前帧图片的比例大于所述第一预设值时,调整所述感兴趣区域的分辨率,其中,所述调整后的分辨率小于所述调整前的分辨率;
图像处理模块,用于依据预设的深度学习模型对所述调整分辨率后的感兴趣区域进行处理。
9.一种摄像设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN201811039245.XA 2018-09-06 2018-09-06 图像处理方法、装置、摄像设备及存储介质 Active CN109034136B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811039245.XA CN109034136B (zh) 2018-09-06 2018-09-06 图像处理方法、装置、摄像设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811039245.XA CN109034136B (zh) 2018-09-06 2018-09-06 图像处理方法、装置、摄像设备及存储介质

Publications (2)

Publication Number Publication Date
CN109034136A true CN109034136A (zh) 2018-12-18
CN109034136B CN109034136B (zh) 2021-07-20

Family

ID=64623889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811039245.XA Active CN109034136B (zh) 2018-09-06 2018-09-06 图像处理方法、装置、摄像设备及存储介质

Country Status (1)

Country Link
CN (1) CN109034136B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871814A (zh) * 2019-02-22 2019-06-11 成都旷视金智科技有限公司 年龄的估计方法、装置、电子设备和计算机存储介质
CN110490910A (zh) * 2019-08-13 2019-11-22 顺丰科技有限公司 目标检测方法、装置、电子设备及存储介质
CN110572579A (zh) * 2019-09-30 2019-12-13 联想(北京)有限公司 图像处理方法、装置及电子设备
CN111311547A (zh) * 2020-01-20 2020-06-19 北京航空航天大学 一种超声图像分割装置及超声图像分割方法
CN111461104A (zh) * 2019-01-22 2020-07-28 北京京东尚科信息技术有限公司 视觉识别方法、装置、设备及存储介质
CN111612726A (zh) * 2019-02-26 2020-09-01 广州慧睿思通信息科技有限公司 图像数据筛选方法、装置、计算机设备和存储介质
CN112702568A (zh) * 2020-12-14 2021-04-23 广东荣文科技集团有限公司 异常检测方法及相关装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120062769A1 (en) * 2010-03-30 2012-03-15 Sony Corporation Image processing device and method, and program
CN102831617A (zh) * 2012-07-17 2012-12-19 聊城大学 一种运动目标检测与跟踪的方法和系统
US20150065850A1 (en) * 2013-09-04 2015-03-05 Siemens Corporation Accurate and efficient polyp detection in wireless capsule endoscopy images
CN105512649A (zh) * 2016-01-22 2016-04-20 大连楼兰科技股份有限公司 一种基于颜色空间的高清视频实时车牌定位方法
CN106682409A (zh) * 2016-12-20 2017-05-17 上海联影医疗科技有限公司 采样方法及放射治疗计划优化方法、剂量计算方法
CN106897993A (zh) * 2017-01-12 2017-06-27 华东师范大学 基于定量磁化率成像人脑灰质核团概率图谱的构建方法
CN107066990A (zh) * 2017-05-04 2017-08-18 厦门美图之家科技有限公司 一种目标跟踪方法及移动设备
CN107292304A (zh) * 2017-06-02 2017-10-24 国芯科技(北京)有限公司 一种感兴趣区域确定的方法及装置
CN107944351A (zh) * 2017-11-07 2018-04-20 深圳市易成自动驾驶技术有限公司 图像识别方法、装置及计算机可读存储介质
CN108230355A (zh) * 2017-06-14 2018-06-29 北京市商汤科技开发有限公司 目标跟踪及神经网络训练方法、装置、存储介质和电子设备
CN108307113A (zh) * 2018-01-26 2018-07-20 北京图森未来科技有限公司 图像采集方法、图像采集控制方法及相关装置
CN108427951A (zh) * 2018-02-08 2018-08-21 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质和计算机设备
CN108460787A (zh) * 2018-03-06 2018-08-28 北京市商汤科技开发有限公司 目标跟踪方法和装置、电子设备、程序、存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120062769A1 (en) * 2010-03-30 2012-03-15 Sony Corporation Image processing device and method, and program
CN102831617A (zh) * 2012-07-17 2012-12-19 聊城大学 一种运动目标检测与跟踪的方法和系统
US20150065850A1 (en) * 2013-09-04 2015-03-05 Siemens Corporation Accurate and efficient polyp detection in wireless capsule endoscopy images
CN105512649A (zh) * 2016-01-22 2016-04-20 大连楼兰科技股份有限公司 一种基于颜色空间的高清视频实时车牌定位方法
CN106682409A (zh) * 2016-12-20 2017-05-17 上海联影医疗科技有限公司 采样方法及放射治疗计划优化方法、剂量计算方法
CN106897993A (zh) * 2017-01-12 2017-06-27 华东师范大学 基于定量磁化率成像人脑灰质核团概率图谱的构建方法
CN107066990A (zh) * 2017-05-04 2017-08-18 厦门美图之家科技有限公司 一种目标跟踪方法及移动设备
CN107292304A (zh) * 2017-06-02 2017-10-24 国芯科技(北京)有限公司 一种感兴趣区域确定的方法及装置
CN108230355A (zh) * 2017-06-14 2018-06-29 北京市商汤科技开发有限公司 目标跟踪及神经网络训练方法、装置、存储介质和电子设备
CN107944351A (zh) * 2017-11-07 2018-04-20 深圳市易成自动驾驶技术有限公司 图像识别方法、装置及计算机可读存储介质
CN108307113A (zh) * 2018-01-26 2018-07-20 北京图森未来科技有限公司 图像采集方法、图像采集控制方法及相关装置
CN108427951A (zh) * 2018-02-08 2018-08-21 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质和计算机设备
CN108460787A (zh) * 2018-03-06 2018-08-28 北京市商汤科技开发有限公司 目标跟踪方法和装置、电子设备、程序、存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
NISHANT SHRIVASTAVA ET AL: "Content based image retrieval based on relative locations of multiple regions of interest using selective regions matching", 《INFORMATION SCIENCES》 *
卢胜男: "复杂交通视频场景中的车辆轨迹提取及行为分析", 《中国博士学位论文全文数据库 信息科技辑》 *
李松泽: "《基于深度学习的车道线检测系统的设计与实现》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈秀梅等: "基于Curvelet变换和SPIHT算法的医学图像感兴趣区压缩", 《中国医学影像学杂志》 *
鲁书喜等: "《基于感兴趣区域的空域分辨率可调整方法》", 《平顶山学院学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461104A (zh) * 2019-01-22 2020-07-28 北京京东尚科信息技术有限公司 视觉识别方法、装置、设备及存储介质
CN111461104B (zh) * 2019-01-22 2024-04-09 北京京东乾石科技有限公司 视觉识别方法、装置、设备及存储介质
CN109871814A (zh) * 2019-02-22 2019-06-11 成都旷视金智科技有限公司 年龄的估计方法、装置、电子设备和计算机存储介质
CN111612726A (zh) * 2019-02-26 2020-09-01 广州慧睿思通信息科技有限公司 图像数据筛选方法、装置、计算机设备和存储介质
CN110490910A (zh) * 2019-08-13 2019-11-22 顺丰科技有限公司 目标检测方法、装置、电子设备及存储介质
CN110572579A (zh) * 2019-09-30 2019-12-13 联想(北京)有限公司 图像处理方法、装置及电子设备
CN111311547A (zh) * 2020-01-20 2020-06-19 北京航空航天大学 一种超声图像分割装置及超声图像分割方法
CN112702568A (zh) * 2020-12-14 2021-04-23 广东荣文科技集团有限公司 异常检测方法及相关装置
CN112702568B (zh) * 2020-12-14 2023-11-24 广东荣文科技集团有限公司 异常检测方法及相关装置

Also Published As

Publication number Publication date
CN109034136B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN109034136A (zh) 图像处理方法、装置、摄像设备及存储介质
Wei et al. Multi-vehicle detection algorithm through combining Harr and HOG features
CN112132156B (zh) 多深度特征融合的图像显著性目标检测方法及系统
CN110163188B (zh) 视频处理以及在视频中嵌入目标对象的方法、装置和设备
CN111696080B (zh) 一种基于静态纹理的人脸欺诈检测方法、系统及存储介质
Xing et al. Traffic sign recognition using guided image filtering
CN110956081A (zh) 车辆与交通标线位置关系的识别方法、装置及存储介质
CN110706235A (zh) 一种基于双级级联分割的远红外行人检测方法
CN113657409A (zh) 车辆损失检测方法、装置、电子设备及存储介质
Kim et al. Robust facial landmark extraction scheme using multiple convolutional neural networks
CN112016519A (zh) 一种基于Hard Triple的车辆重识别方法及系统
US20120189161A1 (en) Visual attention apparatus and control method based on mind awareness and display apparatus using the visual attention apparatus
CN108647605B (zh) 一种结合全局颜色与局部结构特征的人眼凝视点提取方法
JP5201184B2 (ja) 画像処理装置及びプログラム
CN111199199B (zh) 一种基于自适应上下文区域选取的动作识别方法
Jain et al. A hybrid approach for detection and recognition of traffic text sign using MSER and OCR
Gornale et al. Detection and classification of signage’s from random mobile videos using local binary patterns
CN111311601A (zh) 一种拼接图像的分割方法及装置
CN115115947A (zh) 遥感图像检测方法、装置、电子设备以及存储介质
CN115100469A (zh) 一种基于分割算法的目标属性识别方法、训练方法和装置
JP6467817B2 (ja) 画像処理装置、画像処理方法、およびプログラム
Chandra et al. A review of various techniques used in the implementation of lane departure and road detection
Das et al. Bag of feature approach for vehicle classification in heterogeneous traffic
JP2017228297A (ja) テキスト検出方法および装置
Revathi et al. Indian sign board recognition using image processing techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220323

Address after: 430090 No. b1336, chuanggu startup area, taizihu cultural Digital Creative Industry Park, No. 18, Shenlong Avenue, Wuhan Economic and Technological Development Zone, Hubei Province

Patentee after: Yikatong (Hubei) Technology Co.,Ltd.

Address before: 430000 no.c101, chuanggu start up area, taizihu cultural Digital Industrial Park, No.18 Shenlong Avenue, Wuhan Economic and Technological Development Zone, Hubei Province

Patentee before: HUBEI ECARX TECHNOLOGY Co.,Ltd.