CN109657643A - 一种图像处理方法及装置 - Google Patents

一种图像处理方法及装置 Download PDF

Info

Publication number
CN109657643A
CN109657643A CN201811640344.3A CN201811640344A CN109657643A CN 109657643 A CN109657643 A CN 109657643A CN 201811640344 A CN201811640344 A CN 201811640344A CN 109657643 A CN109657643 A CN 109657643A
Authority
CN
China
Prior art keywords
image
processed
region
information
object region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811640344.3A
Other languages
English (en)
Inventor
闫泳杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811640344.3A priority Critical patent/CN109657643A/zh
Publication of CN109657643A publication Critical patent/CN109657643A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种图像处理方法及装置,方法包括:获取待处理图像,待处理图像为车辆行车前方的场景图像;确定待处理图像中的目标图像区域;将目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,目标图像为待处理图像裁剪掉目标图像区域后保留的图像。本发明提供的图像处理方法,在端到端模型训练或者预测过程中,电子设备可以将采集的图像进行裁剪,使得用于训练或者预测的图像中数据量减少,从而缩短训练或者预测过程的耗时,提升端到端模型训练或者预测的效率。

Description

一种图像处理方法及装置
技术领域
本发明涉及汽车技术领域,尤其涉及一种图像处理方法及装置。
背景技术
自动驾驶汽车是通过ECU(Electronic Control Unit,电子控制单元)等车载终端设备,对车辆中各个部分进行精准的控制与计算分析,从而实现车辆的全自动运行,达到车辆无人驾驶的目的。随着深度学习的迅速发展以及人工智能的深入研究,通过端到端的深度学习实现自动驾驶便是自动驾驶领域的一个主要研究方向。
现有的自动驾驶过程中,通常是通过车辆的车头前方的单目相机或者双目相机采集图像,再将采集的图像输入至端到端模型,从而获取预测数据,车载终端设备通过获取的预测数据控制车辆自动行驶。但是,由于通常采集的图像中数据量较大,导致端到端模型获取预测数据的耗时较长,从而降低了端到端模型的预测效率。
发明内容
本发明实施例提供一种图像处理方法及装置,以解决目前因端到端模型的输入图像的数据量较大,而导致预测效率低的问题。
第一方面,本发明实施例提供了一种图像处理方法,包括:
获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
确定所述待处理图像中的目标图像区域;
将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
第二方面,本发明实施例还提供了一种图像处理装置,包括:
图像获取模块,用于获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
图像区域确定模块,用于确定所述待处理图像中的目标图像区域;
裁剪模块,用于将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
第三方面,本发明实施例还提供了一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述图像处理方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述图像处理方法的步骤。
本发明实施例,通过获取待处理图像,待处理图像为车辆行车前方的场景图像;确定待处理图像中的目标图像区域;将目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,目标图像为待处理图像裁剪掉目标图像区域后保留的图像。这样,在端到端模型训练或者预测过程中,电子设备可以将采集的图像进行裁剪,使得用于训练或者预测的图像中数据量减少,从而缩短训练或者预测过程的耗时,提升端到端模型训练或者预测的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的图像处理方法的流程示意图;
图2是本发明实施例提供的目标图像之一;
图3是本发明实施例提供的目标图像之二;
图4是本发明实施例提供的目标图像之三;
图5是本发明实施例提供的目标图像之四;
图6是本发明实施例提供的图像处理装置的结构示意图之一;
图7是本发明实施例提供的图像区域确定模块的结构示意图;
图8是本发明实施例提供的图像区域确定单元的结构示意图之一;
图9是本发明实施例提供的图像区域确定单元的结构示意图之二;
图10是本发明实施例提供的图像处理装置的结构示意图之二;
图11是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种图像处理方法的流程图,如图1所示,包括以下步骤:
步骤101、获取待处理图像,待处理图像为车辆行车前方的场景图像;
步骤102、确定待处理图像中的目标图像区域;
步骤103、将目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,目标图像为待处理图像裁剪掉目标图像区域后保留的图像。
这里,在端到端模型训练或者预测过程中,电子设备可以将采集的图像进行裁剪,使得用于训练或者预测的图像中数据量减少,从而缩短训练或者预测过程的耗时,提升端到端模型训练或者预测的效率。
需要说明的是,上述电子设备可以包括车载终端或者除车载终端设备之外的其他设备,如远程服务器等。
本发明实施例中,在上述步骤101中,获取待处理图像,可以是:在电子设备为车载终端的情况下,车载终端在车辆行驶过程中采集到行车前方的场景图像作为上述待处理图像;或者,在电子设备为远程服务器等其他设备的情况下,接收车载终端发送的待处理图像,该待处理图像为车载终端在车辆行驶过程中采集到行车前方的场景图像。
其中,上述待处理图像可以是在模型训练过程中,车辆在测试路线上行驶过程中采集到的图像,在此情况下对待处理图像裁剪后得到的目标图像用于模型训练;或者,上述待处理图像也可以是车辆在自动驾驶过程中采集到的实时图像,在此情况下对待处理图像裁剪后得到的图像用于输入端到端模型,以输出预测数据,使车载终端通过预测数据对车辆的行驶状态进行控制。
需要说明的是,上述待处理图像可以是通过设置于车辆的车头的一个或者多个相机采集,由于图像采集过程为本领域技术人员熟知,在此并不进行赘述。
本发明实施例中,上述步骤102中,在获取到待处理图像之后,电子设备可以根据预设规则,确定待处理图像中满足要求的目标图像区域。
应当说明的是,由于上述目标图像区域为需要裁剪的图像区域,且裁剪后保留的目标图像用于端到端模型训练或者预测,为避免因裁剪图像而导致端到端模型训练或者预测的准确性降低,本发明实施例中的目标图像区域为与训练结果或者预测结果存在弱相关性的图像区域,即该目标图像区域被裁剪后,训练结果或者预测结果的准确性可以满足要求,如高于预测准确率等。
其中,上述目标图像区域可以是上述待处理图像中的任意弱相关性的图像区域,例如:其可以是处于待处理图像左侧、右侧、上侧或者下侧的图像区域,或者,也可以是处于待处理图像的中间部分的弱相关性的图像区域,等等,在此并不进行限定。
上述确定待处理图像中的目标图像区域,可以是将待处理图像中的预设大小和预设位置的图像区域确定为目标图像区域,例如:由于用于采集图像的相机位置固定,因而采集的图像中车头的图像的位置和大小始终保持不变,而车头的图像通常为待处理图像中的弱相关性图像,可以设定采集的图像下侧高度为H1的图像区域21为目标图像区域,如图2所示。
需要说明的是,上述预设大小和预设位置的确定,可以是通过反复多次测试或者训练得到,以确保确定的目标图像区域的图像为弱相关性图像,从而可以提升端到端模型训练或者预测过程中的准确性。
可选的,上述步骤102包括:获取所述待处理图像中的第一信息,其中,所述第一信息包括道路信息和/或车头参照信息;确定与所述第一信息对应的目标图像区域。
这里,由于道路信息以及车头参照信息可以影响到端到端模型训练或者预测的结果,电子设备可以根据待处理图像中的道路信息和/车头参照信息,确定目标图像区域,从而可以提升端到端模型的训练结果或者预测结果的准确性。
其中,上述获取待处理图像中的第一信息,可以是通过图像识别技术获取,或者也可以是根据操作人员的标注信息获取,且上述道路信息可以包括车辆前方道路的宽度、延伸长度以及道路轮廓等信息;上述车头参照信息可以包括车头的宽度、长度以及车头轮廓等信息,在此并不进行限定。
另外,上述确定与所述第一信息对应的目标图像区域,可以是根据预设规则,将待处理图像中与第一信息对应的图像区域确定为目标图像区域。
例如:以上述第一信息为道路信息为例,可以是根据道路信息确定行车前方道路的最远位置所处的地平面,并将处于该地平面以上的图像所在的图像区域确定为上述目标图像区域,即如图3中高度为H2的图像区域31;或者,以上述第一信息为车头参照信息为例,可以是检测到待处理图像中车头的轮廓线,并在待处理图像中确定与车头的轮廓线平行且间隔预设距离的第一轮廓线,并将待处理图像中由第一轮廓线向远离车头的方向的图像区域确定为上述目标图像区域,即如图4中所示的图像区域41。
可选的,上述确定与第一信息对应的目标图像区域,包括:基于第一信息,确定待处理图像中车辆行车道路的宽度方向;在高度方向上,将待处理图像的顶部与目标高度值对应的图像区域确定为目标图像区域,其中,高度方向垂直于宽度方向,且高度方向由待处理图像中的车头指向待处理图像的边缘。
这里,通过将待处理图像在高度方向上的顶部与目标高度值对应的图像区域确定为目标图像区域,从而可以使待处理图像在宽度方向上的图像信息保留更完整,进而可以进一步提升模型训练或者预测的准确性。
其中,上述基于第一信息,确定待处理图像中车辆行车道路的宽度方向,以第一信息为上述道路信息为例,可以将垂直于道路延伸方向的方向确定为上述宽度方向;或者,以上述第一信息为上述车头参照信息为例,由于行车过程中车头通常可以保持与道路所在平面平行,因而可以将车头宽度延伸的方向确定为上述宽度方向。
另外,上述目标高度值可以是预先设定的高度值,也可以是电子设备实时获取的高度值。
可选的,上述在高度方向上,将待处理图像的顶部与目标高度值对应的图像区域确定为目标图像区域之前,方法还包括:检测待处理图像中拍摄场景为天空的图像区域,并获取图像区域在高度方向上的目标高度值。
这里,由于天空的图像中的数据与模型训练或者预测的结果的相关性弱,电子设备可以通过将天空的图像所在的图像区域在高度方向的高度值确定为上述目标高度值,例如:如图5所示的高度值H3为目标高度值,且高度值H3对应的图像区域51为目标图像区域,进一步降低裁剪目标图像区域对于训练结果或者预测结果的影响,从而提升端到端模型的训练或者预测的准确性。
其中,上述检测待处理图像中拍摄场景为天空的图像区域,可以是通过图像处理技术对待处理图像进行图像分割,得到多个图像区域,并获取各图像区域的平均灰度值,由于天空的灰度值通常变化较小,因而天空图像的灰度值通常处于某一预设灰度值范围,在此可以将待处理图像中平均灰度值处于预设灰度值范围的图像区域确定为上述天空的图像区域;或者,在上述待处理图像为三维图像的情况下,电子设备可以获取待处理图像的景深数据,由于图像中天空的图像的景深值通常较大,也可以将待处理图像中平均景深值大于预设阈值的图像区域确定为上述天空的图像区域,等等。
需要说明的是,本发明实施例中所述的图像识别技术以及图像处理技术,为本领域技术人员所熟知,在此并不进行赘述。
在上述步骤103中,在电子设备确定目标图像区域之后,电子设备可以将目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像。另外,在得到目标图像之后,电子设备还可以对目标图像进行缩放,以进一步提升端到端模型的训练或者预测的效率。
应当说明的是,上述对目标图像进行缩放,可以是使缩放后的目标图像的宽高比与缩放前的宽高比保持一致,或者缩放后的目标图像的宽高比也可以是发生改变,在此并不进行限定。
另外,在上述步骤103之后,电子设备还可以通过目标图像进行端到端模型的训练或者预测,例如:在端到端模型的训练过程中,可以获取目标图像中的图像数据,并将图像数据输入端到端模型进行训练,得到自动驾驶模型;而在端到端模型的预测过程中,此时端到端模型是指训练后的自动驾驶模型,则可以将目标图像作为端到端模型的输入,从而输出预测数据,以实现自动驾驶。
可选的,上述将目标图像区域裁剪,得到目标图像之后,还包括:将目标图像输入至端到端模型,并输出N组预测数据,其中,N组预测数据为N个不同时刻的预测数据。
这里,电子设备可以通过输入一幅图像获取多个不同时刻的预测结果,从而降低预测的频率以及耗时,进一步提升预测效率。
其中,上述通过输入一幅图像获取N组预测数据,可以设置端到端模型的主网络具有N路输出,从而当输入一幅图像时,端到端模型的每一路输出均可以获取一组预测数据,而上述设置端到端模型的主网络具有N路输出为本领域技术人员熟知,在此并不进行赘述。
本发明实施例中,通过获取待处理图像,待处理图像为车辆行车前方的场景图像;确定待处理图像中的目标图像区域;将目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,目标图像为待处理图像裁剪掉目标图像区域后保留的图像。这样,在端到端模型训练或者预测过程中,电子设备可以将采集的图像进行裁剪,使得用于训练或者预测的图像中数据量减少,从而缩短训练或者预测过程的耗时,提升端到端模型训练或者预测的效率。
参见图6,图6是本发明实施例提供的图像处理装置的结构图,如图6所示,图像处理装置600包括:
图像获取模块601,用于获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
图像区域确定模块602,用于确定所述待处理图像中的目标图像区域;
裁剪模块603,用于将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
可选的,如图7所示,所述图像区域确定模块602,包括:
信息获取单元6021,用于获取所述待处理图像中的第一信息,其中,所述第一信息包括道路信息和/或车头参照信息;
图像区域确定单元6022,用于确定与所述第一信息对应的目标图像区域。
可选的,如图8所示,所述图像区域确定单元6022,包括:
宽度方向确定子单元60221,用于基于所述第一信息,确定所述待处理图像中车辆行车道路的宽度方向;
图像区域确定子单元60222,用于在高度方向上,将所述待处理图像的顶部与目标高度值对应的图像区域确定为所述目标图像区域,其中,所述高度方向垂直于所述宽度方向,且所述高度方向由所述待处理图像中的车头指向所述待处理图像的边缘。
可选的,如图9所示,所述图像区域确定单元6022,还包括:
高度值获取子单元60223,用于检测所述待处理图像中拍摄场景为天空的图像区域,并获取所述图像区域在所述高度方向上的所述目标高度值。
可选的,如图10所示,所述图像处理装置600,还包括:
预测模块604,用于将所述目标图像输入至所述端到端模型,并输出N组预测数据,其中,所述N组预测数据为N个不同时刻的预测数据。
本发明实施例提供的图像处理装置600能够实现图1中方法实施例中电子设备实现的各个过程,为避免重复,这里不再赘述。
图11为实现本发明各个实施例的一种电子设备的硬件结构示意图。
该电子设备1100包括但不限于:射频单元1101、网络模块1102、音频输出单元1103、输入单元1104、传感器1105、显示单元1106、用户输入单元1107、接口单元1108、存储器1109、处理器1110、以及电源1111等部件。本领域技术人员可以理解,图11中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,处理器1110,用于:
获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
确定所述待处理图像中的目标图像区域;
将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
可选的,处理器1110,具体用于:
获取所述待处理图像中的第一信息,其中,所述第一信息包括道路信息和/或车头参照信息;
确定与所述第一信息对应的目标图像区域。
可选的,处理器1110,具体用于:
基于所述第一信息,确定所述待处理图像中车辆行车道路的宽度方向;
在高度方向上,将所述待处理图像的顶部与目标高度值对应的图像区域确定为所述目标图像区域,其中,所述高度方向垂直于所述宽度方向,且所述高度方向由所述待处理图像中的车头指向所述待处理图像的边缘。
可选的,处理器1110,具体用于:
检测所述待处理图像中拍摄场景为天空的图像区域,并获取所述图像区域在所述高度方向上的所述目标高度值。
可选的,处理器1110,还用于:
将所述目标图像输入至所述端到端模型,并输出N组预测数据,其中,所述N组预测数据为N个不同时刻的预测数据。
应理解的是,本发明实施例中,射频单元1101可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器1110处理;另外,将上行的数据发送给基站。通常,射频单元1101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元1101还可以通过无线通信系统与网络和其他设备通信。
电子设备通过网络模块1102为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元1103可以将射频单元1101或网络模块1102接收的或者在存储器1109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元1103还可以提供与电子设备1100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元1103包括扬声器、蜂鸣器以及受话器等。
输入单元1104用于接收音频或视频信号。输入单元1104可以包括图形处理器(Graphics Processing Unit,GPU)11041和麦克风11042,图形处理器11041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元1106上。经图形处理器11041处理后的图像帧可以存储在存储器1109(或其它存储介质)中或者经由射频单元1101或网络模块1102进行发送。麦克风11042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元1101发送到移动通信基站的格式输出。
电子设备1100还包括至少一种传感器1105,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板11061的亮度,接近传感器可在电子设备1100移动到耳边时,关闭显示面板11061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器1105还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元1106用于显示由用户输入的信息或提供给用户的信息。显示单元1106可包括显示面板11061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板11061。
用户输入单元1107可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元1107包括触控面板11071以及其他输入设备11072。触控面板11071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板11071上或在触控面板11071附近的操作)。触控面板11071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1110,接收处理器1110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板11071。除了触控面板11071,用户输入单元1107还可以包括其他输入设备11072。具体地,其他输入设备11072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板11071可覆盖在显示面板11061上,当触控面板11071检测到在其上或附近的触摸操作后,传送给处理器1110以确定触摸事件的类型,随后处理器1110根据触摸事件的类型在显示面板11061上提供相应的视觉输出。虽然在图11中,触控面板11071与显示面板11061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板11071与显示面板11061集成而实现电子设备的输入和输出功能,具体此处不做限定。
接口单元1108为外部装置与电子设备1100连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元1108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备1100内的一个或多个元件或者可以用于在电子设备1100和外部装置之间传输数据。
存储器1109可用于存储软件程序以及各种数据。存储器1109可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器1110是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器1109内的软件程序和/或模块,以及调用存储在存储器1109内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器1110可包括一个或多个处理单元;优选的,处理器1110可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1110中。
电子设备1100还可以包括给各个部件供电的电源1111(比如电池),优选的,电源1111可以通过电源管理系统与处理器1110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,电子设备1100包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种电子设备,包括处理器1110,存储器1109,存储在存储器1109上并可在所述处理器1110上运行的计算机程序,该计算机程序被处理器1110执行时实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种图像处理方法,其特征在于,包括:
获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
确定所述待处理图像中的目标图像区域;
将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待处理图像中的目标图像区域,包括:
获取所述待处理图像中的第一信息,其中,所述第一信息包括道路信息和/或车头参照信息;
确定与所述第一信息对应的目标图像区域。
3.根据权利要求2所述的方法,其特征在于,所述确定与所述第一信息对应的目标图像区域,包括:
基于所述第一信息,确定所述待处理图像中车辆行车道路的宽度方向;
在高度方向上,将所述待处理图像的顶部与目标高度值对应的图像区域确定为所述目标图像区域,其中,所述高度方向垂直于所述宽度方向,且所述高度方向由所述待处理图像中的车头指向所述待处理图像的边缘。
4.根据权利要求3所述的方法,其特征在于,所述在高度方向上,所述将所述待处理图像的顶部与目标高度值对应的图像区域确定为所述目标图像区域之前,所述方法还包括:
检测所述待处理图像中拍摄场景为天空的图像区域,并获取所述图像区域在所述高度方向上的所述目标高度值。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述将所述目标图像区域裁剪,得到目标图像之后,还包括:
将所述目标图像输入至所述端到端模型,并输出N组预测数据,其中,所述N组预测数据为N个不同时刻的预测数据。
6.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取待处理图像,所述待处理图像为车辆行车前方的场景图像;
图像区域确定模块,用于确定所述待处理图像中的目标图像区域;
裁剪模块,用于将所述目标图像区域裁剪,以得到用于端到端模型的训练或者预测的目标图像,所述目标图像为所述待处理图像裁剪掉所述目标图像区域后保留的图像。
7.根据权利要求6所述的装置,其特征在于,所述图像区域确定模块,包括:
信息获取单元,用于获取所述待处理图像中的第一信息,其中,所述第一信息包括道路信息和/或车头参照信息;
图像区域确定单元,用于确定与所述第一信息对应的目标图像区域。
8.根据权利要求7所述的装置,其特征在于,所述图像区域确定单元,包括:
宽度方向确定子单元,用于基于所述第一信息,确定所述待处理图像中车辆行车道路的宽度方向;
图像区域确定子单元,用于在高度方向上,将所述待处理图像的顶部与目标高度值对应的图像区域确定为所述目标图像区域,其中,所述高度方向垂直于所述宽度方向,且所述高度方向由所述待处理图像中的车头指向所述待处理图像的边缘。
9.根据权利要求8所述的装置,其特征在于,所述图像区域确定单元,还包括:
高度值获取子单元,用于检测所述待处理图像中拍摄场景为天空的图像区域,并获取所述图像区域在所述高度方向上的所述目标高度值。
10.根据权利要求6至9中任一项所述的装置,其特征在于,所述图像处理装置,还包括:
预测模块,用于将所述目标图像输入至所述端到端模型,并输出N组预测数据,其中,所述N组预测数据为N个不同时刻的预测数据。
11.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的图像处理方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的图像处理方法的步骤。
CN201811640344.3A 2018-12-29 2018-12-29 一种图像处理方法及装置 Pending CN109657643A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811640344.3A CN109657643A (zh) 2018-12-29 2018-12-29 一种图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811640344.3A CN109657643A (zh) 2018-12-29 2018-12-29 一种图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN109657643A true CN109657643A (zh) 2019-04-19

Family

ID=66116974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811640344.3A Pending CN109657643A (zh) 2018-12-29 2018-12-29 一种图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN109657643A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580678A (zh) * 2019-09-10 2019-12-17 北京百度网讯科技有限公司 图像处理方法及装置
CN111695491A (zh) * 2020-06-10 2020-09-22 北京百度网讯科技有限公司 用于检测行人的方法和装置
CN111986207A (zh) * 2019-05-24 2020-11-24 百度在线网络技术(北京)有限公司 一种图片裁切方法及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279759A (zh) * 2013-06-09 2013-09-04 大连理工大学 一种基于卷积神经网络的车辆前方可通行性分析方法
CN103488975A (zh) * 2013-09-17 2014-01-01 北京联合大学 一种基于智能驾驶的斑马线实时检测的方法
CN103942532A (zh) * 2014-03-14 2014-07-23 吉林大学 基于车载摄像机的盲区车辆检测方法
CN108776970A (zh) * 2018-06-12 2018-11-09 北京字节跳动网络技术有限公司 图像处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279759A (zh) * 2013-06-09 2013-09-04 大连理工大学 一种基于卷积神经网络的车辆前方可通行性分析方法
CN103488975A (zh) * 2013-09-17 2014-01-01 北京联合大学 一种基于智能驾驶的斑马线实时检测的方法
CN103942532A (zh) * 2014-03-14 2014-07-23 吉林大学 基于车载摄像机的盲区车辆检测方法
CN108776970A (zh) * 2018-06-12 2018-11-09 北京字节跳动网络技术有限公司 图像处理方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986207A (zh) * 2019-05-24 2020-11-24 百度在线网络技术(北京)有限公司 一种图片裁切方法及终端
CN111986207B (zh) * 2019-05-24 2023-09-05 百度在线网络技术(北京)有限公司 一种图片裁切方法及终端
CN110580678A (zh) * 2019-09-10 2019-12-17 北京百度网讯科技有限公司 图像处理方法及装置
CN111695491A (zh) * 2020-06-10 2020-09-22 北京百度网讯科技有限公司 用于检测行人的方法和装置
CN111695491B (zh) * 2020-06-10 2023-12-19 阿波罗智联(北京)科技有限公司 用于检测行人的方法和装置

Similar Documents

Publication Publication Date Title
CN106778585B (zh) 一种人脸关键点跟踪方法和装置
CN107665697B (zh) 一种屏幕亮度的调节方法及移动终端
CN105487649B (zh) 一种提示方法及移动终端
CN104143078A (zh) 活体人脸识别方法、装置和设备
CN108304758A (zh) 人脸特征点跟踪方法及装置
CN109977845B (zh) 一种可行驶区域检测方法及车载终端
CN104463105B (zh) 路牌识别方法及装置
CN109391762A (zh) 一种跟踪拍摄的方法和装置
CN107590463A (zh) 人脸识别方法及相关产品
CN105989572B (zh) 图片处理方法及装置
CN107749046B (zh) 一种图像处理方法及移动终端
CN107864336B (zh) 一种图像处理方法、移动终端
CN110505403A (zh) 一种录像处理方法及装置
CN106959761A (zh) 一种终端拍照方法、装置及终端
CN109657643A (zh) 一种图像处理方法及装置
JP2016511875A (ja) 画像サムネイルの生成方法、装置、端末、プログラム、及び記録媒体
CN106127829A (zh) 一种增强现实的处理方法、装置及终端
CN110807405A (zh) 一种偷拍装置检测方法及电子设备
CN109739394A (zh) 一种sar值的处理方法、移动终端
CN108984066A (zh) 一种应用程序图标显示方法及移动终端
CN109814799A (zh) 屏幕响应控制方法及终端设备
CN110456395A (zh) 一种定位方法及终端设备
CN109544445A (zh) 一种图像处理方法、装置及移动终端
CN109711477A (zh) 一种自动驾驶模型的训练方法及装置
CN109472825B (zh) 一种对象搜索方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190419

RJ01 Rejection of invention patent application after publication