CN110532947A

CN110532947A - 一种用于车检表格的去偏色处理的方法及设备

Info

Publication number: CN110532947A
Application number: CN201910803760.9A
Authority: CN
Inventors: 周康明
Original assignee: Shanghai Eye Control Technology Co Ltd
Current assignee: Shanghai Eye Control Technology Co Ltd
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2019-12-03

Abstract

本申请的目的是提供一种用于车检表格的去偏色处理的方法及设备，本申请通过通过建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像；基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图；根据所述二值图确定基本颜色通道对应的校正系数；根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色，并提高了去偏色后的准确度。

Description

一种用于车检表格的去偏色处理的方法及设备

技术领域

本申请涉及图像识别领域，尤其涉及一种用于车检表格的去偏色处理的方法及设备。

背景技术

目前在车检表格图像采集过程中，容易受到环境光源、物体本身的反射特性及采集设备的感光系数的影响，造成采集到的图像颜色与真实的图像颜色存在偏差，即图像偏色，而产生偏色的表格图像数据易造成识别结果错误，还会对章的检测产生影响。在现有技术中，对于车检表格图像的灰度算法去偏色方法计算过程冗余，且车检表格图像并非是色彩多样的图像，通常由黑色、红色、灰色、白色组成，且偏光对黑色像素的偏色效果低，将黑色像素加入色彩像素统计后进行去偏色计算会影响最终的偏色校正效果。

发明内容

本申请的一个目的是提供一种用于车检表格的去偏色处理的方法及设备，解决现有技术中对车检表格图像去偏色计算过程冗余、效果差的问题。

根据本申请的一个方面，提供了一种用于车检表格的去偏色处理的方法，该方法包括：

建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像；

基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图；

根据所述二值图确定基本颜色通道对应的校正系数；

根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。

进一步地，所述建立车检表格区域检测模型，包括：

获取不同光条件下不同角度的车检表格图像；

利用矩形框标记所有车检表格图像中表格所在位置，使用预设类别标签标记所有矩形框标记后的车检表格图像，其中，所述预设类别标签包括第一预设类别标签和第二预设类别标签；

使用所述被标记预设类别标签的车检表格图像训练卷积神经网络模型以得到车检表格区域检测模型。

进一步地，所述根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像，包括：

利用所述车检表格区域检测模型确定所述获取到的待检测的车检表格图像的一个或多个矩形区域；

判断所述一个或多个矩形区域是否为表格，若是，则将所述矩形区域作为所述待检测的车检表格图像中的目标车检表格区域图像提取出来。

进一步地，所述根据所述二值图确定基本颜色通道对应的校正系数，包括：

统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和；

根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值；

根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数。

进一步地，所述基本颜色通道包括第一通道、第二通道及第三通道，统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和，包括：

统计所述二值图中像素值为255的元素的总数以及所述目标车检表格区域图像内的第一通道像素值累加和、第二通道像素值累加和以及第三通道像素值累加和，其中，所述第一通道为红色像素通道，第二通道为绿色像素通道，第三通道为蓝色像素通道。

进一步地，所述根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值，包括：

根据所述第一通道像素值累加和、所述第二通道像素值累加和以及所述第三通道像素值累加和分别与所述像素值为255的元素的总数的比值，得到第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值。

进一步地，所述根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数，包括：

根据所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值累加后与所述基本颜色通道的数量的比值确定总像素均值；

分别将所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值与所述总像素均值进行比值，得到第一通道校正系数、第二通道校正系数以及第三通道校正系数。

进一步地，所述根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，包括：

将所述第一通道像素的像素值依次乘以所述第一通道校正系数，将所述第二通道像素的像素值依次乘以所述第二通道校正系数，将所述第三通道像素的像素值依次乘以所述第三通道校正系数。

进一步地，所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型，所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。

根据本申请另一个方面，还提供了一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现前述一种用于车检表格的去偏色处理的方法。

根据本申请再一个方面，还提供了一种用于车检表格的去偏色处理的设备，其中，所述设备包括：

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行前述用于车检表格的去偏色处理的方法的操作。

与现有技术相比，本申请通过建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像；基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图；根据所述二值图确定基本颜色通道对应的校正系数；根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色，并提高了去偏色后的准确度。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1示出根据本申请的一个方面提供一种用于车检表格的去偏色处理的方法流程示意图；

图2示出本申请一优选实施例中获取目标车检表格区域图像的方法示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

图1示出根据本申请的一个方面提供一种用于车检表格的去偏色处理的方法流程示意图，该方法包括：步骤S11～S14，其中，步骤S11，建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像；步骤S12，基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图；步骤S13，根据所述二值图确定基本颜色通道对应的校正系数；步骤S14，根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色，并提高了去偏色后的准确度。

具体地，在步骤S11中，建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像。在此，所述车检表格区域检测模型优选为由基于MobileNet网络的SSD框架构建，例如使用大量不同条件下采集到的车检表格数据训练基于SSD的框架得到车检表格区域检测模型，该框架使用MobileNet网络作为特征提取器，MobileNet网络的参数量较少，因此可以大幅度提高计算速度，在此记录使用MobileNet网络作为特征提取器的SSD框架为MobileNet-SSD网络；对于不同的特征图，检测的效果也不同，因此该SSD使用了特征金字塔结构，在多个特征图上同时进行分类和回归以加快模型的运行速度，使用Softmax(归一化函数)得到目标的类别信息，使用Boundingboxregression(边框回归)得到目标的位置和信息，以精确、快速地提取车检表格图像中的目标车检表格区域图像。需要说明的是，MobileNet为一种使用深度可分离的卷积来构建轻量级的深层神经网络。

步骤S12，基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图。步骤S13，根据所述二值图确定基本颜色通道对应的校正系数。在此，基本颜色通道为图像中可出现颜色的基础颜色，各颜色可由基本颜色通道的变化以及叠加实现。车检表格图像并非是灰度世界算法中所描述的色彩多样的图像，通常由黑色、红色、灰色、白色组成，将黑色像素加入统计会影响最终的偏色校正效果，因此在计算校正系数时，根据目标车检表格区域图像对应的二值图统计黑色像素以外的像素在基础颜色通道的平均值，而并非所有像素的平均值，以准确地完成对车检表格图像的去偏色处理。其中，最大类间方差法比如使用Otsu，选取一个最优阈值把目标车检表格区域图像分为前景色和背景色，两部分的类间方差越大说明两部分差别越大，从而有效的分割图像，得到对应的二值图；以便利用二值图计算基本颜色通道对应的校正系数，通过校正系数去调整图像中的每一像素，实现对图像进行去偏色处理。

步骤S14，根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。在此，根据每一像素对应的基础颜色通道遍历所述每一像素，例如对于红色通道上的某一像素，则将该像素与红色通道上对应的校正系数的积作为该像素被校正后的像素值，优选地，当被校正后的像素值超过255时，限定为255，以准确地得到校正后的像素值。

优选地，步骤S11中，获取不同光条件下不同角度的车检表格图像；利用矩形框标记所有车检表格图像中表格所在位置，使用预设类别标签标记所有矩形框标记后的车检表格图像，其中，所述预设类别标签包括第一预设类别标签和第二预设类别标签；使用所述被标记预设类别标签的车检表格图像训练卷积神经网络模型以得到车检表格区域检测模型。在此，所述车检表格包括但不限于车辆年检表格以及车辆月检表格。首先，获取不同光源条件下不同角度的车检表格图像，例如不同的自然光源或不同的人工光源下各个不同角度的车辆年检表格图像，采用矩形框标记车辆年检表格图像中表格所在位置，并记录相应类别标签以使得卷积神经网络学习分辨车辆年检表格图像中的不同目标，优选地，设置预设类别标签为两类，第一预设类别标签为表格图像，第二预设类别标签为背景。接着，卷积神经网络模型优选为使用COCO训练集预训练过的MobileNet基础模型，则将被标记过且被设置类别标签后的车辆年检表格图像输入到MobileNet-SSD网络中以在MobileNet基础模型上进行微调处理，来获取适合车辆年检表格区域检测的模型，其中，在本申请一优选实施例中，所述微调处理为：将均值文件中的数值修改成经过统计得到的适用于车辆年检表格区域检测的值；COCO数据集的类别数是91，本模型只需要2类预设类别，包括背景和车辆年检表格，因此将MobileNet-SSD网络的类别数设置为2,6个类别得分，卷积核的输出个数设置为6、12、12、12、12、12。根据实验得到的较好效果，设置宽度乘数为0.85，分辨率乘数为3/4，基础学习率为0.001，weight decay设置为0.00005，gamma设置为0.5，学习策略设置为“multistep”，优化算法使用Adam。

步骤S11中，利用所述车检表格区域检测模型确定所述获取到的待检测的车检表格图像的一个或多个矩形区域；判断所述一个或多个矩形区域是否为表格，若是，则将所述矩形区域作为所述待检测的车检表格图像中的目标车检表格区域图像提取出来。在此，首先将所述车检表格图像输入所述车检表格区域检测模型，如图2所示的本申请一优选实施例中获取目标车检表格区域图像的方法示意图，得到N个一维组[class,x,y,width,height]，数组第一个元素class代表对象类别，是“表格区域”则为1，不是则为0，数组后四个元素表征目标对象所在矩形区域，x，y代表矩形左上角点坐标，width代表矩形宽度，height代表矩形高度。每个数组均对应一个矩形区域，当矩形区域对应的对象类别为表格区域时，从目标车检表格图像中提取目标车检表格区域，以精确地确定目标车检表格区域图像。

优选地，步骤S13中，统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和；根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值；根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数。在此，通过均值法获取所述每一基本颜色通道对应的校正系数，其中，所述目标像素值不限定，以使得本申请偏色校正方法可以应用于更多的场景。

优选地，步骤S13中，所述基本颜色通道包括第一通道、第二通道及第三通道，统计所述二值图中像素值为255的元素的总数以及所述目标车检表格区域图像内的第一通道像素值累加和、第二通道像素值累加和以及第三通道像素值累加和，其中，所述第一通道为红色像素通道，第二通道为绿色像素通道，第三通道为蓝色像素通道。接着，根据所述第一通道像素值累加和、所述第二通道像素值累加和以及所述第三通道像素值累加和分别与所述像素值为255的元素的总数的比值，得到第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值。然后，根据所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值累加后与所述基本颜色通道的数量的比值确定总像素均值；分别将所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值与所述总像素均值进行比值，得到第一通道校正系数、第二通道校正系数以及第三通道校正系数。

在本申请一优选实施例中，统计二值图中像素值为255的元素总数并记作nsum，接着，统计像素值为255的元素对应的车检表格区域图像内的基础颜色通道像素值累加和：红色通道(R通道)像素值累加和fsumr、绿色通道(G通道)像素值累加和fsumg以及蓝色通道(B通道)像素值累加和fsumb，通过计算得到R、G、B通道的像素平均值：R通道像素平均值faver、G通道像素平均值faveg以及B通道像素平均值faveb，由以下公式计算得到：

对基本颜色通道的像素平均值累加后再取均值得到总像素均值fave，由以下公式计算得到：

使用faver、faveg、faveb依次除fave得到R、G、B通道对应的校正系数Rr、Rg、Rb，由以下公式计算得到：

进一步地，步骤S14中，将所述第一通道像素的像素值依次乘以所述第一通道校正系数，将所述第二通道像素的像素值依次乘以所述第二通道校正系数，将所述第三通道像素的像素值依次乘以所述第三通道校正系数。接上述实施例，遍历目标表格区域图像的每一个像素，依次将每一个像素的像素值乘以对应基础颜色通道的校正系数，并且对像素值超过255的像素，限制为255，即可得到校正后的图像，将校正后的R、G、B通道像素值对应地记作G(i,j,r)、G(i,j,g)以及G(i,j,b)，可由下式计算得到R、G、B通道的校正后像素值：

优选地，所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型，所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。MobileNet-SSD网络的骨干网络是MobileNet，它采用了深度可分离卷积结构来减少计算量，引入宽度乘数和分辨率乘数来减少参数量和计算量，因此与常用的采用VGG为骨干网络的SSD框架相比，会减少训练时间和网络实际使用时的时间，可以加快完税证明检测表格的速度，提高效率。其中，深度可分离卷积是将一个标准的卷积核分解成深度卷积核和1*1的点卷积核，假设卷积核的大小为D_k*D_k，入通道数为X，输出通道为Y，此标准卷积核为X*D_k*D_k*Y，可以分解成X*D_k*D_k和X*1*1*Y的积。对于D_f*D_f大小的特征图，标准卷积的计算量X*Y*D_k*D_k*D_f*D_f，深度卷积核和1*1的卷积计算量求和得到深度可分离卷积的计算量X*D_k*D_k*D_f*D_f+X*Y*D_f*D_f，因此可以得到深度可分离卷积与标准卷积的计算量比率：

在MobileNet网络中使用3*3卷积核，所以计算量可以减少8-9倍。接着，宽度乘数α主要用于减少通道数，即输入特征图的通道从X变成了αX，分辨率乘数ρ主要用于降低图片的分辨率，即减小特征图的大小，特征图的大小从D_f*D_f变成了ρD_f*ρD_f，因此引入分辨率后的总的计算量为：

CN＝D_k*D_k*αX*ρD_f*ρD_f+αX*αY*ρD_f*ρD_f

并且通过数和特征图大小的数值直接影响参数的个数，因此MobileNet作为骨干网络可以减少计算量和参数量，以减少MobileNet-SSD网络的训练时间和实际运行的时间。

此外，本申请实施例还提供了一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现前述一种用于车检表格的去偏色处理的方法。

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行前述一种用于车检表格的去偏色处理的方法的操作。

例如，计算机可读指令在被执行时使所述一个或多个处理器：通过建立车检表格区域检测模型，根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像；基于最大类间方差法对所述目标车检表格区域图像进行阈值分割，得到所述目标车检表格区域图像对应的二值图；根据所述二值图确定基本颜色通道对应的校正系数；根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，得到去偏色处理后的车检表格图像。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本申请的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此，根据本申请的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于车检表格的去偏色处理的方法，其中，所述方法包括：

根据所述二值图确定基本颜色通道对应的校正系数；

2.根据权利要求1所述的方法，其中，所述建立车检表格区域检测模型，包括：

获取不同光条件下不同角度的车检表格图像；

3.根据权利要求1所述的方法，其中，所述根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测，提取所述待检测的车检表格图像中的目标车检表格区域图像，包括：

4.根据权利要求1所述的方法，其中，所述根据所述二值图确定基本颜色通道对应的校正系数，包括：

5.根据权利要求4所述的方法，其中，所述基本颜色通道包括第一通道、第二通道及第三通道，统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和，包括：

6.根据权利要求5所述的方法，其中，所述根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值，包括：

7.根据权利要求4所述的方法，其中，所述根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数，包括：

8.根据权利要求7所述的方法，其中，所述根据所述校正系数遍历所述目标车检表格区域图像中的每一像素，包括：

9.根据权利要求1所述的方法，其中，所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型，所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。

10.一种用于车检表格的去偏色处理的设备，其中，所述设备包括：

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行如权利要求1至9中任一项所述方法的操作。

11.一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现如权利要求1至9中任一项所述的方法。