CN110532947A - 一种用于车检表格的去偏色处理的方法及设备 - Google Patents
一种用于车检表格的去偏色处理的方法及设备 Download PDFInfo
- Publication number
- CN110532947A CN110532947A CN201910803760.9A CN201910803760A CN110532947A CN 110532947 A CN110532947 A CN 110532947A CN 201910803760 A CN201910803760 A CN 201910803760A CN 110532947 A CN110532947 A CN 110532947A
- Authority
- CN
- China
- Prior art keywords
- channel
- car test
- pixel
- test table
- table area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/64—Circuits for processing colour signals
- H04N9/643—Hue control means, e.g. flesh tone control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请的目的是提供一种用于车检表格的去偏色处理的方法及设备,本申请通过通过建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;根据所述二值图确定基本颜色通道对应的校正系数;根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色,并提高了去偏色后的准确度。
Description
技术领域
本申请涉及图像识别领域,尤其涉及一种用于车检表格的去偏色处理的方法及设备。
背景技术
目前在车检表格图像采集过程中,容易受到环境光源、物体本身的反射特性及采集设备的感光系数的影响,造成采集到的图像颜色与真实的图像颜色存在偏差,即图像偏色,而产生偏色的表格图像数据易造成识别结果错误,还会对章的检测产生影响。在现有技术中,对于车检表格图像的灰度算法去偏色方法计算过程冗余,且车检表格图像并非是色彩多样的图像,通常由黑色、红色、灰色、白色组成,且偏光对黑色像素的偏色效果低,将黑色像素加入色彩像素统计后进行去偏色计算会影响最终的偏色校正效果。
发明内容
本申请的一个目的是提供一种用于车检表格的去偏色处理的方法及设备,解决现有技术中对车检表格图像去偏色计算过程冗余、效果差的问题。
根据本申请的一个方面,提供了一种用于车检表格的去偏色处理的方法,该方法包括:
建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;
基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;
根据所述二值图确定基本颜色通道对应的校正系数;
根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。
进一步地,所述建立车检表格区域检测模型,包括:
获取不同光条件下不同角度的车检表格图像;
利用矩形框标记所有车检表格图像中表格所在位置,使用预设类别标签标记所有矩形框标记后的车检表格图像,其中,所述预设类别标签包括第一预设类别标签和第二预设类别标签;
使用所述被标记预设类别标签的车检表格图像训练卷积神经网络模型以得到车检表格区域检测模型。
进一步地,所述根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像,包括:
利用所述车检表格区域检测模型确定所述获取到的待检测的车检表格图像的一个或多个矩形区域;
判断所述一个或多个矩形区域是否为表格,若是,则将所述矩形区域作为所述待检测的车检表格图像中的目标车检表格区域图像提取出来。
进一步地,所述根据所述二值图确定基本颜色通道对应的校正系数,包括:
统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和;
根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值;
根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数。
进一步地,所述基本颜色通道包括第一通道、第二通道及第三通道,统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和,包括:
统计所述二值图中像素值为255的元素的总数以及所述目标车检表格区域图像内的第一通道像素值累加和、第二通道像素值累加和以及第三通道像素值累加和,其中,所述第一通道为红色像素通道,第二通道为绿色像素通道,第三通道为蓝色像素通道。
进一步地,所述根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值,包括:
根据所述第一通道像素值累加和、所述第二通道像素值累加和以及所述第三通道像素值累加和分别与所述像素值为255的元素的总数的比值,得到第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值。
进一步地,所述根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数,包括:
根据所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值累加后与所述基本颜色通道的数量的比值确定总像素均值;
分别将所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值与所述总像素均值进行比值,得到第一通道校正系数、第二通道校正系数以及第三通道校正系数。
进一步地,所述根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,包括:
将所述第一通道像素的像素值依次乘以所述第一通道校正系数,将所述第二通道像素的像素值依次乘以所述第二通道校正系数,将所述第三通道像素的像素值依次乘以所述第三通道校正系数。
进一步地,所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型,所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。
根据本申请另一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述一种用于车检表格的去偏色处理的方法。
根据本申请再一个方面,还提供了一种用于车检表格的去偏色处理的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述用于车检表格的去偏色处理的方法的操作。
与现有技术相比,本申请通过建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;根据所述二值图确定基本颜色通道对应的校正系数;根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色,并提高了去偏色后的准确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请的一个方面提供一种用于车检表格的去偏色处理的方法流程示意图;
图2示出本申请一优选实施例中获取目标车检表格区域图像的方法示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1示出根据本申请的一个方面提供一种用于车检表格的去偏色处理的方法流程示意图,该方法包括:步骤S11~S14,其中,步骤S11,建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;步骤S12,基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;步骤S13,根据所述二值图确定基本颜色通道对应的校正系数;步骤S14,根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。从而快速高效地将车检表格图像去偏色,并提高了去偏色后的准确度。
具体地,在步骤S11中,建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像。在此,所述车检表格区域检测模型优选为由基于MobileNet网络的SSD框架构建,例如使用大量不同条件下采集到的车检表格数据训练基于SSD的框架得到车检表格区域检测模型,该框架使用MobileNet网络作为特征提取器,MobileNet网络的参数量较少,因此可以大幅度提高计算速度,在此记录使用MobileNet网络作为特征提取器的SSD框架为MobileNet-SSD网络;对于不同的特征图,检测的效果也不同,因此该SSD使用了特征金字塔结构,在多个特征图上同时进行分类和回归以加快模型的运行速度,使用Softmax(归一化函数)得到目标的类别信息,使用Boundingboxregression(边框回归)得到目标的位置和信息,以精确、快速地提取车检表格图像中的目标车检表格区域图像。需要说明的是,MobileNet为一种使用深度可分离的卷积来构建轻量级的深层神经网络。
步骤S12,基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图。步骤S13,根据所述二值图确定基本颜色通道对应的校正系数。在此,基本颜色通道为图像中可出现颜色的基础颜色,各颜色可由基本颜色通道的变化以及叠加实现。车检表格图像并非是灰度世界算法中所描述的色彩多样的图像,通常由黑色、红色、灰色、白色组成,将黑色像素加入统计会影响最终的偏色校正效果,因此在计算校正系数时,根据目标车检表格区域图像对应的二值图统计黑色像素以外的像素在基础颜色通道的平均值,而并非所有像素的平均值,以准确地完成对车检表格图像的去偏色处理。其中,最大类间方差法比如使用Otsu,选取一个最优阈值把目标车检表格区域图像分为前景色和背景色,两部分的类间方差越大说明两部分差别越大,从而有效的分割图像,得到对应的二值图;以便利用二值图计算基本颜色通道对应的校正系数,通过校正系数去调整图像中的每一像素,实现对图像进行去偏色处理。
步骤S14,根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。在此,根据每一像素对应的基础颜色通道遍历所述每一像素,例如对于红色通道上的某一像素,则将该像素与红色通道上对应的校正系数的积作为该像素被校正后的像素值,优选地,当被校正后的像素值超过255时,限定为255,以准确地得到校正后的像素值。
优选地,步骤S11中,获取不同光条件下不同角度的车检表格图像;利用矩形框标记所有车检表格图像中表格所在位置,使用预设类别标签标记所有矩形框标记后的车检表格图像,其中,所述预设类别标签包括第一预设类别标签和第二预设类别标签;使用所述被标记预设类别标签的车检表格图像训练卷积神经网络模型以得到车检表格区域检测模型。在此,所述车检表格包括但不限于车辆年检表格以及车辆月检表格。首先,获取不同光源条件下不同角度的车检表格图像,例如不同的自然光源或不同的人工光源下各个不同角度的车辆年检表格图像,采用矩形框标记车辆年检表格图像中表格所在位置,并记录相应类别标签以使得卷积神经网络学习分辨车辆年检表格图像中的不同目标,优选地,设置预设类别标签为两类,第一预设类别标签为表格图像,第二预设类别标签为背景。接着,卷积神经网络模型优选为使用COCO训练集预训练过的MobileNet基础模型,则将被标记过且被设置类别标签后的车辆年检表格图像输入到MobileNet-SSD网络中以在MobileNet基础模型上进行微调处理,来获取适合车辆年检表格区域检测的模型,其中,在本申请一优选实施例中,所述微调处理为:将均值文件中的数值修改成经过统计得到的适用于车辆年检表格区域检测的值;COCO数据集的类别数是91,本模型只需要2类预设类别,包括背景和车辆年检表格,因此将MobileNet-SSD网络的类别数设置为2,6个类别得分,卷积核的输出个数设置为6、12、12、12、12、12。根据实验得到的较好效果,设置宽度乘数为0.85,分辨率乘数为3/4,基础学习率为0.001,weight decay设置为0.00005,gamma设置为0.5,学习策略设置为“multistep”,优化算法使用Adam。
步骤S11中,利用所述车检表格区域检测模型确定所述获取到的待检测的车检表格图像的一个或多个矩形区域;判断所述一个或多个矩形区域是否为表格,若是,则将所述矩形区域作为所述待检测的车检表格图像中的目标车检表格区域图像提取出来。在此,首先将所述车检表格图像输入所述车检表格区域检测模型,如图2所示的本申请一优选实施例中获取目标车检表格区域图像的方法示意图,得到N个一维组[class,x,y,width,height],数组第一个元素class代表对象类别,是“表格区域”则为1,不是则为0,数组后四个元素表征目标对象所在矩形区域,x,y代表矩形左上角点坐标,width代表矩形宽度,height代表矩形高度。每个数组均对应一个矩形区域,当矩形区域对应的对象类别为表格区域时,从目标车检表格图像中提取目标车检表格区域,以精确地确定目标车检表格区域图像。
优选地,步骤S13中,统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和;根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值;根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数。在此,通过均值法获取所述每一基本颜色通道对应的校正系数,其中,所述目标像素值不限定,以使得本申请偏色校正方法可以应用于更多的场景。
优选地,步骤S13中,所述基本颜色通道包括第一通道、第二通道及第三通道,统计所述二值图中像素值为255的元素的总数以及所述目标车检表格区域图像内的第一通道像素值累加和、第二通道像素值累加和以及第三通道像素值累加和,其中,所述第一通道为红色像素通道,第二通道为绿色像素通道,第三通道为蓝色像素通道。接着,根据所述第一通道像素值累加和、所述第二通道像素值累加和以及所述第三通道像素值累加和分别与所述像素值为255的元素的总数的比值,得到第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值。然后,根据所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值累加后与所述基本颜色通道的数量的比值确定总像素均值;分别将所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值与所述总像素均值进行比值,得到第一通道校正系数、第二通道校正系数以及第三通道校正系数。
在本申请一优选实施例中,统计二值图中像素值为255的元素总数并记作nsum,接着,统计像素值为255的元素对应的车检表格区域图像内的基础颜色通道像素值累加和:红色通道(R通道)像素值累加和fsumr、绿色通道(G通道)像素值累加和fsumg以及蓝色通道(B通道)像素值累加和fsumb,通过计算得到R、G、B通道的像素平均值:R通道像素平均值faver、G通道像素平均值faveg以及B通道像素平均值faveb,由以下公式计算得到:
对基本颜色通道的像素平均值累加后再取均值得到总像素均值fave,由以下公式计算得到:
使用faver、faveg、faveb依次除fave得到R、G、B通道对应的校正系数Rr、Rg、Rb,由以下公式计算得到:
进一步地,步骤S14中,将所述第一通道像素的像素值依次乘以所述第一通道校正系数,将所述第二通道像素的像素值依次乘以所述第二通道校正系数,将所述第三通道像素的像素值依次乘以所述第三通道校正系数。接上述实施例,遍历目标表格区域图像的每一个像素,依次将每一个像素的像素值乘以对应基础颜色通道的校正系数,并且对像素值超过255的像素,限制为255,即可得到校正后的图像,将校正后的R、G、B通道像素值对应地记作G(i,j,r)、G(i,j,g)以及G(i,j,b),可由下式计算得到R、G、B通道的校正后像素值:
优选地,所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型,所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。MobileNet-SSD网络的骨干网络是MobileNet,它采用了深度可分离卷积结构来减少计算量,引入宽度乘数和分辨率乘数来减少参数量和计算量,因此与常用的采用VGG为骨干网络的SSD框架相比,会减少训练时间和网络实际使用时的时间,可以加快完税证明检测表格的速度,提高效率。其中,深度可分离卷积是将一个标准的卷积核分解成深度卷积核和1*1的点卷积核,假设卷积核的大小为Dk*Dk,入通道数为X,输出通道为Y,此标准卷积核为X*Dk*Dk*Y,可以分解成X*Dk*Dk和X*1*1*Y的积。对于Df*Df大小的特征图,标准卷积的计算量X*Y*Dk*Dk*Df*Df,深度卷积核和1*1的卷积计算量求和得到深度可分离卷积的计算量X*Dk*Dk*Df*Df+X*Y*Df*Df,因此可以得到深度可分离卷积与标准卷积的计算量比率:
在MobileNet网络中使用3*3卷积核,所以计算量可以减少8-9倍。接着,宽度乘数α主要用于减少通道数,即输入特征图的通道从X变成了αX,分辨率乘数ρ主要用于降低图片的分辨率,即减小特征图的大小,特征图的大小从Df*Df变成了ρDf*ρDf,因此引入分辨率后的总的计算量为:
CN=Dk*Dk*αX*ρDf*ρDf+αX*αY*ρDf*ρDf
并且通过数和特征图大小的数值直接影响参数的个数,因此MobileNet作为骨干网络可以减少计算量和参数量,以减少MobileNet-SSD网络的训练时间和实际运行的时间。
此外,本申请实施例还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述一种用于车检表格的去偏色处理的方法。
根据本申请再一个方面,还提供了一种用于车检表格的去偏色处理的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述一种用于车检表格的去偏色处理的方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:通过建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;根据所述二值图确定基本颜色通道对应的校正系数;根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (11)
1.一种用于车检表格的去偏色处理的方法,其中,所述方法包括:
建立车检表格区域检测模型,根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像;
基于最大类间方差法对所述目标车检表格区域图像进行阈值分割,得到所述目标车检表格区域图像对应的二值图;
根据所述二值图确定基本颜色通道对应的校正系数;
根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,得到去偏色处理后的车检表格图像。
2.根据权利要求1所述的方法,其中,所述建立车检表格区域检测模型,包括:
获取不同光条件下不同角度的车检表格图像;
利用矩形框标记所有车检表格图像中表格所在位置,使用预设类别标签标记所有矩形框标记后的车检表格图像,其中,所述预设类别标签包括第一预设类别标签和第二预设类别标签;
使用所述被标记预设类别标签的车检表格图像训练卷积神经网络模型以得到车检表格区域检测模型。
3.根据权利要求1所述的方法,其中,所述根据所述车检表格区域检测模型对获取到的待检测的车检表格图像进行检测,提取所述待检测的车检表格图像中的目标车检表格区域图像,包括:
利用所述车检表格区域检测模型确定所述获取到的待检测的车检表格图像的一个或多个矩形区域;
判断所述一个或多个矩形区域是否为表格,若是,则将所述矩形区域作为所述待检测的车检表格图像中的目标车检表格区域图像提取出来。
4.根据权利要求1所述的方法,其中,所述根据所述二值图确定基本颜色通道对应的校正系数,包括:
统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和;
根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值;
根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数。
5.根据权利要求4所述的方法,其中,所述基本颜色通道包括第一通道、第二通道及第三通道,统计所述二值图中像素值为目标值的元素的总数及所述目标车检表格区域图像中每一基本颜色通道的像素值累加和,包括:
统计所述二值图中像素值为255的元素的总数以及所述目标车检表格区域图像内的第一通道像素值累加和、第二通道像素值累加和以及第三通道像素值累加和,其中,所述第一通道为红色像素通道,第二通道为绿色像素通道,第三通道为蓝色像素通道。
6.根据权利要求5所述的方法,其中,所述根据所述元素的总数及所述每一基本颜色通道的像素值累加和确定所述元素的每一基本颜色通道的平均值,包括:
根据所述第一通道像素值累加和、所述第二通道像素值累加和以及所述第三通道像素值累加和分别与所述像素值为255的元素的总数的比值,得到第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值。
7.根据权利要求4所述的方法,其中,所述根据所述元素的每一基本颜色通道的平均值确定所述每一基本颜色通道对应的校正系数,包括:
根据所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值累加后与所述基本颜色通道的数量的比值确定总像素均值;
分别将所述第一通道像素平均值、第二通道像素平均值以及第三通道像素平均值与所述总像素均值进行比值,得到第一通道校正系数、第二通道校正系数以及第三通道校正系数。
8.根据权利要求7所述的方法,其中,所述根据所述校正系数遍历所述目标车检表格区域图像中的每一像素,包括:
将所述第一通道像素的像素值依次乘以所述第一通道校正系数,将所述第二通道像素的像素值依次乘以所述第二通道校正系数,将所述第三通道像素的像素值依次乘以所述第三通道校正系数。
9.根据权利要求1所述的方法,其中,所述车检表格区域检测模型为基于MobileNet-SSD网络的车检表格区域检测模型,所述MobileNet-SSD网络为使用MobileNet网络作为特征提取器的SSD框架。
10.一种用于车检表格的去偏色处理的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至9中任一项所述方法的操作。
11.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910803760.9A CN110532947A (zh) | 2019-08-28 | 2019-08-28 | 一种用于车检表格的去偏色处理的方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910803760.9A CN110532947A (zh) | 2019-08-28 | 2019-08-28 | 一种用于车检表格的去偏色处理的方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110532947A true CN110532947A (zh) | 2019-12-03 |
Family
ID=68664992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910803760.9A Pending CN110532947A (zh) | 2019-08-28 | 2019-08-28 | 一种用于车检表格的去偏色处理的方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532947A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111311697A (zh) * | 2020-03-19 | 2020-06-19 | 北京搜狐新媒体信息技术有限公司 | 图片色彩丰富度的检测方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070133870A1 (en) * | 2005-12-14 | 2007-06-14 | Micron Technology, Inc. | Method, apparatus, and system for improved color statistic pruning for automatic color balance |
CN102750713A (zh) * | 2012-07-18 | 2012-10-24 | 山东神思电子技术股份有限公司 | 一种图像偏色检测方法 |
CN106027787A (zh) * | 2016-06-15 | 2016-10-12 | 维沃移动通信有限公司 | 一种移动终端的白平衡方法及移动终端 |
CN106709928A (zh) * | 2016-12-22 | 2017-05-24 | 湖北工业大学 | 一种快速的含噪图像二维最大类间方差阈值法 |
CN107545550A (zh) * | 2017-08-25 | 2018-01-05 | 安庆师范大学 | 细胞图像偏色校正方法 |
-
2019
- 2019-08-28 CN CN201910803760.9A patent/CN110532947A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070133870A1 (en) * | 2005-12-14 | 2007-06-14 | Micron Technology, Inc. | Method, apparatus, and system for improved color statistic pruning for automatic color balance |
CN102750713A (zh) * | 2012-07-18 | 2012-10-24 | 山东神思电子技术股份有限公司 | 一种图像偏色检测方法 |
CN106027787A (zh) * | 2016-06-15 | 2016-10-12 | 维沃移动通信有限公司 | 一种移动终端的白平衡方法及移动终端 |
CN106709928A (zh) * | 2016-12-22 | 2017-05-24 | 湖北工业大学 | 一种快速的含噪图像二维最大类间方差阈值法 |
CN107545550A (zh) * | 2017-08-25 | 2018-01-05 | 安庆师范大学 | 细胞图像偏色校正方法 |
Non-Patent Citations (3)
Title |
---|
AZKA GILANI 等: "Table Detection using Deep Learning", 《RESEARCHGATE》 * |
巫建辉 等: "基于单目视觉的人机交互系统研究", 《工业控制计算机》 * |
方靖 等: "基于白平衡修正的室外光照估计算法", 《计算机科学》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111311697A (zh) * | 2020-03-19 | 2020-06-19 | 北京搜狐新媒体信息技术有限公司 | 图片色彩丰富度的检测方法及相关装置 |
CN111311697B (zh) * | 2020-03-19 | 2023-11-17 | 北京搜狐新媒体信息技术有限公司 | 图片色彩丰富度的检测方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107507173B (zh) | 一种全切片图像的无参考清晰度评估方法及系统 | |
CN112686812B (zh) | 银行卡倾斜矫正检测方法、装置、可读存储介质和终端 | |
CN104243820B (zh) | 一种确定图像边界的方法及装置 | |
CN110930390B (zh) | 基于半监督深度学习的芯片管脚缺失检测方法 | |
EP3819859A1 (en) | Sky filter method for panoramic images and portable terminal | |
CN106960427A (zh) | 二维码图像处理的方法和装置 | |
CN107038416B (zh) | 一种基于二值图像改进型hog特征的行人检测方法 | |
CN108388905B (zh) | 一种基于卷积神经网络和邻域上下文的光源估计方法 | |
CN109583483A (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN107944403A (zh) | 一种图像中的行人属性检测方法及装置 | |
CN109472193A (zh) | 人脸检测方法及装置 | |
CN110738160A (zh) | 一种结合人脸检测的人脸质量评估方法 | |
WO2018068300A1 (zh) | 图像处理方法和装置 | |
CN111860494A (zh) | 图像目标检测的优化方法、装置、电子设备和存储介质 | |
CN109035196A (zh) | 基于显著性的图像局部模糊检测方法 | |
CN111695373B (zh) | 斑马线的定位方法、系统、介质及设备 | |
CN111209858A (zh) | 一种基于深度卷积神经网络的实时车牌检测方法 | |
CN111709305B (zh) | 一种基于局部图像块的人脸年龄识别方法 | |
CN110827312A (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN104021567B (zh) | 基于首数字定律的图像高斯模糊篡改检测方法 | |
CN104648397B (zh) | 车道偏移警示系统及方法 | |
CN113609984A (zh) | 一种指针式仪表读数识别方法、装置及电子设备 | |
CN110909772B (zh) | 一种高精度实时多尺度表盘指针检测方法和系统 | |
CN109509188A (zh) | 一种基于hog特征的输电线路典型缺陷识别方法 | |
CN115761270A (zh) | 色卡的检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191203 |