CN112819005A - 一种识别方法、终端及计算机存储介质 - Google Patents

一种识别方法、终端及计算机存储介质 Download PDF

Info

Publication number
CN112819005A
CN112819005A CN201911122308.2A CN201911122308A CN112819005A CN 112819005 A CN112819005 A CN 112819005A CN 201911122308 A CN201911122308 A CN 201911122308A CN 112819005 A CN112819005 A CN 112819005A
Authority
CN
China
Prior art keywords
image
recognized
trained
color temperature
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911122308.2A
Other languages
English (en)
Inventor
王琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201911122308.2A priority Critical patent/CN112819005A/zh
Publication of CN112819005A publication Critical patent/CN112819005A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Abstract

本申请实施例公开了一种识别方法,该方法应用于一终端中,包括:获取待识别图像的图像数据和待识别图像的色温数据,分别对待识别图像的图像数据和待识别图像的色温数据进行处理,得到待识别图像的图像特征,将待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对待识别图像进行识别,以识别出待识别图像为室内图像或者室外图像。本申请实施例还同时提供了一种终端及计算机存储介质。

Description

一种识别方法、终端及计算机存储介质
技术领域
本申请涉及图像的识别技术,尤其涉及一种识别方法、终端及计算机存储介质。
背景技术
目前,在图像的室内外检测中,有基于外部器件的方法,例如无线保真(WIFI,Wireless Fidelity),光感和红外,也有基于图像本身的方法,其中,基于图像本身的方法常常采用人工智能(AI,Artificial Intelligence)算法,AI算法用于区分室内及其他场景(例如:绿植&天空&人像),AI算法可以提供室内外多分类结果,但是,针对室内外的识别率的准确性不高,大概在85%左右,并且,AI算法采用的YUV数据使得该算法并不适合提供给自动白平衡(AWB,Auto White Balance)/自动曝光(AE,Automatic Exposure)使用,由此可以看出,现有的对图像的室内外的识别方法的准确率较低。
发明内容
本申请实施例提供一种识别方法、终端及计算机存储介质,能够提高对图像的室内外识别的准确率。
本申请的技术方案是这样实现的:
本申请实施例提供了一种识别方法,该方法应用于一终端中,所述方法包括:
获取待识别图像的图像数据和所述待识别图像的色温数据;
分别对所述待识别图像的图像数据和所述待识别图像的色温数据进行处理,得到所述待识别图像的图像特征;
将所述待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对所述待识别图像进行识别,以识别出所述待识别图像为室内图像或者室外图像。
本申请实施例提供了一种终端,所述终端包括:
获取模块,用于获取待识别图像的图像数据和所述待识别图像的色温数据;
处理模块,用于分别对所述待识别图像的图像数据和所述待识别图像的色温数据进行处理,得到所述待识别图像的图像特征;
识别模块,用于将所述待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对所述待识别图像进行识别,以识别出所述待识别图像为室内图像或者室外图像。
本申请实施例还提供了一种终端,所述终端包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述一个或多个实施例所述识别方法。
本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行上述一个或多个实施例所述识别方法。
本申请实施例提供了一种识别方法、终端及计算机存储介质,该方法应用于一终端中,该方法包括:获取待识别图像的图像数据和待识别图像的色温数据,分别对待识别图像的图像数据和待识别图像的色温数据进行处理,得到待识别图像的图像特征,将待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对待识别图像进行识别,以识别出待识别图像为室内图像或者室外图像;也就是说,在本申请实施例中,通过对获取到的待识别图像的图像数据和色温数据进行处理,得到待识别图像的图像特征之后,将该图像特征输入至预先训练好的机器学习分类模型中进行识别,从而可以识别出该待识别图像为室内图像或者室外图像,这样,对待识别图像的图像特征通过机器学习分类模型进行识别,能够更加准确地识别出待识别图像为室内图像或者室外图像,从而提高了图像识别的准确率,有助于得到效果更加真实的图像。
附图说明
图1为本申请实施例提供的一种可选的识别方法的流程示意图;
图2a为设置有色温传感器的终端的一种实例的结构示意图;
图2b为设置有色温传感器的终端的另一种实例的结构示意图;
图3为色温传感器所获取到的光谱响应曲线;
图4为图像信号处理器中进行图像处理的流程框图;
图5为本申请实施例提供的一种可选的训练机器学习分类器的方法的流程示意图;
图6为本申请实施例提供的一种可选的直方图;
图7为本申请实施例提供的一种合页损失函数的分布曲线;
图8a为本申请实施例提供的一种可选的待识别图像;
图8b为本申请实施例提供的与图8a对应的梯度图像;
图9为交流电的电压曲线;
图10a为本申请实施例提供的一种可选的FD1的时域信息的曲线;
图10b为本申请实施例与图10a对应的频域信息的曲线;
图11为本申请实施例提供的一种终端的结构示意图一;
图12为本申请实施例提供的一种终端的结构示意图二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
实施例一
本申请实施例提供了一种识别方法,该方法应用于一终端中,图1为本申请实施例提供的一种可选的识别方法的流程示意图,参考图1所示,上述识别方法可以包括:
S101:获取待识别图像的图像数据和待识别图像的色温数据;
具体来说,终端的摄像头采集待识别图像,可以得到待识别图像的图像数据,终端上设置有色温传感器,色温传感器可以获取色温数据,图2a为设置有色温传感器的终端的一种实例的结构示意图,图2b为设置有色温传感器的终端的另一种实例的结构示意图,如图2a所示,在终端的前置摄像头旁设置有一枚色温传感器,图2a中黑色圆圈为色温传感器,如图2b所示,在终端的后置摄像头旁设置有一枚色温传感器,图2b中黑色圆圈为色温传感器。
这里,需要说明的是,终端上设置的色温传感器可以获取图像分量R,图像分量G,图像分量B,可见光C,全光谱(WB,Wide Band),相关色温(CCT,Correlated ColourTemperature)以及两个通道(FD1和FD2)的光闪烁频率(Flicker Frequency)及强度,图3为色温传感器所获取到的光谱响应曲线,如图3所示,示出了R,G,B,C,WB,FD1和FD2的光谱响应曲线,由图3可以看出,FD1通道几乎可以覆盖全光谱。
图4为图像信号处理器中进行图像信号处理的流程框图,如图4所示,上方的虚线框是针对RAW数据来说的处理流程,包括AE,AWB/自动对焦(AF,Auto Focus),…,去马赛克DEMOSAIC,…,图像空间颜色转换CSC,下方的虚线框为针对YUV数据来说的处理流程,包括:去噪,AI,…;而本申请实施例提供的识别方法应用于AE之后,AWB/AF之前,主要针对RAW数据进行处理。
可见,使用图像信号处理器时,特征提取需要依赖全尺寸的照片(如4000*3000),应用多尺度的滤波方法提取出大量的结构性特征,而手机的图像信号处理器(ISP,ImageSignal Processing)通常只能提供缩小后的小尺寸图像如(120*90),使用基于全尺寸图像的滤波方法得到的特征精度大为降低,从图像中提取出高维的结构性相关的特征,特征数量经常超过3000个,在手机内使用时很难做的实时处理,并且从实际效果来看复杂的结构性特征面对缺乏天空参考,纯色,室内人造建筑时判错率很高(正确率不足80%);并且,基于YUV数据的场景识别算法在图4上位于DEMOSAIC之后,倾向于最终看到的景象,由于存在时域上的偏差无法很好的为前端的AE&AWB&AF所使用;所以,现有的识别方法的准确率较低,影响终端捕捉到的图像的效果。
为了提高对待识别图像进行识别的准确率,本申请实施例中,终端在捕捉图像时,先通过终端的摄像头采集待识别图像,例如JPEG格式的图像,从而可以获取到待识别图像的图像数据,该图像数据为RAW数据类型,并通过摄像头旁设置的色温传感器采集待识别图像的色温数据,该色温数据至少包括FD1和FD2的时域信息,这样,使得终端可以获取到待识别图像的图像数据和色温数据。
S102:分别对待识别图像的图像数据和待识别图像的色温数据进行处理,得到待识别图像的图像特征;
在一种可选的实施例中,S102可以包括:
对待识别图像的图像数据进行处理,得到处理后的图像数据;
对待识别图像的色温数据进行处理,得到处理后的色温数据;
利用处理后的图像数据和处理后的色温数据形成待识别图像的图像特征。
具体来说,为了得到待识别图像的图像特征,这里,可以分别对待识别图像的图像数据和待识别图像的色温数据进行处理,再利用处理后的待识别图像的图像数据和待识别图像的色温数据能够形成待识别图像的图像特征,这里需要说明的是,在实际应用中,形成的待识别图像的图像特征中特征的数目一般为12个,其中,处理后的图像数据中得到8个特征,处理后的色温数据中得到4个特征。
为了得到12个特征,在一种可选的实施例中,对待识别图像的图像数据进行处理,得到处理后的图像数据,可以包括:
根据待识别图像的图像数据,计算待识别图像的横向梯度值和待识别图像的纵向梯度值;
将待识别图像的横向梯度值与待识别图像的纵向梯度值之和,确定为待识别图像的实际梯度值;
从待识别图像的实际梯度值中,选取出落入预设的弱梯度值范围内的实际梯度值;
对选取出的实际梯度值的待识别图像的图像分量进行分组,得到八组图像分量,将每组图像分量的个数进行归一化得到处理后的图像数据。
具体来说,根据待识别图像的图像数据,计算待识别图像中每个像素点的横向梯度值和纵向梯度值,然后将每个像素点的横向梯度值与纵向梯度值相加得到的和确定为每个像素点的实际梯度值。
由于在终端中预先存储有弱梯度值范围,例如梯度值的范围一般为0-512,在实际应用中可以设置弱梯度值范围为10-100,这样,可以将实际梯度值落入弱梯度值范围的像素点筛选出来,然后,对选取出来的实际梯度值的待识别图像的图像分量,例如G分量,分成8组。
在实际应用中,为了将图像分量分成8组,可以先将图像分量的取值范围平均分成8等分,形成8个图像分量区间,然后,将确定每个图像分量所落入的分组区间,以此来进行分组,在分组完成之后,确定每组中图像分量的个数,然后在对个数进行归一化,从而得到8个特征;其中,这里可以采用构建直方图的形式来分组以得到8个特征。
为了得到12个特征,在一种可选的实施例中,对待识别图像的色温数据进行处理,得到处理后的色温数据,可以包括:
对待识别图像的色温数据中的一个通道的时域信息进行时频转换,得到频域信息;
从频域信息中选取出最大的两个频率幅值和最大的两个频率幅值对应的频率,并分别进行归一化,得到处理后的色温数据。
具体来说,通过色温传感器采集到FD1和FD2的数据之后,由于FD1几乎覆盖了全光谱,所以,这里选用待识别图像的色温数据中的FD1,对FD1的时域信息进行视频转换得到FD1的频域信息,并从FD1的频域信息中选取出最大的两个频率幅值FDM1和FDM2,以及最大的两个频率幅值对应的频率FDQ1和FDQ2,并对FDM1和FDM2进行归一化,对FDQ1和FDQ2进行归一化,从而得到4个特征。
在实际应用中,可以选用65535对FDM1和FDM2进行归一化,选用200Hz对FDQ1和FDQ2进行归一化,来确定4个特征。
如此,便可以确定出待识别图像的图像特征。
S103:将待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对待识别图像进行识别,以识别出待识别图像为室内图像或者室外图像。
通过S102确定出待识别图像的图像特征之后,再将确定出的图像特征输入至预先训练好的机器学习分类模型中进行识别,从而识别出该待识别图像属于室外图像还是室内图像。
其中,上述机器学习分类模型可以为以下任意一项:支持向量机模型,贝叶斯分类器,集成学习模型和决策树,这里,本申请实施例对此不作具体限定。
另外,本申请实施例采用的是预先训练好的机器学习分类模型,该模型是通过对机器学习分类模型进行训练得到的,在具体实施方式中,可以采用以下方式进行训练得到:
获取待训练图像集的图像数据和待训练图像集的色温数据;
分别对待训练图像集的图像数据和待训练图像集的色温数据进行处理,得到待训练图像集的图像特征;
采用待训练图像集的图像特征对机器学习分类模型进行训练,以确定出分类模型中的损失函数取值最小时的模型参数,得到预先训练好的机器学习分类模型。
这里,先通过摄像头获取待训练图像集的图像数据,并且通过色温传感器获取待训练图像集的色温数据。
在获取到待训练图像集的图像数据和待训练图像集的色温数据之后,需要针对待训练图像集中每幅图像的亮度图像分量进行特征提取,在实际应用中,可以采用直方图的形式来获取特征。
具体来说,图5为本申请实施例提供的一种可选的训练机器学习分类器的方法的流程示意图,如图5所示,以支持向量机为例进行训练来说,训练方法可以包括:
S501:获取JEPG数据;
具体来说:对获取到的待训练图像集中的每幅图像,以JPEG格式的图像数据为例来说,从exif中解析出ISP写入的图像数据(stats数据),例如,待训练图像集中每幅图像为120*90为例,每个点都有自己的RGB值。
S502:对stats数据做分割处理;
具体来说,对stats数据做分割处理从而可以得到更多的待训练图像。
S503:计算每个像素点的实际梯度值;
对120*90的stats数据计算每个像素点的横向梯度值和纵向梯度值,将横向梯度值与纵向梯度值之和确定为每个像素点的实际梯度值;
S504:将实际梯度值落入预设的弱梯度值范围的像素点选取出来;
具体来说,实际梯度值的范围一般为0-512,设置弱梯度值的范围为10-100,这样,将落入10-100的实际梯度值都对应的像素点筛选出来。
S505:对选取出来的像素点的G分量构建直方图;
具体来说,图6为本申请实施例提供的一种可选的直方图,如图6所示,直方图的横轴为8个组别的G分量的取值范围,纵轴为G分量的分布情况,图6为本申请实施例提供的一种可选的G分量的直方图,如图6所示,横坐标中的1-8标识G分量的8个取值区间,纵坐标为每个取值区间中所包括的G分量的个数。
S506:获取FD1的时域信息;
具体来说,通过对图像数据的处理得到8个特征,在对色温数据的处理中,通过终端上设置的色温传感器获取FD1的时域信息。
S507:对FD1的时域信息进行时频转换,得到FD1的频域信息;
S508:从频域信息中提取特征;
具体来说,从频域信息中选取出最大的两个频率幅值FDM1和FDM2,以及最大的两个频率幅值对应的频率FDQ1和FDQ2,并对FDM1和FDM2进行归一化,对FDQ1和FDQ2进行归一化,从而得到4个特征;
S509:选择损失函数进行训练更新参数;
具体来说,在得到待训练图像集中每幅图像的图像特征之后,将每幅图像的图像特征输入至支持向量机中,寻找损失函数最小时支持向量机中的参数,以更新支持向量机中的参数。
至此,就可以得到每幅图像的图像特征。
其中,一般机器学习分类模型采用支持向量机模型,使用的损失函数为合页损失函数,合页损失函数的形式为:
Figure BDA0002275777900000091
其中,
Figure BDA0002275777900000092
通过模型训练,可以更新损失函数中的w和b。
图7为本申请实施例提供的一种合页损失函数的分布曲线,其中,模型训练的参数中步长为0.01,损失函数中λ=80000。
也就是说,通过模型训练的方式可以得到更加优化的模型参数,以更新原有的模型得到训练好的机器学习分类模型。
其中,需要说明的是,针对图像数据中提取的8个特征来说,由于从反射模型可以了解到光滑物体的弱边缘有可能反射更多的光源色,这里,利用两个空间滤波器[-1,0,1],[1,0,-1]分别与图像横,纵方向进行卷积,取得图像的横纵方向梯度值,因为stats图像是8bit的,那么横纵方向的梯度范围为gx=[0,255],gy=[0,255],忽略梯度方向,只考虑梯度强度,梯度强度可以用横纵梯度的和表示,g=gx+gy。那么梯度范围g=[0,510]。在这里设定g=[0,100]为弱梯度范围,以弱梯度来模拟物体的弱边缘。
图8a为本申请实施例提供的一种可选的待识别图像,图8b为本申请实施例提供的与图8a对应的梯度图像;如图8a和图8b所示,对图8a中的每个像素点进行计算可以得到图8a中每个像素点的横向梯度值和纵向梯度值,从而得到图8b所示的梯度图像。
室内外场景下的曝光策略通常是有差异的,反映到亮度直方图上,由于室外亮区和暗区的亮度差异极大,发光体的面积差异也很大,通常室内暗区的亮度要低一些,这里同样使用弱梯度(10~100)近似弱边缘的情况,提取场景内弱边缘的亮度累加后分布到8个bin中,每个bin中的亮度归一化后构成8个feature。
在实际应用中,常见的光频率:室外的自然光几乎等于直流分量,而人造光源,北美,日本的交流电通常是60Hz,中国,欧盟,澳大利亚的交流电一般是50Hz,电网配置不发达的国家,交流电频率并不稳定,图9为交流电的电压曲线,如图9所示,50Hz和60Hz的交流电的电压。
那么,处于室外环境下色温传感器的闪烁通道可获取的频率值会很低,而室内环境下人造光源的频率值会高一些。
由图3可以看出,色温传感器的FD1通道几乎可以覆盖全光谱,因此使用FD1通道信息做时频转换,然后提取频谱中幅值最强的两个频率作为FD1Q1和FD1Q2,以及对应的强度FD1M1和FD1M2,FD1Q1和FD1Q2以200hz做归一化,FD1M1和FD1M2以65535做归一化后形成4个feature。
图10a为本申请实施例提供的一种可选的FD1的时域信息的曲线,图10b为本申请实施例与图10a对应的频域信息的曲线,如图10a和图10b所示,经过时频转换之后,可以从频域信息中找到最强的两个频率作为FD1Q1和FD1Q2,以及对应的强度FD1M1和FD1M2。
通过上述对色温数据进行处理的方式对下面4幅图像提取的4个特征的特征值如下表1所示:
表1
FDQ1 FDQ2 FDM1 FDM2
图像1 0.255 0 0.981 0
图像2 0.0001 0.0005 0.952 0.0002
图像3 0.0013 0.232 0.743 0.231
图像4 0.253 0.0001 0.954 0.00001
为了提高识别的准确度,可以在机器学习分类模型训练完成之后再进行测试,在一种可选的实施例中,在采用待训练图像集的图像特征对机器学习分类模型进行训练,以确定出机器学习分类模型中的损失函数取值最小时的模型参数,得到预先训练好的机器学习分类模型之后,该方法还可以包括:
获取待测试图像集的图像数据和待测试图像的色温数据;
分别对待测试图像的图像数据和待测试图像的色温数据进行处理,得到待测试图像的图像特征;
将待测试图像的图像特征输入至预先训练好的机器学习分类模型中,对待测试图像进行识别,得到测试结果;
根据测试结果,判断预先训练好的的机器学习分类模型是否通过。
具体来说,在采用待训练图像集的图像特征对机器学习分类模型训练完成之后,都要对得到训练好的机器学习分类模型进行测试,通过测试结果来判断训练好的模型是否通过测试,只有通过测试的模型才能够用于对图像进行识别,没有通过测试的模型还需要进一步进行训练,以通过测试并用于识别图像。
这里,在对训练好的机器学习分类模型进行测试中,首先要先获取待测试图像集,这里,针对待测试图像集来说,不仅要获取待测试图像集中每幅图像的图像数据,还有每幅图像的色温数据,同样地,采用与识别方法或者训练方法中相同的方式,分别对待测试图像集中的每幅图像的图像数据和每幅图像的色温数据进行处理,得到待测试图像集中每幅图像的图像特征。
再将待测试图像集中每幅图像的图像特征输入至训练好的机器学习分类模型中进行测试,得到测试结果,该测试结果包括待测试图像为室内图像或者室外图像。
为了通过准确率来判断训练好的机器学习分类模型是否通过,在一种可选的实施例中,根据测试结果,判断预先训练好的的机器学习分类模型是否通过,包括:
将测试结果与预设的待测试图像集的测试结果进行比较,确定出测试结果的正确率;
当测试结果的正确率大于等于预设阈值时,确定预先训练好的机器学习分类模型通过;
当测试结果的正确率小于预设阈值时,重新获取新的待训练图像集的图像数据和新的待训练图像集的色温数据,将待训练图像集的图像数据更新为新的待训练图像集的图像数据,将待训练图像集的色温数据更新为新的待训练图像集的色温数据,返回执行分别对待训练图像集的图像数据和待训练图像集的色温数据进行处理,得到待训练图像集的图像特征。
具体来说,将每幅图像的测试结果与预先存储的每幅图像的测试结果进行比较,若相同,说明测试正确,若不同,说明测试错误,这样,可以得到测试正确的百分比,即测试结果的正确率。
再将测试结果的正确率与预设阈值进行比较,例如预设阈值为95%,当测试结果的准确率大于等于95%时,确定训练好的机器学习分类模型通过测试,可以用于图像识别;当测试结果的准确率小于95%时,确定训练好的机器学习分类模型没有通过测试,需要继续进行训练,所以重新获取新的待训练图像集的图像数据和新的待训练图像集的色温数据,对训练好的机器学习分类模型继续进行训练,直至得到通过测试的训练好的机器学习模型,并用于图像识别。
另外,通过本申请实施提供的上述识别方法对数据库中的室内图片1024张,室外图片1134张,闪烁频率的分布从1Hz-135Hz,每次抽取80%的图片作为训练数据对支持向量机进行训练,20%的图片对训练好的支持向量机进行测试,得到的测试结果的正确率如下表2所示:
表2
测试轮数 室内正确率 室外正确率 综合正确率
1 96.78% 96.65% 96.71%
2 96.72% 96.54% 96.63%
3 96.48% 96.92% 96.70%
4 96.39% 96.65% 96.52%
5 96.32% 96.26% 96.29%
平均 96.53% 96.60% 96.56%
通过上述实例,能够准确的室内外判定对AWB算法的应用非常重要,当场景判定为室外时,AWB算法可以较为简单的将色温设置为5000~5000k,色偏差值在0.001~0.005就可以得到比较理想的白平衡效果,针对低亮度下室外缺乏天空参考的场景,以及大面积纯色场景时可以得到远超过竞品机型的效果。
当前场景处于室外时AE算法调节亮度时无需考虑频闪的影响从而可以放心的减少曝光时间来抑制运动模糊。
也就是说,本申请实施例利用单通道的光频率信息,频率强度作为支持向量机的特征参与室内外分类,使用基于弱梯度的亮度特征作为辅组特征进行分类,能够提高对图像进行室内室外的识别准确度。
本申请实施例提供了一种识别方法,该方法应用于一终端中,该方法包括:获取待识别图像的图像数据和待识别图像的色温数据,分别对待识别图像的图像数据和待识别图像的色温数据进行处理,得到待识别图像的图像特征,将待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对待识别图像进行识别,以识别出待识别图像为室内图像或者室外图像;也就是说,在本申请实施例中,通过对获取到的待识别图像的图像数据和色温数据进行处理,得到待识别图像的图像特征之后,将该图像特征输入至预先训练好的机器学习分类模型中进行识别,从而可以识别出该待识别图像为室内图像或者室外图像,这样,对待识别图像的图像特征通过机器学习分类模型进行识别,能够更加准确地识别出待识别图像为室内图像或者室外图像,从而提高了图像识别的准确率,有助于得到效果更加真实的图像。
实施例二
图11为本申请实施例提供的一种终端的结构示意图一,如图11所示,本申请实施例提供了一种终端,包括:
获取模块111,用于获取待识别图像的图像数据和待识别图像的色温数据;
处理模块112,用于分别对待识别图像的图像数据和待识别图像的色温数据进行处理,得到待识别图像的图像特征;
识别模块113,用于将待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对待识别图像进行识别,以识别出待识别图像为室内图像或者室外图像。
可选的,处理模块112,具体用于:
对待识别图像的图像数据进行处理,得到处理后的图像数据;
对待识别图像的色温数据进行处理,得到处理后的色温数据;
利用处理后的图像数据和处理后的色温数据形成待识别图像的图像特征。
可选的,处理模块112对待识别图像的图像数据进行处理,得到处理后的图像数据中,包括:
根据待识别图像的图像数据,计算待识别图像的横向梯度值和待识别图像的纵向梯度值;
将待识别图像的横向梯度值与待识别图像的纵向梯度值之和,确定为待识别图像的实际梯度值;
从待识别图像的实际梯度值中,选取出落入预设的弱梯度值范围内的实际梯度值;
对选取出的实际梯度值的待识别图像的图像分量进行分组,得到八组图像分量,将每组图像分量的个数进行归一化得到处理后的图像数据。
可选的,处理模块112对待识别图像的色温数据进行处理,得到处理后的色温数据中,包括:
对待识别图像的色温数据中的一个通道的时域信息进行时频转换,得到频域信息;
从频域信息中选取出最大的两个频率幅值和最大的两个频率幅值对应的频率,并分别进行归一化,得到处理后的色温数据。
可选的,该终端还用于:
获取待训练图像集的图像数据和待训练图像集的色温数据;
分别对待训练图像集的图像数据和待训练图像集的色温数据进行处理,得到待训练图像集的图像特征;
采用待训练图像集的图像特征对机器学习分类模型进行训练,以确定出机器学习分类模型中的损失函数取值最小时的模型参数,得到预先训练好的机器学习分类模型。
可选的,终端采用待训练图像集的图像特征对所述机器学习分类模型进行训练,以确定出机器学习分类模型中的损失函数取值最小时的模型参数,得到预先训练好的机器学习分类模型之后,还用于:
获取待测试图像集的图像数据和待测试图像集的色温数据;
分别对待测试图像集的图像数据和待测试图像集的色温数据进行处理,得到待测试图像集的图像特征;
将待测试图像集的图像特征输入至预先训练好的机器学习分类模型中,对待测试图像集进行识别,得到测试结果;
根据测试结果,判断预先训练好的机器学习分类模型是否通过。
可选的,终端根据测试结果,判断预先训练好的机器学习分类模型是否通过中,包括:
将测试结果与预设的待测试图像集的测试结果进行比较,确定出测试结果的正确率;
当测试结果的正确率大于等于预设阈值时,确定预先训练好的机器学习分类模型通过;
当测试结果的正确率小于预设阈值时,重新获取新的待训练图像集的图像数据和新的待训练图像集的色温数据,将待训练图像集的图像数据更新为新的待训练图像集的图像数据,将待训练图像集的色温数据更新为新的待训练图像集的色温数据,返回执行分别对待训练图像集的图像数据和待训练图像集的色温数据进行处理,得到待训练图像集的图像特征。
在实际应用中,上述获取模块111、处理模块112和识别模块113可由位于终端上的处理器实现,具体为CPU、微处理器(MPU,Microprocessor Unit)、数字信号处理器(DSP,Digital Signal Processing)或现场可编程门阵列(FPGA,Field Programmable GateArray)等实现。
图12为本申请实施例提供的一种终端的结构示意图二,如图12所示,本申请实施例提供了一种终端1200,包括:
处理器121以及存储有所述处理器121可执行指令的存储介质122,所述存储介质122通过通信总线123依赖所述处理器121执行操作,当所述指令被所述处理器121执行时,执行上述实施例一所述的识别方法。
需要说明的是,实际应用时,终端中的各个组件通过通信总线123耦合在一起。可理解,通信总线123用于实现这些组件之间的连接通信。通信总线123除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图12中将各种总线都标为通信总线123。
本申请实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行实施例一所述的识别方法。
其中,计算机可读存储介质可以是磁性随机存取存储器(ferromagnetic randomaccess memory,FRAM)、只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (10)

1.一种识别方法,其特征在于,所述方法应用于一终端中,所述方法包括:
获取待识别图像的图像数据和所述待识别图像的色温数据;
分别对所述待识别图像的图像数据和所述待识别图像的色温数据进行处理,得到所述待识别图像的图像特征;
将所述待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对所述待识别图像进行识别,以识别出所述待识别图像为室内图像或者室外图像。
2.根据权利要求1所述的方法,其特征在于,所述分别对所述待识别图像的图像数据和所述待识别图像的色温数据进行处理,得到所述待识别图像的图像特征,包括:
对所述待识别图像的图像数据进行处理,得到处理后的图像数据;
对所述待识别图像的色温数据进行处理,得到处理后的色温数据;
利用所述处理后的图像数据和所述处理后的色温数据形成所述待识别图像的图像特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述待识别图像的图像数据进行处理,得到处理后的图像数据,包括:
根据所述待识别图像的图像数据,计算所述待识别图像的横向梯度值和所述待识别图像的纵向梯度值;
将所述待识别图像的横向梯度值与所述待识别图像的纵向梯度值之和,确定为所述待识别图像的实际梯度值;
从所述待识别图像的实际梯度值中,选取出落入预设的弱梯度值范围内的实际梯度值;
对选取出的实际梯度值的待识别图像的图像分量进行分组,得到八组图像分量,将每组图像分量的个数进行归一化得到所述处理后的图像数据。
4.根据权利要求2所述的方法,其特征在于,所述对所述待识别图像的色温数据进行处理,得到处理后的色温数据,包括:
对所述待识别图像的色温数据中的一个通道的时域信息进行时频转换,得到频域信息;
从频域信息中选取出最大的两个频率幅值和最大的两个频率幅值对应的频率,并分别进行归一化,得到所述处理后的色温数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待训练图像集的图像数据和所述待训练图像集的色温数据;
分别对所述待训练图像集的图像数据和所述待训练图像集的色温数据进行处理,得到所述待训练图像集的图像特征;
采用所述待训练图像集的图像特征对机器学习分类模型进行训练,以确定出所述机器学习分类模型中的损失函数取值最小时的模型参数,得到所述预先训练好的机器学习分类模型。
6.根据权利要求5所述的方法,其特征在于,在采用所述待训练图像集的图像特征对所述机器学习分类模型进行训练,以确定出所述机器学习分类模型中的损失函数取值最小时的模型参数,得到所述预先训练好的机器学习分类模型之后,所述方法还包括:
获取待测试图像集的图像数据和所述待测试图像集的色温数据;
分别对所述待测试图像集的图像数据和所述待测试图像集的色温数据进行处理,得到所述待测试图像集的图像特征;
将所述待测试图像集的图像特征输入至所述预先训练好的机器学习分类模型中,对所述待测试图像集进行识别,得到测试结果;
根据所述测试结果,判断所述预先训练好的机器学习分类模型是否通过。
7.根据权利要求6所述的方法,其特征在于,所述根据所述测试结果,判断所述预先训练好的机器学习分类模型是否通过,包括:
将所述测试结果与预设的所述待测试图像集的测试结果进行比较,确定出所述测试结果的正确率;
当所述测试结果的正确率大于等于预设阈值时,确定所述预先训练好的机器学习分类模型通过;
当所述测试结果的正确率小于预设阈值时,重新获取新的待训练图像集的图像数据和所述新的待训练图像集的色温数据,将所述待训练集的图像数据更新为所述新的待训练图像集的图像数据,将所述待训练图像集的色温数据更新为所述新的待训练图像集的色温数据,返回执行所述分别对所述待训练图像集的图像数据和所述待训练图像集的色温数据进行处理,得到所述待训练图像集的图像特征。
8.一种终端,其特征在于,所述终端包括:
获取模块,用于获取待识别图像的图像数据和所述待识别图像的色温数据;
处理模块,用于分别对所述待识别图像的图像数据和所述待识别图像的色温数据进行处理,得到所述待识别图像的图像特征;
识别模块,用于将所述待识别图像的图像特征输入至预先训练好的机器学习分类模型中,对所述待识别图像进行识别,以识别出所述待识别图像为室内图像或者室外图像。
9.一种终端,其特征在于,所述终端包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述的权利要求1至7任一项所述的识别方法。
10.一种计算机存储介质,其特征在于,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行所述的权利要求1至7任一项所述的识别方法。
CN201911122308.2A 2019-11-15 2019-11-15 一种识别方法、终端及计算机存储介质 Pending CN112819005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911122308.2A CN112819005A (zh) 2019-11-15 2019-11-15 一种识别方法、终端及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911122308.2A CN112819005A (zh) 2019-11-15 2019-11-15 一种识别方法、终端及计算机存储介质

Publications (1)

Publication Number Publication Date
CN112819005A true CN112819005A (zh) 2021-05-18

Family

ID=75851899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911122308.2A Pending CN112819005A (zh) 2019-11-15 2019-11-15 一种识别方法、终端及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112819005A (zh)

Similar Documents

Publication Publication Date Title
JP5458905B2 (ja) 画像におけるシャドーの検知装置および検知方法
CN108174185B (zh) 一种拍照方法、装置及终端
US7489345B2 (en) Image processing apparatus, image-taking system, image processing method and image processing program
US9460521B2 (en) Digital image analysis
CN110233971B (zh) 一种拍摄方法及终端、计算机可读存储介质
WO2014128688A1 (en) Method, system and software module for foreground extraction
CN111027489B (zh) 图像处理方法、终端及存储介质
JP7152065B2 (ja) 画像処理装置
CN110798592B (zh) 基于视频图像的物体移动侦测方法、装置、设备及存储介质
CN104636759A (zh) 一种获取图片推荐滤镜信息的方法及图片滤镜信息推荐系统
CN105678245A (zh) 一种基于哈尔特征的靶位识别方法
CN109584175B (zh) 一种图像处理方法及装置
CN102881160A (zh) 一种低照度场景下的户外交通标志识别方法
CN111654643B (zh) 曝光参数确定方法、装置、无人机和计算机可读存储介质
CN102088539A (zh) 一种预拍照画质评价方法和系统
CN110830794B (zh) 光源检测方法、终端及存储介质
CN113177438A (zh) 图像处理方法、设备及存储介质
CN107920205A (zh) 图像处理方法、装置、存储介质和电子设备
WO2013114803A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム
CN109982012B (zh) 图像处理方法及装置、存储介质、终端
CN111666869B (zh) 一种基于宽动态处理的人脸识别方法、装置及电子设备
CN108416782A (zh) 基于视觉识别和光照矫正的烟叶评级方法及系统
Hussain et al. Max-RGB based colour constancy using the sub-blocks of the image
CN108805883B (zh) 一种图像分割方法、图像分割装置及电子设备
CN112819005A (zh) 一种识别方法、终端及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination