CN111753929A - 基于人工智能的分类方法、装置、终端和存储介质 - Google Patents

基于人工智能的分类方法、装置、终端和存储介质 Download PDF

Info

Publication number
CN111753929A
CN111753929A CN202010794242.8A CN202010794242A CN111753929A CN 111753929 A CN111753929 A CN 111753929A CN 202010794242 A CN202010794242 A CN 202010794242A CN 111753929 A CN111753929 A CN 111753929A
Authority
CN
China
Prior art keywords
image
category
test
scene
output value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010794242.8A
Other languages
English (en)
Inventor
贺思颖
陈家君
张亚彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010794242.8A priority Critical patent/CN111753929A/zh
Publication of CN111753929A publication Critical patent/CN111753929A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种基于人工智能的分类方法、装置、终端和存储介质,其中,方法包括,获取待分类图像,并确定待分类图像的场景类别,调用分类模型对待分类图像进行分析,得到待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值,若场景类别为第一光线场景类别,则获取场景类别对应的动态阈值,并根据动态阈值和目标类别输出值确定待分类图像的类别,目标类别输出值为第一类别输出值或第二类别输出值;若场景类别为第二光线场景类别,则根据第一类别输出值和第二类别输出值确定待分类图像的类别。上述方法中,针对不同场景类别的图像,采用不同的分类方式确定图像的分类类别,可以提升对图像分类的准确率。

Description

基于人工智能的分类方法、装置、终端和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于人工智能的分类方法、装置、终端和存储介质。
背景技术
基于深度神经网络的二分类问题是深度学习领域的基础问题之一,如用深度神经网络模型对有人场景和无人场景进行二分类。在应用基于深度神经网络二分类方法解决实际问题时,往往会碰到复杂的光线环境(暗光、逆光等),从而触及深度神经网络模型的分类边界,出现误判或漏判的情况。
实际应用中,离线训练的深度神经网络模型训练完之后,模型中的参数即固定下来,无法更改,即训练好之后的模型具有不可调节性,当需要对复杂的光线环境下的图像进行分类判断时,只能通过获取更多的样本数据对模型进行重新训练来提升模型的分类准确率,效率较低且并不能稳定提升分类准确率。
发明内容
本发明实施例提供了一种基于人工智能的分类方法、装置、终端和存储介质,可以对不同场景类别的图像采用不同的分类方式确定图像的分类类别。
一方面,本发明实施例提供了一种基于人工智能的分类方法,所述方法包括:
获取待分类图像,并确定所述待分类图像的场景类别;
调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值,并根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为所述第一类别输出值或所述第二类别输出值;
若所述场景类别为第二光线场景类别,则根据所述第一类别输出值和所述第二类别输出值确定所述待分类图像的类别。
一方面,本发明实施例提供了一种基于人工智能的分类装置,所述装置包括:
获取模块,用于获取待分类图像;
确定模块,用于确定所述待分类图像的场景类别;
调用模块,用于调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
所述获取模块,还用于若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值;
所述确定模块,还用于根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为第一类别输出值或第二类别输出值;
所述确定模块,还用若所述场景类别为第二光线场景类别,则根据第一类别输出值和第二类别输出值确定所述待分类图像的类别。
一方面,本发明实施例提供了一种终端,包括处理器、输入接口、输出接口和存储器,所述处理器、输入接口、输出接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行所述基于人工智能的分类方法。
一方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行所述基于人工智能的分类方法。
本发明实施例中,可以对不同场景类别的图像采用不同的分类方式确定图像的分类类别,具体为针对复杂光线场景下的图像基于类别输出值与动态阈值的大小关系进行分类,针对正常光线场景下的图像基于不同类别输出值进行分类,上述方法可以提升对图像分类的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于神经网络模型进行二分类的流程示意图;
图2是本发明实施例提供的一种基于人工智能的分类方法的流程示意图;
图3是本发明实施例提供的另一种基于人工智能的分类方法的流程示意图;
图4是本发明实施例提供的一种逆光场景下的图像示意图;
图5是本发明实施例提供的一种暗光场景下的图像示意图;
图6是本发明实施例提供的一种分类准确率与动态阈值的关系曲线示意图;
图7是本发明实施例提供的一种测试动态阈值的确定方法的流程示意图;
图8是本发明实施例提供的另一种测试动态阈值确定方法的流程示意图;
图9是本发明实施例提供的一种显示界面示意图;
图10是本发明实施例提供的一种复杂光线场景下分类准确率与动态阈值的关系曲线示意图;
图11是本发明实施例提供的一种基于人工智能的分类装置的结构示意图;
图12是本发明实施例提供的一种终端的结构示意图。
具体实施方式
基于深度神经网络的二分类问题是深度学习领域的基础问题之一,通过深度神经网络模型对图像进行二分类,可以确定图像中物体所属的类别,实现对物体的自动分类。如图1所示,为当前基于深度神经网络模型进行二分类的流程示意图,具体包括,①输入图像。②图像分析,具体可以使用卷积算子,或其他线性或非线性计算单元的排列组合对数据进行分析。③分类输出,具体用于输出图像属于两个类别中第一类别的第一类别输出值value1以及第二类别的第二类别输出值value2。④类别判断,具体可以采用argmax函数确定value1和value2中的较大值,若value1大于value2,则将输入数据的类别确定为第一类别,若value1小于value2,则将输入数据的类别确定为第二类别。采用上述方式对图像进行分类,可以对大多数图像达到较高的分类准确率,然而,当图像的背景光线为复杂光线(如暗光、逆光)时,模型的分类准确率较低,如采用二分类模型检测图像中是否存在人物,得到有人对应的第一类别输出值以及无人对应的第二类别输出值,当第一类别输出值较大时,确定存在人物,当第二类别输出值较大时,确定不存在人物,然而当图像的背景光线为复杂光线时,容易出现有人情况下第一类别输出值小于第二类别输出值的情况,或无人情况下第一类别输出值大于第二类别输出值的情况,若按照上述基于输出值大确定图像类别的方式对上述复杂光线的图像进行分类,则会造成图像误分类的情况。并且,上述离线训练的模型训练完之后,参数就固定下来之后,无法更改,即训练好之后的模型一般具有不可调节性,从而难以像传统算法那样通过调节一些参数,使算法能够适应不同的复杂光线。
由上可知,在逆光或极度暗光等复杂光线场景下,模型可能对图像的识别精度下降,出现误分类的情况,且难以通过更改模型中的参数解决上述问题,当前,解决这个问题的常见的做法有:①数据重采集:尽可能地在复杂光线下采集真实图像,并对图像进行重新标注,②数据预处理:通过图像增广的办法,模拟真实光线环境的图像,③模型再设计:重新设计模型的结果,如增加深度或宽度,④调整损失函数:设计针对性的损失函数,扩大神经网络的分类边界,⑤优化训练策略:通过设置不同的学习率,优化器等训练策略,使得神经网络在训练阶段可以提升分类能力。
然而数据重采集会面临大规模采集困难和标注耗时的问题,数据预处理有时候很难完全模拟真实的光线环境,模型再设计通常会面临模型复杂度增加的问题,损失函数和训练策略的探索过程需要灵感和实践周期。通过以上方法,确实可以一定程度上改变模型对于图像的分类准确率,但上述方法通常研发周期很长,且不能稳定可靠地使得模型的分类准确率向某一类别图像倾斜,即不能解决神经网络二分类方法对于复杂光线下的图像的进行分类得到的分类准确率较低问题。
基于此,本发明提出了一种基于人工智能的分类方法,以解决复杂光线下的图像的分类准确率较低问题。其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。在本发明实施例提出的基于人工智能的分类方案中,与图1中提供的方案不同的是,本方案除了对输入的图像进行数据分析,输出图像属于两个类别中第一类别的第一类别输出值value1以及第二类别的第二类别输出值value2之外,还会采用光线检测模块检测图像的场景类别,即是否为第一光线场景类别(暗光场景或逆光场景),若否,则基于value1和value2的大小关系确定图像的类别,若图像的场景类别为暗光场景或逆光场景,则说明当前场景的光线极端,通常,二分类算法在这些场景中的准确率会降低,此时,本发明通过判断value1与第一光线场景类别对应的动态阈值thr之间的大小关系,去判断图像的分类类别。
如图2所示,为本方案提供的基于人工智能的分类方法的流程示意图,图2中,本方案中的第一光线场景类别为复杂光线场景(暗光场景或逆光场景),第二光线场景类别为非复杂光线场景的正常光线场景,具体过程如下,①输入图像,具体为,获取到输入的待分类图像。②场景类别判断,具体为采用终端中光线检测模块检测待分类图像的场景类别(是否为暗光或逆光)。③数据分析,具体可以使用卷积算子,或其他线性或非线性计算单元的排列组合对数据进行分析。④分类输出,具体用于输出图像数据属于两个类别中第一类别的第一类别输出值value1以及第二类别的第二类别输出值value2。⑤类别判断,具体可以采用argmax函数确定value1和value2中的较大值,若value1大于value2,则将待分类图像的类别确定为第一类别,若value1小于value2,则将待分类图像的类别确定为第二类别。⑥若光线检测模块确定待分类图像的场景类别属于暗光场景或逆光场景,则基于value1和第一光线场景类别对应的动态阈值thr确定待分类图像的类别,具体为,若value1大于thr,则确定待分类图像的类别为第一类别,若value1小于或等于thr,则确定待分类图像的类别为第二类别。其中,第一光线场景类别对应的动态阈值thr可以基于终端中动态阈值用户主动设定模块进行设定,即用户设置thr,或者,thr也可以由终端中动态阈值自动设定模块进行设定,即终端基于预设规则确定thr。在用户设置thr的情况下,但动态阈值用户主动设定模块未接收到用户设置的动态阈值时,比如在预设时间内没有收到用户的设置,动态阈值自动设定模块自动对动态阈值进行设定。
上述方案中,通过为每个场景类别设置一个较佳的动态阈值,可以提升分类模型对图像分类的准确率,例如,分类模型对图像中的人物进行检测,针对暗光场景下存在人物的图像,分类模型输出的有人对应的第一类别输出值为-0.1,无人对应的第二类别输出值为0.1,暗光场景对应的动态阈值为-0.2,若直接比较两个类别输出值的大小进行分类,则分类结果为无人,导致分类错误,此时,采用基于动态阈值与类别输出值的大小确定图像所属的类别,则第一类别输出值大于动态阈值,分类结果为有人,即可分类正确,以此提升模型对于图像的分类准确率。进一步的,通过调整动态阈值,可以使得模型的分类准确率可以稳定地向某一类别图像的倾斜,例如,模型基于动态阈值和第一类别输出值的大小关系确定图像所属的类别,当第一类别输出值大于或等于动态阈值时,图像属于第一类别,当第一类别输出值小于动态阈值时,图像属于第二类别,则可通过增加动态阈值,使得图像更多的被分类为第二类别,即使得模型的分类准确率可以稳定地向第二类别图像的倾斜,或者,通过减小动态阈值,使得图像更多的被分类为第一类别,即使得模型的分类准确率可以稳定地向第一类别图像的倾斜。
基于上述描述,本方案提供的基于人工智能的分类方法具有以下优点:(1)通过基于动态阈值进行判断,解决模型在应对复杂光线场景时的不可调节性问题。(2)提升模型对于图像的分类准确率。(3)使得模型对于不同类别图像的分类准确率发生定向偏移。
基于上述描述,本发明实施例提供一种基于人工智能的分类方法,请参见图3,该基于人工智能的分类过程可包括以下步骤S301-S304:
S301、终端获取待分类图像,并确定待分类图像的场景类别。
本发明实施例中,待分类图像可以为摄像头抓取的图像,或者人工输入的图像,待分类图像的场景类别具体可以由待分类图像中的背景光线确定,如复杂光线场景类别(暗光场景类别、逆光场景类别等)或正常光线场类别,本方案具体定义了第一光线场景类别和第二光线场景类别,其中,第一光线场景类别可以为复杂光线场景类别,第二光线场景类别为正常光线场景类别。
在一种实现方式中,待分类图像可以为用户上传的图像,终端确定待分类图像的场景类别的具体方式可以为,终端在显示界面中显示图像输入栏以及场景类别输入栏,并获取在图像输入栏中输入的图像,作为待分类图像;以及获取在场景类别输入栏中输入的场景类别,作为待分类图像对应场景类别。即待分类图像的场景类别由用户输入。其中,场景类别输入栏中可以包括多个预设的类别选项,用户可以对选项进行选择以输入待分类图像对应的场景类别。
在一种实现方式中,待分类图像也可以是摄像头获取到的视频中的一帧图像,用户未预先输入待分类图像的场景类别时,终端确定待分类图像的场景类别的具体方式也可以为,终端获取待分类图像中的位置信息,位置信息包括室内或室外,位置信息具体可以为上传待分类图像时输入的,或者,终端基于上传图像的摄像头的位置确定待分类图像的位置信息,若位置信息为室内,则终端在识别出待分类图像中存在室外景象时,确定图像中场景为逆光场景,即场景类别属于第一光线场景类别,具体的,终端可以基于图像识别的方式识别出待分类图像中的物体,当待分类图像中存在汽车、高楼、白云室外景物时,待分类图像中存在室外景象,此时即可确定图像为逆光场景下的图像,符合第一光线场景类别。若位置信息为室外,则在确定待分类图像中亮度低于预设亮度时,确定场景类别为第一光线场景类别,其中,待分类图像中亮度具体可以为图像中每个像素点的平均亮度,预设亮度的具体确定方式可以为,预先获取到多张室外的第一光线场景类别的图像,并将上述多张图像的平均亮度确定为预设亮度;或者,预设亮度也可以由研发人员基于第一光线场景类别的亮度特征进行设定。如图4所示,为本发明提供的一种逆光场景下的图像示意图,图像的位置信息为室内,其具体为拍摄的人物站在窗边的图像,而背景中存在室外景物汽车以及白云,则终端确定该图像的场景类别为逆光场景。
在一种实现方式中,终端确定分类图像的场景类别的具体方式可以为,终端基于训练完成的场景分类模型确定待分类图像所属的场景类别,即通过深度神经网络(DeepNeural Networks,DNN)算法来生成初始场景类别分类模型,并基于人工标注的场景类别来对初始场景类别分类模型进行训练,得到训练优化后的场景类别分类模型来对后续未知类别的图像进行分类。在一个实施例中,可以预先选取K张已经被确定为第一光线场景类别的图像和K张已经被确定为第二光线场景类别的图像,其中,分别将已经确定为第一光线场景类别中的每一张图像作为目标训练图像,提取并生成关于目标训练图像的特征数据,特征数据可以为亮度、像素值、饱和度、对比度等,通过初始场景类别分类模型根据特征数据对目标训练图像进行分类,如果基于最终的类别输出值确定该目标训练图像也为第一光线场景类别,则表明初始场景类别分类模型对该目标训练图像的分类是准确的,针对K张已经确定为第一光线场景类别的训练图像进行分类后,如果准确率达到90%,则认为初始分类模型能够较好地对第一光线场景类别的图像进行分类识别,否则,则需要对初始分类模型中的神经网络参数进行优化,并通过优化后的初始分类模型再次对K张训练图像进行分类,K为正整数,如一万、十万等。同理对上述的第二光线场景类别的图像分别作为目标训练图像对初始场景类别分类模型进行训练以及优化,如果最终对第一光线场景类别的图像的分类准确率和对第二光线场景类别的图像的分类准确率均满足预设的准确率阈值,则确定对初始场景类别分类模型的训练优化完成,可以部署场景类别分类模型以对后续的未知类别的图像进行第一光线场景类别或第二光线场景类别的分类识别。具体实现中,可以预先选取多张如图4所示的逆光场景图像对初始场景类别分类模型进行训练,使得模型能够对逆光场景图像进行分类,以及,预先选取如图5所示的暗光场景图像对初始场景类别分类模型进行训练,使得模型能够对暗光场景图像进行分类。
S302、终端调用分类模型对待分类图像进行分析,得到待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值。
本发明实施例中,终端获取到待分类图像之后,可以调用分类模型对待分类图像进行分析,其中,分类模型具体可以为二分类模型,即模型由两个输出值,即待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值,上述分类模型可应用于人物检测,如第一类别对应图像中存在人物,第二类别对应图像中不存在人物,或者,也可以应用于动物分类,如第一类别对应猫类别,第二类别对应狗类别。
具体的,如图3所示,为一种调用分类模型对待分类图像进行分析的流程示意图,具体包括,①输入待分类图像,即将待分类图像输入至分类模型中。②图像分析,具体可以使用卷积算子,或其他线性或非线性计算单元的排列组合对待分类图像进行分析。③分类输出,具体用于输出待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值。其中,终端基于人工标注的分类类别来对初始分类模型进行训练,得到上述分类模型,具体可以为,终端获取样本图像集合,将样本图像集合输入至初始分类模型中进行迭代训练,以对初始分类模型中的参数进行更新,当检测到参数更新后的初始分类模型满足预设条件时,将参数更新后的初始分类模型确定为用于对待分类图像进行分类的分类模型,其中,预设条件可以为分类模型的损失低于预设阈值。
需要说明的是,输入至分类模型中的待分类图像具体可以为归一化处理后的图像,使得分类模型得到的第一类别输出值与第二类别输出值在原点附近成对称分布,如第一类别输出值为0.5,则第二类别输出值为-0.5。上述方式可以使得不同类别的输出值可以得到区分,如图像对应的真实类别为第一类别,则第一类别输出值会大于第二类别输出值,且大于0。其中,图像归一化处理的具体方式可以为利用图像中对仿射变换具有不变性的矩来确定变换函数的参数,然后利用此参数确定的变换函数把原始图像变换为一个标准形式的图像。
S303、若场景类别为第一光线场景类别,则终端获取场景类别对应的动态阈值,并根据动态阈值和目标类别输出值确定待分类图像的类别。
本发明实施例中,目标类别输出值为第一类别输出值或第二类别输出值,第一光线场景类别可以为复杂光线场景,即逆光场景、暗光场景等,终端根据动态阈值和目标类别输出值确定待分类图像的类别的具体方式可以为,若第一类别输出值大于动态阈值,则将待分类图像的类别确定为第一类别,若第一类别输出值小于或等于动态阈值,则将待分类图像的类别确定为第二类别。或者,终端根据动态阈值和目标类别输出值确定待分类图像的类别的具体方式也可以为,若第二类别输出值小于或等于动态阈值,则将待分类图像的类别确定为第一类别,若第二类别输出值大于动态阈值,则将待分类图像的类别确定为第二类别。
具体实现中,场景类别对应的动态阈值的具体确定方式可以为,终端获取第一光线场景类别下的样本图像集合,并确定第一光线场景类别下的测试动态阈值,终端根据测试动态阈值和每张样本图像通过分类模型进行分析后确定的测试输出值,确定针对每张样本图像的测试分类类别,其中,样本图像集合中包括多张被标记为预设分类类别的样本图像,预设分类类别为第一类别或第二类别,测试输出值包括第一类别测试输出值或第二类别测试输出值,终端检测第一类别测试输出值是否大于动态阈值,若是,则确定测试分类类别为第一类别,若否,则确定测试分类类别为第二类别。
进一步的,终端根据样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定在测试动态阈值下分类模型的分类准确率,其中,分类准确率可以为样本图像中测试分类类别与预设分类类别匹配的样本图像的数量与样本图像总数量之间的比值,若分类准确率不满足预设条件,则修改测试动态阈值的值,以便于基于新的测试动态阈值确定新的分类准确率,若分类准确率满足预设条件,则将测试动态阈值确定为第一光线场景类别对应的动态阈值。其中,预设条件可以为分类准确率大于预设准确率,可选的,终端也可以接收用户输入的动态阈值,作为第一光线场景类别对应的动态阈值,其中,终端在检测到待分类图像的场景类别为第一光线场景类别时,提醒用户是否需要调节动态阈值,基于用户对动态阈值的调节,实现对当前场景的模型矫正。通过上述方式,可以基于设置不同的动态阈值,实现对于分类准确率的调整,相较于现有的单纯基于第一类别输出值与第二类别输出值的大小确定图像类别的方式,实现了基于简单参数调整的方式对模型的输出准确率进行调整,这种方法通过光线检测与动态阈值判断,可以在不需要对模型进行重新训练的情况下,提升模型对复杂光线下图像的分类准确率。
可选的,由于不同应用场景对于第一类别图像的分类准确率需求与第二类别图像的分类准确率需求存在不同,例如,在告警系统中,第一类别图像对应异常情况图像,第二类别图像对应正常情况图像,其中,异常情况可以为有人物、有火情、由漏水情况等,对于异常情况图像,需要较高的分类准确率,以避免出现异常情况后因未及时告警带来较大损失,而对于正常情况图像,分类准确率要求则较低,因即使对正常情况图像分类错误出现误告警,也不会带来较大的损失。因此,在本方案中根据样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定的在测试动态阈值下分类模型的分类准确率中,分类具体准确率包括针对第一类别对应的样本图像进行分类得到的第一分类准确率以及针对第二类别对应的样本图像进行分类得到的第二分类准确率,则终端检测分类准确率是否满足预设条件时,具体检测第一分类准确率与第一预设准确率的大小关系,以及第二分类准确率与第二预设准确率的大小关系,若第一分类准确率大于第一预设准确率,且第二分类准确率大于第二预设准确率,则测试动态阈值对应的分类准确率满足预设条件;若第一分类准确率小于第一预设准确率,或第二分类准确率小于第二预设准确率,则测试动态阈值对应的分类准确率不满足预设条件,其中,第一预设准确率大于所述第二预设准确率。通过上述方式,可以单向提升模型对于某一类别的图像的分类准确率,使得模型对于不同类别图像的分类准确率发生定向偏移。
举例说明,采用二分类模型对图像中的人物进行检测,针对暗光场景下有人物的图像,二分类模型输出的有人对应的第一类别输出值为-0.1,无人对应的第二类别输出值为0.1,若直接比较两个类别输出值的大小进行分类,则分类结果为无人,导致分类错误,此时,采用本方案提供的方式,将动态阈值确定为-0.2,则第一类别输出值大于动态阈值,分类结果为有人,即可分类正确,上述方式提升了对有人情况下的分类精度,降低了无人情况下的分类精度,使得分类准确率发生了可调控的偏移,以更好的适用于不同的应用场景。通过上述方式,可以在不需要对模型进行重新训练的情况下,使已训练好的模型的分类准确率稳定可靠地向一个类别的图像倾斜。
在一种实现方式中,同一场景类别下还可以分为不同的亮度等级,终端获取场景类别对应的动态阈值的方式也可以为,当场景类别为第一光线场景类别时,确定场景类别的等级,等级由待分类图像的亮度确定,根据场景类别等级从至少一个参考动态阈值中选取出场景类别对应的动态阈值,其中,待分类图像的亮度具体可以为待分类图像中各个像素点的平均亮度,例如,针对暗光场景,当亮度范围在[0-60]时,场景类别的等级为第一等级,对应的参考动态阈值为-1,当亮度在[61-120]时,场景类别的等级为第二等级,对应的参考动态阈值为-0.5,当待分类图像的亮度为50时,确定待分类图像的场景类别的等级为第一等级,对应的动态阈值为-1。通过对场景类别划分不同的等级,可以使得不同的图像更具区分性,也可以使得对复杂光线场景下的图像的分类准确率更高。
需要说明的是,为了快速的找到一个能对第一光线场景下图像进行准确分类的测试动态阈值,本方案提供了一种测试动态阈值的确定方式,具体如图7中实施例所示。
S304、若场景类别为第二光线场景类别,则终端根据第一类别输出值和第二类别输出值确定待分类图像的类别。
本发明实施例中,第二光线场景类别可以为正常光线场景,终端第一类别输出值和第二类别输出值确定待分类图像的类别的具体方式可以为,若第一类别输出值大于第二类别输出值,则将待分类图像的类别确定为第一类别,若第一类别输出值小于或等于第二类别输出值,则将待分类图像的类别确定为第二类别。
本发明实施例中,终端获取待分类图像,并确定待分类图像的场景类别,调用分类模型对待分类图像进行分析,得到待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值,若场景类别为第一光线场景类别,则获取场景类别对应的动态阈值,并根据动态阈值和目标类别输出值确定待分类图像的类别,目标类别输出值为第一类别输出值或第二类别输出值;若场景类别为第二光线场景类别,则根据第一类别输出值和第二类别输出值确定待分类图像的类别。上述方法中,针对不同场景类别的图像,采用不同的分类方式确定图像的分类类别,可以提升对图像分类的准确率。并且,通过基于动态阈值进行分类判断,可以提升模型对于图像的分类准确率,进一步的,通过调整动态阈值,可以使得模型的分类准确率可以稳定地提升某一类别图像的倾斜,例如,模型基于动态阈值和第一类别输出值的大小关系确定图像所属的类别,当第一类别输出值大于或等于动态阈值时,图像属于第一类别,当第一类别输出值小于动态阈值时,图像属于第二类别,则可通过增加动态阈值,使得图像更多的被分类为第二类别,即使得模型的分类准确率可以稳定地向第二类别图像的倾斜,或者,通过减小动态阈值,使得图像更多的被分类为第一类别,即使得模型的分类准确率可以稳定地向第一类别图像的倾斜。如图6所示,为本发明实施例提供的分类准确率与动态阈值的关系曲线示意图,其中,分类准确率包括第一类别图像分类准确率,第二类别图像分类准确率以及总体分类准确率,从图6中可以看出,当动态阈值较小(如等于-2)时,可以使得更多的图像被分类为第一类别,使得第一类别图像分类准确率较高,第二类别图像分类准确率较低,总体分类准确率较低,当动态阈值适中(如等于0)时,可以使得总体分类准确率较高,当动态阈值较大(如等于2)时,可以使得更多的图像被分类为第二类别,使得第一类别图像分类准确率较低,第二类别图像分类准确率较高。
基于上述描述,本发明实施例提供了一种测试动态阈值的确定方法,请参见图7,该测试动态阈值的具体方式可包括以下步骤S701-S704:
S701、终端获取测试图像集合。
本发明实施例中,测试图像集合中包括多张测试图像,测试图像可以为第一光线场景类别下图像,也可以为第二光线场景类别下的图像,在此不做限定,具体实现中,终端可以获取到摄像头上传的视频数据,并将视频数据中每一帧图像确定为测试图像,以此构建测试图像集合,或者,终端也可以接收用户上传的多张图像,并以用户上传的图像构建测试图像集合。
S702、终端调用分类模型对测试图像集合进行分析,得到测试类别输出值集合。
本发明实施例中,测试类别输出值集合中包括测试图像集合中每张测试图像的测试类别输出值,测试类别可以为第一类别或第二类别,则测试类别输出值为测试图像属于第一类别的第一类别初始输出值或测试图像属于第二类别的第二类别初始输出值,其中,第一类别或第二类别可以由用户预先设定,如第一类别对应图像中存在人物,第二类别对应图像中不存在人物。具体的,终端获取到测试图像集合之后,采用分类模型对测试集合中每张测试图像进行分析,得到多个第一类别输出值和第二类别输出值,并以此构建测试类别输出值集合。
S703、终端确定表示测试类别输出值集合的离散程度的离散程度值。
本发明实施例中,终端获取到测试类别输出值集合之后,可以基于测试集合中的各个测试类别输出值,计算表示测试类别输出值集合的离散程度的离散程度值,该离散程度值具体可以为各个测试类别输出值的标准差,具体的,针对测试集合中的N张第一类别的测试图像,得到的N张测试图像属于第一类别的输出值集合为{x1、x2、x3.......xn},则测试类别输出值集合的离散程度值σ为:
Figure BDA0002623063390000131
S704、终端对离散程度值进行加权处理,得到第一光线场景类别下的测试动态阈值。
本发明实施例中,终端确定测试类别输出值集合的离散程度值之后,可以采用加权系数n对离散程度值进行加权处理,得到第一光线场景类别下的测试动态阈值。其中,离散程度值越大,加权系数n越小,具体实现中。离散程度值越大,则表明测试集合中不同图像的测试类别输出值差异较大,则此时需要设置一个较小的动态阈值,才能使大部分图像的测试类别输出值大于动态阈值,使得模型对于第一类别测试图像的分类保持较高的准确性。离散程度值越小,则表明测试集合中不同图像的测试类别输出值差异较小,则此时可以设置一个接近于平均输出值的动态阈值,即可使得大部分图像的测试类别输出值大于动态阈值。需要说明的是,加权系数n具体可以由预先设置的离散程度值与加权系数的对应关系确定,或者,基于用户输入的加权系数值确定。终端根据上述测试动态阈值和每张样本图像通过分类模型进行分析后确定的测试输出值确定针对每张样本图像的测试分类类别,以及基于测试分类类别与样本图像预设的分类类别的匹配结果确定测试动态阈值是否满足预设条件。
如图8所示,为本发明实施例提供的一种测试动态阈值确定方法的流程示意图,首先获取测试图像集合,其中,测试图像集合中包括{测试图像a……测试图像b,测试图像c},调用分类模型测试图像集合中的测试图像进行分析,得到测试类别输出值集合{value-a……value-b,value-c},计算上述测试类别输出值集合的标准差σ,并采用加权系数n对标准差σ进行加权处理,得到测试动态阈值thr=σ*n,其中,n可以为负数。
上述方式中,相较于随机获取测试动态阈值进行测试,基于测试测试类别输出值集合的离散程度值预先确定一个较佳的测试动态阈值,可减少对于测试动态阈值的调试次数,快速的确定一个满足预设条件的测试动态阈值,作为第一光线场景类别对应的动态阈值,提升动态阈值的确定效率。
在一种实施场景中,终端可以提供如图9所示的显示界面,在该显示界面中,用户可以输入多张图像,并选择每张图像对应的场景类别,具体的,终端接收至少一张图像;并在显示界面中显示至少一张图像以及每张图像对应的场景类别选项,场景类别选项包括逆光场景选项、暗光场景选项和正常光线场景选项;终端接收针对每张图像的场景类别选项的选择操作,并对选择操作对应的场景类别选项进行标记;终端将至少一张图像中任一张图像作为待分类图像,并根据待分类图像中被标记的场景类别选项确定待分类图像的场景类别,即将被标记的场景类别选项对应的场景类别确定为待分类图像的场景类别。可选的,当用户未对图像的场景进行选择时,终端可以基于训练完成的场景分类模型确定图像的场景类别,并显示在显示界面中,用户也可以对显示的场景类别进行修改,实施本申请实施例,终端可以自动对用户输入的图像的场景类别进行判断,也可以随时接受用户对于场景类别的修改操作,在识别场景类别分类错误时,可以基于用户的操作进行修改,提升了场景类别分类的准确率,用户也不用对每张图像的场景类别都进行标注,提升了用户操作的便捷性。进一步的,终端基于场景类别对应的动态阈值以及分类模型对图像进行分类,使得对于图像的分类准确率更高。其中,在动态阈值的设定过程中,终端可以输出如图6所示的分类准确率与动态阈值的关系曲线示意图,以供用户根据对于分类准确率的需求选择动态阈值,或者,终端可以输出如图10所示的复杂光线场景下分类准确率与动态阈值的关系曲线,以供用户基于图像的场景选择合适的动态阈值,图10中,当动态阈值从0开始逐渐减小时,逆光场景和暗光场景下图像的分类准确率都出现了不同程度的提升。
基于上述基于人工智能的分类方法实施例的描述,本发明实施例还公开了一种基于人工智能的分类装置,该基于人工智能的分类装置可以是运行于终端中的一个计算机程序(包括程序代码),也可以是包含在终端中的一个实体装置。该基于人工智能的分类装置可以执行图3和图7所示的方法。请参见图11,该基于人工智能的分类装110包括:获取模块1101、确定模块1102、调用模块1103,其中,
获取模块1101,用于获取待分类图像;
确定模块1102,用于确定所述待分类图像的场景类别;
调用模块1103,用于调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
所述获取模块1101,还用于若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值;
所述确定模块1102,还用于根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为第一类别输出值或第二类别输出值;
所述确定模块1102,还用若所述场景类别为第二光线场景类别,则根据第一类别输出值和第二类别输出值确定所述待分类图像的类别。
在一种实现方式中,所述获取模块1101,还用于获取第一光线场景类别下的样本图像集合,
所述确定模块1102,还用于:确定所述第一光线场景类别下的测试动态阈值,所述样本图像集合中包括多张被标记为预设分类类别的样本图像,所述预设分类类别为所述第一类别或所述第二类别;
根据所述测试动态阈值和所述每张样本图像通过所述分类模型进行分析后确定的测试输出值,确定针对每张样本图像的测试分类类别,所述测试输出值为第一类别测试输出值或第二类别测试输出值;
根据所述样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定在所述测试动态阈值下所述分类模型的分类准确率;
若所述分类准确率不满足预设条件,则修改所述测试动态阈值的值,以便于基于新的测试动态阈值确定新的分类准确率;
若所述分类准确率满足预设条件,则将所述测试动态阈值确定为所述第一光线场景类别对应的动态阈值。
在一种实现方式中,所述分类准确率包括针对所述第一类别对应的样本图像进行分类得到的第一分类准确率,以及针对所述第二类别对应的样本图像进行分类得到的第二分类准确率,所述确定模块1102,具体用于:
若所述第一分类准确率大于第一预设准确率,且所述第二分类准确率大于第二预设准确率,则所述测试动态阈值对应的分类准确率满足预设条件;
若所述第一分类准确率小于第一预设准确率,或所述第二分类准确率小于第二预设准确率,则所述测试动态阈值对应的分类准确率不满足预设条件;
所述第一预设准确率大于所述第二预设准确率。
在一种实现方式中,所述确定模块1102,具体用于:
获取测试图像集合,所述测试图像集合中包括多张测试图像;
调用所述分类模型对所述测试图像集合进行分析,得到测试类别输出值集合,所述测试类别输出值集合中包括测试图像集合中每张测试图像的测试类别输出值,所述测试类别输出值为测试图像属于第一类别的第一类别初始输出值或测试图像属于第二类别的第二类别初始输出值;
确定表示所述测试类别输出值集合的离散程度的离散程度值;
对所述离散程度值进行加权处理,得到所述第一光线场景类别下的测试动态阈值。
在一种实现方式中,所述第一光线场景类别包括逆光场景或暗光场景,所述第二光线场景类别包括正常光线场景,所述获取模块1101,具体用于:
接收至少一张图像;
在显示界面中显示所述至少一张图像以及每张图像对应的场景类别选项,所述场景类别选项包括逆光场景选项、暗光场景选项和正常光线场景选项;
接收针对所述每张图像的场景类别选项的选择操作,并对所述选择操作对应的场景类别选项进行标记;
将所述至少一张图像中任一张图像作为待分类图像;
所述确定模块1102,具体用于:根据所述待分类图像中被标记的场景类别选项确定所述待分类图像的场景类别。
在一种实现方式中,所述第一光线场景类别包括逆光场景,所述待分类图像携带有位置信息;
所述获取模块,还用于获取所述待分类图像中的位置信息,所述位置信息包括室内或室外;
所述确定模块1102,具体用于:
若所述位置信息为室内,则在确定所述待分类图像中存在室外景象时,确定所述场景类别为第一光线场景类别;
若所述位置信息为室外,则在确定所述待分类图像中亮度低于预设亮度时,确定所述场景类别为第一光线场景类别。
在一种实现方式中,所述获取模块1101,具体用于:
当场景类别为第一光线场景类别时,确定所述场景类别的等级,所述等级由所述待分类图像的亮度确定;
根据所述场景类别等级从至少一个参考动态阈值中选取出所述场景类别对应的动态阈值;
其中,不同的场景类别等级所对应的参考动态阈值不相同。
本发明实施例中,获取模块1101获取待分类图像,确定模块1102确定待分类图像的场景类别,调用模块1103调用分类模型对待分类图像进行分析,得到待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值,若场景类别为第一光线场景类别,则获取模块1101获取场景类别对应的动态阈值,确定模块1102根据动态阈值和目标类别输出值确定待分类图像的类别,若场景类别为第二光线场景类别,则确定模块1102根据第一类别输出值和第二类别输出值确定待分类图像的类别。上述方法中,针对不同场景类别的图像,采用不同的分类方式确定图像的分类类别,可以提升对图像分类的准确率。
请参见图12,为本发明实施例提供的一种终端的结构示意图。如图12所示,该终端包括:至少一个处理器1201,输入设备1203,输出设备1204,存储器1205,至少一个通信总线1202。其中,通信总线1202用于实现这些组件之间的连接通信。其中,存储器1205可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1205可选的还可以是至少一个位于远离前述处理器1201的存储装置。其中处理器1201可以结合图11所描述的装置,存储器1205中存储一组程序代码,且处理器1201,输入设备1203,输出设备1204调用存储器1205中存储的程序代码,用于执行以下操作:
处理器1201,用于获取待分类图像,并确定所述待分类图像的场景类别;
处理器1201,用于调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
处理器1201,用于若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值,并根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为所述第一类别输出值或所述第二类别输出值;
处理器1201,用于若所述场景类别为第二光线场景类别,则根据所述第一类别输出值和所述第二类别输出值确定所述待分类图像的类别。
在一种实现方式中,处理器1201,具体用于:
获取第一光线场景类别下的样本图像集合,并确定所述第一光线场景类别下的测试动态阈值,所述样本图像集合中包括多张被标记为预设分类类别的样本图像,所述预设分类类别为所述第一类别或所述第二类别;
根据所述测试动态阈值和所述每张样本图像通过所述分类模型进行分析后确定的测试输出值,确定针对每张样本图像的测试分类类别,所述测试输出值为第一类别测试输出值或第二类别测试输出值;
根据所述样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定在所述测试动态阈值下所述分类模型的分类准确率;
若所述分类准确率不满足预设条件,则修改所述测试动态阈值的值,以便于基于新的测试动态阈值确定新的分类准确率;
若所述分类准确率满足预设条件,则将所述测试动态阈值确定为所述第一光线场景类别对应的动态阈值。
在一种实现方式中,所述分类准确率包括针对所述第一类别对应的样本图像进行分类得到的第一分类准确率,以及针对所述第二类别对应的样本图像进行分类得到的第二分类准确率,处理器1201,具体用于:
若所述第一分类准确率大于第一预设准确率,且所述第二分类准确率大于第二预设准确率,则所述测试动态阈值对应的分类准确率满足预设条件;
若所述第一分类准确率小于第一预设准确率,或所述第二分类准确率小于第二预设准确率,则所述测试动态阈值对应的分类准确率不满足预设条件;
所述第一预设准确率大于所述第二预设准确率。
在一种实现方式中,处理器1201,具体用于:
获取测试图像集合,所述测试图像集合中包括多张测试图像;
调用所述分类模型对所述测试图像集合进行分析,得到测试类别输出值集合,所述测试类别输出值集合中包括测试图像集合中每张测试图像的测试类别输出值,所述测试类别输出值为测试图像属于第一类别的第一类别初始输出值或测试图像属于第二类别的第二类别初始输出值;
确定表示所述测试类别输出值集合的离散程度的离散程度值;
对所述离散程度值进行加权处理,得到所述第一光线场景类别下的测试动态阈值。
在一种实现方式中,所述第一光线场景类别包括逆光场景或暗光场景,所述第二光线场景类别包括正常光线场景,处理器1201,具体用于:
接收至少一张图像;
在显示界面中显示所述至少一张图像以及每张图像对应的场景类别选项,所述场景类别选项包括逆光场景选项、暗光场景选项和正常光线场景选项;
接收针对所述每张图像的场景类别选项的选择操作,并对所述选择操作对应的场景类别选项进行标记;
将所述至少一张图像中任一张图像作为待分类图像,并根据所述待分类图像中被标记的场景类别选项确定所述待分类图像的场景类别。
在一种实现方式中,所述第一光线场景类别包括逆光场景,所述待分类图像携带有位置信息,处理器1201,具体用于:
获取所述待分类图像中的位置信息,所述位置信息包括室内或室外;
若所述位置信息为室内,则在确定所述待分类图像中存在室外景象时,确定所述场景类别为第一光线场景类别;
若所述位置信息为室外,则在确定所述待分类图像中亮度低于预设亮度时,确定所述场景类别为第一光线场景类别。
在一种实现方式中,处理器1201,具体用于:
当场景类别为第一光线场景类别时,确定所述场景类别的等级,所述等级由所述待分类图像的亮度确定;
根据所述场景类别等级从至少一个参考动态阈值中选取出所述场景类别对应的动态阈值;
其中,不同的场景类别等级所对应的参考动态阈值不相同。
本发明实施例中,处理器1201获取待分类图像,并确定待分类图像的场景类别,处理器1201调用分类模型对待分类图像进行分析,得到待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值,若场景类别为第一光线场景类别,则处理器1201获取场景类别对应的动态阈值,并根据动态阈值和目标类别输出值确定待分类图像的类别,若场景类别为第二光线场景类别,则处理器1201根据第一类别输出值和第二类别输出值确定待分类图像的类别。上述方法中,针对不同场景类别的图像,采用不同的分类方式确定图像的分类类别,可以提升对图像分类的准确率。
本发明实施例中所述模块,可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
应当理解,在本发明实施例中,所称处理器1201可以是中央处理模块(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
总线1202可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互联(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等,该总线1202可以分为地址总线、数据总线、控制总线等,为便于表示,图12仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种基于人工智能的分类方法,其特征在于,所述方法包括:
获取待分类图像,并确定所述待分类图像的场景类别;
调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值,并根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为所述第一类别输出值或所述第二类别输出值;
若所述场景类别为第二光线场景类别,则根据所述第一类别输出值和所述第二类别输出值确定所述待分类图像的类别。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一光线场景类别下的样本图像集合,并确定所述第一光线场景类别下的测试动态阈值,所述样本图像集合中包括多张被标记为预设分类类别的样本图像,所述预设分类类别为所述第一类别或所述第二类别;
根据所述测试动态阈值和所述每张样本图像通过所述分类模型进行分析后确定的测试输出值,确定针对每张样本图像的测试分类类别,所述测试输出值为第一类别测试输出值或第二类别测试输出值;
根据所述样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定在所述测试动态阈值下所述分类模型的分类准确率;
若所述分类准确率不满足预设条件,则修改所述测试动态阈值的值,以便于基于新的测试动态阈值确定新的分类准确率;
若所述分类准确率满足预设条件,则将所述测试动态阈值确定为所述第一光线场景类别对应的动态阈值。
3.如权利要求2所述的方法,其特征在于,所述分类准确率包括针对所述第一类别对应的样本图像进行分类得到的第一分类准确率,以及针对所述第二类别对应的样本图像进行分类得到的第二分类准确率;
若所述第一分类准确率大于第一预设准确率,且所述第二分类准确率大于第二预设准确率,则所述测试动态阈值对应的分类准确率满足预设条件;
若所述第一分类准确率小于第一预设准确率,或所述第二分类准确率小于第二预设准确率,则所述测试动态阈值对应的分类准确率不满足预设条件;
所述第一预设准确率大于所述第二预设准确率。
4.如权利要求2所述的方法,其特征在于,所述确定所述第一光线场景类别下的测试动态阈值,包括:
获取测试图像集合,所述测试图像集合中包括多张测试图像;
调用所述分类模型对所述测试图像集合进行分析,得到测试类别输出值集合,所述测试类别输出值集合中包括测试图像集合中每张测试图像的测试类别输出值,所述测试类别输出值为测试图像属于第一类别的第一类别初始输出值或测试图像属于第二类别的第二类别初始输出值;
确定表示所述测试类别输出值集合的离散程度的离散程度值;
对所述离散程度值进行加权处理,得到所述第一光线场景类别下的测试动态阈值。
5.如权利要求1所述的方法,其特征在于,所述获取待分类图像,并确定所述待分类图像的场景类别,包括:
接收至少一张图像;
在显示界面中显示所述至少一张图像以及每张图像对应的场景类别选项,所述场景类别选项包括逆光场景选项、暗光场景选项和正常光线场景选项;
接收针对所述每张图像的场景类别选项的选择操作,并对所述选择操作对应的场景类别选项进行标记;
将所述至少一张图像中任一张图像作为待分类图像,并根据所述待分类图像中被标记的场景类别选项确定所述待分类图像的场景类别。
6.如权利要求1所述的方法,其特征在于,所述待分类图像携带有位置信息,所述方法还包括:
获取所述待分类图像中的位置信息,所述位置信息包括室内或室外;
若所述位置信息为室内,则在确定所述待分类图像中存在室外景象时,确定所述场景类别为第一光线场景类别;
若所述位置信息为室外,则在确定所述待分类图像中亮度低于预设亮度时,确定所述场景类别为第一光线场景类别。
7.如权利要求1所述的方法,其特征在于,所述获取所述场景类别对应的动态阈值,包括:
当场景类别为第一光线场景类别时,确定所述场景类别的等级,所述等级由所述待分类图像的亮度确定;
根据所述场景类别等级从至少一个参考动态阈值中选取出所述场景类别对应的动态阈值;
其中,不同的场景类别等级所对应的参考动态阈值不相同。
8.一种基于人工智能的分类装置,其特征在于,所述装置包括:
获取模块,用于获取待分类图像;
确定模块,用于确定所述待分类图像的场景类别;
调用模块,用于调用所述分类模型对所述待分类图像进行分析,得到所述待分类图像属于第一类别的第一类别输出值以及属于第二类别的第二类别输出值;
所述获取模块,还用于若所述场景类别为第一光线场景类别,则获取所述场景类别对应的动态阈值;
所述确定模块,还用于根据所述动态阈值和目标类别输出值确定所述待分类图像的类别,所述目标类别输出值为第一类别输出值或第二类别输出值;
所述确定模块,还用若所述场景类别为第二光线场景类别,则根据第一类别输出值和第二类别输出值确定所述待分类图像的类别。
9.如权利要求8所述的装置,其特征在于,
所述获取模块,还用于获取第一光线场景类别下的样本图像集合;
所述确定模块,还用于:
确定所述第一光线场景类别下的测试动态阈值,所述样本图像集合中包括多张被标记为预设分类类别的样本图像,所述预设分类类别为所述第一类别或所述第二类别;
根据所述测试动态阈值和所述每张样本图像通过所述分类模型进行分析后确定的测试输出值,确定针对每张样本图像的测试分类类别,所述测试输出值为第一类别测试输出值或第二类别测试输出值;
根据所述样本图像集合中每张样本图像的测试分类类别与预设分类类别的匹配结果,确定在所述测试动态阈值下所述分类模型的分类准确率;
若所述分类准确率不满足预设条件,则修改所述测试动态阈值的值,以便于基于新的测试动态阈值确定新的分类准确率;
若所述分类准确率满足预设条件,则将所述测试动态阈值确定为所述第一光线场景类别对应的动态阈值。
10.如权利要求9所述的装置,其特征在于,所述确定模块,具体用于:
获取测试图像集合,所述测试图像集合中包括多张测试图像;
调用所述分类模型对所述测试图像集合进行分析,得到测试类别输出值集合,所述测试类别输出值集合中包括测试图像集合中每张测试图像的测试类别输出值,所述测试类别输出值为测试图像属于第一类别的第一类别初始输出值或测试图像属于第二类别的第二类别初始输出值;
确定表示所述测试类别输出值集合的离散程度的离散程度值;
对所述离散程度值进行加权处理,得到所述第一光线场景类别下的测试动态阈值。
11.如权利要求8所述的装置,其特征在于,所述获取模块,具体用于:
接收至少一张图像;
在显示界面中显示所述至少一张图像以及每张图像对应的场景类别选项,所述场景类别选项包括逆光场景选项、暗光场景选项和正常光线场景选项;
接收针对所述每张图像的场景类别选项的选择操作,并对所述选择操作对应的场景类别选项进行标记;
将所述至少一张图像中任一张图像作为待分类图像;
所述获取模块,用于根据所述待分类图像中被标记的场景类别选项确定所述待分类图像的场景类别。
12.如权利要求8所述的装置,其特征在于,所述第一光线场景类别包括逆光场景,所述待分类图像携带有位置信息,
所述获取模块,还用于获取所述待分类图像中的位置信息,所述位置信息包括室内或室外;
所述确定模块,还用于:
若所述位置信息为室内,则在确定所述待分类图像中存在室外景象时,确定所述场景类别为第一光线场景类别;
若所述位置信息为室外,则在确定所述待分类图像中亮度低于预设亮度时,确定所述场景类别为第一光线场景类别。
13.如权利要求8所述的装置,其特征在于,所述获取模块,具体用于:
当场景类别为第一光线场景类别时,确定所述场景类别的等级,所述等级由所述待分类图像的亮度确定;
根据所述场景类别等级从至少一个参考动态阈值中选取出所述场景类别对应的动态阈值;
其中,不同的场景类别等级所对应的参考动态阈值不相同。
14.一种终端,其特征在于,包括处理器、输入接口、输出接口和存储器,所述处理器、输入接口、输出接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN202010794242.8A 2020-08-07 2020-08-07 基于人工智能的分类方法、装置、终端和存储介质 Pending CN111753929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010794242.8A CN111753929A (zh) 2020-08-07 2020-08-07 基于人工智能的分类方法、装置、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010794242.8A CN111753929A (zh) 2020-08-07 2020-08-07 基于人工智能的分类方法、装置、终端和存储介质

Publications (1)

Publication Number Publication Date
CN111753929A true CN111753929A (zh) 2020-10-09

Family

ID=72713212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010794242.8A Pending CN111753929A (zh) 2020-08-07 2020-08-07 基于人工智能的分类方法、装置、终端和存储介质

Country Status (1)

Country Link
CN (1) CN111753929A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396125A (zh) * 2020-12-01 2021-02-23 中国第一汽车股份有限公司 一种定位测试场景的分类方法、装置、设备及存储介质
CN112541550A (zh) * 2020-12-16 2021-03-23 南京掌控网络科技有限公司 一种基于图像分类的冰箱完整性判断方法及电子设备
CN113837286A (zh) * 2021-09-26 2021-12-24 展讯通信(天津)有限公司 一种图像分类方法及相关设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396125A (zh) * 2020-12-01 2021-02-23 中国第一汽车股份有限公司 一种定位测试场景的分类方法、装置、设备及存储介质
CN112396125B (zh) * 2020-12-01 2022-11-18 中国第一汽车股份有限公司 一种定位测试场景的分类方法、装置、设备及存储介质
CN112541550A (zh) * 2020-12-16 2021-03-23 南京掌控网络科技有限公司 一种基于图像分类的冰箱完整性判断方法及电子设备
CN113837286A (zh) * 2021-09-26 2021-12-24 展讯通信(天津)有限公司 一种图像分类方法及相关设备

Similar Documents

Publication Publication Date Title
US20210089895A1 (en) Device and method for generating a counterfactual data sample for a neural network
CN111753929A (zh) 基于人工智能的分类方法、装置、终端和存储介质
CN109886335B (zh) 分类模型训练方法及装置
EP3989104A1 (en) Facial feature extraction model training method and apparatus, facial feature extraction method and apparatus, device, and storage medium
KR20210110823A (ko) 이미지 인식 방법, 인식 모델의 트레이닝 방법 및 관련 장치, 기기
CN111814902A (zh) 目标检测模型训练方法、目标识别方法、装置和介质
CN111652317B (zh) 基于贝叶斯深度学习的超参数图像分割方法
CN111401246B (zh) 一种烟雾浓度检测方法、装置、设备及存储介质
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN109740553B (zh) 一种基于识别的图像语义分割数据筛选方法及系统
CN111310837A (zh) 车辆改装识别方法、装置、系统、介质和设备
CN115880260A (zh) 基站施工的检测方法、装置、设备及计算机可读存储介质
CN112784494B (zh) 假阳性识别模型的训练方法、目标识别方法及装置
CN114387451A (zh) 异常图像检测模型的训练方法、装置及介质
CN113128522A (zh) 目标识别方法、装置、计算机设备和存储介质
CN115797701A (zh) 目标分类方法、装置、电子设备及存储介质
CN111507420A (zh) 轮胎信息获取方法、装置、计算机设备和存储介质
CN116152191A (zh) 基于深度学习的显示屏裂纹缺陷检测方法、装置及设备
CN112686851B (zh) 一种图像检测方法、装置及存储介质
CN115620083A (zh) 模型训练方法、人脸图像质量评价方法、设备及介质
CN113076169A (zh) 基于卷积神经网络的用户界面测试结果分类方法及装置
KR20210089044A (ko) 물체 인식을 위한 학습 데이터를 선택하는 방법 및 상기 방법을 이용하여 학습된 물체 인식 모델을 이용하여 물체를 인식하는 물체 인식 장치
CN111242047A (zh) 图像处理方法和装置、电子设备及计算机可读存储介质
CN112348043B (zh) 机器学习中的特征筛选方法和装置
CN116563770B (zh) 车辆颜色的检测方法、装置及设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030897

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination