CN111507467A - 神经网络模型的训练方法、装置、计算机设备及存储介质 - Google Patents
神经网络模型的训练方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111507467A CN111507467A CN201910101300.1A CN201910101300A CN111507467A CN 111507467 A CN111507467 A CN 111507467A CN 201910101300 A CN201910101300 A CN 201910101300A CN 111507467 A CN111507467 A CN 111507467A
- Authority
- CN
- China
- Prior art keywords
- image
- user
- classification result
- recognition model
- image recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种神经网络模型的训练方法、装置、计算机设备及存储介质,包括:获取目标用户的用户图像;将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果;读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。由于针对性的训练能够使图像识别模型中的权重参数进行适应性调整,调整后的图像识别模型对于该用户的图像识别准确率得到提高,模型的鲁棒性也更加稳定。
Description
技术领域
本发明实施例涉及模型训练领域,尤其是一种神经网络模型的训练方法、装置、计算机设备及存储介质。
背景技术
模拟人类实际神经网络的数学方法问世以来,人们已慢慢习惯了把这种人工神经网络直接称为神经网络。神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景,特别在智能控制中,人们对神经网络的自学习功能尤其感兴趣,并且把神经网络这一重要特点看作是解决自动控制中控制器适应能力这个难题的关键钥匙之一。
现有技术中,神经网络模型在图像处理领域具有较好的表现,通过采用大量同类型的图片反复的对神经网络模型进行训练,使神经网络模型学习到识别一种或多种图像类别的能力。神经网络模型一旦训练至收敛状态后,其中的权重参数就会被固定无法进行变更。因此,现有技术中神经网络模型的个性化环境的适应能力有限,神经网络模型识别的准确率有待提高。
发明内容
本发明实施例提供能够通过在用户使用过程中,针对用户的实际使用需要对通用的图像识别模型进行定向训练,使其生成与用户具有对应权重参数的神经网络模型的训练方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种神经网络模型的训练方法,包括:
获取目标用户的用户图像;
将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;
读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;
根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
可选地,所述将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果之前,包括:
将所述用户图像输入至预设的环境分类模型中,其中,所述环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型;
读取所述环境分类模型输出的环境分类结果;
识别所述环境分类结果表征的环境场景是否训练至收敛状态;
当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别。
可选地,所述识别所述环境分类结果表征的环境场景是否训练至收敛状态包括:
以所述环境分类结果为检索条件在预设的历史分类信息数据库中进行查找,获取与所述环境分类结果表征的环境场景具有映射关系的训练信息,其中,所述训练信息中包括历史记录中所述图像识别模型对包含所述环境场景的用户图像的分类准确率;
将所述分类准确率与预设的准确率阈值进行比对;
当所述分类准确率小于所述准确率阈值时,确认所述环境场景未训练至收敛状态;否则,则确认所述环境场景已训练至收敛状态。
可选地,所述当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别之后,包括:
在预设的策略数据库中查找与所述环境场景具有映射关系的图像增强策略;
根据所述图像增强策略对所述用户图像进行图像增强处理,以生成派生于所述用户图像的增强图像。
可选地,所述图像识别模型为多通道模型,所述将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果包括:
将所述用户图像与所述增强图像分别输入至所述图像识别模型的不同通道内;
比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致;
当所述用户图像的分类结果与所述增强图像的分类结果一致时,确认输出所述用户图像的分类结果。
可选地,所述比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致之后,包括:
当所述用户图像的分类结果与所述增强图像的分类结果不一致时,计算所述用户图像的特征向量与所述增强图像的特征向量之间的第一向量差值;
将所述第一向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述增强图像的分类结果趋于一致。
可选地,所述验证信息中包括目标用户认定的所述用户图像的验证分类结果,所述根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数包括:
当所述验证信息表征的验证结果为所述分类结果错误时,在预设的特征数据库中查找与所述验证分类结果具有映射关系的标定特征向量;
计算所述标定特征向量与所述用户图像的特征向量之间的第二向量差值;
将所述第二向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述验证分类结果趋于一致。
为解决上述技术问题,本发明实施例还提供一种神经网络模型的训练装置,包括:
获取模块,用于获取目标用户的用户图像;
处理模块,用于将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;
读取模块,用于读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;
执行模块,用于根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
可选地,所述神经网络模型的训练装置还包括:
第一处理子模块,用于将所述用户图像输入至预设的环境分类模型中,其中,所述环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型;
第一读取子模块,用于读取所述环境分类模型输出的环境分类结果;
第一识别子模块,用于识别所述环境分类结果表征的环境场景是否训练至收敛状态;
第一执行子模块,用于当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别。
可选地,所述神经网络模型的训练装置还包括:
第二处理子模块,用于以所述环境分类结果为检索条件在预设的历史分类信息数据库中进行查找,获取与所述环境分类结果表征的环境场景具有映射关系的训练信息,其中,所述训练信息中包括历史记录中所述图像识别模型对包含所述环境场景的用户图像的分类准确率;
第一比对子模块,用于将所述分类准确率与预设的准确率阈值进行比对;
第二执行子模块,用于当所述分类准确率小于所述准确率阈值时,确认所述环境场景未训练至收敛状态;否则,则确认所述环境场景已训练至收敛状态。
可选地,所述神经网络模型的训练装置还包括:
第三处理子模块,用于在预设的策略数据库中查找与所述环境场景具有映射关系的图像增强策略;
第三执行子模块,用于根据所述图像增强策略对所述用户图像进行图像增强处理,以生成派生于所述用户图像的增强图像。
可选地,所述图像识别模型为多通道模型,所述神经网络模型的训练装置还包括:
第四处理子模块,用于将所述用户图像与所述增强图像分别输入至所述图像识别模型的不同通道内;
第二比对子模块,用于比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致;
第四执行子模块,用于当所述用户图像的分类结果与所述增强图像的分类结果一致时,确认输出所述用户图像的分类结果。
可选地,所述神经网络模型的训练装置还包括:
第五执行子模块,用于当所述用户图像的分类结果与所述增强图像的分类结果不一致时,计算所述用户图像的特征向量与所述增强图像的特征向量之间的第一向量差值;
第五处理子模块,用于将所述第一向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述增强图像的分类结果趋于一致。
可选地,所述验证信息中包括目标用户认定的所述用户图像的验证分类结果,所述神经网络模型的训练装置还包括:
第六执行子模块,用于当所述验证信息表征的验证结果为所述分类结果错误时,在预设的特征数据库中查找与所述验证分类结果具有映射关系的标定特征向量;
第一计算子模块,用于计算所述标定特征向量与所述用户图像的特征向量之间的第二向量差值;
第六处理子模块,用于将所述第二向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述验证分类结果趋于一致。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述神经网络模型的训练方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述神经网络模型的训练方法的步骤。
本发明实施例的有益效果是:在获取用户的用户图像后,将用户图像输入至通用型的图像识别模型中,其中,该图像识别模型已经被训练至收敛。将图像识别模型输出的分类结果进行显示,并获取到用户对于该分类结果的进行评判的验证信息,根据验证信息中表征的判断结果,再对图像识别模型进行针对性的训练,使图像识别模型具有个性化的识别能力,由于针对性的训练能够使图像识别模型中的权重参数进行适应性调整,调整后的图像识别模型对于该用户的图像识别准确率得到提高,模型的鲁棒性也更加稳定。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例神经网络模型的训练方法的基本流程示意图;
图2为本发明实施例根据用户图像表征的环境场景确认用户图像是否进行识别的流程示意图;
图3为本发明实施例通过历史记录判断用户图像表征的环境场景是否参与训练的流程示意图;
图4为本发明实施例根据环境场景对用户图像进行增强的流程示意图;
图5为本发明实施例通过增强图像的分类结果控制用户分类结果输出的流程示意图;
图6为本发明实施例根据增强图像对图像识别模型的权重参数进行调整的流程示意图;
图7为本发明实施例通过验证分类结果对图像识别模型进行训练的流程示意图;
图8为本发明实施例神经网络模型的训练装置基本结构示意图;
图9为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体请参阅图1,图1为本实施例神经网络模型的训练方法的基本流程示意图。
如图1所示,一种神经网络模型的训练方法,包括:
S1100、获取目标用户的用户图像;
本实施方式中,目标用户的用户图像是指:目标用户采集或者上传的图像。用户图像不局限于目标用户的人脸图像、目标用户任一身体部位或者全身照片,而是包括目标用户持有的终端采集或者上传的所有图像。目标用户是指使用本实施方式中图像识别模型的任意用户。
用户图像中的图像内容与图像识别模型的识别类型相对应,例如:若图像识别模型用于人脸图像的身份信息、年龄、性别或颜值等,则用户图像的内容中包括人脸图像;若图像识别模型用于肢体动作的识别,则用户图像的内容中包括人体身体形态图像;若图像识别模型用于文字信息的识别,则用户图像的内容中包括文字图像。
S1200、将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;
将获取得到的用户图像输入至预设的图像识别模型中,其中,图像识别模型为预先训练至收敛状态的神经网络模型。图像识别模型识别的图像类别能够是(不限于):对用户的身份信息进行识别、对用户字体进行提取或对用户的肢体动作进行识别等。
本实施方式中,图像识别模型能够为已经训练至收敛状态的卷积神经网络模型(CNN),但是图像识别模型还能够是:深度神经网络模型(DNN)、循环神经网络模型(RNN)或者上述三种网络模型的变形模型。
图像识别模型在训练时,采用大量的与其设定的分类类别相关的图像进行训练,训练至收敛状态后,能够准确的识别相关图像。例如,采用大量的人脸图像进行训练,使图像识别模型具有判断用户身份信息的能力;采用大量字体图像进行训练,使图像识别模型具有识别文字的能力;采用大量的肢体动作图像进行,使图像识别模型具有识别肢体动作的能力。
图像识别模型对输入其中的用户图像进行图像识别得到对应的分类结果。分类结果即图像识别模型对用户图像的识别结果。不同类型的图像识别模型输出的分类结果不同。例如,图像识别模型为对用户的身份信息进行识别时,其输出的分类结果为用户图像表征的用户身份信息;图像识别模型为对用户字体进行提取时,输出的分类结果为用户图像记载的文字信息;图像识别模型为对用户的肢体动作进行识别时,输出的分类结果为用户图像中肢体动作表征的信息。
S1300、读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;
图像识别模型输出用户图像的分类结果后,用户终端读取该分类结果进行显示,目标用户根据显示的内容对分类结果进行查看。例如,用户上传人脸图像进行人脸识别时,分类结果显示的用户图像的姓名是否与用户的认知一致,若是,则用户确认分类结果正确;否则,则用户确认分类结果错误。在一些实施方式中,当用户确认分类结果错误时,还需要输入用户对该用户图像的正确认知作为验证分类结果。
目标用户对分类结果的判断结果被记录生成验证信息。即验证信息中包括目标用户对分类结果的判断信息。
S1400、根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
用户终端读取验证信息中的内容,并根据验证信息记载的内容对图像识别模型进行进一步地训练。
当验证信息中记录的信息为“确认”时,即目标用户认为分类结果与其认知是相同的,此时,对图像识别模型中卷积层的权重不进行更改。
当验证信息中记录的信息为“错误”时,即目标用户认为分类结果与其认知是不相同,此时,需要通过图像识别模型中的损失函数,计算用户图像的特征向量与正确判断结果对应的特征向量之间的向量差值,并根据向量差值进行反向传播,对图像识别模型的权重参数进行矫正。将用户图像的特征向量与向量差值相乘得到权重的梯度,梯度乘上一个梯度参数并取反后加到图像识别模型的之前的权重中,完成对权重参数的更新。
通过上述的步骤过程,反复循环迭代的对图像识别模型中的权重参数进行矫正,直至对用户图像的分类结果与用户的认知一致后结束训练。经过再次训练的图像识别模型能够提取到更加细致的甄别用户图像与其他图像之间区别的图像特征,进而将上述细致的甄别特征转化为目标用户独有的特征,以此提高图像识别模型针对目标用户识别准确率。例如,反复的训练能够使图像识别模型学习到目标用户面部特征与其他用户之间的细微差别或者在不同环境场景中的细微差别,或者学习到用户书写的文字的习惯,又或者学习到用户肢体动作与常规肢体动作之间的差距。
上述实施方式中在获取用户的用户图像后,将用户图像输入至通用型的图像识别模型中,其中,该图像识别模型已经被训练至收敛。将图像识别模型输出的分类结果进行显示,并获取到用户对于该分类结果的进行评判的验证信息,根据验证信息中表征的判断结果,再对图像识别模型进行针对性的训练,使图像识别模型具有个性化的识别能力,由于针对性的训练能够使图像识别模型中的权重参数进行适应性调整,调整后的图像识别模型对于该用户的图像识别准确率得到提高,模型的鲁棒性也更加稳定。
在一些实施方式中,当图像识别模型用于人脸识别或者人身识别时,为增强图像识别模型在不同环境场景中人脸识别或者人身识别的准确率,在获取了用户图像后,先对用户图像所处的环境类别进行识别,以判断当前用户图像表征的环境场景是否进行训练。请参阅图2,图2为本实施例根据用户图像表征的环境场景确认用户图像是否进行识别的流程示意图。
如图2所示,图1所示的S1200步骤之前,包括:
S1111、将所述用户图像输入至预设的环境分类模型中,其中,所述环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型;
将用户图像输入至预设的环境分类模型中,其中,环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型。环境分类模型能够对用户人脸图像或者人身图像所处的环境进行分类,例如环境分类结果为:室内、室外、江河湖海或者高山大川等。即识别用户图像中人脸图像或人身图像中背景图像所表征的环境信息。
本实施方式中,环境分类模型能够为已经训练至收敛状态的卷积神经网络模型(CNN),但是环境分类模型还能够是:深度神经网络模型(DNN)、循环神经网络模型(RNN)或者上述三种网络模型的变形模型。
环境分类模型在训练时,采用大量的记录有环境场景的图片进行训练,训练至收敛状态后,环境分类模型能够准确的识别输入图像中的环境场景。
S1112、读取所述环境分类模型输出的环境分类结果;
环境分类模型对用户图像进行分类后,读取该环境分类模型输出的环境分类结果。环境分类结果中记载用户图像所属的环境场景。
S1113、识别所述环境分类结果表征的环境场景是否训练至收敛状态;
为增加图像识别模型的训练效率,对于识别准确率较高的(例如,99.5%)环境场景,或者同类环境场景中图像识别模型连续识别准确达20次时,则判断该环境场景模式下图像识别模型已经训练至收敛,继续训练模型的收益率会很低,停止对该环境场景下对图像识别模型的训练。
S1114、当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别。
当该环境场景的判断准确率未达到上述标准时,则判断该环境场景模式下图像识别模型未训练至收敛,该场景模式下的用户图像需要进一步地训练。
通过对用户图像中的环境场景进行辨识,识别各个环境场景下图像识别模型的识别准确率,对于准确率高于一定标准的环境场景下的用户图像进行训练排除,有利于提高图像识别模型训练的收益率,缩短图像识别模型训练的周期,节约了训练资源。
在一些实施方式中,为持续的对图像识别模型进行训练,将历史中图像识别模型进行图像识别的识别信息进行记录,通过该历史记录识别不同环境场景的用户图像是否需要进行图像识别训练。请参阅图3,图3为本实施例通过历史记录判断用户图像表征的环境场景是否参与训练的流程示意图。
如图3所示,图2所示的S1113步骤包括:
S1121、以所述环境分类结果为检索条件在预设的历史分类信息数据库中进行查找,获取与所述环境分类结果表征的环境场景具有映射关系的训练信息,其中,所述训练信息中包括历史记录中所述图像识别模型对包含所述环境场景的用户图像的分类准确率;
本实施方式中建立历史分类信息数据库,历史分类信息数据库中记录有图像识别模型过往历史中每一次分类时,用户图像的表征的环境场景的环境分类结果。并且以环境场景的类别为聚类节点,统计图像识别模型针对各个环境场景的用户图像的分类准确率,并将该准确率记录在各个环境场景对应的训练信息中。因此,通过环境分类结果就能够在历史分类信息数据库中进行查找与其对应的训练信息。
S1122、将所述分类准确率与预设的准确率阈值进行比对;
将当前用户图像对应的环境场景对应的分类准确率与预设的准确率阈值进行比对,准确率阈值为衡量分类识别模型对于各个环境场景的识别准确率是否达标的数值。例如,准确率阈值为99.5%,需要指出的是,准确率阈值的取值不局限于此,根据具体应用场景的不同,在一些实施方式中,准确率阈值的取值能够更大或者更小。
S1123、当所述分类准确率小于所述准确率阈值时,确认所述环境场景未训练至收敛状态;否则,则确认所述环境场景已训练至收敛状态。
当比对的结果分类准确率小于准确率阈值时,则判断该环境场景模式下图像识别模型未训练至收敛,该场景模式下的用户图像需要进一步地训练。当比对的结果分类准确率大于等于准确率阈值时,则判断该环境场景模式下图像识别模型已经训练至收敛,继续训练模型的收益率会很低,停止对该环境场景下对图像识别模型的训练。
通过对历史分类结果进行记录,方便统计各个环境场景下图像识别模型的识别准确率,不同环境场景准确率的分别统计,有利于分析重点训练对象,进而从整体上提升图像识别模型的识别准确率。
在一些实施方式中,为了进一步地提升图像识别模型的鲁棒性,在对用户图像进行识别时,首先生成派生于用户图像的增强图像,其中,增强图像的增强策略需要根据环境场景进行选定。请参阅图4,图4为本实施例根据环境场景对用户图像进行增强的流程示意图。
请参阅图4,如图4所示的S1114步骤之后,包括:
S1131、在预设的策略数据库中查找与所述环境场景具有映射关系的图像增强策略;
本实施方式中设置策略数据库,策略数据库中记载各种用于增强用户图像的增强策略。策略数据库记载的策略主要分类两大类,其中,第一类为用户图像的环境场景较为简单,例如室内环境或者背景像素的背景颜色组成较为单一,如背景像素值包括三种或者三种以下的像素值组成的,此时,图像增强策略为向用户图像中增加其他背景元素,以使增强后的用户图像中人脸图像或人身图像与背景图像之间的混淆度增强。其中,背景元素的增加为随机抽取策略数据库的背景元素进行增加。第二类为用户图像的环境场景较为复杂,例如在室外环境或者背景颜色组成较为复杂,如背景像素值包括三种以上的像素值组成的,此时,图像增强策略为降低用户图像的亮度与锐化参数,以降低人脸图像或人身图像与背景图像之间的对比度,以使增强后的用户图像中人脸图像或人身图像与背景图像之间的混淆度增强。
S1132、根据所述图像增强策略对所述用户图像进行图像增强处理,以生成派生于所述用户图像的增强图像。
根据图像增强策略对用户图像进行图像增强处理,生成派生于用户图像的增强图像。其中,增强图像派生于用户图像,其记载的对于图像识别模型识别起作用的特征与用户图像完全一致,不同点在于,由于背景图像中人脸图像或人身图像与背景图像之间的混淆度增强,增加了图像识别模型训练时的判断难度,通过增强图像进行训练后的图像识别模型的鲁棒性更强,对于复杂环境的识别准确率提高。
在一些实施方式中,图像识别模型为多通道图像识别模型,即图像识别模型至少包括两个卷积通道,将用户图像和增强图像分别输入至图像识别模型中对图像识别模型进行训练,以增强图像识别模型的鲁棒性。请参阅图5,图5为本实施例通过增强图像的分类结果控制用户分类结果输出的流程示意图。
如图1所示S1200步骤包括:
S1211、将所述用户图像与所述增强图像分别输入至所述图像识别模型的不同通道内;
本实施方式中,图像识别模型中包括两个卷积通道,其中,一个卷积通道用于对用户图像的图像特征进行提取,另一个则对增强图像的特征记性提取。但是图像识别模型不局限于两个卷积通道,根据具体应用场景的不同,在一些实施方式中,当增强图像为N张时,图像识别模型的卷积通道为N+1个。
将用户图像与增强图像分别输入至图像识别模型的不同通道内,以使图像处理模型分别提取用户图像与增强图像的特征向量。
S1212、比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致;
比对图像识别模型计算得到的用户图像的分类结果与增强图像的分类结果是否一致,比对的方式为计算用户图像的分类结果与增强图像的分类结果之间的汉明距离,当两个分类结果之间的汉明距离等于零时,则表明用户图像的分类结果与增强图像的分类结果一致;否则,则表明用户图像的分类结果与增强图像的分类结果不一致。
S1213、当所述用户图像的分类结果与所述增强图像的分类结果一致时,确认输出所述用户图像的分类结果。
当比对结果为用户图像的分类结果与增强图像的分类结果一致时,则表明图像识别模型能够避免被增强图像的干扰内容所影响,正确的对用户图像中人脸图像或人身图像的特征进行了提取,不需要进一步地训练,确认输出用户图像的分类结果。
在一些实施方式中,当用户图像的分类结果与增强图像的分类结果不一致时,需要对图像识别模型进行训练,以增强图像识别模型的鲁棒性。请参阅图6,图6为本实施例根据增强图像对图像识别模型的权重参数进行调整的流程示意图。
如图6所示,图5所示的S1212步骤之后,包括:
S1221、当所述用户图像的分类结果与所述增强图像的分类结果不一致时,计算所述用户图像的特征向量与所述增强图像的特征向量之间的第一向量差值;
当用户图像的分类结果与增强图像的分类结果不一致时,计算用户图像的特征向量与增强图像的特征向量之间的第一向量差值。计算方式为通过损失函数计算两个特征向量之间的向量差值,并将该向量差值定义为第一向量差值。其中,第一向量差值的数值表明图像识别装置提取的特征向量与正确的特征向量之间的差距。
需要说明的是S1213与S1222是属于同一个处理步骤的不同处理方式,具有选择执行的属性,不具有明确的先后关系。
S1222、将所述第一向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述增强图像的分类结果趋于一致。
根据第一向量差值进行反向传播,对图像识别模型的权重参数进行矫正。将增强图像的特征向量与第一向量差值相乘得到权重的梯度,梯度乘上一个梯度参数(例如,0.05,但不限于)并取反后加到图像识别模型增强图像的卷积通道之前的权重中,完成对图像识别模型增强图像的卷积通道权重参数的更新。更新权重参数后的图像识别模型增强图像的卷积通道提取的增强图像特征向量趋向于提取的用户图像的特征向量。
通过上述的步骤过程,反复循环迭代的对图像识别模型中的权重参数进行矫正,直至对增强图像的分类结果与用户图像的分类结果一致后结束训练。
由于背景图像中人脸图像或人身图像与背景图像之间的混淆度增强,增加了图像识别模型训练时的判断难度,通过增强图像进行训练后的图像识别模型的鲁棒性更强,对于复杂环境的识别准确率提高。
在一些实施方式中,当验证信息表征的用户确认结果为分类错误时,需要用户输入正确的分类结果,定义该分类结果为验证分类结果,需要通过验证分类结果对图像识别模型进行训练。请参阅图7,图7为本实施例通过验证分类结果对图像识别模型进行训练的流程示意图。
如图7所示,图1所示的S1400步骤包括:
S1411、当所述验证信息表征的验证结果为所述分类结果错误时,在预设的特征数据库中查找与所述验证分类结果具有映射关系的标定特征向量;
当验证信息中记录的信息为“错误”时,即目标用户认为分类结果与其认知是不相同。需要在特征数据库中查找验证分类结果具有映射关系的标定特征向量。特征数据库中存储有设定的用户图像的标定特征向量,标定特征向量为正确的具有参考性的特征向量。例如,用户图像为人脸图像或者人身图像时,存储在特征数据库中人为标定的用户人脸图像或者人身图像的标定特征向量,验证分类结果则为目标用户输入的用户图像正确的名称,通过该名称在特征数据库中查找到与验证分类结果具有映射关系的标定特征向量。
S1412、计算所述标定特征向量与所述用户图像的特征向量之间的第二向量差值;
计算用户图像的特征向量与标定特征向量之间的第二向量差值。计算方式为通过损失函数计算两个特征向量之间的向量差值,并将该向量差值定义为第二向量差值。其中,第二向量差值的数值表明图像识别装置提取的特征向量与正确的特征向量之间的差距。
S1413、将所述第二向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述验证分类结果趋于一致。
根据第二向量差值进行反向传播,对图像识别模型的权重参数进行矫正。将用户图像的特征向量与第二向量差值相乘得到权重的梯度,梯度乘上一个梯度参数(例如,0.05,但不限于)并取反后加到图像识别模型之前的权重中,完成对图像识别模型增强图像的卷积通道权重参数的更新。更新权重参数后的图像识别模型提取的特征向量趋向于标定特征特征向量。
通过上述的步骤过程,反复循环迭代的对图像识别模型中的权重参数进行矫正,直至对用户图像的分类结果与用户的认知一致后结束训练。
通过标定特征向量的设定,使图像识别模型的训练收敛具有方向和参照,能够加快对图像识别模型的训练,提高训练的效率。
为解决上述技术问题,本发明实施例还提供一种神经网络模型的训练装置。
具体请参阅图8,图8为本实施例神经网络模型的训练装置基本结构示意图。
如图8所示,一种神经网络模型的训练装置,包括:获取模块2100、处理模块2200、读取模块2300和执行模块2400。其中,获取模块2100用于获取目标用户的用户图像;处理模块2200用于将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;读取模块2300用于读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;执行模块2400用于根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
神经网络模型的训练装置在获取用户的用户图像后,将用户图像输入至通用型的图像识别模型中,其中,该图像识别模型已经被训练至收敛。将图像识别模型输出的分类结果进行显示,并获取到用户对于该分类结果的进行评判的验证信息,根据验证信息中表征的判断结果,再对图像识别模型进行针对性的训练,使图像识别模型具有个性化的识别能力,由于针对性的训练能够使图像识别模型中的权重参数进行适应性调整,调整后的图像识别模型对于该用户的图像识别准确率得到提高,模型的鲁棒性也更加稳定。
在一些实施方式中,所述神经网络模型的训练装置还包括:第一处理子模块、第一读取子模块和第一执行子模块。其中,第一处理子模块用于将所述用户图像输入至预设的环境分类模型中,其中,所述环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型;第一读取子模块用于读取所述环境分类模型输出的环境分类结果;第一识别子模块用于识别所述环境分类结果表征的环境场景是否训练至收敛状态;第一执行子模块用于当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别。
在一些实施方式中,所述神经网络模型的训练装置还包括:第二处理子模块、第一比对子模块和第二执行子模块。其中,第二处理子模块用于以所述环境分类结果为检索条件在预设的历史分类信息数据库中进行查找,获取与所述环境分类结果表征的环境场景具有映射关系的训练信息,其中,所述训练信息中包括历史记录中所述图像识别模型对包含所述环境场景的用户图像的分类准确率;第一比对子模块用于将所述分类准确率与预设的准确率阈值进行比对;第二执行子模块用于当所述分类准确率小于所述准确率阈值时,确认所述环境场景未训练至收敛状态;否则,则确认所述环境场景已训练至收敛状态。
在一些实施方式中,所述神经网络模型的训练装置还包括:第三处理子模块和第三执行子模块。其中,第三处理子模块用于在预设的策略数据库中查找与所述环境场景具有映射关系的图像增强策略;第三执行子模块用于根据所述图像增强策略对所述用户图像进行图像增强处理,以生成派生于所述用户图像的增强图像。
在一些实施方式中,所述图像识别模型为多通道模型,所述神经网络模型的训练装置还包括:第四处理子模块、第二比对子模块和第四执行子模块。其中,第四处理子模块用于将所述用户图像与所述增强图像分别输入至所述图像识别模型的不同通道内;第二比对子模块用于比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致;第四执行子模块用于当所述用户图像的分类结果与所述增强图像的分类结果一致时,确认输出所述用户图像的分类结果。
在一些实施方式中,所述神经网络模型的训练装置还包括:第五执行子模块和第五处理子模块。其中,第五执行子模块用于当所述用户图像的分类结果与所述增强图像的分类结果不一致时,计算所述用户图像的特征向量与所述增强图像的特征向量之间的第一向量差值;第五处理子模块用于将所述第一向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述增强图像的分类结果趋于一致。
在一些实施方式中,所述验证信息中包括目标用户认定的所述用户图像的验证分类结果,所述神经网络模型的训练装置还包括:第六执行子模块、第一计算子模块和第六处理子模块。其中,第六执行子模块用于当所述验证信息表征的验证结果为所述分类结果错误时,在预设的特征数据库中查找与所述验证分类结果具有映射关系的标定特征向量;第一计算子模块用于计算所述标定特征向量与所述用户图像的特征向量之间的第二向量差值;第六处理子模块用于将所述第二向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述验证分类结果趋于一致。
为解决上述技术问题,本发明实施例还提供计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种神经网络模型的训练方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种神经网络模型的训练方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中获取模块2100、处理模块2200、读取模块2300和执行模块2400的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有人脸图像关键点检测装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
计算机设备通过在对快速模型进行训练时,无需对参与训练的样本图像进行标记,节约了标记所需要的时间和花费的精力,提高了训练的速度。同时,直接计算辅助模型输出的表征样本图像特征的特征向量,与快速模型输出的表征样本图像特征的特征向量之间的距离(欧式距离和/或余弦距离)并进行反向传播,采用这种方法将神经网络模型的训练转化为一种单纯的回归算法,能够最大限度的缩短训练时间,且能够保证训练完成时快速模型输出的准确率。
本发明还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例神经网络模型的训练方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
Claims (10)
1.一种神经网络模型的训练方法,其特征在于,包括:
获取目标用户的用户图像;
将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;
读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;
根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
2.根据权利要求1所述的神经网络模型的训练方法,其特征在于,所述将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果之前,包括:
将所述用户图像输入至预设的环境分类模型中,其中,所述环境分类模型为预先训练至收敛状态,用于对输入图像进行环境分类的神经网络模型;
读取所述环境分类模型输出的环境分类结果;
识别所述环境分类结果表征的环境场景是否训练至收敛状态;
当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别。
3.根据权利要求2所述的神经网络模型的训练方法,其特征在于,所述识别所述环境分类结果表征的环境场景是否训练至收敛状态包括:
以所述环境分类结果为检索条件在预设的历史分类信息数据库中进行查找,获取与所述环境分类结果表征的环境场景具有映射关系的训练信息,其中,所述训练信息中包括历史记录中所述图像识别模型对包含所述环境场景的用户图像的分类准确率;
将所述分类准确率与预设的准确率阈值进行比对;
当所述分类准确率小于所述准确率阈值时,确认所述环境场景未训练至收敛状态;否则,则确认所述环境场景已训练至收敛状态。
4.根据权利要求2所述的神经网络模型的训练方法,其特征在于,所述当所述环境场景未训练至收敛状态时,确认所述图像识别模型对所述用户图像进行识别之后,包括:
在预设的策略数据库中查找与所述环境场景具有映射关系的图像增强策略;
根据所述图像增强策略对所述用户图像进行图像增强处理,以生成派生于所述用户图像的增强图像。
5.根据权利要求4所述的神经网络模型的训练方法,其特征在于,所述图像识别模型为多通道模型,所述将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果包括:
将所述用户图像与所述增强图像分别输入至所述图像识别模型的不同通道内;
比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致;
当所述用户图像的分类结果与所述增强图像的分类结果一致时,确认输出所述用户图像的分类结果。
6.根据权利要求5所述的神经网络模型的训练方法,其特征在于,所述比对图像识别模型计算得到的所述用户图像的分类结果与所述增强图像的分类结果是否一致之后,包括:
当所述用户图像的分类结果与所述增强图像的分类结果不一致时,计算所述用户图像的特征向量与所述增强图像的特征向量之间的第一向量差值;
将所述第一向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述增强图像的分类结果趋于一致。
7.根据权利要求1所述的神经网络模型的训练方法,其特征在于,所述验证信息中包括目标用户认定的所述用户图像的验证分类结果,所述根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数包括:
当所述验证信息表征的验证结果为所述分类结果错误时,在预设的特征数据库中查找与所述验证分类结果具有映射关系的标定特征向量;
计算所述标定特征向量与所述用户图像的特征向量之间的第二向量差值;
将所述第二向量差值进行反向传播以矫正所述图像识别模型中的权重参数,以使所述用户图像的分类结果与所述验证分类结果趋于一致。
8.一种神经网络模型的训练装置,其特征在于,包括:
获取模块,用于获取目标用户的用户图像;
处理模块,用于将所述用户图像输入至预设的图像识别模型中,以获取所述图像识别模型对所述用户图像的分类结果,其中,所述图像识别模型为预先训练至收敛状态的,用于对输入图像进行图像分类的神经网络模型;
读取模块,用于读取所述图像识别模型输出的分类结果并显示所述分类结果,以获取所述目标用户对所述分类结果做出的验证信息;
执行模块,用于根据所述验证信息对所述图像识别模型进行训练,以使所述图像识别模型中生成专属于所述目标用户的权重参数。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述神经网络模型的训练方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述神经网络模型的训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910101300.1A CN111507467A (zh) | 2019-01-31 | 2019-01-31 | 神经网络模型的训练方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910101300.1A CN111507467A (zh) | 2019-01-31 | 2019-01-31 | 神经网络模型的训练方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111507467A true CN111507467A (zh) | 2020-08-07 |
Family
ID=71864637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910101300.1A Pending CN111507467A (zh) | 2019-01-31 | 2019-01-31 | 神经网络模型的训练方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507467A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095194A (zh) * | 2021-04-02 | 2021-07-09 | 北京车和家信息技术有限公司 | 图像分类方法、装置、存储介质及电子设备 |
CN113408632A (zh) * | 2021-06-28 | 2021-09-17 | 北京百度网讯科技有限公司 | 提高图像分类准确性的方法、装置、电子设备及存储介质 |
WO2023184833A1 (zh) * | 2022-03-28 | 2023-10-05 | 上海商汤智能科技有限公司 | 检测结果处理方法和装置、设备、介质及计算机程序产品 |
CN117649668A (zh) * | 2023-12-22 | 2024-03-05 | 南京天溯自动化控制系统有限公司 | 一种医疗设备计量证书识别和分析方法 |
-
2019
- 2019-01-31 CN CN201910101300.1A patent/CN111507467A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095194A (zh) * | 2021-04-02 | 2021-07-09 | 北京车和家信息技术有限公司 | 图像分类方法、装置、存储介质及电子设备 |
CN113408632A (zh) * | 2021-06-28 | 2021-09-17 | 北京百度网讯科技有限公司 | 提高图像分类准确性的方法、装置、电子设备及存储介质 |
WO2023184833A1 (zh) * | 2022-03-28 | 2023-10-05 | 上海商汤智能科技有限公司 | 检测结果处理方法和装置、设备、介质及计算机程序产品 |
CN117649668A (zh) * | 2023-12-22 | 2024-03-05 | 南京天溯自动化控制系统有限公司 | 一种医疗设备计量证书识别和分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN109522815B (zh) | 一种专注度评估方法、装置及电子设备 | |
CN109614989B (zh) | 快速模型的训练方法、装置、计算机设备及存储介质 | |
CN111507467A (zh) | 神经网络模型的训练方法、装置、计算机设备及存储介质 | |
US20230119593A1 (en) | Method and apparatus for training facial feature extraction model, method and apparatus for extracting facial features, device, and storage medium | |
CN108230291B (zh) | 物体识别系统训练方法、物体识别方法、装置和电子设备 | |
CN106022317A (zh) | 人脸识别方法及装置 | |
CN105590099B (zh) | 一种基于改进卷积神经网络的多人行为识别方法 | |
CN111178120B (zh) | 一种基于作物识别级联技术的害虫图像检测方法 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN112150493A (zh) | 一种基于语义指导的自然场景下屏幕区域检测方法 | |
CN109711356B (zh) | 一种表情识别方法和系统 | |
CN111401192B (zh) | 基于人工智能的模型训练方法和相关装置 | |
CN111104852B (zh) | 一种基于启发式高斯云变换的人脸识别技术 | |
CN111401105B (zh) | 一种视频表情识别方法、装置及设备 | |
CN111507138A (zh) | 图像识别方法、装置、计算机设备及存储介质 | |
CN113705596A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
Li et al. | Image manipulation localization using attentional cross-domain CNN features | |
CN115761888A (zh) | 基于nl-c3d模型的塔吊操作人员异常行为检测方法 | |
CN111507137A (zh) | 动作理解方法、装置、计算机设备及存储介质 | |
CN113762326A (zh) | 一种数据识别方法、装置、设备及可读存储介质 | |
CN115187772A (zh) | 目标检测网络的训练及目标检测方法、装置及设备 | |
CN108446688B (zh) | 人脸图像性别判断方法、装置、计算机设备及存储介质 | |
CN113806564B (zh) | 多模态信息性推文检测方法及系统 | |
Wang et al. | Yolov5 enhanced learning behavior recognition and analysis in smart classroom with multiple students |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |