CN111476160A - 损失函数优化方法、模型训练方法、目标检测方法及介质 - Google Patents

损失函数优化方法、模型训练方法、目标检测方法及介质 Download PDF

Info

Publication number
CN111476160A
CN111476160A CN202010265104.0A CN202010265104A CN111476160A CN 111476160 A CN111476160 A CN 111476160A CN 202010265104 A CN202010265104 A CN 202010265104A CN 111476160 A CN111476160 A CN 111476160A
Authority
CN
China
Prior art keywords
target
human body
detection
region
human face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010265104.0A
Other languages
English (en)
Inventor
吴晓晖
张凯丽
王书平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Shizai Technology Co ltd
Original Assignee
Hangzhou Shizai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Shizai Technology Co ltd filed Critical Hangzhou Shizai Technology Co ltd
Priority to CN202010265104.0A priority Critical patent/CN111476160A/zh
Publication of CN111476160A publication Critical patent/CN111476160A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

损失函数优化方法、模型训练方法、目标检测方法及介质,涉及图片识别技术领域;目标检测模型训练方法,包括以下步骤:获取样本数据集;数据集的前处理:对获取的样本数据进行提前标注,对标注出的目标进行聚类,并做多组实验找到适合手机检测的anchor;用自定义的anchor采用目标检测网络训练得到目标检测模型。本发明结合当前主流的计算机视觉处理技术,使用基于深度卷积神经网络的目标检测算法做基本的处理算法,引入层级智能过滤的方式,将非限定场景中的玩手机行为识别问题转为限定场景中的玩手机行为识别问题,同时也可以通过此步将复杂场景直接转换为简单场景。

Description

损失函数优化方法、模型训练方法、目标检测方法及介质
技术领域
本发明涉及图片识别技术领域,特别涉及损失函数优化方法、模型训练方法、目标检测方法及介质。
背景技术
随着现代社会分工的精细化,一些企业对相关人员的管理也越来越规范,而一些管理任务又非常庞杂,比如特定工作场景下的玩手机检测、抽烟、其他的一些行为规范以及工作服穿戴合规检测等;单靠人工巡查,或是人工对视频的浏览已经无法满足一些现代企业管理的需要,因此,有人提出引入智能化的视频分析技术,对监控视频进行智能化分析,从中筛选出操作人员的一些违规图片,推送给管理者。这样做有下面几个好处:第一,可以节省大量的用于现场巡查或是视频浏览巡查的人力,为企业节省成本,提高效率;第二,可以做到24小时全覆盖;
针对玩手机的检测识别通常采取下面三种方式:
第一种方式:管理人员不定时现场巡查。这样做的好处是:巡查所到之处,问题发现准确,解决到位;缺点是:受到巡查人员精力,时间限制,无法做到全天候覆盖,会遗漏大量的问题点;
第二种方式:管理人员视频巡查。这样做的好处是同第一种方式;缺点是:面对庞大的视频数据,如果需要全部巡查所有问题点,需要的巡查人员数量非常庞大。
上述两种传统的巡查管理方式都面临一个问题:巡查任务非常巨大,巡查人手不够。所以限制了管理工作人员行为规范的大规模推广,造成管理质量良莠不齐,问题频发,严重影响企业形象。为此,有人提出利用人工智能的方法来缩小视频巡检的范围,做到更加精准的定位问题点,以提高工作效率,从而有了第三种巡查方式:
第三种方式:基于视频智能分析的管理人员巡查。通过人工智能算法对视频进行分析,只保留少量的问题图片。通过研究发现当前主流的目标检测算法具有局限性,精准度不够。
发明内容
本发明的目的在于,提供损失函数优化方法、模型训练方法、目标检测方法及介质。
本发明的技术方案:目标检测模型训练方法,包括以下步骤:
获取样本数据集;
数据集的前处理:对获取的样本数据进行提前标注,对标注出的目标进行聚类,并做多组实验找到适合手机检测的anchor;
用自定义的anchor采用目标检测网络训练得到目标检测模型。
上述的目标检测模型训练方法中,目标模型训练阶段包括用于评价每一轮训练结果的损失函数计算,该损失函数包括对候选框的对角线长度与真实框对角线长度之差计算,公式为:
Figure BDA0002440978170000021
上述的目标检测模型训练方法中,损失函数的完整公式为:
Figure BDA0002440978170000031
其中,(x,y)表示在图像分割成s*s的待检区域中,第i个区域的中心区域区域坐标;B表示分类目标的总数;Ci表示预测的目标分类;Pi为预测类的概率;λcoord表示目标存在时,位置与分类项的损失权重;λnoobj表示目标不存在的时候,对于类别判断结果是否正确的权重。
目标检测模型中的损失函数优化方法,包括对候选框的对角线长度与真实框对角线长度之差计算,公式为:
Figure BDA0002440978170000032
上述的目标检测模型中的损失函数优化方法中,损失函数的完整公式为:
Figure BDA0002440978170000033
其中,(x,y)表示在图像分割成s*s的待检区域中,第i个区域的中心区域区域坐标;B表示分类目标的总数;Ci表示预测的目标分类;Pi为预测类的概率;λcoord表示目标存在时,位置与分类项的损失权重;λnoobj表示目标不存在的时候,对于类别判断结果是否正确的权重。
目标检测方法,包括如下步骤:
1、获取图片数据;
2、对图片数据进行对象检测,并筛选出可用数据;
3、将可用数据输入到权利要求1-3记载的目标检测模型中用于检测对象区域是否存在目标;
4、通过步骤3的检测结果,判断对象是否存在相应行为。
上述的目标检测方法中,所述对象检测是针对人体和/或人脸的检测,所述目标检测是针对手机的检测,所述相应的行为是“玩手机”。
上述的目标检测方法中,对象检测的具体步骤为:从图片数据中检测人体目标和人脸目标,并匹配人体和人脸目标,匹配方法如下:
对获取的人体信息做遍历,对每个获取的人体信息,输入同时获取到的人脸信息,然后再遍历输入的人脸信息,首先获取每个人脸目标框和人体的目标框的交集区域的面积,然后找到其交集区域面积最大的人脸目标框,然后对比这个交集区域与原始的人脸目标区域的比值是否大于设定的阈值,满足条件则绑定当前的人脸信息与人体信息,如果所有的人脸信息都不满足以上条件,则认为在这个人体区域中没有检测到有效的人脸信息,在人体信息的数据中设置相应的人脸信息的置信度conf=0。
上述的目标检测方法中,筛选出可用数据之后,将获取的人体区域框向外扩充,其规则为:以人体目标框的中心点为中心,将人体目标框的长和宽都扩充到原长宽的0.8-1.5倍。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:计算机程序被处理器执行时实现如上述模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求上述损失函数优化方法的步骤;或者,所述处理器执行所述计算机程序时实现上述的目标检测方法的步骤。
与现有技术相比,优点在于:本发明结合当前主流的计算机视觉处理技术,使用基于深度卷积神经网络的目标检测算法做基本的处理算法,引入层级智能过滤的方式,将非限定场景中的玩手机行为识别问题转为限定场景中的玩手机行为识别问题,同时也可以通过此步将复杂场景直接转换为简单场景。
附图说明:
图1是实施例中提及的“玩手机”检测流程示意图。
下面结合实施例和附图对本发明作进一步的说明,但并不作为对本发明限制的依据。
实施例:参照图1所示应用场景为对“玩手机”行为的检测。
通过研究发现当前主流的目标检测算法存在以下局限性:首先是对于业务场景的限制,如在后厨场景中训练的玩手机检测模型拿到其他的业务场景中,泛化性能很差,针对新的业务场景又要重新做数据标注、网络训练等工作,而且由于检测目标较小,对于视频中的复杂场景下的玩手机的检测会存在大量的干扰信息导致结果误报;其实是当前算法没有针对小目标做出相应的改进,如果直接用原始算法训练的话会导致大量的检测目标的漏检问题;最后由于手机在不同摄像头视角下会存在一定的形变问题,原始算法的损失函数在训练的时候只计算了目标长宽的损失,会导致损失函数往一个错误的方向收敛,导致训练的网络对于一些摄像头视角导致的形变问题会出现错误分类或者无法检测出目标,对提升工作效率帮助有限。
本发明结合当前主流的计算机视觉处理技术,使用基于深度卷积神经网络的目标检测算法做基本的处理算法,引入层级智能过滤的方式,将非限定场景中的玩手机行为识别问题转为限定场景中的玩手机行为识别问题,同时也可以通过此步将复杂场景直接转换为简单场景。针对小目标检测不准的问题,本专利使用提前标注好的手机样本数据使用K-means聚类并坐多组实验找到适合手机检测的anchor,用自定义的anchor训练手机检测模型。针对目标在不同的摄像头视角下的形变问题,本专利提出一种改进的损失函数,将损失函数中将原网络中针对长宽的回归损失定义成计算对角线的损失,网络的收敛拟合性能更强,也大大提升了目标检测的准确性。具体实施时在目标检测处理算法前加入多层的判断处理条件,在都满足巡视条件的前提下,才会将特定的目标区域作为目标检测算法的输入传入网络,获取一张图片或者单帧视频帧中的所有符合判断处理条件的目标结果,然后根据特定限制场景的巡视规则推理出违规/合规,然后将违规图像再推送到管理者的手中,以节省巡查人员的巡查工作量,而且这种结合多层的判断处理条件的基于目标检测的玩手机识别算法,可以快速应用到其他场景中,成本低且开发部署方便,能够大大提高企业的管理效率。
具体的方法如下:
(101)将特定场景获取的原始图像,首先将图像做灰度与模糊度判断,当图像的灰度值与模糊度值大于预先设定的阈值时,我们认为该张图像无法获取有效信息,则跳过,不对该张图像做判断。然后将图像作为输入传进一个采用基于计算机视觉的人体和人脸的通用目标检测网络,提取出图像中的人体和人脸信息,将人脸信息和人体信息分开存储,然后匹配提取到的人体和人脸信息,具体匹配方案如下:
对获取的人体信息做遍历,对每个获取的人体信息,输入同时获取到的人脸信息,然后再遍历输入的人脸信息,首先获取每个人脸目标框和人体的目标框的交集区域的面积,然后找到其交集区域面积最大的人脸目标框,然后对比这个交集区域与原始的人脸目标区域的比值是否大于设定的阈值,这一步是为了进一步确定该人脸目标是否是该人体目标的人脸区域,若满足条件则绑定当前的人脸信息与人体信息,如果所有的人脸信息都不满足以上条件,则认为在这个人体区域中没有检测到有效的人脸信息,在人体信息的数据中设置相应的人脸信息的置信度;所有的人体信息绑定人脸信息的操作均如上,依次迭代下去,完成提取到的人体和人脸信息的匹配;
(102)拿到人体和人脸的相关匹配信息,根据人脸和人体的匹配信息判断是否要进行下一步的算法推断;在本专利中的判断条件是如果在人体的目标框中没有检测到人脸的话,则认为当前图像中的某一个人体的目标不满足进一步判断的条件,则不会再继续做下面的手机检测了;
如果满足进行下一步的算法推断条件,则将获取的人体的区域框向外扩充一定区域,该步主要为了防止由于视角问题导致手机在人体目标区域外,故在检测到的人体区域框的基础上,以人体目标框的中心点为中心,将人体目标框的长和宽都扩充到原长宽的1.2倍左右。然后将所有扩充的人体的区域框输入到检测手机的小模型中,进一步检测在人体的区域中是否有手机,具体步骤如下:
首先,针对我们的手机目标检测器来说,我们使用的基础目标检测网络是yolov3-tiny,对于这个网络,我们针对检测目标手机来说,做了相应的改进,具体的改进是使用提前标注好的手机样本数据使用K-means聚类并坐多组实验找到适合手机检测的anchor,用自定义的anchor训练手机检测模型;
此外,在网络的训练过程中,针对训练目标在不同的视角下可能会存在一定的形变的问题,在本专利中对于原始的损失函数也加了一项修正项。损失函数是对每一轮的训练结果来做评价的,反映的是本次的预测结果和真实的数据之间的差异,损失越小表示训练的越好,因此我们期望训练过程是朝着损失值值减小的方向进行的。
由于之前的损失函数在训练的时候只计算了目标长宽的损失,模型的收敛拟合性能较差,对于一些摄像头视角导致的形变问题会出现错误分类或者无法检测出目标的问题,在本专利中,我们在损失函数中将原网络中针对长宽的回归损失定义成计算对角线的损失,具体修改的项修改后为:
Figure BDA0002440978170000091
该项反映的是候选框的对角线长度与真实框对角线长度之差,为了防止由于目标和镜头的视角差距引起的旋转和侧翻导致的损失值不能评价真实的检测结果,改进后的损失函数如下:
Figure BDA0002440978170000092
其中,(x,y)表示在图像分割成s*s的待检区域中,第i个区域的中心区域区域坐标;B表示分类目标的总数;Ci表示预测的目标分类;Pi为预测类的概率;λcoord表示目标存在时,位置与分类项的损失权重;λnoobj表示目标不存在的时候,对于类别判断结果是否正确的权重。
在本实施例中认为在人体区域中检测到手机的话,则认为该人在玩手机,将检测到的手机的概率confidence赋值给人体属性信息的玩手机的置信度,如果在人体的区域中检测到的是非手机,那么用1减去检测到的非手机的概率值confidence并赋值给人体属性信息的玩手机的置信度;
(103)拿到102步中更新后的所有的人体的相关信息,然后遍历,如果人体信息中人体属性信息的玩手机的置信度大于设定的警告阈值的话,那么该张图片要给出玩手机警告,并向管理者推送出该张图片;
上述具体实施方式用来解释说明本发明,仅为本发明的优选实施例,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改、等同替换、改进等,都落入本发明的保护范围。

Claims (10)

1.目标检测模型训练方法,其特征在于:包括如下步骤:
获取样本数据集;
数据集的前处理:对获取的样本数据进行提前标注,对标注出的目标进行聚类,并做多组实验找到适合手机检测的anchor;
用自定义的anchor采用目标检测网络训练得到目标检测模型。
2.基于权利要求1所述目标检测模型训练方法,其特征在于:目标模型训练阶段包括用于评价每一轮训练结果的损失函数计算,该损失函数包括对候选框的对角线长度与真实框对角线长度之差计算,公式为:
Figure FDA0002440978160000011
3.基于权利要求2所述目标检测模型训练方法,其特征在于:损失函数的完整公式为:
Figure FDA0002440978160000012
其中,(x,y)表示在图像分割成s*s的待检区域中,第i个区域的中心区域区域坐标;B表示分类目标的总数;Ci表示预测的目标分类;Pi为预测类的概率;λcoord表示目标存在时,位置与分类项的损失权重;λnoobj表示目标不存在的时候,对于类别判断结果是否正确的权重。
4.目标检测模型中的损失函数优化方法,其特征在于:包括对候选框的对角线长度与真实框对角线长度之差计算,公式为:
Figure FDA0002440978160000021
5.根据权利要求4所述的目标检测模型中的损失函数优化方法,其特征在于:损失函数的完整公式为:
Figure FDA0002440978160000022
其中,(x,y)表示在图像分割成s*s的待检区域中,第i个区域的中心区域区域坐标;B表示分类目标的总数;Ci表示预测的目标分类;Pi为预测类的概率;λcoord表示目标存在时,位置与分类项的损失权重;λnoobj表示目标不存在的时候,对于类别判断结果是否正确的权重。
6.目标检测方法,其特征在于:包括如下步骤:
1、获取图片数据;
2、对图片数据进行对象检测,并筛选出可用数据;
3、将可用数据输入到权利要求1-3记载的目标检测模型中用于检测对象区域是否存在目标;
4、通过步骤3的检测结果,判断对象是否存在相应行为。
7.根据权利要求6所述的目标检测方法,其特征在于:所述对象检测是针对人体和/或人脸的检测,所述目标检测是针对手机的检测,所述相应的行为是“玩手机”。
8.根据权利要求7所述的目标检测方法,其特征在于:对象检测的具体步骤为:从图片数据中检测人体目标和人脸目标,并匹配人体和人脸目标,匹配方法如下:
对获取的人体信息做遍历,对每个获取的人体信息,输入同时获取到的人脸信息,然后再遍历输入的人脸信息,首先获取每个人脸目标框和人体的目标框的交集区域的面积,然后找到其交集区域面积最大的人脸目标框,然后对比这个交集区域与原始的人脸目标区域的比值是否大于设定的阈值δ,满足条件则绑定当前的人脸信息与人体信息,如果所有的人脸信息都不满足以上条件,则认为在这个人体区域中没有检测到有效的人脸信息,在人体信息的数据中设置相应的人脸信息的置信度conf=0。
9.根据权利要求7或8所述的目标检测方法,其特征在于:筛选出可用数据之后,将获取的人体区域框向外扩充,其规则为:以人体目标框的中心点为中心,将人体目标框的长和宽都扩充到原长宽的0.8-1.5倍。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:计算机程序被处理器执行时实现如权利要求1至3任一项所述模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求4至5任一项所述损失函数优化方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求6-9任一项所述的检测方法的步骤。
CN202010265104.0A 2020-04-07 2020-04-07 损失函数优化方法、模型训练方法、目标检测方法及介质 Pending CN111476160A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010265104.0A CN111476160A (zh) 2020-04-07 2020-04-07 损失函数优化方法、模型训练方法、目标检测方法及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010265104.0A CN111476160A (zh) 2020-04-07 2020-04-07 损失函数优化方法、模型训练方法、目标检测方法及介质

Publications (1)

Publication Number Publication Date
CN111476160A true CN111476160A (zh) 2020-07-31

Family

ID=71749899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010265104.0A Pending CN111476160A (zh) 2020-04-07 2020-04-07 损失函数优化方法、模型训练方法、目标检测方法及介质

Country Status (1)

Country Link
CN (1) CN111476160A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070736A (zh) * 2020-09-01 2020-12-11 上海电机学院 一种结合目标检测和深度计算的物体体积视觉测量方法
CN112257809A (zh) * 2020-11-02 2021-01-22 浙江大华技术股份有限公司 目标检测网络优化方法和装置、存储介质及电子设备
CN112995666A (zh) * 2021-02-22 2021-06-18 天翼爱音乐文化科技有限公司 一种结合场景切换检测的视频横竖屏转换方法及装置
CN113486858A (zh) * 2021-08-03 2021-10-08 济南博观智能科技有限公司 一种人脸识别模型训练方法、装置、电子设备及存储介质
CN115880751A (zh) * 2022-11-22 2023-03-31 山东鲁软数字科技有限公司 一种基于表情识别的用户体验度量方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018088049A (ja) * 2016-11-28 2018-06-07 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN108256404A (zh) * 2016-12-29 2018-07-06 北京旷视科技有限公司 行人检测方法和装置
CN109214289A (zh) * 2018-08-02 2019-01-15 厦门瑞为信息技术有限公司 一种从整体到局部的两阶段打电话行为识别方法
CN109993089A (zh) * 2019-03-22 2019-07-09 浙江工商大学 一种基于深度学习的视频目标去除及背景恢复方法
CN110070005A (zh) * 2019-04-02 2019-07-30 腾讯科技(深圳)有限公司 图像目标识别方法、装置、存储介质及电子设备
CN110705383A (zh) * 2019-09-09 2020-01-17 深圳市中电数通智慧安全科技股份有限公司 吸烟行为检测方法、装置、终端和可读存储介质
CN110738127A (zh) * 2019-09-19 2020-01-31 福建师范大学福清分校 基于无监督深度学习神经网络算法的安全帽识别方法
CN110765865A (zh) * 2019-09-18 2020-02-07 北京理工大学 基于改进的yolo算法的水下目标检测方法
CN110969045A (zh) * 2018-09-28 2020-04-07 杭州海康威视数字技术股份有限公司 一种行为检测方法、装置、电子设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018088049A (ja) * 2016-11-28 2018-06-07 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN108256404A (zh) * 2016-12-29 2018-07-06 北京旷视科技有限公司 行人检测方法和装置
CN109214289A (zh) * 2018-08-02 2019-01-15 厦门瑞为信息技术有限公司 一种从整体到局部的两阶段打电话行为识别方法
CN110969045A (zh) * 2018-09-28 2020-04-07 杭州海康威视数字技术股份有限公司 一种行为检测方法、装置、电子设备和存储介质
CN109993089A (zh) * 2019-03-22 2019-07-09 浙江工商大学 一种基于深度学习的视频目标去除及背景恢复方法
CN110070005A (zh) * 2019-04-02 2019-07-30 腾讯科技(深圳)有限公司 图像目标识别方法、装置、存储介质及电子设备
CN110705383A (zh) * 2019-09-09 2020-01-17 深圳市中电数通智慧安全科技股份有限公司 吸烟行为检测方法、装置、终端和可读存储介质
CN110765865A (zh) * 2019-09-18 2020-02-07 北京理工大学 基于改进的yolo算法的水下目标检测方法
CN110738127A (zh) * 2019-09-19 2020-01-31 福建师范大学福清分校 基于无监督深度学习神经网络算法的安全帽识别方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070736A (zh) * 2020-09-01 2020-12-11 上海电机学院 一种结合目标检测和深度计算的物体体积视觉测量方法
CN112070736B (zh) * 2020-09-01 2023-02-24 上海电机学院 一种结合目标检测和深度计算的物体体积视觉测量方法
CN112257809A (zh) * 2020-11-02 2021-01-22 浙江大华技术股份有限公司 目标检测网络优化方法和装置、存储介质及电子设备
CN112257809B (zh) * 2020-11-02 2023-07-14 浙江大华技术股份有限公司 目标检测网络优化方法和装置、存储介质及电子设备
CN112995666A (zh) * 2021-02-22 2021-06-18 天翼爱音乐文化科技有限公司 一种结合场景切换检测的视频横竖屏转换方法及装置
CN113486858A (zh) * 2021-08-03 2021-10-08 济南博观智能科技有限公司 一种人脸识别模型训练方法、装置、电子设备及存储介质
CN113486858B (zh) * 2021-08-03 2024-01-23 济南博观智能科技有限公司 一种人脸识别模型训练方法、装置、电子设备及存储介质
CN115880751A (zh) * 2022-11-22 2023-03-31 山东鲁软数字科技有限公司 一种基于表情识别的用户体验度量方法

Similar Documents

Publication Publication Date Title
CN112215155B (zh) 一种基于多特征融合的人脸跟踪方法及系统
CN111476160A (zh) 损失函数优化方法、模型训练方法、目标检测方法及介质
CN109117827B (zh) 基于视频的工服工帽穿戴状态自动识别方法与报警系统
CN109711320B (zh) 一种值班人员违规行为检测方法及系统
CN107123131B (zh) 一种基于深度学习的运动目标检测方法
CN103324937B (zh) 标注目标的方法和装置
CN110378324B (zh) 一种基于质量维度的人脸识别算法评估方法
CN108875600A (zh) 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN104978567B (zh) 基于场景分类的车辆检测方法
CN108052859A (zh) 一种基于聚类光流特征的异常行为检测方法、系统及装置
CN108197604A (zh) 基于嵌入式设备的快速人脸定位跟踪方法
CN104361327A (zh) 一种行人检测方法和系统
CN101389004A (zh) 一种基于在线学习的运动目标分类方法
CN111507232B (zh) 多模态多策略融合的陌生人识别方法和系统
CN111027370A (zh) 一种多目标跟踪及行为分析检测方法
CN110610150A (zh) 一种目标运动物体的跟踪方法、装置、计算设备和介质
CN117496129A (zh) 一种基于YOLOv7改进的工厂安全穿戴目标检测方法
CN110110732B (zh) 一种用于餐饮后厨的智能巡查方法
CN115035088A (zh) 一种基于yolov5和姿态估计的安全帽佩戴检测方法
CN117437599B (zh) 面向监控场景的行人异常事件检测方法和系统
CN112465854A (zh) 基于无锚点检测算法的无人机跟踪方法
US20230386188A1 (en) Image analysis system an update method for machine learning model
CN114219073A (zh) 属性信息的确定方法、装置、存储介质及电子装置
CN113591705A (zh) 巡检机器人仪表识别系统及方法、存储介质
CN114694090B (zh) 一种基于改进PBAS算法与YOLOv5的校园异常行为检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200731

RJ01 Rejection of invention patent application after publication