CN112308885A - 基于光流的暴力抛扔检测方法、装置、设备和存储介质 - Google Patents
基于光流的暴力抛扔检测方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112308885A CN112308885A CN201910691116.7A CN201910691116A CN112308885A CN 112308885 A CN112308885 A CN 112308885A CN 201910691116 A CN201910691116 A CN 201910691116A CN 112308885 A CN112308885 A CN 112308885A
- Authority
- CN
- China
- Prior art keywords
- throwing
- optical flow
- violent
- confidence score
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 89
- 238000001514 detection method Methods 0.000 title claims abstract description 38
- 230000009471 action Effects 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000007477 logistic regression Methods 0.000 claims abstract description 19
- 239000012634 fragment Substances 0.000 claims abstract description 16
- 230000006399 behavior Effects 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 abstract description 9
- 230000000875 corresponding effect Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/269—Analysis of motion using gradient-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30232—Surveillance
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种基于光流的暴力抛扔检测方法、装置、设备和存储介质,该方法包括将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆;基于行为识别模型,检测光流堆中片段的抛扔动作以及计算抛扔动作对应的置信度分数,而置信度分数用于表征暴力抛扔的严重程度;根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。本申请实施例从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
Description
技术领域
本发明一般涉及计算机视觉技术领域,具体涉及一种基于光流的暴力抛扔检测方法、装置、设备和存储介质。
背景技术
现代社会中,人们越来越多地使用快递来收寄物品。尤其是随着电子商务的蓬勃发展,网上购物的方式得到快速普及和应用。网上购物通过使用快递将商品派送到客户手中,这极大地方便了人们的日常生活。
在快递行业的服务质量以及分拣效率不断提高的当下,暴力分拣的行业顽疾依然存在。由于暴力抛扔会破坏快件,这种行为不仅给快递公司造成了巨大的经济损失,而且也影响了快递公司的行业形象。
目前,为规范快件分拣的操作过程,绝大部分快递企业都在分拣场所安装了摄像机系统,通过人工对视频图像进行辨别和监控,来进行暴力分拣的排查。然而,仅仅依靠人工对大量的视频数据进行分析,不但需要消耗大量的人力、物力等成本,而且人工长时间监控容易疲劳、效率极低,从而导致报警准确性低,漏报率和误报率高。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种基于光流的暴力抛扔检测方法、装置、设备和存储介质,从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
第一方面,本申请提供一种基于光流的暴力抛扔检测方法,包括:
将经过解析的帧图像流转换为灰度序列,并当所述灰度序列的数量达到预设数量时,将所述灰度序列堆叠形成光流堆;
基于行为识别模型,检测所述光流堆中片段的抛扔动作,以及计算所述抛扔动作对应的置信度分数;其中,所述置信度分数用于表征暴力抛扔的严重程度;
根据所述抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
第二方面,本申请提供一种基于光流的暴力抛扔检测装置,包括:
转换模块,用于将经过解析的帧图像流转换为灰度序列,并当所述灰度序列的数量达到预设数量时,将所述灰度序列堆叠形成光流堆;
检测模块,用于基于行为识别模型,检测所述光流堆中片段的抛扔动作,以及计算所述抛扔动作对应的置信度分数;其中,所述置信度分数用于表征暴力抛扔的严重程度;
计算模块,用于根据所述抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
第三方面,本申请提供一种设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如第一方面所述的基于光流的暴力抛扔检测方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现如第一方面所述的基于光流的暴力抛扔检测方法的步骤。
综上,本申请实施例提供的基于光流的暴力抛扔检测方法、装置、设备和存储介质,从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果;基于此,本申请实施例中将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将该灰度序列堆叠形成光流堆;然后,基于行为识别模型,检测光流堆中片段的抛扔动作以及计算抛扔动作对应的置信度分数,该置信度分数用于表征暴力抛扔的严重程度;进而,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,综合计算出抛扔识别分数,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例提供的一种基于光流的暴力抛扔检测方法的基本流程示意图;
图2为本申请实施例提供的另一种基于光流的暴力抛扔检测方法的流程示意图;
图3为本申请实施例提供的一种基于光流的暴力抛扔检测装置;
图4为本申请实施例提供的另一种基于光流的暴力抛扔检测装置;
图5为本申请实施例提供的又一种基于光流的暴力抛扔检测装置;
图6为本申请实施例提供的一种计算机系统。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本申请实施例提供一种基于光流的暴力抛扔检测方法,该方法应用于终端中。需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(PersonalComputer,PC)、个人数字助理(Personal Digital Assistant,PDA)、平板电脑(TabletComputer)、无线手持设备和手机等。
为了便于理解和说明,下面通过图1至图5详细的阐述本申请实施例提供的基于光流的暴力抛扔检测方法及装置。
请参考图1,其为本申请实施例提供的一种基于光流的暴力抛扔检测方法的基本流程示意图,该方法包括以下步骤:
S101,将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆。
举例说明,在快件分拣场所安装摄像机系统,由该摄像机系统中的各个摄像头采集帧图像流。然后,对该帧图像流进行解析之后,转换为灰度序列,记为RGB序列,其中灰度序列能够弱化周围环境的影响,并突出目标物体。当RGB序列的数量达到预设数量,比如预设数量为5帧、10帧时,将RGB序列堆叠形成光流堆。
需要说明的是,光流(Optic Flow)是空间运动物体在观察成像平面上的像素运动的瞬时速度,利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧和当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息。一般而言,光流是由于场景中前景目标本身的移动、摄像头的移动或者二者的共同运动所产生的。光流除了能够提供物体之间的远近信息外,还可以提供运动的角度信息。
进一步地,还可以计算帧图像流中相邻帧图像的结构相似度,并当结构相似度大于预设阈值时,从相邻帧图像中选取一幅帧图像加入转换队列。由于如果将结构相似度相同的相邻帧图像都加入转换队列,会造成重复计算,增加光流的计算次数,进而降低处理速度。
举例说明,假设预设阈值为90%,当然预设阈值也可以为其它数值,本申请实施例对此不进行限定。比如,帧图像1和帧图像2是帧图像流中相邻的两幅帧图像,经过计算该两幅帧图像的结构相似度为95%,大于预设阈值90%。因此,从帧图像1和帧图像2中任意选取一幅帧图像加入转换队列,这样可以加快处理速度,减少光流的计算次数,并且对暴力抛扔事件的检测不产生影响。
需要说明的是,结构相似度测量指标(Structural Similarity IndexMeasurement)是衡量两幅图像之间相似度的指标。自然图像具有极高的结构性,表现在图像的像素间存在着很强的相关性。尤其是在空间相似的情况下,这些相关性在视觉场景中携带着关于目标物体结构的重要信息。
进一步地,本申请实施例中对灰度序列的尺寸进行调整,以使得灰度序列的尺寸与网络输入图像的尺寸相等。相较于灰度序列的尺寸而言,网络输入图像的尺寸要小很多,比如摄像头中画面的尺寸在1280*960量级,而网络输入图像的尺寸则为560*420量级,这样能够加快处理进度,同时对光流的计算精度影响不大。由于光流精度与动作分类的识别精度并不是正相关,光流的精度较低时也可能有较好地识别精度。经过对行为识别模型进行测试,在画面宽高比例为4:3时,能够取得较好地识别精度。
S102,基于行为识别模型,检测光流堆中片段的抛扔动作,以及计算抛扔动作对应的置信度分数。
其中,置信度分数用于表征暴力抛扔的严重程度。
举例说明,本申请实施例中以时间序列网络(Temporal Segment Networks,TSN)作为框架进行说明。首先,将光流堆按照相等间隔分为若干段,并分别从段中随机采样得到片段;然后,根据行为识别模型中的空间流卷积网络和时间流卷积网络,对光流堆中片段的抛扔动作进行识别,并计算抛扔动作对应的置信度分数。
比如,首先将光流堆分为3段(Segment),一个片段(Snippet)从它对应的段中随机采样得到,即片段1、片段2和片段3;然后将片段1、片段2和片段3作为行为识别模型的输入,经过空间流卷积网络和时间流卷积网络进行抛扔动作的识别,用以判断快件在分拣的过程中是否存在暴力抛扔的现象,即没有抛扔和严重抛扔;进而,获取时间序列网络的全连接层识别数据,并将该全连接层识别数据与经验值作商的结果作为抛扔动作对应的置信度分数。其中,经验值和行为识别模型的训练程度相关,例如经验值可以为5,也可以为其它任意正数。另外,由于行为检测的数据集相对较小,训练时有过拟合的风险。为此,本申请实施例中可以采用交叉输入模式与训练、批标准化(Batch Normalization,BN)以及数据增强之一来解决过拟合的问题。当然,行为识别模型也可以为深时序线性编码网络(Deep TemporalLinear Encoding Networks)。作为视频动作识别的行为识别模型,只要能够使用光流进行输入即可,本申请实施例对此不进行限定。
S103,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
举例说明,本申请实施例中将抛扔动作对应的置信度分数输入到逻辑回归模型中,得到抛扔识别分数。因此,本申请实施例通过分数即可判断是否属于暴力抛扔,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
需要说明的是,逻辑回归模型y=wx+b中,系数w和b根据卷积网络全连接层的向量作为输入,通过不断地深度学习得到。例如,在训练样本上获取每个样本的全连接层向量,此处将样本分为严重抛扔和非严重抛扔两类,并通过拟合得到逻辑回归模型。而如果样本是多分类,比如按照抛扔程度分为没有抛扔、轻微抛扔和严重抛扔三种类别,可以把没有抛扔当做一类,把轻微抛扔和严重抛扔当做另一类进行处理。
本申请实施例提供的基于光流的暴力抛扔检测方法,从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果;基于此,本申请实施例中将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将该灰度序列堆叠形成光流堆;然后,基于行为识别模型,检测光流堆中片段的抛扔动作以及计算抛扔动作对应的置信度分数,该置信度分数用于表征暴力抛扔的严重程度;进而,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,综合计算出抛扔识别分数,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
基于前述实施例,本申请实施例提供的另一种基于光流的暴力抛扔检测方法的流程示意图,如图2所示,该方法包括以下步骤:
S201,将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆。
需要说明的是,在本申请的其它实施例中,还可以计算帧图像流中相邻帧图像的结构相似度,并当结构相似度大于预设阈值时,从相邻帧图像中选取一幅帧图像加入转换队列。由于如果将结构相似度相同的相邻帧图像都加入转换队列,会造成重复计算,增加光流的计算次数,进而降低处理速度。
进一步地,本申请实施例中对灰度序列的尺寸进行调整,以使得灰度序列的尺寸与网络输入图像的尺寸相等。相较于灰度序列的尺寸而言,网络输入图像的尺寸要小很多,比如摄像头中画面的尺寸在1280*960量级,而网络输入图像的尺寸则为560*420量级,这样能够加快处理进度,同时对光流的计算精度影响不大。
S202,将光流堆按照相等间隔分为若干段,并分别从段中随机采样得到片段。
S203,根据行为识别模型中的空间流卷积网络和时间流卷积网络,对光流堆中片段的抛扔动作进行识别,并计算抛扔动作对应的置信度分数。
具体的,本申请实施例中获取片段经过空间流卷积网络和时间流卷积网络训练之后,得到的在空间流和时间流上对应的全连接层向量;进而,根据全连接层向量,计算置信度分数。
举例说明,首先将光流堆分为3段(Segment),一个片段(Snippet)从它对应的段中随机采样得到,即片段1、片段2和片段3;然后将片段1、片段2和片段3作为行为识别模型的输入,经过空间流卷积网络和时间流卷积网络进行抛扔动作的识别,用以判断快件在分拣的过程中是否存在暴力抛扔的现象,即没有抛扔和严重抛扔;进而,获取时间序列网络的全连接层识别数据,并将该全连接层识别数据与经验值作商的结果作为抛扔动作对应的置信度分数。
S204,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
举例说明,本申请实施例中将抛扔动作对应的置信度分数输入到逻辑回归模型中,得到抛扔识别分数。因此,本申请实施例通过分数即可判断是否属于暴力抛扔,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
在逻辑回归模型y=wx+b中,系数w和b根据卷积网络全连接层的向量作为输入,通过不断地深度学习得到。例如,在训练样本上获取每个样本的全连接层向量,此处将样本分为严重抛扔和非严重抛扔两类,并通过拟合得到逻辑回归模型。而如果样本是多分类,比如按照抛扔程度分为没有抛扔、轻微抛扔和严重抛扔三种类别,可以把没有抛扔当做一类,把轻微抛扔和严重抛扔当做另一类进行处理。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
基于前述实施例,本申请实施例提供一种设备,该设备包括一个或多个处理器;
存储器,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行上述的基于光流的暴力抛扔检测方法。
本申请实施例提供的基于光流的暴力抛扔检测方法,从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
基于前述实施例,本申请实施例提供一种基于光流的暴力抛扔检测装置,该装置可以应用于图1~2对应的实施例提供的基于光流的暴力抛扔检测方法中。参照图3所示,该基于光流的暴力抛扔检测装置3包括:
转换模块31,用于将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆;
检测模块32,用于基于行为识别模型,检测光流堆中片段的抛扔动作,以及计算抛扔动作对应的置信度分数;其中,置信度分数用于表征暴力抛扔的严重程度;
计算模块33,用于根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
在本申请的其它实施例中,如图4所示,检测模块32包括:
采样单元321,用于将光流堆按照相等间隔分为若干段,并分别从段中随机采样得到片段;
计算单元322,用于根据行为识别模型中的空间流卷积网络和时间流卷积网络,对光流堆中片段的抛扔动作进行识别,并计算抛扔动作对应的置信度分数。
在本申请的其它实施例中,计算单元322具体用于获取片段经过空间流卷积网络和时间流卷积网络训练之后,得到的在空间流和时间流上对应的全连接层向量,并根据全连接层向量,计算置信度分数。
在本申请的其它实施例中,转换模块31还用于计算帧图像流中相邻帧图像的结构相似度;
当结构相似度大于预设阈值时,从相邻帧图像中选取一幅帧图像加入转换队列。
在本申请的其它实施例中,如图5所示,基于光流的暴力抛扔检测装置3还包括:
调整模块34,用于对灰度序列的尺寸进行调整,以使得灰度序列的尺寸与网络输入图像的尺寸相等。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本申请实施例提供的基于光流的暴力抛扔检测装置,从整个视频中稀疏地采样一系列短片段,而每个短片段都对暴力抛扔的程度进行初步预测,从而根据这些短片段的共识来得到视频级的预测结果;基于此,本申请实施例中将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将该灰度序列堆叠形成光流堆;然后,基于行为识别模型,检测光流堆中片段的抛扔动作以及计算抛扔动作对应的置信度分数,该置信度分数用于表征暴力抛扔的严重程度;进而,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,综合计算出抛扔识别分数,能够检测出是否存在暴利抛扔快件的现象,避免了仅仅依靠人工进行监控,主观性强,且效率极低的问题。
基于前述实施例,本申请实施例提供一种计算机系统。请参照图6所示,该计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请的实施例,上文参考流程图1~2描述的过程可以被实现为计算机软件程序。例如,本申请的实施例1包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序由CPU 601执行,以实现如下步骤:
将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆;
基于行为识别模型,检测光流堆中片段的抛扔动作,以及计算抛扔动作对应的置信度分数;其中,置信度分数用于表征暴力抛扔的严重程度;
根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例基于光流的暴力抛扔检测设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括转换模块、检测模块及计算模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的终端中所包含的;也可以是单独存在,而未装配入该终端中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该终端执行时,使得该终端实现如上述实施例中的基于光流的暴力抛扔检测方法。
例如,终端可以实现如图1中所示的:S101,将经过解析的帧图像流转换为灰度序列,并当灰度序列的数量达到预设数量时,将灰度序列堆叠形成光流堆;S102,基于行为识别模型,检测光流堆中片段的抛扔动作,以及计算抛扔动作对应的置信度分数;其中,置信度分数用于表征暴力抛扔的严重程度;S103,根据抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。又如,终端可以实现如图2中所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的终端的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种基于光流的暴力抛扔检测方法,其特征在于,所述方法包括:
将经过解析的帧图像流转换为灰度序列,并当所述灰度序列的数量达到预设数量时,将所述灰度序列堆叠形成光流堆;
基于行为识别模型,检测所述光流堆中片段的抛扔动作,以及计算所述抛扔动作对应的置信度分数;其中,所述置信度分数用于表征暴力抛扔的严重程度;
根据所述抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
2.根据权利要求1所述的基于光流的暴力抛扔检测方法,其特征在于,所述基于行为识别模型,检测所述光流堆中片段的抛扔动作,以及计算所述抛扔动作对应的置信度分数,包括:
将所述光流堆按照相等间隔分为若干段,并分别从所述段中随机采样得到所述片段;
根据所述行为识别模型中的空间流卷积网络和时间流卷积网络,对所述光流堆中片段的抛扔动作进行识别,并计算所述抛扔动作对应的置信度分数。
3.根据权利要求2所述的基于光流的暴力抛扔检测方法,其特征在于,所述根据所述行为识别模型中的空间流卷积网络和时间流卷积网络,对所述光流堆中片段的抛扔动作进行识别,并计算所述抛扔动作对应的置信度分数,包括:
获取所述片段经过所述空间流卷积网络和所述时间流卷积网络训练之后,得到的在所述空间流和所述时间流上对应的全连接层向量;
根据所述全连接层向量,计算所述置信度分数。
4.根据权利要求1所述的基于光流的暴力抛扔检测方法,其特征在于,所述将经过解析的帧图像流转换为灰度序列,并当所述灰度序列的数量达到预设数量时,将所述灰度序列堆叠形成光流堆,还包括:
计算所述帧图像流中相邻帧图像的结构相似度;
当所述结构相似度大于预设阈值时,从所述相邻帧图像中选取一幅帧图像加入转换队列。
5.根据权利要求1至4中任意一项所述的基于光流的暴力抛扔检测方法,其特征在于,所述方法还包括:
对所述灰度序列的尺寸进行调整,以使得所述灰度序列的尺寸与网络输入图像的尺寸相等。
6.一种基于光流的暴力抛扔检测装置,其特征在于,所述装置包括:
转换模块,用于将经过解析的帧图像流转换为灰度序列,并当所述灰度序列的数量达到预设数量时,将所述灰度序列堆叠形成光流堆;
检测模块,用于基于行为识别模型,检测所述光流堆中片段的抛扔动作,以及计算所述抛扔动作对应的置信度分数;其中,所述置信度分数用于表征暴力抛扔的严重程度;
计算模块,用于根据所述抛扔动作对应的置信度分数和预先训练的逻辑回归模型,计算抛扔识别分数。
7.根据权利要求6所述的基于光流的暴力抛扔检测装置,其特征在于,所述检测模块包括:
采样单元,用于将所述光流堆按照相等间隔分为若干段,并分别从所述段中随机采样得到所述片段;
计算单元,用于根据所述行为识别模型中的空间流卷积网络和时间流卷积网络,对所述光流堆中片段的抛扔动作进行识别,并计算所述抛扔动作对应的置信度分数。
8.根据权利要求7所述的基于光流的暴力抛扔检测装置,其特征在于,所述计算单元具体用于获取所述片段经过所述空间流卷积网络和所述时间流卷积网络训练之后,得到的在所述空间流和所述时间流上对应的全连接层向量;
根据所述全连接层向量,计算所述置信度分数。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至5中任一项所述的基于光流的暴力抛扔检测方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于实现如权利要求1至5中任一项所述的基于光流的暴力抛扔检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910691116.7A CN112308885A (zh) | 2019-07-29 | 2019-07-29 | 基于光流的暴力抛扔检测方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910691116.7A CN112308885A (zh) | 2019-07-29 | 2019-07-29 | 基于光流的暴力抛扔检测方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112308885A true CN112308885A (zh) | 2021-02-02 |
Family
ID=74329989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910691116.7A Pending CN112308885A (zh) | 2019-07-29 | 2019-07-29 | 基于光流的暴力抛扔检测方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308885A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113469654A (zh) * | 2021-07-05 | 2021-10-01 | 安徽南瑞继远电网技术有限公司 | 一种基于智能算法融合的变电站多层次安全管控系统 |
WO2024037660A1 (zh) * | 2022-08-16 | 2024-02-22 | 顺丰科技有限公司 | 确定异常分拣区域的方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123544A (zh) * | 2014-07-23 | 2014-10-29 | 通号通信信息集团有限公司 | 基于视频分析的异常行为检测方法及系统 |
CN105550699A (zh) * | 2015-12-08 | 2016-05-04 | 北京工业大学 | 一种基于cnn融合时空显著信息的视频识别分类方法 |
CN105678216A (zh) * | 2015-12-21 | 2016-06-15 | 中国石油大学(华东) | 基于深度学习的时空数据流视频行为识别方法 |
CN106897714A (zh) * | 2017-03-23 | 2017-06-27 | 北京大学深圳研究生院 | 一种基于卷积神经网络的视频动作检测方法 |
CN107609460A (zh) * | 2017-05-24 | 2018-01-19 | 南京邮电大学 | 一种融合时空双重网络流和attention机制的人体行为识别方法 |
CN109508621A (zh) * | 2018-08-28 | 2019-03-22 | 顺丰科技有限公司 | 装卸口状态监控方法、装置、设备及其存储介质 |
CN109543513A (zh) * | 2018-10-11 | 2019-03-29 | 平安科技(深圳)有限公司 | 智能监控实时处理的方法、装置、设备及存储介质 |
US20190205629A1 (en) * | 2018-01-04 | 2019-07-04 | Beijing Kuangshi Technology Co., Ltd. | Behavior predicton method, behavior predicton system, and non-transitory recording medium |
CN109977904A (zh) * | 2019-04-04 | 2019-07-05 | 成都信息工程大学 | 一种基于深度学习的轻量型的人体动作识别方法 |
-
2019
- 2019-07-29 CN CN201910691116.7A patent/CN112308885A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123544A (zh) * | 2014-07-23 | 2014-10-29 | 通号通信信息集团有限公司 | 基于视频分析的异常行为检测方法及系统 |
CN105550699A (zh) * | 2015-12-08 | 2016-05-04 | 北京工业大学 | 一种基于cnn融合时空显著信息的视频识别分类方法 |
CN105678216A (zh) * | 2015-12-21 | 2016-06-15 | 中国石油大学(华东) | 基于深度学习的时空数据流视频行为识别方法 |
CN106897714A (zh) * | 2017-03-23 | 2017-06-27 | 北京大学深圳研究生院 | 一种基于卷积神经网络的视频动作检测方法 |
CN107609460A (zh) * | 2017-05-24 | 2018-01-19 | 南京邮电大学 | 一种融合时空双重网络流和attention机制的人体行为识别方法 |
US20190205629A1 (en) * | 2018-01-04 | 2019-07-04 | Beijing Kuangshi Technology Co., Ltd. | Behavior predicton method, behavior predicton system, and non-transitory recording medium |
CN109508621A (zh) * | 2018-08-28 | 2019-03-22 | 顺丰科技有限公司 | 装卸口状态监控方法、装置、设备及其存储介质 |
CN109543513A (zh) * | 2018-10-11 | 2019-03-29 | 平安科技(深圳)有限公司 | 智能监控实时处理的方法、装置、设备及存储介质 |
CN109977904A (zh) * | 2019-04-04 | 2019-07-05 | 成都信息工程大学 | 一种基于深度学习的轻量型的人体动作识别方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113469654A (zh) * | 2021-07-05 | 2021-10-01 | 安徽南瑞继远电网技术有限公司 | 一种基于智能算法融合的变电站多层次安全管控系统 |
CN113469654B (zh) * | 2021-07-05 | 2024-03-15 | 安徽南瑞继远电网技术有限公司 | 一种基于智能算法融合的变电站多层次安全管控系统 |
WO2024037660A1 (zh) * | 2022-08-16 | 2024-02-22 | 顺丰科技有限公司 | 确定异常分拣区域的方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229280B (zh) | 时域动作检测方法和系统、电子设备、计算机存储介质 | |
CN108304816B (zh) | 身份识别方法、装置、存储介质及电子设备 | |
CN110929785B (zh) | 数据分类方法、装置、终端设备及可读存储介质 | |
US20230417700A1 (en) | Automated analysis of analytical gels and blots | |
CN112329558B (zh) | 一种基于烧结机尾断面视频的FeO含量预测方法 | |
CN113723341B (zh) | 视频的识别方法、装置、可读介质和电子设备 | |
CN112308885A (zh) | 基于光流的暴力抛扔检测方法、装置、设备和存储介质 | |
CN113158909A (zh) | 基于多目标跟踪的行为识别轻量化方法、系统、设备 | |
CN112270309A (zh) | 一种车辆卡口设备抓拍质量评估方法、装置及可读介质 | |
CN112967289A (zh) | 安检包裹匹配方法、系统、设备及存储介质 | |
CN114663871A (zh) | 图像识别方法、训练方法、装置、系统及存储介质 | |
CN116894985A (zh) | 半监督图像分类方法及半监督图像分类系统 | |
CN115346278A (zh) | 图像检测方法、装置、可读介质及电子设备 | |
CN111723617B (zh) | 动作识别的方法、装置、设备及存储介质 | |
CN111126112B (zh) | 候选区域确定方法和装置 | |
CN113392241B (zh) | 测井图像清晰度的识别方法、装置、介质及电子设备 | |
Wang et al. | An improved YOLOX approach for low-light and small object detection: PPE on tunnel construction sites | |
US20220270228A1 (en) | Method and apparatus for obtaining information | |
CN111327946A (zh) | 视频质量评价和特征字典的训练方法、装置和介质 | |
CN116578925B (zh) | 基于特征画像的行为预测方法、装置及存储介质 | |
CN111523399A (zh) | 敏感视频检测及装置 | |
CN111259926A (zh) | 肉品新鲜度检测方法、装置、计算设备和存储介质 | |
CN111985269A (zh) | 检测模型构建方法、检测方法、装置、服务器及介质 | |
CN114445767B (zh) | 一种传输带传输异物检测方法及系统 | |
CN111259194B (zh) | 用于确定重复视频的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |