CN111428626B - 一种移动物体的识别方法、装置、及存储介质 - Google Patents

一种移动物体的识别方法、装置、及存储介质 Download PDF

Info

Publication number
CN111428626B
CN111428626B CN202010206308.7A CN202010206308A CN111428626B CN 111428626 B CN111428626 B CN 111428626B CN 202010206308 A CN202010206308 A CN 202010206308A CN 111428626 B CN111428626 B CN 111428626B
Authority
CN
China
Prior art keywords
motion trail
ordered
distance
class
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010206308.7A
Other languages
English (en)
Other versions
CN111428626A (zh
Inventor
林晓明
江金陵
鲁邹尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mingsheng Pinzhi Artificial Intelligence Technology Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202010206308.7A priority Critical patent/CN111428626B/zh
Publication of CN111428626A publication Critical patent/CN111428626A/zh
Application granted granted Critical
Publication of CN111428626B publication Critical patent/CN111428626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种移动物体的识别方法,包括采集视频;检测所采集的视频中的移动物体的运动轨迹;根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一图片进行识别,根据识别结果确定所述视频中是否包含指定物体。本申请能够较准确的识别移动物体。

Description

一种移动物体的识别方法、装置、及存储介质
技术领域
本文涉及计算机领域,尤指一种移动物体的识别方法、装置、及存储介质。
背景技术
随着人们生活水平的提高,卫生安全变得越来越重要,卫生安全中,食品安全是很重要的一块。厨房卫生安全是食品安全的重要组成部分,而在厨房卫生安全中,老鼠带来的危险是非常高的。但是一方面,我们难以时刻监视厨房中是否出现老鼠,另一方面,捕鼠器、老鼠药是有效的除鼠手段,但是在没有看到老鼠的情况下,难以确定捕鼠器、老鼠药的放置地点,除鼠的效率会低很多。所以,监视厨房是否出现老鼠,并在出现老鼠的时候地位老鼠的运动轨迹就变得非常重要。本发明针对的是夜间视频,而且为了加大算法的可行性,每个视频的长度一般为一分钟到两分钟。过长的视频需要被切分成短视频。短视频保证了视频的整体背景变化很小。
现有技术采用的基于深度学习的图片分类模,对于一张图片,如果图片中有老鼠,就判断整张图片的类别为老鼠。可以使用常用的图像分类模型,如resnet,densenet等。但是,厨房视频图像中,老鼠只占图片的一个很小的区域。一方面,如果模型要很好的识别图片中的老鼠,使用的深度学习模型需要很大,计算量和存储都会变大很多。另一方面,如果模型效果要好的话,需要海量的数据,同时因为不同厨房背景差异大,即使训练得到效果好的分类模型,也难以保证模型的泛化能力。此外,对整张图片做分类就没法对老鼠定位了,也无法得到老鼠的运动轨迹图。
现有技术也会采用基于深度学习的目标检测模型,基于深度学习的目标检测模型能够有效的识别图片中的目标,以及定位目标的位置。通过训练一个关于老鼠的深度学习目标检测模型,如Faster-RCNN,SSD,YOLO-v3等可以有效的识别图片中的老鼠,达到检测视频中的老鼠的目的。但是,一方面,对于同一个店铺的厨房,可以训练一个有效的目标检模型,但是这个模型在其它的店铺很可能效果就很差了。一个目标检测模型,不仅需要判断图片中哪些是老鼠,还需要判断哪些不是老鼠,不同的店铺中,店铺的背景差异很大,所以使用深度学习目标检测模型效果并不好。如果希望训练一个泛化能力很好的目标检测模型,那么就需要很多很多不同背景下的老鼠图片,而这很难达到。另一方面,目标检测模型计算量都比较大,这种模型如果同时部署到很多店铺的话,需要的计算成本也很高。
现有技术还会采用混合高斯背景建模和基于深度学习的图片分类模型,包括两个主要部分:
a)混合高斯背景建模
在运动目标检测提取中,背景目标对于目标的识别和跟踪至关重要。而混合高斯背景建模适合于在摄像机固定的情况下从图像序列中分离出背景和前景。在摄像机固定的情况下,背景的变化是缓慢的,而且大都是光照,风等等的影响,通过对背景建模,对一幅给定图像分离前景和背景,一般来说,前景就是运动物体,从而达到运动物品检测的目的。
b)基于深度学习的图片分类模型
常用的图像分类网络,如resnet、VGG16、densenet等,可以通过对一张图片打上类别标记,然后训练一个分类模型,以此识别给定图片的类别。基于移动检测得到的小区域图片做分类,需要的模型就会比较小,模型泛化能力也会比直接使用分类模型好很多。
餐厅厨房场景下,摄像头是固定摄像头,背景变化也比较小,移动物品检测算法效果会比较好。通过结合混合高斯背景建模的移动物品检测模型以及图像分类模型可以有效的检测视频中的老鼠,并定位老鼠的位置。先检测视频中移动的物品所在的位置,然后使用图片分类模型对图片做分类,判断该移动物品是不是老鼠,以此判断视频中是否出现老鼠,以及老鼠的位置。
混合高斯背景建模和基于深度学习的图片分类模型缺点在于深度学习分类模型受限于训练数据和模型效果,模型也难以达到完美的效果。容易对飞虫误检,当厨房中出现的飞虫多了,单纯的使用图像分类模型,难免误检。
所以,为了训练一个泛化能力强,效果也很好的,不容易对飞虫误检的老鼠检测算法。除了针对图片本身,还需要基于物体的运动轨迹判断移动物品是否是老鼠。
发明内容
本申请提供了一种移动物体的识别方法、装置、及存储介质,能够达到较准确的识别移动物体的目的。
本申请提供了一种移动物体的识别方法,包括:采集视频;检测所采集的视频中的移动物体的运动轨迹;根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;其中,运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到;其中,移动区域是指所述视频的帧图片中,包括所述移动物体的区域;对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一图片进行识别,根据识别结果确定所述视频中是否包含指定物体。
与相关技术相比,本申请实施例通过确定运动轨迹的有序类内距离对移动物体的可能情形进行识别,再采用图片分类模型进行进一步的确认,从而能够提高对应移动物体的识别准确性。
在一个示例性实施例中,本申请实施例通过图片分类模型对移动轨迹的多种情形的预测值进行处理,使得最可能的情形预测值一定大于比较可能的情形。
在一个示例性实施例中,本申请实施例通过图片分类模型对每帧帧图片的预测值进行预定方式的处理,从而能够得到移动轨迹的预测结果。
在一个示例性实施例中,本申请实施例在采用所述运动轨迹对应所有帧图片中排序在前的指定数量帧图片预测结果值求平均值的方式确定所述具有所述运动轨迹的视频图像包含移动物体的预测结果值;通过选择排序在前的指定数量帧图片预测结果值求平均值,能够避免帧图片仅包括指定移动物体的部分区域,造成预测值过低,带来整个移动轨迹预测值过低的情形。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1本申请实施例移动物体的识别方法流程图;
图2本申请实施例移动物体的识别装置模块示意图;
图3本申请实施例基于具体场景下的移动物体识别视频图片示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
如图1所示,本申请提供一种移动物体的识别方法,所述方法包括如下操作:
S1、采集视频;
在一个示例性实施例中,视频采集可以通过摄像设备进行采集。例如,当需要识别厨房中的老鼠时,可以通过固定安装在厨房中的摄像头,采集厨房中的视频。
在一个示例性实施例中,对于老鼠检测场景,为了降低计算量,假定只检测夜间活动的老鼠。因为白天的时候,厨房中很多人的活动信息,这时候如果做移动物品检测,会检测到很多物品在移动,然后之后深度学习模型就需要做很多的判断,计算量会大很多。所以摄像头需要有红外线摄像的功能,红外线摄像能在夜间也采集得到清楚的图片,之后的模型处理可以基于红外线摄像开启后采集的视频做处理。
S2、检测所采集的视频中的移动物体的运动轨迹;
在一个示例性实施例中,采用混合高斯模型检测视频中的移动物品的运动轨迹。混合高斯背景建模的主要原理是构建视频中的背景,然后对于每一帧的图片,一方面将该图片与背景做差别检测,以此检测图片中的“前景”,该前景即为认为的移动物品;另一方面,使用该图片去更新背景,得到新的背景。
S3、根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;其中,运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到;其中,移动区域是指所述视频的帧图片中,包括所述移动物体的区域;
在一个示例性实施例中,混合高斯模型检测得到的移动区域为移动轨迹对应帧图中的矩形区域,该区域是移动物体出现的区域,一般用rectangle表示,一条轨迹A按照顺序移动区域包括rectangle1,rectangle2,…,rectanglen。每一个矩形rectangle对应了一帧图片中的截图。
在一个示例性实施例中,一帧图片中的移动区域可能包括一个,也可能包括多个。
如图3所示,该图形为采集的视频中一帧图片,图片中的矩形区域为移动区域,w表示的是整个图的长,h表示的是整个图的宽。(x,y)表示的是左上角的坐标(默认整个图的左上角的坐标是(0,0),(dx,dy)分别为移动区域的长和宽。
在一个示例性实施中,操作S3中所述运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离取平均值得到。所述运动轨迹的有序类内距离通过以下公式确定:
Figure BDA0002421196600000061
其中,A表示运动轨迹;distance_sequential(A)表示运动轨迹A的帧图片中移动区域之间的有序类内距离;n表示运动轨迹所对应的移动区域的个数;i运动轨迹中各移动区域的顺序号。
上述公式通过以下推理得到:
假设rectangle1=(x1,y1,dx1,dy1,w,h),rectangle2=(x2,y2,dx2,dy2,w,h),定义两个矩形rectangle1和rectangle2之间的距离。
首先,两个rectangle的中心点的距离由横坐标间的距离和纵坐标间的距离决定:
Figure BDA0002421196600000071
Figure BDA0002421196600000072
然后,两个矩形框之间的距离:
Figure BDA0002421196600000073
c)定义一条轨迹的“有序类内距离”,轨迹A的有序类内距离为:
Figure BDA0002421196600000074
在其他实施方式中,所述运动轨迹的有序类内距离可以根据部分每两个相邻移动区域之间的距离取平均值获取,也可以通过取每两个相邻移动区域之间的距离的中位数获取,也可以通过筛查异常值之后取平均值获取等等方式。
本申请实施例通过对移动轨迹的有序类内距离的确定,可以区分移动物体。例如在检测老师的实际应用场景中,视频中记录的移动物体除了老鼠可能存在飞虫,飞蛾等情况,通过对移动物体的轨迹的有序类内距离,从而确定移动物体是飞虫的情况,从而排除误报。一般,飞虫在图片中的区域比较小,同时飞行速度比老鼠快,通过该现象对飞虫进行区别。
S4、对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体。
一般的,移动轨迹里面的图片一般是帧图片部分截图,在其他方式中也可以直接采用帧图片。
在一个示例性实施例中,预先采用基于卷积网络的图像分类模型,如resnet,densenet等等。
在一个示例性实施例中,所述方法还包括操作:S5:判断所述运动轨迹的有序类内距离是否符合预定条件。
在一个示例性实施例中,上述操作S5包括如下操作:
S50、将所述运动轨迹的有序类内距离与预设最大有序类内距离和预设可疑有序类内距离进行比较;
S51、当所述运动轨迹的有序类内距离大于预设最大有序类内距离,则确定所述运动轨迹的有序类内距离不符合预定条件;
S52当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离,或者所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离,则确定所述运动轨迹的有序类内距离符合预定条件。
在一个示例性实施例中,所述方法还包括S6:对于有序类内距离不符合预定条件的运动轨迹,确定所述视频中不包含指定物体。
例如,在检测老鼠的应用场景中,可以根据研究预先定义“最大有序类内距离”(max_distance)”和“可疑有序类内距离”(doubtful_distance)。比如max_distance=1.5,doubtful_distance=1。当distancesequential(A)>max_distance的时候,认为该轨迹不可能是老鼠,很可能是飞虫等移动物体。
上述对于有序类内距离不符合预定条件的运动轨迹确定为不包含指定物体结果,但是对于有序类内距离符合预定条件的运动轨迹不能直接得出结果,需要进一步判断,需要采用图片分类模型进行进一步的预测。
例如,在上述检测老鼠的应用场景中,当max_distance≥distance_sequential(A)>doubtful_distance,认为该轨迹不太可能是老鼠,需要结合图片分类模型的预测结果来判断。当distance_sequential(A)≤doubtful_distance的时候认为不太可能是飞虫,以图片分类模型的预测结果为准。
故,在一个示例性实施例中,上述操作S4所述对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体,包括如下操作:
S41、对所述运动轨迹对应的每一张图片是否包含所述指定移动物体进行预测,得到所述运动轨迹对应的每一张图片包含指定移动物体的预测结果值;
S42、根据每一张图片包含指定移动物体的预测结果值,采用预定方式得到所述运动轨迹包含所述指定移动物体的预测结果值;
S43、根据所得到的所述运动轨迹包含所述指定移动物体的预测结果值,确定所述视频中是否包含指定物体;
其中,当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第一预测结果值;当所述运动轨迹的有序类内距离小于或等于可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第二预测结果值;所述第一预测结果值小于第二预测结果值。
例如,在检测老鼠的应用场景中,当distance_sequential(A)<doubtful_distance的时候,采用图形分类模型对移动轨迹中的rectangle1,rectangle2,…,rectanglen对应的预测结果分别为[pred1,pred2,,,,predn],其中predi是一个0-1之间的数,越接近1,表示这帧图中越可能包含老鼠。
同时,需要界定不太可能是老鼠的情形预测值小于不太可能是飞虫的情形的预测值。假设:doubtful_distance=1;max_distance=2;现在有一条轨迹A,假设它使用图片分类模型的预测值为[0.9,0.8,0.5,0.6,0.4]。轨迹A的有序类内距离为distance_sequential(A);若distance_sequential(A)>max_distance,则得到最终预测值pred_1=0;若distance_sequential(A)>doubtful_distance,则得到最终预测值pred_2(第一预测结果);若distance_sequential(A)<=doubtful_distance,则得到最终预测值pred_3(第二预测结果)。必须要保证pred_2需要小于pred_3。
因为上述是对每帧帧图片的结果进行的预测,而没有对整个移动轨迹的进行预测,故需要采用预定方式对移动轨迹进行预测。
在一个示例性实施例中,采用对所述运动轨迹对应所有帧图片包含指定移动物体的预测结果值求平均值的方式确定所述运动轨迹包含所述指定移动物体的预测结果值;在当所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时,对所述预测结果值求平均值并且乘以指定系数;
或者,在另一个示例性实施例中,采用所述运动轨迹对应所有帧图片中排序在前的指定数量帧图片预测结果值求平均值的方式确定所述具有所述运动轨迹的视频图像包含移动物体的预测结果值;在所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时采用的帧图片数量,对于在所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时采用的帧图片数量。
上述在当所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时,对所述预测结果值求平均值并且乘以指定系数;或者在所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时采用的帧图片数量,对于在所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时采用的帧图片数量。目的是为了要保证pred_2需要小于pred_3。
在一个示例性实施例中,上述指定系数可以为0-1之间的数。当然也可以在pred_3的情形下采用乘以一定倍数。
如图2所示,本申请提供一种移动物体的识别装置,包括:
视频采集模块10,用于采集视频;
检测模块20,用于检测所采集的视频中的移动物体的运动轨迹;
有序类内距离确定模块30,用于根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;其中,运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到;其中,移动区域是指所述视频的帧图片中,包括所述移动物体的区域;
图片分类模块40,用于对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体。
本申请还提供一种定向投放内容的装置,包括处理器和存储器,其特征在于,所述存储器中存储有用于定向投放内容的程序;所述处理器用于读取所述用于定向投放内容的程序,执行上述中任一项所述的方法。
本申请还提供一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述中任一项所述的方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (6)

1.一种移动物体的识别方法,其特征在于,所述方法包括:
采集视频;
检测所采集的视频中的移动物体的运动轨迹;
根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;其中,运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到;其中,移动区域是指所述视频的帧图片中,包括所述移动物体的区域;
判断所述运动轨迹的有序类内距离是否符合预定条件,包括:
将所述运动轨迹的有序类内距离与预设最大有序类内距离和预设可疑有序类内距离进行比较;
当所述运动轨迹的有序类内距离大于预设最大有序类内距离,则确定所述运动轨迹的有序类内距离不符合预定条件;
当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离,或者所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离,则确定所述运动轨迹的有序类内距离符合预定条件;
对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体,包括:
对所述运动轨迹对应的每一张图片是否包含指定移动物体进行预测,得到所述运动轨迹对应的每一张图片包含指定移动物体的预测结果值;
根据每一张图片包含指定移动物体的预测结果值,采用预定方式得到所述运动轨迹包含所述指定移动物体的预测结果值;
根据所得到的所述运动轨迹包含所述指定移动物体的预测结果值,确定所述视频中是否包含指定物体;
其中,当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第一预测结果值;当所述运动轨迹的有序类内距离小于或等于可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第二预测结果值;所述第一预测结果值小于第二预测结果值;
对于有序类内距离不符合预定条件的运动轨迹,确定所述视频中不包含指定物体。
2.根据权利要求1所述的方法,其特征在于,所述运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到,包括:
所述运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离取平均值得到。
3.根据权利要求1所述的方法,其特征在于:所述采用预定方式确定所述运动轨迹包含移动物体的预测结果值,包括:
采用对所述运动轨迹对应所有帧图片包含指定移动物体的预测结果值求平均值的方式确定所述运动轨迹包含所述指定移动物体的预测结果值;在当所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离时,对所述预测结果值求平均值并且乘以指定系数;或者在当所述运动轨迹的有序类内距离小于或等于可疑有序类内距离对所述预测结果值求平均值并且乘以指定倍数。
4.一种移动物体的识别装置,其特征在于,所述装置包括:
视频采集模块,用于采集视频;
检测模块,用于检测所采集的视频中的移动物体的运动轨迹;
有序类内距离确定模块,用于根据所检测到的移动物体的运动轨迹,确定所检测到的运动轨迹的有序类内距离;其中,运动轨迹的有序类内距离根据该运动轨迹所包含的多个移动区域中,每两个相邻移动区域之间的距离得到;其中,移动区域是指所述视频的帧图片中,包括所述移动物体的区域;
图片分类模块,用于判断所述运动轨迹的有序类内距离是否符合预定条件,包括:
将所述运动轨迹的有序类内距离与预设最大有序类内距离和预设可疑有序类内距离进行比较;
当所述运动轨迹的有序类内距离大于预设最大有序类内距离,则确定所述运动轨迹的有序类内距离不符合预定条件;
当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离,或者所述运动轨迹的有序类内距离小于或等于预设可疑有序类内距离,则确定所述运动轨迹的有序类内距离符合预定条件;
对于有序类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体,包括:
对所述运动轨迹对应的每一张图片是否包含指定移动物体进行预测,得到所述运动轨迹对应的每一张图片包含指定移动物体的预测结果值;
根据每一张图片包含指定移动物体的预测结果值,采用预定方式得到所述运动轨迹包含所述指定移动物体的预测结果值;
根据所得到的所述运动轨迹包含所述指定移动物体的预测结果值,确定所述视频中是否包含指定物体;
其中,当所述运动轨迹的有序类内距离小于或等于预设最大有序类内距离并且大于预设可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第一预测结果值;当所述运动轨迹的有序类内距离小于或等于可疑有序类内距离时,采用预定方式得到所述运动轨迹包含所述指定移动物体的第二预测结果值;所述第一预测结果值小于第二预测结果值;
对于有序类内距离不符合预定条件的运动轨迹,确定所述视频中不包含指定物体。
5.一种定向投放内容的装置,包括处理器和存储器,其特征在于,所述存储器中存储有用于定向投放内容的程序;所述处理器用于读取所述用于定向投放内容的程序,执行权利要求1-3中任一项所述的方法。
6.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述的方法。
CN202010206308.7A 2020-03-23 2020-03-23 一种移动物体的识别方法、装置、及存储介质 Active CN111428626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010206308.7A CN111428626B (zh) 2020-03-23 2020-03-23 一种移动物体的识别方法、装置、及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010206308.7A CN111428626B (zh) 2020-03-23 2020-03-23 一种移动物体的识别方法、装置、及存储介质

Publications (2)

Publication Number Publication Date
CN111428626A CN111428626A (zh) 2020-07-17
CN111428626B true CN111428626B (zh) 2023-05-23

Family

ID=71549657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010206308.7A Active CN111428626B (zh) 2020-03-23 2020-03-23 一种移动物体的识别方法、装置、及存储介质

Country Status (1)

Country Link
CN (1) CN111428626B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457447B (zh) * 2022-11-07 2023-03-28 浙江莲荷科技有限公司 运动物体识别的方法、装置、系统及电子设备、存储介质
CN117671597A (zh) * 2023-12-25 2024-03-08 北京大学长沙计算与数字经济研究院 一种老鼠检测模型的构建方法和老鼠检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011014093A1 (ru) * 2009-07-27 2011-02-03 Matsur Igor Yurievich Способ определения скорости движения транспортного средства
CN102396001A (zh) * 2009-12-28 2012-03-28 松下电器产业株式会社 移动体检测装置以及移动体检测方法
CN106541419A (zh) * 2016-10-13 2017-03-29 同济大学 一种机器人轨迹误差的测量方法
CN110070560A (zh) * 2019-03-20 2019-07-30 西安理工大学 基于目标检测的物体运动方向识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011014093A1 (ru) * 2009-07-27 2011-02-03 Matsur Igor Yurievich Способ определения скорости движения транспортного средства
CN102396001A (zh) * 2009-12-28 2012-03-28 松下电器产业株式会社 移动体检测装置以及移动体检测方法
CN106541419A (zh) * 2016-10-13 2017-03-29 同济大学 一种机器人轨迹误差的测量方法
CN110070560A (zh) * 2019-03-20 2019-07-30 西安理工大学 基于目标检测的物体运动方向识别方法

Also Published As

Publication number Publication date
CN111428626A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
US10782688B2 (en) Method, control apparatus, and system for tracking and shooting target
CN112418069B (zh) 一种高空抛物检测方法、装置、计算机设备及存储介质
St-Charles et al. Universal background subtraction using word consensus models
US11205274B2 (en) High-performance visual object tracking for embedded vision systems
CN109154976B (zh) 通过机器学习训练对象分类器的系统和方法
US9767570B2 (en) Systems and methods for computer vision background estimation using foreground-aware statistical models
US9230175B2 (en) System and method for motion detection in a surveillance video
Bertini et al. Multi-scale and real-time non-parametric approach for anomaly detection and localization
US8559670B2 (en) Moving object detection detection within a video stream using object texture
US20200380269A1 (en) Camera blockage detection for autonomous driving systems
KR101910542B1 (ko) 객체 검출을 위한 영상분석 서버장치 및 방법
US8553086B2 (en) Spatio-activity based mode matching
US20170006215A1 (en) Methods and systems for controlling a camera to perform a task
US10692225B2 (en) System and method for detecting moving object in an image
KR102002812B1 (ko) 객체 검출을 위한 영상분석 서버장치 및 방법
CN112926410A (zh) 目标跟踪方法、装置、存储介质及智能视频系统
CN111428626B (zh) 一种移动物体的识别方法、装置、及存储介质
Führ et al. Combining patch matching and detection for robust pedestrian tracking in monocular calibrated cameras
KR20090043416A (ko) 카메라 이동 영향을 검출하고 억제하는 감시 카메라 장치및 그 제어 방법
CN109255360A (zh) 一种目标分类方法、装置及系统
US20230394795A1 (en) Information processing device, information processing method, and program recording medium
CN111444758A (zh) 一种基于时空信息的行人重识别方法及装置
Junejo et al. Single-class SVM for dynamic scene modeling
CN109727268A (zh) 目标跟踪方法、装置、计算机设备和存储介质
Wang et al. Tracking objects through occlusions using improved Kalman filter

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230811

Address after: 200232 unit 5b06, floor 5, building 2, No. 277, Longlan Road, Xuhui District, Shanghai

Patentee after: Shanghai Mingsheng Pinzhi Artificial Intelligence Technology Co.,Ltd.

Address before: 100084 a1002, 10th floor, building 1, yard 1, Zhongguancun East Road, Haidian District, Beijing

Patentee before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.