CN112541412A - 基于视频的目标识别装置和方法 - Google Patents

基于视频的目标识别装置和方法 Download PDF

Info

Publication number
CN112541412A
CN112541412A CN202011384534.0A CN202011384534A CN112541412A CN 112541412 A CN112541412 A CN 112541412A CN 202011384534 A CN202011384534 A CN 202011384534A CN 112541412 A CN112541412 A CN 112541412A
Authority
CN
China
Prior art keywords
video stream
unit image
target
module
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011384534.0A
Other languages
English (en)
Inventor
李欣
冯凯凯
庞志远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumavision Technologies Co Ltd
Original Assignee
Sumavision Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumavision Technologies Co Ltd filed Critical Sumavision Technologies Co Ltd
Priority to CN202011384534.0A priority Critical patent/CN112541412A/zh
Publication of CN112541412A publication Critical patent/CN112541412A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于视频的目标识别装置和方法,包括视频流获取模块、视频流传输模块和视频流分析模块;视频流获取模块、视频流传输模块和视频流分析模块依次连接;视频流获取模块用于获取目标视频流,并将目标视频流发送给视频流传输模块;视频流传输模块用于将目标视频流发送给视频流分析模块;视频流分析模块用于将目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果,可以将动态的目标视频流进行裁剪获取多个静态的单元图像文件,从静态的单元图像文件中识别目标对象,提高识别准确率。

Description

基于视频的目标识别装置和方法
技术领域
本发明涉及图像处理技术领域,尤其是涉及基于视频的目标识别装置和方法。
背景技术
视频是将一系列静态影像以电信号的方式,进行捕捉、纪录、处理、储存、传送和重现的技术。当连续的图像变化每秒超过24帧时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频。
随着科学技术的发展,视频以串流媒体的形式存储在互联网上,并被用户终端进行接收和播放。目前,从图像文件中获取目标信息的应用越来越广泛。但是,从动态的视频中识别目标对象的准确率较低,无法准确识别目标对象。
发明内容
有鉴于此,本发明的目的在于提供基于视频的目标识别装置和方法,可以将动态的目标视频流进行裁剪获取多个静态的单元图像文件,从静态的单元图像文件中识别目标对象,提高识别准确率。
第一方面,本发明实施例提供了基于视频的目标识别装置,所述装置包括视频流获取模块、视频流传输模块和视频流分析模块;
所述视频流获取模块、所述视频流传输模块和所述视频流分析模块依次连接;
所述视频流获取模块,用于获取目标视频流,并将所述目标视频流发送给所述视频流传输模块;
所述视频流传输模块,用于将所述目标视频流发送给所述视频流分析模块;
所述视频流分析模块,用于将所述目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果。
进一步的,所述视频流分析模块包括视频流裁剪模块、识别对比模块和云数据库,所述装置还包括数据存储模块;
所述视频流裁剪模块、所述识别对比模块和所述云数据库依次连接,所述云数据库与所述数据存储模块相连接;
所述视频流裁剪模块,用于将所述目标视频流进行裁剪,得到所述多个单元图像文件;
所述识别对比模块,用于从所述云数据库中调取所述预存的目标对象图像;从所述预存的目标对象图像中提取目标对象特征;从所述多个单元图像文件中选取任一单元图像文件作为当前单元图像文件,将所述当前单元图像文件与所述目标对象特征进行比对,如果所述当前单元图像文件存在所述目标对象特征,则将所述目标视频流存储到所述数据存储模块中;如果所述当前单元图像文件不存在所述目标对象特征,则继续对下一单元图像文件进行比对。
进一步的,所述识别对比模块,用于通过深度学习算法将所述当前单元图像文件与所述目标对象特征进行比对。
进一步的,所述装置还包括目标视频流采集端;
所述目标视频流采集端,与所述视频流获取模块相连接,用于采集目标视频流、所述目标视频流对应的位置信息和时间信息,并将所述目标视频流、所述目标视频流对应的所述位置信息和所述时间信息发送给所述视频流获取模块。
进一步的,所述目标视频流采集端为摄像机或视频文件存储端。
第二方面,本发明实施例提供了基于视频的目标识别方法,应用于如上所述的基于视频的目标识别装置,基于视频的目标识别装置包括数据存储模块和云数据库,所述方法包括:
获取目标视频流;
将所述目标视频流进行裁剪,得到多个单元图像文件;
调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果。
进一步的,所述调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果,包括:
从所述云数据库中调取所述预存的目标对象图像;
从所述预存的目标对象图像中提取目标对象特征;
从所述多个单元图像文件中选取任一单元图像文件作为当前单元图像文件;
将所述当前单元图像文件与所述目标对象特征进行比对;
如果所述当前单元图像文件存在所述目标对象特征,则将所述目标视频流存储到所述数据存储模块中;
如果所述当前单元图像文件不存在所述目标对象特征,则继续对下一单元图像文件进行比对。
进一步的,所述将所述当前单元图像文件与所述目标对象特征进行比对,包括:
通过深度学习算法将所述当前单元图像文件与所述目标对象特征进行比对。
第三方面,本发明实施例提供了电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法。
第四方面,本发明实施例提供了具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行如上所述的方法。
本发明实施例提供了基于视频的目标识别装置和方法,包括视频流获取模块、视频流传输模块和视频流分析模块;视频流获取模块、视频流传输模块和视频流分析模块依次连接;视频流获取模块用于获取目标视频流,并将目标视频流发送给视频流传输模块;视频流传输模块用于将目标视频流发送给视频流分析模块;视频流分析模块用于将目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果,可以将动态的目标视频流进行裁剪获取多个静态的单元图像文件,从静态的单元图像文件中识别目标对象,提高识别准确率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的基于视频的目标识别装置示意图;
图2为本发明实施例二提供的另一基于视频的目标识别装置示意图;
图3为本发明实施例三提供的基于视频的目标识别方法流程图。
图标:
1-视频流获取模块;2-视频流传输模块;3-视频流分析模块;4-目标视频流采集端;5-数据存储模块;31-视频流裁剪模块;32-识别对比模块;33-云数据库。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,下面对本发明实施例进行详细介绍。
实施例一:
图1为本发明实施例一提供的基于视频的目标识别装置示意图。
参照图1,该装置包括视频流获取模块1、视频流传输模块2和视频流分析模块3;
视频流获取模块1、视频流传输模块2和视频流分析模块3依次连接;
视频流获取模块1,用于获取目标视频流,并将目标视频流发送给视频流传输模块2;
视频流传输模块2,用于将目标视频流发送给视频流分析模块3;
视频流分析模块3,用于将目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果。
本实施例中,视频流获取模块在获取目标视频流后,将目标视频流发送给视频流传输模块;视频流传输模块将目标视频流发送给视频流分析模块;视频流分析模块将目标视频流进行裁剪,得到多个单元图像文件,其中,单元图像文件为静态图像;将多个单元图像文件与预存的目标对象图像进行比较,确定单元图像文件中是否存在目标对象特征,从而得到比对结果;通过将动态的目标视频流裁剪为静态的多个单元图像文件,可以提高识别准确率。本申请还可以对目标对象进行智能提取和智能分析,从而实现目标对象识别、目标对象跟踪、目标对象提取和目标对象分析等功能。
实施例二:
图2为本发明实施例二提供的另一基于视频的目标识别装置示意图。
参照图2,该装置包括:视频流获取模块1、视频流传输模块2和视频流分析模块3;视频流分析模块3包括视频流裁剪模块31、识别对比模块32和云数据库33,该装置还包括数据存储模块5;
视频流裁剪模块31、识别对比模块32和云数据库33依次连接,云数据库33与数据存储模块5相连接;
视频流裁剪模块31,用于将目标视频流进行裁剪,得到多个单元图像文件;
这里,单元图像文件为目标视频流的一帧画面。
识别对比模块32,用于从云数据库33中调取预存的目标对象图像;从预存的目标对象图像中提取目标对象特征;从多个单元图像文件中选取任一单元图像文件作为当前单元图像文件,将当前单元图像文件与目标对象特征进行比对,如果当前单元图像文件存在目标对象特征,则将目标视频流存储到数据存储模块5中;如果当前单元图像文件不存在目标对象特征,则继续对下一单元图像文件进行比对。
进一步的,识别对比模块32,用于通过深度学习算法将当前单元图像文件与目标对象特征进行比对。
深度学习算法具体为:将除最顶层的其他层间的权重变为双向的,这样最顶层仍然是一个单层神经网络,而其他层则变为了图模型。向上的权重用于“认知”,向下的权重用于“生成”。
然后使用wake-sleep算法调整所有的权重。让认知和生成达成一致,也就是保证生成的最顶层能够尽可能正确的复原底层的节点。比如顶层的一个节点表示人脸,那么所有人脸的图像应该激活这个节点,并且这个结果向下生成的图像应该能够表现为一个大概的人脸图像。wake-sleep算法分为醒(wake)阶段和睡(sleep)阶段两个部分。
wake阶段为认知过程,通过外界的特征和向上的权重产生每一层的抽象表示,并且使用梯度下降修改层间的下行权重。
sleep阶段为生成过程,通过顶层表示向下权重,生成底层的状态,同时修改层间向上的权重。
自下上升的非监督学习:从底层开始,一层一层地往顶层训练。采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。具体的,先用无标定数据训练第一层,训练时先学习第一层的参数,这层可以看作是使输出和输入差别最小的三层神经网络的隐层,由于模型容量的限制以及稀疏性约束,使得得到的模型能够学习到数据本身的结构,从而得到比输入更具有表示能力的特征;在学习得到n-l层后,将n-l层的输出作为第n层的输入,训练第n层,由此分别得到各层参数。
自顶向下的监督学习:通过带标签的数据去训练,误差自顶向下传输,对网络进行微调。基于非监督学习得到的各层参数,进一步调整个多层模型的参数,这是一个有监督训练过程。非监督学习过程中,采用类似神经网络的随机初始化初值的过程,由于不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。因此,深度学习算法的良好效果在很大程度上归功于特征学习的过程。
进一步的,该装置还包括目标视频流采集端4;
目标视频流采集端4,与视频流获取模块1相连接,用于采集目标视频流、目标视频流对应的位置信息和时间信息,并将目标视频流、目标视频流对应的位置信息和时间信息发送给视频流获取模块1。
进一步的,目标视频流采集端4为摄像机或视频文件存储端。
这里,视频流获取模块1除了获取目标视频流外,还接收目标视频流采集端4发送的目标视频流对应的位置信息和时间信息。
本发明实施例提供了基于视频的目标识别装置,包括视频流获取模块、视频流传输模块和视频流分析模块;视频流获取模块、视频流传输模块和视频流分析模块依次连接;视频流获取模块用于获取目标视频流,并将目标视频流发送给视频流传输模块;视频流传输模块用于将目标视频流发送给视频流分析模块;视频流分析模块用于将目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果,可以将动态的目标视频流进行裁剪获取多个静态的单元图像文件,从静态的单元图像文件中识别目标对象,提高识别准确率。
实施例三:
图3为本发明实施例三提供的基于视频的目标识别方法流程图。
参照图3,应用于如上所述的基于视频的目标识别装置,基于视频的目标识别装置包括数据存储模块和云数据库,该方法包括以下步骤:
步骤S101,获取目标视频流;
步骤S102,将目标视频流进行裁剪,得到多个单元图像文件;
步骤S103,调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果。
进一步的,步骤S103包括以下步骤:
步骤S201,从云数据库中调取预存的目标对象图像;
步骤S202,从预存的目标对象图像中提取目标对象特征;
步骤S203,从多个单元图像文件中选取任一单元图像文件作为当前单元图像文件;
步骤S204,将当前单元图像文件与目标对象特征进行比对;
步骤S205,如果当前单元图像文件存在目标对象特征,则将目标视频流存储到数据存储模块中;
步骤S206,如果当前单元图像文件不存在目标对象特征,则继续对下一单元图像文件进行比对。
进一步的,步骤S204包括:
通过深度学习算法将当前单元图像文件与目标对象特征进行比对。
本发明实施例提供了基于视频的目标识别方法,包括:获取目标视频流;将目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将多个单元图像文件分别与预存的目标对象图像进行比对,得到比对结果,可以将动态的目标视频流进行裁剪获取多个静态的单元图像文件,从静态的单元图像文件中识别目标对象,提高识别准确率。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例提供的基于视频的目标识别方法的步骤。
本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,计算机可读介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例的基于视频的目标识别方法的步骤。
本发明实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种基于视频的目标识别装置,其特征在于,所述装置包括视频流获取模块、视频流传输模块和视频流分析模块;
所述视频流获取模块、所述视频流传输模块和所述视频流分析模块依次连接;
所述视频流获取模块,用于获取目标视频流,并将所述目标视频流发送给所述视频流传输模块;
所述视频流传输模块,用于将所述目标视频流发送给所述视频流分析模块;
所述视频流分析模块,用于将所述目标视频流进行裁剪,得到多个单元图像文件;调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果。
2.根据权利要求1所述的基于视频的目标识别装置,其特征在于,所述视频流分析模块包括视频流裁剪模块、识别对比模块和云数据库,所述装置还包括数据存储模块;
所述视频流裁剪模块、所述识别对比模块和所述云数据库依次连接,所述云数据库与所述数据存储模块相连接;
所述视频流裁剪模块,用于将所述目标视频流进行裁剪,得到所述多个单元图像文件;
所述识别对比模块,用于从所述云数据库中调取所述预存的目标对象图像;从所述预存的目标对象图像中提取目标对象特征;从所述多个单元图像文件中选取任一单元图像文件作为当前单元图像文件,将所述当前单元图像文件与所述目标对象特征进行比对,如果所述当前单元图像文件存在所述目标对象特征,则将所述目标视频流存储到所述数据存储模块中;如果所述当前单元图像文件不存在所述目标对象特征,则继续对下一单元图像文件进行比对。
3.根据权利要求2所述的基于视频的目标识别装置,其特征在于,所述识别对比模块,用于通过深度学习算法将所述当前单元图像文件与所述目标对象特征进行比对。
4.根据权利要求1所述的基于视频的目标识别装置,其特征在于,所述装置还包括目标视频流采集端;
所述目标视频流采集端,与所述视频流获取模块相连接,用于采集目标视频流、所述目标视频流对应的位置信息和时间信息,并将所述目标视频流、所述目标视频流对应的所述位置信息和所述时间信息发送给所述视频流获取模块。
5.根据权利要求4所述的基于视频的目标识别装置,其特征在于,所述目标视频流采集端为摄像机或视频文件存储端。
6.一种基于视频的目标识别方法,其特征在于,应用于权利要求1至5任一项所述的基于视频的目标识别装置,基于视频的目标识别装置包括数据存储模块和云数据库,所述方法包括:
获取目标视频流;
将所述目标视频流进行裁剪,得到多个单元图像文件;
调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果。
7.根据权利要求6所述的基于视频的目标识别方法,其特征在于,所述调取预存的目标对象图像,将所述多个单元图像文件分别与所述预存的目标对象图像进行比对,得到比对结果,包括:
从所述云数据库中调取所述预存的目标对象图像;
从所述预存的目标对象图像中提取目标对象特征;
从所述多个单元图像文件中选取任一单元图像文件作为当前单元图像文件;
将所述当前单元图像文件与所述目标对象特征进行比对;
如果所述当前单元图像文件存在所述目标对象特征,则将所述目标视频流存储到所述数据存储模块中;
如果所述当前单元图像文件不存在所述目标对象特征,则继续对下一单元图像文件进行比对。
8.根据权利要求7所述的基于视频的目标识别方法,其特征在于,所述将所述当前单元图像文件与所述目标对象特征进行比对,包括:
通过深度学习算法将所述当前单元图像文件与所述目标对象特征进行比对。
9.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求6至8任一项所述的方法。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求6至8任一项所述的方法。
CN202011384534.0A 2020-11-30 2020-11-30 基于视频的目标识别装置和方法 Pending CN112541412A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011384534.0A CN112541412A (zh) 2020-11-30 2020-11-30 基于视频的目标识别装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011384534.0A CN112541412A (zh) 2020-11-30 2020-11-30 基于视频的目标识别装置和方法

Publications (1)

Publication Number Publication Date
CN112541412A true CN112541412A (zh) 2021-03-23

Family

ID=75016911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011384534.0A Pending CN112541412A (zh) 2020-11-30 2020-11-30 基于视频的目标识别装置和方法

Country Status (1)

Country Link
CN (1) CN112541412A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268598A (zh) * 2017-12-18 2018-07-10 苏州航天系统工程有限公司 一种基于视频图像数据的分析系统及分析方法
CN110198432A (zh) * 2018-10-30 2019-09-03 腾讯科技(深圳)有限公司 视频数据的处理方法、装置、计算机可读介质及电子设备
CN111010590A (zh) * 2018-10-08 2020-04-14 传线网络科技(上海)有限公司 一种视频裁剪方法及装置
CN111405197A (zh) * 2020-03-19 2020-07-10 北京海益同展信息科技有限公司 一种视频裁剪方法、图像处理方法及装置
CN111553247A (zh) * 2020-04-24 2020-08-18 上海锘科智能科技有限公司 一种基于改进骨干网络的视频结构化系统、方法及介质
CN111935479A (zh) * 2020-07-30 2020-11-13 浙江大华技术股份有限公司 一种目标图像确定方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268598A (zh) * 2017-12-18 2018-07-10 苏州航天系统工程有限公司 一种基于视频图像数据的分析系统及分析方法
CN111010590A (zh) * 2018-10-08 2020-04-14 传线网络科技(上海)有限公司 一种视频裁剪方法及装置
CN110198432A (zh) * 2018-10-30 2019-09-03 腾讯科技(深圳)有限公司 视频数据的处理方法、装置、计算机可读介质及电子设备
CN111405197A (zh) * 2020-03-19 2020-07-10 北京海益同展信息科技有限公司 一种视频裁剪方法、图像处理方法及装置
CN111553247A (zh) * 2020-04-24 2020-08-18 上海锘科智能科技有限公司 一种基于改进骨干网络的视频结构化系统、方法及介质
CN111935479A (zh) * 2020-07-30 2020-11-13 浙江大华技术股份有限公司 一种目标图像确定方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN109977262B (zh) 从视频中获取候选片段的方法、装置及处理设备
CN109697434B (zh) 一种行为识别方法、装置和存储介质
CN110602526B (zh) 视频处理方法、装置、计算机设备及存储介质
CN108140032B (zh) 用于自动视频概括的设备和方法
US11087167B2 (en) First-person camera based visual context aware system
JP6517681B2 (ja) 映像パターン学習装置、方法、及びプログラム
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
CN111242222B (zh) 分类模型的训练方法、图像处理方法及装置
CN108230291B (zh) 物体识别系统训练方法、物体识别方法、装置和电子设备
JP7007829B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN112052759B (zh) 一种活体检测方法和装置
JP2012208710A (ja) 属性推定装置
CN110135369A (zh) 一种行为识别方法、系统、设备及计算机可读存储介质
CN108921140A (zh) 行人再识别方法
JP2013120441A (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
CN113128526B (zh) 图像识别方法、装置、电子设备和计算机可读存储介质
CN110570375A (zh) 一种图像处理方法、装置、电子设置以及存储介质
CN115481671A (zh) 图像识别辅助装置、图像识别辅助方法及记录介质
CN112686195A (zh) 情绪识别方法、装置、计算机设备和存储介质
CN113393385A (zh) 基于多尺度融合的无监督去雨方法、系统、装置及介质
CN117392714A (zh) 基于半监督学习的人脸美丽预测方法、设备及介质
CN112541412A (zh) 基于视频的目标识别装置和方法
CN108596068B (zh) 一种动作识别的方法和装置
US20230066331A1 (en) Method and system for automatically capturing and processing an image of a user
CN114841887B (zh) 一种基于多层次差异学习的图像恢复质量评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination