CN111626075A - 一种目标识别方法及装置 - Google Patents

一种目标识别方法及装置 Download PDF

Info

Publication number
CN111626075A
CN111626075A CN201910145599.0A CN201910145599A CN111626075A CN 111626075 A CN111626075 A CN 111626075A CN 201910145599 A CN201910145599 A CN 201910145599A CN 111626075 A CN111626075 A CN 111626075A
Authority
CN
China
Prior art keywords
video
processed
time period
image
specified time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910145599.0A
Other languages
English (en)
Inventor
李艳杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201910145599.0A priority Critical patent/CN111626075A/zh
Publication of CN111626075A publication Critical patent/CN111626075A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种目标识别方法及装置,所述方法包括:获取待处理视频;对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。本发明提高了对目标对象的识别速度,并且大量的节省服务器的计算资源,有利于相关电子设备的大规模推广和使用。

Description

一种目标识别方法及装置
技术领域
本发明涉及图像识别技术领域,尤其涉及一种目标识别方法及装置。
背景技术
当前,包含摄像头的智能设备越来越普及,例如智能摄像机、智能门铃、智能手机、机器人等。一般的,在这些智能设备上都均有配备有目标识别的功能,例如:人形检测、人脸识别、宠物识别等。这些智能设备的一般工作流程是拍摄一张图像或一段视频,然后通过对视频进行处理和分析并识别出其中的人脸、人形或宠物等。
其中,基于拍摄视频的目标识别,将所拍摄的视频上传到云端,在云端服务器上进行整个视频的解码,并对得到的每一帧图像进行目标识别处理。最后将识别的结果返回本地客户端,如对应的手机应用中。这种处理方式虽然可准确的进行目标检测,但是会极大的消耗服务器的计算资源,并且识别速度较慢,不利于大规模使用。
发明内容
鉴于上述问题,本发明提出的一种目标识别方法及装置,可提高识别速度,并且大量的节省服务器的计算资源,有利于相关电子设备的大规模推广和使用。
第一方面,本申请通过一实施例提供如下技术方案:
一种目标识别方法,所述方法包括:
获取待处理视频;对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
优选地,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,还包括:
在识别到所述目标对象时,结束对所述待处理视频的解码。
优选地,所述对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,包括:
对所述待处理视频进行解码;每解码一帧图像,判断该帧图像是否属于所述指定时段内;若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
优选地,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别,包括:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
优选地,所述获取待处理视频之前,还包括:
采集所述待处理视频对应的多个视频样本;根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
优选地,所述指定时段位于所述待处理视频的前12秒。
优选地,所述预设比例的取值范围为85%-100%。
第二方面,基于同一发明构思,本申请通过一实施例提供如下技术方案:
一种目标识别装置,所述装置包括:
获取模块,用于获取待处理视频;解码模块,用于对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;识别模块,用于从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
优选地,还包括终止模块,用于:
在所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,识别到所述目标对象时,结束对所述待处理视频的解码。
优选地,所述解码模块,还用于:
对所述待处理视频进行解码;每解码一帧图像,判断该帧图像是否属于所述指定时段内;若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
优选地,所述识别模块,还用于:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
优选地,还包括采集统计模块,用于:
在所述获取待处理视频之前,采集所述待处理视频对应的多个视频样本;
根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
优选地,所述指定时段位于所述待处理视频的前12秒。
优选地,所述预设比例的取值范围为85%-100%。
第三方面,基于同一发明构思,本申请通过一实施例提供如下技术方案:
一种目标识别装置,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述目标识别装置执行第一方面中任一项所述方法的步骤。
第四方面,基于同一发明构思,本申请通过一实施例提供如下技术方案:
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项所述方法的步骤。
本发明实施例提供的一种目标识别方法及装置,其中,方法包括获取待处理视频;对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例。从所述起始图像开始依次对所述指定时段内的图像进行目标对象的识别。因此,本发明通过解码寻找指定时段,在未找到指定时段的起始图像时不进行目标对象的识别。并且在寻找到指定时段后识别到包含目标对象的图像时,终止待处理视频的解码,结束待处理视频的识别过程。在整个目标对象的识别过程中实际仅仅识别了待处理图像的一小部分,并不对整个待处理视频进行识别,大量的节省服务器的计算资源,同时还提高了同一待处理视频的识别速度,有利于相关电子设备的大规模推广和使用。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明第一实施例提供的一种目标识别方法的流程图;
图2示出了本发明第一实施例中指定时段的获取步骤流程图;
图3示出了本发明第二实施例提供的一种目标识别装置的模块框图;
图4示出了本发明第三实施例提供的一种目标识别装置的模块框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
第一实施例
请参见图1,图1示出了本发明第一实施例提供的一种目标识别方法的流程图。该方法具体包括以下步骤:
步骤S10:获取待处理视频;
步骤S20:对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
步骤S30:从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
在步骤S10中,所述待处理视频可由智能设备上安装的摄像头拍摄,例如在智能门铃上安装有摄像头,当有访问者来访并按下门铃时可启动视频录制功能,所录制的视频即为待处理视频。当本发明中的方法应用在本地智能设备时,可直接由本地智能设备进行待处理视频的解码和识别。进一步的,本发明可应用在云端服务器中,随着物联网技术的发展,目前的智能设备越来多,并且大量的应用了目标检测,通过本方法可大量的节省服务器的资源。
步骤S20:对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像。
在步骤S20中,指定时段表示包含(出现)大部分目标对象的时段。具体的,指定时段内的目标对象占待处理视频中目标对象总量的比例的大于等于预设比例,可通过计算指定时段内含有目标对象的视频帧的数量占整段待处理视频含有目标对象的总帧数进行确定。
例如,预设比例为98%,且指定时段内的目标对象占待处理视频中所述目标对象总量的比例等于98%;目标对象为人形。此时,在一段拍摄时长为20秒的待处理视频中,指定时段为2-10秒,即在2-10秒内出现了整段待处理视频中98%的人形目标;在另一段20秒的视频中,指定时段为0-1秒,即在0-1秒内出现了整段待处理视频中98%的人形目标。
进一步的,可通过统计大量的待处理视频对应的样本视频获得指定时段。具体的,请参照图2,在步骤S10之前,通过以下步骤获得指定时段:
步骤S101:采集所述待处理视频对应的多个视频样本。其中,多个表示两个或两个以上。为了更加准确的确定待处理视频的指定时段,其中待处理视频对应的视频样本应当均为同一种设备或者同一类设备在相同或相似的应用环境中所采集的。例如,待处理视频为智能门铃所拍摄的视频时,最优选的,视频样本也应当为智能门铃所拍摄的与待处理视频为相同类型的视频。进一步的,视频样本的数量应当足够大,以保证统计的准确性。
步骤S102:根据每个所述视频样本中的所述目标对象出现的时段,获得所述指定时段。
在步骤S102中,目标对象可为一种或多种,例如人形、人脸、宠物等,不作限制。
在步骤S102中,可通过对每个视频样本进行目标识别,确定出预设比例的目标对象所出现的时段;需要说明的是,在本实施例中所述预设比例可以根据不同的智能设备或不同的应用环境进行确定,例如:通过对每个视频样本进行目标识别,确定出预设比例(取值范围可为大于等于85%,即85%-100%,如85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%等)的目标对象所出现的时段,可将该时段作为指定时段。
需要说明的是,为了使本发明实施例实现最优的效果,由于智能设备通常在被触发后立即进行视频采集,结合本发明的实施方案进行视频样本的目标对象出现的时段的统计分析,可确定目标对象基本集中出现在待处理视频的前0-12秒内;并且,当预设比例为85%-100%时可实现较好的识别效果,在不同的应用环境下或不同的电子设备中可适当的在85%-100%区间内调整预设比例的取值,例如智能门铃在一般情况下可将预设比例设置为98%,且指定时段内目标对象占比为98%,即以2%的漏检代价实现计算资源的节省。
步骤S20可具体包括如下实施过程:
首先,对所述待处理视频进行解码;解码的方式可为软解码和硬解码,不作限制。
然后,每解码一帧图像,判断该帧图像是否属于所述指定时段内。在一帧图像的解码后可通过确定出该帧图像在待处理视频中的时间点,进而判断该时间点是否位于指定时段内。需要说明的是,解码的图像为视频的末尾图像,则结束视频解码及目标识别。
若当前解码的一帧图像属于所述指定时段内,则将当前解码的图像作为所述起始图像。其中,所述的起始图像为需要进行目标对象的检测的起始时间点的图像。
因此,在起始图像的时间点之前的图像均无需进行目标对象的目标检测,可节约大量的计算资源。
步骤S30:依次对所述起始图像以及所述起始图像之后的每一帧图像进行目标对象的识别。进一步的,识别的图像应为指定时段内的图像。
步骤S30还具体包括:
从起始图像开始,依次判断指定时段内的图像是否为指定时段的末尾图像。
若判断结果为是时,即当前一帧图像为末尾图像则需要结束末尾图像之后的视频的解码与目标对象的识别,节约计算资源。例如,在智能门铃的拍摄范围之外的目标触发了智能门铃的视频采集,此时采集的视频中将不会出现目标对象;通过该种方式可避免即使待处理视频中没有目标对象时,也无需将起始图像之后的所有待处理视频全部进行识别,仅仅只需对指定时段的视频进行目标识别,同时仅仅对末尾图像之前的视频进行解码。
若判断结果为否,即当前判断的图像不为所述末尾图像时时,需要对每判断为否时对应的每帧图像进行所述目标对象的识别。在节省了服务器的计算资源的同时,保证了目标识别准确率。
在实际的应用场景中为了保证更高的工作效率,进一步的降低服务器的负担,节省计算资源,在步骤S30之后还包括:
在识别到包含目标对象的图像时,结束对待处理视频的解码。其中在本发明实施例提供的智能设备中,对于一次视频采集而言,采集的触发源一般都为一个目标或最先出现在视频中的目标。因此,在识别出目标对象时即可结束整个视频的解码以及识别过程,进一步的降低了服务器的计算资源。
本发明实施例提供的一种目标识别方法,其中,方法包括获取待处理视频;对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例。从所述起始图像开始依次对所述指定时段内的图像进行目标对象的识别。因此,本发明通过解码寻找指定时段,在未找到指定时段的起始图像时不进行目标对象的识别。并且在寻找到指定时段后识别到包含目标对象的图像时,终止待处理视频的解码,结束待处理视频的识别过程。在整个目标对象的识别过程中实际仅仅识别了待处理图像的一小部分,并不对整个待处理视频进行识别,大量的节省服务器的计算资源,同时还提高了同一待处理视频的识别速度,有利于相关电子设备的大规模推广和使用。
第二实施例
基于同一发明构思,本发明第二实施例提供了一种目标识别装置400。图3示出了本发明提供的装置400的功能模块框图。
所述装置400具体包括:
获取模块401,用于获取待处理视频;
解码模块402,用于对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
识别模块403,用于从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
作为一种可选的实施方式,还包括终止模块,用于:
在所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,识别到所述目标对象时,结束对所述待处理视频的解码。
作为一种可选的实施方式,所述解码模块402,还用于:
对所述待处理视频进行解码;每解码一帧图像,判断该帧图像是否属于所述指定时段内;若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
作为一种可选的实施方式,所述识别模块403,还用于:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
作为一种可选的实施方式,还包括采集统计模块,用于:
在所述获取待处理视频之前,采集所述待处理视频对应的多个视频样本;
根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
作为一种可选的实施方式,所述指定时段位于所述待处理视频的前12秒。
作为一种可选的实施方式,所述预设比例的取值范围为85%-100%。
需要说明的是,本发明实施例所提供的目标识别装置400,其具体实现及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
第三实施例
另外,基于同一发明构思,本发明第三实施例还提供了一种目标识别装置,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述目标识别装置执行以下操作:
获取待处理视频;对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
需要说明的是,本发明实施例所提供的目标识别装置中,上述每个步骤的具体实现及产生的技术效果和前述方法实施例相同,为简要描述,本实施例未提及之处可参考前述方法实施例中相应内容。
于本发明实施例中,目标识别装置中安装有操作系统以及第三方应用程序。目标识别装置可以为智能门铃、扫地机器人、平板电脑、手机、笔记本电脑、PC(personalcomputer,个人计算机)、可穿戴设备、车载终端等设备。
图4示出了一种示例性目标识别装置500的模块框图。如图4所示,目标识别装置500包括存储器502、存储控制器504,一个或多个(图中仅示出一个)处理器506、外设接口508、网络模块510、输入输出模块512、显示模块514等。这些组件通过一条或多条通讯总线/信号线516相互通讯。
存储器502可用于存储软件程序以及模块,如本发明实施例中的目标识别方法以及装置对应的程序指令/模块,处理器506通过运行存储在存储器502内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本发明实施例提供的目标识别方法。
存储器502可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器506以及其他可能的组件对存储器502的访问可在存储控制器504的控制下进行。
外设接口508将各种输入/输出装置耦合至处理器506以及存储器502。在一些实施例中,外设接口508,处理器506以及存储控制器504可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
网络模块510用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。
输入输出模块512用于提供给用户输入数据实现用户与目标识别装置的交互。所述输入输出模块512可以是,但不限于,鼠标、键盘和触控屏幕等。
显示模块514在目标识别装置500与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示模块514可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器进行计算和处理。
可以理解,图4所示的结构仅为示意,目标识别装置500还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
第四实施例
本发明第四实施例提供了一种计算机存储介质,本发明第二实施例中的目标识别装置集成的功能模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述第一实施例的目标识别方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的目标识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1.一种目标识别方法,其特征在于,所述方法包括:
获取待处理视频;
对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
A2.根据A1所述的方法,其特征在于,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,还包括:
在识别到所述目标对象时,结束对所述待处理视频的解码。
A3.根据A1所述的方法,其特征在于,所述对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,包括:
对所述待处理视频进行解码;
每解码一帧图像,判断该帧图像是否属于所述指定时段内;
若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
A4.根据A1所述的方法,其特征在于,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别,包括:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;
若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
A5.根据A1所述的方法,其特征在于,所述获取待处理视频之前,还包括:
采集所述待处理视频对应的多个视频样本;
根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
A6.根据A1所述的方法,其特征在于,所述指定时段位于所述待处理视频的前12秒。
A7.根据A1-A6任一所述的方法,其特征在于,所述预设比例的取值范围为85%-100%。
本发明公开了B8.一种目标识别装置,其特征在于,所述装置包括:
获取模块,用于获取待处理视频;
解码模块,用于对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
识别模块,用于从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
B9.根据B8所述的装置,其特征在于,还包括终止模块,用于:
在所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,
识别到所述目标对象时,结束对所述待处理视频的解码。
B10.根据B8所述的装置,其特征在于,所述解码模块,还用于:
对所述待处理视频进行解码;
每解码一帧图像,判断该帧图像是否属于所述指定时段内;
若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
B11.根据B8所述的装置,其特征在于,所述识别模块,还用于:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;
若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
B12.根据B8所述的装置,其特征在于,还包括采集统计模块,用于:
在所述获取待处理视频之前,
采集所述待处理视频对应的多个视频样本;
根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
B13.根据B8所述的装置,其特征在于,所述指定时段位于所述待处理视频的前12秒。
B14.根据B8-B13任一所述的装置,其特征在于,所述预设比例的取值范围为85%-100%。
本发明公开了C15.一种目标识别装置,其特征在于,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述目标识别装置执行A1-A7中任一项所述方法的步骤。
本发明公开了D16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现A1-A7中任一项所述方法的步骤。

Claims (10)

1.一种目标识别方法,其特征在于,所述方法包括:
获取待处理视频;
对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
2.根据权利要求1所述的方法,其特征在于,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别之后,还包括:
在识别到所述目标对象时,结束对所述待处理视频的解码。
3.根据权利要求1所述的方法,其特征在于,所述对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,包括:
对所述待处理视频进行解码;
每解码一帧图像,判断该帧图像是否属于所述指定时段内;
若该帧图像属于所述指定时段内,则将该帧图像作为所述起始图像。
4.根据权利要求1所述的方法,其特征在于,所述从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别,包括:
从所述起始图像开始,依次判断所述指定时段内的图像是否为所述指定时段的末尾图像;
若当前判断的图像不为所述末尾图像时,对当前判断的图像进行所述目标对象的识别。
5.根据权利要求1所述的方法,其特征在于,所述获取待处理视频之前,还包括:
采集所述待处理视频对应的多个视频样本;
根据每个所述视频样本中的所述目标对象出现的时段,统计出所述指定时段。
6.根据权利要求1所述的方法,其特征在于,所述指定时段位于所述待处理视频的前12秒。
7.根据权利要求1-6任一所述的方法,其特征在于,所述预设比例的取值范围为85%-100%。
8.一种目标识别装置,其特征在于,所述装置包括:
获取模块,用于获取待处理视频;
解码模块,用于对所述待处理视频进行解码,确定所述待处理视频中指定时段的起始图像,其中,所述指定时段内的目标对象占所述待处理视频中所述目标对象总量的比例的大于等于预设比例;
识别模块,用于从所述起始图像开始依次对所述指定时段内的图像进行所述目标对象的识别。
9.一种目标识别装置,其特征在于,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述目标识别装置执行权利要求1-7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
CN201910145599.0A 2019-02-27 2019-02-27 一种目标识别方法及装置 Pending CN111626075A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910145599.0A CN111626075A (zh) 2019-02-27 2019-02-27 一种目标识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910145599.0A CN111626075A (zh) 2019-02-27 2019-02-27 一种目标识别方法及装置

Publications (1)

Publication Number Publication Date
CN111626075A true CN111626075A (zh) 2020-09-04

Family

ID=72258776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910145599.0A Pending CN111626075A (zh) 2019-02-27 2019-02-27 一种目标识别方法及装置

Country Status (1)

Country Link
CN (1) CN111626075A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115119071A (zh) * 2022-06-10 2022-09-27 腾讯科技(深圳)有限公司 视频封面生成方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115119071A (zh) * 2022-06-10 2022-09-27 腾讯科技(深圳)有限公司 视频封面生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN108830235B (zh) 用于生成信息的方法和装置
CN107392189B (zh) 用于确定无人车的驾驶行为的方法和装置
WO2021184972A1 (zh) 图像分割方法、装置、电子设备及存储介质
CN110287891B (zh) 基于人体关键点的手势控制方法、装置及电子设备
CN107633541B (zh) 一种图像特效的生成方法和装置
CN107786549A (zh) 音频文件的添加方法、装置、系统及计算机可读介质
CN110263680B (zh) 图像处理方法、装置和系统及存储介质
CN113128368B (zh) 一种人物交互关系的检测方法、装置及系统
WO2021104124A1 (zh) 圈养栏信息的确定方法、装置及系统、存储介质
CN110209658B (zh) 数据清洗方法和装置
CN113496208B (zh) 视频的场景分类方法及装置、存储介质、终端
CN110660102A (zh) 基于人工智能的说话人识别方法及装置、系统
CN112163468A (zh) 基于多线程的图像处理方法及装置
CN112530205A (zh) 机场停机坪飞机状态检测方法及装置
CN111401206A (zh) 一种全景图共享方法、系统、设备和介质
CN110599520B (zh) 一种旷场实验数据分析方法、系统及终端设备
CN111626075A (zh) 一种目标识别方法及装置
CN112101109B (zh) 人脸关键点检测模型训练方法、装置、电子设备和介质
CN111680670B (zh) 一种跨模态人头检测方法及装置
CN110222576B (zh) 拳击动作识别方法、装置和电子设备
CN110414322B (zh) 提取图片的方法、装置、设备及存储介质
CN110363814A (zh) 一种视频处理方法、装置、电子装置和存储介质
CN110019951B (zh) 一种生成视频缩略图的方法及设备
CN110610178A (zh) 图像识别方法、装置、终端及计算机可读存储介质
CN114740975A (zh) 目标内容的获取方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination