CN110532833A - 一种视频分析方法及装置 - Google Patents

一种视频分析方法及装置 Download PDF

Info

Publication number
CN110532833A
CN110532833A CN201810502120.XA CN201810502120A CN110532833A CN 110532833 A CN110532833 A CN 110532833A CN 201810502120 A CN201810502120 A CN 201810502120A CN 110532833 A CN110532833 A CN 110532833A
Authority
CN
China
Prior art keywords
image
target identification
video
analyzed
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810502120.XA
Other languages
English (en)
Inventor
戴威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201810502120.XA priority Critical patent/CN110532833A/zh
Priority to PCT/CN2019/073661 priority patent/WO2019223361A1/zh
Publication of CN110532833A publication Critical patent/CN110532833A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频分析方法及装置,其中,方法包括:获取待分析视频;识别所述待分析视频中的目标标识;检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。通过本发明实施例,可以确定待分析视频中目标标识的曝光数据,而且可以节省人力资源。

Description

一种视频分析方法及装置
技术领域
本申请涉及视频处理领域,特别是涉及一种视频分析方法及装置。
背景技术
目前,节目冠名已经成为广告主宣传企业品牌的有效渠道,具体的,广告主通过在电视节目中嵌入企业品牌的广告,使得观众在观看电视节目的过程中注意到嵌入有企业品牌的广告,进而起到宣传企业品牌的效果。在实际应用中,电视节目中企业品牌是否曝光、曝光的位置,以及曝光的时长等曝光数据,都会影响企业品牌的宣传效果。因此,需要分析企业品牌在电视节目中的曝光数据,以便寻找使广告主的企业品牌达到更好宣传效果的宣传方式,或者,分析竞争对手的企业品牌的曝光数据。
目前,专业人员观看电视节目,并分析用于表示待分析企业品牌的目标标识在电视节目中的曝光数据。
但是,通过专业人员分析该目标标识在电视节目中的曝光数据,浪费人力资源。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频分析方法及装置。
其中,一种视频分析方法,包括:
获取待分析视频;
识别所述待分析视频中的目标标识;
检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
依据所述检测结果,确定满足所述目标标识在所述待分析视频中的曝光数据。
其中,所述分别识别所述待分析视频中的目标标识,包括:
将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型按照以下步骤识别所述任意一帧图像中的所述目标标识:
提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
基于所述多尺度的特征图像集合生成候选区域;
从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
其中,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合,包括:
通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述基于所述多尺度的特征图像集合生成候选区域,包括:
将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
其中,通过以下方式对所述预设模型进行训练,得到所述训练后的预设模型:
获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
将所述待分析视频中的图像输入所述第一预设模型;
获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
其中,所述预设条件还包括:
占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
其中,依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据包括:
在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
一种视频分析装置,包括:
获取单元,用于获取待分析视频;
第一识别单元,用于识别所述待分析视频中的目标标识;
检测单元,用于检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
确定单元,用于依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。
其中,所述第一识别单元,包括:
第一输入子单元,用于将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型包括:
第一提取单元,用于提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
生成单元,用于基于所述多尺度的特征图像集合生成候选区域;
选取单元,用于从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
第二提取单元,用于分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
第二识别单元,通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
其中,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述第一提取单元,具体用于通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述生成单元,具体用于将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
其中,还包括:训练单元;
所述训练单元,用于对所述预设模型进行训练,得到所述训练后的预设模型;
其中,所述训练单元,包括:
第一获取子单元,用于获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
第一训练子单元,用于采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
第二输入子单元,用于将所述待分析视频中的图像输入所述第一预设模型;
第二获取子单元,用于获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
第三获取子单元,用于获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
第二训练子单元,用于采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
其中,检测单元还用于:检测占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
其中,确定单元,包括:
第一确定子单元,用于在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
第二确定子单元,用于在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
一种存储介质,所述存储介质上存储有程序,所述程序被处理器执行时实现上述任意一项所述的视频分析方法。
一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的视频分析方法。
借由上述技术方案,本发明提供的技术方案中,识别待分析视频中的目标标识;检测所识别出的目标标识是否满足预设条件,满足该预设条件的目标标识所具有的特点,与目标标识在视频中曝光时所具有的特定相符;本实施例中,通过检测所识别出的目标标识中是否满足预设条件所得到检测结果,该检测结果包括:识别出的目标标识满足预设条件与识别出的目标标识不满足预设条件;因此,在本实施例中,可以根据检测结果确定该目标标识是否曝光;当该目标标识曝光时,即识别出的目标标识满足预设条件,此时,该预设条件中限定了分布在相邻的至少两帧图像中的目标标识的占位是至少重叠的,此时,占位至少重叠的目标标识的占位体现了曝光的目标标识的位置;进一步的,依据曝光的目标标识的位置,可以确定待识别视频中该位置处的曝光的目标标识的播放时长;因此,在本申请实施例中,可以依据检测结果确定待分析视频中目标标识的曝光数据,而且可以节省人力资源。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请中一种模型训练方法实施例的流程图;
图2示出了本申请中一种采用方框标注出图像中的每个宝马品牌标识的示意图;
图3示出了本申请中一种视频中目标标识的分析方法实施例的流程图;
图4示出了本申请中一种图像集合包含的图像中所识别出的目标标识的分布示意图;
图5示出了本申请中一种视频中目标标识的分析装置实施例的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本实施例中,设置了用于目标识别的模型,具体的,可以应用于以目标识别为基础的场景中,例如,图像分类和图像分割等。其中,该模型架构可以为Faster-RCNN架构。其中,在该模型架构中,采用ResNet模型作为底层特征提取模型,采用RPN网络作为候选区域生成网络。其中,ResNet模型包括5个部分,分别为部分1、部分2、部分3、部分4和部分5,每个部分包含有池化层和卷积层。
在本实施例中,对模型的处理流程进行了改进,具体的,以该模型用于图像识别为例,介绍本实施例模型处理流程的具体改进。首先,将待处理图像输入该模型,该模型中不同部分的卷积层输出待处理图像不同尺度(图像的不同尺度可以理解为是不同分辨率)的信息。例如,当待处理图像大小为M*M时,部分1的卷积层输出大小为M*M的第一特征图像集合,部分2的卷积层输出大小为M*M的第二特征图像集合,部分3的卷积层输出M/2*M/2大小的第三特征图像集合,部分4的卷积层输出M/4*M/4大小的第四特征图像集合,部分5的卷积层输出M/8*M/8大小的第五特征图像集合。需要说明的是,第一特征图像集合、第二特征图像集合、第三特征图像集合、第四特征图像集合和第五特征图像集合都是由多层图像组成,具体的图像层数与该特征图像集合所对应的卷积层中的卷积核的数量相同。
其次,在部分1、部分2、部分3、部分4和部分5分别输出不同尺度的特征图像集合后,将该不同尺度的特征图像集合输入RPN网络,该RPN网络生成候选区域;再次,从5个特征图像集合中选取出至少两个特征图像集合,并分别从至少两个特征图像集合中提取该候选坐标区域所对应的区域集合,并将提取出的区域集合在长度和宽度上统一为预设大小;最后,将统一为预设大小的区域集合从层数上进行拼接,并将拼接后的区域集合进行全连接,以识别待处理图像中待识别的目标。需要说明的是,上述接收该模型的处理流程时,以图像识别场景为例进行了介绍,当然,本实施例中的模型还可以用于其他场景,本实施例不对模型的具体场景作限定。
上述提取区域集合,将提取出的区域集合统一为预设大小,并将统一为预设大小的区域集合从层数上进行拼接的具体例子可以为:假设第一特征图像集合为128*128*3,其中,3表示第一特征图像集合所包含的第一特征图像的帧数,128*128表示任意一个第一特征图像的大小为128*128;第二特征图像集合为64*64*6,其中,6表示第二特征图像集合所包含的第二特征图像的帧数,64*64表示任意一个第二特征图像的大小为64*64;第三特征图像集合为32*32*4,第四特征图像集合为16*16*2,第五特征图像集合为4*4*3,其中,第三图像特征集合、第四图像特征集合和第五图像特征集合的参数含义,与第一特征图像集合中的参数含义相同,这里不再赘述。
从第一特征图像集合、第二特征图像集合、第三特征图像集合、第四特征图像集合和第五特征图像集合中,选取至少两个特征图像集合,将所选取出的至少两个特征图像集合进行数据采样,使得所选取的至少两个特征图像集合所包含的图像从大小上进行统一,例如,将大小统一为7*7的图像。
在将所选取的至少两个特征图像集合统一大小后,从层数上进行叠加。具体的,假设所选取的至少两个特征图像集合为第三特征图像集合和第五特征图像集合,并将这两个特征图像集合所包含图像的大小统一为7*7,此时,将大小统一为7*7的这两个特征图像集合从层数上进行叠加,叠加后的特征图像集合为7*7*10。
在本实施例中的模型,采用ResNet模型作为底层特征提取模型,采用RPN网络作为候选区域生成网络,并采用改进的处理流程对输入的待处理图像进行处理,其中,本实施例的模型在RPN模型生成候选区域后,分别从至少两个特征图像集合中提取该候选区域对应的区域集合,得到至少两个区域集合。由于该至少两个区域集合来自不同的特征图像集合,并且不同特征图像集合体现的是待处理图像在不同尺度的信息,因此,本实施例中的模型将待处理图像中至少两个尺度的图像信息进行全连接,使得本实施例中的模型对待处理图像的不同尺度的信息进行识别。而以标准Faster-RCNN架构的模型对从待处理图像中提取出的候选区域对应的图像区域集合,进行全连接,使得采用标准Faster-RCNN架构的模型只对待处理图像这一尺度上的信息进行识别。
在实际应用中,待处理图像中可能存在不同大小的目标标识,其中,不同大小的目标标识的特征可能体现在不同尺度的特征图像集合上。本实施例中的模型可以识别不同尺度的特征图像集合中的信息,因此,本实施例中的模型可以识别体现在不同尺度的特征图像集合上的信息。进而,相比于采用标准Faster-RCNN架构的模型,本实施例中的模型对识别不同大小的目标标识具有更高的识别准确率。
在本实施例中,对设置好架构的模型进行训练,具体对该模型进行训练的过程,可以参考图1,图1示出了本申请中一种模型训练方法实施例的流程图,该方法实施例可以包括:
步骤101:获取训练集。
在本实施例中,还以该模型用于图像识别为例,介绍对该模型的训练过程。具体的图像识别场景为:识别图像中是否存在宝马品牌标识。在本步骤中,获取用于训练该模型的训练集,其中,训练集包括标注出宝马品牌标识的大量图像。
具体的,用于组成训练集的大量图像可以通过以下方式获取:从百度、Google等搜索平台或其他素材网站上,采集含有宝马品牌标识的图像;还可以利用屏幕截图软件从直播节目等视频中,采集含有宝马品牌标识的图像。当然,在实际应用中,还可以采用其他方式获取含有宝马品牌标识的大量图像,本步骤只是提供了两种获取含有宝马品牌标识的图像的方式,并不对具体的获取含有宝马品牌标识图像的方式作限定。
在获取到含有宝马品牌标识的大量图像后,接着,针对所获取的每帧图像,标注出图像中的宝马品牌标识,具体的,如图2所示,采用方框标注出图像中的每个宝马品牌标识。
步骤102:采用所获取的训练集对模型进行训练,得到第一模型。
在获取到训练集后,接着,在本步骤中,采用所获取的训练集中大量图像对该模型进行训练。具体的,分别将标注出宝马品牌标识的图像输入模型中,该模型采用改进后的流程识别并标注所输入的图像中的宝马品牌标识,并以训练集中标注出宝马品牌标识为基准,自动调整模型中的参数,经过多次调整模型中的参数,当达到某一标准时,得到第一模型。
步骤103:将预设数量帧待识别图像输入该第一模型。
采用训练集对模型进行训练得到第一模型后,接着,在本步骤中,将预设数量帧待识别图像输入该第一模型中,针对输入的每帧待识别图像,该第一模型识别并标注出每帧待识别图像中所包含有的为宝马品牌标识。
步骤104:获取第一模型分别识别并标注出目标标识的预设数目帧图像。
在第一模型对所输入的每帧待识别图像中的目标标识进行识别与标注后,获取该第一模型所识别并标注出目标标识的预设数目帧图像。在实际应用中,第一模型识别并标注待识别图像中的目标标识时,会出现错误识别的情况,此时,所标注出的目标标识也是错误的。因此,在本步骤中,所获取的经第一模型识别并标注出目标标识的预设数目帧图像中,存在标注非目标标识的符号,为了描述方便,本实施例将标注非目标标识的符号统称为错误符号。
步骤105:获取将人工对错误符号修正后的预设数量帧图像。
人工对错误符号进行修正,即人工识别错误符号,并人工标注出的目标标识。在本步骤中,获取经人工对错误符号修正后的预设数量帧图像。
步骤106:将修正后的预设数量帧图像输入第一模型中,对该第一模型进行训练,得到训练后的模型。
在获取到经人工修正后的预设数量帧图像后,接着,在本步骤中,将修正后的预设数量帧图像输入第一模型中,对该第一模型进行进一步的训练。具体的,在本步骤中对第一模型进行训练的过程,与步骤102对模型进行训练的思路是相同的,具体训练过程可以参考步骤102,这里不再赘述。为了描述方便,本实施例将对第一模型进行训练后所得到的模型,统称为训练后的模型。
在本实施例中,对通过训练集对模型进行训练后得到第一模型,由于训练集的图像是从搜索平台中采集得到的,因此,采用该训练集中的图像对模型进行训练后,模型只对该训练集中的目标标识进行学习。在实际应用中,待识别的图像中可能存在与目标标识相似的相似标识,为了使模型可以更好的区分目标标识与相似标识的区别特征,在本实施例中,将预设数量帧待识别图像输入该第一模型,该第一模型所输出的用于标注目标标识的符号中存在错误符号,采用人工对错误符号修正后的预设数量帧图像,再次对第一模型进行训练,得到训练后的模型。此时,相比于第一模型,训练后的模型对待识别图像中的目标标识的识别准确率得到提高,因此,通过本实施例的训练方法,可以进一步提高模型对待识别图像中的目标标识的识别准确率。
在得到训练后的模型后,接着,在本实施例中,将该训练后的模型应用于分析视频中目标标识植入情况的场景中。具体的,参考图3,示出了本申请中一种分析视频中目标标识的方法实施例的流程图,该方法实施例可以包括:
步骤301:获取待分析视频。
在本步骤中所获取的待分析视频可以为编码后的待分析视频。
步骤302:对所获取的待分析视频进行解码,得到解码后的待分析视频。
步骤303:对于解码后的待分析视频,按照视频帧的先后顺序,以及以第一预设数量帧的图像作为一个图像集合的原则,将解码后的视频划分为多个图像集合。
在本实施例中,视频中植入的目标标识一般在连续的两三秒钟持续播放,其中,目标标识表示预设的一种标识,例如,需要分析视频中宝马品牌标识,此时,宝马品牌标识就是目标标识。在实际应用中,每秒所播放的图像大概为5帧左右,因此,解码后的待分析视频中植入目标标识的图像一般在连续的10~15帧中出现。因此,为了更准确地分析待分析视频中目标标识的植入情况,在本步骤中,针对解码后的待分析视频,按照待分析视频中视频帧的先后顺序,将第一预设数量帧图像作为一个图像集合,其中,预设数量可以为5~7帧中的任意一个数字。此时,将解码后的待分析视频划分为多个图像集合。
步骤304:分别将每个图像集合中的图像输入训练后的模型,使得训练后的模型识别每个图像集合所包含的图像中的目标标识。
将解码后的待分析视频划分为多个图像集合后,接着,在本步骤中,分别将每个图像集合中的图像输入训练后的模型中,该训练后的模型对每帧图像中的目标标识进行识别。在实际应用中,训练后的模型中在识别出待分析视频中的目标标识后,将所识别出的目标标识进行标注,例如,训练后的模型识别出一个宝马品牌标识,可以采用一个方框将所识别出的宝马品牌标识框住,并输出采用方框框住所识别出的宝马品牌标识的图像。
步骤305:获取训练后的模型所输出的与每个图像集合对应的标注出目标标识的图像集合。
在训练后的模型输出标注有预设符号的图像后,得到与所划分的每个图像集合对应的标注有预设符号的图像集合,得到多个识别后的图像集合。
步骤306:检测每个图像集合中所标注出的目标标识是否满足预设条件。
在得到多个标注出目标标识的图像集合后,接着,在本步骤中,分别检测每个图像集合中所标注的目标标识是否存在满足预设条件。在本步骤中,以任意一个图像集合为例,介绍该任意一个图像集合中所标注出的目标标识是否满足预设条件。
其中,预设条件可以包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠。其中,目标标识的占位是指该目标标识在一个基准坐标系中所占的空间区域。
以下以一个具体的场景为例,介绍图像集合中的所识别出的目标标识是否满足预设条件。具体的场景为:该图像集合中包括5帧图像,分别为第一帧,第二帧,第三帧,第四帧和第五帧,目标标识为宝马品牌标识;对于第一帧图像、第二帧图像、第三帧图像、第四帧图像和第五帧图像中所识别出的目标标识的位置分布如图4所示。具体的,在第一帧图像中所识别出的宝马品牌标识为两个,一个分布在图像的左上角位置,另一个分布在图像的右下角位置;第二帧图像中识别出两个宝马品牌标识,一个分布在图像的右上角位置,另一个分布在图像的右下角位置;第三帧图像中识别出一个宝马品牌标识,分布在图像的右下角位置;第四帧图像中没有识别出宝马品牌标识;第五帧图像中识别出一个宝马品牌标识,分布在图像的右下角位置;其中,第一帧图像、第二帧图像和第三帧图像中右下角位置的目标标识的占位重叠。
该预设条件为“分布在相邻至少两帧图像中的目标标识的占位至少部分重叠”,因此在这个场景中,分布在相邻的至少两帧图像中的目标标识,具体为:分布在第一帧图像、第二帧图像和第三帧图像中的5个宝马品牌标识;接着,判断分布在相邻至少两帧图像中的目标标识的占位是否至少部分重叠,在第一帧图像、第二帧图像和第三帧图像这三帧图像中右下角的3个宝马品牌标识是重叠的。因此,该图像集合中所识别出的宝马品牌标识满足预设条件。
在检测图像集合中已识别出的目标标识是否满足预设条件,得到两种检测结果,一种为:图像集合中已识别出的目标标识满足预设条件,另一种为:图像集合中已识别出的目标标识不满足预设条件。
为了使得检测结果的准确性更高,在本实施例中,预设条件还可以包括:占位至少部分重叠的目标标识间的重叠比例大于预设百分比;占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。其中,预设百分比的取值范围可以不小于50%,预设总数量的取值范围可以不小于5。
需要说明的是,本实施例只是给出了预设百分比和预设总数量较优的取值范围,当然,在实际应用中,预设百分比和预设总数量还可以根据实际情况确定具体取值,本实施例不对预设百分比和预设总数量的具体取值作限定。
步骤307:依据检测结果确定该目标标识在待分析视频中的曝光数据。
在得到检测结果后,接着,在本步骤中,依据该检测结果,确定该目标标识在该待分析视频中的曝光数据。其中,曝光数据包括:是否曝光、曝光位置,以及曝光时长等。具体的,在本步骤中,若检测结果为:图像集合中已识别出的目标标识满足预设条件,则表明该目标标识在该图像集合中曝光;并将相邻的至少两帧图像中占位至少部分重叠的目标标识所占有的空间位置,确定为该目标标识的曝光位置;并依据该曝光位置,统计待分析视频中在该曝光位置存在目标标识的连续图像的帧数,依据该帧数确定该目标标识的播放时长。
需要说明的是,在实际应用中,目标标识的曝光位置可能有多个,此时,分别确定每个曝光位置的目标标识的播放时长,并将所有曝光位置所对应的播放时长的和,作为该目标标识的总播放时长。
当检测结果为:图像集合中已识别出的目标标识不满足预设条件,则表明该目标标识在该图像集合中没有曝光,若该目标标识在每个图像集合中都没有曝光,则表明该目标标识在待分析视频中没有曝光。此时,就没有曝光位置以及曝光时长。
在本实施例中,识别待分析视频中的目标标识;检测所识别出的目标标识是否满足预设条件,满足该预设条件的目标标识所具有的特点,与目标标识在视频中曝光时所具有的特定相符;本实施例中,通过检测所识别出的目标标识中是否满足预设条件所得到检测结果,该检测结果包括:识别出的目标标识满足预设条件与识别出的目标标识不满足预设条件;因此,在本实施例中,可以根据检测结果确定该目标标识是否曝光;当该目标标识曝光时,即识别出的目标标识满足预设条件,此时,该预设条件中限定了分布在相邻的至少两帧图像中的目标标识的占位是至少重叠的,此时,占位至少重叠的目标标识的占位体现了曝光的目标标识的位置;进一步的,依据曝光的目标标识的位置,可以确定待识别视频中该位置处的曝光的目标标识的播放时长;因此,在本申请实施例中,可以依据检测结果确定待分析视频中目标标识的曝光数据。
参考图5,示出了本申请中一种视频中目标标识的分析装置实施例的结构示意图,该装置实施例可以包括:
获取单元501,用于获取待分析视频;
第一识别单元502,用于识别所述待分析视频中的目标标识;
检测单元503,用于检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
确定单元504,用于依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。
其中,第一识别单元502,可以包括:
第一输入子单元,用于将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型包括:
第一提取单元,用于提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
生成单元,用于基于所述多尺度的特征图像集合生成候选区域;
选取单元,用于从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
第二提取单元,用于分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
第二识别单元,通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
其中,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述第一提取单元,具体用于通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述生成单元,具体用于将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
其中,该装置还可以包括:训练单元;
该训练单元,用于对所述预设模型进行训练,得到所述训练后的预设模型;
其中,所述训练单元,包括:
第一获取子单元,用于获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
第一训练子单元,用于采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
第二输入子单元,用于将所述待分析视频中的图像输入所述第一预设模型;
第二获取子单元,用于获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
第三获取子单元,用于获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
第二训练子单元,用于采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
其中,检测单元503还用于:检测占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
其中,确定单元504,可以包括:
第一确定子单元,用于在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
第二确定子单元,用于在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
所述视频中目标标识的分析装置包括处理器和存储器,上述获取单元、第一识别单元、检测单元、确定单元和训练单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来分析目标标识在视频中的曝光数据。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述视频分析方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述视频分析方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取待分析视频;
识别所述待分析视频中的目标标识;
具体的,将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型按照以下步骤识别所述任意一帧图像中的所述目标标识:
提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
基于所述多尺度的特征图像集合生成候选区域;
从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
其中,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合,包括:
通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述基于所述多尺度的特征图像集合生成候选区域,包括:
将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
其中,通过以下方式对所述预设模型进行训练,得到所述训练后的预设模型:
获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
将所述待分析视频中的图像输入所述第一预设模型;
获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
其中,预设条件还可以包括:
占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。
具体的,在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取待分析视频;
识别所述待分析视频中的目标标识;
具体的,将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型按照以下步骤识别所述任意一帧图像中的所述目标标识:
提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
基于所述多尺度的特征图像集合生成候选区域;
从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
其中,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合,包括:
通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述基于所述多尺度的特征图像集合生成候选区域,包括:
将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
其中,通过以下方式对所述预设模型进行训练,得到所述训练后的预设模型:
获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
将所述待分析视频中的图像输入所述第一预设模型;
获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
其中,所述预设条件还包括:
占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。
具体的,在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种视频分析方法,其特征在于,包括:
获取待分析视频;
识别所述待分析视频中的目标标识;
检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
依据所述检测结果,确定满足所述目标标识在所述待分析视频中的曝光数据。
2.根据权利要求1所述的方法,其特征在于,所述分别识别所述待分析视频中的目标标识,包括:
将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型按照以下步骤识别所述任意一帧图像中的所述目标标识:
提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
基于所述多尺度的特征图像集合生成候选区域;
从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
3.根据权利要求2所述的方法,其特征在于,所述预设模型为:以Faster-RCNN为架构,所述架构包括底层特征提取模型和候选区域生成网络;
其中,所述提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合,包括:
通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征,得到所述多尺度特征图像集合;
所述基于所述多尺度的特征图像集合生成候选区域,包括:
将所述多尺度的特征图像集合输入所述候选区域生成网络,通过所述候选区域生成网络生成所述侯选区域。
4.根据权利要求2所述的方法,其特征在于,通过以下方式对所述预设模型进行训练,得到所述训练后的预设模型:
获取训练集;所述训练集包括:已标注出所述目标标识的多帧图像;
采用所述多帧图像对所述预设模型进行训练,得到第一预设模型;
将所述待分析视频中的图像输入所述第一预设模型;
获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像;所述标注出所述目标标识的图像中存在错误标注;
获取修正图像;所述修正图像为:经人工对所述错误标注进行修正后的图像;
采用所述修正图像对所述第一预设模型进行训练,得到所述训练后的预设模型。
5.根据权利要求1所述的方法,其特征在于,所述预设条件还包括:
占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比;所述占位至少部分重叠的所述目标标识中,清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。
6.根据权利要求1所述的方法,其特征在于,依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据包括:
在所述检测结果为所述目标标识满足所述预设条件的情况下,确定所述目标标识在所述待分析视频中曝光,并进一步确定曝光参数,其中,所述曝光参数包括以下至少之一:曝光时长、曝光位置;
在所述检测结果为所述目标标识不满足所述预设条件的情况下,确定所述目标标识未在所述待分析视频中曝光。
7.一种视频分析装置,其特征在于,包括:
获取单元,用于获取待分析视频;
第一识别单元,用于识别所述待分析视频中的目标标识;
检测单元,用于检测已识别出的目标标识是否满足预设条件,所述预设条件包括:分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠,得到检测结果;
确定单元,用于依据所述检测结果,确定满足所述目标标识在所述待分析视频中曝光数据。
8.根据权利要求7所述的装置,其特征在于,所述第一识别单元,包括:
第一输入子单元,用于将所述待分析视频中的每帧图像输入训练后的预设模型,使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识;
其中,针对所述待分析视频中的任意一帧图像,所述预设模型包括:
第一提取单元,用于提取所述任意一帧图像的多尺度特征,得到多尺度特征图像集合;
生成单元,用于基于所述多尺度的特征图像集合生成候选区域;
选取单元,用于从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合;
第二提取单元,用于分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合,得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合;
第二识别单元,通过对所述至少两个尺度的区域集合进行全连接,识别出所述任意一帧图像中的所述目标标识。
9.一种存储介质,其特征在于,所述存储介质上存储有程序,所述程序被处理器执行时实现权利要求1至6中任一权利要求所述的视频分析方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任一权利要求所述的视频分析方法。
CN201810502120.XA 2018-05-23 2018-05-23 一种视频分析方法及装置 Pending CN110532833A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810502120.XA CN110532833A (zh) 2018-05-23 2018-05-23 一种视频分析方法及装置
PCT/CN2019/073661 WO2019223361A1 (zh) 2018-05-23 2019-01-29 一种视频分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810502120.XA CN110532833A (zh) 2018-05-23 2018-05-23 一种视频分析方法及装置

Publications (1)

Publication Number Publication Date
CN110532833A true CN110532833A (zh) 2019-12-03

Family

ID=68616536

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810502120.XA Pending CN110532833A (zh) 2018-05-23 2018-05-23 一种视频分析方法及装置

Country Status (2)

Country Link
CN (1) CN110532833A (zh)
WO (1) WO2019223361A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556337A (zh) * 2020-05-15 2020-08-18 腾讯科技(深圳)有限公司 一种媒体内容植入方法、模型训练方法以及相关装置
CN113496230A (zh) * 2020-03-18 2021-10-12 中国电信股份有限公司 图像匹配方法和系统
CN113573043A (zh) * 2021-01-18 2021-10-29 腾讯科技(深圳)有限公司 视频噪点识别方法、存储介质及设备

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062527B (zh) * 2019-12-10 2023-12-05 北京爱奇艺科技有限公司 一种视频集流量预测方法及装置
CN111027510A (zh) * 2019-12-23 2020-04-17 上海商汤智能科技有限公司 行为检测方法及装置、存储介质
CN111046849B (zh) * 2019-12-30 2023-07-21 珠海格力电器股份有限公司 一种厨房安全的实现方法、装置以及智能终端、存储介质
CN111310695B (zh) * 2020-02-26 2023-11-24 酷黑科技(北京)有限公司 一种迫降方法、装置及电子设备
CN111950424B (zh) * 2020-08-06 2023-04-07 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、计算机及可读存储介质
CN112055249B (zh) * 2020-09-17 2022-07-08 京东方科技集团股份有限公司 一种视频插帧方法及装置
CN113312951B (zh) * 2020-10-30 2023-11-07 阿里巴巴集团控股有限公司 动态视频目标跟踪系统、相关方法、装置及设备
CN112989934B (zh) * 2021-02-05 2024-05-24 方战领 视频分析方法、装置及系统
CN113191293B (zh) * 2021-05-11 2023-04-07 创新奇智(重庆)科技有限公司 广告检测方法、装置、电子设备、系统及可读存储介质
CN113825013B (zh) * 2021-07-30 2023-11-14 腾讯科技(深圳)有限公司 图像显示方法和装置、存储介质及电子设备
CN114095722A (zh) * 2021-10-08 2022-02-25 钉钉(中国)信息技术有限公司 清晰度的确定方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777124A (zh) * 2010-01-29 2010-07-14 北京新岸线网络技术有限公司 一种提取视频文本信息的方法及装置
CN102567982A (zh) * 2010-12-24 2012-07-11 浪潮乐金数字移动通信有限公司 一种视频节目特定信息的提取系统及其方法、移动终端
CN107122773A (zh) * 2017-07-05 2017-09-01 司马大大(北京)智能系统有限公司 一种视频广告检测方法、装置及设备
CN107197269A (zh) * 2017-07-04 2017-09-22 广东工业大学 一种视频拼接的方法与装置
CN107679250A (zh) * 2017-11-01 2018-02-09 浙江工业大学 一种基于深度自编码卷积神经网络的多任务分层图像检索方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2360581A (en) * 2000-03-15 2001-09-26 Television Monitoring Services Quantification of brand exposure on screen
CN105163127B (zh) * 2015-09-07 2018-06-05 浙江宇视科技有限公司 视频分析方法及装置
CN107944409B (zh) * 2017-11-30 2020-05-08 清华大学 能够区分关键动作的视频分析方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777124A (zh) * 2010-01-29 2010-07-14 北京新岸线网络技术有限公司 一种提取视频文本信息的方法及装置
CN102567982A (zh) * 2010-12-24 2012-07-11 浪潮乐金数字移动通信有限公司 一种视频节目特定信息的提取系统及其方法、移动终端
CN107197269A (zh) * 2017-07-04 2017-09-22 广东工业大学 一种视频拼接的方法与装置
CN107122773A (zh) * 2017-07-05 2017-09-01 司马大大(北京)智能系统有限公司 一种视频广告检测方法、装置及设备
CN107679250A (zh) * 2017-11-01 2018-02-09 浙江工业大学 一种基于深度自编码卷积神经网络的多任务分层图像检索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113496230A (zh) * 2020-03-18 2021-10-12 中国电信股份有限公司 图像匹配方法和系统
CN111556337A (zh) * 2020-05-15 2020-08-18 腾讯科技(深圳)有限公司 一种媒体内容植入方法、模型训练方法以及相关装置
CN113573043A (zh) * 2021-01-18 2021-10-29 腾讯科技(深圳)有限公司 视频噪点识别方法、存储介质及设备
CN113573043B (zh) * 2021-01-18 2022-11-08 腾讯科技(深圳)有限公司 视频噪点识别方法、存储介质及设备

Also Published As

Publication number Publication date
WO2019223361A1 (zh) 2019-11-28

Similar Documents

Publication Publication Date Title
CN110532833A (zh) 一种视频分析方法及装置
CN109871316A (zh) 一种控件识别方法和装置
US10395120B2 (en) Method, apparatus, and system for identifying objects in video images and displaying information of same
CN106649316B (zh) 一种视频推送方法及装置
WO2019062388A1 (zh) 广告效果分析方法及装置
US20150248592A1 (en) Method and device for identifying target object in image
Wu et al. Object recognition in construction-site images using 3D CAD-based filtering
CN109726765A (zh) 一种视频分类问题的样本提取方法及装置
CN114819186A (zh) 构建gbdt模型的方法、装置及预测方法、装置
CN112819110B (zh) 基于权重生成的增量式小样本目标检测方法及系统
CN109858542B (zh) 一种字符识别方法和装置
CN110175609A (zh) 界面元素检测方法、装置及设备
CN113836850A (zh) 模型获得方法及系统及装置及介质及产品缺陷检测方法
CN110969600A (zh) 一种产品缺陷检测方法、装置、电子设备及存储介质
CN110287831A (zh) 一种基于地标的控制点的获取方法、装置和电子设备
CN113763348A (zh) 图像质量确定方法、装置、电子设备及存储介质
CN111414948A (zh) 目标对象检测方法和相关装置
CN111476271A (zh) 图标识别的方法、装置、系统、计算机设备和存储介质
CN110248235A (zh) 软件教学方法、装置、终端设备及介质
WO2019062841A1 (zh) 品牌曝光效果分析方法及装置
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN112348566A (zh) 推荐广告的确定方法、装置及存储介质
CN116664566A (zh) 一种oled面板丝印质量控制方法及系统及装置及介质
CN116843665A (zh) 相机模组涂胶情况判定方法、装置、设备及存储介质
CN111709951B (zh) 目标检测网络训练方法及系统及网络及装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203