CN110532833A

CN110532833A - 一种视频分析方法及装置

Info

Publication number: CN110532833A
Application number: CN201810502120.XA
Authority: CN
Inventors: 戴威
Original assignee: Beijing Gridsum Technology Co Ltd
Current assignee: Beijing Gridsum Technology Co Ltd
Priority date: 2018-05-23
Filing date: 2018-05-23
Publication date: 2019-12-03
Also published as: WO2019223361A1

Abstract

本发明公开了一种视频分析方法及装置，其中，方法包括：获取待分析视频；识别所述待分析视频中的目标标识；检测已识别出的目标标识是否满足预设条件，所述预设条件包括：分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠，得到检测结果；依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据。通过本发明实施例，可以确定待分析视频中目标标识的曝光数据，而且可以节省人力资源。

Description

一种视频分析方法及装置

技术领域

本申请涉及视频处理领域，特别是涉及一种视频分析方法及装置。

背景技术

目前，节目冠名已经成为广告主宣传企业品牌的有效渠道，具体的，广告主通过在电视节目中嵌入企业品牌的广告，使得观众在观看电视节目的过程中注意到嵌入有企业品牌的广告，进而起到宣传企业品牌的效果。在实际应用中，电视节目中企业品牌是否曝光、曝光的位置，以及曝光的时长等曝光数据，都会影响企业品牌的宣传效果。因此，需要分析企业品牌在电视节目中的曝光数据，以便寻找使广告主的企业品牌达到更好宣传效果的宣传方式，或者，分析竞争对手的企业品牌的曝光数据。

目前，专业人员观看电视节目，并分析用于表示待分析企业品牌的目标标识在电视节目中的曝光数据。

但是，通过专业人员分析该目标标识在电视节目中的曝光数据，浪费人力资源。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频分析方法及装置。

其中，一种视频分析方法，包括：

获取待分析视频；

识别所述待分析视频中的目标标识；

检测已识别出的目标标识是否满足预设条件，所述预设条件包括：分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠，得到检测结果；

依据所述检测结果，确定满足所述目标标识在所述待分析视频中的曝光数据。

其中，所述分别识别所述待分析视频中的目标标识，包括：

将所述待分析视频中的每帧图像输入训练后的预设模型，使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识；

其中，针对所述待分析视频中的任意一帧图像，所述预设模型按照以下步骤识别所述任意一帧图像中的所述目标标识：

提取所述任意一帧图像的多尺度特征，得到多尺度特征图像集合；

基于所述多尺度的特征图像集合生成候选区域；

从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合；

分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合，得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合；

通过对所述至少两个尺度的区域集合进行全连接，识别出所述任意一帧图像中的所述目标标识。

其中，所述预设模型为：以Faster-RCNN为架构，所述架构包括底层特征提取模型和候选区域生成网络；

其中，所述提取所述任意一帧图像的多尺度特征，得到多尺度特征图像集合，包括：

通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征，得到所述多尺度特征图像集合；

所述基于所述多尺度的特征图像集合生成候选区域，包括：

将所述多尺度的特征图像集合输入所述候选区域生成网络，通过所述候选区域生成网络生成所述侯选区域。

其中，通过以下方式对所述预设模型进行训练，得到所述训练后的预设模型：

获取训练集；所述训练集包括：已标注出所述目标标识的多帧图像；

采用所述多帧图像对所述预设模型进行训练，得到第一预设模型；

将所述待分析视频中的图像输入所述第一预设模型；

获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像；所述标注出所述目标标识的图像中存在错误标注；

获取修正图像；所述修正图像为：经人工对所述错误标注进行修正后的图像；

采用所述修正图像对所述第一预设模型进行训练，得到所述训练后的预设模型。

其中，所述预设条件还包括：

占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比；所述占位至少部分重叠的所述目标标识中，清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。

其中，依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据包括：

在所述检测结果为所述目标标识满足所述预设条件的情况下，确定所述目标标识在所述待分析视频中曝光，并进一步确定曝光参数，其中，所述曝光参数包括以下至少之一：曝光时长、曝光位置；

在所述检测结果为所述目标标识不满足所述预设条件的情况下，确定所述目标标识未在所述待分析视频中曝光。

一种视频分析装置，包括：

获取单元，用于获取待分析视频；

第一识别单元，用于识别所述待分析视频中的目标标识；

检测单元，用于检测已识别出的目标标识是否满足预设条件，所述预设条件包括：分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠，得到检测结果；

确定单元，用于依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据。

其中，所述第一识别单元，包括：

第一输入子单元，用于将所述待分析视频中的每帧图像输入训练后的预设模型，使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识；

其中，针对所述待分析视频中的任意一帧图像，所述预设模型包括：

第一提取单元，用于提取所述任意一帧图像的多尺度特征，得到多尺度特征图像集合；

生成单元，用于基于所述多尺度的特征图像集合生成候选区域；

选取单元，用于从所述多尺度特征图像集合中选取至少两个尺度的特征图像集合；

第二提取单元，用于分别从所述至少两个尺度的特征图像集合中提取所述候选区域对应的区域集合，得到与所述至少两个尺度的特征图像集合对应的至少两个尺度的区域集合；

第二识别单元，通过对所述至少两个尺度的区域集合进行全连接，识别出所述任意一帧图像中的所述目标标识。

其中，所述第一提取单元，具体用于通过所述底层特征提取模块提取所述任意一帧图像的多尺度特征，得到所述多尺度特征图像集合；

所述生成单元，具体用于将所述多尺度的特征图像集合输入所述候选区域生成网络，通过所述候选区域生成网络生成所述侯选区域。

其中，还包括：训练单元；

所述训练单元，用于对所述预设模型进行训练，得到所述训练后的预设模型；

其中，所述训练单元，包括：

第一获取子单元，用于获取训练集；所述训练集包括：已标注出所述目标标识的多帧图像；

第一训练子单元，用于采用所述多帧图像对所述预设模型进行训练，得到第一预设模型；

第二输入子单元，用于将所述待分析视频中的图像输入所述第一预设模型；

第二获取子单元，用于获取所述待分析视频中经所述第一预设模型标注出所述目标标识的图像；所述标注出所述目标标识的图像中存在错误标注；

第三获取子单元，用于获取修正图像；所述修正图像为：经人工对所述错误标注进行修正后的图像；

第二训练子单元，用于采用所述修正图像对所述第一预设模型进行训练，得到所述训练后的预设模型。

其中，检测单元还用于：检测占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比；所述占位至少部分重叠的所述目标标识中，清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。

其中，确定单元，包括：

第一确定子单元，用于在所述检测结果为所述目标标识满足所述预设条件的情况下，确定所述目标标识在所述待分析视频中曝光，并进一步确定曝光参数，其中，所述曝光参数包括以下至少之一：曝光时长、曝光位置；

第二确定子单元，用于在所述检测结果为所述目标标识不满足所述预设条件的情况下，确定所述目标标识未在所述待分析视频中曝光。

一种存储介质，所述存储介质上存储有程序，所述程序被处理器执行时实现上述任意一项所述的视频分析方法。

一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述任意一项所述的视频分析方法。

借由上述技术方案，本发明提供的技术方案中，识别待分析视频中的目标标识；检测所识别出的目标标识是否满足预设条件，满足该预设条件的目标标识所具有的特点，与目标标识在视频中曝光时所具有的特定相符；本实施例中，通过检测所识别出的目标标识中是否满足预设条件所得到检测结果，该检测结果包括：识别出的目标标识满足预设条件与识别出的目标标识不满足预设条件；因此，在本实施例中，可以根据检测结果确定该目标标识是否曝光；当该目标标识曝光时，即识别出的目标标识满足预设条件，此时，该预设条件中限定了分布在相邻的至少两帧图像中的目标标识的占位是至少重叠的，此时，占位至少重叠的目标标识的占位体现了曝光的目标标识的位置；进一步的，依据曝光的目标标识的位置，可以确定待识别视频中该位置处的曝光的目标标识的播放时长；因此，在本申请实施例中，可以依据检测结果确定待分析视频中目标标识的曝光数据，而且可以节省人力资源。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请中一种模型训练方法实施例的流程图；

图2示出了本申请中一种采用方框标注出图像中的每个宝马品牌标识的示意图；

图3示出了本申请中一种视频中目标标识的分析方法实施例的流程图；

图4示出了本申请中一种图像集合包含的图像中所识别出的目标标识的分布示意图；

图5示出了本申请中一种视频中目标标识的分析装置实施例的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

在本实施例中，设置了用于目标识别的模型，具体的，可以应用于以目标识别为基础的场景中，例如，图像分类和图像分割等。其中，该模型架构可以为Faster-RCNN架构。其中，在该模型架构中，采用ResNet模型作为底层特征提取模型，采用RPN网络作为候选区域生成网络。其中，ResNet模型包括5个部分，分别为部分1、部分2、部分3、部分4和部分5，每个部分包含有池化层和卷积层。

在本实施例中，对模型的处理流程进行了改进，具体的，以该模型用于图像识别为例，介绍本实施例模型处理流程的具体改进。首先，将待处理图像输入该模型，该模型中不同部分的卷积层输出待处理图像不同尺度(图像的不同尺度可以理解为是不同分辨率)的信息。例如，当待处理图像大小为M*M时，部分1的卷积层输出大小为M*M的第一特征图像集合，部分2的卷积层输出大小为M*M的第二特征图像集合，部分3的卷积层输出M/2*M/2大小的第三特征图像集合，部分4的卷积层输出M/4*M/4大小的第四特征图像集合，部分5的卷积层输出M/8*M/8大小的第五特征图像集合。需要说明的是，第一特征图像集合、第二特征图像集合、第三特征图像集合、第四特征图像集合和第五特征图像集合都是由多层图像组成，具体的图像层数与该特征图像集合所对应的卷积层中的卷积核的数量相同。

其次，在部分1、部分2、部分3、部分4和部分5分别输出不同尺度的特征图像集合后，将该不同尺度的特征图像集合输入RPN网络，该RPN网络生成候选区域；再次，从5个特征图像集合中选取出至少两个特征图像集合，并分别从至少两个特征图像集合中提取该候选坐标区域所对应的区域集合，并将提取出的区域集合在长度和宽度上统一为预设大小；最后，将统一为预设大小的区域集合从层数上进行拼接，并将拼接后的区域集合进行全连接，以识别待处理图像中待识别的目标。需要说明的是，上述接收该模型的处理流程时，以图像识别场景为例进行了介绍，当然，本实施例中的模型还可以用于其他场景，本实施例不对模型的具体场景作限定。

上述提取区域集合，将提取出的区域集合统一为预设大小，并将统一为预设大小的区域集合从层数上进行拼接的具体例子可以为：假设第一特征图像集合为128*128*3，其中，3表示第一特征图像集合所包含的第一特征图像的帧数，128*128表示任意一个第一特征图像的大小为128*128；第二特征图像集合为64*64*6，其中，6表示第二特征图像集合所包含的第二特征图像的帧数，64*64表示任意一个第二特征图像的大小为64*64；第三特征图像集合为32*32*4，第四特征图像集合为16*16*2，第五特征图像集合为4*4*3，其中，第三图像特征集合、第四图像特征集合和第五图像特征集合的参数含义，与第一特征图像集合中的参数含义相同，这里不再赘述。

从第一特征图像集合、第二特征图像集合、第三特征图像集合、第四特征图像集合和第五特征图像集合中，选取至少两个特征图像集合，将所选取出的至少两个特征图像集合进行数据采样，使得所选取的至少两个特征图像集合所包含的图像从大小上进行统一，例如，将大小统一为7*7的图像。

在将所选取的至少两个特征图像集合统一大小后，从层数上进行叠加。具体的，假设所选取的至少两个特征图像集合为第三特征图像集合和第五特征图像集合，并将这两个特征图像集合所包含图像的大小统一为7*7，此时，将大小统一为7*7的这两个特征图像集合从层数上进行叠加，叠加后的特征图像集合为7*7*10。

在本实施例中的模型，采用ResNet模型作为底层特征提取模型，采用RPN网络作为候选区域生成网络，并采用改进的处理流程对输入的待处理图像进行处理，其中，本实施例的模型在RPN模型生成候选区域后，分别从至少两个特征图像集合中提取该候选区域对应的区域集合，得到至少两个区域集合。由于该至少两个区域集合来自不同的特征图像集合，并且不同特征图像集合体现的是待处理图像在不同尺度的信息，因此，本实施例中的模型将待处理图像中至少两个尺度的图像信息进行全连接，使得本实施例中的模型对待处理图像的不同尺度的信息进行识别。而以标准Faster-RCNN架构的模型对从待处理图像中提取出的候选区域对应的图像区域集合，进行全连接，使得采用标准Faster-RCNN架构的模型只对待处理图像这一尺度上的信息进行识别。

在实际应用中，待处理图像中可能存在不同大小的目标标识，其中，不同大小的目标标识的特征可能体现在不同尺度的特征图像集合上。本实施例中的模型可以识别不同尺度的特征图像集合中的信息，因此，本实施例中的模型可以识别体现在不同尺度的特征图像集合上的信息。进而，相比于采用标准Faster-RCNN架构的模型，本实施例中的模型对识别不同大小的目标标识具有更高的识别准确率。

在本实施例中，对设置好架构的模型进行训练，具体对该模型进行训练的过程，可以参考图1，图1示出了本申请中一种模型训练方法实施例的流程图，该方法实施例可以包括：

步骤101：获取训练集。

在本实施例中，还以该模型用于图像识别为例，介绍对该模型的训练过程。具体的图像识别场景为：识别图像中是否存在宝马品牌标识。在本步骤中，获取用于训练该模型的训练集，其中，训练集包括标注出宝马品牌标识的大量图像。

具体的，用于组成训练集的大量图像可以通过以下方式获取：从百度、Google等搜索平台或其他素材网站上，采集含有宝马品牌标识的图像；还可以利用屏幕截图软件从直播节目等视频中，采集含有宝马品牌标识的图像。当然，在实际应用中，还可以采用其他方式获取含有宝马品牌标识的大量图像，本步骤只是提供了两种获取含有宝马品牌标识的图像的方式，并不对具体的获取含有宝马品牌标识图像的方式作限定。

在获取到含有宝马品牌标识的大量图像后，接着，针对所获取的每帧图像，标注出图像中的宝马品牌标识，具体的，如图2所示，采用方框标注出图像中的每个宝马品牌标识。

步骤102：采用所获取的训练集对模型进行训练，得到第一模型。

在获取到训练集后，接着，在本步骤中，采用所获取的训练集中大量图像对该模型进行训练。具体的，分别将标注出宝马品牌标识的图像输入模型中，该模型采用改进后的流程识别并标注所输入的图像中的宝马品牌标识，并以训练集中标注出宝马品牌标识为基准，自动调整模型中的参数，经过多次调整模型中的参数，当达到某一标准时，得到第一模型。

步骤103：将预设数量帧待识别图像输入该第一模型。

采用训练集对模型进行训练得到第一模型后，接着，在本步骤中，将预设数量帧待识别图像输入该第一模型中，针对输入的每帧待识别图像，该第一模型识别并标注出每帧待识别图像中所包含有的为宝马品牌标识。

步骤104：获取第一模型分别识别并标注出目标标识的预设数目帧图像。

在第一模型对所输入的每帧待识别图像中的目标标识进行识别与标注后，获取该第一模型所识别并标注出目标标识的预设数目帧图像。在实际应用中，第一模型识别并标注待识别图像中的目标标识时，会出现错误识别的情况，此时，所标注出的目标标识也是错误的。因此，在本步骤中，所获取的经第一模型识别并标注出目标标识的预设数目帧图像中，存在标注非目标标识的符号，为了描述方便，本实施例将标注非目标标识的符号统称为错误符号。

步骤105：获取将人工对错误符号修正后的预设数量帧图像。

人工对错误符号进行修正，即人工识别错误符号，并人工标注出的目标标识。在本步骤中，获取经人工对错误符号修正后的预设数量帧图像。

步骤106：将修正后的预设数量帧图像输入第一模型中，对该第一模型进行训练，得到训练后的模型。

在获取到经人工修正后的预设数量帧图像后，接着，在本步骤中，将修正后的预设数量帧图像输入第一模型中，对该第一模型进行进一步的训练。具体的，在本步骤中对第一模型进行训练的过程，与步骤102对模型进行训练的思路是相同的，具体训练过程可以参考步骤102，这里不再赘述。为了描述方便，本实施例将对第一模型进行训练后所得到的模型，统称为训练后的模型。

在本实施例中，对通过训练集对模型进行训练后得到第一模型，由于训练集的图像是从搜索平台中采集得到的，因此，采用该训练集中的图像对模型进行训练后，模型只对该训练集中的目标标识进行学习。在实际应用中，待识别的图像中可能存在与目标标识相似的相似标识，为了使模型可以更好的区分目标标识与相似标识的区别特征，在本实施例中，将预设数量帧待识别图像输入该第一模型，该第一模型所输出的用于标注目标标识的符号中存在错误符号，采用人工对错误符号修正后的预设数量帧图像，再次对第一模型进行训练，得到训练后的模型。此时，相比于第一模型，训练后的模型对待识别图像中的目标标识的识别准确率得到提高，因此，通过本实施例的训练方法，可以进一步提高模型对待识别图像中的目标标识的识别准确率。

在得到训练后的模型后，接着，在本实施例中，将该训练后的模型应用于分析视频中目标标识植入情况的场景中。具体的，参考图3，示出了本申请中一种分析视频中目标标识的方法实施例的流程图，该方法实施例可以包括：

步骤301：获取待分析视频。

在本步骤中所获取的待分析视频可以为编码后的待分析视频。

步骤302：对所获取的待分析视频进行解码，得到解码后的待分析视频。

步骤303：对于解码后的待分析视频，按照视频帧的先后顺序，以及以第一预设数量帧的图像作为一个图像集合的原则，将解码后的视频划分为多个图像集合。

在本实施例中，视频中植入的目标标识一般在连续的两三秒钟持续播放，其中，目标标识表示预设的一种标识，例如，需要分析视频中宝马品牌标识，此时，宝马品牌标识就是目标标识。在实际应用中，每秒所播放的图像大概为5帧左右，因此，解码后的待分析视频中植入目标标识的图像一般在连续的10～15帧中出现。因此，为了更准确地分析待分析视频中目标标识的植入情况，在本步骤中，针对解码后的待分析视频，按照待分析视频中视频帧的先后顺序，将第一预设数量帧图像作为一个图像集合，其中，预设数量可以为5～7帧中的任意一个数字。此时，将解码后的待分析视频划分为多个图像集合。

步骤304：分别将每个图像集合中的图像输入训练后的模型，使得训练后的模型识别每个图像集合所包含的图像中的目标标识。

将解码后的待分析视频划分为多个图像集合后，接着，在本步骤中，分别将每个图像集合中的图像输入训练后的模型中，该训练后的模型对每帧图像中的目标标识进行识别。在实际应用中，训练后的模型中在识别出待分析视频中的目标标识后，将所识别出的目标标识进行标注，例如，训练后的模型识别出一个宝马品牌标识，可以采用一个方框将所识别出的宝马品牌标识框住，并输出采用方框框住所识别出的宝马品牌标识的图像。

步骤305：获取训练后的模型所输出的与每个图像集合对应的标注出目标标识的图像集合。

在训练后的模型输出标注有预设符号的图像后，得到与所划分的每个图像集合对应的标注有预设符号的图像集合，得到多个识别后的图像集合。

步骤306：检测每个图像集合中所标注出的目标标识是否满足预设条件。

在得到多个标注出目标标识的图像集合后，接着，在本步骤中，分别检测每个图像集合中所标注的目标标识是否存在满足预设条件。在本步骤中，以任意一个图像集合为例，介绍该任意一个图像集合中所标注出的目标标识是否满足预设条件。

其中，预设条件可以包括：分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠。其中，目标标识的占位是指该目标标识在一个基准坐标系中所占的空间区域。

以下以一个具体的场景为例，介绍图像集合中的所识别出的目标标识是否满足预设条件。具体的场景为：该图像集合中包括5帧图像，分别为第一帧，第二帧，第三帧，第四帧和第五帧，目标标识为宝马品牌标识；对于第一帧图像、第二帧图像、第三帧图像、第四帧图像和第五帧图像中所识别出的目标标识的位置分布如图4所示。具体的，在第一帧图像中所识别出的宝马品牌标识为两个，一个分布在图像的左上角位置，另一个分布在图像的右下角位置；第二帧图像中识别出两个宝马品牌标识，一个分布在图像的右上角位置，另一个分布在图像的右下角位置；第三帧图像中识别出一个宝马品牌标识，分布在图像的右下角位置；第四帧图像中没有识别出宝马品牌标识；第五帧图像中识别出一个宝马品牌标识，分布在图像的右下角位置；其中，第一帧图像、第二帧图像和第三帧图像中右下角位置的目标标识的占位重叠。

该预设条件为“分布在相邻至少两帧图像中的目标标识的占位至少部分重叠”，因此在这个场景中，分布在相邻的至少两帧图像中的目标标识，具体为：分布在第一帧图像、第二帧图像和第三帧图像中的5个宝马品牌标识；接着，判断分布在相邻至少两帧图像中的目标标识的占位是否至少部分重叠，在第一帧图像、第二帧图像和第三帧图像这三帧图像中右下角的3个宝马品牌标识是重叠的。因此，该图像集合中所识别出的宝马品牌标识满足预设条件。

在检测图像集合中已识别出的目标标识是否满足预设条件，得到两种检测结果，一种为：图像集合中已识别出的目标标识满足预设条件，另一种为：图像集合中已识别出的目标标识不满足预设条件。

为了使得检测结果的准确性更高，在本实施例中，预设条件还可以包括：占位至少部分重叠的目标标识间的重叠比例大于预设百分比；占位至少部分重叠的所述目标标识中，清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。其中，预设百分比的取值范围可以不小于50％，预设总数量的取值范围可以不小于5。

需要说明的是，本实施例只是给出了预设百分比和预设总数量较优的取值范围，当然，在实际应用中，预设百分比和预设总数量还可以根据实际情况确定具体取值，本实施例不对预设百分比和预设总数量的具体取值作限定。

步骤307：依据检测结果确定该目标标识在待分析视频中的曝光数据。

在得到检测结果后，接着，在本步骤中，依据该检测结果，确定该目标标识在该待分析视频中的曝光数据。其中，曝光数据包括：是否曝光、曝光位置，以及曝光时长等。具体的，在本步骤中，若检测结果为：图像集合中已识别出的目标标识满足预设条件，则表明该目标标识在该图像集合中曝光；并将相邻的至少两帧图像中占位至少部分重叠的目标标识所占有的空间位置，确定为该目标标识的曝光位置；并依据该曝光位置，统计待分析视频中在该曝光位置存在目标标识的连续图像的帧数，依据该帧数确定该目标标识的播放时长。

需要说明的是，在实际应用中，目标标识的曝光位置可能有多个，此时，分别确定每个曝光位置的目标标识的播放时长，并将所有曝光位置所对应的播放时长的和，作为该目标标识的总播放时长。

当检测结果为：图像集合中已识别出的目标标识不满足预设条件，则表明该目标标识在该图像集合中没有曝光，若该目标标识在每个图像集合中都没有曝光，则表明该目标标识在待分析视频中没有曝光。此时，就没有曝光位置以及曝光时长。

在本实施例中，识别待分析视频中的目标标识；检测所识别出的目标标识是否满足预设条件，满足该预设条件的目标标识所具有的特点，与目标标识在视频中曝光时所具有的特定相符；本实施例中，通过检测所识别出的目标标识中是否满足预设条件所得到检测结果，该检测结果包括：识别出的目标标识满足预设条件与识别出的目标标识不满足预设条件；因此，在本实施例中，可以根据检测结果确定该目标标识是否曝光；当该目标标识曝光时，即识别出的目标标识满足预设条件，此时，该预设条件中限定了分布在相邻的至少两帧图像中的目标标识的占位是至少重叠的，此时，占位至少重叠的目标标识的占位体现了曝光的目标标识的位置；进一步的，依据曝光的目标标识的位置，可以确定待识别视频中该位置处的曝光的目标标识的播放时长；因此，在本申请实施例中，可以依据检测结果确定待分析视频中目标标识的曝光数据。

参考图5，示出了本申请中一种视频中目标标识的分析装置实施例的结构示意图，该装置实施例可以包括：

获取单元501，用于获取待分析视频；

第一识别单元502，用于识别所述待分析视频中的目标标识；

检测单元503，用于检测已识别出的目标标识是否满足预设条件，所述预设条件包括：分布在相邻的至少两帧图像中的目标标识的占位至少部分重叠，得到检测结果；

确定单元504，用于依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据。

其中，第一识别单元502，可以包括：

其中，该装置还可以包括：训练单元；

该训练单元，用于对所述预设模型进行训练，得到所述训练后的预设模型；

其中，所述训练单元，包括：

其中，检测单元503还用于：检测占位至少部分重叠的所述目标标识间的重叠比例大于预设百分比；所述占位至少部分重叠的所述目标标识中，清晰度大于预设清晰度阈值的目标标识的总数量大于预设总数量。

其中，确定单元504，可以包括：

所述视频中目标标识的分析装置包括处理器和存储器，上述获取单元、第一识别单元、检测单元、确定单元和训练单元等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来分析目标标识在视频中的曝光数据。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述视频分析方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述视频分析方法。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现以下步骤：

获取待分析视频；

识别所述待分析视频中的目标标识；

具体的，将所述待分析视频中的每帧图像输入训练后的预设模型，使得所述训练后的预设模型识别所述待分析视频中每帧图像中的目标标识；

基于所述多尺度的特征图像集合生成候选区域；

所述基于所述多尺度的特征图像集合生成候选区域，包括：

将所述待分析视频中的图像输入所述第一预设模型；

其中，预设条件还可以包括：

依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据。

具体的，在所述检测结果为所述目标标识满足所述预设条件的情况下，确定所述目标标识在所述待分析视频中曝光，并进一步确定曝光参数，其中，所述曝光参数包括以下至少之一：曝光时长、曝光位置；

本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序：

获取待分析视频；

识别所述待分析视频中的目标标识；

基于所述多尺度的特征图像集合生成候选区域；

所述基于所述多尺度的特征图像集合生成候选区域，包括：

将所述待分析视频中的图像输入所述第一预设模型；

其中，所述预设条件还包括：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种视频分析方法，其特征在于，包括：

获取待分析视频；

识别所述待分析视频中的目标标识；

2.根据权利要求1所述的方法，其特征在于，所述分别识别所述待分析视频中的目标标识，包括：

基于所述多尺度的特征图像集合生成候选区域；

3.根据权利要求2所述的方法，其特征在于，所述预设模型为：以Faster-RCNN为架构，所述架构包括底层特征提取模型和候选区域生成网络；

所述基于所述多尺度的特征图像集合生成候选区域，包括：

4.根据权利要求2所述的方法，其特征在于，通过以下方式对所述预设模型进行训练，得到所述训练后的预设模型：

将所述待分析视频中的图像输入所述第一预设模型；

5.根据权利要求1所述的方法，其特征在于，所述预设条件还包括：

6.根据权利要求1所述的方法，其特征在于，依据所述检测结果，确定满足所述目标标识在所述待分析视频中曝光数据包括：

7.一种视频分析装置，其特征在于，包括：

获取单元，用于获取待分析视频；

第一识别单元，用于识别所述待分析视频中的目标标识；

8.根据权利要求7所述的装置，其特征在于，所述第一识别单元，包括：

9.一种存储介质，其特征在于，所述存储介质上存储有程序，所述程序被处理器执行时实现权利要求1至6中任一权利要求所述的视频分析方法。

10.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至6中任一权利要求所述的视频分析方法。