CN112883899A

CN112883899A - 基于颜色聚类的视频镜头分割方法

Info

Publication number: CN112883899A
Application number: CN202110267399.XA
Authority: CN
Inventors: 张宪民; 吴立新; 黄勇
Original assignee: Shanghai Callsc Electronic Information Technology Co ltd
Current assignee: Shanghai Callsc Electronic Information Technology Co ltd
Priority date: 2021-03-12
Filing date: 2021-03-12
Publication date: 2021-06-01

Abstract

本发明公开了一种基于颜色聚类的视频镜头分割方法，首先，在任一帧视频图像内选择一定数量的像素点构成集合，在颜色域内对该集合的像素点进行颜色聚类运算；其次，按最近邻颜色距离规则聚类每一像素点；按最近邻颜色类规则合并颜色类；然后，计算帧内每个颜色类的中心坐标(x,y,z)、计算每个颜色类的半径Radius、统计每个颜色类的像素点个数count，并构成帧内颜色类矢量及其标注；最后，计算帧间图像之间的帧内颜色类矢量的相似度，建立基于颜色类矢量图像帧间相似度估计模型；根据每一帧图像的颜色类矢量将一段视听信息媒体流聚类为镜头序列。

Description

基于颜色聚类的视频镜头分割方法

技术领域

本发明属于媒体视听信息处理领域，具体涉及一种基于颜色聚类的视频镜头分割方法。

背景技术

广播电视互联网新媒体视听信息监测监管中需要对视频序列的内容进行视频分析。镜头分割是视频分析的关键技术；

每一个视听信息流，或是CCTV-1台24小时节目流，或是手机新媒体的一段短视频流，都是若干镜头组成的。每个镜头是一段图像帧序列组成，这些帧图像时间相关、颜色空间相关、亮度分布相关、几何特征相关、内容也相关。

目前，国内外影视行业，对视听信息流进行镜头分割大多采用人工观察的方法，镜头如何分割都是通过相关操作人员观察决定。

人工观察的方法精确度及效率低，可能会影响视频的播放效果。

发明内容

本发明所要解决的技术问题是：提供一种基于颜色聚类的视频镜头分割方法，解决了现有技术中人工观察方法分割镜头精确度及效率低的问题。

本发明为解决上述技术问题采用以下技术方案：

基于颜色聚类的视频镜头分割方法，包括如下步骤：

步骤1、在任一帧视频图像内选择一定数量的像素点构成集合，在颜色域内对该集合的像素点进行颜色聚类运算；

步骤2、引入类别数的限制参数C1，按最近邻颜色距离规则聚类每一像素点；按最近邻颜色类规则合并颜色类，使得帧内颜色聚类的类别数为C1或小于C1；

步骤3、计算帧内每个颜色类的中心坐标(x,y,z)、计算每个颜色类的半径Radius、统计每个颜色类的像素点个数count，并构成帧内颜色类矢量及其标注：

{Color1((x,y,z),Radius,count)；Color2((x,y,z),Radius,count)；…ColorC1((x,y,z),Radius,count))}；

步骤4、计算帧间图像之间的帧内颜色类矢量的相似度，建立基于颜色类矢量图像帧间相似度估计模型；将每一帧图像的颜色类矢量进行相似度估计聚类分析计算；将一段视听信息媒体流聚类为镜头序列。

聚类过程中，颜色空间的坐标系可以为CIE1931为基础的各类颜色表达空间。

所述颜色表达空间包括CIE-RGB、YUV、YCbCr、RGB、HSV。

步骤1中，在任一帧视频图像内至少选择60％的像素点构成集合。

步骤3中，计算每个颜色类的像素点个数count时，引入每个颜色类最少像素个数的限制参数C2，在镜头聚类过程中，如某个颜色类的像素点少于最少像素个数的限制参数C2，则将该颜色类去掉或将该颜色类的像素点归并到最近邻的类别中去。

聚类后的镜头序列包括：时间相关、颜色空间相关、亮度分布相关、几何特征相关、内容相关。

与现有技术相比，本发明具有以下有益效果：

1、基于颜色相关对视频镜头进行分割，直接通过计算机硬件处理，速度快，精确度高。

2、采用该方法，计算机可以基于颜色进行实时分割镜头，进一步提高了处理的速度及精确度。

附图说明

图1为本发明帧内颜色类矢量及其标注的构成结构图。

具体实施方式

下面结合附图对本发明的结构及工作过程作进一步说明。

基于颜色聚类的视频镜头分割方法，包括如下步骤：

具体实施例，如图1所示，

基于颜色聚类的视频镜头分割方法，包括如下步骤：

步骤1、在任一帧视频图像内选择65％左右的像素点(基于某一规则的感兴趣区域内)构成集合，在颜色域内对该集合的像素点进行颜色聚类运算；颜色空间的坐标系可以是CIE1931为基础的各类颜色表达空间，如：CIE-RGB、YUV、YCbCr、RGB、HSV等；所述基于某一规则的感兴趣区域可以根据不同的应用目的做出相应的调节，也可以按照个人主观因素做出，例如：将中心位置作为基准，围绕其进行像素点选择，或者将台标附近的位置作为基准，选择相应区域的像素点，还可以根据马赛克活动范围，跑马灯活动轨迹等，也可以按照个人喜好选择像素点区域。

步骤2、引入类别数的限制参数C1，该实施例C1可以选择5，该参数能够防止聚类过程时的类别数无序增长；按最近邻颜色距离规则聚类每一像素点；按最近邻颜色类规则合并颜色类，使得帧内颜色聚类的类别数为C1或小于C1；

计算每个颜色类的像素点个数count时，引入每个颜色类最少像素个数的限制参数C2，该实施例C2选择像素个数的7％，在镜头聚类过程中，如某个颜色类的像素点少于最少像素个数的限制参数C2，则将该颜色类去掉或将该颜色类的像素点归并到最近邻的类别中去；C2是根据实际处理情况，或者根据经验值来选择参数，与运算时间长度、计算量大小、计算负担等因素相关。

步骤4、计算帧间图像之间的帧内颜色类矢量的相似度，根据理论模型和统计经验，建立基于颜色类矢量图像帧间相似度估计模型；将每一帧图像的颜色类矢量进行相似度估计聚类分析计算；将一段视听信息媒体流聚类为镜头序列。

采用该方法分割镜头，能够被进一步应用到如下领域：

1、视听信息流检测监管领域：可以建立基于镜头样本的视听信息流监测监管大数据集(堆、库)，检测和收集图像异态、声音异态镜头样本、收集内容安全违规违法事例的镜头样本，积累基于镜头样本的经验数据、利用大数据分析和机器智能算法对大数据镜头样本进行分析并学习和揭示其中的统计特征和舆论泛起模式(规律)，可以提高视听信息流监测监管效率。

2、移动互联网中的短视频流监测监管领域：需要建立基于镜头样本的大数据，统一监测监管基于镜头样本格式和存储传输标准，对移动互联网上发布的短视频建立基于镜头样本的机器索引，内容分类标准；对于互联网的舆论监测、舆论导向掌控具有重大意义；也有潜在的巨大商业价值。

3、移动互联网上各类视频平台的检测监管：如：抖音、直播引发了视频社会化、视频产业生态链、社会治理的视频化、如：互联网视频+医疗互联网视频+购物、互联网视频+教育、互联网视频+扶贫、互联网视频+居家办公等；视频社会化导致了分分秒秒都在产生巨大海量的视音频信息；如何对这些视音频信息监测监管？如何对这些视音频信息进行视频内容的分析？本发明的基于颜色聚类分析的实时高效的镜头分割方法是回答这些问题的关键技术。

以上对本发明的较佳实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，其中未尽详细描述的部分应该理解为用本领域中的普通方式予以实施；任何熟悉本领域的技术人员，在不脱离本发明技术方案范围情况下，都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例，这并不影响本发明的实质内容。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本发明技术方案保护的范围内。

Claims

1.基于颜色聚类的视频镜头分割方法，其特征在于：包括如下步骤：

2.根据权利要求1所述的基于颜色聚类的视频镜头分割方法，其特征在于：聚类过程中，颜色空间的坐标系可以为CIE1931为基础的各类颜色表达空间。

3.根据权利要求2所述的基于颜色聚类的视频镜头分割方法，其特征在于：所述颜色表达空间包括CIE-RGB、YUV、YCbCr、RGB、HSV。

4.根据权利要求1所述的基于颜色聚类的视频镜头分割方法，其特征在于：步骤1中，在任一帧视频图像内至少选择60％的像素点构成集合。

5.根据权利要求1所述的基于颜色聚类的视频镜头分割方法，其特征在于：步骤3中，计算每个颜色类的像素点个数count时，引入每个颜色类最少像素个数的限制参数C2，在镜头聚类过程中，如某个颜色类的像素点少于最少像素个数的限制参数C2，则将该颜色类去掉或将该颜色类的像素点归并到最近邻的类别中去。

6.根据权利要求1所述的基于颜色聚类的视频镜头分割方法，其特征在于：聚类后的镜头序列包括：时间相关、颜色空间相关、亮度分布相关、几何特征相关、内容相关。