CN110443780A

CN110443780A - 一种基于OpenCV算法的PPT边框提取方法及相关设备

Info

Publication number: CN110443780A
Application number: CN201910562960.XA
Authority: CN
Inventors: 管明雷; 柯君卓; 汪驰升
Original assignee: Shenzhen Ronghui Technology Co ltd
Current assignee: Shenzhen Ronghui Technology Co ltd
Priority date: 2019-06-26
Filing date: 2019-06-26
Publication date: 2019-11-12

Abstract

本发明提供了一种基于OpenCV算法提取PPT边框的方法及系统，通过获取含有PPT文档的信息图像；调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割；将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出四边形的四个顶点；获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。本发明所提供的方法及设备，可以实现快捷的从视频文件中识别出PPT文档的边框，为从PPT文档中准确的提取PPT信息提供了前提，为用户从视频文件中提取PPT信息提供便利。

Description

一种基于OpenCV算法的PPT边框提取方法及相关设备

技术领域

本发明涉及信息处理技术领域，尤其涉及的是一种基于OpenCV算法的PPT边框提取方法及相关设备。

背景技术

目前，在大型会议还是内部讨论会中，参会者都会利用PPT文档进行报告。演讲者通过将PPT投影到投影幕或显示器上来将演讲主要内容呈现给观众。观众主要是通过呈现出来的PPT文档和演讲者口头汇报的内容来获知PPT文档的信息，因此在会议中最主要内容是PPT文档内容和演讲中口述内容。

目前，观众或者主办方会利用录像设备来对会议中PPT文档内容、演讲者口头语言内容进行采集。这种视频录制方法能够有效地记录演讲者的PPT演示内容和口头演讲内容，但是针对录制好的视频文件可能会含有大量与PPT文档及其讲解不相关的内容，若未能参加现场会议的用户需要基于整个视频文件获取PPT文档的信息，则可能会因视频文件中含有的信息量大，并非是单一的关于PPT文档信息的视频文件，导致花费大量不必要的时间。而现有技术中，还未公开用于提取视频文件中的PPT文档内容或者演讲中的语言文字内容的方法，也未公开如何在提取视频文件中的PPT文档时准确识别其边框，从而实现准确的PPT画面的提取，因此如何快速的从视频文件中提取PPT文档相关信息的问题是亟待需要解决的问题。

因此，现有技术有待于进一步的改进。

发明内容

鉴于上述现有技术中的不足之处，本发明的目的在于为用户提供一种基于OpenCV算法的PPT边框提取方法及相关设备，克服现有技术中存在的技术还不含有从视频文件中获取PPT文档方法的缺陷。

本发明提供了一种基于OpenCV的PPT边框提取方法，其中，包括步骤：

A、获取含有PPT文档的信息图像；

B、调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割；

C、将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；

D、检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出四边形；

E、获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。

可选的，所述步骤A包括：

步骤A1、对含有PPT文档的视频文件进行图像帧分割，得到多个得到由截取得到的多个图像帧组成的图像帧集；

步骤A2、从所述图像帧集中任意取一张图像帧作为所述信息图像。

可选的，所述步骤C包括：

C1、调用OpenCV库中的自适应阈值化函数对所述信息灰度图进行背景修正。

可选的，所述步骤D包括：

D1、利用轮廓检测函数对所述背景修正后的所述信息灰度图进行轮廓检测，获取轮廓信息。

可选的，所述步骤D还包括：

D2、调用OpenCV库中轮廓处理函数计算各个轮廓的面积及周长；

D3、计算各个轮廓的平均面积，并将轮廓面积低于平均面积的轮廓剔除；

D4、利用多边形逼近算法，使用第一参数计算剔除后剩余轮廓的角点个数，并删除角点个数超出预设个数的轮廓，得到筛选出的轮廓。

可选的，所述步骤D还包括：

D5、利用多边形逼近算法，使用第二参数对所述筛选出的轮廓进行再次多边形逼近，筛选出角点个数为四个的四边形。

可选的，所述四个角点的在所述信息图像中的位置信息为所述四个角点在信息图像中的二维坐标信息。

本发明在上述方法的基础上，还提供了一种基于OpenCV的PPT边框提取装置，其中，包括：

图像获取模块，用于获取含有PPT文档的信息图像；

图像分割模块，用于调用OpenCV库中的Mean-Shift函数对所述信息图像进行图像分割；

灰度转换模块，用于将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；

轮廓检测模块，用于检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出四边形；

边框提取模块，用于获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。

本发明在上述方法的基础上，还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现所述方法的步骤。

本发明在上述方法的基础上，还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现所述的方法的步骤。

有益效果，本发明提供了一种基于OpenCV的PPT边框提取方法及相关设备，通过获取含有PPT文档的信息图像；调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割；将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出四边形；获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。本发明所提供的方法及设备，利用函数对含有PPT文档信息的图像中识别出PPT文档的边框，为从含有PPT文档信息的图片或者视频中准确的提取PPT信息提供了前提，为用户获取PPT信息提供了便利。

附图说明

图1是本发明提供的所述方法具体实施例的步骤流程图；

图2是本发明所述方法中信息图像转换成的灰度图；

图3是本发明所述方法中对灰度图进行自适应阈值化函数处理后的图像；

图4是本发明所述方法中轮廓检测函数检测后的输出图像；

图5是本发明所述装置的原理结构框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

本发明提供了一种基于OpenCV的PPT边框提取方法，如图1，包括步骤：

步骤S1、获取含有PPT文档的信息图像。

本步骤中首先获取到含有PPT文档的信息图像，其获取方法可以为从视频文件中获取，也可以是基于PPT文档直接拍摄的图像。

具体的，所述本步骤包括：

步骤S11、对含有PPT文档的视频文件进行图像帧分割，得到多个得到由截取得到的多个图像帧组成的图像帧集；

步骤S12、从所述图像帧集中任意取一张图像帧作为所述信息图像。

对于第一种方式，所述信息图像可以为对视频文件进行分帧处理得到的。将视频文件分割成处于同一时间轴序列的一系列图像帧，该一系列图像帧形成序列图库。可以想到的是，对视频文件做分帧处理一般需要获取该视频文件的总时长，根据预定时间为间隔，将视频文件分割成独立的原始图像帧。其中，预设时间越小，则视频文件中分割出原始图像帧越多，预设时间越大，则视频文件中分割出的原始图像帧就越少。而所述原始图像帧分割出的越多，则相似度高的图像帧就会越多，相邻图像帧之间的相似度就会越大，因此本步骤中视频文件的总时长，以及分割时间的设置均对分割出的图像帧个数及相邻图像帧之间的相似度有影响。

针对第二种，该图像帧也可以是拍摄出的含有PPT画面的一系列图像，将拍摄出的一系列图像按照时间顺序进行排列，得到一系列的信息图像组成的信息图像集。

步骤S2、调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割。

调用OpenCV库中的Mean-Shift函数对所述信息图像进行预处理，减少信息图像上的噪声信息，具体的采用的函数如下表述：

void cv::pyrMeanShiftFiltering (cv::InputArray src, cv::OutputArray dst,cv::double sp, cv::double sr, int maxLever)

其中，输入的信息图像src和输出图像dst分别是8位三通道彩色图像，且宽高相同。sp代表空间半径，sr代表颜色半径，maxLevel代表用于分割的金字塔层数。

步骤S3、将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图。

为了实现准确的从信息图像中识别出轮廓，本步骤中需要对信息图像进行再次处理，得到信息图像的灰度图。如图2所示为信息图像的灰度图示意图。现有技术中本步骤可以使用多种方法实现灰度图的处理，例如：可以使用平均值法，将同一个像素位置三通道RGB值进行平均，或者采用最大最小平均值法，取同一个像素位置的RGB中亮度最大的和最小的进行平均，或者加权平均法，通过加权系数调节参数对每个像素的灰度值进行设置。本步骤中采用上述方法的任意一种均可。

为了提高灰度化图像后，目标区域（即PPT区域）与背景区域之间的区别出来，本步骤还包括：

调用OpenCV库中的自适应阈值化函数对所述信息灰度图进行背景修正。

在灰度图像中，灰度值变化明显的区域往往是物体的轮廓，因此本步骤中对信息图像使用adaptiveThreshold函数（自适应阈值化函数）进行背景进行修正，保证信息图像中各个像素的阈值会随着周围领域块的变化而变化。如图3所示，为本步骤中对灰度图进行自适应阈值化函数处理后的灰度图。

步骤S4、检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出四边形。

从上述步骤中修正后的灰度图中检测并识别出四边形轮廓信息，并根据轮廓信息所含有的轮廓面积和周长，所述四边形轮廓信息为近似矩形或矩形，四边形角度范围在80º～90º，则根据识别出的轮廓和四个边的角度范围，识别出PPT边框。

为了准确识别出四边形，所述本步骤包括以下内容：

S41、利用轮廓检测函数对所述背景修正后的所述信息灰度图进行轮廓检测，获取轮廓信息。

通过调用轮廓检测函数（find Contours函数）对自适应阈值化函数后的信息灰度图进行轮廓检测，获取灰度图中轮廓的信息，如图4所示是轮廓检测函数检测后的输出图像。本步骤中输入的图像必须是8位单通道二值化图像，并且检测到的轮廓被表示成一个点向量，输出该点向量。

void cv::findContours (cv::InputArray src, cv::OutputArray contours,int mode, int method)

其中，输入图像src是8位单通道彩色图像，输出contours为vector<cv::Point>向量，每一个向量中的point表示轮廓线上的二维顶点， mode代表轮廓提取的方式，method代表轮廓表达方式。

以及，mode = cv::RETE_LIST（检测所有轮廓及轮廓层级）,method = CHAIN_APPORX_NONE(压缩处理后的点，仅保留最后一个)。

S42、调用OpenCV库中轮廓处理函数计算各个轮廓的面积及周长。

对轮廓进行第一次筛选，通过轮廓处理函数（contourArea函数）计算每个轮廓的面积和利用arcLength函数计算周长。

本步骤中所使用的轮廓处理函数表示为：

void cv::approxPolyDP (cv::InputArray curve, cv::OutputArray approxCurve,double epsilon, bool closed)

其中，输出curve为一次输入的多边形，approxCurve为输出数组，可表示为cv::Point形式，epsilon为原多边形和最终拟合的多边形之间存在的最大误差，closed指明原多边形是否闭合。

S43、计算各个轮廓的平均面积，并将轮廓面积低于平均面积的轮廓剔除。

S44、利用多边形逼近算法，使用第一参数计算剔除后剩余轮廓的角点个数，并删除角点个数超出预设个数的轮廓，得到筛选出的轮廓。

针对较大且不属于检测目标的轮廓，使用多边形逼近算法，进行第一次多边形逼近。使用多边形逼近对不属于PPT的轮廓进行初步删除，因为PPT的形状一般为规则四边形（或矩形），考虑到场景不同以及遮挡原因可能存在误差，将多边形逼近得到出的角点限制在3个到8个之间。

S45、利用多边形逼近算法，使用第二参数对所述筛选出的轮廓进行再次多边形逼近，筛选出角点个数为四个的四边形。

对满足条件的轮廓进行第二次多边形逼近。要进行第二次逼近的原因在于第一次使用了准确度较高的参数进行排除，保留了包括检测目标在内的其他轮廓。通过对第一轮轮廓进行面积排序，从面积最大轮廓进行多边形逼近，此时逼近精度调整为平均轮廓周长的十五分之一，通过降低精度选出可能因为遮挡而导致大于四条边的PPT，输出第二次多边形逼近结果是四边形的多边形，即判断为四边形。

本步骤中多边形逼近算法所使用的参数与上述步骤S44中所使用的参数不同，本次使用的参数为了筛选出角点的个数为4的多边形，上述步骤S44中所使用的参数为了筛选出角点的个数范围为3-8的多边形，因此本步骤中所使用的参数对多边形逼近后得到多边形的要求更为精确。

步骤S5、获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。

本发明所公开的方法主要运用OpenCV库内的函数，首先使用均值偏移算法（Mean-Shift算法）对信息图像进行模糊处理，减少信息图像的噪声，然后计算信息图像内部的轮廓面积以及周长等约束条件，用以排除噪声轮廓，然后使用多边形逼近排除较大轮廓，最后再修改多边形逼近的参数筛选出四边形，获取四边形的四个顶点，根据所述四边形的四个顶点计算四边形四个内角的角度，并根据所述四个内角的角度筛选出PPT边框，并提取筛选出的PPT边框。

下面对本发明所述方法中各个步骤中所使用的函数算法进行更加详细的描述。

H1、首先对信息图像进行预处理，减少噪声信息，本次通过调用Mean-Shift函数实现对信息图像的去噪处理。

H2、对去噪后的信息图像的三通道彩色图像转换成单通道的灰度图。

H3、使用自适应阈值化函数对上述步骤H2中转换得到的灰度图进行修正；

H4、通过轮廓检测函数对上述步骤S3中修正后的灰度图进行轮廓检测，获取轮廓信息。

H5、利用轮廓处理函数计算上述步骤H4中检测出的各个轮廓的面积以及周长，并计算检测到的轮廓的平均面积，并将小于平均面积的轮廓剔除。

H6、使用多边形逼近算法，对剩下的轮廓进行第一次多边形逼近，得将逼近得出的轮廓的角点超出8个和低于3个轮廓删除。

H7、对删除掉角点个数为3-8之间的轮廓进行第二次多边形逼近，得到多边形逼近结果为四边形的多边形，将该四边形判定为PPT边框。

H8、将上述步骤中多边形逼近得到的四边形的四个角点判定为PPT边框的四个角点，根据该四个角点的位置信息输出PPT边框。

本发明所述方法可以针对含有PPT文档的图像依次进行去噪处理、轮廓检测和使用两次多边形逼近算法，检测出图像中可能存在的PPT边框，由于本发明所述方法中通过调用OpenCV库内的函数直接对图像进行处理，因此易于实现，运算量小，处理效率高，且识别精度高，为实现从图像中获取PPT文档信息提供了便利。

本发明在上述方法的基础上，还提供了一种基于OpenCV的PPT边框提取装置，如图5，包括：

图像获取模块510，用于获取含有PPT文档的信息图像；其功能如步骤S1所述。

图像分割模块520，用于调用OpenCV库中的Mean-Shift函数对所述信息图像进行图像分割；其功能如步骤S2所述。

灰度转换模块530，用于将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；其功能如步骤S3所述。

轮廓检测模块540，用于检测所述信息灰度图中所含有的轮廓，计算检测到的各个轮廓的面积和周长，并根据所述各个轮廓的面积和周长筛选出PPT边框；其功能如步骤S4所述。

边框提取模块550，用于获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框，其功能如步骤S5所述。

本发明提供了一种基于OpenCV的PPT边框提取方法及相关设备，通过获取含有PPT文档的信息图像；调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割；将进行图像分割后的所述信息图像转换成灰度图，得到信息灰度图；检测所述信息灰度图中所含的若干个目标物的轮廓信息，获取所述目标物的轮廓面积和周长，并根据所述轮廓面积和周长筛选出四边形；获取所述四边形的四个顶点，利用余弦定理计算所述四边形四个内角的角度，根据所述角度筛选出PPT边框，并提取筛选出的所述PPT边框。本发明所提供的方法及设备，利用函数对含有PPT文档信息的图像中识别出PPT文档的边框，为从含有PPT文档信息的图片或者视频中准确的提取PPT信息提供了前提，为用户获取PPT信息提供了便利。

可以理解的是，对本领域普通技术人员来说，可以根据本发明的技术方案及其发明构思加以等同替换或改变，而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于OpenCV的PPT边框提取方法，其特征在于，包括步骤：

A、获取含有PPT文档的信息图像；

2.根据权利要求1所述的基于OpenCV的PPT边框提取方法，其特征在于，所述步骤A包括：

3.根据权利要求1所述的基于OpenCV的PPT边框提取方法，其特征在于，所述步骤C包括：

4.根据权利要求3所述的基于OpenCV的PPT边框提取方法，其特征在于，所述步骤D包括：

5.根据权利要求4所述的基于OpenCV的PPT边框提取方法，其特征在于，所述步骤D还包括：

D3、利用多边形逼近算法，使用第一参数计算剔除后剩余轮廓的角点个数，并删除角点个数超出预设个数的轮廓，得到筛选出的轮廓。

6.根据权利要求4所述的基于OpenCV的PPT边框提取方法，其特征在于，所述步骤D还包括：

D4、利用多边形逼近算法，使用第二参数对所述筛选出的轮廓进行再次多边形逼近，筛选出角点个数为四个的四边形。

7.根据权利要求6所述的基于OpenCV的PPT边框提取方法，其特征在于，所述四个角点的在所述信息图像中的位置信息为所述四个角点在信息图像中的二维坐标信息。

8.一种基于OpenCV的PPT边框提取装置，其特征在于，包括：

图像获取模块，用于获取含有PPT文档的信息图像；

图像分割模块，用于调用OpenCV库中的均值偏移算法对所述信息图像进行图像分割；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。