CN113542864A - 视频的花屏区域检测方法、装置、设备及可读存储介质 - Google Patents

视频的花屏区域检测方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113542864A
CN113542864A CN202010333912.6A CN202010333912A CN113542864A CN 113542864 A CN113542864 A CN 113542864A CN 202010333912 A CN202010333912 A CN 202010333912A CN 113542864 A CN113542864 A CN 113542864A
Authority
CN
China
Prior art keywords
video
gradient
determining
edge detection
video frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010333912.6A
Other languages
English (en)
Other versions
CN113542864B (zh
Inventor
张亚彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010333912.6A priority Critical patent/CN113542864B/zh
Publication of CN113542864A publication Critical patent/CN113542864A/zh
Application granted granted Critical
Publication of CN113542864B publication Critical patent/CN113542864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43637Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wireless protocol, e.g. Bluetooth, RF or wireless LAN [IEEE 802.11]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供了一种视频的花屏区域检测方法、装置、设备及可读存储介质,该方法包括:获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。该方法实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度。

Description

视频的花屏区域检测方法、装置、设备及可读存储介质
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种视频的花屏区域检测方法、装置、设备及计算机可读存储介质。
背景技术
在视频会议、无线投屏等软件开发和质量测试中,由于在视频录制编码和网络传输等复杂的处理过程中会偶然性出现花屏,花屏会严重影响用户的观感体验。
传统的质量检测方法不能有效的定位视频的花屏区域,例如,目前的视频会议和投屏技术大多具备网络抗性,根据I帧网络丢包率来检测花屏,但是检测花屏的效率低,而且无法解决针对非网络丢包引起的花屏问题。又例如,计算视频的边缘图像灰度值,即通过检测划分子块边界像素点的灰度值来判定子块是否为花屏子块,若花屏子块的数量高于指定阈值,则判定该视频存在花屏;但是根据划分子块边界像素点的灰度值而得到判定结果对区块划分成子块有一定的依赖,而且受到视频内容的较大干扰,无法有效的检测出花屏区域。
发明内容
本申请针对现有的方式的缺点,提出一种视频的花屏区域检测方法、装置、电子设备及计算机可读存储介质,用以解决如何提升检测视频的花屏区域的效率和准确度的问题。
第一方面,本申请提供了一种视频的花屏区域检测方法,包括:
获取待检测的视频;
将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;
根据边缘检测图和所述梯度图,确定视频帧对应的梯度单一性值;
当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。
可选地,获取待检测的视频,包括:
获取待检测的棋盘格视频,棋盘格视频通过视频发送端将预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成,棋盘格视频中的棋盘格的梯度方向为预设角度。
可选地,棋盘格视频包括二维码信息,二维码信息包括帧数信息,帧数信息用于确定时间戳。
可选地,在确定视频帧包括的花屏区域之后,还包括:
根据时间戳,确定花屏区域出现的时间信息。
可选地,将视频包括的视频帧进行边缘检测,确定边缘检测图,包括:
通过预设的第一算子对视频帧进行边缘检测,确定二值分布的边缘检测图,边缘检测图将视频帧上的像素标识为位于边缘区域的像素或位于平坦区域的像素。
可选地,将视频帧进行平滑处理和梯度检测,确定梯度图,包括:
通过预设的高斯窗对视频帧做平滑处理,得到平滑处理后的视频帧;
通过预设的第二算子对平滑处理后的视频帧进行垂直梯度检测和水平梯度检测,确定垂直的梯度图和水平的梯度图。
可选地,根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值,包括:
根据边缘检测图,确定边缘区域的各像素;
根据垂直的梯度图和水平的梯度图,确定边缘区域的各像素的垂直梯度值和水平梯度值;
根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值。
可选地,根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值,包括:
根据垂直梯度值和水平梯度值,确定边缘区域的各像素的梯度单一性值,各像素的数量之和为N,N为正整数;
将各像素的梯度单一性值之和与N相除,得到视频帧对应的梯度单一性值。
第二方面,本申请提供了一种视频的花屏区域检测装置,包括:
第一处理模块,用于获取待检测的视频;
第二处理模块,用于将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;
第三处理模块,用于根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;
第四处理模块,用于当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。
可选地,第一处理模块,具体用于获取待检测的棋盘格视频,棋盘格视频通过视频发送端将预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成,棋盘格视频中的棋盘格的梯度方向为预设角度。
可选地,棋盘格视频包括二维码信息,二维码信息包括帧数信息,帧数信息用于确定时间戳。
可选地,第四处理模块,具体用于在确定视频帧包括的花屏区域之后,根据时间戳,确定花屏区域出现的时间信息。
可选地,第二处理模块,具体用于通过预设的边缘检测第一算子对视频帧进行边缘检测,确定二值分布的边缘检测图,边缘检测图将视频帧上的像素标识为位于边缘区域的像素或位于平坦区域的像素。
可选地,第二处理模块,具体用于通过预设的高斯窗对视频帧做平滑处理,得到平滑处理后的视频帧;通过预设的第二算子对平滑处理后的视频帧进行垂直梯度检测和水平梯度检测,确定垂直的梯度图和水平的梯度图。
可选地,第三处理模块,具体用于根据边缘检测图,确定边缘区域的各像素;根据垂直的梯度图和水平的梯度图,确定边缘区域的各像素的垂直梯度值和水平梯度值;根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值。
可选地,第三处理模块,具体用于根据垂直梯度值和水平梯度值,确定边缘区域的各像素的梯度单一性值,各像素的数量之和为N,N为正整数;将各像素的梯度单一性值之和与N相除,得到视频帧对应的梯度单一性值。
第三方面,本申请提供了一种电子设备,包括:处理器、存储器和总线;
总线,用于连接处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本申请第一方面的视频的花屏区域检测方法。
第四方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本申请第一方面的视频的花屏区域检测方法。
本申请实施例提供的技术方案,至少具有如下有益效果:
获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。如此,实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度;实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种视频的花屏区域检测方法的流程示意图;
图2为本申请实施例提供的视频的花屏区域检测的示意图;
图3为本申请实施例提供的视频的花屏区域检测的示意图;
图4为本申请实施例提供的视频的花屏区域检测的示意图;
图5为本申请实施例提供的另一种视频的花屏区域检测方法的流程示意图;
图6为本申请实施例提供的一种视频的花屏区域检测装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使得本申请的发明目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面详细描述本申请的实施例,该实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习或深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
为了更好的理解及说明本申请实施例的方案,下面对本申请实施例中所涉及到的一些技术用语进行简单说明。
Canny算子:Canny边缘检测算子是一个多级边缘检测算法,该算法用高斯滤波器平滑图像,计算平滑后的图像的梯度幅值和方向,对梯度幅值采用非极大值抑制,其过程为找出图像梯度中的局部极大值点,把其他非极大值点置零而得到细化的边缘,用双阈值算法检测和连接边缘。
Sobel算子:Sobel索贝尔算子是计算机视觉领域的一种重要处理方法。主要用于获得数字图像的一阶梯度,常见的应用和物理意义是边缘检测。索贝尔算子是把图像中每个像素的上下左右四领域的灰度值加权差,在边缘处达到极值从而检测边缘。索贝尔算子主要用作边缘检测。在技术上,它是一离散性差分算子,用来运算图像亮度函数的梯度之近似值。在图像的任何一点使用此算子,将会产生对应的梯度矢量或是其法矢量。索贝尔算子不但产生较好的检测效果,而且对噪声具有平滑抑制作用。
高斯窗:高斯窗是一种指数窗;高斯窗的主瓣较宽,频率分辨力低,无负的旁瓣。高斯窗常被用来截短一些非周期信号,如指数衰减信号等。对于随时间按指数衰减的函数,可采用指数窗来提高信噪比。
HDMI:高清多媒体接口(High Definition Multimedia Interface,HDMI)是一种全数字化视频和声音发送接口,可以发送未压缩的音频及视频信号。
USB:通用串行总线(Universal Serial Bus,USB)是一种串口总线标准,也是一种输入输出接口的技术规范。
YUV:YUV是一种颜色编码方法,常使用在各个视频处理组件中;YUV在对照片或视频编码时,考虑到人类的感知能力,允许降低色度的带宽。YUV是编译true-color颜色空间(color space)的种类,Y表示明亮度(Luminance或Luma),即灰阶值;U和V表示色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。
RGB:RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色。RGB格式对一种颜色进行编码的方法统称为颜色空间或色域。
块效应:基于块的变换编码在图像压缩编码中得到广泛应用,随着码率的降低,量化变得粗糙,在块的边界会出现不连续,形成重建图像的明显缺陷,称为块效应。
H264:H264是一种编码方式,也被称为MPEG-4part10或者ACV(高级视频编码),是一种视频压缩技术。
HEVC:高效视频编码(High Efficiency Video Coding,HEVC)也称为H.265,可以通过蓝光最佳视频压缩方法实现两倍的压缩。
本申请实施例提供的技术方案涉及人工智能的计算机视觉技术,下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例中提供了一种视频的花屏区域检测方法,应用于视频接收端,该方法的流程示意图如图1所示,该方法包括:
S101,获取待检测的视频。
可选地,如图2所示,视频发送端PC1(110)生成待检测的视频,视频发送端PC1(110)对待检测的视频进行编码,得到编码后的视频;视频发送端PC1(110)使用无线投屏软件将编码后的视频通过无线局域网WIFI发送给投屏盒子120,投屏盒子120对编码后的视频进行解码,即将视频包括的视频帧从YUV格式转化为RGB格式,得到待检测的视频;投屏盒子120将待检测的视频通过HDMI发送给视频采集卡130,即视频接收端PC2(140)使用视频采集卡130通过HDMI采集到待检测的视频;视频采集卡130通过USB将待检测的视频发送给视频接收端PC2(140);视频接收端PC2(140)接收到待检测的视频,即视频接收端PC2(140)获取待检测的视频。
可选地,获取待检测的视频,包括:
获取待检测的棋盘格视频,棋盘格视频通过视频发送端PC1(110)将预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成,棋盘格视频中的棋盘格的梯度方向为预设角度。
可选地,棋盘格视频包括二维码信息,二维码信息包括帧数信息,帧数信息用于确定时间戳。
可选地,待测试的视频为棋盘格视频,视频发送端PC1(110)生成梯度方向为±45度的棋盘格视频。
可选地,视频发送端PC1(110)生成方格大小为N=96,倾斜角theta=45度的棋盘模板,棋盘模板可以是预设的棋盘格的图片,预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成棋盘格视频。例如,视频发送端PC1(110)生成一段长度约20s、帧率30fps和分辨率1920x1080的棋盘格视频;预设的运动方向每隔5s变换一次,每帧的运动矢量分别为[+5,+5]、[-5,+5]、[-5,-5]和[+5,-5],即运动方向分别为45度、135度、225度和315度。
需要说明的是,N为16的倍数,N的大小为达到纹理复杂度和抗性的均衡,N的大小可以做适当调整。当N较小时,纹理复杂度高,容易检测到花屏,但也容易受到压缩失真干扰;当N较大时,纹理密度偏少,将会有不容易检测到花屏的风险。
可选地,棋盘格明暗颜色的选取可以保证棋盘格在不同的传输码率下画质稳定,不易出现压缩失真导致的块效应且保持梯度的完整性,棋盘格明暗颜色可以选取如下表现稳定的明暗RGB色彩对:{[161,204,191],[31,82,80]};{[131,176,227],[41,58,108]};{[166,142,191],[57,55,91]};{[208,114,106],[104,10,2]};{[205,177,190],[103,65,96]}。
可选地,如图3所示,视频发送端PC1(110)全屏循环播放待测试的视频,待测试的视频为棋盘格视频。当棋盘格视频的长度约20s(秒),以及帧率为30fps,fps表示每秒的帧数,则棋盘格视频中共有20×30=600帧。二维码信息包括帧数信息,帧数信息包括帧号,帧号Frame 177表示棋盘格视频序列中的第177帧,帧号用于在比20s(秒)的更小尺度内定位花屏出现的时间戳。Frame 177下方为二维码,二维码用于增强信息冗余度以及对抗压缩失真等干扰。将视频帧的帧数信息转化为二维码添加至棋盘格视频最左侧,根据帧数信息确定时间戳,时间戳包括二维码中记录的视频帧号和视频帧号对应的视频帧出现的时间信息。
可选地,棋盘格的关注区域内梯度方向均为theta=45度或者135度,即|tan(theta)|=1,当出现花屏现象,由于视频编码均采用规整分割的编码单元,例如,H264和HEVC使用16×16或者64×64作为一个基础的编码单元,则视频处出现|tan(theta)|偏离1,就可以有效的检测到花屏现象。
可选地,棋盘格的关注区域可以为图4中边框中的区域,即图4中高10%~90%,宽30%~90%的区域;关注区域内所有的边缘线均为45或135度的斜线。检测该边框选定的区域,二维码在边框的外面,从而避免了二维码的干扰。
S102,将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图。
可选地,将视频包括的视频帧进行边缘检测,确定边缘检测图,包括:
通过预设的第一算子对视频帧进行边缘检测,确定二值分布的边缘检测图,边缘检测图将视频帧上的像素标识为位于边缘区域的像素或位于平坦区域的像素。
可选地,第一算子包括边缘检测Canny算子。
可选地,通过预设的边缘检测Canny算子对视频帧进行边缘检测,确定视频帧上的像素的梯度值;Canny算子通过预设的一个高阈值和一个预设的低阈值来区分边缘区域的像素和位于平坦区域的像素,当视频帧上的像素的梯度值大于高阈值,则边缘检测图将视频帧上的像素标识为位于边缘区域的像素;当视频帧上的像素的梯度值小于低阈值,则边缘检测图将视频帧上的像素标识为位于平坦区域的像素。例如,高阈值和低阈值分别设置为100和20,当视频帧上的像素的梯度值大于高阈值100,则边缘检测图将视频帧上的像素标识为位于边缘区域的像素,边缘检测图上的二值分布确定为1;当视频帧上的像素的梯度值小于低阈值20,则边缘检测图将视频帧上的像素标识为位于平坦区域的像素,边缘检测图上的二值分布确定为0。
可选地,将视频帧进行平滑处理和梯度检测,确定梯度图,包括:
通过预设的高斯窗对视频帧做平滑处理,得到平滑处理后的视频帧;
通过预设的第二算子对平滑处理后的视频帧进行垂直梯度检测和水平梯度检测,确定垂直的梯度图和水平的梯度图。
可选地,第二算子包括Sobel算子。
可选地,通过尺寸为5×5以及sigma=1的高斯窗对视频帧做平滑处理,得到平滑处理后的视频帧。
可选地,通过预设的Sobel算子对平滑处理后的视频帧进行水平梯度检测和垂直梯度检测,确定垂直的梯度图Gx和水平的梯度图Gy。
S103,根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值。
可选地,根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值,包括:
根据边缘检测图,确定边缘区域的各像素;
根据垂直的梯度图和水平的梯度图,确定边缘区域的各像素的垂直梯度值和水平梯度值;
根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值。
可选地,根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值,包括:
根据垂直梯度值和水平梯度值,确定边缘区域的各像素的梯度单一性值,各像素的数量之和为N,N为正整数;
将各像素的梯度单一性值之和与N相除,得到视频帧对应的梯度单一性值。
可选地,根据边缘检测图,确定边缘区域的各像素Pi,其中,i为1到N之间的正整数,各像素Pi的数量之和为N,N为正整数;通过垂直的梯度图Gx和水平的梯度图Gy分别求得Pi的水平梯度值gx和Pi的垂直梯度值gy;根据Pi的水平梯度值gx和Pi的垂直梯度值gy,通过公式(1)确定Pi对应的梯度单一性值Si,公式(1)如下所示:
Figure BDA0002465922430000111
可选地,将各像素Pi的梯度单一性值Si之和与N相除,得到视频帧对应的梯度单一性值S。通过公式(2)确定梯度单一性值S,公式(2)如下所示:
Figure BDA0002465922430000112
S104,当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。
可选地,当梯度单一性值S小于预设阈值,确定视频帧包括的花屏区域,预设阈值可以预设为0.85。花屏区域在图4所示的关注区域中,即图4中高10%~90%,宽30%~90%的区域。
可选地,在确定视频帧包括的花屏区域之后,还包括:
根据时间戳,确定花屏区域出现的时间信息。
本申请实施例中,获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。如此,实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度;实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
本申请实施例中提供了另一种视频的花屏区域检测方法,该方法的流程示意图如图5所示,该方法包括:
S201,视频发送端PC1(110)生成单一梯度的待检测的棋盘格视频。
可选地,单一梯度的待检测的棋盘格视频为梯度方向±45度的棋盘格视频。
S202,视频发送端PC1(110)通过投屏盒子120和视频采集卡130,将待检测的棋盘格视频发送给视频接收端PC2(140)。
可选地,视频发送端PC1(110)对待检测的棋盘格视频进行编码,得到编码后的棋盘格视频;视频发送端PC1(110)使用无线投屏软件将编码后的棋盘格视频通过WIFI发送给投屏盒子120,投屏盒子120对编码后的棋盘格视频进行解码,得到待检测的棋盘格视频;投屏盒子120将待检测的棋盘格视频通过HDMI发送给视频采集卡130,即视频接收端PC2(140)使用视频采集卡130通过HDMI采集到待检测的棋盘格视频;视频采集卡130通过USB将待检测的棋盘格视频发送给视频接收端PC2(140);视频接收端PC2(140)接收到待检测的棋盘格视频。
S203,视频接收端PC2(140)将棋盘格视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图。
S204,视频接收端PC2(140)根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值。
S205,当梯度单一性值小于预设阈值,视频接收端PC2(140)确定视频帧包括的花屏区域。
S206,视频接收端PC2(140)根据时间戳,确定花屏区域出现的时间信息。
可选地,将视频帧的帧数信息转化为二维码添加至棋盘格视频最左侧,根据帧数信息确定时间戳,时间戳包括二维码中记录的视频帧号和视频帧号对应的视频帧出现的时间信息。当视频帧出现花屏区域,视频帧号对应的视频帧出现的时间信息就是花屏区域出现的时间信息。
为了更好的理解本申请实施例所提供的方法,下面结合具体应用场景的示例对本申请实施例的方案进行进一步说明。
本申请实施例所提供的方法应用于图2中所示的视频会议系统或无线投屏系统,视频会议系统或无线投屏系统包括视频发送端PC1(110)、投屏盒子120、视频采集卡130和视频接收端PC2(140),视频发送端PC1(110)生成棋盘格视频,视频接收端PC2(140)对棋盘格视频进行检测,当视频接收端PC2(140)检测到棋盘格视频的视频帧包括的花屏区域,则视频会议系统或无线投屏系统不稳定;当视频接收端PC2(140)没有检测到棋盘格视频的视频帧包括的花屏区域,则视频会议系统或无线投屏系统稳定。
可选地,当梯度单一性值S小于预设阈值0.85,视频接收端PC2(140)将当前一段时间内的视频会议系统或无线投屏系统传输的视频,以及当前画面截屏,自动保存在本地,确定花屏区域出现的时间信息,其中,本地包括视频接收端PC2(140)。如图4所示的当前画面截屏,Thres:0.85,表示预设阈值为0.85;dumped:000,表示检测到花屏的次数;frms:1230650,表示视频发送端PC1(110)已发送的视频帧的总数;score:0.54,表示当前视频帧对应的梯度单一性值为0.54;s_avg:nan,表示系统检测总时间内梯度单一性值score的平均值;s_min:0.04,表示系统检测总时间内梯度单一性值score的最小值。
需要说明的是,在启动检侧花屏之后,才开启无线投屏,检侧花屏启动后的45s(秒)左右的时间用来无线投屏启动,该45s(秒)中的score梯度单一性值会被忽略;但是s_avg和s_min会分别统计所有时间内的score的平均值和score的最小值,因此,s_avg取值nan,s_min取值0.04。
本申请实施例中,实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
基于相同的发明构思,本申请实施例还提供了一种视频的花屏区域检测装置,应用于视频接收端,该装置的结构示意图如图6所示,视频的花屏区域检测装置60,包括第一处理模块601、第二处理模块602、第三处理模块603和第四处理模块604。
第一处理模块601,用于获取待检测的视频;
第二处理模块602,用于将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;
第三处理模块603,用于根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;
第四处理模块604,用于当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。
可选地,第一处理模块601,具体用于获取待检测的棋盘格视频,棋盘格视频通过视频发送端将预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成,棋盘格视频中的棋盘格的梯度方向为预设角度。
可选地,棋盘格视频包括二维码信息,二维码信息包括帧数信息,帧数信息用于确定时间戳。
可选地,第四处理模块604,具体用于在确定视频帧包括的花屏区域之后,根据时间戳,确定花屏区域出现的时间信息。
可选地,第二处理模块602,具体用于通过预设的第一算子对视频帧进行边缘检测,确定二值分布的边缘检测图,边缘检测图将视频帧上的像素标识为位于边缘区域的像素或位于平坦区域的像素。
可选地,第二处理模块602,具体用于通过预设的高斯窗对视频帧做平滑处理,得到平滑处理后的视频帧;通过预设的第二算子对平滑处理后的视频帧进行垂直梯度检测和水平梯度检测,确定垂直的梯度图和水平的梯度图。
可选地,第三处理模块603,具体用于根据边缘检测图,确定边缘区域的各像素;根据垂直的梯度图和水平的梯度图,确定边缘区域的各像素的垂直梯度值和水平梯度值;根据垂直梯度值和水平梯度值,确定视频帧对应的梯度单一性值。
可选地,第三处理模块603,具体用于根据垂直梯度值和水平梯度值,确定边缘区域的各像素的梯度单一性值,各像素的数量之和为N,N为正整数;将各像素的梯度单一性值之和与N相除,得到视频帧对应的梯度单一性值。
本申请实施例提供的视频的花屏区域检测装置中未详述的内容,可参照上述实施例提供的视频的花屏区域检测方法,本申请实施例提供的视频的花屏区域检测装置能够达到的有益效果与上述实施例提供的视频的花屏区域检测方法相同,在此不再赘述。
应用本申请实施例,至少具有如下有益效果:
获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。如此,实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度;实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
基于相同的发明构思,本申请实施例还提供了一种电子设备,该电子设备的结构示意图如图7所示,该电子设备6000包括至少一个处理器6001、存储器6002和总线6003,至少一个处理器6001均与存储器6002电连接;存储器6002被配置用于存储有至少一个计算机可执行指令,处理器6001被配置用于执行该至少一个计算机可执行指令,从而执行如本申请中任意一个实施例或任意一种可选实施方式提供的任意一种视频的花屏区域检测方法的步骤。
进一步,处理器6001可以是FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其它具有逻辑处理能力的器件,如MCU(Microcontroller Unit,微控制单元)、CPU(Central Process Unit,中央处理器)。
应用本申请实施例,至少具有如下有益效果:
获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。如此,实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度;实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
基于相同的发明构思,本申请实施例还提供了另一种计算机可读存储介质,存储有计算机程序,该计算机程序用于被处理器执行时实现本申请中任意一个实施例或任意一种可选实施方式提供的任意一种视频的花屏区域检测的步骤。
本申请实施例提供的计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(RandomAccess Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
应用本申请实施例,至少具有如下有益效果:
获取待检测的视频;将视频包括的视频帧进行边缘检测,确定边缘检测图,并将视频帧进行平滑处理和梯度检测,确定梯度图;根据边缘检测图和梯度图,确定视频帧对应的梯度单一性值;当梯度单一性值小于预设阈值,确定视频帧包括的花屏区域。如此,实现了实时的检测待检测的视频的花屏区域,通过边缘检测、平滑处理和梯度检测有效地提升了定位待检测的视频的花屏区域的效率和准确度;实现了低开销的对视频会议系统和无线投屏系统的长期检测,并可以检测到视频会议系统和无线投屏系统小概率出现的花屏及花屏区域。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本申请公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种视频的花屏区域检测方法,其特征在于,包括:
获取待检测的视频;
将所述视频包括的视频帧进行边缘检测,确定边缘检测图,并将所述视频帧进行平滑处理和梯度检测,确定梯度图;
根据所述边缘检测图和所述梯度图,确定所述视频帧对应的梯度单一性值;
当所述梯度单一性值小于预设阈值,确定所述视频帧包括的花屏区域。
2.根据权利要求1所述的方法,其特征在于,所述获取待检测的视频,包括:
获取待检测的棋盘格视频,所述棋盘格视频通过视频发送端将预设的棋盘格的图片在预设时间段内按照预设的运动方向进行移动来生成,所述棋盘格视频中的棋盘格的梯度方向为预设角度。
3.根据权利要求2所述的方法,其特征在于,所述棋盘格视频包括二维码信息,所述二维码信息包括帧数信息,所述帧数信息用于确定时间戳。
4.根据权利要求2所述的方法,其特征在于,在所述确定所述视频帧包括的花屏区域之后,还包括:
根据所述时间戳,确定所述花屏区域出现的时间信息。
5.根据权利要求1所述的方法,其特征在于,所述将所述视频包括的视频帧进行边缘检测,确定边缘检测图,包括:
通过预设的第一算子对所述视频帧进行边缘检测,确定二值分布的边缘检测图,所述边缘检测图将所述视频帧上的像素标识为位于边缘区域的像素或位于平坦区域的像素。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述将所述视频帧进行平滑处理和梯度检测,确定梯度图,包括:
通过预设的高斯窗对所述视频帧做平滑处理,得到平滑处理后的视频帧;
通过预设的第二算子对所述平滑处理后的视频帧进行垂直梯度检测和水平梯度检测,确定垂直的梯度图和水平的梯度图。
7.根据权利要求6所述的方法,其特征在于,所述根据所述边缘检测图和所述梯度图,确定所述视频帧对应的梯度单一性值,包括:
根据所述边缘检测图,确定所述边缘区域的各像素;
根据所述垂直的梯度图和所述水平的梯度图,确定所述边缘区域的各像素的垂直梯度值和水平梯度值;
根据所述垂直梯度值和所述水平梯度值,确定所述视频帧对应的梯度单一性值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述垂直梯度值和所述水平梯度值,确定所述视频帧对应的梯度单一性值,包括:
根据所述垂直梯度值和所述水平梯度值,确定所述边缘区域的各像素的梯度单一性值,所述各像素的数量之和为N,N为正整数;
将所述各像素的梯度单一性值之和与所述N相除,得到所述视频帧对应的梯度单一性值。
9.一种视频的花屏区域检测装置,其特征在于,包括:
第一处理模块,用于获取待检测的视频;
第二处理模块,用于将所述视频包括的视频帧进行边缘检测,确定边缘检测图,并将所述视频帧进行平滑处理和梯度检测,确定梯度图;
第三处理模块,用于根据所述边缘检测图和所述梯度图,确定所述视频帧对应的梯度单一性值;
第四处理模块,用于当所述梯度单一性值小于预设阈值,确定所述视频帧包括的花屏区域。
10.一种电子设备,其特征在于,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行如权利要求1-8中任一项所述的视频的花屏区域检测方法。
CN202010333912.6A 2020-04-24 2020-04-24 视频的花屏区域检测方法、装置、设备及可读存储介质 Active CN113542864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010333912.6A CN113542864B (zh) 2020-04-24 2020-04-24 视频的花屏区域检测方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010333912.6A CN113542864B (zh) 2020-04-24 2020-04-24 视频的花屏区域检测方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113542864A true CN113542864A (zh) 2021-10-22
CN113542864B CN113542864B (zh) 2023-04-25

Family

ID=78094189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010333912.6A Active CN113542864B (zh) 2020-04-24 2020-04-24 视频的花屏区域检测方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113542864B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938674A (zh) * 2021-10-25 2022-01-14 重庆紫光华山智安科技有限公司 视频质量检测方法、装置、电子设备及可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551900A (zh) * 2008-03-31 2009-10-07 新奥特(北京)视频技术有限公司 一种视频马赛克图像检测方法
US20100002957A1 (en) * 2008-07-03 2010-01-07 Rastislav Lukac Detecting Edges In A Digital Images
CN102542282A (zh) * 2010-12-16 2012-07-04 北京大学 一种无源图像马赛克检测方法及装置
EP2491721A1 (en) * 2009-10-20 2012-08-29 Apple Inc. System and method for demosaicing image data using weighted gradients
CN103079029A (zh) * 2013-02-06 2013-05-01 上海风格信息技术股份有限公司 一种基于宏块边缘信息的数字电视马赛克识别方法
CN106372584A (zh) * 2016-08-26 2017-02-01 浙江银江研究院有限公司 一种视频图像马赛克检测方法
US20170161873A1 (en) * 2015-12-02 2017-06-08 Texas Instruments Incorporated Universal and adaptive de-mosaicing (cfa) system
CN107818568A (zh) * 2017-09-29 2018-03-20 昆明理工大学 一种视频马赛克检测方法
CN108364282A (zh) * 2018-01-15 2018-08-03 北京华兴宏视技术发展有限公司 图像马赛克检测方法、图像马赛克检测系统
CN108696747A (zh) * 2018-04-17 2018-10-23 青岛海信电器股份有限公司 一种视频测试方法和装置
CN111062331A (zh) * 2019-12-18 2020-04-24 银河互联网电视有限公司 图像的马赛克检测方法、装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101551900A (zh) * 2008-03-31 2009-10-07 新奥特(北京)视频技术有限公司 一种视频马赛克图像检测方法
US20100002957A1 (en) * 2008-07-03 2010-01-07 Rastislav Lukac Detecting Edges In A Digital Images
EP2491721A1 (en) * 2009-10-20 2012-08-29 Apple Inc. System and method for demosaicing image data using weighted gradients
CN102542282A (zh) * 2010-12-16 2012-07-04 北京大学 一种无源图像马赛克检测方法及装置
CN103079029A (zh) * 2013-02-06 2013-05-01 上海风格信息技术股份有限公司 一种基于宏块边缘信息的数字电视马赛克识别方法
US20170161873A1 (en) * 2015-12-02 2017-06-08 Texas Instruments Incorporated Universal and adaptive de-mosaicing (cfa) system
CN106372584A (zh) * 2016-08-26 2017-02-01 浙江银江研究院有限公司 一种视频图像马赛克检测方法
CN107818568A (zh) * 2017-09-29 2018-03-20 昆明理工大学 一种视频马赛克检测方法
CN108364282A (zh) * 2018-01-15 2018-08-03 北京华兴宏视技术发展有限公司 图像马赛克检测方法、图像马赛克检测系统
CN108696747A (zh) * 2018-04-17 2018-10-23 青岛海信电器股份有限公司 一种视频测试方法和装置
CN111062331A (zh) * 2019-12-18 2020-04-24 银河互联网电视有限公司 图像的马赛克检测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何滋鱼: "基于比例梯度的马赛克检测算法" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113938674A (zh) * 2021-10-25 2022-01-14 重庆紫光华山智安科技有限公司 视频质量检测方法、装置、电子设备及可读存储介质
CN113938674B (zh) * 2021-10-25 2023-09-26 重庆紫光华山智安科技有限公司 视频质量检测方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN113542864B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
US10977809B2 (en) Detecting motion dragging artifacts for dynamic adjustment of frame rate conversion settings
EP2916543B1 (en) Method for coding/decoding depth image and coding/decoding device
CN105472205B (zh) 编码过程中的实时视频降噪方法和装置
US11343504B2 (en) Apparatus and method for picture coding with selective loop-filtering
CN109379594B (zh) 视频编码压缩方法、装置、设备和介质
CN106971399B (zh) 图像马赛克检测方法及装置
US9584806B2 (en) Using depth information to assist motion compensation-based video coding
EP3718306A1 (en) Cluster refinement for texture synthesis in video coding
EP3721414A1 (en) A method and apparatus for encoding/decoding the geometry of a point cloud representing a 3d object
Li et al. A scalable coding approach for high quality depth image compression
CN113542864B (zh) 视频的花屏区域检测方法、装置、设备及可读存储介质
Yuan et al. Object shape approximation and contour adaptive depth image coding for virtual view synthesis
CN111770334B (zh) 数据编码方法及装置、数据解码方法及装置
Meuel et al. Superpixel-based segmentation of moving objects for low bitrate ROI coding systems
Xia et al. Visual sensitivity-based low-bit-rate image compression algorithm
Wang et al. Region of interest oriented fast mode decision for depth map coding in DIBR
CN115802038A (zh) 一种量化参数确定方法、装置及一种视频编码方法、装置
CN110740326A (zh) 图像编码方法及装置
CN113613024B (zh) 视频预处理方法及设备
CN113556545B (zh) 图像处理方法及图像处理电路
Sandberg et al. Model-based video coding using colour and depth cameras
CN103997653A (zh) 一种基于边缘的面向虚拟视绘制的深度视频的编码方法
Beling et al. ERP-based CTU splitting early termination for intra prediction of 360 videos
CN103957422A (zh) 一种基于边缘的面向虚拟视绘制的深度视频的编码方法
CN116711301A (zh) 虚拟视点生成、渲染、解码方法及装置、设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant