CN107666560A - 一种视频去隔行方法及装置 - Google Patents

一种视频去隔行方法及装置 Download PDF

Info

Publication number
CN107666560A
CN107666560A CN201610615875.1A CN201610615875A CN107666560A CN 107666560 A CN107666560 A CN 107666560A CN 201610615875 A CN201610615875 A CN 201610615875A CN 107666560 A CN107666560 A CN 107666560A
Authority
CN
China
Prior art keywords
pixel
video
frame
region
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610615875.1A
Other languages
English (en)
Other versions
CN107666560B (zh
Inventor
马晓
杨星亮
郭耀松
张天若
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumavision Technologies Co Ltd
Original Assignee
Sumavision Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumavision Technologies Co Ltd filed Critical Sumavision Technologies Co Ltd
Priority to CN201610615875.1A priority Critical patent/CN107666560B/zh
Publication of CN107666560A publication Critical patent/CN107666560A/zh
Application granted granted Critical
Publication of CN107666560B publication Critical patent/CN107666560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • H04N7/012Conversion between an interlaced and a progressive signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/0142Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes the interpolation being edge adaptive

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Graphics (AREA)
  • Television Systems (AREA)

Abstract

本发明公开了一种视频去隔行方法及装置,用以解决现有技术在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题。所述视频去隔行方法,包括:逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。

Description

一种视频去隔行方法及装置
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频去隔行方法及装置。
背景技术
去隔行技术是将隔行扫描视频处理为能够在非电视终端播放的一种视频格式转换技术。电视视频信号按隔行扫描的方式采集并发送,该方式将视频帧拆成奇偶两场。电视或机顶盒接收时,会对两场依次进行处理后显示,每幅视频画面其实是拆出来的一场图像。而在非电视终端(如液晶、等离子等数字视频显示器)接收时,由于按图像帧进行处理和显示,画面会出现由场效应引起的各种问题如,闪烁、锯齿、羽化等。去隔行技术的目的就是要消除两场间的场效应横纹及画面闪烁,从而增强画面清晰度,提高观看者的主观感受。
现已提出多种去隔行技术,如:
(1)不区分运动情况的方法包括:空域、时域滤波、时空滤波及非线性滤波,这些方法实现简单,资源占用少,但是对运动和非运动情况的适应性差,存在静态物体变形,运动物体拖影等质量问题。
(2)考虑区分运动情况的算法包括:运动补偿方法及非运动补偿的自适应方法。基于运动补偿的方法通过运动搜索,匹配运动中的物体在多个场中的位置。这种方法中运动搜索的计算量太大,在高清视频发展迅速的时代,远不能满足视频编码器的实用需求,且运动搜索结果准确度不佳时会产生严重的质量问题。
现有的去隔行技术将图像按整体进行处理,对实际电视节目中存在的如静态贴图,滚动字幕等场景未加区分。用普通的自适应方法对这些特殊场景进行处理时,运动判定的不精确及插值的低通性,会导致场景区域处理质量达不到应用需求。
静态贴图以CCTV的台标为例进行说明,该类台标为半透明图片,其像素会受背景像素的影响。当背景中存在运动物体时,普通的运动自适应算法会将半透明台标判定为运动区域,从而用运动区域的方法来处理。现有方法在处理运动区域时,只对一场进行处理,场信息的丢失导致静态台标的边缘及文字会由于信息丢失而出现变形及闪烁。
滚动字幕是一种在电视节目中常见且很重要的内容。场效应导致的问题包括,字体横纹、锯齿及闪烁。当使用普通插值算法处理时,算法的低通效果会导致字体模糊,对比度下降,甚至当出现一些复杂字体的时候,会导致字体笔画丢失。当使用边缘保护的非线性方法处理时,由于字体包含大量边界及角点,不精确的边缘方向判定会导致字体变形及引入噪点。
发明内容
本发明提供了一种视频去隔行方法及装置,在对隔行视频处理前,先对视频中存在的各种应用场景做判定分析,针对不同场景运用相应的去隔行方法,用以解决现有技术在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题。
本发明实施例提供了一种视频去隔行方法,包括:
逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;
针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
本发明实施例提供了一种视频去隔行装置,包括:
识别单元,用于逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;
处理单元,用于针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
本发明的有益效果包括:
本发明实施例提供的视频去隔行方法及装置中,对视频进行分场景去隔行处理,具体为,逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域,针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域,从而解决了现有技术中在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1a为逐行扫描示意图;
图1b为隔行扫描示意图;
图2为本发明实施例中,视频去隔行方法的实施流程示意图;
图3a为本发明实施例中,视频去隔行方法的整体流程示意图;
图3b为本发明实施例中,静态区域的确定流程示意图;
图3c为本发明实施例中,静态像素判断流程示意图;
图4为本发明实施例中,静态区域判断流程示意图;
图5a为本发明实施例中,滚动字幕区域的确定流程示意图;
图5b为本发明实施例中,滚动字幕区域判断流程示意图;
图6为本发明实施例中,滚动字幕区域处理流程示意图;
图7为本发明实施例中,视频去隔行装置的结构示意图。
具体实施方式
为了解决现有技术中在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题,本发明提供了一种视频去隔行方法及装置。
本发明实施例提供的视频去隔行方法的实现原理是:逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域,针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。根据本发明实施例提供的视频去隔行方法,对视频进行分场景去隔行处理,解决了现有技术中在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
首先,对视频扫描格式进行简单介绍,参考图1a和图1b,分别为逐行扫描示意图和隔行扫描示意图。传统电视采用隔行扫描方式,其原理是将一帧图像分为两场扫描,第一场扫1、3、5……行(奇数行),称为奇数场,第二场扫2、4、6……行(偶数行),称为偶数场。奇数场和偶数场组合起来,就构成一幅完整的图像,这种扫描方式,通常叫隔行扫描。隔行扫描规定第一场结束时扫描到最后一行的中间,第二场时无论电子束如何折回,必须回到显示屏顶部的中间位置,这样可以保证相邻的第二场扫描恰好衔接在第一场各扫描线的中间,因此,隔行扫描中要求视频帧总的行数必须是奇数,如PAL制(PhaseAlteration Line,帕尔制)的扫描线为625行。传统的隔行扫描方式下,场频接近人眼对闪烁的敏感频率,在观看大面积浅色背景画面时会感到明显闪烁;隔行扫描奇偶轮回导致明显的扫描线间闪烁,在观看文字信息时尤为明显;隔行扫描奇偶轮回还导致画面呈现明显的、排列整齐的行结构线,且屏幕尺寸越大,行结构线越明显,影响画面细节的体现和总体画面效果。而逐行扫描时,电子束是从显示屏的首行首像素一行行的首位衔接扫到尾行尾像素,逐行扫描在显示屏上扫描一遍即可显示一幅完整的视频图像,观看电视时,扫描线几乎不可见,垂直分辨率较隔行扫描提高了一倍,完全克服了大面积的闪烁的隔行扫描行固有的缺点,使图像更为细腻、稳定,在大屏幕电视上观看时效果尤佳,即便是长时间近距离观看眼睛也不易疲劳。去隔行就是把隔行视频转换为逐行视频,这是一个数据量加倍而信息量不变的过程。如图2所示,其为本发明实施例提供的视频去隔行方法的实施流程示意图,可以包括以下步骤:
S21、逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域。
具体实施时,以帧为单位读取输入的视频流,对输入的视频流进行分析,分别识别读取的视频帧中的静态区域和滚动字幕区域。对于静态区域和滚动字幕区域的判定过程将在后文中详细阐述。
S22、针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
本步骤中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域,即运动区域。具体实施时,将视频帧分为以上三个不同的场景分别运用相应的方法进行去隔行处理。
为了更好的理解本发明实施例,以下针对视频去隔行方法流程进行说明。
如图3a所示,其为本实施例视频去隔行方法的整体流程示意图,可以包括以下步骤:
S31、静态像素分析及静态区域分析。
静态区域的特点是,在整个视频流中,每一帧对应位置的像素变化不大,在一个小范围内浮动,本步骤中,根据这一特性设计判断条件来判定某个像素是否属于静态像素,由这些静态像素组成的区域判定为静态区域。
S32、滚动字幕区域分析。
滚动字幕区域的特点是,在视频流的时间轴上,每一行像素的和的大小变化不大,在一个较小的范围内浮动,本步骤中,根据这一特性,设计判断条件来判定某一行是否属于滚动字幕区域。
S33、场效应级别计算及运动区域分析。
本步骤中,运动区域为除了静态区域和滚动字幕区域以外的区域,场效应级别是用来判断运动状态的参数,通过分别计算场差和帧差来计算场效应级别。
S34、判断是否为滚动字幕区域,如果是,则执行步骤S38,否则,执行步骤S35。
S35、判断是否为静态区域,如果是,则执行步骤S36,否则,执行步骤S37。
S36、空域插值去隔行。
本步骤中,当视频帧为静态区域时,利用空域插值去隔行方法对该静态区域进行处理。
S37、时空边缘保护去隔行。
本步骤中,当视频帧为运动区域时,利用时空边缘保护去隔行方法对该运动区域进行处理。具体实施时,时空边缘保护去隔行方法为修正的ELA算法。
S38、时空运动补偿去隔行。
本步骤中,当视频帧为滚动字幕区域时,利用时空运动补偿去隔行方法对该滚动字幕区域进行处理。
在本实施例视频去隔行方法的实施流程示意图中,可以包括如下两部分:(1)分析流程,包括步骤S31-S33;(2)处理流程,包括步骤S34-S38。
其中,分析流程主要用于在进行隔行处理前对视频流进行分析,判定其中的静态区域、滚动字幕区域及运动区域;处理流程对判定出的以上三种区域场景分别运用不同的方法进行处理,即:利用空域插值去隔行方法对静态区域进行去隔行处理,利用时空运动补偿去隔行方法对滚动字幕区域进行去隔行处理,以及利用修正的时空边缘保护去隔行ELA方法对运动区域进行去隔行处理。
其中,步骤S31中,可以按照图3b所示的流程识别读取的视频帧中的静态区域:
S311、针对读取的、除第一帧视频以外的视频帧按像素遍历,并确定该视频帧中的静态像素。
S312、如果连续N帧视频中相同位置的像素均为静态像素,则确定静态像素组成的区域为静态区域,其中,N为第一预设值。
具体的,针对读取的视频帧中的每一像素,步骤S311中可以按照图3c所示的流程判断该像素是否为静态像素:
S3111、确定第一帧视频中的像素点作为基准参考像素。
S3112、针对除第一帧视频以外的视频帧中的任一像素,确定该像素与第一帧视频中相同位置的基准参考像素的第一差值;
本步骤中,计算该像素的像素值与第一帧视频中相同位置像素(即基准参考像素)的像素值作为第一差值。
S3113、确定该像素与前一帧视频中相同位置的像素的第二差值。
S3114、如果所述第一差值的绝对值和第二差值的绝对值均不大于第二预设值,则确定该像素为静态像素。
根据图3b和图3c所示的流程,本发明实施例中,可以按照图4所示的流程识别读取的视频帧中的静态区域,包括以下步骤:
S41、读取第一帧视频图像,记录为基准参考像素。
本步骤中,将读取的第一帧视频中的每一像素点作为该像素点所在位置的基准参考像素,需要说明的是,步骤S41中需要记录第一帧视频中基准参考像素的像素位置及该位置对应的像素值。
S42、读取下一帧视频图像。
S43、依序遍历下一未遍历的像素。
本步骤中,即按像素遍历除第一帧以外的视频帧,具体的,可以从读取的视频帧的第一个像素开始获取当前读取的视频帧中的像素。
S44、判断该像素是否为静态像素,如果是,则执行步骤S45,否则执行步骤S46。
本步骤中,首先确定该像素的像素值与第一帧视频中相同位置的基准参考像素的像素值的差为第一差值,以及确定该像素的像素值与前一帧视频中相同位置像素的像素值的差为第二差值,然后设定判断条件1:第一差值的绝对值不大于第二预设值,以及判断条件2:第二差值的绝对值不大于第二预设值。其中第二预设值即阈值,是根据实验所得经验值。当同时满足判断条件1和2时,则读入的像素为静态像素。
需要说明的是,对于第二帧视频图像来说,第一差值和第二差值应相同,因此,具体实施时,也可以仅判断其是否满足以上任一判断条件即可。
S45、将该像素对应的计数器加1,并执行步骤S47。
S46、将该像素对应的计数器清零,更新该像素位置对应的基准参考像素,并执行步骤S47。
如果不满足步骤S44中判断条件1和2中的任何一个,则认为读入的像素为非静态像素,将静态标志计数器清零,并将该像素作为基准参考像素,具体的,可以根据该像素所在位置更新相应位置的像素值,即将相应位置的像素值更新为该像素的像素值。
S47、判断是否遍历完成当前帧视频图像,如果是,执行步骤S48,否则,执行步骤S43。
S48、判断该视频帧中每一静态像素对应的计数器是否均大于第一预设值,如果是,则执行步骤S49,否则执行步骤S42。
读入若干帧视频帧后,将静态标志计数器与第一预设值(即N)比较,当静态标志计数器的值大于N时,则输出静态区域,确定静态像素组成的区域为静态区域。其中,N可以为根据实验所得的经验值。
S49、输出识别出的静态区域。
本步骤中,将连续N帧中识别出的所有静态像素组成的区域作为视频帧中的静态区域。
具体实施时,由于滚动字幕区域的特点是,在视频流的时间轴上,每一行像素和的大小变化不大,在一个较小的范围内浮动。根据这些特点,本发明实施例中设计了判断条件3来判定某一行是否属于滚动字幕区域。初始时,设置视频帧每一行对应的行像素和为零,后续随着读取的视频帧的变化,利用读取的当前帧中每一行对应的行像素和持续进行更新。
基于此,具体实施时,本发明实施例中可以按照图5a所示的流程识别读取的视频帧中的滚动字幕区域:
S501、确定读取的视频帧中的滚动行像素。
S502、如果连续M帧相同位置的行像素均为滚动行像素,则确定滚动行像素组成的区域为滚动字幕区域。
其中,M为第三预设值。
本步骤中,按照时间顺序依序读取视频帧,针对读取的连续M帧视频图像中相同行像素的行像素和的差值在预设范围内,则确定该行像素为滚动行像素。例如,按照时间顺序读取的连续M帧视频图像中的第5行像素,如果任意相邻两帧视频图像的行像素和之间的差值均在预设范围内,假设M=4,则需要判断第2帧与第1帧,第3帧与第2帧,第4帧与第3帧中第5行像素的像素和的差值是否在预设范围内,如果是,则确定第5行像素为滚动行像素。
较佳地,针对读取的视频帧中的任一行像素,如果该行像素的行像素和与参考行像素和上的差值绝对值不大于第四预设值,则确定当前行像素为滚动行像素,其中,所述参考行像素和为与当前读取的视频帧相邻的、上一帧视频中相同位置行像素的行像素和。需要说明的是,初始时,预先设置每一行像素对应的行像素和为零,即读取第一帧视频图像时,每一行对应的参考行像素和为0,之后读取的每一帧图像中每一行对应的参考行像素和为相邻的、上一帧视频图像中相同位置行像素的行像素和,即第二帧视频图像中的每一行像素对应的参考行像素和为第一帧视频图像中相同行的行像素和,第三帧视频图像中的每一行像素对应的参考行像素和为第二帧视频图像中相同行的行像素和,以此类推。例如,第二帧视频图像中的第5行像素对应的参考行像素和为第一帧视频图像中第5行像素的像素和,第三帧视频图像中的第5行像素对应的参考行像素和为第二帧视频图像中第5行像素的像素和。
基于此,本发明实施例中,可以按照图5b所示的流程识别读取的视频帧中的滚动字幕区域,可以包括以下步骤:
S51、初始化每一行像素对应的行像素和为0。
S52、读取下一视频帧。
具体的,按照时间从第一帧图像开始依序读取视频帧。
S53、计算当前行的行像素和。
本步骤中,从第一行开始按像素遍历读取的视频帧,每遍历一个像素,计算当前行像素的行像素和,即将当前像素的像素值累加至当前行像素和中。
S54、判断是否到达行尾,如果是,则执行步骤S55,否则执行步骤S53。
本步骤中,判断是否到达当前行的行尾,如果没有到达行尾,返回执行步骤S53,如果到达行尾,继续执行步骤S55。
S55、判断当前行的行像素和是否符合判断条件3,如果是,则执行步骤S56,否则执行步骤S57。
具体实施时,根据滚动字幕区域的特点,设计判断条件3,具体为:当前行像素和与当前行像素对应的参考行像素和的差值绝对值小于第四预设值。其中,第四预设值为阈值,可以是实验所得经验值。
S56、将当前行像素对应的计数器加1,并执行步骤S58。
本步骤中,当像素到达行尾后,执行判断条件3,如果符合判断条件,则当前行像素对应的计数器加1。
S57、将当前行像素对应的计数器清零,并执行步骤S58。
本步骤中,当像素到达行尾和,执行判断条件3,如果不符合判断条件,即当前行像素和与参考行像素和的差值绝对值大于第四预设值,将该行像素对应的计数器清零。
S58、更新该行像素对应的参考行像素和。
S59、判断是否遍历完成读取的视频帧,如果是,执行步骤S511,如果否,执行步骤S510。
S510、开始遍历读取的视频帧中的下一行像素,并执行步骤S53。
S511、判断读取的视频帧中每一行像素对应的计数器是否大于第三预设值,如果是,则执行步骤S512,否则执行步骤S52。
S512、输出滚动字幕区域。
具体实施时,读入若干帧帧视频帧后,针对每一行像素,将该行像素对应的计数器与第三预设值(即M)比较,当计数器的值大于M时,则输出确定出的滚动行像素组成的区域作为滚动字幕区域。
至此,静态区域和滚动字幕区域判断完成,则除了静态区域和滚动字幕区域以外的区域即为运动区域。对这三种区域场景分别利用空域插值去隔行方法、时空运动补偿去隔行方法以及修正的时空边缘保护去隔行ELA方法进行去隔行处理。
如图6所示,其为本发明实施例中滚动字幕区域处理流程示意图,可以包括以下步骤:
S61、判断是否为顶场,如果是,则执行步骤S62,否则执行步骤S63。
具体实施时,对于隔行扫描,每一帧一般有2个场(field),一个叫顶场(topfield),一个叫底场(bottom field)。假设一帧图像是720行,那么,顶场就包含其中所有的偶数行,而底场则包含其中所有的奇数行。
S62、输出当前值。
首先判断是否为顶场,如果是顶场则输出当前值,不对其进行处理。
S63、底场平移匹配。
本步骤中,当判断结果不是顶场时即是底场,对底场进行平移匹配。
S64、判断是否为最优平移距离,如果是,则执行步骤S65,否则执行步骤S63。
本步骤中,根据滚动字幕的滚动速度在一定的搜索范围内按字幕的滚动方向平移当前像素,计算平移后像素和下一帧对应的当前位置像素的差的绝对值,找到差最小的平移距离作为最佳补偿距离。
S65、根据最优距离平移。
补偿时,按照最佳平移距离对底场的像素整体平移,作为处理结果。
S66、匹配结果检查。
对匹配的结果进行检查。
S67、判断补偿是否有效,如果是,则直接输出处理结果,否则执行步骤S68。
本步骤中,要对按照最佳平移距离对底场的像素整体平移后的补偿处理结果进行场效应强度的分析,如果补偿有效,则直接输出处理结果。
S68、插值滤波。
如果平移后场效应反而增强,说明补偿不准确或该像素点不需要补偿,则用普通的插值滤波方法进行处理。
如果当前像素不属于滚动字幕区域,则判断并进行静态区域处理。在静态区域时,利用空域插值去隔行方法处理。
对于除滚动字幕区域和静态区域以外的运动区域,可以利用时空边缘保护去隔行方法对进行处理,例如使用ELA(边沿的线平均算法,Edge-based Line Average)算法对运动区域进行处理。为了提高处理精度,本发明实施例中对现有的ELA算法进行了修正。具体的,在基本ELA算法中,加入横向边界判定条件,针对确定出的每个修正方向,在插值处理前,增加主导方向判断条件,其中,横向边界判定条件如下:用与保护方向的上下行对应像素的差的绝对值和预设阈值比较,如果在预设范围内,则判定其满足判断条件。主导方向判断条件如下:用欲保护方向和该方向相反方向的上下行的距离差和预设阈值比较,如果在预设阈值范围内,则判定符合判断条件,针对符合上述两个判断条件的修正方向进行插值处理。修正后的ELA算法减少了原ELA算法在细边界及角点处的噪点,优化了横向边缘的处理质量。进行边缘保护后,参考前后帧对应位置的附近8邻域像素,结合中值算法的思想,对插值结果进行修正。
需要说明的是,本发明实施例中涉及的静态区域是相对运动区域和滚动字幕区域而言的。
本发明实施例提供的视频去隔行方法,对视频进行分场景去隔行处理,逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域,针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域,从而解决了现有技术中在对不同应用场景不加区分地进行去隔行处理时导致输出的视频质量变差的问题。
基于同一发明构思,本发明实施例中提供了视频去隔行装置,由于上述装置解决问题的原理与视频去隔行方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,其为本发明实施例提供的视频去隔行装置的结构示意图,可以包括:
识别单元71,用于逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;
处理单元72,用于针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
所述识别单元71包括:
第一确定子单元,用于针对读取的、除第一帧视频以外的视频帧按像素遍历,并确定该视频帧中的静态像素;
第二确定子单元,用于当连续N帧视频中相同位置的像素均为静态像素时,确定静态像素组成的区域为静态区域,其中,N为第一预设值。
所述第一确定子单元包括:
第一确定模块,用于确定第一帧视频中的像素点作为基准参考像素;
第二确定模块,用于针对除第一帧视频以外的视频帧中的任一像素,确定该像素与第一帧视频中相同位置的基准参考像素的第一差值;
第三确定模块,用于确定该像素与前一帧视频中相同位置的像素的第二差值;
第四确定模块,用于当所述第一差值的绝对值和所述第二差值的绝对值均不大于第二预设值时,确定该像素为静态像素。
较佳地,所述第一确定子单元还可以包括:
第一更新模块,用于针对除第一帧视频以外的视频帧中的任一像素,当所述第一差值的绝对值或者第二差值的绝对值大于所述第二预设值时,利用该像素更新相同位置的基准参考像素。
较佳地,所述识别单元,还可以包括:
第三确定子单元,用于确定读取的视频帧中的滚动行像素;
第四确定子单元,用于当连续M帧相同位置的行像素均为滚动行像素时,确定滚动行像素组成的区域为滚动字幕区域,M为第三预设值。
所述第三确定子单元,具体用于针对读取的视频帧中的任一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值不大于第四预设值,则确定当前行像素为滚动行像素,其中,该行像素对应的参考行像素和为与当前读取的视频帧相邻的、上一帧视频中相同位置行像素的行像素和。
较佳地,所述第三确定子单元,还针对读取的视频帧中的每一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值大于第四预设值,则置M为零。
较佳地,所述处理单元72包括:
第一处理子单元,用于利用空域插值去隔行方法对所述静态区域进行去隔行处理;
第二处理子单元,用于利用时空运动补偿去隔行方法对所述滚动字幕区域进行去隔行处理;
第三处理子单元,用于利用修正的时空边缘保护去隔行ELA方法对所述运动区域进行去隔行处理。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种视频去隔行方法,其特征在于,包括:
逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;
针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
2.如权利要求1所述的方法,其特征在于,按照以下方法识别读取的视频帧中的静态区域:
针对读取的、除第一帧视频以外的视频帧按像素遍历,并确定该视频帧中的静态像素;
如果连续N帧视频中相同位置的像素均为静态像素,则确定静态像素组成的区域为静态区域,其中,N为第一预设值。
3.如权利要求2所述的方法,其特征在于,针对读取的视频帧中的每一像素,按照以下流程判断该像素是否为静态像素:
确定第一帧视频中的像素点作为基准参考像素;
针对除第一帧视频以外的视频帧中的任一像素,确定该像素与第一帧视频中相同位置的基准参考像素的第一差值;以及
确定该像素与前一帧视频中相同位置的像素的第二差值;
如果所述第一差值的绝对值和第二差值的绝对值均不大于第二预设值,则确定该像素为静态像素。
4.如权利要求3所述的方法,其特征在于,还包括:
针对除第一帧视频以外的视频帧中的任一像素,如果所述第一差值的绝对值或者第二差值的绝对值大于所述第二预设值,则利用该像素更新相同位置的基准参考像素。
5.如权利要求1所述的方法,其特征在于,按照以下方法识别读取的视频帧中的滚动字幕区域:
确定读取的视频帧中的滚动行像素;
如果连续M帧相同位置的行像素均为滚动行像素,则确定滚动行像素组成的区域为滚动字幕区域,M为第三预设值。
6.如权利要求5所述的方法,其特征在于,针对读取的视频帧中的任一行像素,按照以下方法判断该行像素是否为滚动行像素:
针对读取的视频帧中的任一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值不大于第四预设值,则确定当前行像素为滚动行像素,其中,该行像素对应的参考行像素和为与当前读取的视频帧相邻的、上一帧视频中相同位置行像素的行像素和。
7.如权利要求6所述的方法,其特征在于,还包括:
针对读取的视频帧中的每一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值大于第四预设值,则置M为零。
8.如权利要求1所述的方法,其特征在于,针对识别出的滚动区域、静态区域以及运动区域分别进行去隔行处理,具体包括:
利用空域插值去隔行方法对所述静态区域进行去隔行处理;
利用时空运动补偿去隔行方法对所述滚动字幕区域进行去隔行处理;
利用修正的时空边缘保护去隔行ELA方法对所述运动区域进行去隔行处理。
9.一种视频去隔行装置,其特征在于,包括:
识别单元,用于逐帧读取输入的视频流中包含的视频帧,分别识别读取的视频帧中的静态区域和滚动字幕区域;
处理单元,用于针对识别出的静态区域、滚动字幕区域和运动区域分别进行去隔行处理,其中,所述运动区域包括视频帧中除静态区域和滚动字幕区域以外的区域。
10.如权利要求9所述的装置,其特征在于,所述识别单元,包括:
第一确定子单元,用于针对读取的、除第一帧视频以外的视频帧按像素遍历,并确定该视频帧中的静态像素;
第二确定子单元,用于当连续N帧视频中相同位置的像素均为静态像素时,确定静态像素组成的区域为静态区域,其中,N为第一预设值。
11.如权利要求10所述的装置,其特征在于,所述第一确定子单元,包括:
第一确定模块,用于确定第一帧视频中的像素点作为基准参考像素;
第二确定模块,用于针对除第一帧视频以外的视频帧中的任一像素,确定该像素与第一帧视频中相同位置的基准参考像素的第一差值;
第三确定模块,用于确定该像素与前一帧视频中相同位置的像素的第二差值;
第四确定模块,用于当所述第一差值的绝对值和所述第二差值的绝对值均不大于第二预设值时,确定该像素为静态像素。
12.如权利要求11所述的装置,其特征在于,所述第一确定子单元,还包括:
更新模块,用于针对除第一帧视频以外的视频帧中的任一像素,当所述第一差值的绝对值或者第二差值的绝对值大于所述第二预设值时,利用该像素更新相同位置的基准参考像素。
13.如权利要求9所述的装置,其特征在于,所述识别单元,包括:
第三确定子单元,用于确定读取的视频帧中的滚动行像素;
第四确定子单元,用于当连续M帧相同位置的行像素均为滚动行像素时,确定滚动行像素组成的区域为滚动字幕区域,M为第三预设值。
14.如权利要求13所述的装置,其特征在于,
所述第三确定子单元,具体用于针对读取的视频帧中的任一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值不大于第四预设值,则确定当前行像素为滚动行像素,其中,该行像素对应的参考行像素和为与当前读取的视频帧相邻的、上一帧视频中相同位置行像素的行像素和。
15.如权利要求14所述的装置,其特征在于,
所述第三确定子单元,还针对读取的视频帧中的每一行像素,如果该行像素的行像素和与该行像素对应的参考行像素和的差值绝对值大于第四预设值,则置M为零。
16.如权利要求9所述的装置,其特征在于,所述处理单元包括:
第一处理子单元,用于利用空域插值去隔行方法对所述静态区域进行去隔行处理;
第二处理子单元,用于利用时空运动补偿去隔行方法对所述滚动字幕区域进行去隔行处理;
第三处理子单元,用于利用修正的时空边缘保护去隔行ELA方法对所述运动区域进行去隔行处理。
CN201610615875.1A 2016-07-28 2016-07-28 一种视频去隔行方法及装置 Active CN107666560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610615875.1A CN107666560B (zh) 2016-07-28 2016-07-28 一种视频去隔行方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610615875.1A CN107666560B (zh) 2016-07-28 2016-07-28 一种视频去隔行方法及装置

Publications (2)

Publication Number Publication Date
CN107666560A true CN107666560A (zh) 2018-02-06
CN107666560B CN107666560B (zh) 2020-11-17

Family

ID=61115812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610615875.1A Active CN107666560B (zh) 2016-07-28 2016-07-28 一种视频去隔行方法及装置

Country Status (1)

Country Link
CN (1) CN107666560B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107414A (zh) * 2018-10-25 2020-05-05 中国电信股份有限公司 视频处理方法和装置
CN113727176A (zh) * 2021-08-30 2021-11-30 杭州国芯科技股份有限公司 一种视频运动字幕检测方法
EP3944189A1 (en) * 2020-07-21 2022-01-26 Amlogic (Shanghai) Co., Ltd. Method and apparatus for processing image, electronic device, and storage medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043609A (zh) * 2006-03-24 2007-09-26 株式会社东芝 字幕检测设备、字幕检测方法、及降频信号检测设备
CN101309385A (zh) * 2008-07-09 2008-11-19 北京航空航天大学 一种基于运动检测的去隔行处理方法
CN101588444A (zh) * 2008-05-20 2009-11-25 华为技术有限公司 视频数据的去隔行方法、去隔行装置及视频处理系统
CN102572289A (zh) * 2011-08-02 2012-07-11 上海高清数字科技产业有限公司 电影模式的检测及处理方法和装置
US20140321555A1 (en) * 2013-04-15 2014-10-30 Luca Rossato Hybrid backward-compatible signal encoding and decoding
CN104244073A (zh) * 2014-09-26 2014-12-24 北京大学 一种视频中滚动字幕的自动检测和识别方法
CN105282397A (zh) * 2014-07-22 2016-01-27 北京数码视讯科技股份有限公司 运动字幕的去隔行方法及装置
CN105282475A (zh) * 2014-06-27 2016-01-27 澜起科技(上海)有限公司 移动字幕检测与补偿方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043609A (zh) * 2006-03-24 2007-09-26 株式会社东芝 字幕检测设备、字幕检测方法、及降频信号检测设备
CN101588444A (zh) * 2008-05-20 2009-11-25 华为技术有限公司 视频数据的去隔行方法、去隔行装置及视频处理系统
CN101309385A (zh) * 2008-07-09 2008-11-19 北京航空航天大学 一种基于运动检测的去隔行处理方法
CN102572289A (zh) * 2011-08-02 2012-07-11 上海高清数字科技产业有限公司 电影模式的检测及处理方法和装置
US20140321555A1 (en) * 2013-04-15 2014-10-30 Luca Rossato Hybrid backward-compatible signal encoding and decoding
CN105282475A (zh) * 2014-06-27 2016-01-27 澜起科技(上海)有限公司 移动字幕检测与补偿方法及系统
CN105282397A (zh) * 2014-07-22 2016-01-27 北京数码视讯科技股份有限公司 运动字幕的去隔行方法及装置
CN104244073A (zh) * 2014-09-26 2014-12-24 北京大学 一种视频中滚动字幕的自动检测和识别方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107414A (zh) * 2018-10-25 2020-05-05 中国电信股份有限公司 视频处理方法和装置
EP3944189A1 (en) * 2020-07-21 2022-01-26 Amlogic (Shanghai) Co., Ltd. Method and apparatus for processing image, electronic device, and storage medium
CN113727176A (zh) * 2021-08-30 2021-11-30 杭州国芯科技股份有限公司 一种视频运动字幕检测方法
CN113727176B (zh) * 2021-08-30 2023-05-16 杭州国芯科技股份有限公司 一种视频运动字幕检测方法

Also Published As

Publication number Publication date
CN107666560B (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN102394051B (zh) 图像显示装置及方法
US8654181B2 (en) Methods for detecting, visualizing, and correcting the perceived depth of a multicamera image sequence
US8144255B2 (en) Still subtitle detection apparatus and image processing method therefor
JP4843753B2 (ja) 三次元画像生成方法及び装置
CN101237553B (zh) 确定插值方法的程序、装置及方法
CN104735521B (zh) 一种滚动字幕检测方法及装置
CN107580186B (zh) 一种基于缝合线时空优化的双摄像机全景视频拼接方法
KR20090006068A (ko) 동영상 시퀀스를 수정하는 방법 및 그 장치
JP6715864B2 (ja) 画像に対する深度マップを決定するための方法及び装置
US20070097261A1 (en) Region or frame based aspect ratio scaling
US20140320534A1 (en) Image processing apparatus, and image processing method
CN107666560A (zh) 一种视频去隔行方法及装置
CN106464865A (zh) 用于视频处理的基于块的静态区域检测
CN114302226B (zh) 一种视频画幅智能裁剪方法
CN111722891B (zh) 显示方法、装置、计算机可读存储介质和计算机设备
CN108270945A (zh) 一种运动补偿去噪方法及装置
CN107026998B (zh) 一种去隔行方法及设备
EP4165874A1 (en) Producing and adapting video images for presentation on displays with different aspect ratios
US9807339B2 (en) Frame rate conversion system
US20070008342A1 (en) Segmentation refinement
JP5566196B2 (ja) 画像処理装置及びその制御方法
Lin et al. A stereoscopic video conversion scheme based on spatio-temporal analysis of MPEG videos
US9544613B2 (en) Local detection model (LDM) for recursive motion estimation
KR101629414B1 (ko) 휴먼 팩터에 기초한 스테레오스코픽 이미지 추출 방법 및 장치
US10674207B1 (en) Dynamic media placement in video feed

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant