CN109635777B - 一种视频数据编辑识别方法及装置 - Google Patents
一种视频数据编辑识别方法及装置 Download PDFInfo
- Publication number
- CN109635777B CN109635777B CN201811585508.7A CN201811585508A CN109635777B CN 109635777 B CN109635777 B CN 109635777B CN 201811585508 A CN201811585508 A CN 201811585508A CN 109635777 B CN109635777 B CN 109635777B
- Authority
- CN
- China
- Prior art keywords
- change target
- video
- target
- frame
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Abstract
本发明公开了一种视频数据编辑识别方法及装置,通过读取待识别视频并进行帧间差分获取视频帧图像中的变化目标并建立模型,计算变化目标模型和初始帧目标模型的相似度,根据相似度寻找最优的变化目标匹配区域,根据变化目标匹配区域计算变化目标位置向量判断视频数据是否被编辑,即视频为原始视频还是被视频剪辑软件处理编辑过的视频,能够判定视频数据是否被编辑过还是原视频,即为原始视频是否是被视频剪辑软件处理编辑过的视频,识别效果稳定,成功率高,算法在识别系统中的负载很小,系统开销小,流程简单,比较适合应用于各种小功率的嵌入式设备或移动设备中,也能够应用与普通计算机中,应用面广泛。
Description
技术领域
本公开涉及计算机视频处理技术领域,具体涉及一种视频数据编辑识别方法及装置。
背景技术
目前,计算机视频处理技术越来越发达,经过视频剪辑软件处理过后越来越难以辨识是否是原视频,目前一般是通过凭借人工辨识,根据反射、光影、色彩等判断是否经过Windows Movie Maker、Adobe Premiere、Pinnacle Studio、Pinnacle Edition、会声会影、Apple iMovie等视频剪辑软件编辑修改拼接处理过,人工辨识的误检率很高,尤其是在经过一些视频优化拼接算法处理过后的原视频,反射、光影、色彩、对比度,饱和度,色温,亮度在视频拼接处视频帧经过平滑的过渡,人工识别的成功率极低,尤其是视频经过在网络传输、运算、存储等环节中要借助计算机对视频进行编码、压缩、解码等常规性的操作,更加难以识别是否是编辑的视频还是原视频。
发明内容
本公开提供一种视频数据编辑识别方法及装置,通过读取待识别视频并进行帧间差分获取视频帧图像中的变化目标并建立模型,计算变化目标模型和初始帧目标模型的相似度,根据相似度寻找最优的变化目标匹配区域,根据变化目标匹配区域计算变化目标位置向量判断视频数据是否被编辑,即视频为原始视频还是被视频剪辑软件处理编辑过的视频。
为了实现上述目的,根据本公开的一方面,提供一种视频数据编辑识别方法,所述方法包括以下步骤:
步骤1,读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
步骤2,建立变化目标模型和初始帧目标模型;
步骤3,计算变化目标模型和初始帧目标模型的相似度;
步骤4,根据相似度寻找最优的变化目标匹配区域;
步骤5,根据变化目标匹配区域计算变化目标位置向量判断是否被编辑。
进一步地,在步骤1中,读取待识别视频并进行帧间差分获取视频帧图像中的变化目标的方法为:
步骤1.1,通过公式Dk(x,y)=|fk(x,y)-fk-1(x,y)|将待识别视频中视频帧的图像中的k-1时刻的图像fk-1(x,y)与k时刻的图像fk(x,y)进行差分,每个视频帧为一帧图像;
步骤1.2,将差分后的图像Dk根据公式进行二值化处理得到变化目标,当差分图像中某一像素点的差值Dk(x,y)大于或等于变化阈值T时,即Mk(x,y)=1,则判定该像素点为变化目标的像素点,即变化目标,否则判定其是背景点,待识别视频的视频格式为RMVB、AVI、WMV、MPG、MPEG、FLV、3GP格式中的任意一种格式,变化目标为待识别视频中视频帧的图像前一帧图像和后前一帧图像的变化的像素区间。
进一步地,在步骤2中,建立变化目标模型和初始帧目标模型的方法为:
令变化目标所在视频帧的图像中心为x0,{xi}i=1...n表示变化目标所在视频帧的图像共n个像素,m为变化目标所在视频帧的图像总数,则建立变化目标模型为:
式中:映射函数是将目标归一化为单位圆,映射函数在消除大小不同的目标计算时的影响时给图像中心的像素一个大小为的权值,不断以步长为1像素远离中心的像素也不断以步长为1像素递减权值,δ[b(xi)-u]为判断变化目标中像素的颜色值b(xi)是否隶属于第u个像素的函数,若是则值为1;不是则值为0,C为标准化系数,令有
令初始帧的中心位置为y,{xi}i=1...n表示初始帧的图像共n个像素,则初始帧目标模型为:
进一步地,在步骤3中,计算变化目标模型和初始帧目标模型的相似度的方法为:
进一步地,在步骤4中,根据相似度寻找最优的变化目标匹配区域的方法为:
首先在当前帧找寻找前一帧中变化目标中心的位置y0,作为当前帧的变化目标中心y,从变化目标中心点开始寻找最优的变化目标匹配区域,即通过公式
进一步地,在步骤5中,根据变化目标匹配区域计算变化目标位置向量判断是否被编辑的方法为:
其中:g(x)=-k'(x),mh,G(y)就是从y0到y的变化目标位置向量,当变化目标位置向量mh,G(y)<0,判定视频数据未被编辑,即为原始视频,当变化目标位置向量mh,G(y)>0,判定视频数据被编辑过。
本发明还提供了一种视频数据编辑识别装置,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
变化目标获取单元,用于读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
目标模型建立单元,用于建立变化目标模型和初始帧目标模型;
相似度计算单元,用于计算变化目标模型和初始帧目标模型的相似度;
匹配区域寻找单元,用于根据相似度寻找最优的变化目标匹配区域;
编辑判断单元,用于根据变化目标匹配区域计算变化目标位置向量判断是否被编辑。
本公开的有益效果为:本发明提供一种视频数据编辑识别方法及装置,能够判定视频数据是否被编辑过还是原视频,即为原始视频是否是被视频剪辑软件处理编辑过的视频,识别效果稳定,成功率高,算法在识别系统中的负载很小,系统开销小,流程简单,比较适合应用于各种小功率的嵌入式设备或移动设备中,也能够应用与普通计算机中,应用面广泛。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为一种视频数据编辑识别方法的流程图;
图2所示为一种视频数据编辑识别装置图。
具体实施方式
以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本公开的一种视频数据编辑识别方法的流程图,下面结合图1来阐述根据本公开的实施方式的一种视频数据编辑识别方法。
本公开提出一种视频数据编辑识别方法,具体包括以下步骤:
步骤1,读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
步骤2,建立变化目标模型和初始帧目标模型;
步骤3,计算变化目标模型和初始帧目标模型的相似度;
步骤4,根据相似度寻找最优的变化目标匹配区域;
步骤5,根据变化目标匹配区域计算变化目标位置向量判断是否被编辑。
进一步地,在步骤1中,读取待识别视频并进行帧间差分获取视频帧图像中的变化目标的方法为:
步骤1.1,通过公式Dk(x,y)=|fk(x,y)-fk-1(x,y)|将待识别视频中视频帧的图像中的k-1时刻的图像fk-1(x,y)与k时刻的图像fk(x,y)进行差分,每个视频帧为一帧图像;
步骤1.2,将差分后的图像Dk根据公式进行二值化处理得到变化目标,当差分图像中某一像素点的差值Dk(x,y)大于或等于变化阈值T时,即Mk(x,y)=1,则判定该像素点为变化目标的像素点,即变化目标,否则判定其是背景点,待识别视频的视频格式为RMVB、AVI、WMV、MPG、MPEG、FLV、3GP格式中的任意一种格式,变化目标为待识别视频中视频帧的图像前一帧图像和后前一帧图像的变化的像素区间。
进一步地,在步骤2中,建立变化目标模型和初始帧目标模型的方法为:
令变化目标所在视频帧的图像中心为x0,{xi}i=1...n表示变化目标所在视频帧的图像共n个像素,m为变化目标所在视频帧的图像总数,则建立变化目标模型为:
式中:映射函数是将目标归一化为单位圆,映射函数在消除大小不同的目标计算时的影响时给图像中心的像素一个大小为的权值,不断以步长为1像素远离中心的像素也不断以步长为1像素递减权值,δ[b(xi)-u]为判断变化目标中像素的颜色值b(xi)是否隶属于第u个像素的函数,若是则值为1;不是则值为0,C为标准化系数,令有
令初始帧的中心位置为y,{xi}i=1...n表示初始帧的图像共n个像素,则初始帧目标模型为:其中,δ[b(xi)-u]为判断初始帧的变化目标中像素的颜色值b(xi)是否隶属于第u个像素的函数,若是则值为1,不是则值为0,Ch为标准化系数,
进一步地,在步骤3中,计算变化目标模型和初始帧目标模型的相似度的方法为:
进一步地,在步骤4中,根据相似度寻找最优的变化目标匹配区域的方法为:
首先在当前帧找寻找前一帧中变化目标中心的位置y0,作为当前帧的变化目标中心y,从变化目标中心点开始寻找最优的变化目标匹配区域,即通过公式
进一步地,在步骤5中,根据变化目标匹配区域计算变化目标位置向量判断是否被编辑的方法为:
其中:g(x)=-k'(x),mh,G(y)就是从y0到y的变化目标位置向量,当变化目标位置向量mh,G(y)<0,判定视频数据未被编辑,即为原始视频,当变化目标位置向量mh,G(y)>0,判定视频数据被编辑过。
算法实现及结果分析:
本发明早测试环境为Intel英特尔i5六核CPU、内存4G、硬盘容量128G,操作系统Windows10的测试环境中,将本发明的实施例vc6.0为编程平台实现测试程序,在测试程序中分别导入分辨率为480×600、600×800、1024×768、1280×720的标准mpg格式视频进行测试,视频帧速率为30帧/秒,输入不同的480×600、600×800、1024×768、1280×720分辨率标准mpg格式视频的各100个进行识别测试,其中,每100个mpg格式视频中包含被视频剪辑软件处理过后过mpg格式视频有50个,测试结果如表1所示。
表1各mpg格式视频模拟实验结果
显然,标准mpg格式视频的分辨率越小消耗时间越少、识别成功率越高。
本公开的实施例提供的一种视频数据编辑识别装置,如图2所示为本公开的一种视频数据编辑识别装置图,该实施例的一种视频数据编辑识别装置包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种视频数据编辑识别装置实施例中的步骤。
所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
变化目标获取单元,用于读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
目标模型建立单元,用于建立变化目标模型和初始帧目标模型;
相似度计算单元,用于计算变化目标模型和初始帧目标模型的相似度;
匹配区域寻找单元,用于根据相似度寻找最优的变化目标匹配区域;
编辑判断单元,用于根据变化目标匹配区域计算变化目标位置向量判断是否被编辑。
所述一种视频数据编辑识别装置可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述一种视频数据编辑识别装置,可运行的装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种视频数据编辑识别装置的示例,并不构成对一种视频数据编辑识别装置的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种视频数据编辑识别装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种视频数据编辑识别装置运行装置的控制中心,利用各种接口和线路连接整个一种视频数据编辑识别装置可运行装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种视频数据编辑识别装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。
Claims (6)
1.一种视频数据编辑识别方法,其特征在于,所述方法包括以下步骤:
步骤1,读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
步骤2,建立变化目标模型和初始帧目标模型;
步骤3,计算变化目标模型和初始帧目标模型的相似度;
步骤4,根据相似度寻找最优的变化目标匹配区域;
步骤5,根据变化目标匹配区域计算变化目标位置向量判断是否被编辑;
在步骤2中,建立变化目标模型和初始帧目标模型的方法为:
令变化目标所在视频帧的图像中心为x0,{xi}i=1...n表示变化目标所在视频帧的图像共n个像素,m为变化目标所在视频帧的图像总数,则建立变化目标模型为:
式中:映射函数是将目标归一化为单位圆,映射函数在消除大小不同的目标计算时的影响时给图像中心的像素一个大小为的权值;不断以步长为1像素远离中心的像素,也不断以步长为1像素递减权值,δ[b(xi)-u]为判断变化目标中像素的颜色值b(xi)是否隶属于第u个像素的函数,若是则值为1;不是则值为0,C为标准化系数,令有
令初始帧的中心位置为y,{xi}i=1...n表示初始帧的图像共n个像素,则初始帧目标模型为:
6.一种视频数据编辑识别装置,其特征在于,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
变化目标获取单元,用于读取待识别视频并进行帧间差分获取视频帧图像中的变化目标;
目标模型建立单元,用于建立变化目标模型和初始帧目标模型;
相似度计算单元,用于计算变化目标模型和初始帧目标模型的相似度;
匹配区域寻找单元,用于根据相似度寻找最优的变化目标匹配区域;
编辑判断单元,用于根据变化目标匹配区域计算变化目标位置向量判断是否被编辑;
在目标模型建立单元中,建立变化目标模型和初始帧目标模型的方法为:
令变化目标所在视频帧的图像中心为x0,{xi}i=1...n表示变化目标所在视频帧的图像共n个像素,m为变化目标所在视频帧的图像总数,则建立变化目标模型为:
式中:映射函数是将目标归一化为单位圆,映射函数在消除大小不同的目标计算时的影响时给图像中心的像素一个大小为的权值;不断以步长为1像素远离中心的像素,也不断以步长为1像素递减权值,δ[b(xi)-u]为判断变化目标中像素的颜色值b(xi)是否隶属于第u个像素的函数,若是则值为1;不是则值为0,C为标准化系数,令有
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811585508.7A CN109635777B (zh) | 2018-12-24 | 2018-12-24 | 一种视频数据编辑识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811585508.7A CN109635777B (zh) | 2018-12-24 | 2018-12-24 | 一种视频数据编辑识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109635777A CN109635777A (zh) | 2019-04-16 |
CN109635777B true CN109635777B (zh) | 2022-09-13 |
Family
ID=66077094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811585508.7A Active CN109635777B (zh) | 2018-12-24 | 2018-12-24 | 一种视频数据编辑识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109635777B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112752098B (zh) * | 2021-04-06 | 2021-06-04 | 腾讯科技(深圳)有限公司 | 视频编辑效果的验证方法、装置 |
CN113821675A (zh) * | 2021-06-30 | 2021-12-21 | 腾讯科技(北京)有限公司 | 视频识别方法、装置、电子设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760436A (zh) * | 2012-08-09 | 2012-10-31 | 河南省烟草公司开封市公司 | 一种语音词库筛选方法 |
CN104113789A (zh) * | 2014-07-10 | 2014-10-22 | 杭州电子科技大学 | 一种基于深度学习的视频摘要在线生成方法 |
CN106341722A (zh) * | 2016-09-21 | 2017-01-18 | 努比亚技术有限公司 | 一种视频编辑方法及装置 |
CN108010057A (zh) * | 2017-11-29 | 2018-05-08 | 长沙安行机电设备有限公司 | 一种交互式铁路线路实景视频中目标编辑方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7617104B2 (en) * | 2003-01-21 | 2009-11-10 | Microsoft Corporation | Method of speech recognition using hidden trajectory Hidden Markov Models |
-
2018
- 2018-12-24 CN CN201811585508.7A patent/CN109635777B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760436A (zh) * | 2012-08-09 | 2012-10-31 | 河南省烟草公司开封市公司 | 一种语音词库筛选方法 |
CN104113789A (zh) * | 2014-07-10 | 2014-10-22 | 杭州电子科技大学 | 一种基于深度学习的视频摘要在线生成方法 |
CN106341722A (zh) * | 2016-09-21 | 2017-01-18 | 努比亚技术有限公司 | 一种视频编辑方法及装置 |
CN108010057A (zh) * | 2017-11-29 | 2018-05-08 | 长沙安行机电设备有限公司 | 一种交互式铁路线路实景视频中目标编辑方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109635777A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111327945B (zh) | 用于分割视频的方法和装置 | |
US11132555B2 (en) | Video detection method, server and storage medium | |
KR102354692B1 (ko) | 규칙 기반 비디오 중요도 분석 | |
CN109035304B (zh) | 目标跟踪方法、介质、计算设备和装置 | |
US10796438B2 (en) | Method and apparatus for tracking target profile in video | |
US9167221B2 (en) | Methods and systems for video retargeting using motion saliency | |
US9600744B2 (en) | Adaptive interest rate control for visual search | |
US9008366B1 (en) | Bio-inspired method of ground object cueing in airborne motion imagery | |
CN107220652B (zh) | 用于处理图片的方法和装置 | |
US20220172476A1 (en) | Video similarity detection method, apparatus, and device | |
CN110427915B (zh) | 用于输出信息的方法和装置 | |
US9305603B2 (en) | Method and apparatus for indexing a video stream | |
CN109635777B (zh) | 一种视频数据编辑识别方法及装置 | |
WO2019127940A1 (zh) | 视频分类模型训练方法、装置、存储介质及电子设备 | |
Kumar et al. | Video shot boundary detection and key frame extraction for video retrieval | |
Thounaojam et al. | A survey on video segmentation | |
CN114708437A (zh) | 目标检测模型的训练方法、目标检测方法、装置和介质 | |
CN114708287A (zh) | 一种镜头边界检测方法、设备及存储介质 | |
CN109919220B (zh) | 用于生成视频的特征向量的方法和装置 | |
CN109712075B (zh) | 一种数字图像数据原图识别方法及装置 | |
CN112291634A (zh) | 视频处理方法及装置 | |
CN110852250B (zh) | 一种基于最大面积法的车辆排重方法、装置及存储介质 | |
Zhang et al. | Pixso: a system for video shot detection | |
CN113743219B (zh) | 运动目标检测方法、装置、电子设备及存储介质 | |
Wu et al. | A fast gradual shot boundary detection method based on SURF |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |