CN110769276A - 基于md5的帧提取切片视频检测方法 - Google Patents

基于md5的帧提取切片视频检测方法 Download PDF

Info

Publication number
CN110769276A
CN110769276A CN201911084065.8A CN201911084065A CN110769276A CN 110769276 A CN110769276 A CN 110769276A CN 201911084065 A CN201911084065 A CN 201911084065A CN 110769276 A CN110769276 A CN 110769276A
Authority
CN
China
Prior art keywords
sample
detected
samples
similarity
frame extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911084065.8A
Other languages
English (en)
Inventor
陶磊
彭光辉
屈立笳
苟溟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU GOLDTEL INDUSTRY GROUP Co Ltd
Original Assignee
CHENGDU GOLDTEL INDUSTRY GROUP Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU GOLDTEL INDUSTRY GROUP Co Ltd filed Critical CHENGDU GOLDTEL INDUSTRY GROUP Co Ltd
Priority to CN201911084065.8A priority Critical patent/CN110769276A/zh
Publication of CN110769276A publication Critical patent/CN110769276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于MD5的帧提取切片视频检测方法,包括以下步骤:检测待测样本大小,提取样本库中与待测样本大小处于预设邻近区间内的样本;按相同时间间隔对待测样本和样本进行帧提取;将待测样本的帧逐一与一参照样本的对应帧进行MD5值对比,计算待测样本与该参照样本的相似度;选取参照样本中相似度最高的样本,将其相似度与预设阈值进行比较;判断是否相同。本方法针对视频文件,按固定间隔提取帧,能够处理待检样本局部字节修改或末尾增加个别字节的情况。

Description

基于MD5的帧提取切片视频检测方法
技术领域
本发明涉及数据分析领域,尤其涉及基于MD5的帧提取切片视频检测方法。
背景技术
为掌握某个视频短时间内在互联网进行大规模散播造成的影响,我们需要第一时间掌握这些视频的传播态势及受众反馈态势。此时就需要通过技术手段实现在线视频相似度/一致性判定,确定指定的视频内容在哪些地方出现,受众反馈情形如何。
MD5算法是计算机安全领域广泛使用的一种散列函数,可以将任意长度的消息压缩成固定长度的信息摘要,并且对原文内容变化高度敏感。然而,该算法对待检样本发生细微改变的特殊情况处理仍存在局限性。例如利用WinHex等工具修改原视频文件的个别字节,或通过echo命令在文件末尾插入几个字节等 ,都会产生完全不同的MD5值。此时,本检测方法则会失效。
发明内容
为了解决上述问题,本发明提出更精准的基于MD5的帧提取切片视频检测方法,包括以下步骤:
检测待测样本大小,提取样本库中与待测样本大小处于预设邻近区间内的样本;
按相同时间间隔对待测样本和样本进行帧提取;
将待测样本的帧逐一与一参照样本的对应帧进行MD5值对比,计算待测样本与该参照样本的相似度;
选取参照样本中相似度最高的样本,将其相似度与预设阈值进行比较;判断是否相同。
优选的,所述预设邻近区间为95%—105%区间。
优选的,所述相似度为待测样本与该参照样本的相同帧与帧总数之比。
本发明的有益效果在于:本方法针对视频文件,按固定间隔提取帧,能够处理待检样本局部字节修改或末尾增加个别字节的情况。
附图说明
图1是本方法流程示意图;
图2是帧提取示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
如图1所示,基于MD5的帧提取切片视频检测方法,包括以下步骤:
检测待测样本大小,提取样本库中与待测样本大小处于预设邻近区间内的样本;
按相同时间间隔对待测样本和样本进行帧提取;
将待测样本的帧逐一与一参照样本的对应帧进行MD5值对比,计算待测样本与该参照样本的相似度;
选取参照样本中相似度最高的样本,将其相似度与预设阈值进行比较;判断是否相同。
在本实施例中,首先获取待测样本的大小,在遍历样本库,获取库中所有大小与获取待测样本的大小邻近的样本,建立临时样本集合,邻近阈值可由用户配置,一般优选为95%—105%区间。
在进行帧提取时,首先确定时间间隔,可以根据样本时长和检测速度的实际需要设定,设置间隔的越大,帧提取的密度越小,执行效率越高;反之,帧提取的密度越大,需要比对的次数越多,执行效率越低。在本实施例中提取的帧数为奇数,设为n,如图2所示。
将待测样本的帧逐一与一参照样本的对应帧进行MD5值对比,计算待测样本与该参照样本的相似度。具体地,帧相同则取1,不同则取0,设n个片段取值和为m,则相似度为m/n。
遍历样本集中所有样本的相似度,选取最高的记录,与预设阈值进行比较,若大于,则认为待测样本与参照样本相同;若小于,则不同。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、ROM、RAM等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (3)

1.基于MD5的帧提取切片视频检测方法,其特征在于,包括以下步骤:
检测待测样本大小,提取样本库中与待测样本大小处于预设邻近区间内的样本;
按相同时间间隔对待测样本和样本进行帧提取;
将待测样本的帧逐一与一参照样本的对应帧进行MD5值对比,计算待测样本与该参照样本的相似度;
选取参照样本中相似度最高的样本,将其相似度与预设阈值进行比较;判断是否相同。
2.根据权利要求1所述的基于MD5的帧提取切片视频检测方法,其特征在于,所述预设邻近区间为95%—105%区间。
3.根据权利要求1所述的基于MD5的帧提取切片视频检测方法,其特征在于,所述相似度为待测样本与该参照样本的相同帧与帧总数之比。
CN201911084065.8A 2019-11-07 2019-11-07 基于md5的帧提取切片视频检测方法 Pending CN110769276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911084065.8A CN110769276A (zh) 2019-11-07 2019-11-07 基于md5的帧提取切片视频检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911084065.8A CN110769276A (zh) 2019-11-07 2019-11-07 基于md5的帧提取切片视频检测方法

Publications (1)

Publication Number Publication Date
CN110769276A true CN110769276A (zh) 2020-02-07

Family

ID=69336749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911084065.8A Pending CN110769276A (zh) 2019-11-07 2019-11-07 基于md5的帧提取切片视频检测方法

Country Status (1)

Country Link
CN (1) CN110769276A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015079102A (ja) * 2013-10-16 2015-04-23 日本電信電話株式会社 ハッシュ関数生成方法、ハッシュ値生成方法、ハッシュ関数生成装置、ハッシュ値生成装置、ハッシュ関数生成プログラム及びハッシュ値生成プログラム
CN108259932A (zh) * 2018-03-15 2018-07-06 华南理工大学 基于时空域极坐标余弦变换的鲁棒哈希重复视频检测方法
CN109218721A (zh) * 2018-11-26 2019-01-15 南京烽火星空通信发展有限公司 一种基于帧比对的变种视频检测方法
CN109815364A (zh) * 2019-01-18 2019-05-28 上海极链网络科技有限公司 一种海量视频特征提取、存储和检索方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015079102A (ja) * 2013-10-16 2015-04-23 日本電信電話株式会社 ハッシュ関数生成方法、ハッシュ値生成方法、ハッシュ関数生成装置、ハッシュ値生成装置、ハッシュ関数生成プログラム及びハッシュ値生成プログラム
CN108259932A (zh) * 2018-03-15 2018-07-06 华南理工大学 基于时空域极坐标余弦变换的鲁棒哈希重复视频检测方法
CN109218721A (zh) * 2018-11-26 2019-01-15 南京烽火星空通信发展有限公司 一种基于帧比对的变种视频检测方法
CN109815364A (zh) * 2019-01-18 2019-05-28 上海极链网络科技有限公司 一种海量视频特征提取、存储和检索方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王媛媛等: "有害音视频一致性检测方法的研究与实现", 《中国人民公安大学学报( 自然科学版)》 *

Similar Documents

Publication Publication Date Title
US8886660B2 (en) Method and apparatus for tracking a change in a collection of web documents
CN107609149B (zh) 一种视频定位方法和装置
CN111600894B (zh) 一种网络攻击检测方法及装置
CN105187408A (zh) 网络攻击检测方法和设备
CN104636319A (zh) 一种文本去重方法和装置
CN109600382B (zh) webshell检测方法及装置、HMM模型训练方法及装置
EP3905084A1 (en) Method and device for detecting malware
CN111507260B (zh) 一种视频相似度快速检测方法及检测装置
Moonsamy et al. Feature reduction to speed up malware classification
JP2009118461A (ja) ビデオ・ストリームに対するリアル・タイム新規イベント検出のシステムおよび方法
CN111914257A (zh) 文档检测的方法、装置、设备、及计算机存储介质
CN109067708B (zh) 一种网页后门的检测方法、装置、设备及存储介质
CN111177725B (zh) 一种检测恶意刷点击操作的方法、装置、设备及存储介质
CN110719278A (zh) 一种网络入侵数据的检测方法、装置、设备及介质
CN110889274B (zh) 信息质量评估方法、装置、设备及计算机可读存储介质
CN109189840B (zh) 一种流式在线日志解析方法
CN117857088A (zh) 一种网络流量异常检测方法、系统、设备及介质
CN104424435B (zh) 一种获取病毒特征码的方法及装置
CN110769276A (zh) 基于md5的帧提取切片视频检测方法
CN116204889A (zh) 一种基于对比学习的软件漏洞评估方法、系统及介质
CN112163217B (zh) 恶意软件变种识别方法、装置、设备及计算机存储介质
CN116028936A (zh) 一种基于神经网络的恶意代码检测方法、介质及设备
CN116112209A (zh) 漏洞攻击流量检测方法及装置
CN113076932B (zh) 训练音频语种识别模型的方法、视频检测方法及其装置
CN111651987B (zh) 身份判别方法及装置、计算机可读存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207