CN110879967A - 视频内容重复判断方法及装置 - Google Patents

视频内容重复判断方法及装置 Download PDF

Info

Publication number
CN110879967A
CN110879967A CN201910984045.XA CN201910984045A CN110879967A CN 110879967 A CN110879967 A CN 110879967A CN 201910984045 A CN201910984045 A CN 201910984045A CN 110879967 A CN110879967 A CN 110879967A
Authority
CN
China
Prior art keywords
video content
picture
comparison
data set
comparison value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910984045.XA
Other languages
English (en)
Other versions
CN110879967B (zh
Inventor
陈方毅
谢振林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meishao Co Ltd
Original Assignee
Xiamen Meishao Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meishao Co Ltd filed Critical Xiamen Meishao Co Ltd
Priority to CN201910984045.XA priority Critical patent/CN110879967B/zh
Publication of CN110879967A publication Critical patent/CN110879967A/zh
Application granted granted Critical
Publication of CN110879967B publication Critical patent/CN110879967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了视频内容重复判断方法及装置,其中,该方法通过建立包括图片比较值计算和图片相似性判断过程的图片相似性判断模型,利用图片相似性判断模型计算每一个视频样本内容的样本帧比较值信息,并生成视频内容对比数据集,然后利用图片相似性判断模型计算目标视频内容的图片帧比较值信息,最后将目标帧图片的比较值信息与视频样本内容的样本帧图片的比较值信息进行对比,根据视频去重策略判断目标视频内容与视频内容对比数据集之间的重复情况。通过提供一种快捷且准确度高的图片相似性判断方法,并将视频内容去重概括为不同帧图片的相似性判断,对于海量视频内容来说,提取关键信息,减少去重工作量,大大提高了视频内容的去重效率。

Description

视频内容重复判断方法及装置
技术领域
本发明涉及信息处理领域,尤其是一种视频内容重复判断方法及装置。
背景技术
目前在互联网中充斥着海量的视频内容,其中包含大量的重复内容。这些重复内容会浪费大量的存储资源。为了节省存储资源,需要去除互联网中重复的视频内容。随着计算机对图片信息等各种自然语言处理应用的普及,人们需要一个有效且准确的方法来计算两个视频内容之间的相似度。目前的视频内容重复性判断方法主要是:余弦相似算法,但是余弦相似算法存在对比计算量大、效率低且阈值难定的问题,其相似度判断准确度不高。
因此需要提出一种能够快速去重且相似度判断准确性的视频内容重复判断方法。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的是提供一种能够快速去重且相似度判断准确性的视频内容重复判断方法。
本发明实施例所采用的技术方案是:
第一方面,本发明实施例提供一种视频内容重复判断方法,包括:
建立图片相似性判断模型,所述图片相似性判断模型包括:图片比较值计算和图片相似性判断;
利用所述图片相似性判断模型计算每一个视频样本内容的样本帧图片的比较值信息,并生成视频内容对比数据集;
利用所述图片相似性判断模型计算目标视频内容的目标帧图片的比较值信息;
将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况。
进一步地,所述图片比较值计算具体为:
将图片归一化成相同的像素尺寸,并计算所有像素的平均灰度值;
遍历所有像素并与所述平均灰度值进行大小对比,根据对比结果进行二进制编码生成图片比较值,所述图片比较值为simhash值。
进一步地,所述图片相似性判断过程具体为:
根据待比较的两张图片的图片比较值,计算两张图片之间的海明距离;
如果所述海明距离小于预设阈值,则判断所述两张图片相似。
进一步地,所述样本帧图片和所述目标帧图片均包括:封面帧图片、第一预设时间帧图片和第二预设时间帧图片。
进一步地,所述视频内容对比数据集包括:视频样本内容的时长和样本帧图片的比较值信息。
进一步地,所述将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况,包括:
根据所述目标视频内容的视频时长在所述视频内容对比数据集中选取时长近似的视频样本内容作为对比视频集;
根据所述图片相似性判断过程判断所述目标视频内容和所述对比视频集的封面帧图片是否相似,如果不相似,则判断所述目标视频内容与所述视频内容对比数据集之间不重复;
否则,判断第一预设时间帧图片和第二预设时间帧图片是否都相似,如果都相似,则判断所述目标视频内容与所述视频内容对比数据集之间重复;
否则,判断所述目标视频内容与所述视频内容对比数据集之间不重复。
第二方面,本发明还提供一种视频内容重复判断装置,包括:
图片相似性判断模型建立模块:用于建立图片相似性判断模型,所述图片相似性判断模型包括:图片比较值计算和图片相似性判断过程;
生成对比数据集模块:用于利用所述图片相似性判断模型计算每一个视频样本内容的样本帧图片的比较值信息,并生成视频内容对比数据集;
计算目标比较值模块:用于利用所述图片相似性判断模型计算目标视频内容的目标帧图片的比较值信息;
判断重复状态模块:用于将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况。
第三方面,本发明实施例提供一种视频内容重复判断设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如第一方面任一项所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面任一项所述的方法。
本发明实施例的有益效果是:
本发明实施例通过建立包括图片比较值计算和图片相似性判断过程的图片相似性判断模型,利用图片相似性判断模型计算每一个视频样本内容的样本帧比较值信息,并生成视频内容对比数据集,然后利用图片相似性判断模型计算目标视频内容的图片帧比较值信息,最后将目标帧图片的比较值信息与视频样本内容的样本帧图片的比较值信息进行对比,并根据视频去重策略判断目标视频内容与视频内容对比数据集之间的重复情况。本发明实施例通过提供一种快捷且准确度高的图片相似性判断方法,并将视频内容去重概括为不同帧图片的相似性判断,对于海量视频内容来说,提取关键信息,减少去重工作量,大大提高了视频内容的去重效率。可广泛应用于视频内容比较相关的信息处理领域。
附图说明
图1是本发明中视频内容重复判断方法的一具体实施例的实现流程图;
图2是本发明中视频内容重复判断方法的一具体实施例的计算图片比较值过程示意图;
图3是本发明中视频内容重复判断方法的一具体实施例的生成视频内容对比数据集示意图;
图4是本发明中视频内容重复判断方法的一具体实施例的视频去重策略流程示意图;
图5是本发明中视频内容重复判断装置的一具体实施例的结构框图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一:
本发明实施例一提供一种视频内容重复判断方法,图1为本发明实施例提供的一种视频内容重复判断方法的实现流程图,如图1所示,该方法包括以下步骤:
S1:建立图片相似性判断模型,其中图片相似性模型包括:图片比较值计算和图片相似性判断。
S2:生成视频内容对比数据库,具体是:收集视频样本内容,利用图片相似性判断模型计算每一个视频样本内容的样本帧图片的比较值信息,并生成视频内容对比数据集,主要形成用于重复判断的比较视频库。
S3:生成目标视频内容比较值信息:具体是:利用图片相似性判断模型计算目标视频内容的目标帧图片的比较值信息,对应于上述步骤,本实施例中比较值信息包括:样本帧图片的比较值信息和目标帧图片的比较值信息。
其中,样本帧图片和目标帧图片均包括:封面帧图片、第一预设时间帧图片和第二预设时间帧图片。封面帧图片指当前视频内容用作封面标识的图片,可选的第一预设时间帧为开始第三帧,第二预设时间帧为倒数第三帧,该值均可根据实际应用情况进行调整,另外,在一种实施方式中,比较值信息包括多个时间帧的图像比较值,不限于3个。
S4:判断重复状态:将目标帧图片的比较值信息与视频内容对比数据集的样本帧图片的比较值信息进行对比,并根据对比结果判断目标视频内容与视频内容对比数据集之间的重复情况。
其中步骤S1中,如图2所示,为计算图片比较值过程示意图:
S11:为计算方便,将需要计算图片比较值的图片图片归一化成相同的像素尺寸,可以理解的是,样本帧图片和目标帧图片均采用该方式计算图片比较值。
S12:计算图片中所有像素的平均灰度值,本实施例中,可选的将图片归一化成8×8的像素,减少计算工作量。
S13:遍历图片中所有像素并与平均灰度值进行大小对比,根据对比结果进行二进制编码生成图片的比较值,本实施例中比较值即simhash值,可选的,例如根据对比结果将大于平均灰度值的记为1,小于平均灰度值的记为0,生成一个64位(可根据实际情况适应性修改)的二进制编码,即图片simhash值。
计算图片相似性过程为:
S14:根据两张图片的simhash值计算图片的海明距离,其中,在信息编码中,两个合法代码对应位上编码不同的位数称为码距,也称海明距离,本实施例中,对两张图片的simhash值各个位数编码进行对比,最终不同的位数就作为两张图片的海明距离。
S15:如果两张图片的海明距离小于预设阈值,则判断这两张图片相似,预设阈值可选的为6。
步骤S2中,生成视频内容对比数据集,即构建一个用于比较的原始数据库,如图3所示,为生成视频内容对比数据集示意图,从图中可见包括以下流程:
具体的是:利用步骤S1中得到图片相似性判断模型计算每一个视频样本内容的比较值信息,并生成视频内容对比数据集,视频内容对比数据集包括:视频样本内容的时长和样本帧图片的比较值信息。其中,如图3所示,为本实施例中生成视频内容对比数据集示意图,具体包括:
S21:获取作为训练样本集的视频样本内容及对应时长,如历史视频资讯等;
S22:利用图片相似性判断模型计算样本图片帧比较值信息,包括:封面帧图片的比较值、第一预设时间帧图片的比较值和第二预设时间帧图片的比较值,即图片simhash值;
S23:生成基于视频时长的视频样本内容列表,同时保存每一个视频样本内容对应的比较值信息,构建视频内容对比数据集。
本实施例中,如图4所示,步骤S4具体包括:
1)根据目标视频内容的视频时长在视频内容对比数据集中选取时长相同(判断时长相同时,两者不是完全相同,只要在预设误差之内即判定为相同,如预设误差为3s,如果两者时长差的绝对值小于等于3s,都认为两者相同)的视频样本内容作为对比视频集;
2)根据图片相似性判断过程判断目标视频内容和对比视频集的封面帧图片是否相似(即海明距离小于预设阈值),如果不相似,则判断目标视频内容与视频内容对比数据集之间不重复;
3)否则,判断第一预设时间帧图片和第二预设时间帧图片是否都相似,如果都相似,则判断目标视频内容与视频内容对比数据集之间重复;
4)否则,判断目标视频内容与视频内容对比数据集之间不重复。
本实施例通过建立包括图片比较值计算和图片相似性判断过程的图片相似性判断模型,利用图片相似性判断模型计算每一个视频样本内容的样本帧比较值信息,并生成视频内容对比数据集,然后利用图片相似性判断模型计算目标视频内容的图片帧比较值信息,最后将目标帧图片的比较值信息与视频样本内容的样本帧图片的比较值信息进行对比,并根据视频去重策略判断目标视频内容与视频内容对比数据集之间的重复情况。提供一种快捷且准确度高的图片相似性判断方法,并将视频内容去重概括为不同帧图片的相似性判断,对于海量视频内容来说,提取关键信息,减少去重工作量,大大提高了视频内容的去重效率。
实施例二:
本实施例提供了一种视频内容重复判断装置,用于执行实施例一所述的方法,如图5所示,为本实施例的视频内容重复判断装置结构框图,包括:
图片相似性判断模型建立模块10:用于建立图片相似性判断模型,其中,图片相似性模型包括:图片比较值计算和图片相似性判断过程;
生成对比数据集模块20:用于利用图片相似性判断模型计算每一个视频样本内容的比较值信息,并生成视频内容对比数据集;
计算目标比较值模块30:用于利用图片相似性判断模型计算目标视频内容的比较值信息;
判断重复状态模块40:用于将目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断目标视频内容与视频内容对比数据集之间的重复情况;
对应的,比较值信息包括:样本帧图片的比较值信息和目标帧图片的比较值信息。
另外,本发明还提供一种视频内容重复判断设备,包括:
至少一个处理器,以及与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如实施例一所述的方法。
另外,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,其中计算机可执行指令用于使计算机执行如实施例一所述的方法。
本发明可在对比过程中返回的相似非重复数据或返回视频内容最相似数据列表,能够广泛应用于数据相关推荐算法、搜索query查询结果和原创作者分析、热门事件/话题发现等信息处理领域。
以上各实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (9)

1.一种视频内容重复判断方法,其特征在于,包括:
建立图片相似性判断模型,所述图片相似性判断模型包括:图片比较值计算和图片相似性判断过程;
利用所述图片相似性判断模型计算每一个视频样本内容的样本帧图片的比较值信息,并生成视频内容对比数据集;
利用所述图片相似性判断模型计算目标视频内容的目标帧图片的比较值信息;
将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况。
2.根据权利要求1所述的一种视频内容重复判断方法,其特征在于,所述图片比较值计算具体为:
将图片归一化成相同的像素尺寸,并计算所有像素的平均灰度值;
遍历所有像素并与所述平均灰度值进行大小对比,根据对比结果进行二进制编码生成图片比较值,所述图片比较值为simhash值。
3.根据权利要求1所述的一种视频内容重复判断方法,其特征在于,所述图片相似性判断过程具体为:
根据待比较的两张图片的图片比较值,计算两张图片之间的海明距离;
如果所述海明距离小于预设阈值,则判断所述两张图片相似。
4.根据权利要求1所述的一种视频内容重复判断方法,其特征在于,所述样本帧图片和所述目标帧图片均包括:封面帧图片、第一预设时间帧图片和第二预设时间帧图片。
5.根据权利要求4所述的一种视频内容重复判断方法,其特征在于,所述视频内容对比数据集包括:视频样本内容的时长和样本帧图片的比较值信息。
6.根据权利要求5任一项所述的一种视频内容重复判断方法,其特征在于,所述将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况,包括:
根据所述目标视频内容的视频时长在所述视频内容对比数据集中选取时长相同的视频样本内容作为对比视频集;
根据所述图片相似性判断过程判断所述目标视频内容和所述对比视频集的封面帧图片是否相似,如果不相似,则判断所述目标视频内容与所述视频内容对比数据集之间不重复;
否则,判断第一预设时间帧图片和第二预设时间帧图片是否都相似,如果都相似,则判断所述目标视频内容与所述视频内容对比数据集之间重复;
否则,判断所述目标视频内容与所述视频内容对比数据集之间不重复。
7.一种视频内容重复判断装置,其特征在于,包括:
图片相似性判断模型建立模块:用于建立图片相似性判断模型,所述图片相似性判断模型包括:图片比较值计算和图片相似性判断过程;
生成对比数据集模块:用于利用所述图片相似性判断模型计算每一个视频样本内容的样本帧图片的比较值信息,并生成视频内容对比数据集;
计算目标比较值模块:用于利用所述图片相似性判断模型计算目标视频内容的目标帧图片的比较值信息;
判断重复状态模块:用于将所述目标帧图片的比较值信息与所述视频内容对比数据集的所述样本帧图片的比较值信息进行对比,并根据对比结果判断所述目标视频内容与所述视频内容对比数据集之间的重复情况。
8.一种视频内容重复判断设备,其特征在于,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至6任一项所述的方法。
CN201910984045.XA 2019-10-16 2019-10-16 视频内容重复判断方法及装置 Active CN110879967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910984045.XA CN110879967B (zh) 2019-10-16 2019-10-16 视频内容重复判断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910984045.XA CN110879967B (zh) 2019-10-16 2019-10-16 视频内容重复判断方法及装置

Publications (2)

Publication Number Publication Date
CN110879967A true CN110879967A (zh) 2020-03-13
CN110879967B CN110879967B (zh) 2023-02-17

Family

ID=69727913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910984045.XA Active CN110879967B (zh) 2019-10-16 2019-10-16 视频内容重复判断方法及装置

Country Status (1)

Country Link
CN (1) CN110879967B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111601115A (zh) * 2020-05-12 2020-08-28 腾讯科技(深圳)有限公司 一种视频检测的方法、相关装置、设备及存储介质
CN112231514A (zh) * 2020-10-19 2021-01-15 腾讯科技(深圳)有限公司 一种数据去重方法、装置及存储介质和服务器
CN112399236A (zh) * 2020-10-09 2021-02-23 北京达佳互联信息技术有限公司 一种视频查重方法、装置及电子设备
CN115714882A (zh) * 2022-11-24 2023-02-24 北京香哈网络股份有限公司 一种视频时长优化处理方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104104952A (zh) * 2014-08-01 2014-10-15 武汉高德信息产业有限公司 一种适应于移动设备存储与播放的音视频处理方法与系统
US20150309880A1 (en) * 2014-04-25 2015-10-29 International Business Machines Corporation Efficient video data deduplication
CN105678244A (zh) * 2015-12-31 2016-06-15 北京理工大学 一种基于改进编辑距离的近似视频检索方法
CN106570165A (zh) * 2016-11-07 2017-04-19 北京航空航天大学 一种基于内容的视频检索方法及装置
CN107257338A (zh) * 2017-06-16 2017-10-17 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及存储介质
CN108416013A (zh) * 2018-03-02 2018-08-17 北京奇艺世纪科技有限公司 视频匹配、检索、分类和推荐方法、装置及电子设备
CN108647295A (zh) * 2018-05-08 2018-10-12 南京大学 一种基于深度协同哈希的图片标注方法
CN108737423A (zh) * 2018-05-24 2018-11-02 国家计算机网络与信息安全管理中心 基于网页关键内容相似性分析的钓鱼网站发现方法及系统
CN108933935A (zh) * 2017-05-22 2018-12-04 中兴通讯股份有限公司 视频通信系统的检测方法、装置、存储介质和计算机设备
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110149529A (zh) * 2018-11-01 2019-08-20 腾讯科技(深圳)有限公司 媒体信息的处理方法、服务器及存储介质
CN110956037A (zh) * 2019-10-16 2020-04-03 厦门美柚股份有限公司 多媒体内容重复判断方法及装置
CN111581437A (zh) * 2020-05-07 2020-08-25 腾讯科技(深圳)有限公司 一种视频检索方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150309880A1 (en) * 2014-04-25 2015-10-29 International Business Machines Corporation Efficient video data deduplication
CN104104952A (zh) * 2014-08-01 2014-10-15 武汉高德信息产业有限公司 一种适应于移动设备存储与播放的音视频处理方法与系统
CN105678244A (zh) * 2015-12-31 2016-06-15 北京理工大学 一种基于改进编辑距离的近似视频检索方法
CN106570165A (zh) * 2016-11-07 2017-04-19 北京航空航天大学 一种基于内容的视频检索方法及装置
CN108933935A (zh) * 2017-05-22 2018-12-04 中兴通讯股份有限公司 视频通信系统的检测方法、装置、存储介质和计算机设备
CN107257338A (zh) * 2017-06-16 2017-10-17 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及存储介质
CN108416013A (zh) * 2018-03-02 2018-08-17 北京奇艺世纪科技有限公司 视频匹配、检索、分类和推荐方法、装置及电子设备
CN108647295A (zh) * 2018-05-08 2018-10-12 南京大学 一种基于深度协同哈希的图片标注方法
CN108737423A (zh) * 2018-05-24 2018-11-02 国家计算机网络与信息安全管理中心 基于网页关键内容相似性分析的钓鱼网站发现方法及系统
CN110149529A (zh) * 2018-11-01 2019-08-20 腾讯科技(深圳)有限公司 媒体信息的处理方法、服务器及存储介质
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110956037A (zh) * 2019-10-16 2020-04-03 厦门美柚股份有限公司 多媒体内容重复判断方法及装置
CN111581437A (zh) * 2020-05-07 2020-08-25 腾讯科技(深圳)有限公司 一种视频检索方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YEGUANG LI等: "Fast distributed video deduplication via locality-sensitive hashing with similarity ranking", 《EURASIP JOURNAL ON IMAGE AND VIDEO PROCESSING》 *
张宇: "基于海明距离的相似查找索引算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
胡雪晴: "基于感知哈希的视频去重", 《软件工程与应用》 *
自媒体O运营: "今日头条视频如何消重去重,今日头条运营手册", 《HTTPS://WWW.MEIWEN.COM.CN/SUBJECT/GGNZDQTX.HTML?_360SAFEPARAM=1065382109》 *
袁圆: "基于内嵌字幕的近似视频网页去重研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111601115A (zh) * 2020-05-12 2020-08-28 腾讯科技(深圳)有限公司 一种视频检测的方法、相关装置、设备及存储介质
CN112399236A (zh) * 2020-10-09 2021-02-23 北京达佳互联信息技术有限公司 一种视频查重方法、装置及电子设备
CN112231514A (zh) * 2020-10-19 2021-01-15 腾讯科技(深圳)有限公司 一种数据去重方法、装置及存储介质和服务器
CN112231514B (zh) * 2020-10-19 2024-01-05 腾讯科技(深圳)有限公司 一种数据去重方法、装置及存储介质和服务器
CN115714882A (zh) * 2022-11-24 2023-02-24 北京香哈网络股份有限公司 一种视频时长优化处理方法及系统

Also Published As

Publication number Publication date
CN110879967B (zh) 2023-02-17

Similar Documents

Publication Publication Date Title
CN110879967B (zh) 视频内容重复判断方法及装置
US8837769B2 (en) Video signature based on image hashing and shot detection
CN110956037B (zh) 多媒体内容重复判断方法及装置
US11734347B2 (en) Video retrieval method and apparatus, device and storage medium
CN111382298B (zh) 基于图片内容的图像检索方法、装置与电子设备
CN111507260B (zh) 一种视频相似度快速检测方法及检测装置
CN110956038A (zh) 图文内容重复判断方法及装置
CN113205160B (zh) 模型训练、文本识别方法、装置、电子设备和介质
CN113344826B (zh) 图像处理方法、装置、电子设备及存储介质
CN111901594B (zh) 面向视觉分析任务的图像编码方法、电子设备及介质
CN109697240B (zh) 一种基于特征的图像检索方法及装置
WO2023284609A1 (zh) 图形码识别方法、装置、计算机设备和存储介质
CN115391578A (zh) 一种跨模态图文检索模型训练方法及系统
WO2021142072A1 (en) Peceptual video fingerprinting
CN111327946A (zh) 视频质量评价和特征字典的训练方法、装置和介质
CN114973229A (zh) 文本识别模型训练、文本识别方法、装置、设备及介质
CN114528421A (zh) 内容审核方法、装置、电子设备及存储介质
CN111143619B (zh) 视频指纹生成方法、检索方法、电子设备及介质
CN116740500A (zh) 图像相似度检测模型训练、检测方法、装置、设备、介质
CN114694146B (zh) 文本识别模型的训练方法、文本识别方法、装置及设备
CN110348509B (zh) 数据增广参数的调整方法、装置、设备及存储介质
CN112883372B (zh) 跨站脚本攻击检测方法和装置
CN112766052A (zh) 基于ctc的图像文字识别方法及装置
CN108021918A (zh) 文字识别方法及装置
CN111008301B (zh) 一种以图搜视频的方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant