CN108881947B - 一种直播流的侵权检测方法及装置 - Google Patents

一种直播流的侵权检测方法及装置 Download PDF

Info

Publication number
CN108881947B
CN108881947B CN201710338387.5A CN201710338387A CN108881947B CN 108881947 B CN108881947 B CN 108881947B CN 201710338387 A CN201710338387 A CN 201710338387A CN 108881947 B CN108881947 B CN 108881947B
Authority
CN
China
Prior art keywords
segment
content
feature
live stream
maternal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710338387.5A
Other languages
English (en)
Other versions
CN108881947A (zh
Inventor
毛锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710338387.5A priority Critical patent/CN108881947B/zh
Publication of CN108881947A publication Critical patent/CN108881947A/zh
Application granted granted Critical
Publication of CN108881947B publication Critical patent/CN108881947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Abstract

本申请涉及多媒体处理技术,特别涉及一种直播流的侵权检测方法及装置,用于实现直播视频的侵权检测。该方法为:以时间片为粒度,从直播流中提取直播流片段,针对一个直播流片段,将其划分为若干直播流子片段,各个直播流子片段之间并行提取内容特征并转换为特征索引,以及将各个直播流片段包含的各个直播流子片段与母本包含的各个母本片段进行特征索引的查询匹配,以确定直播流相对于母本在设定时间段内的单位时间母本片段内容特征命中次数,在确定单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述直播流侵权,这样,能够实时准确地对直播视频的侵权内容进行自动监控,实现直播场景下的版权保护。

Description

一种直播流的侵权检测方法及装置
技术领域
本申请涉及多媒体处理技术,特别涉及一种直播流的侵权检测方法及装置。
背景技术
随着互联网技术日新月异地发展,直播视频作为一种新的内容传播方式得到了广泛地应用。采用直播视频可以及时向用户提供最新的视频内容,在很大程度上提升了用户体验和视频传播效率。然而,直播视频却也给侵犯视频内容版权提供了新的渠道,这不但给视频内容所有者造成了损失,也给互联网平台商、运营商带来巨大的违规风险。
由于直播视频是实时地进行内容生成及传播,因而互联网中每天会存在成千上万路的直播流,若采用人工审核方式进行侵权检测,成本巨大且效率低下。
而现有技术下,已设计了三种视频侵权检测方案。
方案一:通过模板匹配的方式进行视频特征匹配,即从模板视频中提取出指纹序列(即视频特征序列),再从待查询视频中提取出指纹序列,并将模板视频的特征序列在待查询直播视频的特征序列上滑动,计算关联系数以找出相似度最大的匹配位置,若该区域位置的相似度达到设定相似度门限则确定待查询视频侵权。
方案二:从各个模板视频中提取出各个视频特征,再对各个视频特征进行倒排索引,即记录各个视频特征分别出现在哪些模板视频中,然后,提取待查询视频的视频特征,并查找待查询视频的视频特征相对于模板视频的视频特征的命中数目,若该命中数目达到设定数目门限则确定待查询视频侵权。
方案三:从模板视频中截取关键帧,再通过图像搜索方式从待查询视频中提取关键帧,然后,计算模板视频中的关键帧与查询视频中的关键帧之间的匹配度,若该匹配度达到设定匹配度门限则确定待查询视频侵权。
然而,上述三种视频侵权检测方案均是针对离线的待查询视频进行侵权检测的,其索引构建耗时长,而且匹配效率低下,无法应用于视频直播的场景。
发明内容
本申请实施例提供一种直播视频的侵权检测方法及装置,用以实时准确地对直播视频的侵权内容进行自动监控,实现直播场景下的版权保护。
本申请实施例提供的具体技术方案如下:
一种直播流的侵权检测方法,包括:
按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及将直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,并确定特征索引对应的内容特征集合;
采用一个母本片段对各个直播流子片段进行特征索引查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括所述当前时间片。
可选的、将所述直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,包括:
对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果;
将获得的各个提取结果进行汇总,获得所述直播流片段对应的若干内容特征;
将获得的若干内容特征转换为相应的特征索引。
可选的,对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果,包括:
针对至少一帧图像执行以下操作:
在一帧图像中提取出特征点集合;
提出所述特征点集合中的特征点对应的内容特征;
将所述特征点集合中的特征点对应的内容特征进行汇总,作为相应的提取结果。
可选的,在所述一帧图像中提取出特征点集合,具体包括:
在所述一帧图像中选定若干候选点;
计算候选点的像素值,以及计算候选点的周边设定区域中的像素点的像素值;
计算候选点的周边设定区域中,与相应候选点的像素值差值达到预设像素值门限的目标像素点数目;
将对应的目标像素点数目达到预设数目门限的候选点选定为特征点。
可选的,提出所述特征点集合中的个特征点对应的内容特征,包括:
针对至少一个特征点执行以下操作:
在一个特征点周边选定若干抽样点;
将抽样点进行两两组合,获得若干抽样点对;
针对至少一个抽样点对执行以下操作:判断一个抽样点对中包含的两个抽样点之间的状态关系是否满足预设条件,若是,则对应所述一个抽样点对设置第一二进制值,否则,对应所述一个抽样点对设置第二二进制值;
将各个抽样点对对应的二进制值进行汇总,将汇总结果输出作为所述一个特征点的内容特征。
可选的,在获得一帧图像对应的提取结果之后,进一步包括:
按照预设的内容特征限制数目,从所述提取结果中采样总数目不高于所述内容特征限制数目的内容特征。
可选的,将获得的若干内容特征转换为相应的特征索引,包括:
采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的帧图像对应的内容特征进行比特位采样,获得相应的特征索引。
可选的,确定特征索引对应的内容特征集合之后,进一步包括:
基于获得的内容特征建立倒排索引,确定内容特征对应的直播流子片段集合,其中,一个内容特征对应的直播流子片段,为包含所述一个内容特征的帧图像所归属的直播流子片段。
可选的,基于获得的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,具体包括:
计算获得的各个母本片段内容特征命中次数之和;
确定所述设定时间段包含的时间片数目;
计算所述母本片段内容特征命中次数之和与所述时间片数目的比值,作为单位时间母本内容特征命中次数。
可选的,基于所述母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数之前,进一步包括:
针对所述母本包含的至少一个母本片段执行以下操作:
将一个母本片段在所述设定时间段内曾匹配的各个直播流子片段,按照对应的母本片段内容特征命中次数的取值进行排序,获得排序结果;
根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,并保留相应的母本片段内容特征命中次数。
可选的,根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,包括:
若所述排序结果表征按照母本片段内容特征命中次数从大到小的顺序进行排序,则选取前k个直播流子片段,其中,第k+1个母本片段内容特征命中次数与第k个母本片段内容特征命中次数的比值低于第一设定阈值;或者
若所述排序结果表征按照母本片段内容特征命中次数从小到大的顺序进行排序,则选取除前k’个直播流子片段之外的其余直播流子片段,其中,第k’个母本片段内容特征命中次数与第k’+1个母本片段内容特征命中次数的比值低于第二设定阈值。
可选的,进一步包括:
针对所述母本包含的母本片段,计算母本片段与在所述述设定时间段内曾匹配的直播流子片段之间的时间片偏移量;
针对所述母本包含的母本片段,统计获得的时间片偏移量取值对应的时间片偏移量数目,进一步筛选出时间片偏移量数目最多的时间片偏移量取值所关联的各个直播流子片段。
一种图像检测方法,包括:
获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引;
在母本片段中检索所述特征索引,得到匹配成功的特征索引以及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
确定所述单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述待检测视频图像包含有违规内容。
可选的,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为若干直播流子片段;
从直播流子片段包含的待检测视频图像中提取内容特征;
将提取的内容特征转换为相应的特征索引。
可选的,基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,包括:
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算所述待检测视频图像的母本片段内容特征命中次数;
基于所述母本片段所归属的母本在设定时间段内曾匹配的待检测视频图像的母本片段内容特征命中次数,计算所述母本在所述设定时间段内的单位时间母本内容特征命中次数,其中,所述设定时间段至少包括所述当前时间片。
一种图像检测方法,包括:
获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引;
在母本片段中检索所述特征索引,获得单位时间的检索命中次数;
确定所述检索命中次数达到预设阈值,判定所述待检测视频图像包含目标内容。
可选的,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为至少一个直播流子片段;
对所述直播流子片段并行进行如下处理:从直播流子片段包含的待检测视频图像中提取内容特征,并将所述内容特征转换为相应的特征索引。
可选的,将所述内容特征转换为相应的特征索引,包括:
采用预设的哈希函数集合中的哈希函数,针对所述内容特征进行比特位采样,获得相应的特征索引。
可选的,在母本片段中检索所述特征索引,获得单位时间的检索命中次数,包括:
在母本片段中检索所述特征索引,确定匹配成功的特征索引及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算检索命中次数,其中,检索命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的检索命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间的检索命中次数,其中,所述设定时间段至少包括所述当前时间片。
一种存储介质,存储有用于直播流的侵权检测的程序,所述程序被处理器运行时,执行以下步骤:
按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及将直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,并确定特征索引对应的内容特征集合;
采用一个母本片段对各个直播流子片段进行特征索引查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括所述当前时间片。
一种计算机装置,包括一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述计算机装置执行上述任一项所述的方法。
一种直播流的侵权检测装置,包括:
转换单元,用于按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及将直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,并确定特征索引对应的内容特征集合;
计算单元,用于采用一个母本片段对各个直播流子片段进行特征索引查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
判定单元,用于基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括所述当前时间片。
可选的、将所述直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引时,所述转换单元用于:
对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果;
将获得的各个提取结果进行汇总,获得所述直播流片段对应的若干内容特征;
将获得的若干内容特征转换为相应的特征索引。
可选的,对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果时,所述转换单元用于:
针对至少一帧图像执行以下操作:
在一帧图像中提取出特征点集合;
提出所述特征点集合中的特征点对应的内容特征;
将所述特征点集合中的特征点对应的内容特征进行汇总,作为相应的提取结果。
可选的,在所述一帧图像中提取出特征点集合时,所述转换单元用于:
在所述一帧图像中选定若干候选点;
计算候选点的像素值,以及计算候选点的周边设定区域中的像素点的像素值;
计算候选点的周边设定区域中,与相应候选点的像素值差值达到预设像素值门限的目标像素点数目;
将对应的目标像素点数目达到预设数目门限的候选点选定为特征点。
可选的,提出所述特征点集合中的个特征点对应的内容特征时,所述转换单元用于:
针对至少一个特征点执行以下操作:
在一个特征点周边选定若干抽样点;
将抽样点进行两两组合,获得若干抽样点对;
针对至少一个抽样点对执行以下操作:判断一个抽样点对中包含的两个抽样点之间的状态关系是否满足预设条件,若是,则对应所述一个抽样点对设置第一二进制值,否则,对应所述一个抽样点对设置第二二进制值;
将各个抽样点对对应的二进制值进行汇总,将汇总结果输出作为所述一个特征点的内容特征。
可选的,在获得一帧图像对应的提取结果之后,所述转换单元进一步用于:
按照预设的内容特征限制数目,从所述提取结果中采样总数目不高于所述内容特征限制数目的内容特征。
可选的,将获得的若干内容特征转换为相应的特征索引时,所述转换单元用于:
采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的帧图像对应的内容特征进行比特位采样,获得相应的特征索引。
可选的,确定特征索引对应的内容特征集合之后,所述转换单元进一步用于:
基于获得的内容特征建立倒排索引,确定内容特征对应的直播流子片段集合,其中,一个内容特征对应的直播流子片段,为包含所述一个内容特征的帧图像所归属的直播流子片段。
可选的,基于获得的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数时,所述判定单元用于:
计算获得的各个母本片段内容特征命中次数之和;
确定所述设定时间段包含的时间片数目;
计算所述母本片段内容特征命中次数之和与所述时间片数目的比值,作为单位时间母本内容特征命中次数。
可选的,基于所述母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数之前,所述判定单元进一步用于:
针对所述母本包含的至少一个母本片段执行以下操作:
将一个母本片段在所述设定时间段内曾匹配的各个直播流子片段,按照对应的母本片段内容特征命中次数的取值进行排序,获得排序结果;
根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,并保留相应的母本片段内容特征命中次数。
可选的,根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段时,所述判定单元用于:
若所述排序结果表征按照母本片段内容特征命中次数从大到小的顺序进行排序,则选取前k个直播流子片段,其中,第k+1个母本片段内容特征命中次数与第k个母本片段内容特征命中次数的比值低于第一设定阈值;或者
若所述排序结果表征按照母本片段内容特征命中次数从小到大的顺序进行排序,则选取除前k’个直播流子片段之外的其余直播流子片段,其中,第k’个母本片段内容特征命中次数与第k’+1个母本片段内容特征命中次数的比值低于第二设定阈值。
可选的,所述判定单元进一步用于:
针对所述母本包含的母本片段,计算母本片段与在所述述设定时间段内曾匹配的直播流子片段之间的时间片偏移量;
针对所述母本包含的母本片段,统计获得的时间片偏移量取值对应的时间片偏移量数目,进一步筛选出时间片偏移量数目最多的时间片偏移量取值所关联的各个直播流子片段。
本申请实施例中,设计了一种高吞吐、高精度的直播流检测框架,以时间片为粒度,从直播流中提取直播流片段,各个直播流片段并行执行侵权检测,其中,针对一个直播流片段,又将其划分为若干直播流子片段,各个直播流子片段之间并行提取内容特征并转换为特征索引,以及将各个直播流片段包含的各个直播流子片段与母本包含的各个母本片段进行特征索引的查询匹配,根据查询结果,确定直播流相对于母本在设定时间段内的单位时间母本片段内容特征命中次数,在确定单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述直播流侵权,这样,由于采用时间片分片的方式进行并行处理,因此可以实时地构建和释放特征索引,即使是在直播场景下,也可以及时提取直播视频片段的特征索引,通过水平扩展方式加快特征索引的查询匹配速度,同时也能保留特征索引的原本的时序信息,从而能够实时准确地对直播视频的侵权内容进行自动监控,实现直播场景下的版权保护。
附图说明
图1为本申请实施例中侵权检测系统架构示意图;
图2为本申请实施例中侵权检测流程原理示意图;
图3为本申请实施例中直播流侵权检测详细流程图;
图4为本申请实施例中FAST特征提取原理示意图;
图5为本申请实施例中BRISK特征描述子原理示意图;
图6为本申请实施例中直播流时间分片索引示意图;
图7为本申请实施例中采用哈希函数针对内容特征进行比特位采样示意图;
图8为本申请实施例中LSH技术下特征索引结构示意图;
图9为本申请实施例中倒排索引示意图;
图10为本申请实施例中检测服务器结构示意图。
具体实施方式
为了实时准确地对直播视频的侵权内容进行自动监控,实现直播场景下的版权保护,本申请实施例中,预先对版权视频的视频图像内容进行分析,快速提取出多种内容特征,再将提取出的各个内容特征存入特征库并建立索引,其中,所谓内容特征是指图像的纹理、颜色、边缘、形状、局部特征点、运动向量等等从视频图像的内容自身获得的特征,而不是类似关键字、标签、链接等元数据特征,接着,当获得直播流的视频图像内容时,采用相同方式快速获得直播流的内容特征,并在特征库中进行特征搜索和匹配,从而确定直播流的视频图像内容是否包含有侵权内容。
为了便于描述,下面对本申请实施例中使用的技术术语进行预先定义。
直播流片段:按照设定的时长片长度从直播流中截取的视频片段;
直播流子片段:直播流片段经划分后获得的子片段。
内容特征:直播流子片段中包含的视频图像所具有的纹理、颜色、边缘、形状、局部特征点、运动向量等等从视频图像的内容自身获得的特征,
内容特征索引:将内容特征进行比特位采样后获得的索引。
下面结合附图对本申请优选的实施方式作出进一步详细说明。
参阅图1所示,本申请实施例中,由侵权检测集群中的检测服务器对直播视频流(以下简称直播流)进行侵权检测,在检测过程中,检测服务器会从版权视频库中提取版权视频内容与直播流进行匹配,以获得检测结果,最后,再将检测结果呈现给后台进行运营处置。
具体的,本申请实施例中,检测服务器对直播流进行侵权检测时,会按照预设划分的时间片提取相应的直播流片段(即分片检测),再分别针对每一个直播流片段中包含的视频图像内容进行实时版权视频内容比对。因此,在针对直播流进行侵权检测之前,需要设置好待使用的版权视频内容,后续流程中,将具有版权的视频内容简称为母本视频或母本,英文记为reference或ref,)。
本申请实施例中,整个处理流程以直播流包含的片段(stream segment)为粒度,采用时间分片方式处理,stream segment的长度与系统延迟、检测速度、检测精度相关。stream segment的长度越大,系统延迟越大,但精度越高,本申请实施例中,可选的,将stream segment的长度设置为5秒,即积攒5秒的直播流内容为一个stream segment。
参阅图2所示,每个stream segment在整个流程中会经历4个阶段:直播流生成(live)、索引构建(build index)、查询匹配(query)和决策输出(output)。如图2所示,从上到下t0-t3是时间轴,以stream segment的长度为粒度,称时间片。
t0时间片,直播流的第一个片段stream segment[0]处于发起直播并生成直播流内容的live阶段,待该stream segment[0]的内容生成完毕后,进入t1时间片。
t1时间片,直播流的第二个片段stream segment[1]处于发起直播并生成直播流内容的live阶段,而stream segment[0]进入build index阶段,即针对stream segment[0]进行内容特征索引构建,待该stream segment[0]的内容特征索引构建完毕后,进入t2时间片。
t2时间处,直播流的第三个片段stream segment[2]处于发起直播并生成直播流内容的live阶段,stream segment[1]进入build index阶段,而stream segment[0]进入query阶段,即采用母本的内容特征索引对stream segment[0]已构建好的内容特征索引进行查询匹配,之后,进入t3时间片。
t3时间片,直播流的第四个片段stream segment[3]处于发起直播并生成直播流内容的live阶段,stream segment[2]进入build index阶段,stream segment[1]进入query阶段,而stream segment[0]则进入output阶段,即根据查询匹配结果,决策是否发出侵权报警。
在对每一个时间片内对应的直播流片段进行处理时,系统检测时长一般为时间片时长的2倍,如,时间片时长为5秒时,延迟为10秒。如图2所示,检测流程包含的几个阶段是并发处理的,即当stream segment[0]在query阶段时,stream segment[1]在build index阶段,而stream segment[2]在live阶段,其中,live阶段的耗时一般比较固定,即等于时间片时长,为了保证系统的高吞吐、低延迟,build index阶段和query阶段的耗时通常需要小于等于时间片时长,所以将系统检测时长设置为时间片时长的2倍,是为了各个阶段都有充分的时间进行相关处理。
由图2可知,在每个时间片内,均需要对大量的直播流片段进行处理,一个直播流包含的各个直播流片段的侵权检测过程是串行的,而不同直播流包含的各个直播流片段的检测检测过程可以是并发处理的,而系统会在output阶段针对所有直播流片段做出决策。
基于上述运行原理,下面以一个stream segment为例,介绍侵权检测流程的具体实施过程。
参阅图3所示,本申请实施例中,进行侵权检测方法的详细流程如下:
步骤300:按照预设的时间片时长,从直播流中获取该时间片时长当前对应的直播流片段,即stream segment。
具体的,假设时间片时长为5秒,那么,检测服务器每隔5秒,便从当前传播的直播流中读取5秒这一时长所对应的直播流片段,作为待处理的stream segment。
步骤310:对上述stream segment包含的各个帧图像进行内容特征提取,获得相应的若干内容特征。
具体的,为了能够在后续流程中将stream segment与具有版权的母本进行比对,在步骤310中,需要针对stream segment包含的视频图像进行内容特征提取。
在实际应用场景中,侵权的直播流通常存在画中画(Picture in Picture)、模糊(Blur)、图案插入(Insertion of pattern)、重新编码(Strong re-encoding)、噪声(Noise)、对比度调整(Contrast)、色变(Change in gamma)、镜像(Mirroing)、纵横比拉伸(Ratio)、裁剪(Crop)、平移(Shift)、字幕插入(Text insertion)等等变化。显然,侵权的直播流存在的这些变化均是基于视频图像的具体内容产生的,因此,本申请实施例中,直接从stream segment的视频图像内容中提取若干局部特征作为stream segment的内容特征,这样,可以充分体现stream segment在视频内容上产生的变化,以便和具有版权的母本进行区分。
具体的,一个stream segment中可以包含有若干帧图像,而一帧图像中可以包含有若干内容特征,在执行步骤310时,需要先分别对stream segment包含的每一帧图像进行内容特征提取,获得相应的提取结果,再将获得的各个提取结果进行汇总,获得若干内容特征。
本申请实施例中,可以分别采用FAST特征点提取方式以及BRISK特征描述子输出方式来进行内容特征的提取,采用这种两种方式提取的内容特征鲁棒性强且提取速度非常快,使得build index和query这两个阶段耗时控制在可接受范围内。
以一帧图像(以下称为图像A)为例,在对图像A进行内容特征提取时,包括:
首先,采用FAST特征点提取方式在图像A中提取出特征点集合。
具体的,如图4所示,先在图像A包含的各个像素点中选定若干候选点;接着,分别计算每一个候选点的像素值,以及分别计算每一个候选点的周边设定区域中每一个像素点的像素值;然后,分别计算每一个候选点的周边设定区域中,与相应候选点的像素值差值达到预设像素值门限的目标像素点数目;最后,将对应的目标像素点数目达到预设数目门限的候选点选定为特征点。
FAST特征点提取方式是公认的比较快速的特征点提取方法,只需要利用周边像素比较的信息就可以得到特征点,简单,有效。
3)采用BRISK特征描述子输出方式获得每一个特征点对应的特征值。
BRISK,即Binary Robust Invariant Scalable Keypoints,全称“鲁棒尺度不变性二值关键点”。它是一种二值特征描述子,如图5所示,中心的圆点表示已选定的特征点,其余圆点表示特征点周边的抽样点,而抽样点周边的虚线圆半径为用于平滑特征点亮度的高斯核的标准差。
本申请实例中,在选中特征点后,会在特征点周边选定若干抽样点,再将各个抽样点进行两两组合(通常是短距离抽样点之间两两组合),获得若干抽样点对,而BRISK则采用抽样点旋转角度,描述每一组抽样点对包含的两个抽样点之间的状态关系。由于BRISK描述子是二值的,即只有1和0两个取值,那么,会先判断抽样点对包含的两个抽样点之间的状态关系是否满足某种预设条件,若是,则取值为1,否则,取值为0(反之亦可),这样,可以采用“1”或“0”表示某一个抽样点对包含的两个抽样点之间的状态关系是否满足上述预设条件。
本申请实施例中,每一个BRISK描述子均是由短距离点对两两进行比较产生的,一个BRISK描述子通常为一个包含512个比特位的向量,那么,采用一个BRISK描述子,便可以描述一个特征点周边存在的512个抽样点对中每一个抽样点对包含的两个抽样点之间的状态关系,这些状态关系汇总后便可以表示特征点的内容特征,显然,采用BRISK描述子可以快速、高效地输出每一个特征点的内容特征。
进一步地,由于每一帧图像的内容特征数目会因为图像纹理的复杂度不同而有所不同,为了保证整个侵权检测处理过程能够在2个时间片内完成,获得各个帧图像对应的提取结果后,会按照预设的内容特征限制数目(如,200个),分别从每一个提取结果中采样总数目不高于该内容特征限制数目的内容特征(即从一帧图像对应的提取结果中采样的内容特征的总数目不高于200个),其余内容特征删除。
当然,若一帧图像对应的内容特征的数目较少,则也可以不基于内容特征限制数目进行采样,在此不再赘述。
步骤320:将上述stream segment划分为若干直播流子片段(sub_segment),将各个sub_segment对应的内容特征转换为相应的特征索引。
具体的,在执行步骤320时,可选的,检测服务器可以分别针对每一个sub_segment执行以下操作:采用预设的哈希函数集合中的每一个哈希函数,分别针对一个sub_segmennt包含的每一帧图像对应的每一个内容特征进行比特位采样,获得相应的特征索引,基于特征索引和内容特征之间的关联关系,确定每一个特征索引对应的内容特征集合。
本申请实施例中,检测服务器可以同时对多路直播流进行侵权检测,参阅图6所示,假设直播流集合为stream[n],n=0,1,..N,n为直播流的序号,而每路直播流包含的直播流片段为segment[m],m=0,1,...M,m为时间片的序号,当到达时间片m时,会针对stream[n]的segment[m]进行哈希索引构建。如图6所示,在build index区域中,每一行代表在时间片m上的N路stream的segment,每一列表示某一路stream在不同时间片的segment。
进一步地,为了提高处理效率,以及为了进一步保留直播流中原本的时序信息,可选的,可以将各个时间片对应的stream segment进一步划分为若干sub_segment,各个sub_segment之间可以并行处理。本申请实施例中,可选的,可以将各个stream segment划分为4个sub_segment,则时长为5秒的stream segment被分成4个1.25秒的sub_segment集合:sub_segment[i],i=0,1,2,3,分别代表stream segment的0s~1.25s,1.25s~2.5s,2.5s~3.75s,3.75s~5s的4个时间分片。
进一步地,将stream segment划分为4个sub_segment,为了便于在后续流程中,与具有版权的母本进行特征匹配,需要分别针对每一个sub_segment包含的各个帧图像对应的内容特征建立特征索引。本申请实施例中,采用局部敏感哈希(Locality-SensitiveHashing,LSH)技术来生成特征索引,为了提高特征索引的描述准确性,可选的,可以选用多个哈希函数,针对每一个内容特征均生成相应的多个特征索引,本申请实施例中,选取的哈希函数的数目为3个。其中,所谓的LSH技术,是一种用于海量高维数据的近似最近邻快速查找哈希技术,其原理为:将原始数据空间中的两个相邻数据点通过相同的映射或投影变换(projection)后,这两个数据点在新的数据空间中仍然相邻的概率很大,而不相邻的数据点被映射到同一个哈希桶的概率很小。
下面以采用3个哈希函数对一个内容特征中的一段数据进行比特征位采样为例,对LSH技术进行介绍。参阅图7所示,由于内容特征是二值的,针对局部数据进行比特位采样时,不同位置的采样结果不一样,如图7所示,采用三个哈希函数对同一个内容特征进行比特位采样时,可以获得三个不同的特征索引,从而可以表示这一段数据的三个不同特点。因此,采用三个哈希函数,分别对每一个sub segment包含的每一帧图像对应的每一个内容特征进行比特位采样,便可以获得各个sub segment中各帧图像的多种特征索引。
例如,假设如图7所示的一段数据为16比特,那么,采用三个哈希函数进行比特位采样时,三个哈希函数可以分别为:
哈希函数1={bits[x1]}x1=0,1,2,...11;
哈希函数2={bits[x2]}x2=2,...13;
哈希函数3={bits[x3]}x3=4,...15
同理,可以将上述方法实际应用于的512比特的内容特征,用于生成特征索引,在此不再赘述。
采用上述LSH技术构建特征索引,可以在后续与母本进行匹配时,令得索引引擎具有很高的吞吐能力,并能保证较高的检索精度。
以一个哈希函数(以下称为哈希函数x)为例,参阅图8所示,采用哈希函数x对某一个sub_segment(以下称为sub_segment x)包含的各帧图像对应的图像特征进行比特位采样后,共生成了L1个特征索引(以下称为hamming key),每一个hamming key对应一个哈希桶。
实际应用中,不同内容特征经哈希函数x进行比特位采样后,由于采样的是局部数据,因此可能会产生相同的hamming key,所以产生了相同hamming key的内容特征的序号(feature ID)需要记录在对应这一hamming key设置的哈希桶中。
如图8所示,每个hamming key对应的哈希桶中存储了sub_segment x内包含的所有帧图像对应的所有内容特征的序号(即featureID),在特征索引构建过程中,会将sub_segmentx中的所有帧图像对应的所有内容特征,通过哈希函数x获得相应的hamming key,并将内容特征的标识信息写入对应的哈希桶中。
当然,不同sub_segment之间的hamming key的序号可以全局统一排序设置,也可以以sub_segment为单位,各自独立排序设置,在此不再赘述。
图8仅以采用一个哈希函数对一个sub_segment包含的各个帧图像对应的各个内容特征进行比特位采样为例进行说明,若采用多个哈希函数对多个sub_segment分别进行处理时,均可以参考上述方式执行,在此不再一一赘述。
步骤330:基于获得的各个内容特征建立倒排索引,确定每一个内容特征对应的sub_segment集合,其中,一个内容特征对应的sub_segment,为包含该一个内容特征的帧图像所归属的sub_segment。
所谓倒排索引,是一种索引方法,源于实际应用中需要根据属性值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址,也常被称为反向索引、置入档案或反向档案。如,可以被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。它是检索系统中最常用的数据结构,通过倒排索引,可以根据属性值快速获取包含这个属性值的记录。
本申请实施例,按照当前时间片对应的stream segment包含的所有内容特征,对当前时间片对应的stream segment包含的各个sub_segment进行倒排索引,具体如图9所示,由于不同帧图像可以具有相同的内容特征,因此,一个内容特征可以对应多个帧图像,进而对应多个sub_segment,而由于一个sub_segment可以包含有多个帧图像,因此,一个sub_segment也可以对应多个内容特征。
采用上述倒排索引方式,是为了可以根据每一个内容特征迅速查找到包含有这个内容特征的sub_segment,从而在后续流程中,在将当前时间片对应的stream segment对应的各个内容特征的特征索引与具有版权的母本进行匹配时,一旦发现匹配命中的特征索引,可以立即查找到具有这个特征索引的全部内容特征,再根据倒排索引,确定包含有这些内容特征的sub_segment集合。
当然,若内容特征的数目较少,也可以不建立倒排索引,而是根据最后确定匹配命中的内容特征实时查找相应的sub_segment。
如图4所示,由于各个stream segment的特征索引是流式构建的,即特征索引在完成后续的侵权检测后便会被释放,检测服务器便会进行下一个时间片对应的steamsegment的特征索引的构建,从而大大节省磁盘和内存消耗。
另外,每个sub segment采用不同哈希函数构建的特征索引可以分布式部署,水平扩展以支持并发构建和查询,从而提高了特征索引的吞吐量,降低了处理延迟。
步骤340:获取预设的母本,确定母本包含的各个母本片段所对应的若干特征索引。
针对对当前时间片的对应的stream segment包含的所有sub_segment构建完特征索引后,便进入query阶段,此时,需要先获取具有版权的至少一个母本,所谓母本即是具有版权的视频内容,母本的数量可以是一个也可以是多个,如果获取了多个母本,则检测服务器会并行分别进行侵权检测,为了便于描述,后续均以一个母本为例进行说明。
同样地,在预处理阶段,母本也会被采用同样的方式切分成若干视频片段,以及提取出每一个视频片段包含的帧图像的内容特征,并转换为相应的特征索引,即一个母本也会对应至少一个特征索引。
参阅图6所示,在query区域内,每一行表示多个不同的母本,每一列表示某个母本的不同segment,称为ref_segment,将每个ref_segment划分为若干子片段后,采用设定的哈希函数集合(即采用LSH技术)进行比特位采样即可以得到相应的特征索引,即hamming_key。
步骤350:分别针对预设的母本包含的每一个母本片段执行以下操作:基于一个母本片段对应的各个特征索引,对当前时间片对应的stream segment包含的各个sub_segment对应的各个特征索引进行查询匹配,确定匹配成功的特征索引以及对应的匹配成功的内容特征集合;基于该匹配成功的内容特征集合,针对上述一个母本片段计算当前时间片对应的stream segment包含的每一个sub_segment的母本片段内容特征命中次数,其中,母本片段内容特征命中次数表征一个sub_segment与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数。
例如,仍以一个ref_segment(以下称为ref_segment y)为例,对当前时间片对应的stream segment进行侵权检测时,可以基于ref_segment y对应的各个hamming_key和stream segment对应的各个hamming key进行特征索引查询匹配,记录匹配成功的hammingkey,并采用如图8所示的LSH索引结构,根据匹配成功的hamming key查找到对应的匹配成功的feature ID集合,然后,再基于获得的匹配成功的feature ID集合采用如图9所示的倒排索引,确定在当前时间片对应的stream segment中命中的sub_segment集合,其中,每确定匹配成功的feature ID命中一个sub_segment,便需要将这一个sub_segment对应的母本片段内容特征命中次数+1。
例如,ref_segment y与sub_segment i匹配后,针对ref_segment而言sub_segment i对应的母本片段内容特征命中次数可以表示为一个5维匹配统计矩阵MM:
M M [ref_x][ref_y][n][m][i]=hits
其中,ref_x表示第x个母本,x为母本的序号,ref_y表示母本的第y个片段,y为母本片段的序号,n表示第n路直播流,n为直播流的序号,m表示直播流的第m个片段,m为直播流片段的序号,i表示直播流片段的第i个子片段,i为直播流子片段的序号,hits表示第i个直播流子片段与第x个母本的第y个母本片段匹配后,确定的母本片段内容特征命中次数。
由上述公式可以看出,一个sub_segment的母本片段内容特征命中次数是相对于一个ref_segment而言的,同一个sub_segment对应不同的ref_segment具有不同的母本片段内容特征命中次数。
上述矩阵可以随着时间不断更新,在到达当前时间片时,在进行决策时,检测服务器也会使用之前时间片对应的统计结果,称为“记忆时序统计”,即可以设定一个至少包含有当前时间片的时间段,称为设定时间段,检测服务器在进行决策时,可以使用在这个时间段中包含的每一个时间片内曾匹配的每一个sub_segment对应的各个母本片段内容特征命中次数。
另一方面,由于可以采用多个不同的哈希函数分别针对同一内容特征建立不同的特征索引,因此,在后续进行查询匹配过程中,针对某一sub_segment,有可能同一内容特征对应的多个不同的特征索引均匹配成功,那么,这一内容特征便会被视为命中多次,相应的,上述sub_segment对应的母本片段内容特征命中次数便会进行重复累积;进一步地,根据不同应用场景的使用需求,针对包含有重复累积数目的母本片段内容特征命中次数,可以执行去重处理,也可以不执行去重处理,只要所有sub_segment对应的母本片段内容特征命中次数均采用相同方式处理,便不会影响最终的判定结果。
步骤360:针对母本包含的每一个母本片段,分别确定该每一个母本片段在设定时间段内曾匹配的每一个直播流子片段对应的母本片段内容特征命中次数。
由于不同的母本片段在不同的时间片中可以重复利用,因此,各个母本片段在不同时间片中可以与不同的sub_segment分别进行匹配,每一个sub_segment相对于不同的母本片段具有不同的母本片段内容特征命中次数,具体参阅步骤350中的公式,在此不再赘述。
步骤370:分别针对每一个母本片段执行以下操作:将一个母本在上述设定时间段内曾匹配的各个sub_segment,按照对应的母本片段内容特征命次数的取值进行排序,获得排序结果,基于该排序结果针对上述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的sub_segment,并保留相应的母本片段内容特征命中次数。
具体的可以采用但不限于以下两种方式:
第一种方式为:若排序结果表征按照母本片段内容特征命中次数从大到小的顺序进行排序,则选取前k个直播流子片段,其中,第k+1个母本片段内容特征命中次数与第k个母本片段内容特征命中次数的比值低于第一设定阈值(如,0.3);
这样,可以分别针对每一个母本片段,筛选出匹配效果最好的k个sub_segment,便于后续针对整个母本进行侵权性评估打分,如,对于M M [ref_x][ref_y]而言,保留了与第ref_x个母本的第ref_y个片段匹配效果最好的k个sub_segment。同时,为了保证匹配效率,可选的,k的取值不大于预设的数目门限值(如,1000)。
第二种方式为:若排序结果表征按照母本片段内容特征命中次数从小到大的顺序进行排序,则选取除前k’个直播流子片段之外的其余直播流子片段,其中,第k’个母本片段内容特征命中次数与第k’+1个母本片段内容特征命中次数的比值低于第二设定阈值(如,0.3)。
第二种方式的实施效果与第一种方式相同,在此不再赘述。而其中,第一设定阈值和第二设定阈值的取值可以相同,也可以不相同,在此亦不再赘述。
另一方面,可选的,若每一个母本片段在设定时间段内各自曾匹配的sub_segment的数目较少,或者,已确定每一个母本片段在设定时间段内各自曾匹配的sub_segment的匹配效果均较佳,则也可以不执行步骤370,而针对每一个母本片段数目较少
步骤380:针对上述母本包含的每一个母本片段,分别计算每一个母本片段与在上述述设定时间段内曾匹配的每一个sub_segment之间的时间片偏移量;针对上述母本包含的各个母本片段,统计每一种时间片偏移量取值对应的时间片偏移量数目,进一步筛选出对应的时间片偏移量数目最多的时间片偏移量取值所关联的各个sub_segment,并保留相应的母本片段内容特征命中次数。
具体的,一个母本片段ref_y与其曾匹配的一个sub_segment i之间的时间片偏移量可以表达为:
offset=ref_y-(m×4+i)
m为时间片序号,也即是stream segment的序号,4为一个stream segment中包含的sub_segment的数目,本实施例中,仅以“4”为例。
接着,会针对上述母本包含的各个母本片段,统计每一种时间片偏移量取值对应的时间片偏移量数目(如,采用直方图方式统计),进一步筛选出时间片偏移量数目最多的时间片偏移量取值所关联的各个sub_segment;由于不同的母本片段和不同的sub_segment之间可能会出现相同的时间片偏移量取值,因此,上述“对应的时间片偏移量数目最多的时间片偏移量取值(以下称为取值x)所关联的各个sub_segment”,是指在计算各个母本片段与在上述设定时间段内曾匹配的各个sub_segment的时间片偏移量的过程中,获得的所有时间片偏移量取值为取值X的sub_segment(即不区分母本片段)。
执行步骤380后,可以获得相应的矩阵MM的脚标集合:{ref_y*,m*,i*}。
之所以执行步骤380,是为了针对整个母本,进一步筛选出匹配关系具有一定时序约束性的部分sub_segment,因为越具有时序约束性的sub_segment,越能够在整体上体现出是否对母本造成侵权,从而有效降低误匹配率,提高匹配精度。
当然,如果已确定不存在时序约束性问题,或者,已确定时序约束性问题对后续的侵权判定不会造成决定性影响,则也可以不执行步骤380。
步骤390:基于获得的各个母本片段内容特征命中次数,计算直播流相对于母本在上述设定时间段内的单位时间母本片段内容特征命中次数,在确定该单位时间母本片段内容特征命中次数达到设定次数门限时,判定直播流侵权。
例如,假设上述设定时间段包含的时间片数目为m’,m为当前的stream segment的序号,那么,可以采用以下公式计算单位时间母本片段内容特征命中次数,也称为score:
score=(1/m’)∑M M [ref_y*][m*][i*]
在每一个时间片结束时,若确定在当前时间片得到的上述score达到设定分数门限(也可以称为次数门限),则可以直接触发侵权报警,提示管理人员当前直流流侵权。
当然,上述score是随时时间片的推进而不断更新的,由于时序上的约束,持续计算更新的score分数实现高精度、低延迟的侵权内容检测。
当然上述过程以一个母本为例,对于多路母本而言,检测服务器所在的侵权检测集群可以并行处理,并不会影响侵权判定的效率。
基于上述实施例,本申请一个实施例还提供了一种图像检测方法,包括:
获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引;
在母本片段中检索所述特征索引,得到匹配成功的特征索引以及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
确定所述单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述待检测视频图像包含有违规内容。
可选的,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为若干直播流子片段;
从直播流子片段包含的待检测视频图像中提取内容特征;
将提取的内容特征转换为相应的特征索引。
可选的,基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,包括:
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算所述待检测视频图像的母本片段内容特征命中次数;
基于所述母本片段所归属的母本在设定时间段内曾匹配的待检测视频图像的母本片段内容特征命中次数,计算所述母本在所述设定时间段内的单位时间母本内容特征命中次数,其中,所述设定时间段至少包括所述当前时间片。
进一步地,本申请一个实施例中还提供了一种图像检测方法,包括:
获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引;
在母本片段中检索所述特征索引,获得单位时间的检索命中次数;
确定所述检索命中次数达到预设阈值,判定所述待检测视频图像包含目标内容。
可选的,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为至少一个直播流子片段;
对所述直播流子片段并行进行如下处理:从直播流子片段包含的待检测视频图像中提取内容特征,并将所述内容特征转换为相应的特征索引。
可选的,将所述内容特征转换为相应的特征索引,包括:
采用预设的哈希函数集合中的哈希函数,针对所述内容特征进行比特位采样,获得相应的特征索引。
可选的,在母本片段中检索所述特征索引,获得单位时间的检索命中次数,包括:
在母本片段中检索所述特征索引,确定匹配成功的特征索引及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算检索命中次数,其中,检索命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的检索命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间的检索命中次数,其中,所述设定时间段至少包括所述当前时间片。
本申请一个实施例中进一步提供了一种存储介质,存储有用于直播流的侵权检测的程序,所述程序被处理器运行时,执行以下步骤:
按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及将直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,并确定特征索引对应的内容特征集合;
采用一个母本片段对各个直播流子片段进行特征索引查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括所述当前时间片。
本申请一个实施例中,进一步提供了一种计算机装置,包括一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述计算机装置执行上述任一项所述的方法。
参阅图10所示,本申请一个实施例中,一种直播流的侵权检测装置,包括:
转换单元1000,用于按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及将直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,并确定特征索引对应的内容特征集合;
计算单元1001,用于采用一个母本片段对各个直播流子片段进行特征索引查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
判定单元1002,用于基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括所述当前时间片。
可选的、将所述直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引时,转换单元1000用于:
对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果;
将获得的各个提取结果进行汇总,获得所述直播流片段对应的若干内容特征;
将获得的若干内容特征转换为相应的特征索引。
可选的,对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果时,转换单元1000用于:
针对至少一帧图像执行以下操作:
在一帧图像中提取出特征点集合;
提出所述特征点集合中的特征点对应的内容特征;
将所述特征点集合中的特征点对应的内容特征进行汇总,作为相应的提取结果。
可选的,在所述一帧图像中提取出特征点集合时,转换单元1000用于:
在所述一帧图像中选定若干候选点;
计算候选点的像素值,以及计算候选点的周边设定区域中的像素点的像素值;
计算候选点的周边设定区域中,与相应候选点的像素值差值达到预设像素值门限的目标像素点数目;
将对应的目标像素点数目达到预设数目门限的候选点选定为特征点。
可选的,提出所述特征点集合中的个特征点对应的内容特征时,转换单元1000用于:
针对至少一个特征点执行以下操作:
在一个特征点周边选定若干抽样点;
将抽样点进行两两组合,获得若干抽样点对;
针对至少一个抽样点对执行以下操作:判断一个抽样点对中包含的两个抽样点之间的状态关系是否满足预设条件,若是,则对应所述一个抽样点对设置第一二进制值,否则,对应所述一个抽样点对设置第二二进制值;
将各个抽样点对对应的二进制值进行汇总,将汇总结果输出作为所述一个特征点的内容特征。
可选的,在获得一帧图像对应的提取结果之后,所述转换单元进一步用于:
按照预设的内容特征限制数目,从所述提取结果中采样总数目不高于所述内容特征限制数目的内容特征。
可选的,将获得的若干内容特征转换为相应的特征索引时,转换单元1000用于:
采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的帧图像对应的内容特征进行比特位采样,获得相应的特征索引。
可选的,确定特征索引对应的内容特征集合之后,转换单元1000进一步用于:
基于获得的内容特征建立倒排索引,确定内容特征对应的直播流子片段集合,其中,一个内容特征对应的直播流子片段,为包含所述一个内容特征的帧图像所归属的直播流子片段。
可选的,基于获得的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数时,判定单元1002用于:
计算获得的各个母本片段内容特征命中次数之和;
确定所述设定时间段包含的时间片数目;
计算所述母本片段内容特征命中次数之和与所述时间片数目的比值,作为单位时间母本内容特征命中次数。
可选的,基于所述母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数之前,判定单元1002进一步用于:
针对所述母本包含的至少一个母本片段执行以下操作:
将一个母本片段在所述设定时间段内曾匹配的各个直播流子片段,按照对应的母本片段内容特征命中次数的取值进行排序,获得排序结果;
根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,并保留相应的母本片段内容特征命中次数。
可选的,根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段时,判定单元1002用于:
若所述排序结果表征按照母本片段内容特征命中次数从大到小的顺序进行排序,则选取前k个直播流子片段,其中,第k+1个母本片段内容特征命中次数与第k个母本片段内容特征命中次数的比值低于第一设定阈值;或者
若所述排序结果表征按照母本片段内容特征命中次数从小到大的顺序进行排序,则选取除前k’个直播流子片段之外的其余直播流子片段,其中,第k’个母本片段内容特征命中次数与第k’+1个母本片段内容特征命中次数的比值低于第二设定阈值。
可选的,判定单元1002进一步用于:
针对所述母本包含的母本片段,计算母本片段与在所述述设定时间段内曾匹配的直播流子片段之间的时间片偏移量;
针对所述母本包含的母本片段,统计获得的时间片偏移量取值对应的时间片偏移量数目,进一步筛选出时间片偏移量数目最多的时间片偏移量取值所关联的各个直播流子片段。
本申请实施例中,设计了一种高吞吐、高精度的直播流检测框架,以时间片为粒度,从直播流中提取直播流片段,各个直播流片段并行执行侵权检测,其中,针对一个直播流片段,又将其划分为若干直播流子片段,各个直播流子片段之间并行提取内容特征并转换为特征索引,以及将各个直播流片段包含的各个直播流子片段与母本包含的各个母本片段进行特征索引的查询匹配,根据查询结果,确定直播流相对于母本在设定时间段内的单位时间母本片段内容特征命中次数,在确定单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述直播流侵权,这样,由于采用时间片分片的方式进行并行处理,因此可以实时地构建和释放特征索引,即使是在直播场景下,也可以及时提取直播视频片段的特征索引,通过水平扩展方式加快特征索引的查询匹配速度,同时也能保留特征索引的原本的时序信息,从而能够实时准确地对直播视频的侵权内容进行自动监控,实现直播场景下的版权保护。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (19)

1.一种直播流的侵权检测方法,其特征在于,包括:
按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的视频图像对应的内容特征进行比特位采样,获得相应的特征索引,并确定特征索引对应的内容特征集合;
基于一个母本片段对应的各个特征索引,对各个直播流子片段对应的各个特征索引进行查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括当前时间片。
2.如权利要求1所述的方法,其特征在于,将所述直播流子片段包含的视频图像对应的内容特征转换为相应的特征索引,包括:
对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果;
将获得的各个提取结果进行汇总,获得所述直播流片段对应的若干内容特征;
将获得的若干内容特征转换为相应的特征索引。
3.如权利要求2所述的方法,其特征在于,对所述直播流片段包含的帧图像进行内容特征提取,获得相应的提取结果,包括:
针对至少一帧图像执行以下操作:
在一帧图像中提取出特征点集合;
提出所述特征点集合中的特征点对应的内容特征;
将所述特征点集合中的特征点对应的内容特征进行汇总,作为相应的提取结果。
4.如权利要求3所述的方法,其特征在于,在所述一帧图像中提取出特征点集合,具体包括:
在所述一帧图像中选定若干候选点;
计算候选点的像素值,以及计算候选点的周边设定区域中的像素点的像素值;
计算候选点的周边设定区域中,与相应候选点的像素值差值达到预设像素值门限的目标像素点数目;
将对应的目标像素点数目达到预设数目门限的候选点选定为特征点。
5.如权利要求3所述的方法,其特征在于,提出所述特征点集合中的特征点对应的内容特征,包括:
针对至少一个特征点执行以下操作:
在一个特征点周边选定若干抽样点;
将抽样点进行两两组合,获得若干抽样点对;
针对至少一个抽样点对执行以下操作:判断一个抽样点对中包含的两个抽样点之间的状态关系是否满足预设条件,若是,则对应所述一个抽样点对设置第一二进制值,否则,对应所述一个抽样点对设置第二二进制值;
将各个抽样点对对应的二进制值进行汇总,将汇总结果输出作为所述一个特征点的内容特征。
6.如权利要求3、4或5所述的方法,其特征在于,在获得一帧图像对应的提取结果之后,进一步包括:
按照预设的内容特征限制数目,从所述提取结果中采样总数目不高于所述内容特征限制数目的内容特征。
7.如权利要求2所述的方法,其特征在于,将获得的若干内容特征转换为相应的特征索引,包括:
采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的帧图像对应的内容特征进行比特位采样,获得相应的特征索引。
8.如权利要求1所述的方法,其特征在于,确定特征索引对应的内容特征集合之后,进一步包括:
基于获得的内容特征建立倒排索引,确定内容特征对应的直播流子片段集合,其中,一个内容特征对应的直播流子片段,为包含所述一个内容特征的帧图像所归属的直播流子片段。
9.如权利要求1-5、7、8任一项所述的方法,其特征在于,基于获得的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,具体包括:
计算获得的各个母本片段内容特征命中次数之和;
确定所述设定时间段包含的时间片数目;
计算所述母本片段内容特征命中次数之和与所述时间片数目的比值,作为单位时间母本内容特征命中次数。
10.如权利要求9所述的方法,其特征在于,基于所述母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数之前,进一步包括:
针对所述母本包含的至少一个母本片段执行以下操作:
将一个母本片段在所述设定时间段内曾匹配的各个直播流子片段,按照对应的母本片段内容特征命中次数的取值进行排序,获得排序结果;
根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,并保留相应的母本片段内容特征命中次数。
11.如权利要求10所述的方法,其特征在于,根据所述排序结果,针对所述一个母本片段筛选出对应的母本片段内容特征命中次数的取值符合预设筛选条件的直播流子片段,包括:
若所述排序结果表征按照母本片段内容特征命中次数从大到小的顺序进行排序,则选取前k个直播流子片段,其中,第k+1个母本片段内容特征命中次数与第k个母本片段内容特征命中次数的比值低于第一设定阈值;或者
若所述排序结果表征按照母本片段内容特征命中次数从小到大的顺序进行排序,则选取除前k’个直播流子片段之外的其余直播流子片段,其中,第k’个母本片段内容特征命中次数与第k’+1个母本片段内容特征命中次数的比值低于第二设定阈值。
12.如权利要求10所述的方法,其特征在于,进一步包括:
针对所述母本包含的母本片段,计算母本片段与在所述设定时间段内曾匹配的直播流子片段之间的时间片偏移量;
针对所述母本包含的母本片段,统计获得的时间片偏移量取值对应的时间片偏移量数目,进一步筛选出时间片偏移量数目最多的时间片偏移量取值所关联的各个直播流子片段。
13.一种图像检测方法,其特征在于,包括:
获取待检测视频图像的内容特征,并采用预设的哈希函数集合中的哈希函数,针对所述待检测视频图像对应的内容特征进行比特位采样,获得相应的特征索引;
在母本片段中检索所述特征索引,得到匹配成功的特征索引以及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
确定所述单位时间母本片段内容特征命中次数达到设定次数门限时,判定所述待检测视频图像包含有违规内容;
其中,基于匹配成功的特征索引及相应的匹配成功的内容特征集合,计算单位时间母本片段内容特征命中次数,包括:
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算所述待检测视频图像的母本片段内容特征命中次数;
基于所述母本片段所归属的母本在设定时间段内曾匹配的待检测视频图像的母本片段内容特征命中次数,计算所述母本在所述设定时间段内的单位时间母本内容特征命中次数,其中,所述设定时间段至少包括当前时间片。
14.如权利要求13所述的方法,其特征在于,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为若干直播流子片段;
从直播流子片段包含的待检测视频图像中提取内容特征;
将提取的内容特征转换为相应的特征索引。
15.一种图像检测方法,其特征在于,包括:
获取待检测视频图像的内容特征,并采用预设的哈希函数集合中的哈希函数,针对所述内容特征进行比特位采样,获得相应的特征索引;
在母本片段中检索所述特征索引,获得单位时间的检索命中次数;
确定所述检索命中次数达到预设阈值,判定所述待检测视频图像包含目标内容;
其中,在母本片段中检索所述特征索引,获得单位时间的检索命中次数,包括:
在母本片段中检索所述特征索引,确定匹配成功的特征索引及相应的匹配成功的内容特征集合;
基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算检索命中次数,其中,检索命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的检索命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间的检索命中次数,其中,所述设定时间段至少包括当前时间片。
16.如权利要求15所述的方法,其特征在于,获取待检测视频图像的内容特征,并将所述内容特征转换为相应的特征索引,包括:
按照预设的时间片时长从直播流中获取直播流片段;
将获取的直播流片段划分为至少一个直播流子片段;
对所述直播流子片段并行进行如下处理:从直播流子片段包含的待检测视频图像中提取内容特征,并将所述内容特征转换为相应的特征索引。
17.一种存储介质,其特征在于,存储有用于直播流的侵权检测的程序,所述程序被处理器运行时,执行以下步骤:
按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的视频图像对应的内容特征进行比特位采样,获得相应的特征索引,并确定特征索引对应的内容特征集合;
基于一个母本片段对应的各个特征索引,对各个直播流子片段对应的各个特征索引进行查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括当前时间片。
18.一种计算机装置,其特征在于,包括一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述计算机装置执行如权利要求1至17任一项所述的方法。
19.一种直播流的侵权检测装置,其特征在于,包括:
转换单元,用于按照预设的时间片时长从直播流中获取直播流片段,并将获取的直播流片段划分为若干直播流子片段,以及采用预设的哈希函数集合中的哈希函数,针对直播流子片段包含的视频图像对应的内容特征进行比特位采样,获得相应的特征索引,并确定特征索引对应的内容特征集合;
计算单元,用于基于一个母本片段对应的各个特征索引,对各个直播流子片段对应的各个特征索引进行查询匹配,基于匹配成功的特征索引以及相应的匹配成功的内容特征集合,计算直播流子片段的母本片段内容特征命中次数,其中,母本片段内容特征命中次数包括一个直播流子片段与一个母本片段进行匹配时被确定包含有匹配成功的内容特征的次数;
判定单元,用于基于母本在设定时间段内曾匹配的直播流子片段对应的母本片段内容特征命中次数,计算所述直播流相对于所述母本在所述设定时间段内的单位时间母本内容特征命中次数,确定所述单位时间母本内容特征命中次数达到设定次数门限时,判定所述直播流侵权;其中,所述设定时间段至少包括当前时间片。
CN201710338387.5A 2017-05-15 2017-05-15 一种直播流的侵权检测方法及装置 Active CN108881947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710338387.5A CN108881947B (zh) 2017-05-15 2017-05-15 一种直播流的侵权检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710338387.5A CN108881947B (zh) 2017-05-15 2017-05-15 一种直播流的侵权检测方法及装置

Publications (2)

Publication Number Publication Date
CN108881947A CN108881947A (zh) 2018-11-23
CN108881947B true CN108881947B (zh) 2021-08-17

Family

ID=64320420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710338387.5A Active CN108881947B (zh) 2017-05-15 2017-05-15 一种直播流的侵权检测方法及装置

Country Status (1)

Country Link
CN (1) CN108881947B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109831697B (zh) * 2018-12-28 2021-05-21 广州华多网络科技有限公司 违规处理时长的检测方法及系统
CN110381338B (zh) * 2019-07-17 2022-02-18 腾讯科技(深圳)有限公司 视频数据处理与分析方法、装置、设备及介质
CN110324729B (zh) * 2019-07-18 2021-08-27 北京奇艺世纪科技有限公司 一种识别侵权视频链接的方法、装置、电子设备及介质
CN110662113B (zh) * 2019-09-25 2021-06-11 腾讯音乐娱乐科技(深圳)有限公司 视频播放方法、装置和计算机可读存储介质
CN112788363B (zh) * 2020-12-30 2023-04-28 北京奇艺世纪科技有限公司 识别侵权视频的方法、识别侵权视频的装置及电子设备
CN112836600B (zh) * 2021-01-19 2023-12-22 新华智云科技有限公司 一种视频相似度的计算方法与系统
CN113051236B (zh) * 2021-03-09 2022-06-07 北京沃东天骏信息技术有限公司 审核视频的方法、装置及计算机可读存储介质
CN114051163B (zh) * 2021-11-10 2024-03-22 广东触电传媒科技有限公司 一种基于视频字幕比对的版权监测方法及系统
CN113886632B (zh) * 2021-12-03 2022-04-01 杭州并坚科技有限公司 一种基于动态规划的视频检索匹配方法
CN114760472B (zh) * 2022-03-21 2023-05-12 杭州叙简科技股份有限公司 一种基于条带i帧均衡编解码系统及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2444094A (en) * 2006-11-22 2008-05-28 Half Minute Media Ltd Identifying repeating video sections by comparing video fingerprints from detected candidate video sequences
CN102693299A (zh) * 2012-05-17 2012-09-26 西安交通大学 一种并行视频拷贝检测系统和方法
CN103336957A (zh) * 2013-07-18 2013-10-02 中国科学院自动化研究所 一种基于时空特征的网络同源视频检测方法
CN103514293A (zh) * 2013-10-09 2014-01-15 北京中科模识科技有限公司 在视频模板库中进行视频匹配的方法
CN105975939A (zh) * 2016-05-06 2016-09-28 百度在线网络技术(北京)有限公司 视频检测方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0623961D0 (en) * 2006-11-30 2007-01-10 Univ St Andrews Video fingerprinting
EP2321964B1 (en) * 2008-07-25 2018-12-12 Google LLC Method and apparatus for detecting near-duplicate videos using perceptual video signatures
KR20130119781A (ko) * 2012-04-24 2013-11-01 한국전자통신연구원 비디오 중복 검출 장치 및 방법
CN104657383B (zh) * 2013-11-22 2017-11-24 华中科技大学 一种基于关联特性的重复视频检测方法与系统
CN106454385B (zh) * 2015-08-04 2019-06-25 中国科学院深圳先进技术研究院 视频帧篡改检测方法
CN105681899B (zh) * 2015-12-31 2019-05-10 北京奇艺世纪科技有限公司 一种相似视频和盗版视频的检测方法及装置
CN105608233A (zh) * 2016-02-26 2016-05-25 北京大学 一种基于改进的om特征的视频拷贝检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2444094A (en) * 2006-11-22 2008-05-28 Half Minute Media Ltd Identifying repeating video sections by comparing video fingerprints from detected candidate video sequences
CN102693299A (zh) * 2012-05-17 2012-09-26 西安交通大学 一种并行视频拷贝检测系统和方法
CN103336957A (zh) * 2013-07-18 2013-10-02 中国科学院自动化研究所 一种基于时空特征的网络同源视频检测方法
CN103514293A (zh) * 2013-10-09 2014-01-15 北京中科模识科技有限公司 在视频模板库中进行视频匹配的方法
CN105975939A (zh) * 2016-05-06 2016-09-28 百度在线网络技术(北京)有限公司 视频检测方法和装置

Also Published As

Publication number Publication date
CN108881947A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN108881947B (zh) 一种直播流的侵权检测方法及装置
US11126654B1 (en) Method and apparatus for multi-dimensional content search and video identification
AU2017204338B2 (en) Industry first method that uses users search query to show highly relevant poster frames for stock videos thereby resulting in great experience and more sales among users of stock video service
RU2628192C2 (ru) Устройство для семантической классификации и поиска в архивах оцифрованных киноматериалов
EP3477506A1 (en) Video detection method, server and storage medium
US10878280B2 (en) Video content indexing and searching
EP2742459B1 (en) Methods and apparatus for comparing videos
CN108427925B (zh) 一种基于连续拷贝帧序列的拷贝视频检测方法
CN106557545B (zh) 视频检索方法和装置
US20090274364A1 (en) Apparatus and methods for detecting adult videos
CN104520875A (zh) 优选用于搜索和检索目的的从视频内容提取描述符的方法和装置
CN111182364B (zh) 一种短视频版权检测方法及系统
CN111651636A (zh) 视频相似片段搜索方法及装置
CN110688524A (zh) 视频检索方法、装置、电子设备及存储介质
CN112257595A (zh) 视频匹配方法、装置、设备及存储介质
CN112199582A (zh) 一种内容推荐方法、装置、设备及介质
CN108966042B (zh) 一种基于最短路径的视频摘要生成方法及装置
CN112069331A (zh) 一种数据处理、检索方法、装置、设备及存储介质
Chiu et al. Efficient video segment matching for detecting temporal-based video copies
Ren et al. Visual words based spatiotemporal sequence matching in video copy detection
Rodrıguez Codebook-Based Near-Duplicate Video Detection
CN114612834A (zh) 程序化创意视频片段去重方法、系统、设备及存储介质
CN117150062A (zh) 一种基于深度学习和特征匹配的侵权图像检测方法及系统
Chiu et al. Scalable near-duplicate video stream monitoring
Dutta et al. Indexing Video Database for a CBVCD System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant