CN110198473A - 视频处理方法、装置、电子设备及计算机可读存储介质 - Google Patents

视频处理方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110198473A
CN110198473A CN201910498004.XA CN201910498004A CN110198473A CN 110198473 A CN110198473 A CN 110198473A CN 201910498004 A CN201910498004 A CN 201910498004A CN 110198473 A CN110198473 A CN 110198473A
Authority
CN
China
Prior art keywords
video
probability
target video
similarity
condition codes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910498004.XA
Other languages
English (en)
Other versions
CN110198473B (zh
Inventor
何轶
李�根
李磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910498004.XA priority Critical patent/CN110198473B/zh
Publication of CN110198473A publication Critical patent/CN110198473A/zh
Application granted granted Critical
Publication of CN110198473B publication Critical patent/CN110198473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供了一种视频处理方法、装置、电子设备及计算机可读存储介质。该方法包括:确定目标视频的多帧图像分别映射至预设的多个特征码的相应概率,以得到多帧图像分别对应的第一概率集合;基于多帧图像分别对应的第一概率集合,确定多个特征码分别与相应目标概率集合的对应关系;基于多个特征码分别与相应目标概率集合的所述对应关系,确定目标视频映射至多个特征码的相应概率;确定为目标视频的候选特征码集合;基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与所述至少一个预存视频的相似度;基于相似度,确定对目标视频执行的操作。本申请实施例提高了对视频进行处理的精度以及效率。

Description

视频处理方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及视频识别技术领域,具体而言,本申请涉及一种视频处理方法、装置、电子设备及计算机可读存储介质。
背景技术
近年来,随着多媒体和计算机技术的飞速发展,视频由于包含丰富的内容,已逐渐成为当下信息表达和传播的主流。因而,如何对视频进行识别越来越重要。
现有的对视频进行识别的技术主要存在如下方式:一、为视频的每帧图像映射一个特征码,将映射的所有特征码作为视频的特征码集合,根据不同视频的特征码集合计算相似性,这种方式因将不同图像可能映射至相同的特征码,存在因映射同一特征码导致图像特征损失过大,无法考虑到不同图像的差异性,进而导致图像间相似度的判断的准确度低的问题;二、对视频的每帧图像均映射多个特征码,这种方式虽然解决了图像特征损失大的问题,但当视频的图像过多时,导致对不同视频的相似度的计算消耗大且效率低的问题。
发明内容
本申请提供了一种视频处理方法、装置、电子设备及计算机可读存储介质,可以解决上述技术问题。所述技术方案如下:
第一方面,提供了一种视频处理方法,该方法包括:
确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以得到多帧图像分别对应的第一概率集合;
基于目标视频的多帧图像分别对应的第一概率集合,确定多个特征码分别与相应的目标概率集合的对应关系,针对任一特征码相对应的目标概率集合包括多帧图像分别映射至该任一特征码的概率;
在目标视频映射至多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为目标视频的候选特征码集合;
基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度;
基于相似度,确定对目标视频执行的操作。
第二方面,提供了一种视频处理装置,该装置包括:
图像帧概率确定模块,用于确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以得到多帧图像分别对应的第一概率集合;
概率集合确定模块,用于基于所述多帧图像分别对应的第一概率集合,确定多个特征码分别与相应的目标概率集合的对应关系,针对任一特征码相对应的目标概率集合包括所述多帧图像分别映射至该任一特征码的概率;
视频概率确定模块,用于基于所述多个特征码分别与相应的目标概率集合的所述对应关系,确定所述目标视频映射至多个特征码的相应概率;
候选特征码确定模块,用于在所述目标视频映射至所述多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为所述目标视频的候选特征码集合;
相似度计算模块,用于基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定所述目标视频与至少一个预存视频的相似度;
视频处理模块,用于根据所述相似度,确定对所述目标视频执行的操作。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行上述视频处理方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述视频处理方法。
本申请实施例提供的技术方案带来的有益效果是:通过确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以便确定多个特征码分别与相应目标概率集合的对应关系,从而基于各个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率,起到了将图像与多个特征码的概率对应关系向目标视频与多个特征码的概率对应关系转换的作用,进而基于概率的顺序,在目标视频映射至多个特征码的相应概率中,将各个特征码中前预定数量概率对应的特征码确定为目标视频的候选特征码集合,基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度,并根据相似度确定对目标视频执行的操作,既考虑到视频的不同帧图像间的差异性,提高了视频的不同帧图像的区分度以及对不同视频进行识别的精确度,又降低了不同视频的相似度的计算消耗,提高了相似度计算的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种视频处理方法的流程示意图;
图2为本申请实施例提供的一种视频处理方法中确定目标视频映射至多个特征码的相应概率的流程示意图;
图3为本申请实施例提供的一种视频处理装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种视频处理方法,如图1所示,该方法包括:步骤S101至步骤S106。
步骤S101、确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以得到多帧图像分别对应的第一概率集合。
本申请实施例中,目标视频的多帧图像可以是目标视频的所有图像帧,也可以是目标视频的关键帧图像,具体应用时,可以根据需要进行确定。例如,若多帧图像为目标视频的关键帧图像,那么可以预先在目标视频中进行标记,并直接对关键帧进行处理;或者是利用关键帧提取方法(如OpenCV+pillow)提取目标视频的关键帧后,执行该步骤。
本申请实施例中,预设的多个特征码均通过比特进行表示,具体地,可以通过确定特征码的比特位的位数来确定各个特征码,例如,若特征码的比特位的位数为3,那么预设的特征码的数量为8,且分别为:000、001、010、011、100、101、110、111,具体地,多个特征码的比特位的位数可以根据实际需要进行设定。
具体应用时,可以采用任意一种降维方法(如特征哈希、神经网络等方法)对待识别视频的各帧图像进行处理,将原始的高维特征向量(即原图像)压缩成较低维特征向量,从而确定待识别视频的各帧图像分别映射至预设的各个特征码的概率。
步骤S102、基于多帧图像分别对应的第一概率集合,确定多个特征码分别与相应的目标概率集合的对应关系,针对任一特征码相对应的目标概率集合包括多帧图像分别映射至该任一特征码的概率。
例如,假设目标视频V共有两帧图像,分别为图片image1和图片image2,图片image1分别映射000、001、010、011、100、101、110、111的概率分别为p11、p12、p13、p14、p15、p16、p17、p18;图片2映射000、001、010、011、100、101、110、111的概率分别为p21、p22、p23、p24、p25、p26、p27、p28,因此,特征码“000”相应的目标概率集合为{p11,p21},特征码“001”对应的目标概率集合为{p12,p22},以此类推,直至得到每个特征码相应的目标概率集合。通过该步骤将目标视频的概率按照特征码进行统计,为后续确定目标视频映射至多个特征码的概率提供数据基础。
步骤S103、基于多个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率。
由于每个特征码相应的目标概率集合是目标视频中多帧图像分别映射至该特征码的概率得到的,因此,可以确定每个特征码映射至目标视频的概率,即得到了多个特征码分别属于目标视频的概率。
例如,假设目标视频为V,V可以看成多张图片的集合,V若表征为V={I0,I1,...,In},其中,In表示目标视频V的图片,本申请中每张图片对应一个第一概率集合,即对应一个hash code的概率分布。
若P(C∈h(v))=1-ΠI[1-P(C∈h(I))],其中,1-P(C∈h(I))表征任一特征码不属于图片I的概率,ΠI[1-P(C∈h(I))]表征任一特征码(即hash code)不属于目标视频V中任何一张图片的概率,那么1-ΠI[1-P(C∈h(I))]则表征任一特征码(即hash code)属于目标视频C中一个image的概率,即任一特征码属于目标视频V的概率;因此,基于上述公式从而可以得到目标视频V映射至多个特征码的相应概率,得到目标视频V关于hash code的概率分布。
步骤S104、在目标视频映射至多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为目标视频的候选特征码集合。
本申请实施例中,可以依据精度要求确定预定数量,具体地,若精度要求高,则可以将预定数量设置为较大的值;若精度要求低,则可以将预定数量设置为较小的值。例如,若预定数量为2,那么候选特征码集合包括的是概率最大的两个特征码,若要求提高图像识别精度,则可以将预定数量修改为大于2的值,如修改为5。
步骤S105、基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度。
本申请实施例中,至少一个预存视频可以是利用爬虫在视频平台抓取到的视频。
具体应用时,至少一个预存视频对应的特征码集合可以是预先存储的,也可以在执行步骤S105时进行确定。具体可以参照步骤S101至步骤S103确定的;也可也是参照步骤S101至步骤S104确定的各个预存视频对应的候选特征码集合,通过步骤S104,对各个预存视频对应的特征码集合中特征码的数量进行限制,达到控制目标视频与至少一个预存视频相似度的计算消耗的目的。
步骤S106、基于相似度,确定对目标视频执行的操作。
本申请实施例,通过确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以便确定多个特征码分别与相应目标概率集合的对应关系,从而基于各个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率,起到了将图像与多个特征码的概率对应关系向目标视频与多个特征码的概率对应关系转换的作用,进而基于概率的顺序,在目标视频映射至多个特征码的相应概率中,将各个特征码中前预定数量概率对应的特征码确定为目标视频的候选特征码集合,基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度,并根据相似度确定对目标视频执行的操作,既考虑到视频的不同帧图像间的差异性,提高了视频的不同帧图像的区分度以及对不同视频进行识别的精确度,又降低了不同视频的相似度的计算消耗,提高了相似度计算的效率。
在一个实现方式中,如图1所示,步骤S101中确定目标视频的多帧图像分别映射至预设的多个特征码的概率,包括:
步骤S1011(图中未示出)、将目标视频输入预设的神经网络,得到多帧图像分别对应的多维向量,多帧图像中任一帧图像分别对应的多维向量的维度均相同;
步骤S1012(图中未示出)、基于各个多维向量的维度,确定预设的各个特征码,并计算多个特征码分别对应的多个比特位的值分别属于多帧图像分别对应的多维向量的概率;
步骤S1013(图中未示出)、依据多个特征码分别对应的多个比特位的值分别属于多帧图像分别对应的多维向量的概率,确定各个特征码分别属于各帧图像分别对应的多维向量的概率,以将多个特征码分别属于各帧图像分别对应的多维向量的概率,确定为多帧图像映射至预设的多个特征码的相应概率。
本申请实施例中,通过神经网络实现了将目标视频的多帧图像进行降维的目的,得到相应的多维向量,为后续确定目标视频的多帧图像映射至预设的多个特征码的相应概率提供基础。
例如,假设卷积神经网络模型输出的多维向量的维度为3,那么预设的特征码的个数为8,各个特征码的比特位为3,且这8个特征码分别为000、001、010、011、100、101、110、111。由于每个特征码的比特位的位数均为3。例如,若多维向量P为(p1,p2,p3),若Pi表示特征码的第i个比特取值为1的概率,那么,特征码“000”的第一个比特“0”取值为p1的概率为(1-p1),第二个比特取值为p2的概率为(1-p2),第三个比特取值为p3的概率为(1-p3),那么“000”属于多维向量(p1,p2,p3)的概率为:(1-p1)*(1-p2)*(1-p3);同理,“001”属于多维向量(p1,p2,p3)的概率为:(1-p1)*(1-p2)*p3。
具体应用时,目标视频可以以一定的速度输入至卷积神经网络,例如以每秒2帧图像的速度输入。
具体应用时,为了降低卷积神经网络的计算量,在将目标视频输入至卷积神经网络模型之前,可以对目标视频进行处理,保证目标视频的每一帧图像的图像大小符合卷积神经网络的输入要求,例如将目标视频的每一帧图像的图像大小处理为64*64大小。
在又一个实现方式中,若目标视频是依据视频存储请求获取到的,如图1所示,步骤S106根据相似度,确定对目标视频执行的操作,包括:
步骤S1061(图中未示出)、若相似度大于第一预设相似度阈值,则对目标视频及至少一个预存视频进行去重处理;
步骤S1062(图中未示出)、若相似度不大于第一预设相似度阈值,则对目标视频进行存储处理。
具体应用时,至少一个预存视频一般存储在指定数据库,若目标视频与任一预存视频的相似度大于第一预设相似度阈值,那么对目标视频和该预存视频执行去重处理,否则进行存储。实际应用时,在将目标视频与指定数据库中任一预存视频进行相似度计算之前,可以依据该数据库中任意两个预存视频分别对应的特征码集合,计算该数据库中这任意两个预存视频的相似度,若相似度大于该数据库中预设的相似度阈值,则对该数据库执行去重处理,防止因该数据库存储有两个甚至两个以上相同的视频,导致的存储空间浪费问题。例如,假设X数据库中存储有3个视频,分别为视频1、视频2和视频3,那么这三个视频分别对应的特征码集合,若通过计算,视频1与视频2的相似度大于该数据库的相似度阈值,那么对该数据库中视频1和视频2执行去重处理,最终该数据库中仅存储视频1或视频2,实现对该数据库的去重。
在又一个实现方式中,如图1所示,若目标视频是依据视频检索请求获取的,步骤S106根据相似度,确定对目标视频执行的操作,包括:
步骤S1063(图中未示出)、将相似度大于第二预设相似度阈值的至少一个预存视频作为视频检索请求对应的视频检索结果。
本申请实施例中,通过视频检索请求确定待检索视频,例如,通过某视频检索网站查询关于“甄X传”的视频,具体地,用户可以在视频检索网站直接输入目标视频,以便视频检索网站依据该目标视频查询与该目标视频相似的视频,并将查询到的视频作为视频检索结果,显示在该视频检索网页的内容显示区。具体应用时,可以先在该视频检索网站输入查询语句(如“甄X传”),该图片检索网站先依据该查询语句显示关于“甄X传”的全部视频,以便用户从中进行选择,最终将用户选定的视频作为目标视频,并按照步骤S101至步骤S104得到该目标视频的候选特征码集合。
在又一个实现方式中,如图2所示,步骤S103基于多个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率,包括:
步骤S1031、依据多个特征码分别与相应的目标概率集合的对应关系,计算多个特征码分别不属于目标视频的概率;
步骤S1032、基于多个特征码分别不属于目标视频的概率,确定多个特征码分别属于目标视频的概率。
例如,若目标视频V包括图像image1和图像image2,假设特征码“000”相应的概率集合为(p1,p2),其中,p1为图像image1映射至“000”的概率,p2为图像image2映射至“000”的概率,因此,特征码“000”不属于p1的概率为1-p1,不属于p2的概率为1-p2,因此,特征码“000”既不属于p1,也不属于p2的概率为(1-p1)*(1-p2),即不属于视频V的概率为(1-p1)*(1-p2),因此,属于视频V的概率为[1-(1-p1)*(1-p2)],直至计算出所有特征码各自属于视频V的概率。
实施例二
下面以应用本申请提供的方法的网站为例,对本申请进行进一步说明。
假设视频A为目标视频,用户将视频A上传至网站后,服务器获取到视频A,并对视频A的每帧图像均进行映射,映射至预设的各个特征码。假设视频A由图像1和图像2组成,预设的各个特征码分别为:000、001、010、011、100、101、110、111,映射后图像1对应的概率集合为集合1(p11、p12、p13、p14、p15、p16、p17、p18);图像2对应的概率集合为集合2(p21、p22、p23、p24、p25、p26、p27、p28),根据集合1和集合2能够得到:
“000”对应的概率集合为(p11,p21);
“001”对应的概率集合为(p12,p22);
“010”对应的概率集合为(p13,p23);
“011”对应的概率集合为(p14,p24);
“100”对应的概率集合为(p15,p25);
“101”对应的概率集合为(p16,p26);
“110”对应的概率集合为(p17,p27);
“111”对应的概率集合为(p18,p28);
那么依据上述关系,可以计算“000”不属于(p11,p21)的概率为(1-p11)*(1-p21),因此,
“000”属于(p11,p21)的概率为P1=[1-(1-p11)*(1-p21)],同理,计算出:
“001”属于(p12,p22)的概率为P2=[1-(1-p12)*(1-p22)];
“010”属于(p13,p23)的概率为P3=[1-(1-p13)*(1-p23)];
“011”属于(p14,p24)的概率为P4=[1-(1-p14)*(1-p24)];
“100”属于(p15,p25)的概率为P5=[1-(1-p15)*(1-p25)];
“101”属于(p16,p26)的概率为P6=[1-(1-p16)*(1-p26)];
“110”属于(p17,p27)的概率为P7=[1-(1-p17)*(1-p27)];
“111”属于(p18,p28)的概率为P8=[1-(1-p18)*(1-p28)],因此,视频A分别映射至000、001、010、011、100、101、110、111的概率分别为(P1,P2,P3,P4,P5,P6,P7,P8)。若P1和P2最大,那么选定概率最大的两个特征码000和001作为视频A的候选特征码集合,那么将(000,001)与该网站存储的视频的特征码集合进行比较,若将(000,001)与该网站视频B对应的特征码集合进行计算的相似度大于相似度阈值,那么确定视频A与视频B相似。
具体应用时,服务器将该视频A和该网站的图片数据库进行去重处理;或者,若该网站是具有侵权判定的功能的网站,那么服务器可以认定视频A存在侵权风险,并生成存在侵权分析的提示信息后发送给该网站。
若将(000,001)与该网站视频B对应的特征码集合进行计算的相似度不大于相似度阈值,那么服务器可以将视频A存储至该网站的图片数据库。
实施例三
本申请实施例提供了一种视频处理装置,如图3所示,该视频处理装置30可以包括:图像帧率确定模块301、概率集合确定模块302、视频概率确定模块303、候选特征码确定模块304、相似度计算模块305以及视频处理模块306,其中,
图像帧率确定模块301,用于确定目标视频的多帧图像分别映射至预设的多个特征码的相应概率,以得到多帧图像分别对应的第一概率集合;
概率集合确定模块302,用于基于目标视频的多帧图像分别对应的第一概率集合,确定多个特征码分别与相应目标概率集合的对应关系,针对任一特征码相应的目标概率集合包括多帧图像分别映射至该任一特征码的概率;
视频概率确定模块303,用于基于多个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率;
候选特征码确定模块304,用于在目标视频映射至多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为目标视频的候选特征码集合;
相似度计算模块305,用于基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度;
视频处理模块306,用于根据相似度,确定对目标视频执行的操作。
本申请实施例,通过确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以便确定多个特征码分别与相应目标概率集合的对应关系,从而基于各个特征码分别与相应目标概率集合的对应关系,确定目标视频映射至多个特征码的相应概率,起到了将图像与多个特征码的概率对应关系向目标视频与多个特征码的概率对应关系转换的作用,进而基于概率的顺序,在目标视频映射至多个特征码的相应概率中,将各个特征码中前预定数量概率对应的特征码确定为目标视频的候选特征码集合,基于目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定目标视频与至少一个预存视频的相似度,并根据相似度确定对目标视频执行的操作,既考虑到视频的不同帧图像间的差异性,提高了视频的不同帧图像的区分度以及对不同视频进行识别的精确度,又降低了不同视频的相似度的计算消耗,提高了相似度计算的效率。
进一步地,图像帧概率确定模块用于:
将目标视频输入预设的神经网络模型,得到目标视频的多帧图像分别对应的多维向量,任一帧图像分别对应的多维向量的维度均相同;
基于各个多维向量的维度,确定预设的多个特征码,并计算多个特征码分别对应的多个比特位的值分别属于多帧图像分别对应的多维向量的概率;
依据多个特征码分别对应的多个比特位的值分别属于多帧图像分别对应的多维向量的概率,确定多个特征码分别属于多帧图像分别对应的多维向量的概率,以将多个特征码分别属于各帧图像分别对应的多维向量的概率,确定为目标视频的多帧图像分别映射至预设的多个特征码的概率。
进一步地,若目标视频是依据视频存储请求获取到的,视频处理模块用于:
若相似度大于第一预设相似度阈值,则对目标视频及至少一个预存视频进行去重处理;
若相似度不大于第一预设相似度阈值,则对面部视频进行存储处理。
进一步地,若目标视频是依据视频检索请求获取到的,视频处理模块用于:
将相似度大于第二预设相似度阈值至少一个预存视频,作为视频检索请求对应的视频搜索结果。
进一步地,视频概率确定模块用于:
依据多个特征码分别与相应的目标概率集合的对应关系,计算多个特征码分别不属于目标视频的概率;
基于多个特征码分别不属于目标视频的概率,确定多个特征码分别属于目标视频的概率。
本实施例的视频处理装置可执行本申请实施例一提供的视频处理方法,其实现原理相类似,此处不再赘述。
实施例四
下面参考图4,其示出了适于用来实现本申请实施例的电子设备400的结构示意图。本申请实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本申请实施例的方法中限定的上述功能。
需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种视频处理方法,其特征在于,包括:
确定目标视频的多帧图像分别映射至预设的多个特征码的相应概率,以得到所述多帧图像分别对应的第一概率集合;
基于所述多帧图像分别对应的第一概率集合,确定所述多个特征码分别与相应的目标概率集合的对应关系,针对任一特征码相对应的目标概率集合包括所述多帧图像分别映射至该任一特征码的概率;
基于多个特征码分别与相应目标概率集合的所述对应关系,确定所述目标视频映射至所述多个特征码的相应概率;
在所述目标视频映射至所述多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为所述目标视频的候选特征码集合;
基于所述目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定所述目标视频与所述至少一个预存视频的相似度;
基于所述相似度,确定对所述目标视频执行的操作。
2.根据权利要求1所述的方法,其特征在于,所述确定目标视频的多帧图像分别映射至预设的多个特征码的相应概率,包括:
将所述目标视频输入预设的神经网络模型,得到所述目标视频的所述多帧图像分别对应的多维向量,所述多帧图像中任一帧图像分别对应的多维向量的维度均相同;
基于多个多维向量的维度,确定预设的多个特征码,并计算多个特征码分别对应的多个比特位中任一比特位的值分别属于多帧图像分别对应的多维向量的概率;
依据多个特征码分别对应的多个比特位中任一比特位的值分别属于所述多帧图像分别对应的多维向量的概率,确定多个特征码分别属于所述多帧图像分别对应的多维向量的概率,以将多个特征码分别属于所述多帧图像分别对应的多维向量的概率,确定为所述多帧图像分别映射至预设的多个特征码的相应概率。
3.根据权利要求1所述的方法,其特征在于,若所述目标视频是依据视频存储请求获取到的,所述根据所述相似度,确定对所述目标视频执行的操作,包括:
若所述相似度大于第一预设相似度阈值,则对所述目标视频及所述至少一个预存视频进行去重处理;
若所述相似度不大于第一预设相似度阈值,则对所述目标视频进行存储处理。
4.根据权利要求1所述的方法,其特征在于,若所述目标视频是依据视频检索请求获取到的,所述根据所述相似度,确定对所述目标视频执行的操作,包括:
将所述相似度大于第二预设相似度阈值的至少一个预存视频作为所述视频检索请求对应的视频搜索结果。
5.根据权利要求1所述的方法,其特征在于,所述基于多个特征码分别与相应的目标概率集合的对应关系,确定所述目标视频映射至多个特征码的相应概率,包括:
依据多个特征码分别与相应的目标概率集合的对应关系,计算多个特征码分别不属于所述目标视频的概率;
基于多个特征码分别不属于所述目标视频的概率,确定多个特征码分别属于所述目标视频的概率。
6.一种视频处理装置,其特征在于,包括:
图像帧概率确定模块,用于确定目标视频的多帧图像分别映射至预设的多个特征码的概率,以得到所述多帧图像分别对应的第一概率集合;
概率集合确定模块,用于基于所述多帧图像分别对应的第一概率集合,确定多个特征码分别与相对应的目标概率集合的对应关系,针对任一特征码相对应的目标概率集合包括所述多帧图像分别映射至该任一特征码的概率;
视频概率确定模块,用于基于所述多个特征码分别与相应的目标概率集合的所述对应关系,确定所述目标视频映射至多个特征码的相应概率;
候选特征码确定模块,用于在所述目标视频映射至所述多个特征码的相应概率中,将按照降序排序在前预定数量的概率对应的特征码确定为所述目标视频的候选特征码集合;
相似度计算模块,用于基于所述目标视频的候选特征码集合以及至少一个预存视频分别对应的特征码集合,确定所述目标视频与至少一个预存视频的相似度;
视频处理模块,用于基于所述相似度,确定对所述目标视频执行的操作。
7.根据权利要求6所述的装置,其特征在于,若所述目标视频是依据视频存储请求获取到的,所述视频处理模块用于:
若所述相似度大于第一预设相似度阈值,则对所述目标视频及各预存视频进行去重处理;
若所述相似度不大于第一预设相似度阈值,则对所述目标视频进行存储处理。
8.根据权利要求6所述的装置,其特征在于,若所述目标视频是依据视频检索请求获取到的,所述视频处理模块用于:
将所述相似度大于第二预设相似度阈值至少一个预存视频,作为相应所述视频检索请求的视频搜索结果。
9.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1-5任一项所述的视频处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述的视频处理方法。
CN201910498004.XA 2019-06-10 2019-06-10 视频处理方法、装置、电子设备及计算机可读存储介质 Active CN110198473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910498004.XA CN110198473B (zh) 2019-06-10 2019-06-10 视频处理方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910498004.XA CN110198473B (zh) 2019-06-10 2019-06-10 视频处理方法、装置、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110198473A true CN110198473A (zh) 2019-09-03
CN110198473B CN110198473B (zh) 2021-07-20

Family

ID=67754302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910498004.XA Active CN110198473B (zh) 2019-06-10 2019-06-10 视频处理方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110198473B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294610A (zh) * 2020-02-20 2020-06-16 北京奇艺世纪科技有限公司 一种视频处理方法及装置
CN111461906A (zh) * 2020-05-28 2020-07-28 深圳麦亚信科技股份有限公司 车险快速理赔方法、装置、计算机设备及存储介质
CN112861565A (zh) * 2019-11-12 2021-05-28 上海高德威智能交通系统有限公司 确定轨迹相似度的方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110229045A1 (en) * 2010-03-16 2011-09-22 Nec Laboratories America, Inc. Method and system for image classification
CN103336963A (zh) * 2013-07-08 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种图像特征提取的方法及装置
CN104574440A (zh) * 2014-12-30 2015-04-29 安科智慧城市技术(中国)有限公司 一种视频运动目标跟踪方法及装置
CN106028158A (zh) * 2016-05-26 2016-10-12 成都掌中全景信息技术有限公司 一种基于多视频源的进度识别方法
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN106295541A (zh) * 2016-08-03 2017-01-04 乐视控股(北京)有限公司 车辆类型识别方法及系统
CN107291936A (zh) * 2017-07-04 2017-10-24 太原理工大学 一种基于视觉特征和征象标签的超图哈希图像检索实现肺结节征象识别的方法
CN108171136A (zh) * 2017-12-21 2018-06-15 浙江银江研究院有限公司 一种多任务卡口车辆以图搜图的系统及方法
CN109495784A (zh) * 2018-11-29 2019-03-19 北京微播视界科技有限公司 信息推送方法、装置、电子设备及计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110229045A1 (en) * 2010-03-16 2011-09-22 Nec Laboratories America, Inc. Method and system for image classification
CN103336963A (zh) * 2013-07-08 2013-10-02 天脉聚源(北京)传媒科技有限公司 一种图像特征提取的方法及装置
CN104574440A (zh) * 2014-12-30 2015-04-29 安科智慧城市技术(中国)有限公司 一种视频运动目标跟踪方法及装置
CN106028158A (zh) * 2016-05-26 2016-10-12 成都掌中全景信息技术有限公司 一种基于多视频源的进度识别方法
CN106156284A (zh) * 2016-06-24 2016-11-23 合肥工业大学 基于随机多视角哈希的大规模近重复视频检索方法
CN106295541A (zh) * 2016-08-03 2017-01-04 乐视控股(北京)有限公司 车辆类型识别方法及系统
CN107291936A (zh) * 2017-07-04 2017-10-24 太原理工大学 一种基于视觉特征和征象标签的超图哈希图像检索实现肺结节征象识别的方法
CN108171136A (zh) * 2017-12-21 2018-06-15 浙江银江研究院有限公司 一种多任务卡口车辆以图搜图的系统及方法
CN109495784A (zh) * 2018-11-29 2019-03-19 北京微播视界科技有限公司 信息推送方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHIYAN HU: "《Efficient video retrieval by locality sensitive hashing》", 《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2005》 *
白亮,贾玉华,王昊冉,谢毓湘,于天元: "《基于局部敏感哈希算法和神经网络学习的跨媒体检索方法》", 《国防科技大学学报》 *
陈飞,吕绍和,李军,王晓东,窦勇: "《目标提取与哈希机制的多标签图像检索》", 《中国图象图形学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861565A (zh) * 2019-11-12 2021-05-28 上海高德威智能交通系统有限公司 确定轨迹相似度的方法、装置、计算机设备和存储介质
CN112861565B (zh) * 2019-11-12 2023-05-23 上海高德威智能交通系统有限公司 确定轨迹相似度的方法、装置、计算机设备和存储介质
CN111294610A (zh) * 2020-02-20 2020-06-16 北京奇艺世纪科技有限公司 一种视频处理方法及装置
CN111461906A (zh) * 2020-05-28 2020-07-28 深圳麦亚信科技股份有限公司 车险快速理赔方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110198473B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN111476309B (zh) 图像处理方法、模型训练方法、装置、设备及可读介质
CN110321958A (zh) 神经网络模型的训练方法、视频相似度确定方法
CN113392173A (zh) 基于区块链的信息推送更新方法、系统及云服务信息平台
CN110399848A (zh) 视频封面生成方法、装置及电子设备
CN109299348A (zh) 一种数据查询方法、装置、电子设备及存储介质
CN110198473A (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN110222775A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN109189938A (zh) 用于更新知识图谱的方法和装置
CN110213614A (zh) 从视频文件中提取关键帧的方法和装置
CN109919244A (zh) 用于生成场景识别模型的方法和装置
CN110348730A (zh) 风险用户判断方法及其系统、电子设备
CN110502357A (zh) 一种栈回溯方法、装置、介质和设备
CN110321447A (zh) 重复图像的确定方法、装置、电子设备及存储介质
CN109359237A (zh) 一种用于搜索寄宿程序的方法与设备
CN110019263A (zh) 信息存储方法和装置
CN109885593A (zh) 用于处理信息的方法和装置
CN107315833A (zh) 基于应用程序的检索与下载的方法和装置
CN109284367A (zh) 用于处理文本的方法和装置
CN110188782A (zh) 图像相似性确定方法、装置、电子设备及可读存储介质
WO2021196836A1 (zh) 用于定位快递包裹的方法和装置
CN109697034A (zh) 一种数据写入方法、装置、电子设备及存储介质
CN110119386A (zh) 数据处理方法、数据处理装置、介质和计算设备
CN110334650A (zh) 物体检测方法、装置、电子设备及存储介质
CN109165723A (zh) 用于处理数据的方法和装置
CN109241344A (zh) 用于处理信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder