CN111506771A - 一种视频检索方法、装置、设备及存储介质 - Google Patents

一种视频检索方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111506771A
CN111506771A CN202010321723.7A CN202010321723A CN111506771A CN 111506771 A CN111506771 A CN 111506771A CN 202010321723 A CN202010321723 A CN 202010321723A CN 111506771 A CN111506771 A CN 111506771A
Authority
CN
China
Prior art keywords
video
retrieval
tag
tags
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010321723.7A
Other languages
English (en)
Other versions
CN111506771B (zh
Inventor
吴宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jilian Network Technology Co ltd
Original Assignee
Shanghai Jilian Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jilian Network Technology Co ltd filed Critical Shanghai Jilian Network Technology Co ltd
Priority to CN202010321723.7A priority Critical patent/CN111506771B/zh
Publication of CN111506771A publication Critical patent/CN111506771A/zh
Application granted granted Critical
Publication of CN111506771B publication Critical patent/CN111506771B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种视频检索方法、装置、设备及存储介质。该方法包括:获取用户输入的检索标签,并基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,其中,所述检索标签包括至少一个元素标签,所述视频索引库包括各检索视频的元素标签索引信息;根据各所述检索视频中与所述检索标签对应的元素标签索引信息和预设划分规则,对各所述检索视频进行划分得到至少一个视频片段;其中,所述预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;将所述各视频片段反馈给用户。本发明实施例通过根据检索标签对检索视频进行划分,解决了视频检索不准确的问题,提高了视频检索的效率和准确度。

Description

一种视频检索方法、装置、设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种视频检索方法、装置、设备及存储介质。
背景技术
随着互联网应用的丰富和发展,我们接触越来越多的视频数据。此时面对海量的视频数据,用户往往需要从中快速的检索到符合查询需求的视频数据。但由于视频数据中包括人物、物体、环境等多种特征组合成的各种场景,因此,当我们需要对灵活组合的场景进行查询时,视频数据的信息解析结果动辄上亿条,各种检索标签的组合更是数不清。
由于视频数据的长度不一,且包含的内容多样,用户的检索需求也各异。当用户对视频中包含的部分视频内容进行检索时,现有的技术方案通常是将包含该部分视频内容的整个视频作为检索结果返回给用户。但该视频中往往不仅包括包含检索标签内容的视频数据,还包括与检索标签无关的视频数据。用户在查看该视频时,通常还需要人为的对视频内容进行审核,以确定该视频中与检索标签符合程度最高的视频片段,从而影响视频检索的效率。
发明内容
本发明实施例提供了一种视频检索方法、装置、设备及存储介质,以提高视频检索的准确度和检索效率。
第一方面,本发明实施例提供了一种视频检索方法,该方法包括:
获取用户输入的检索标签,并基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,其中,所述检索标签包括至少一个元素标签,所述视频索引库包括各检索视频的元素标签索引信息;
根据各所述检索视频中与所述检索标签对应的元素标签索引信息和预设划分规则,对各所述检索视频进行划分得到至少一个视频片段;其中,所述预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
将所述各视频片段反馈给用户。
第二方面,本发明实施例还提供了一种视频检索装置,该装置包括:
检索标签获取模块,用于获取用户输入的检索标签,并基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,其中,所述检索标签包括至少一个元素标签,所述视频索引库包括各检索视频的元素标签索引信息;
视频片段划分模块,用于根据各所述检索视频中与所述检索标签对应的元素标签索引信息和预设划分规则,对各所述检索视频进行划分得到至少一个视频片段;其中,所述预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
视频片段反馈模块,用于将所述各视频片段反馈给用户。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述所涉及的任一所述的视频检索方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行上述所涉及的任一所述的视频检索方法。
本发明实施例通过根据检索标签对检索视频进行划分,解决了视频检索不准确的问题,提高了视频检索的效率和准确度。
附图说明
图1是本发明实施例一提供的一种视频检索方法的流程图。
图2是本发明实施例二提供的一种视频检索方法的流程图。
图3是本发明实施例二提供的一种视频检索方法的具体实例的流程图。
图4是本发明实施例三提供的一种视频检索装置的示意图。
图5是本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的一种视频检索方法的流程图,本实施例可适用于对数据库中的视频进行检索的情况,该方法可以由视频检索装置来执行,该装置可采用软件和/或硬件的方式实现,该装置可以配置于终端设备中。具体包括如下步骤:
S110、获取用户输入的检索标签,并基于检索标签在视频索引库中确定与检索标签对应的至少一个检索视频;
其中,检索标签是用于对视频进行检索的标签,在一个实施例中,检索标签包括至少一个元素标签。示例性的,检索标签包括“物体A和物体B”,其中,物体A和物体B均为元素标签,也就是说,该检索标签包括两个元素标签。其中,视频索引库包括各检索视频的元素标签索引信息。其中,元素标签索引信息可用于与检索标签中的元素标签进行匹配,以实现对视频索引库中的视频进行检索。
在一个实施例中,可选的,采用深度学习算法对已存储的视频进行解析,将解析得到的元素标签索引信息与视频的标识对应存储,生成视频索引库,其中,元素标签索引信息包括元素标签、元素标签的开始时刻、元素标签的结束时刻和与元素标签对应的元素标签图像的屏幕占比中至少一种。
其中,示例性的,深度学习算法包括但不限于图神经网络算法、卷积神经网络算法和递归神经网络算法等。其中,示例性的,视频的标识可以是序列号,当然也可以是文本名称,举例而言,视频的标识可以是“A0001”,也可以是“综艺A”。
其中,元素标签索引信息中的元素标签包括与视频内容相关的标签。在一个实施例中,将视频中的每张视频帧图像输入到预先训练完成的神经网络模型中,得到输出的至少一个元素标签。在另一个实施例中,对视频进行视频帧图像提取,将提取到的至少一张视频帧图像输入到预先训练完成的神经网络模型中,得到输出的至少一个元素标签。其中,示例性的,对视频进行视频帧图像提取,包括:采用距离阈值聚类算法对视频进行视频帧图像提取。其中,神经网络模型采用深度学习算法对各视频帧图像中的目标元素进行特征识别,并采用分类器对识别到的目标元素进行分类,得到与该目标元素对应的元素标签。举例而言,视频帧图像A中包括物体A和背景图像,神经网络模型对输入的视频帧图像A进行特征识别得到物体A图像,采用分类器对物体A进行分类,示例性的,物体A对应的元素标签可以是“皮球”。针对提取到的至少一张视频帧图像,均进行采用上述记载的技术方案,可得到与该视频对应的至少一个元素标签,示例性的,与该视频对应的元素标签包括“皮球”、“球门”和“人物A”等等。此处只是对深度学习算法对视频进行解析进行举例解释说明,并不对解析的具体过程进行限定。
其中,与元素标签对应的元素标签图像的屏幕占比用于描述元素标签图像与视频帧图像之间的比值,也就是说,元素标签图像在视频帧图像中的尺寸占比。
在一个实施例中,可选的,根据检索标签中各元素标签以及各元素标签的关联信息在视频索引库中元素标签索引信息中进行检索,确定与检索标签对应的至少一个检索视频,其中,关联信息包括与关联、或关联和非关联中至少一种。
其中,示例性的,关联信息可以在用户输入元素标签时进行输入,用于描述各元素标签之间的关系。举例而言,检索标签包括“物体A”、“物体B”和“物体C”3个元素标签。若关联信息包括与关联,则用户输入的检索标签可以是物体A and物体B and物体C,其中,and用于表示与关联;若关联信息包括或关联,则用户输入的检索标签可以是物体A or物体B or物体C,其中,or用于表示或关联;若关联信息包括非关联,则用户输入的检索标签可以是物体A not物体B not物体C,其中,not用于表示非关联,也就是说,检索视频中包括物体A,但不包括物体B和物体C;若关联信息包括与关联和或关联,则用户输入的检索标签可以是物体A and物体B or物体C,也就是说,检索视频中包括物体A,还包括物体B或物体C其中一种。
S120、根据各检索视频中与检索标签对应的元素标签索引信息和预设划分规则,对各检索视频进行划分得到至少一个视频片段;
其中,检索视频的元素标签索引信息包括从检索视频中解析得到的所有元素标签,示例性的,检索视频的元素标签包括“物体A”、“物体B”和“物体C”,若检索标签包括“物体A”,则检索视频中与检索标签对应的元素标签索引信息包括物体A索引信息。在一个实施例中,预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;其中,示例性的,连续出现至少一个元素标签的视频帧包括每个相邻视频帧中均包括检索标签中的至少一个元素标签。其中,具体的,在一个检索视频中,以视频帧中出现至少一个元素标签的视频时刻作为视频片段的开始时刻。当当前视频帧的下一视频帧中不包括元素标签时,将当前视频帧的视频时刻作为视频片段的结束时刻。当然,也可以将零点时刻作为视频片段的开始时刻,将视频片段的时长作为视频片段的结束时刻。
在一个实施例中,可选的,针对每个检索视频,确定划分得到的第一视频片段在检索视频的结束时刻与划分得到的第二视频片段在检索视频的开始时刻之间的时间差;如果时间差小于预设时间阈值,则将第一视频片段和第二视频片段合并为同一视频片段。其中,结束时刻和开始时刻均指检索视频中的视频时刻。示例性的,第一视频片段属于检索视频的12分30秒到13分04秒之间的视频片段,则第一视频片段在检索视频中的开始时刻为12分30秒,结束时刻为13分04秒。其中,示例性的,预设时间阈值可以是10秒钟。也就是说,在上一视频片段结束后,如果在间隔10秒钟的视频片段中再次出现至少一个元素标签,则将间隔的视频片段合并到上一视频片段中,且继续对视频片段进行计时,直到在间隔10秒钟的视频片段中不再出现元素标签。
在一个实施例中,可选的,根据与检索标签对应的元素标签索引信息中的元素标签的开始时刻和元素标签的结束时刻,确定至少一个视频片段。其中,示例性的,检索标签包括“物体A”、“物体B”和“物体C”,则将与物体A、物体B和物体C对应的3个开始时刻中最早时刻作为视频片段的开始时刻,将与物体A、物体B和物体C对应的3个结束时刻中最晚时刻作为视频片段的结束时刻。其中,根据各元素标签的开始时刻对元素标签对应的视频片段进行排序,相邻视频片段中的前一视频片段的开始时刻与后一视频片段的结束时刻之间的时间差小于预设时间阈值。
S130、将各视频片段反馈给用户。
其中,示例性的,反馈给用户的各视频片段的顺序可以是随机的,也可以是根据视频片段的时长进行排序后的。在一个实施例中,可选的,对各视频片段进行时长筛选,将满足预设时长范围内的视频片段反馈给用户。其中,示例性的,预设时长范围可以是1分钟~5分钟。这样设置的好处在于,视频片段的时长太短可能对用户的下一步操作的帮助作用不大,视频时长太长可能会影响到下一步操作的执行效率。此处对预设时长范围不作限定,具体的可根据实际的视频应用进行限定。
本实施例的技术方案,通过根据检索标签对检索视频进行划分,解决了视频检索不准确的问题,提高了视频检索的效率和准确度。
实施例二
图2是本发明实施例二提供的一种视频检索方法的流程图,本实施例的技术方案是上述实施例的基础上的进一步细化。可选的,在将所述各视频片段反馈给用户之前,还包括:对各所述视频片段进行评分,并基于评分结果对所述各视频片段进行排序。
本实施例的具体实施步骤包括:
S210、获取用户输入的检索标签,并基于检索标签在视频索引库中确定与检索标签对应的至少一个检索视频;
S220、根据与检索标签对应的元素标签索引信息和预设划分规则,对各检索视频进行划分得到至少一个视频片段;
S230、对各视频片段进行评分,并基于评分结果对各视频片段进行排序;
在一个实施例中,可选的,针对每个视频片段,根据检索标签中各元素标签的权重、各元素标签在视频片段中的持续时长和与各元素标签对应的元素标签图像的屏幕占比,计算得到视频片段的评分结果。
在一个实施例中,元素标签的权重可以在用户输入检索标签的时候输入,示例性的,用户在输入各元素标签后,为各元素标签选择对应的权重。在另一个实施例中,根据检索标签中各元素标签的顺序确定元素标签的权重。示例性的,检索标签包括“物体A”、“物体B”和“物体C”,则第一位的物体A的权重最高,第二位的物体B次之,最后一位的物体C的权重最低。
在一个实施例中,当视频片段中只包括一个元素标签时,则将该元素标签的权重、该视频片段的时长和该元素标签的屏幕占比相乘后,得到该视频片段的评分结果。在另一个实施例中,当视频片段中包括多个元素标签时,分别计算视频片段中各元素标签对应的子视频片段的评分结果,将各元素标签对应的子视频片段的评分结果相加后,得到该视频片段的评分结果。
在一个实施例中,可选的,针对检索标签中的每个元素标签,基于元素标签对视频片段进行视频帧提取,得到至少一个视频帧图像;分别确定各视频帧图像中的元素标签图像与视频帧图像之间的比值,并将满足预设条件的比值作为元素标签图像的屏幕占比,其中,预设条件的比值包括平均比值。
其中,示例性的,对视频进行视频帧图像提取,包括:采用距离阈值聚类算法对视频进行视频帧图像提取。这样设置的好处在于,可以降低后续的计算量,提高计算效率。
其中,示例性的,确定各视频帧图像中的元素标签图像与视频帧图像之间的比值,包括:确定元素标签图像的标签尺寸,将标签尺寸除以视频帧图像的图像尺寸,得到元素标签图像与视频帧图像之间的比值。
其中,示例性的,预设条件的比值包括但不限于平均比值、最大比值、最小比值和中值比值。以平均比值为例,针对每个与元素标签对应的视频帧图像,均可计算得到与该视频帧图像中元素标签图像与该视频帧图像之间的比值,将至少一个比值进行平均计算后,将计算得到的数值作为与元素标签对应的屏幕占比。
S240、将排序后的各视频片段反馈给用户。
在上述实施例的基础上,可选的,还包括:将视频索引库存储在HBASE分布式系统中。其中,HBASE分布式系统是一种高可靠性、高性能、面向列和可伸缩的分布式存储系统,支持水平扩展和无单点故障分享。在一个实施例中,将视频标识作为HBASE的主键。这样设置的好处在于,当元素标签索引信息中的元素标签与检索标签中的元素标签匹配时,将视频标识作为查询结果返回,从而实现快速返回包含任意元素标签索引信息的检索视频。其中,示例性的,基于HBASE分布式系统对视频进行检索,可支持10个元素标签的级联,也就是说,检索标签可包括10个元素标签。
在一个实施例中,可选的,将视频检索功能和视频片段评分功能均集成在HBASE分布式系统中。其中,通过NFINX服务器作为反向代理,其中,NFINX服务器是一种轻量级的web服务器,具备支持水平扩展、分层转发、负载均衡和满足高并发需求等优势。
图3是本发明实施例二提供的一种视频检索方法的具体实例的流程图。采用深度学习算法对已存储的视频进行解析,具体的,可通过神经网络模型对存储的视频进行解析。解析得到视频的基础信息,并将其存储在HBASE基础信息库中,其中,示例性的,基础信息包括视频中的元素标签、元素标签的开始时刻、元素标签的结束时刻和元素标签的元素标签图像的屏幕占比中至少一种。建立基础信息与视频标识之间的二级索引关系,并将其存储在HBASE二级索引库中。其中,示例性的,HBASE基础信息库和HBASE二级索引库共同构成本实施例中的视频索引库。接收至少一个检索标签,图3以3个检索标签为例,分别对NFINX服务器进行访问。根据上述记载的技术方案,得到对检索视频划分得到的视频片段,基于HBASE分布式系统中集成的视频片段评分算法,对各视频片段进行评分,并基于评分结果对视频片段进行排序,将排序后的视频片段反馈给用户。
本实施例的技术方案,通过对视频片段进行评分,解决了用户查看视频片段效率低的问题,可以使用户最先查看到与检索标签匹配度最高的视频片段,从而提高用户对检索到的视频片段的查看和筛选效率,提高用户体验。
实施例三
图4是本发明实施例三提供的一种视频检索装置的示意图。本实施例可适用于对数据库中的视频进行检索的情况,该装置可采用软件和/或硬件的方式实现,该装置可以配置于终端设备。该视频检索装置包括:检索标签获取模块310、视频片段划分模块320和视频片段反馈模块330。
其中,检索标签获取模块310,用于获取用户输入的检索标签,并基于检索标签在视频索引库中确定与检索标签对应的至少一个检索视频,其中,检索标签包括至少一个元素标签,视频索引库包括各检索视频的元素标签索引信息;
视频片段划分模块320,用于根据各检索视频中与检索标签对应的元素标签索引信息和预设划分规则,对各检索视频进行划分得到至少一个视频片段;其中,预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
视频片段反馈模块330,用于将各视频片段反馈给用户。
本实施例的技术方案,通过根据检索标签对检索视频进行划分,解决了视频检索不准确的问题,提高了视频检索的效率和准确度。
在上述技术方案的基础上,可选的,该装置还包括视频片段合并模块,用于:
针对每个检索视频,确定划分得到的第一视频片段在检索视频的结束时刻与划分得到的第二视频片段在检索视频的开始时刻之间的时间差;
如果时间差小于预设时间阈值,则将第一视频片段和第二视频片段合并为同一视频片段。
在上述技术方案的基础上,可选的,该装置还包括视频打分模块,用于:
对各视频片段进行评分,并基于评分结果对各视频片段进行排序。
在上述技术方案的基础上,可选的,视频打分模块具体用于:
针对每个视频片段,根据检索标签中各元素标签的权重、各元素标签在视频片段中的持续时长和与各元素标签对应的元素标签图像的屏幕占比,计算得到视频片段的评分结果。
在上述技术方案的基础上,可选的,该装置还包括屏幕占比确定模块,用于:
针对检索标签中的每个元素标签,基于元素标签对视频片段进行视频帧提取,得到至少一个视频帧图像;
分别确定各视频帧图像中的元素标签图像与视频帧图像之间的比值,并将满足预设条件的比值作为元素标签图像的屏幕占比,其中,预设条件的比值包括平均比值。
在上述技术方案的基础上,可选的,该装置还包括视频索引库生成模块,用于:
采用深度学习算法对已存储的视频进行解析,将解析得到的元素标签索引信息与视频的标识对应存储,生成视频索引库,其中,元素标签索引信息包括元素标签、元素标签的开始时刻、元素标签的结束时刻和与元素标签对应的元素标签图像的屏幕占比中至少一种。
在上述技术方案的基础上,可选的,视频片段划分模块320具体用于:
根据检索标签中各元素标签以及各元素标签的关联信息在视频索引库中元素标签索引信息中进行检索,确定与检索标签对应的至少一个检索视频,其中,关联信息包括与关联、或关联和非关联中至少一种。
本发明实施例所提供的视频检索装置可以用于执行本发明实施例所提供的视频检索方法,具备执行方法相应的功能和有益效果。
值得注意的是,上述视频检索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例四
图5是本发明实施例四提供的一种设备的结构示意图,本发明实施例为本发明上述实施例的视频检索方法的实现提供服务,可配置上述实施例中的视频检索装置。图5示出了适于用来实现本发明实施方式的示例性设备12的框图。图5显示的设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备12交互的设备通信,和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器20通过总线18与设备12的其它模块通信。应当明白,尽管图中未示出,可以结合设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的视频检索方法。
通过上述设备,解决了视频检索不准确的问题,提高了视频检索的效率和准确度。
实施例五
本发明实施例五还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种视频检索方法,该方法包括:
获取用户输入的检索标签,并基于检索标签在视频索引库中确定与检索标签对应的至少一个检索视频,其中,检索标签包括至少一个元素标签,视频索引库包括各检索视频的元素标签索引信息;
根据各检索视频中与检索标签对应的元素标签索引信息和预设划分规则,对各检索视频进行划分得到至少一个视频片段;其中,预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
将各视频片段反馈给用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的视频检索方法中的相关操作。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种视频检索方法,其特征在于,包括:
获取用户输入的检索标签,并基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,其中,所述检索标签包括至少一个元素标签,所述视频索引库包括各检索视频的元素标签索引信息;
根据各所述检索视频中与所述检索标签对应的元素标签索引信息和预设划分规则,对各所述检索视频进行划分得到至少一个视频片段;其中,所述预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
将所述各视频片段反馈给用户。
2.根据权利要求1所述的方法,其特征在于,还包括:
针对每个检索视频,确定划分得到的第一视频片段在所述检索视频的结束时刻与划分得到的第二视频片段在所述检索视频的开始时刻之间的时间差;
如果所述时间差小于预设时间阈值,则将所述第一视频片段和第二视频片段合并为同一视频片段。
3.根据权利要求1所述的方法,其特征在于,在将所述各视频片段反馈给用户之前,还包括:
对各所述视频片段进行评分,并基于评分结果对所述各视频片段进行排序。
4.根据权利要求3所述的方法,其特征在于,所述对所述各视频片段进行评分,包括:
针对每个视频片段,根据所述检索标签中各元素标签的权重、各元素标签在所述视频片段中的持续时长和与各元素标签对应的元素标签图像的屏幕占比,计算得到所述视频片段的评分结果。
5.根据权利要求4所述的方法,其特征在于,还包括:
针对所述检索标签中的每个元素标签,基于所述元素标签对所述视频片段进行视频帧提取,得到至少一个视频帧图像;
分别确定所述各视频帧图像中的元素标签图像与所述视频帧图像之间的比值,并将满足预设条件的比值作为所述元素标签图像的屏幕占比,其中,所述预设条件的比值包括平均比值。
6.根据权利要求1所述的方法,其特征在于,还包括:
采用深度学习算法对已存储的视频进行解析,将解析得到的元素标签索引信息与视频的标识对应存储,生成所述视频索引库,其中,所述元素标签索引信息包括元素标签、元素标签的开始时刻、元素标签的结束时刻和与元素标签对应的元素标签图像的屏幕占比中至少一种。
7.根据权利要求6所述的方法,其特征在于,所述基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,包括:
根据所述检索标签中各元素标签以及所述各元素标签的关联信息在所述视频索引库中元素标签索引信息中进行检索,确定与所述检索标签对应的至少一个检索视频,其中,所述关联信息包括与关联、或关联和非关联中至少一种。
8.一种视频检索装置,其特征在于,包括:
检索标签获取模块,用于获取用户输入的检索标签,并基于所述检索标签在视频索引库中确定与所述检索标签对应的至少一个检索视频,其中,所述检索标签包括至少一个元素标签,所述视频索引库包括各检索视频的元素标签索引信息;
视频片段划分模块,用于根据各所述检索视频中与所述检索标签对应的元素标签索引信息和预设划分规则,对各所述检索视频进行划分得到至少一个视频片段;其中,所述预设划分规则包括将连续出现至少一个元素标签的视频帧组成的视频作为一个视频片段;
视频片段反馈模块,用于将所述各视频片段反馈给用户。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的视频检索方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的视频检索方法。
CN202010321723.7A 2020-04-22 2020-04-22 一种视频检索方法、装置、设备及存储介质 Expired - Fee Related CN111506771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010321723.7A CN111506771B (zh) 2020-04-22 2020-04-22 一种视频检索方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010321723.7A CN111506771B (zh) 2020-04-22 2020-04-22 一种视频检索方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111506771A true CN111506771A (zh) 2020-08-07
CN111506771B CN111506771B (zh) 2021-04-02

Family

ID=71864172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010321723.7A Expired - Fee Related CN111506771B (zh) 2020-04-22 2020-04-22 一种视频检索方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111506771B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269899A (zh) * 2020-10-20 2021-01-26 西安工程大学 一种基于深度学习的视频检索方法
CN112307180A (zh) * 2020-10-22 2021-02-02 上海芯翌智能科技有限公司 一种基于标签对象的快速检索方法及设备
CN113139094A (zh) * 2021-05-06 2021-07-20 北京百度网讯科技有限公司 视频搜索方法及装置、电子设备和介质
CN113254716A (zh) * 2021-05-26 2021-08-13 北京亮亮视野科技有限公司 视频片段检索方法、装置、电子设备和可读存储介质
CN115065865A (zh) * 2022-06-23 2022-09-16 北京奇艺世纪科技有限公司 一种视频合成方法、装置、电子设备及存储介质
CN116628257A (zh) * 2023-07-25 2023-08-22 北京欣博电子科技有限公司 视频检索方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102486800A (zh) * 2010-12-01 2012-06-06 财团法人工业技术研究院 视频搜索方法、系统及建立视频数据库的方法
US8510795B1 (en) * 2007-09-04 2013-08-13 Google Inc. Video-based CAPTCHA
CN105657537A (zh) * 2015-12-23 2016-06-08 小米科技有限责任公司 视频剪辑方法及装置
CN105718547A (zh) * 2016-01-18 2016-06-29 传成文化传媒(上海)有限公司 基于景点标签的导游方法及系统
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN109922373A (zh) * 2019-03-14 2019-06-21 上海极链网络科技有限公司 视频处理方法、装置及存储介质
CN110121093A (zh) * 2018-02-06 2019-08-13 优酷网络技术(北京)有限公司 视频中目标对象的搜索方法及装置
CN110209877A (zh) * 2018-02-06 2019-09-06 上海全土豆文化传播有限公司 视频分析方法及装置
CN110309353A (zh) * 2018-02-06 2019-10-08 上海全土豆文化传播有限公司 视频索引方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510795B1 (en) * 2007-09-04 2013-08-13 Google Inc. Video-based CAPTCHA
CN102486800A (zh) * 2010-12-01 2012-06-06 财团法人工业技术研究院 视频搜索方法、系统及建立视频数据库的方法
CN105657537A (zh) * 2015-12-23 2016-06-08 小米科技有限责任公司 视频剪辑方法及装置
CN105718547A (zh) * 2016-01-18 2016-06-29 传成文化传媒(上海)有限公司 基于景点标签的导游方法及系统
CN107704525A (zh) * 2017-09-04 2018-02-16 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN109189987A (zh) * 2017-09-04 2019-01-11 优酷网络技术(北京)有限公司 视频搜索方法和装置
CN110121093A (zh) * 2018-02-06 2019-08-13 优酷网络技术(北京)有限公司 视频中目标对象的搜索方法及装置
CN110209877A (zh) * 2018-02-06 2019-09-06 上海全土豆文化传播有限公司 视频分析方法及装置
CN110309353A (zh) * 2018-02-06 2019-10-08 上海全土豆文化传播有限公司 视频索引方法及装置
CN109922373A (zh) * 2019-03-14 2019-06-21 上海极链网络科技有限公司 视频处理方法、装置及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112269899A (zh) * 2020-10-20 2021-01-26 西安工程大学 一种基于深度学习的视频检索方法
CN112307180A (zh) * 2020-10-22 2021-02-02 上海芯翌智能科技有限公司 一种基于标签对象的快速检索方法及设备
CN113139094A (zh) * 2021-05-06 2021-07-20 北京百度网讯科技有限公司 视频搜索方法及装置、电子设备和介质
CN113139094B (zh) * 2021-05-06 2023-11-07 北京百度网讯科技有限公司 视频搜索方法及装置、电子设备和介质
CN113254716A (zh) * 2021-05-26 2021-08-13 北京亮亮视野科技有限公司 视频片段检索方法、装置、电子设备和可读存储介质
CN113254716B (zh) * 2021-05-26 2022-05-24 北京亮亮视野科技有限公司 视频片段检索方法、装置、电子设备和可读存储介质
CN115065865A (zh) * 2022-06-23 2022-09-16 北京奇艺世纪科技有限公司 一种视频合成方法、装置、电子设备及存储介质
CN116628257A (zh) * 2023-07-25 2023-08-22 北京欣博电子科技有限公司 视频检索方法、装置、计算机设备和存储介质
CN116628257B (zh) * 2023-07-25 2023-12-01 北京欣博电子科技有限公司 视频检索方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111506771B (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
CN111506771B (zh) 一种视频检索方法、装置、设备及存储介质
CN110837579B (zh) 视频分类方法、装置、计算机以及可读存储介质
CN111125435B (zh) 视频标签的确定方法、装置和计算机设备
US9665798B2 (en) Device and method for detecting specified objects in images using metadata
CN102119385B (zh) 用于在内容检索服务系统内检索媒体内容的方法和子系统
CN109033385B (zh) 图片检索方法、装置、服务器及存储介质
Qian et al. Social media based event summarization by user–text–image co-clustering
CN109474847B (zh) 基于视频弹幕内容的搜索方法、装置、设备及存储介质
CN109241319B (zh) 一种图片检索方法、装置、服务器和存储介质
CN109558513B (zh) 一种内容推荐方法、装置、终端及存储介质
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
CN109271509B (zh) 直播间话题的生成方法、装置、计算机设备和存储介质
CN111782977A (zh) 兴趣点处理方法、装置、设备及计算机可读存储介质
CN111428049A (zh) 一种事件专题的生成方法、装置、设备和存储介质
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
CN113806588A (zh) 搜索视频的方法和装置
CN114116811B (zh) 日志处理方法、装置、设备及存储介质
CN110688434A (zh) 一种兴趣点处理方法、装置、设备和介质
CN115098729A (zh) 视频处理方法、样本生成方法、模型训练方法及装置
CN107729486B (zh) 一种视频搜索方法及装置
CN107368923B (zh) 景点热度预测方法及装置
CN111488450A (zh) 一种用于生成关键词库的方法、装置和电子设备
CN107908724B (zh) 一种数据模型匹配方法、装置、设备及存储介质
CN112328752B (zh) 基于搜索内容的课程推荐方法、装置、计算机设备及介质
CN111552780B (zh) 医用场景的搜索处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210402