CN109684511A - 一种视频剪辑方法、视频聚合方法、装置以及系统 - Google Patents

一种视频剪辑方法、视频聚合方法、装置以及系统 Download PDF

Info

Publication number
CN109684511A
CN109684511A CN201811505962.7A CN201811505962A CN109684511A CN 109684511 A CN109684511 A CN 109684511A CN 201811505962 A CN201811505962 A CN 201811505962A CN 109684511 A CN109684511 A CN 109684511A
Authority
CN
China
Prior art keywords
video
events
time
obtains
text message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811505962.7A
Other languages
English (en)
Inventor
赵之健
林亦宁
包怡欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Original Assignee
SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd filed Critical SHANGHAI QINIU INFORMATION TECHNOLOGIES Co Ltd
Priority to CN201811505962.7A priority Critical patent/CN109684511A/zh
Publication of CN109684511A publication Critical patent/CN109684511A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开了一种视频剪辑方法、视频聚合方法、装置以及系统,该方法包括:分析视频文本信息,得到视频事件对应时间范围;在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。通过本发明所提供的方法,可以通过通用OCR技术和文本分类技术结合找到对应事件,最终利用深度学习的视频分类技术得到视频剪辑的全自动剪辑方法,并且提升了视频剪辑效率。

Description

一种视频剪辑方法、视频聚合方法、装置以及系统
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频剪辑方法、视频聚合方法、装置以及系统。
背景技术
目前,各类视频的全自动剪辑一直以来是研究的热点问题。一般来说视频剪辑都是由有经验的编辑来完成,近年来提出了不少的基于计算机视觉的方案,但是这些方案存在着一些问题,首先视频中会存在与当前事件无关内容,这样会导致视频持续时间较长,从而导致视频剪辑的处理事件也较长,完成速度较慢,比如说,足球视频一场比赛在90分钟左右,加上中场休息和广告,一般在两个小时,传统的基于视觉图像的分析技术即使达到实时处理的速度也需要两个小时完成处理,处理时间很长。
另外,传统的自动剪辑方法中,多数采用检测固定的场景相关的物体,然后通过相关物体来确定对应的事件,这样导致定制性较强,无法得到较好的扩展性。
虽然,当前深度学习算法已经发展到整个计算机视觉领域方向,但是传统的视频剪辑方案中一般都没有采用基于深度学习的算法来处理视频,因此,传统的视频剪辑方法相比于深度学习算法,准确性以及处理效率都较低。
发明内容
本发明提供了一种视频剪辑方法、视频聚合方法、装置以及系统,用以解决现有技术中视频剪辑时间较长以及准确性较低的问题。
其具体的技术方案如下:
一种视频剪辑方法,所述方法包括:
分析视频文本信息,得到视频事件对应时间范围;
在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;
将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。
可选的,分析视频文本信息,得到视频事件对应时间范围,包括:
对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;
通过textcnn模型、lstm with attetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;
将三种类型的特征数据首尾相接输入到分类器,得到分类标签;
根据分类标签中的时间信息,得到视频事件对应的时间范围。
可选的,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐,包括:
在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;
通过回归处理,得到所述特征图对应的视频文字区域;
将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
可选的,将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频,包括:
将直播视频分解为三部分;
通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;
将结果融合输出作为对应的编辑视频。
一种视频聚合方法,所述方法包括:
在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件,所述提取方法应用权利要求1-4中任一权项所述的视频剪辑方法;
将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。
一种视频剪辑系统,所述系统包括
分析模块,用于分析视频文本信息,得到视频事件对应时间范围;
处理模块,用于在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。
优选的,所述分析模块,具体用于
对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;通过textcnn模型、lstm with attetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;将三种类型的特征数据首尾相接输入到分类器,得到分类标签;根据分类标签中的时间信息,得到视频事件对应的时间范围。
优选的,所述处理模块,具体用于在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;通过回归处理,得到所述特征图对应的视频文字区域;将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
优选的,所述处理模块,具体用于将直播视频分解为三部分;通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;将结果融合输出作为对应的编辑视频。
此外,本发明还公开了一种视频聚合装置,所述装置包括:
提取模块,用于在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件;
处理模块,用于将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。
一种存储介质,所述存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得所述计算机程序执行如权利要求1-4中任一权项所述的视频剪辑方法。
通过本发明实施例所提供的方法,可以通过通用OCR技术和文本分类技术结合找到对应事件,最终利用深度学习的视频分类技术得到视频剪辑的全自动剪辑方法,并且提升了视频剪辑效率。
附图说明
图1为本发明实施例中一种视频剪辑方法的流程图;
图2为本发明实施例中视频剪辑的执行流程图;
图3为本发明实施例中直播文本信息的分类方法流程图;
图4为本发明实施例中视频文字事件对齐方法流程示意图;
图5为本发明实施例中视频事件二次精准定位方法示意图;
图6为本发明实施例中一种视频剪辑系统的结构示意图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解,本发明实施例以及实施例中的具体技术特征只是对本发明技术方案的说明,而不是限定,在不冲突的情况下,本发明实施例以及实施例中的具体技术特征可以相互组合。
如图1所示为本发明实施例中一种视频剪辑方法,该方法包括:
S1,分析视频文本信息,得到视频事件对应时间范围;
首先,如图2所示,在本发明中首先是直播文本分类,然后基于光学字符识别(英文:Optical Character Recognition,简称:OCR)技术的视频文字事件时间对齐,最后视频事件二次精细定位。
步骤S1对应第一步,直播文本分类主要是利用带时间的视频文本信息,得到视频事件发生的时间范围,从而大大的减少了需要处理的视频数量,这里的时间信息可以是视频文本信息中带有的时间标签或者是时间戳等等,此处不做具体限定。
具体来讲,对于步骤S1来讲,通过收集以往的一些视频文本数据,这里需要说明的是,这里视频文本数据步骤S1中所描述的视频事件相关,比如说都是足球比赛的直播数据。将数据整理去重后进行打标签,通过图3所示的训练模型进行数据处理,首先是将文本信息进行转换处理,得到特征向量,在本发明实施例中可以通过word2vec算法转换成一个特征向量,通过三种不同类型的模型,包括:textcnn模型,lstm with attetion模型和VDCNN模型分别提取特征,得到三种类型的模型对应的特征数据,将三种类型的特征数据首尾相接输入到分类器,得到分类标签。也就是最终将特征数据首尾相接输入到全链接的分类器中得到最终预测的标签。训练阶段利用bp算法进行训练,测试阶段直接推理达到结果。
S2,在时间范围内,通过第一预设处理条件,将视频文本信息中的时间与视频事件中的时间对齐;
此处第一预设处理条件具体为OCR技术。在上述步骤S1中确定了时间范围之后,通过OCR技术来实现时间对齐,如图4所示,在OCR使用时包括两个部分,文字区域的精确定位和识别,第一步在视频数据的图片中设置时间可能出现的感兴趣区域ROI区域,利用卷积神经网络提取出特征,并通过自底向上的卷积得到多尺度的特征图,然后通过回归算法得到视频文字区域的精确位置。
第二步将得到的文字区域输入到CRNN的识别网络中,最终得到文字区域对应的时间的信息结果,在使用OCR的时候采用锚点法,即:每隔十分钟精确对齐时间一次,中间的时间采用差值的方法得到,这样保证精确度的同时大大提升速度。
S3,将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应的编辑视频。
第二预设处理条件具体为TSN网络,最终的视频分类任务采用的是TSN网络,训练时将将视频分为前中后三个部分,在每个部分随机提取视频帧,并送入TSN网络进行训练,如图5所示,最终将结果融合输出。时间推理时候,逐帧进行推理,直接将前后三帧推理结果进行融合,得到最终的结果输出。该精细推理只在第一步得到的文本分类的候选时间段进行。
举例来讲,对一个视频的精彩镜头提取剪辑,通过视频的图像处理+时间轴+语音识别+文本等多个维度进行分析:比如:足球赛用识别视频的射门、点球等特定的场景,图像+结合文字和语音识别分析+比赛时间对齐,直播的计时比分的时间去做画面和解说的对齐。再加上特定的人脸识别的特写+知识图谱引擎,看谁踢的,将该运动员的历史踢球数据。
这里需要说明是,上述方法只是使用足球视频的剪辑进行说明,而不是限定,该方法不仅仅可以应用到足球比赛视频剪辑,还可以应用到其他视频剪辑上,本实施例不做具体的限定。
通过本发明实施例所提供的方法,可以通过通用OCR技术和文本分类技术结合找到对应事件,最终利用深度学习的视频分类技术得到视频剪辑的全自动剪辑方法,并且提升了视频剪辑效率。
进一步,在本发明实施例中,基本上述实施例,还提供了一种视频聚合方法,该视频聚合方法包括:在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件;在所述视频文件中提取出具有所述预设特征的子视频文件,将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。
这里需要说明是,该视频聚合方法中的子视频文件提取使用了上述实施例中的视频剪辑方法,具体的实现原理在上述的实施例中已经详细说明,此处就不再赘述。
对应本发明所提供的方法,本发明实施例中还提供了一种视频剪辑系统,如图6所示为本发明实施例中一种视频剪辑系统的结构示意图,该系统包括:
分析模块601,用于分析视频文本信息,得到视频事件对应时间范围;
处理模块602,用于在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。
进一步,所述分析模块601,具体用于对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;通过textcnn模型、lstm withattetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;将三种类型的特征数据首尾相接输入到分类器,得到分类标签;根据分类标签中的时间信息,得到视频事件对应的时间范围。
进一步,所述处理模块602,具体用于在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;通过回归处理,得到所述特征图对应的视频文字区域;将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
进一步,所述处理模块602,具体用于将直播视频分解为三部分;通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;将结果融合输出作为对应的编辑视频。
进一步,基本上述实施例,对应发明实施例中还提供了一种视频数据装置,该装置包括:
提取模块,用于在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件;
处理模块,用于将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。此处对视频剪辑方法不再做具体说明。
进一步,在本发明实施例中一种存储介质,所述存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得所述计算机程序执行上述的视频剪辑方法。此处对视频剪辑方法不再做具体说明。
尽管已描述了本申请的优选实施例,但本领域内的普通技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改,包括采用特定符号、标记确定顶点等变更方式。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (11)

1.一种视频剪辑方法,其特征在于,所述方法包括:
分析视频文本信息,得到视频事件对应时间范围;
在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;
将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应的编辑视频。
2.如权利要求1所述的方法,其特征在于,分析视频文本信息,得到视频事件对应时间范围,包括:
对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;
通过textcnn模型、lstm with attetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;
将三种类型的特征数据首尾相接输入到分类器,得到分类标签;
根据分类标签中的时间信息,得到视频事件对应的时间范围。
3.如权利要求1所述的方法,其特征在于,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐,包括:
在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;
通过回归处理,得到所述特征图对应的视频文字区域;
将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
4.如权利要求1所述的方法,其特征在于,将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频,包括:
将直播视频分解为三部分;
通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;
将结果融合输出作为对应的编辑视频。
5.一种视频聚合方法,其特征在于,所述方法包括:
在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件,所述提取方法应用权利要求1-4中任一权项所述的视频剪辑方法;
将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。
6.一种视频剪辑系统,其特征在于,所述系统包括
分析模块,用于分析视频文本信息,得到视频事件对应时间范围;
处理模块,用于在所述时间范围内,通过第一预设处理条件,将视频文本信息中的时间与所述视频事件中的时间对齐;将时间对齐的视频事件通过第二预设处理条件进行处理,得到视频事件对应编辑视频。
7.如权利要求6所述的系统,其特征在于,所述分析模块,具体用于对已进行标记的带时间信息的视频文本信息进行转换处理,得到所述视频文本信息对应的特征向量;通过textcnn模型、lstm with attetion模型以及VDCNN模型,对所述特征向量进行特征提取,得到三种类型的特征数据;将三种类型的特征数据首尾相接输入到分类器,得到分类标签;根据分类标签中的时间信息,得到视频事件对应的时间范围。
8.如权利要求6所述的系统,其特征在于,所述处理模块,具体用于在直播视频的图片中确定出感兴趣区域ROI,提取图片中的特征,并通过自底向上的卷积得到N个尺度的特征图,其中,N为大于等于1的正整数;通过回归处理,得到所述特征图对应的视频文字区域;将所述视频文字区域输入到端到端文字识别CRNN的识别网络中,得到所述视频文字区域对应的时间的信息结果。
9.如权利要求6所述的系统,其特征在于,所述处理模块,具体用于将直播视频分解为三部分;通过所述第二预设处理条件,分别对分解出的三部分进行处理,得到结果融合输出;将结果融合输出作为对应的编辑视频。
10.一种视频聚合装置,其特征在于,所述装置包括:
提取模块,用于在获取到一视频文件时,在所述视频文件中提取出具有预设特征的子视频文件;
处理模块,用于将提取出的所有子视频文件进行视频聚合处理,得到聚合视频文件。
11.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得所述计算机程序执行如权利要求1-4中任一权项所述的视频剪辑方法。
CN201811505962.7A 2018-12-10 2018-12-10 一种视频剪辑方法、视频聚合方法、装置以及系统 Pending CN109684511A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811505962.7A CN109684511A (zh) 2018-12-10 2018-12-10 一种视频剪辑方法、视频聚合方法、装置以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811505962.7A CN109684511A (zh) 2018-12-10 2018-12-10 一种视频剪辑方法、视频聚合方法、装置以及系统

Publications (1)

Publication Number Publication Date
CN109684511A true CN109684511A (zh) 2019-04-26

Family

ID=66187267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811505962.7A Pending CN109684511A (zh) 2018-12-10 2018-12-10 一种视频剪辑方法、视频聚合方法、装置以及系统

Country Status (1)

Country Link
CN (1) CN109684511A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110012348A (zh) * 2019-06-04 2019-07-12 成都索贝数码科技股份有限公司 一种赛事节目自动集锦系统及方法
CN111757147A (zh) * 2020-06-03 2020-10-09 苏宁云计算有限公司 一种赛事视频结构化的方法、装置及系统
CN112929744A (zh) * 2021-01-22 2021-06-08 北京百度网讯科技有限公司 用于分割视频剪辑的方法、装置、设备、介质和程序产品
CN113297364A (zh) * 2021-06-07 2021-08-24 吉林大学 一种面向对话系统中的自然语言理解方法及装置
CN113542777A (zh) * 2020-12-25 2021-10-22 腾讯科技(深圳)有限公司 直播视频剪辑方法、装置及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021903A (zh) * 2006-10-10 2007-08-22 鲍东山 视频字幕内容分析系统
CN101887439A (zh) * 2009-05-13 2010-11-17 富士通株式会社 生成视频摘要的方法、装置、包含该装置的图像处理系统
CN102595191A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 体育赛事视频中赛事事件的搜索方法及装置
US20170011275A1 (en) * 2015-07-08 2017-01-12 Sage Software, Inc. Nearsighted camera object detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021903A (zh) * 2006-10-10 2007-08-22 鲍东山 视频字幕内容分析系统
CN101887439A (zh) * 2009-05-13 2010-11-17 富士通株式会社 生成视频摘要的方法、装置、包含该装置的图像处理系统
CN102595191A (zh) * 2012-02-24 2012-07-18 央视国际网络有限公司 体育赛事视频中赛事事件的搜索方法及装置
US20170011275A1 (en) * 2015-07-08 2017-01-12 Sage Software, Inc. Nearsighted camera object detection

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张皓: "计算机视觉视频理解领域的经典方法和最新成果", 《HTTP://WWW.QIANJIA.COM/HTML/2018-05/28_293492.HTML》 *
徐涵: "《大数据、人工智能和网络舆情治理》", 31 October 2018, 武汉大学出版社 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110012348A (zh) * 2019-06-04 2019-07-12 成都索贝数码科技股份有限公司 一种赛事节目自动集锦系统及方法
CN110012348B (zh) * 2019-06-04 2019-09-10 成都索贝数码科技股份有限公司 一种赛事节目自动集锦系统及方法
CN111757147A (zh) * 2020-06-03 2020-10-09 苏宁云计算有限公司 一种赛事视频结构化的方法、装置及系统
CN113542777A (zh) * 2020-12-25 2021-10-22 腾讯科技(深圳)有限公司 直播视频剪辑方法、装置及计算机设备
CN113542777B (zh) * 2020-12-25 2022-06-21 腾讯科技(深圳)有限公司 直播视频剪辑方法、装置及计算机设备
CN112929744A (zh) * 2021-01-22 2021-06-08 北京百度网讯科技有限公司 用于分割视频剪辑的方法、装置、设备、介质和程序产品
CN113297364A (zh) * 2021-06-07 2021-08-24 吉林大学 一种面向对话系统中的自然语言理解方法及装置
CN113297364B (zh) * 2021-06-07 2023-06-09 吉林大学 一种面向对话系统中的自然语言理解方法及装置

Similar Documents

Publication Publication Date Title
CN109684511A (zh) 一种视频剪辑方法、视频聚合方法、装置以及系统
US20190035431A1 (en) Apparatus, systems, and methods for integrating digital media content
CN102222103B (zh) 视频内容的匹配关系的处理方法及装置
CN109325148A (zh) 生成信息的方法和装置
CN109117777A (zh) 生成信息的方法和装置
US9373040B2 (en) Image matching using motion manifolds
US20130148898A1 (en) Clustering objects detected in video
CN107169106B (zh) 视频检索方法、装置、存储介质及处理器
CN103150375A (zh) 用于视频侦查的快速视频检索系统和方法
CN109684913A (zh) 一种基于社区发现聚类的视频人脸标注方法和系统
KR102132722B1 (ko) 영상 내 다중 객체 추적 방법 및 시스템
CN114286171B (zh) 视频处理方法、装置、设备及存储介质
CN110909703A (zh) 一种基于人工智能的明厨亮灶场景下厨师帽的检测方法
CN111126401A (zh) 一种基于上下文信息的车牌字符识别方法
CN109977779A (zh) 对视频创意中插入的广告进行识别的方法
CN109872541A (zh) 一种车辆信息分析方法及装置
CN112989950A (zh) 一种面向多模态特征语义关联特征的暴力视频识别系统
CN111311601B (zh) 一种拼接图像的分割方法及装置
Ji et al. News videos anchor person detection by shot clustering
CN109977738A (zh) 一种视频场景分割判断方法、智能终端及存储介质
CN111753618A (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN113766308A (zh) 视频封面推荐方法、装置、计算机设备和存储介质
CN114067356B (zh) 基于联合局部引导与属性聚类的行人重识别方法
CN116469167A (zh) 基于视频中人物动作获取人物动作片段的方法及系统
CN110012013A (zh) 一种基于knn的虚拟平台威胁行为分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190426

RJ01 Rejection of invention patent application after publication