CN110442747A - 一种基于关键词的视频摘要生成方法 - Google Patents
一种基于关键词的视频摘要生成方法 Download PDFInfo
- Publication number
- CN110442747A CN110442747A CN201910615122.4A CN201910615122A CN110442747A CN 110442747 A CN110442747 A CN 110442747A CN 201910615122 A CN201910615122 A CN 201910615122A CN 110442747 A CN110442747 A CN 110442747A
- Authority
- CN
- China
- Prior art keywords
- video
- text
- keyword
- abstract
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 230000000007 visual effect Effects 0.000 claims abstract description 6
- 230000011218 segmentation Effects 0.000 claims description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于关键词的视频摘要生成方法,通过对视频进行视觉通道处理,进行基于关键词的视觉内容摘要提取,得到图像摘要;视频语音文本内容预处理,进行基于关键词的语音文本内容摘要提取,得到文本摘要;利用图像摘要和文本摘要,获得最终图文摘要。本发明提供了一种自动生成视频摘要的方法,大大减少了视频上传者手工操作的时间;充分考虑了视频搜索用户的需求,为用户提供了更加贴合自己搜索意图的视频摘要;使用基于人工智能深度学习技术的方法,使生成的视频摘要更能准确的反映视频的内容。
Description
技术领域
本发明涉及人工智能与计算机视觉领域,具体涉及一种基于关键词的视频摘要生成方法。
背景技术
视频摘要技术自20世纪90年代提出来,作为一个研究热点和难点,得到了国内外众多研究团队的持续关注。理论上,视频是由一系列视频帧按事件顺序或空间分布规则组合得到的图像集,可多角度表达语义信息。然而,视频摘要不仅要对原始视频流进行分析,还应该综合考虑伴随着视频的有意义的音频流和文本流等多媒体信息。
视频摘要是指利用计算机技术分析视频结构,理解视频内容,并从原始的多媒体数据中选取具有代表性的、有意义的部分,将它们以某种方式组合并生成紧凑的、用户可读的原始视频的缩略形式。依据最终的呈现形式,视频摘要可分为静态视频摘要和动态视频摘要。而所谓视频摘要,不光只有缩略图一种形式,往往还伴随着文本。
静态视频摘要可分为标题、海报和故事板。标题是对视频内容的一段简短文字描述,是最简单的静态视频摘要。海报又称为视频代表帧,是从视频中抽出的能够代表视频内容的图像帧。而故事板是从视频中抽取的一段图像序列,按照时间顺序或者重要程度进行组合。
动态视频摘要是从原始视频中选取可表达语义内容的视频片段拼接编辑得到。它本身也是一段视频,但比原视频要短的多。动态视频摘要可分为精彩集锦和全局缩略视频。精彩集锦一般由原始视频中最精彩的部分组成。全局缩略视频是通过对整个时间轴上的视频片段进行组合来对整个视频内容进行概括。
每个视频序列由各种局部和全局视觉特征组成,例如颜色,边缘,运动等。因此,已经开发了许多通过测量每个镜头或场景帧内特征的相似度来检测视频镜头(视频序列)以生成视频摘要的技术。
每个帧/图像的最有效、最富有表现力和简单的特征是颜色,因为它对任何方向和大小的变化都不敏感并且十分稳定。许多视频摘要技术都使用了这个特征。颜色直方图如今已被广泛用于通过计算帧之间的相似性来选择代表性关键帧以生成视频摘要的方法中。
仅基于运动特征的视频摘要是一项具有挑战性的任务,并且在摄像机和物体均运动的情况下会变得更加复杂。然而使用这种技术提取关键帧,可以显着提高视频摘要的表现力和信息量。两种常用的运动估计方法是像素到像素的帧差和光流。
现有的一个方法是一种视频摘要的生成方法及系统(201410709377.4)。
具体步骤如下:
分割原始视频中的目标和背景;
将发生过遮挡或粘连的所述目标划分为一组,其他没有发生过粘连或遮挡的所述目标各自为一组;
根据所述原始视频确定待生成视频摘要的总时长;
根据所述原始视频确定各个组在所述待生成视频摘要中的持续时长,所述各个组内部各个目标的时空关系与所述原始视频中的一致;
根据各个组在所述待生成视频摘要中的持续时长以及所述各个组的开始时刻,生成所述视频摘要。
这种方法的缺点在于:
1.首先生成的摘要是以视频的剪切形式所展示的,对于用户来说不够直观,不能一眼理解到视频内容。
2.这种定制的视频摘要往往是静态性的,它忽略了用户真正想要了解的部分。
3.系统自动生成的视频摘要过于随机,不具备代表性。
发明内容
本发明的目的是克服现有方法的不足,提出了一种基于关键词的视频摘要生成方法。本发明所要解决的技术问题在于提供了一种为视频生成直观的图文摘要的技术,并且通过关键词与图像及文本语义的连接与匹配技术,解决了原有摘要生成方法的静态性以及随机性的缺陷,本方法通过与人工智能结合的技术特点,实现了自动化生成,提高了准确性的同时也减少了定制时间。
为了解决上述问题,本发明提出了一种基于关键词的视频摘要生成方法,所述方法包括:
对视频进行视觉通道预处理,获得初步分割镜头;
利用分割镜头,进行视频场景分割并进行视频帧聚类;
利用聚类后的视频帧,进行基于关键词的视觉内容摘要提取,得到图像摘要;
视频语音文本内容预处理,得到视频语音文本数据;
利用视频语音文本数据,对视频语料库主题模型进行训练,得到文本子主题;
利用文本子主题,进行基于关键词的语音文本内容摘要提取,得到文本摘要;
利用图像摘要和文本摘要,获得最终图文摘要。
本发明提出的一种基于关键词的视频摘要生成方法,提供了一种自动生成视频摘要的方法,大大减少了视频上传者手工操作的时间;充分考虑了视频搜索用户的需求,为用户提供了更加贴合自己搜索意图的视频摘要;使用基于人工智能深度学习技术的方法,使生成的视频摘要更能准确的反映视频的内容。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的视频摘要生成方法总体流程图;
图2是本发明实施例的视频场景分割流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例的视频摘要生成方法总体流程图,如图1所示,该方法包括:
S1,对视频进行视觉通道预处理,获得初步分割镜头;
S2,利用分割镜头,进行视频场景分割并进行视频帧聚类;
S3,利用聚类后的视频帧,进行基于关键词的视觉内容摘要提取,得到图像摘要;
S4,视频语音文本内容预处理,得到视频语音文本数据;
S5,利用视频语音文本数据,对视频语料库主题模型进行训练,得到文本子主题;
S6,利用文本子主题,进行基于关键词的语音文本内容摘要提取,得到文本摘要;
S7,利用图像摘要和文本摘要,获得最终图文摘要。
步骤S1,具体如下:
S1-1:用颜色直方图特征衡量视频帧的视觉特征相似性,计算方法为16*4*4(H:16,S:4,V:4)的256维的归一化HSV颜色直方图。
S1-2:计算相邻两帧颜色直方图特征的欧氏距离。
S1-3:选取同一段关键帧序列中间的图像作为一个视频镜头。
S1-4:采用Matlab 2015b集成的开源Tesseract OCR引擎对视频帧中的文字信息进行提取。
步骤S2,如图2所示,具体如下:
S2-1:提取视频帧序列的颜色特征和运动特征等视觉特征。
S2-2:基于视觉特征对视频进行镜头分割,然后进行谱聚类得到初步结果。
S2-3:将同一个类簇拆分成一系列连续的镜头片段{s1,s2,…,sn},根据视频时间轴定义两镜头片段距离如公式所示:
si表示连续的镜头片段,dc(si)表示si镜头片段在视频时间轴中的中心位置,e为指数函数,w为所有类间欧式距离的平均值。
S2-4:基于镜头片段时间距离,对各个镜头片段进行k-means聚类,聚类后各个类簇构成的视频镜头序列就是视频场景分割的结果。
步骤S3,具体如下:
S3-1:这里利用R-CNN来做视频帧的语义检测,首先训练(或者下载)一个分类模型(比如AlexNet)。
S3-2:对该模型做fine-tuning,fine tuning的过程其实就是用训练好的参数(可以从已训练好的模型中获得)初始化自己的网络,然后用自己的数据接着训练。将分类数从1000改为20,去掉最后一个全连接层。
S3-3:特征提取,提取图像的所有候选框(选择性搜索),对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘。
S3-4:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别,这里将用户输入关键词语义检测相似性对应为一个SVM,来判断关键帧与关键词是否语义上属于同一类别。
S3-5:输出所有与关键词类别相匹配的视频帧,定为视频的基于关键词的图像摘要。
步骤S4,具体如下:
S4-1:利用微软提供的语音识别工具包来将语音信号转化为文本。
S4-2:过滤停用词和语音识别输出的冗余的时间戳信息。
S4-3:使用TextRank算法对文本信息进行提干处理。TextRank算法是一种用于文本的基于图的排序算法。其基本思想来源于谷歌的PageRank算法,通过把文本分割成若干组成单元(单词、句子)并建立图模型,利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘。
步骤S5,具体如下:
S5-1:使用获得的视频数据,经前几步处理后获得的语料库进行LDA训练,挖掘视频语音文本内容的潜在主题模型。LDA联合概率公式如公式所示:
θ表示文档级别的变量,每个文档对应一个θ,z是主题的集合、w是单词的集合,zn为第n个主题,wn为第n个单词,是狄利克雷分布的参数,用于生成主题向量,表示各个主题对应的单词概率分布矩阵。
S5-2:将视频语音转文本的结果作为改进后的TextTiling算法的输入,算法改用主题包代替词语包表示文本语义,也就是前步用LDA训练后得到的主题。算法以句子为初始块,提取每个文本块的主题包特征后,以余弦相似度度量相邻文本块的语义相似度。
S5-3:计算深度分数,深度分数表示文本块与其上下文关联度分数的差值,反映了文本块两侧的语义变化的相对剧烈程度,以下公式为深度分数计算方法:
其中hl(c)表示从文本块左边找到的第一个关联度分数最高的峰值,右边hr(c)同理。s(c)表示当前文本块和其上下文的关联度。s(c)的计算公式如下所示。
p,c,f是相邻文本块,t表示文本块的语义特征维度,p表示和当前c文本块相邻的前一个文本块,f表示和当前c文本块相邻的后一个文本块,wt,c表示c文本块第t维度主题包特征的值。
深度分数越高表明文本块关联度变化的趋势越剧烈,越有可能是主题边界。设置一个阈值,深度大于该阈值的文本块即为主题边界。
步骤S6,具体如下:
S6-1:首先,对视频分割好的主题场景中由LDA提取出来的各个主题场景的文本主题运用TextRank算法提炼出每个主题的分数排在前n个的关键词。
S6-2:使用Word2Vec词向量空间的计算方法,利用训练好的模型,分别获取用户输入关键词以及视频主题关键词的词向量。
S6-3:对两者进行余弦相似度计算,选取与用户输入关键词相似度高的视频主题关键词所对应的视频主题作为视频文本摘要输出。计算公式如下:
t代表用户输入关键词,v代表视频主题关键词。
步骤S7,具体如下:
S7-1:将获得的语义相似度结果进行收集并按降序排列。
S7-2:设置一个阈值x,例如x取5,则取排列中前五的结果作为最终图文摘要。
本发明实施例提出的一种基于关键词的视频摘要生成方法,提供了一种自动生成视频摘要的方法,大大减少了视频上传者手工操作的时间;充分考虑了视频搜索用户的需求,为用户提供了更加贴合自己搜索意图的视频摘要;使用基于人工智能深度学习技术的方法,使生成的视频摘要更能准确的反映视频的内容。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种基于关键词的视频摘要生成方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (1)
1.一种基于关键词的视频摘要生成方法,其特征在于,所述方法包括:
对视频进行视觉通道预处理,获得初步分割镜头;
利用分割镜头,进行视频场景分割进行视频帧聚类;
利用聚类后的视频帧,进行基于关键词的视觉内容摘要提取,得到图像摘要;
视频语音文本内容预处理,得到视频语音文本数据;
利用视频语音文本数据,对视频语料库主题模型进行训练,得到文本子主题;
利用文本子主题,进行基于关键词的语音文本内容摘要提取,得到文本摘要;
利用图像摘要和文本摘要,获得最终图文摘要。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910615122.4A CN110442747B (zh) | 2019-07-09 | 2019-07-09 | 一种基于关键词的视频摘要生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910615122.4A CN110442747B (zh) | 2019-07-09 | 2019-07-09 | 一种基于关键词的视频摘要生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110442747A true CN110442747A (zh) | 2019-11-12 |
CN110442747B CN110442747B (zh) | 2023-10-20 |
Family
ID=68429926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910615122.4A Active CN110442747B (zh) | 2019-07-09 | 2019-07-09 | 一种基于关键词的视频摘要生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110442747B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110730389A (zh) * | 2019-12-19 | 2020-01-24 | 恒信东方文化股份有限公司 | 一种视频节目自动生成互动问答的方法及装置 |
CN111339359A (zh) * | 2020-02-18 | 2020-06-26 | 中山大学 | 一种基于九宫格的视频缩略图自动生成方法 |
CN111564157A (zh) * | 2020-03-18 | 2020-08-21 | 浙江省北大信息技术高等研究院 | 会议记录优化方法、装置、设备及存储介质 |
CN111914118A (zh) * | 2020-07-22 | 2020-11-10 | 珠海大横琴科技发展有限公司 | 基于大数据的视频分析方法、装置、设备及存储介质 |
CN112200078A (zh) * | 2020-10-10 | 2021-01-08 | 济南浪潮高新科技投资发展有限公司 | 一种基于视频智能分析的语料数据集生成方法及系统 |
CN113270092A (zh) * | 2021-05-11 | 2021-08-17 | 云南电网有限责任公司 | 一种基于lda算法的调度语音关键词提取方法 |
CN113377970A (zh) * | 2020-03-10 | 2021-09-10 | 阿里巴巴集团控股有限公司 | 信息的处理方法和装置 |
CN114143479A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安人寿保险股份有限公司 | 视频摘要的生成方法、装置、设备以及存储介质 |
CN114407079A (zh) * | 2022-01-24 | 2022-04-29 | 湖南中南智能装备有限公司 | 一种控制机械臂安装螺栓的方法 |
CN117194818A (zh) * | 2023-11-08 | 2023-12-08 | 北京信立方科技发展股份有限公司 | 基于视频的图文网页生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120123780A1 (en) * | 2010-11-15 | 2012-05-17 | Futurewei Technologies, Inc. | Method and system for video summarization |
CN103646094A (zh) * | 2013-12-18 | 2014-03-19 | 上海紫竹数字创意港有限公司 | 实现视听类产品内容摘要自动提取生成的系统及方法 |
CN108009293A (zh) * | 2017-12-26 | 2018-05-08 | 北京百度网讯科技有限公司 | 视频标签生成方法、装置、计算机设备和存储介质 |
CN109145152A (zh) * | 2018-06-28 | 2019-01-04 | 中山大学 | 一种基于查询词的自适应智能生成图文视频缩略图方法 |
-
2019
- 2019-07-09 CN CN201910615122.4A patent/CN110442747B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120123780A1 (en) * | 2010-11-15 | 2012-05-17 | Futurewei Technologies, Inc. | Method and system for video summarization |
CN103646094A (zh) * | 2013-12-18 | 2014-03-19 | 上海紫竹数字创意港有限公司 | 实现视听类产品内容摘要自动提取生成的系统及方法 |
CN108009293A (zh) * | 2017-12-26 | 2018-05-08 | 北京百度网讯科技有限公司 | 视频标签生成方法、装置、计算机设备和存储介质 |
CN109145152A (zh) * | 2018-06-28 | 2019-01-04 | 中山大学 | 一种基于查询词的自适应智能生成图文视频缩略图方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110730389A (zh) * | 2019-12-19 | 2020-01-24 | 恒信东方文化股份有限公司 | 一种视频节目自动生成互动问答的方法及装置 |
CN111339359A (zh) * | 2020-02-18 | 2020-06-26 | 中山大学 | 一种基于九宫格的视频缩略图自动生成方法 |
CN111339359B (zh) * | 2020-02-18 | 2020-12-22 | 中山大学 | 一种基于九宫格的视频缩略图自动生成方法 |
CN113377970A (zh) * | 2020-03-10 | 2021-09-10 | 阿里巴巴集团控股有限公司 | 信息的处理方法和装置 |
CN111564157A (zh) * | 2020-03-18 | 2020-08-21 | 浙江省北大信息技术高等研究院 | 会议记录优化方法、装置、设备及存储介质 |
CN111914118A (zh) * | 2020-07-22 | 2020-11-10 | 珠海大横琴科技发展有限公司 | 基于大数据的视频分析方法、装置、设备及存储介质 |
CN112200078A (zh) * | 2020-10-10 | 2021-01-08 | 济南浪潮高新科技投资发展有限公司 | 一种基于视频智能分析的语料数据集生成方法及系统 |
CN113270092A (zh) * | 2021-05-11 | 2021-08-17 | 云南电网有限责任公司 | 一种基于lda算法的调度语音关键词提取方法 |
CN114143479A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安人寿保险股份有限公司 | 视频摘要的生成方法、装置、设备以及存储介质 |
CN114143479B (zh) * | 2021-11-29 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 视频摘要的生成方法、装置、设备以及存储介质 |
CN114407079A (zh) * | 2022-01-24 | 2022-04-29 | 湖南中南智能装备有限公司 | 一种控制机械臂安装螺栓的方法 |
CN114407079B (zh) * | 2022-01-24 | 2024-01-30 | 湖南中南智能装备有限公司 | 一种控制机械臂安装螺栓的方法 |
CN117194818A (zh) * | 2023-11-08 | 2023-12-08 | 北京信立方科技发展股份有限公司 | 基于视频的图文网页生成方法及装置 |
CN117194818B (zh) * | 2023-11-08 | 2024-01-16 | 北京信立方科技发展股份有限公司 | 基于视频的图文网页生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110442747B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110442747A (zh) | 一种基于关键词的视频摘要生成方法 | |
US11256741B2 (en) | Video tagging system and method | |
Bhatt et al. | Multimedia data mining: state of the art and challenges | |
Vijayakumar et al. | A study on video data mining | |
Baidya et al. | LectureKhoj: automatic tagging and semantic segmentation of online lecture videos | |
Husain et al. | Multimodal fusion of speech and text using semi-supervised LDA for indexing lecture videos | |
Abdulmunem et al. | Semantic based video retrieval system: survey | |
Chivadshetti et al. | Content based video retrieval using integrated feature extraction and personalization of results | |
Saravanan | Segment based indexing technique for video data file | |
Zhang et al. | Effectively leveraging multi-modal features for movie genre classification | |
Haloi et al. | Unsupervised story segmentation and indexing of broadcast news video | |
Charhad et al. | Semantic video content indexing and retrieval using conceptual graphs | |
Ibrahim et al. | Large-scale text-based video classification using contextual features | |
Fleischman et al. | Unsupervised content-based indexing for sports video retrieval | |
Shrivastav et al. | Towards an ontology based framework for searching multimedia contents on the web | |
Shambharkar et al. | Automatic classification of movie trailers using data mining techniques: A review | |
Rozsa et al. | TV News Database Indexing System with Video Structure Analysis, Representative Images Extractions and OCR for News Titles | |
Ashok Kumar et al. | An efficient scene content-based indexing and retrieval on video lectures | |
Poornima et al. | Automatic Annotation of Educational Videos for Enhancing Information Retrieval. | |
Adrakatti et al. | CONTENT BASED RETRIEVAL OF LECTURE VIDEO REPOSITORY: LITERATURE REVIEW | |
Jacob et al. | An innovative Method of Accessing Digital Video Archives through Video Indexing | |
Dhakal | Political-advertisement video classification using deep learning methods | |
Khollam et al. | A survey on content based lecture video retrieval using speech and video text information | |
Lu et al. | Text detection in multimodal video analysis | |
Niaz et al. | EURECOM at TrecVid 2015: Semantic Indexing and Video Hyperlinking Tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |