CN116405745A - 视频信息的提取方法、装置、终端设备及计算机介质 - Google Patents

视频信息的提取方法、装置、终端设备及计算机介质 Download PDF

Info

Publication number
CN116405745A
CN116405745A CN202310680662.7A CN202310680662A CN116405745A CN 116405745 A CN116405745 A CN 116405745A CN 202310680662 A CN202310680662 A CN 202310680662A CN 116405745 A CN116405745 A CN 116405745A
Authority
CN
China
Prior art keywords
image
key frame
extracting
target
frame image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310680662.7A
Other languages
English (en)
Other versions
CN116405745B (zh
Inventor
冯建设
朱枫
谢旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinrun Fulian Digital Technology Co Ltd
City University of Hong Kong CityU
Original Assignee
Shenzhen Xinrun Fulian Digital Technology Co Ltd
City University of Hong Kong CityU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinrun Fulian Digital Technology Co Ltd, City University of Hong Kong CityU filed Critical Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority to CN202310680662.7A priority Critical patent/CN116405745B/zh
Publication of CN116405745A publication Critical patent/CN116405745A/zh
Application granted granted Critical
Publication of CN116405745B publication Critical patent/CN116405745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/8549Creating video summaries, e.g. movie trailer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8455Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种视频信息的提取方法、装置、终端设备及计算机介质,涉及图像处理技术领域,包括:对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。本发明达到了令编写人员能够更高效浏览学习目标视频图像中的内容,提高编写人员撰写标准作业程序效率并减少编写人员在编撰过程中的工作量的技术效果。

Description

视频信息的提取方法、装置、终端设备及计算机介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种视频信息的提取方法、装置、终端设备及计算机可读存储介质。
背景技术
随着SOP(Standard Operation Procedure-标准作业程序)技术的发展,标准作业程序被越来越多的应用于各种各样的日常工作事务中,尤其是针对厂房中各种设备的使用,通过标准作业程序能够更快的帮助设备操作人员掌握设备的使用方法,但是,目前标准作业程序的撰写主要由人工完成,而撰写人员在编写标准作业程序之前,往往需要观看包含大量无用信息或重复信息的教学视频,并对教学视频中的关键内容进行细化和量化才能编写标准作业程序,如此,不但影响了标准作业程序的编写进度,还大大浪费了撰写人员的时间和精力。
发明内容
本发明实施例通过提供一种视频信息的提取方法、装置、终端设备及计算机可读存储介质,旨在令编写人员能够更高效的撰写标准作业程序,并减少编写人员在编撰过程中的工作量。
本发明提供一种视频信息的提取方法,所述视频信息的提取方法应用于提取目标视频图像内的各关键帧图像,所述视频信息的提取方法包括以下步骤:
对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;
将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
进一步地,所述根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像的步骤,包括:
基于各所述图像相似度将所述目标视频图像分解为多个时间序列,并将所述多个时间序列组成时间序列子集;
在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像。
进一步地,所述在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像的步骤,包括:
在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像。
进一步地,在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像的步骤之后,所述方法包括:
检测各所述关键帧图像中是否存在与多个所述时间序列对应的目标关键帧图像;
若检测到存在所述目标关键帧图像,则标记所述目标关键帧图像为无效图像。
进一步地,所述方法还包括:
判断各所述单帧图像的数量是否大于预设的图像数量阈值;
若是,则按照预设的比例在各所述单帧图像中提取目标单帧图像,并对各所述目标单帧图像进行计算得到各所述目标单帧图像之间的各所述图像相似度。
进一步地,所述对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度的步骤,包括:
确认各所述单帧图像各自对应的编号标识;
基于各所述编号标识对各所述单帧图像进行排序得到排序结果;
按照所述排序结果依次对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度。
进一步地,所述对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度的步骤,包括:
缩小各所述单帧图像中处于相邻位置的单帧图像的尺寸,并将各所述单帧图像的色彩进行简化处理以得到各目标图像;
计算各所述目标图像的离散余弦变换平均值,并根据所述离散余弦变换平均值计算得到各所述目标图像的哈希值;
根据所述哈希值确定各所述目标图像之间的所述图像相似度。
此外,为实现上述目的,本发明还提供一种视频信息的提取装置,所述装置应用于提取目标视频图像内的关键信息,所述装置包括:
分帧模块,用于对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
计算模块,用于对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各关键帧图像;
排序模块,用于将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
此外,为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频信息的提取程序,所述处理器执行所述视频信息的提取程序时实现如上述中的视频信息的提取方法的步骤。
此外,为实现上述目的,本发明还提供一所述计算机可读存储介质上存储有视频信息的提取程序,所述视频信息的提取程序被处理器执行时实现如上述中的停视频信息的提取方法的步骤。
本发明实施例提供的视频信息的提取方法、装置、终端设备及计算机可读存储介质通过对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
在本实施例中,终端设备在运行时,首先调用视频处理模块对目标视频图像进行分帧处理,得到该目标视频图像内的各单帧图像,之后,该终端设备将该各单帧图像按照该各单帧图像在目标视频图像中的时间标记进行排列组成单帧图像合集,并将该单帧图像合集输入终端设备内置的相似度计算模块,由该相似度计算模块计算该单帧图像合集内各相邻单帧图像之间图像相似度,该终端设备将该各图像相似度输入关键帧提取模块内,通过关键帧提取算法基于该各图像相似度将该目标视频图像划分为多个不同的时间序列,并在该各时间序列中提取与各时间序列对应的各关键帧图像,最后,该终端设备将该各关键帧图像按照时间顺序进行排序并组成关键帧图像集。
如此,本发明通过对目标视频图像进行分帧处理并提取该目标视频图像中的各关键帧图像,将该各关键帧图像组成关键帧图像集的方式,达到了令编写人员能够更高效浏览学习目标视频图像中的内容,提高编写人员撰写标准作业程序效率并减少编写人员在编撰过程中的工作量的技术效果。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端设备的结构示意图;
图2为本发明视频信息的提取方法一实施例的流程示意图;
图3为本发明视频信息的提取方法一实施例涉及的细化流程示意图;
图4为本发明视频信息的提取方法一实施例涉及的步骤S203的细化流程示意图;
图5为本发明视频信息的提取方法一实施例涉及的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图。
本发明实施例所涉及的终端设备具体可以是集成控制系统作为内部操作系统的PC(Personal Computer,个人计算机),当然,该终端设备具体还可以是手机、平板等可移动终端设备或者其他固定式终端设备。
如图1所示,该终端设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及视频信息的提取程序。
在图1所示的终端设备中,网络接口1004主要用于与其他设备进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明终端设备中的处理器1001、存储器1005可以设置在终端设备中,所述终端设备通过处理器1001调用存储器1005中存储的视频信息的提取程序,并执行本发明实施例提供的视频信息的提取方法。
基于上述的终端设备,提供本发明视频信息的提取方法的各个实施例。
请参照图2,图2为本发明一种视频信息的提取方法第一实施例的流程示意图。应当理解的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,本发明视频信息的提取方法当然也可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,本发明视频信息的提取方法应用于提取目标视频图像内的关键信息,本发明视频信息的提取方法包括以下步骤:
步骤S10:对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
在本实施例中,终端设备在运行时,将目标视频图像输入至该终端设备内置的视频处理模块,通过该视频处理模块对该目标视频进行逐帧分解处理,以获得该目标视频图像中的各单帧图像,该视频处理模块将该各单帧图像输入值该终端设备内置的存储模块进行存储。
示例性地,例如,请参照图3,图为本发明视频信息的提取方法一实施例涉及的细化流程示意图,终端设备在运行的过程中,通过该终端设备内所集成的控制系统将上述目标视频图像输入该终端设备内置的图像处理装置,由该图像处理装置调用该控制系统内预先安装好的视频编辑工具对该目标视频图像进行分帧处理,以将该目标视频图像的每一帧单帧图像进行提取,同时,该图像处理装置按照该各单帧图像在该目标视频图像中的时间序列对该各单帧图像进行标记,并将该各单帧图像组合为单帧图像集,该图像处理装置将该单帧图像集输入该终端设备内置的存储器内进行存储。
步骤S20:对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;
在本实施例中,终端设备读取存储模块获取上述单帧图像集,并提取该单帧图像集内的各单帧图像,该终端设备按照该各单帧图像的标号将该各单帧图像进行排列,并将各相邻的单帧图像输入至该终端设备内置的相似度计算模块,由该相似度计算通过预设的哈希感知算法计算该各相邻的单帧图像之间的图像相似度,该相似度计算模块将该各图像相似度值入至该终端设备内置的关键帧提取模块,由该关键帧提取模块根据该各图像相似度,调用预设的关键帧提取算法在该各单帧图像中提取与该目标视频图像中的各关键帧图像。
示例性地,例如,请参照图3,图为本发明视频信息的提取方法一实施例涉及的细化流程示意图,终端设备读取存储器以获取上述的单帧图像集,并提取该单帧图像集内的各单帧图像,该终端设备按照该各单帧图像各自对应的标号对该各单帧图像进行排列,并将第i单帧图像和与该第i单帧图像相邻的第i+1单帧图像一同输入该终端设备内置的相似度计算装置,由该相似度计算装置调用用户预设的哈希感知算法计算该第i单帧图像与该第i+1单帧图像之间的相似度,该相似度计算装置将该相似度结果上传至该终端设备的控制系统,并由该控制系统将该相似度结果输入至该终端设备内置的关键帧提取装置,该关键帧提取装置根据用户预设的关键帧提取算法在上述各单帧图像中提取与目标视频图像内各步骤各自对应的各关键帧图像。
进一步地,在一种可行的实施例中,上述步骤S20中“对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度”的步骤,具体包括:
步骤S201:确认各所述单帧图像各自对应的编号标识;
在本实施例中,终端设备在获取上述各单帧图像后,读取该各单帧图像内与上述目标视频图像内各时间序列各自对应的编号标识。
步骤S202:基于各所述编号标识对各所述单帧图像进行排序得到排序结果;
在本实施例中,终端设备在识别上述编号标识之后,按照该各编号标识对该各单帧图像进行排列,并在排列完成后确认该各单帧图像之间的位置关系;
步骤S203:按照所述排序结果依次对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度;
在本实施例中,终端设备在完成对上述各单帧图像的排列之后,该终端设备调用相似度计算模块按照上述位置关系,依次对位置关系处于相邻位置的各单帧图像调用用户预设的感知哈希算法进行计算,以获取处于相邻位置的各单帧图像之间的各图像相似度。
示例性地,例如,终端设备在获取上述各单帧图像后,读取该各单帧图像内与上述目标视频图像内各时间序列各自对应的编号标识,并按照该各编号标识对该各单帧图像进行排列以确定该各图像之间的位置关系,之后,该终端设备调用相似度计算装置识别上述确认的位置关系,对处于相邻位置的各单帧图像调用用户预设的感知哈希算法进行计算,该相似度计算装置根据计算结果得到该各单帧图像之间的各图像相似度,并将该各图像相似度值输入至该终端设备内的关键帧提取装置中。
进一步地,请参照图4,图4为本发明视频信息的提取方法一实施例涉及步骤S203的细化流程示意图,在一种可行的实施例中,上述步骤S203,具体可以包括:
步骤S2031:缩小各所述单帧图像中处于相邻位置的单帧图像的尺寸,并将各所述单帧图像的色彩进行简化处理以得到各目标图像;
在本实施例中,终端设备调用相似度计算模块将上述各单帧图像的尺寸进行缩小,同时将该各单帧图像的色彩进行简化并将经过缩小处理和色彩简化处理的该各单帧图像标记为各目标图像。
步骤S2032:计算各所述目标图像的离散余弦变换平均值,并根据所述离散余弦变换平均值计算得到各所述目标图像的哈希值:
在本实施例中,终端设备的相似度计算模块计算上述经过缩小处理和色彩简化处理的各目标图像对应的各离散余弦变换值,之后,该相似度计算模块将各目标图像的各离散余弦变换值进行平均值计算得到上述离散余弦变换平均值,并根据该离散余弦变换平均值计算得到哈希值。
步骤S2033:根据所述哈希值确定各所述目标图像之间的所述图像相似度;
在本实施例中,终端设备将上述各哈希值组合在一起展开构成各向量,并将该各向量标识为各单帧图像之间的图像相似度。
示例性地,例如,终端设备调用相似度计算装置对上述各单帧图像的尺寸进行缩小处理,得到32*32像素大小的单帧图像,同时,该相似度计算装置对经过处理的单帧图像的色彩进行简化处理,并将该经过处理的单帧图像转化为256阶的灰度图像,并将该灰度图像标记为目标图像,然后,该相似度计算装置调用控制系统内预先安装的Opencv计算机视觉和机器学习软件库将该目标图像转化为频率和标量的集合,以得到32*32的离散余弦变换矩阵并对该离散余弦变换矩阵做进一步的缩小,仅保留该目标图像左上角8*8的离散余弦变换矩阵,并计算离散余弦变换矩阵平均值,再然后,根据所得的8*8离散余弦变换矩阵,该似度计算装置设置0或1的64位的哈希值,并将大于等于离散余弦变换矩阵的64位的哈希值设置为1,小于离散余弦变换矩阵的64位的哈希值设置为0,该相似度计算装置将该各64位的哈希值组合在一起,展开构成一个64位的向量,最后,该相似度计算装置计算两个相邻的单帧图像之间的向量之间的汉明距离确定两个图像之间的相异性标识为:
Figure SMS_1
进一步地,在一种可行的实施例中,上述步骤S20“根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像”的步骤,具体可以包括:
步骤S204:基于各所述图像相似度将所述目标视频图像分解为多个时间序列,并将所述多个时间序列组成时间序列子集;
在本实施例中,终端设备将上述得到的各图像相似度输入该终端设备内置的关键帧提取装置,由该关键帧提取装置调用用户预设的关键帧提取算法首先将上述目标视频按照该各图像相似度分解为多个时间序列,并令该多个时间序列与该目标视频内的各步骤各自对应,之后,将该多个时间序列组成时间序列子集并上传至控制系统。
步骤S205:在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像;
在本实施例中,终端设备的控制系统读取上述时间序列子集并输入关键帧提取模块,由该关键帧提取算法在该时间序列子集内多个时间序列中提取该各时间序列各自对应的关键帧图像,并将该各关键帧图像与对应的时间序列上传至控制系统。
示例性地,例如,终端设备将上述得到的各图像相似度输入该终端设置的关键帧提取装置,由该关键帧提取装置调用用户预设的关键帧提取算法将上述目标视频基于该各图像相似度分解为多个时间序列,并将该多个时间序列组成时间序列子集,然后,该关键帧提取装置在该序列子集中提取与各时间序列各自对应的关键帧图像,并将该各关键帧图像与该各时间序列进行绑定并上传至控制系统。
需要说明的是,在本实施例中,上述关键帧提取算法的数据推倒原理为建立上述单帧图像集
Figure SMS_2
,因为该单帧图像集中的各单帧图像已经按上述时间序列进行排序,因此,该单帧图像集中各单帧图像p的下标与该时间序列各自对应,同时,该单帧图像集P可以视为上述时间序列,因此,该单帧图像集中每两个图像与/>
Figure SMS_3
之间的相/>
Figure SMS_4
似度表示为
Figure SMS_5
,进而,将该相似度转化为矩阵形式:
Figure SMS_6
通过该矩阵D,可以从单帧图像集P中建议另一个小的子集以表示该目标视频图像的时间序列,因此,对相异性
Figure SMS_7
以及相关联的赋值变量/>
Figure SMS_8
建立一个优化程序,即:
Figure SMS_9
其中,
Figure SMS_10
用来表示是/>
Figure SMS_11
否能够代表/>
Figure SMS_12
。如果可以,则/>
Figure SMS_13
即等于1;反之如果不可以,则/>
Figure SMS_14
等于0,因此,用一个子集表示所有样本的代价函数可以定义为:
Figure SMS_15
同时,所选数据点的数量应该尽可能的少。因此,矩阵Z中的非零行数可以进一步表示为:
Figure SMS_16
可以理解的是,式中的
Figure SMS_17
为p的范数,/>
Figure SMS_18
为指示函数。当它的输入为正时等于1。
将以上两个代价函数相结合,得到用于信号概括的目标函数:
Figure SMS_19
可以理解的是,式中
Figure SMS_20
为一个权衡参数;
其中,为了达到简化该优化目标的计算,对以上目标函数进行转换得到:
Figure SMS_21
可以理解的是,式中的
Figure SMS_22
为一个辅助的变量,/>
Figure SMS_23
为一个数值极大的任意常数,通过这两个变量,简化的表示出上述Z中的非零行数,上述/>
Figure SMS_24
即为所得的代表性样本的数量;
进一步地,针对该目标函数,考虑到所得图像数据集都具有相应的时间戳,可视为一个时间序列,每个时间点的样本只能由它之前的时间点的样本表示,因此,设置三个主要的限制条件,即:
确保所选的关键帧均为每一个步骤片段的第一帧,即因果约束;
Figure SMS_25
或者,
确保每个时间点的图像样本有且只有一个代表,即唯一性约束;
Figure SMS_26
或者,
每个时间点的图像样本只能代表一个连续的时间段中的所有样本,即连续性约束;
如此,就能确保所选的代表样本能代表一个视频片段,进而得到:
Figure SMS_27
而为了提高求解该优化目标的效率,则分别对上述因果约束以及上述连续性约束做以下的变换,针对该因果约束通过对相异性矩阵D的元素
Figure SMS_28
增加一个额外的惩罚性:
Figure SMS_29
其中
Figure SMS_30
为一个数值极大的常数;
通过上述这种方式, 如果i<j,一个额外的惩罚性
Figure SMS_31
会被引入,从而避免/>
Figure SMS_32
,也可以间接实现因果约束,而避免对/>
Figure SMS_33
施加约束,完成简化运算;
而针对连续性约束,我们将其转换为:
Figure SMS_35
基于以上变换,得到以下的优化目标方程式:
Figure SMS_36
该目标方程式符合线性规划的基本形式,则在本实施例中,终端设备可直接通过CVX,Gurobi等预设的工具程序对该目标方程式进行直接求解。
进一步地,在一种可行的实施例中,上述步骤S20“在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像”的步骤,还可以包括:
步骤S206:在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像;
在本实施例中,终端设备通过控制系统读取上述时间序列子集,同时调用关键帧提取模块确定该时间序列子集中的各时间序列,该关键帧提取模块在该各时间序列中提取该各时间序列的第一帧图像,并将该各第一帧图像标记为关键帧图像。
或者,
终端设备通过控制系统读取上述时间序列子集,同时调用关键帧提取模块确定该时间序列子集中的各时间序列,该关键帧提取模块在该各时间序列中提取该各时间序列的任意一帧图像,并将该图像标记为该关键帧图像。
示例性地,例如,终端设备通过控制系统读取上述时间序列子集,同时调用关键帧提取装置调整上述关键帧提取算法内的:
Figure SMS_37
,if/>
Figure SMS_38
之后,该关键帧提取装置调用调整后的关键帧提取算法在该各时间序列中提取该各时间序列的第一帧图像,并将该各第一帧图像标记为关键帧图像;
或者,
终端设备通过控制系统读取上述时间序列子集,同时调用关键帧提取装置调整上述关键帧提取算法内的:
Figure SMS_39
之后,该关键帧提取装置调用调整后的关键帧提取算法在该各时间序列中提取该各时间序列的任一图像,并将该图像标记为该关键帧图像。
进一步地,在一种可行的实施例中,在上述步骤S20之后,本发明视频信息的提取方法还可以包括:
步骤S207:检测各所述关键帧图像中是否存在与多个所述时间序列对应的目标关键帧图像;
在本实施例中,终端设备在调用关键帧提取模块提取各关键帧图像之后,对该各关键帧图像进行检测,以确定该各关键帧图像中是否包含能与上述时间序列子集内多个时间序列产生对应关系的目标关键帧图像。
步骤S208:若检测到存在所述目标关键帧图像,则标记所述目标关键帧图像为无效图像;
在本实施例中,若该终端设备检测到各关键帧图像中包含能与上述时间序列子集内多个时间序列产生对应关系的目标关键帧图像,则该终端设备标记该目标关键帧图像为无效图像。
示例性地,例如,终端设备在调用关键帧提取模块提取各关键帧图像之后,对关键帧提取装置内关键帧提取算法进行调整;
令:
Figure SMS_40
,if/>
Figure SMS_41
之后,该终端设备调用该关键帧提取装置对该各关键帧图像进行检测,以确定该各关键帧图像中是否包含能与上述时间序列子集内多个时间序列产生对应关系的目标关键帧图像,若关键帧提取装置检测到该各关键帧图像中包含能与上述时间序列子集内多个时间序列产生对应关系的该目标关键帧图像,则该关键帧提取装置标记该目标关键帧图像为无效图像。
步骤S30:将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集;
在本实施例中,终端设备读取上述各关键帧图像,并将该各关键帧图像与上述目标视频图像的各步骤进行比对以确定该各关键帧图像与该各步骤之间的时间序列关系,之后,该终端设备按照该各时间序列关系对该各关键帧图像进行排序,并按照排序后的结果将该各关键帧图像按照该排序组成关键帧图像集。
示例性地,例如,请参照图3,图为本发明视频信息的提取方法一实施例涉及的细化流程示意图,终端设备读取上述各关键帧图像,同时读取上述目标视频图像内各步骤各自对应的时间序列,该终端设备调用关键帧提取装置将该各关键帧图像与该各时间序列进行匹配以确定该各关键帧各自对应的时间序列,该关键帧提取装置根据该各步骤各自对应的各时间序列对该各关键帧图像进行排序,并将该各关键帧图像按照排序后的结果组成关键帧图像集,该关键帧提取装置将该关键帧图像集上传至控制系统,由控制系统将该关键帧图像集转化为一可视化界面输出至与该终端设备链接的显示设备以供用户查看该目标视频图像内的关键信息。
进一步地,在一种可行的实施例中,本发明视频信息的提取方法还包括:
步骤A:判断各所述单帧图像的数量是否大于预设的图像数量阈值;
在本实施例中,终端设备预先接收用户触发的设置图像数量阈值的指令,该终端设备根据该指令内携带的图像数量阈值对相似度处理模块进行设置,在计算上述各相邻单帧图像之间的图像相似度之前,该相似度计算模块首先确认该目标视频图像内的单帧图像总数,并将该单帧图像总数与该图像数量阈值进行比对,以确定该单帧图像总数是否高于该图像数量阈值。
步骤B:若是,则按照预设的比例在各所述单帧图像中提取目标单帧图像,并对各所述目标单帧图像进行计算得到各所述目标单帧图像之间的各所述图像相似度;
在本实施例中,若相似度计算模块确定上述单帧图像总数高于上述图像数量阈值,则该终端设备控制该相似度计算模块按照用户预设的比例在上述各单帧图像中提取一定比例的目标单帧图像,并对该各目标单帧图像通过预设的哈希感知算法计算该各目标单帧图像之间的图像相似度。
示例性地,例如,终端设备预先接收用户触发的设置图像数量阈值的指令,该终端设备根据该指令内携带的图像数量阈值对相似度计算装置进行设置,令该相似度计算装置进行上述图像相似度的计算数量不超过该图像数量阈值,同时,在计算上述各相邻单帧图像之间的图像相似度之前,该相似度计算装置首先获取上述处理装置输出的该目标视频图像内包含的单帧图像总数,并将该单帧图像总数与该图像数量阈值进行对比,以确定该单帧图像总数是否高于该图像数量阈值,而当该相似度计算装置确定该单帧图像总数高于该图像数量阈值,则该终端设备控制该相似度计算装置按照用户预设的比例在该各单帧图像中提取一定比例的目标单帧图像,例如,当该用户预设的比例为50%时,该终端设备控制该相似度计算装置在全部的单帧图像中提取50%的单帧图像作为目标单帧图像,并对该各目标单帧图像通过预设的哈希感知算法计算该各目标单帧图像之间的图像相似度。
在本实施例中,终端设备在运行时,将目标视频图像输入至该终端设备内置的视频处理模块,通过该视频处理模块对该目标视频进行逐帧分解处理,以获得该目标视频图像中的各单帧图像,该视频处理模块将该各单帧图像输入值该终端设备内置的存储模块进行存储,然后,该终端设备读取存储模块获取上述单帧图像集,并提取该单帧图像集内的各单帧图像,该终端设备按照该各单帧图像的标号将该各单帧图像进行排列,并将各相邻的单帧图像输入至该终端设备内置的相似度计算模块,由该相似度计算通过预设的哈希感知算法计算该各相邻的单帧图像之间的图像相似度,该相似度计算模块将该各图像相似度值入至该终端设备内置的关键帧提取模块,由该关键帧提取模块根据该各图像相似度,调用预设的关键帧提取算法在该各单帧图像中提取与该目标视频图像中的各关键帧图像,最后,该终端设备读取上述各关键帧图像,并将该各关键帧图像与上述目标视频图像的各步骤进行比对以确定该各关键帧图像与该各步骤之间的时间序列关系,之后,该终端设备按照该各时间序列关系对该各关键帧图像进行排序,并按照排序后的结果将该各关键帧图像按照该排序组成关键帧图像集。
如此,本发明通过对目标视频图像进行分帧处理并提取该目标视频图像中的各关键帧图像,将该各关键帧图像组成关键帧图像集的方式,达到了令编写人员能够更高效浏览学习目标视频图像中的内容,提高编写人员撰写标准作业程序效率并减少编写人员在编撰过程中的工作量的技术效果。
此外,本发明还提供一种视频信息的提取装置,本发明视频信息的提取装置应用于提取目标视频图像内的关键信息,请参照图5,图5为本发明视频信息的提取装置一实施例的功能模块示意图,如图5所示,本发明视频信息的提取装置包括:
分帧模块,用于对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
计算模块,用于对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各关键帧图像;
排序模块,用于将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
进一步地,计算模块,包括:
视频分解单元:用于基于各所述图像相似度将所述目标视频图像分解为多个时间序列,并将所述多个时间序列组成时间序列子集;
图像提取单元:用于在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像。
进一步地,计算模块,还包括:
图像提取单元:用于在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像。
进一步地,计算模块,还包括:
关键图像筛选单元:用于检测各所述关键帧图像中是否存在与多个所述时间序列对应的目标关键帧图像;
无效标记单元:用于若检测到存在所述目标关键帧图像,则标记所述目标关键帧图像为无效图像。
进一步地,计算模块,还包括:
图像阈值检测单元:用于判断各所述单帧图像的数量是否大于预设的图像数量阈值;
数据处理降低单元:用于若判断到所述各单帧图像的数量大于预设的图像数量阈值,则按照预设的比例在各所述单帧图像中提取目标单帧图像,并对各所述目标单帧图像进行计算得到各所述目标单帧图像之间的各所述图像相似度。
进一步地,计算模块,还包括:
编号确认单元:用于确认各所述单帧图像各自对应的编号标识;
图像排序单元:用于基于各所述编号标识对各所述单帧图像进行排序得到排序结果;
相似计算单元:用于按照所述排序结果依次对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度。
进一步地,相似计算单元,包括:
图像处理子单元:用于缩小各所述单帧图像中处于相邻位置的单帧图像的尺寸,并将各所述单帧图像的色彩进行简化处理以得到各目标图像;
数据计算子单元:用于计算各所述目标图像的离散余弦变换平均值,并根据所述离散余弦变换平均值计算得到各所述目标图像的哈希值;
哈希值计算子单元:用于根据所述哈希值确定各所述目标图像之间的所述图像相似度。
此外,本发明还提供一种终端设备,该终端设备上有可在处理器上运行的视频信息的提取程序,所述终端设备执行所述视频信息的提取程序时实现如以上任一项实施例所述的视频信息的提取方法的步骤。
本发明终端设备的具体实施例与上述视频信息的提取方法各实施例基本相同,在此不作赘述。
此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有视频信息的提取程序,所述视频信息的提取程序被处理器执行时实现如以上任一项实施例所述的视频信息的提取方法的步骤。
本发计算机可读存储介质的具体实施例与视频信息的提取方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还 包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、 方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光 盘)中,包括若干指令用以使得一台终端设备(可以集成控制系统作为内部操作系统的PC,当然,该终端设备具体还可以是手机、平板等可移动终端设备或者其他固定式终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种视频信息的提取方法,其特征在于,所述视频信息的提取方法应用于提取目标视频图像内的各关键帧图像,所述视频信息的提取方法包括以下步骤:
对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像;
将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
2.如权利要求1所述的视频信息的提取方法,其特征在于,所述根据各所述图像相似度在各所述单帧图像中提取各所述关键帧图像的步骤,包括:
基于各所述图像相似度将所述目标视频图像分解为多个时间序列,并将所述多个时间序列组成时间序列子集;
在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像。
3.如权利要求2所述的视频信息的提取方法,其特征在于,所述在所述时间序列子集中提取所述多个时间序列各自对应的各所述关键帧图像的步骤,包括:
在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像。
4.如权利要求3所述的视频信息的提取方法,其特征在于,在所述时间序列子集中提取所述多个时间序列各自对应的一帧图像为所述关键帧图像的步骤之后,所述方法包括:
检测各所述关键帧图像中是否存在与多个所述时间序列对应的目标关键帧图像;
若检测到存在所述目标关键帧图像,则标记所述目标关键帧图像为无效图像。
5.如权利要求1所述的视频信息的提取方法,其特征在于,所述方法还包括:
判断各所述单帧图像的数量是否大于预设的图像数量阈值;
若是,则按照预设的比例在各所述单帧图像中提取目标单帧图像,并对各所述目标单帧图像进行计算得到各所述目标单帧图像之间的各所述图像相似度。
6.如权利要求1所述的视频信息的提取方法,其特征在于,所述对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度的步骤,包括:
确认各所述单帧图像各自对应的编号标识;
基于各所述编号标识对各所述单帧图像进行排序得到排序结果;
按照所述排序结果依次对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度。
7.如权利要求6所述的视频信息的提取方法,其特征在于,所述对各所述单帧图像中处于相邻位置的单帧图像采用感知哈希算法进行计算得到各所述图像相似度的步骤,包括:
缩小各所述单帧图像中处于相邻位置的单帧图像的尺寸,并将各所述单帧图像的色彩进行简化处理以得到各目标图像;
计算各所述目标图像的离散余弦变换平均值,并根据所述离散余弦变换平均值计算得到各所述目标图像的哈希值;
根据所述哈希值确定各所述目标图像之间的所述图像相似度。
8.一种视频信息的提取装置,其特征在于,所述装置应用于提取目标视频图像内的关键信息,所述装置包括:
分帧模块,用于对所述目标视频图像进行分帧处理得到所述目标视频图像内的各单帧图像;
计算模块,用于对各所述单帧图像进行计算得到各所述单帧图像之间的各图像相似度,根据各所述图像相似度在各所述单帧图像中提取各关键帧图像;
排序模块,用于将各所述关键帧图像进行排序得到排序结果,根据所述排序结果将各所述关键帧图像组成关键帧图像集。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频信息的提取程序,所述处理器执行所述视频信息的提取程序时实现如权利要求1至7中任一项所述的视频信息的提取方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频信息的提取程序,所述视频信息的提取程序被处理器执行时实现如权利要求1至7任一项所述的视频信息的提取方法的步骤。
CN202310680662.7A 2023-06-09 2023-06-09 视频信息的提取方法、装置、终端设备及计算机介质 Active CN116405745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310680662.7A CN116405745B (zh) 2023-06-09 2023-06-09 视频信息的提取方法、装置、终端设备及计算机介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310680662.7A CN116405745B (zh) 2023-06-09 2023-06-09 视频信息的提取方法、装置、终端设备及计算机介质

Publications (2)

Publication Number Publication Date
CN116405745A true CN116405745A (zh) 2023-07-07
CN116405745B CN116405745B (zh) 2023-11-17

Family

ID=87016532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310680662.7A Active CN116405745B (zh) 2023-06-09 2023-06-09 视频信息的提取方法、装置、终端设备及计算机介质

Country Status (1)

Country Link
CN (1) CN116405745B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132926A (zh) * 2023-10-27 2023-11-28 腾讯科技(深圳)有限公司 一种视频处理的方法、相关装置、设备以及存储介质

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101072305A (zh) * 2007-06-08 2007-11-14 华为技术有限公司 镜头分类方法、场景提取方法、摘要生成方法及装置
CN101398855A (zh) * 2008-10-24 2009-04-01 清华大学 一种视频关键帧提取方法和系统
CN101425088A (zh) * 2008-10-24 2009-05-06 清华大学 基于图分割的关键帧提取方法和系统
CN101443850A (zh) * 2006-05-12 2009-05-27 惠普开发有限公司 视频的关键帧提取
CN102663431A (zh) * 2012-04-17 2012-09-12 北京博研新创数码科技有限公司 一种基于区域加权的图像匹配计算方法
CN103942751A (zh) * 2014-04-28 2014-07-23 中央民族大学 一种视频关键帧提取方法
CN105718871A (zh) * 2016-01-18 2016-06-29 成都索贝数码科技股份有限公司 一种基于统计的视频主持人识别方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107087211A (zh) * 2017-03-30 2017-08-22 北京奇艺世纪科技有限公司 一种主持人镜头检测方法及装置
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN107590419A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 视频分析中的镜头关键帧提取方法及装置
CN107590420A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 视频分析中的场景关键帧提取方法及装置
US20180082127A1 (en) * 2014-12-19 2018-03-22 Amazon Technologies, Inc. Video segmentation techniques
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110287778A (zh) * 2019-05-15 2019-09-27 北京旷视科技有限公司 一种图像的处理方法、装置、终端及存储介质
CN110941594A (zh) * 2019-12-16 2020-03-31 北京奇艺世纪科技有限公司 一种视频文件的拆分方法、装置、电子设备及存储介质
CN111353552A (zh) * 2020-03-13 2020-06-30 杭州趣维科技有限公司 一种基于感知哈希算法的图像相似度对比方法
CN111541939A (zh) * 2020-04-30 2020-08-14 北京奇艺世纪科技有限公司 一种视频拆分方法、装置、电子设备及存储介质
CN112270247A (zh) * 2020-10-23 2021-01-26 杭州卷积云科技有限公司 基于帧间差分和颜色直方图差值的关键帧提取方法
CN113111208A (zh) * 2021-05-11 2021-07-13 青岛以萨数据技术有限公司 一种以图搜图的方法、系统、设备及存储介质
CN114494775A (zh) * 2022-01-24 2022-05-13 深圳市英威诺科技有限公司 视频切分方法、装置、设备及存储介质
WO2023011094A1 (zh) * 2021-08-02 2023-02-09 北京百度网讯科技有限公司 视频编辑方法、装置、电子设备以及存储介质

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101443850A (zh) * 2006-05-12 2009-05-27 惠普开发有限公司 视频的关键帧提取
CN101072305A (zh) * 2007-06-08 2007-11-14 华为技术有限公司 镜头分类方法、场景提取方法、摘要生成方法及装置
CN101398855A (zh) * 2008-10-24 2009-04-01 清华大学 一种视频关键帧提取方法和系统
CN101425088A (zh) * 2008-10-24 2009-05-06 清华大学 基于图分割的关键帧提取方法和系统
CN102663431A (zh) * 2012-04-17 2012-09-12 北京博研新创数码科技有限公司 一种基于区域加权的图像匹配计算方法
CN103942751A (zh) * 2014-04-28 2014-07-23 中央民族大学 一种视频关键帧提取方法
US20180082127A1 (en) * 2014-12-19 2018-03-22 Amazon Technologies, Inc. Video segmentation techniques
CN105718871A (zh) * 2016-01-18 2016-06-29 成都索贝数码科技股份有限公司 一种基于统计的视频主持人识别方法
CN105912643A (zh) * 2016-04-08 2016-08-31 浙江理工大学 一种基于内容改进型均值哈希的图像检索方法
CN107590419A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 视频分析中的镜头关键帧提取方法及装置
CN107590420A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 视频分析中的场景关键帧提取方法及装置
CN107087211A (zh) * 2017-03-30 2017-08-22 北京奇艺世纪科技有限公司 一种主持人镜头检测方法及装置
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN109918537A (zh) * 2019-01-18 2019-06-21 杭州电子科技大学 一种基于HBase的船舶监控视频内容的快速检索方法
CN110287778A (zh) * 2019-05-15 2019-09-27 北京旷视科技有限公司 一种图像的处理方法、装置、终端及存储介质
CN110941594A (zh) * 2019-12-16 2020-03-31 北京奇艺世纪科技有限公司 一种视频文件的拆分方法、装置、电子设备及存储介质
CN111353552A (zh) * 2020-03-13 2020-06-30 杭州趣维科技有限公司 一种基于感知哈希算法的图像相似度对比方法
CN111541939A (zh) * 2020-04-30 2020-08-14 北京奇艺世纪科技有限公司 一种视频拆分方法、装置、电子设备及存储介质
CN112270247A (zh) * 2020-10-23 2021-01-26 杭州卷积云科技有限公司 基于帧间差分和颜色直方图差值的关键帧提取方法
CN113111208A (zh) * 2021-05-11 2021-07-13 青岛以萨数据技术有限公司 一种以图搜图的方法、系统、设备及存储介质
WO2023011094A1 (zh) * 2021-08-02 2023-02-09 北京百度网讯科技有限公司 视频编辑方法、装置、电子设备以及存储介质
CN114494775A (zh) * 2022-01-24 2022-05-13 深圳市英威诺科技有限公司 视频切分方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132926A (zh) * 2023-10-27 2023-11-28 腾讯科技(深圳)有限公司 一种视频处理的方法、相关装置、设备以及存储介质
CN117132926B (zh) * 2023-10-27 2024-02-09 腾讯科技(深圳)有限公司 一种视频处理的方法、相关装置、设备以及存储介质

Also Published As

Publication number Publication date
CN116405745B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN111950424B (zh) 一种视频数据处理方法、装置、计算机及可读存储介质
CN111160335A (zh) 基于人工智能的图像水印处理方法、装置及电子设备
CN110675940A (zh) 病理图像标注方法、装置、计算机设备及存储介质
CN116405745B (zh) 视频信息的提取方法、装置、终端设备及计算机介质
CN110852311A (zh) 一种三维人手关键点定位方法及装置
CN112801099B (zh) 一种图像处理方法、装置、终端设备及介质
CN112330331A (zh) 基于人脸识别的身份验证方法、装置、设备及存储介质
CN113569998A (zh) 票据自动识别方法、装置、计算机设备及存储介质
CN114399775A (zh) 文档标题生成方法、装置、设备及存储介质
CN114022891A (zh) 扫描文本的关键信息提取方法、装置、设备及存储介质
CN112839185A (zh) 用于处理图像的方法、装置、设备和介质
CN116629201A (zh) 标签自动布局排版方法、装置、电子设备及存储介质
CN114743018B (zh) 图像描述生成方法、装置、设备及介质
CN113627576B (zh) 扫码信息检测方法、装置、设备及存储介质
CN115937862A (zh) 一种端到端的集装箱号码识别方法及系统
CN114943306A (zh) 意图分类方法、装置、设备及存储介质
CN114970467A (zh) 基于人工智能的作文初稿生成方法、装置、设备及介质
CN112232431A (zh) 水印检测模型训练方法、水印检测方法、系统、设备及介质
CN112395834A (zh) 基于图片输入的脑图生成方法、装置、设备及存储介质
CN113887422A (zh) 基于人工智能的表格图片内容提取方法、装置及设备
Kwon et al. An introduction to face-recognition methods and its implementation in software applications
CN117830601B (zh) 一种基于弱监督的三维视觉定位方法、装置、设备及介质
CN113850207B (zh) 基于人工智能的微表情分类方法、装置、电子设备及介质
CN117275023A (zh) 一种表格解析方法、装置、设备及其存储介质
CN117333861A (zh) 一种三维模型识别的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant