CN111414842B - 一种视频对比方法、装置、计算机设备和存储介质 - Google Patents
一种视频对比方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111414842B CN111414842B CN202010187813.1A CN202010187813A CN111414842B CN 111414842 B CN111414842 B CN 111414842B CN 202010187813 A CN202010187813 A CN 202010187813A CN 111414842 B CN111414842 B CN 111414842B
- Authority
- CN
- China
- Prior art keywords
- video
- definition
- feature vector
- image sequence
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Signal Processing (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种视频对比方法、装置、计算机设备和存储介质,可获取第一视频和第二视频;从第一视频和第二视频中分别获取第一图像序列和第二图像序列;再通过视频对比模型的第一特征提取模块对第一图像序列进行第一清晰度特征向量的提取;通过视频对比模型的第二特征提取模块对第二图像序列进行第二清晰度特征向量的提取,该第一特征提取模块和第二特征提取模块相同,故两图像序列的清晰度特征向量可更准确反映两视频的清晰度相对情况,通过视频对比模型的清晰度差分析模块,基于第一清晰度特征向量和第二清晰度特征向量,确定第一视频和第二视频的清晰度差,实现对两视频的清晰度差异的量化,有利于提升对视频的清晰度差异的分析准确度。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种视频对比方法、装置、计算机设备和存储介质。
背景技术
相关技术中,视频清晰度的评估方式基本上都是针对单个视频进行的,若是基于这种清晰度的评估方式来对两个视频进行比较,则两个视频的清晰度差的准确度得不到保证。
发明内容
本发明实施例提供一种视频对比方法、装置、计算机设备和存储介质,可以提升对视频之间的清晰度比较结果的准确度。
本发明实施例提供一种视频对比方法,该方法包括:
获取第一视频和第二视频;
从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;
通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
本发明实施例还提供一种视频对比装置,该装置包括:
获取单元,用于获取第一视频和第二视频;
序列提取单元,用于从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
第一特征提取单元,用于通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
第二特征提取单元,用于通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;
清晰度差分析单元,用于通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
可选的,获取单元,用于:
获取原始视频;
对所述原始视频按照第一视频转码方式进行转换,得到第一视频;
对所述原始视频按照第二视频转码方式进行转换,得到第二视频。
可选的,获取单元,用于:
基于待评估的视频客户端提供的第一视频转码方式,对所述原始视频进行转换,得到第一视频;
所述对所述原始视频按照第二视频转码方式进行转换,得到第二视频,包括:
基于所述视频客户端的竞品视频客户端提供的第二视频转码方式,对所述原始视频进行转换,得到第二视频。
可选的,序列提取单元,用于:
从所述第一视频中提取预设数量的第一图像,组成第一图像序列;
从所述第二视频中,提取与所述第一视频中的第一图像位置相同的第二图像,组成第二图像序列。
可选的,第一特征提取单元,用于:
通过所述第一特征提取模块,将所述第一图像序列中的第一图像从像素空间映射到目标嵌入空间,得到所述第一图像序列的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的第一图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列对应的第一清晰度特征向量;
对应的,第二特征提取单元,用于:
通过所述第二特征提取模块,将所述第二图像序列中的第二图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的第二图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列对应的第二清晰度特征向量。
可选的,清晰度差分析单元,用于:
通过所述视频对比模型的清晰度差分析模块计算所述第一清晰度特征向量和所述第二清晰度特征向量的向量差值;
基于所述向量差值确定所述第一视频和第二视频的清晰度差。
可选的,所述第二视频转码方式为预设参考视频转码方式;本实施例的视频对比装置还包括:转码性能分析单元,用于在清晰度差分析单元,通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差后,基于所述清晰度差,分析所述第一视频转码方式相较于所述预设参考视频转码方式的转码性能优劣程度。
可选的,本实施例的视频对比装置还包括:训练单元,用于在通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取前,获取训练样本对,其中,训练样本对中包括第一图像序列样本和第二图像序列样本,同一训练样本对中的第一图像序列样本来自同一个第一视频样本,同一训练样本对中的第二图像序列样本来自同一个第二视频样本,所述训练样本对的样本标签包括对应的第一视频样本和第二视频样本的期望清晰度差;获取待训练的视频对比模型,所述视频对比模型包括第一特征提取模块,第二特征提取模块,和清晰度差分析模块;通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取;通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块的网络结构和网络参数相同;通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差;基于训练样本对的预测清晰度差和对应的期望清晰度差,调整所述视频对比模型的参数,直到所述视频对比模型训练完成,其中,在每一次参数调整后,所述第一特征提取模块和第二特征提取模块的参数相同。
可选的,训练单元,用于:
通过所述第一特征提取模块,将所述第一图像序列样本中的图像从像素空间映射到目标嵌入空间,得到所述第一图像序列样本的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列样本的第一清晰度特征向量;
通过所述第二特征提取模块,将所述第二图像序列样本中的图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列样本的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列样本的第二清晰度特征向量。
可选的,训练单元,用于:
通过所述清晰度差分析模块,计算同一训练样本对所对应的所述第一清晰度特征向量和第二清晰度特征向量之间的向量差值;
基于所述训练样本对的向量差值,确定训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
本发明实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上所述视频对比方法的步骤。
本发明实施例还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述视频对比方法的步骤。
本发明实施例提供了一种视频对比方法、装置、计算机设备和存储介质,可以获取第一视频和第二视频;然后从第一视频中获取第一图像序列,从第二视频中获取第二图像序列;再通过视频对比模型的第一特征提取模块对第一图像序列进行第一清晰度特征向量的提取;通过视频对比模型的第二特征提取模块对第二图像序列进行第二清晰度特征向量的提取,本实施例的第一特征提取模块和第二特征提取模块相同,其提取的两个图像序列的清晰度特征向量可以更加准确反映出两个视频的清晰度相对情况,提取特征向量后,可通过视频对比模型的清晰度差分析模块基于第一清晰度特征向量和第二清晰度特征向量,确定第一视频和第二视频的清晰度差,实现对两个视频的清晰度差异的量化,本实施例基于清晰度特征向量的分析,有利于提升对视频的清晰度差异的分析准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的视频对比方法的场景示意图;
图2是本发明实施例提供的一种视频对比方法的流程图;
图3a是本发明实施例中视频对比模型的训练方法的流程图;
图3b是本发明实施例提供的视频对比方案的技术框架图;
图4是本发明实施例提供的一种视频对比装置的结构示意图;
图5是本发明实施例提供的一种计算机设备的结构示意图;
图6是本发明实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图;
图7是本发明实施例提供的区块结构的一个可选的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种视频对比方法、装置、计算机设备和存储介质。具体地,本实施例提供适用于视频对比装置的视频对比方法,该视频对比装置可以集成在计算机设备中。
该计算机设备可以为终端等设备,例如可以为手机、平板电脑、笔记本电脑、台式电脑等。
该计算机设备还可以为服务器等设备,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
本实施例的视频对比方法,可以由终端或服务器实现,也可以由终端和服务器共同实现。
下面以终端和服务器共同实现该视频对比方法为例,对视频对比方法进行说明。
参考图1,本发明实施例提供的视频对比系统包括终端10和服务器20等;终端10与服务器20之间通过网络连接,比如,通过有线或无线网络连接等,其中,终端侧的视频对比装置可以以客户端的形式集成在终端中。
其中,终端10,可以用于获取第一视频和第二视频,向服务器所述第一视频和第二视频,以及指示服务器进行视频对比的对比指令;
其中,服务器20可以用于接收所述第一视频和第二视频,以及对比指令,从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差,将所述清晰度差发送给所述终端。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本发明实施例将从视频对比装置的角度进行描述,该视频对比装置具体可以集成在终端中。本发明实施例提供了一种视频对比方法,该方法可以由终端的处理器执行,如图2所示,该视频对比方法的流程可以如下:
201、获取第一视频和第二视频;
本实施例中的第一视频和第二视频采用的视频转码方式可以相同或不同,本实施例对此没有限制。第一视频和第二视频的视频格式可以相同或不同,例如视频格式包括但不限于rmvb、mpeg1-4、以及mov等等。第一视频和第二视频的时长,包含的图像帧的数量等等,可以不同;第一视频和第二视频可以为横向视频和竖向视频中的任意一种,本实施例对此没有限制。
在一个示例中,第一视频和第二视频可以是通过视频客户端拍摄的视频,本实施例的视频客户端可以理解为向用户提供视频拍摄入口的客户端,包括但不限于即时通讯客户端和短视频客户端等等。
本实施例中,第一视频和第二视频可以来源于相同的原始视频。
可选的,步骤“所述获取第一视频和第二视频”,可以包括:
获取原始视频;
对所述原始视频按照第一视频转码方式进行转换,得到第一视频;
对所述原始视频按照第二视频转码方式进行转换,得到第二视频。
其中,第一视频转码方式和第二视频转码方式可以是不同视频客户端提供的转码方式。
本实施例的原始视频可以是终端通过摄像头实时拍摄得到的,或者是从终端本地的视频库中获取得到的。
可选的,步骤“获取原始视频”,可以包括:
通过终端的摄像头拍摄一段视频作为原始视频。
或者,步骤“获取原始视频”,可以包括:
从终端本地存储的视频中选择一段视频作为原始视频。
本实施例中,可以通过本实施例的方案对两个视频客户端进行视频清晰度的比较。可选的,步骤“对原始视频按照第一视频转码方式进行转换,得到第一视频”,可以包括:
基于待评估的视频客户端提供的第一视频转码方式,对所述原始视频进行转换,得到第一视频;
所述“对所述原始视频按照第二视频转码方式进行转换,得到第二视频”,可以包括:
基于所述视频客户端的竞品视频客户端提供的第二视频转码方式,对所述原始视频进行转换,得到第二视频。
本实施例中,考虑到网络传输对视频清晰度影响,第一视频和第二视频可以是通过视频客户端从网络上下载的。
可选的,步骤“获取第一视频和第二视频”,可以包括:
在登录待评估的视频客户端后,在待评估的视频客户端上下载一段视频作为第一视频;
在登录视频客户端的竞品视频客户端后,在待评估的视频客户端上下载一段视频作为第二视频。
在一个方案中,可以先将原始视频在两个不同的视频客户端上进行转换,然后再从视频客户端上下载转换后的视频,进行本实施例的视频对比。
可选的,步骤“对所述原始视频按照第二视频转码方式进行转换,得到第二视频”,可以包括:
基于待评估的视频客户端提供的第一视频转码方式,对所述原始视频进行转换,得到第一转换后视频;
通过待评估的视频客户端发布第一转换后视频;
从待评估的视频客户端上下载该第一转换后视频,其中下载的该第一转换后视频作为第一视频。
可选的,步骤“对原始视频按照第一视频转码方式进行转换,得到第一视频”,可以包括:
基于待评估的视频客户端的竞品视频客户端提供的第二视频转码方式,对原始视频进行转换,得到第二转换后视频;
通过竞品视频客户端发布第二转换后视频;
从竞品视频客户端上下载该第二转换后视频,其中下载的该第二转换后视频作为第二视频。
本实施例中,终端上可以安装有待评估的视频客户端以及竞品客户端,本实施例的方法可以由视频对比装置实现,该视频对比装置可以以客户端的形式集成在终端上,该视频对比装置可以通过待评估的视频客户端和竞品视频客户端的应用程序接口,调用这些视频客户端。
获取原始视频后,可以显示对比分析触发页面,该对比分析触发页面可以包括待评估的视频客户端的选择列表,以及竞品视频客户端的选择列表;
在用户选择待评估的视频客户端和竞品视频客户端后,可以通过待评估的视频客户端的应用程序接口,调用待评估的视频客户端按照第一视频转码方式,对所述原始视频进行转换,得到第一视频,通过竞品视频客户端的应用程序接口,调用竞品视频客户端提供的第二视频转码方式,对所述原始视频进行转换,得到第二视频。
由此,可以实现对第一视频和第二视频的自动获取。
在另一个示例中,还可以通过向待评估的视频客户端和竞品视频客户端人工输入原始视频的方式,获取第一视频和第二视频。
202、从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
本实施例中,第一图像序列和第二图像序列中,图像的帧数可以相同或不同。可选的,第一图像序列和第二图像序列的图像帧数相等。
对第一视频和第二视频进行图像帧的提取,可以得到第一图像序列和第二图像序列。
可选的,步骤“从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列”,可以包括:
从所述第一视频中提取预设数量的第一图像,组成第一图像序列;
从所述第二视频中,提取与所述第一视频中的第一图像位置相同的第二图像,组成第二图像序列。
其中,预设数量可以根据需要设置,例如可以为20、30等等数值。
进一步的,从第一视频和第二视频中抽取图像的方式不限,例如可以是随机抽取,可以通过预设帧数间隔的方式提取,例如,从视频中的第一帧开始按照预设帧数间隔提取预设数量的图像。
本实施例中,在第一视频和第二视频同源时,可选的,第一图像序列和第二图像序列中对应的图像在第一视频和第二视频中的位置相同。
如假设第一视频提取序号为1、3、7、9以及11的第一图像,组成第一图像序列。在第二视频中也提取序号为1、3、7、9以及11的第二图像,组成第二图像序列。
在另一个示例中,对于同源和非同源的第一视频和第二视频,从第一视频和第二视频中提取图像,可以通过关键帧的方式提取,即第一视频和第二视频中提取的图像均为关键帧图像。可选的,可以采用自适应的非监督聚类方法进行视频关键帧的提取。
在第一图像和第二图像提取后,可以对图像进行处理,如缩放处理等,将第一图像和第二图像处理成相同尺寸。例如第一图像和第二图像全部缩放至224×224大小。
203、通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
204、通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;
本实施例中的第一特征提取模块和第二特征提取模块的相同,包括结构相同以及参数相同,如采用完全相同的网络层结构,网络层中的参数(包括权重)等完全相同。
本实施例中的视频对比模型包括第一特征提取模块、第二特征提取模块以及清晰度差值计算模块。
在此,先结合图3a和图3b,对视频对比模型的训练过程进行描述。
本实施例的步骤101之前,还可以通过图3a所示的方法,对视频对比模型进行训练。
参考图3a,视频训练的过程包括:
301、获取训练样本对,其中,训练样本对中包括第一图像序列样本和第二图像序列样本,同一训练样本对中的第一图像序列样本来自同一个第一视频样本,同一训练样本对中的第二图像序列样本来自同一个第二视频样本,所述训练样本对的样本标签包括对应的第一视频样本和第二视频样本的期望清晰度差;
本实施例中训练样本对中的第一图像序列样本和第二图像序列样本的获取方式可以参考前述描述的第一图像序列和第二图像序列的获取过程。例如,可以针对第一视频样本采用提取关键帧的方式提取预设数量的图像,组成第一图像序列样本,对第二视频样本采用提取关键帧的方式也提取预设数量的图像,组成第二图像序列样本,其中,预设数量可以根据实际情况确定,例如20张。
可以理解的是,在本实施例中,针对同一视频样本,可以多次提取预设数量的图像,组成多个(第一或第二)图像序列样本,当然可以理解的是,同一视频提取得到的两个图像序列样本,至少存在一帧不同的图像。可以理解的是,一个训练样本对中的第一图像序列样本和第二图像序列样本的视频来源可以相同,例如在一个训练样本对中,第一视频样本和第二视频样本,可以是针对同一个终端拍摄视频,采用不同的视频转码方法进行转码得到的视频。
本实施例中,在从视频样本中提取图像后,可以针对这些图像进行一些预处理,例如进行缩放处理,将提取的图像缩放至预设尺寸,如缩放至224×224大小。使得第一图像序列样本和第二图像序列样本中的图像的尺寸一致,便于后续提取特征,以及进行比较等等。
302、获取待训练的视频对比模型,所述视频对比模型包括第一特征提取模块,第二特征提取模块,和清晰度差分析模块;
本实施例的步骤302中,可以基于训练样本对建立待训练的视频对比模型。
其中,第一特征提取模块可以包括第一特征提取层和第二特征提取层,第一特征提取层和第二特征提取层可以学习不同维度的特征,例如,第一特征提取层提取图像特征,第二特征提取层提取图像特征之间的时序特征。当然,第一特征提取模块不局限于第一特征提取层和第二特征提取层的结构,还可以有其他可行的组成。
其中,第一特征提取层的结构可以根据实际需要设置和调整,其提取的图像特征可以是多维度的,本实施例对此没有限制。
例如,第一特征提取层对每帧图像提取多维度的特征之后,可以分别对每一帧图像进行特征融合,得到每帧图像的图像特征,然后将融合后的图像特征输入第二特征提取层进行时序关系的学习。
鉴于第一特征提取模块和第二特征提取模块相同,第一特征提取模块包括第一特征提取层和第二特征提取层时,第二特征提取模块也包括第一特征提取层和第二特征提取层。
303、通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取;
304、通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块的网络结构和网络参数相同;
本实施例中的第一特征提取模块和第二特征提取模块可以基于神经网络实现。
可选的,步骤“通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取”,可以包括:
通过所述第一特征提取模块,将所述第一图像序列样本中的图像从像素空间映射到目标嵌入空间,得到所述第一图像序列样本的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列样本的第一清晰度特征向量;
可选的,步骤“所述通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取”,可以包括:
通过所述第二特征提取模块,将所述第二图像序列样本中的图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列样本的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列样本的第二清晰度特征向量。
本实施例中,通过第一特征提取模块,得到第一图像特征向量的过程,具体可以包括:通过第一特征提取模块,对第一图像序列样本中的图像进行多维度特征的提取,得到多个维度的图像特征向量,对各图像的多个维度的图像特征向量进行特征融合,得到第一图序列样本中各图像的融合后图像特征,作为第一图像特征向量,其中,第一图像特征向量所属的目标嵌入空间(即目标特征空间,一般为高纬度空间)为由多个特征空间(每个维度的图像特征向量对应一个特征空间)组合而成的组合空间。
对应的,通过第二特征提取模块,得到第二图像特征向量的过程,具体可以包括:通过第二特征提取模块,对第二图像序列样本中的图像进行多维度特征的提取,得到多个维度的图像特征向量,对各图像的多个维度的图像特征向量进行特征融合,得到第二图序列样本中各图像的融合后图像特征,作为第二图像特征向量,其中,第二图像特征向量所属的目标嵌入空间(即目标特征空间,一般为高纬度空间)为由多个特征空间(每个维度的图像特征向量对应一个特征空间)组合而成的组合空间。
在影像中,像素是位图(又称栅格图)中的一个物理点,表示为图像表示中最小的元素。也即,图像可以理解为由一格一格的像素构成的。每个像素有各自的颜色值和空间位置。图像中所有像素的颜色和空间位置决定了图像所呈现出来的样子。在神经网络中,图像可以被表示成[h,w,c]的格式,其中,h表示图像高度,W表示图像宽度,c表示图像通道数,本实施例的像素空间可以理解为h,w,c构成的三维空间。
本实施例中的图像可以采用任意的图像模式,图像模式可以理解为把色彩分解成部分颜色组件,对颜色组件不同的分类就形成了不同的色彩模式,不同的色彩模式所定义的颜色范围不同,不同的色彩模式应的图像通道数目也可以不同。例如,RGB模式的图像对应的图像通道数为3,Alpha模式的图像对应的图像通道数可以为4。
本实施例中,第一图像特征向量和第二图像特征向量,可以通过第一特征提取层提取,第一清晰度特征向量和第二清晰度特征向量可以通过第二特征提取层提取的。
本实施例中将图像从像素空间映射到目标嵌入空间,可以理解为对图像进行特征提取,目标嵌入空间可以理解为对图像进行特征提取后,得到的第二图像特征向量所处的特征空间,该特征空间根据特征提取方式的不同而不同。
可选的,本实施例中,第一特征提取层可以是任意具有图像特征提取功能的网络层,其可以基于任意可用的网络结构实现,例如可以基于CNN(Convolutional NeuralNetwork,卷积神经网络)实现,本实施例中,第二特征提取层可以是任意具有时序特征提取功能的网络,其可以基于任意可用的网络结构实现,例如,可以基于循环神经网络结构实现。
参考图3b,第一特征提取层可以基于CNN实现,第二特征提取层可以基于循环神经网络实现,例如LSTM(Long Short-Term Memory,长短期记忆网络)。
本实施例中,第一特征提取层可以采用ResNet50(在其他示例中,可以采用其他CNN网络)作为主干结构进行微调,同时采用数据批处理的方式进行训练。
对于视频的一组序列帧It∈RN×C×H×W数据(可以理解为N个第一图像序列样本或N个第二图像序列样本),其中,N为批处理数据的样本个数、C为图片的通道数、H为图片高度,W为图片宽度。
本实施例可以把这组数据作为输入传输到第一特征提取层中,同时提取ResNet50的最后一个全连接层的输出,作为当前视频帧序列的高维空间特征,最后一个全连接层的特征维度设置为2048(该2048维度仅为示例,维度总数还可以设置为其他数值,本实施例对此没有限制),即:
Ft=CNN(It),Ft∈RN×2048 (1)
如公式1所示,Ft∈RN×2048为当前视频序列帧的高维序列特征向量(第一或第二图像特征向量),N代表当前一次批处理的文件数量(可以理解为训练样本对数量)。对于图3b中的两个第一特征提取层,它们在训练的过程中共享参数。
当第一特征提取层对视频序列帧的特征抽取完毕以后,会将该高维特征向量送入第二特征提取层如LSTM模块中,进行时序特征的学习,该LSTM模块可以通过遗忘门、输入门和输出门的序列组合,自动保留视频序列帧中有用的信息并输出最终的视频特征向量,该视频特征向量即为第一或第二清晰度特征向量。
本实施例中,LSTM结构的参数设置不限,可以为:LSTM细胞个数20,对应每个视频抽取的20帧图像;隐藏层的神经元个数512,对应最终输出的视频特征维度为512,激活函数选择tanh激活函数。
该时序特征即为第一或第二清晰度特征向量。
对于图3b中的两个第二特征提取层如LSTM层,它们在训练的过程中也共享参数。
305、通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
本实施例中,第一特征提取模块和第二特征提取模块的相同(包括结构和参数如权重等完全相同),使得对于同一训练样本对中的两个图像序列样本而言,用于进行清晰度对比分析的清晰度特征向量在同一向量空间中,保证了两个图像序列样本可以基于清晰度特征向量进行对比分析,并且,训练样本对的标签为清晰度差,所以在视频对比模型的不断训练过程中,模型的参数例如特征的权重等参数,基于预测清晰度差和期望清晰度差被不断调整,模型提取的清晰度特征向量可以越来越准确地反映视频之间的清晰度差,最终,在一定程度上提升了模型对视频的清晰度对比分析的准确性。
在一个示例中,还可以对两个清晰度特征向量计算相似度,通过相似度衡量第一视频和第二视频之间的清晰度差,其中,相似度可以通过欧式距离等表示。
在另一个示例中,也可以通过两个清晰度特征向量的向量差值分析清晰度差。
可选的,步骤“所述通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差”,可以包括:
通过所述清晰度差分析模块,计算同一训练样本对所对应的所述第一清晰度特征向量和第二清晰度特征向量之间的向量差值;
基于所述训练样本对的向量差值,确定训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
其中,步骤“基于所述训练样本对的向量差值,确定训练样本对对应的第一视频样本和第二视频样本的预测清晰度差”,可以包括:
通过全连接层对训练样本对的向量差值进行处理,得到一维的向量差值;
对所述一维的向量差值进行归一化,得到训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
对F1和F2进行按位相减的操作得到向量差值Ffinal
得到向量差值后,可以通过清晰度差分析模块中的全连接层对向量差值进行分类,其中,全连接层包括第一全连接层和第二全连接层,第一全连接层的维度和第一清晰度特征向量的维度相同,例如为512维。第二全连接层的维度为1。
例如图3b所示的技术框架图中,全连接层可以包括512维度的全连接层FC1和一个1维的全连接层FC2,本实施例中,第一全连接层和第二全连接层之间连接有激活层,激活层的激活函数可以是非线性激活函数层,如ReLU(Rectified Linear Unit,线性整流函数)。
一维的向量差值本实施例的清晰度差值可以为是-1至1之间的任意数值,参考图3b,在计算出一维的向量差值后,对该一维的向量差值进行回归操作即归一化操作,得到取值在-1至1之间的预测清晰度差。可选的,归一化操作采用的函数可以根据实际需要选择,例如选择Tanh函数,将1维的向量差值进行Tanh归一化激活操作,输出最终的清晰度差Result。
Result=Tanh(Fscore),Result∈(-1,1) (5)
306、基于训练样本对的预测清晰度差和对应的期望清晰度差,调整所述视频对比模型的参数,直到所述视频对比模型训练完成,其中,在每一次参数调整后,所述第一特征提取模块和第二特征提取模块的参数相同。如图3b中的CNN和LSTM的参数相同。
本实施例中的期望清晰度差可以是针对第一视频样本和第二视频样本进行主观评测得到的,例如该期望清晰度差可以是视频主观评测的MOS(Mean Opinion Score,平均意见得分)均值。
本实施例中,可以采用预设损失函数计算预测清晰度差和对应的期望清晰度差之间的损失值,基于该损失值调整所述视频对比模型的参数。
可选的,预设损失函数可以是均方差损失函数。
可选的,在基于第一图像序列和第二图像序列进行视频清晰度对比分析时,通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取的步骤,可以包括:
通过所述第一特征提取模块,将所述第一图像序列中的第一图像从像素空间映射到目标嵌入空间,得到所述第一图像序列的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的第一图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列对应的第一清晰度特征向量。
对应的,通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取的步骤,可以包括:
通过所述第二特征提取模块,将所述第二图像序列中的第二图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的第二图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列对应的第二清晰度特征向量。
其中,提取第一清晰度向量和第二清晰度向量的具体步骤,可以参考上述模型训练过程中的描述。
205、通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
可选的,本实施例的视频对比模型可以是一个端到端网络结构的模型,输入是图像序列,输出是清晰度差值,不但可以实现对视频之间的清晰度差异的量化,还有效解决了非端到端网络结构的模型在训练难度高,部署繁琐的问题。
本实施例的清晰度差值,取值可以为正负值或零,取值为零可以表示第一视频的清晰度与第二视频的清晰度相同,正值可以表示第一视频的清晰度比第二视频的清晰度高,负值可以表示第一视频的清晰度值比第二视频的清晰度值低。
可选的,步骤“所述通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差”,可以包括:
所述通过所述视频对比模型的清晰度差分析模块,计算所述第一清晰度特征向量和所述第二清晰度特征向量的相似度;
基于所述相似度,确定所述第一视频和所述第二视频的清晰度差。
其中,相似度可以用向量之间的向量距离表示,例如欧式距离。
可选的,步骤“所述通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差”,可以包括:
通过所述视频对比模型的清晰度差分析模块计算所述第一清晰度特征向量和所述第二清晰度特征向量的向量差值;
基于所述向量差值确定所述第一视频和第二视频的清晰度差。
其中,清晰度差的具体计算过程,可以参考模型训练方案中的相关描述。
本实施例的清晰度差分析模块包括全连接层,该全连接层可以由至少一个全连接层构成。
其中,步骤“基于所述向量差值确定所述第一视频和第二视频的清晰度差”,可以包括:
通过全连接层对向量差值进行处理,得到一维的向量差值;
对所述一维的向量差值进行归一化,得到第一视频和第二视频的清晰度差。
例如,类似于模型训练方案中的示例,还是假设第一清晰度特征向量和第二清晰度特征向量分别为F1,F2,对F1和F2进行按位相减的操作得到向量差值Ffinal
即Ffinal=F1-F2
清晰度差可以基于全连接层对向量差值的处理得到,本实施例的全连接层中包含的全连接层的数量不限,类似的可以包含图3b示出的第一全连接层FC1和第二全连接层FC2,第一全连接层和第二全连接层之间连接有激活层,激活层的激活函数可以是非线性激活函数层,如ReLU(Rectified Linear Unit,线性整流函数)。
一维的向量差值Fscore=FC2(ReLU(FC1(Ffinal)))
当然,在其他示例中,还可以采用其他可用的激活函数替换上述的ReLU函数。
本实施例中,可以将第二视频转码方式作为预设参考视频转码方式。
在通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差后,还可以基于所述清晰度差,分析所述第一视频转码方式相较于预设参考视频转码方式的转码性能优劣程度。
例如,设置清晰度差值与转码性能优劣等级的对应关系,若清晰度差值在-1-0(不包括0)范围内,第一视频转码方式劣于第二视频转码方式,若清晰度差值在0-1(不包括0)范围内,第一视频转码方式优于第二视频转码方式。
对于-1-0(不包括0),还可以细分为不同的若干范围,然后对每个范围设置不同的劣势等级,越接近-1,劣势等级越高,对于0-1(不包括0),也可以细分为不同的若干范围,然后对每个范围设置不同的优势等级,越接近1,劣势等级越高。
本实施例中,可以基于(尤其是同源视频的)转码性能优劣程度,确定对上述待分析的视频客户端的优化方案,例如对视频客户端提供的第一视频转码方式进行优化或替换。
对于UGC类视频,采用本实施例的方案,可以准确评估与竞品视频客户端的性能差异,有利于优化客户端,提高产品的视频质量,进而提升用户体验,吸引更多用户使用。
本实施例中,终端的摄像头的拍摄模式(不同拍摄模式的拍摄参数不同)可以有多种,本实施例中,可以通过上述方案获取多个原始视频对应的清晰度差,其中,原始视频视为本终端通过摄像头拍摄,并且多个原始视频的总的拍摄模式不低于两种。
在获取清晰度差后,还可以分析拍摄模式对清晰度差值的影响;
基于分析结果,确定第一视频转换方式对应的目标拍摄模式,其中,在目标拍摄模式下,第一视频与第二视频相比最为清晰。
其中,第一视频和第二视频的清晰度差可以为正值(第一视频更清晰)或为负值(第二视频更清晰),若清晰度差中存在正值,在目标拍摄模式下,第一视频,与通过(如竞品客户端)的第二视频转换方式得到的第二视频之间的清晰度差值最大(且为正值),若清晰度差中不存在正值,在目标拍摄模式下,第一视频,与通过(如竞品客户端)的第二视频转换方式得到的第二视频之间的清晰度差值最小(且为负值)。
本实施例提供了一种视频对比方法,可以获取第一视频和第二视频;然后从第一视频中获取第一图像序列,从第二视频中获取第二图像序列;再通过视频对比模型的第一特征提取模块对第一图像序列进行第一清晰度特征向量的提取;通过视频对比模型的第二特征提取模块对第二图像序列进行第二清晰度特征向量的提取,本实施例的第一特征提取模块和第二特征提取模块相同,其提取的两个图像序列的清晰度特征向量可以更加准确反映出两个视频的清晰度相对情况,提取特征向量后,可通过视频对比模型的清晰度差分析模块基于第一清晰度特征向量和第二清晰度特征向量,确定第一视频和第二视频的清晰度差,实现对两个视频的清晰度差异的量化,本实施例基于清晰度特征向量的分析,有利于提升对视频的清晰度差异的分析准确度。
进一步的,本实施例的视频对比模型输入两个视频,即可输出视频之间的清晰度差值,这种端对端的解决方案,十分便于模型的部署。
进一步的,可以将本实施例的方案应用于UGC视频推荐端的竞品数据自动化分析,可以准确评估与竞品的性能差异,提高产品的视频质量;同时,本实施例的方案也可以应用于对视频转码技术的评测,准确估计不同转码技术的性能优劣,使得转码技术能够针对视频清晰度做出有效的优化策略。
为了更好地实施以上方法,相应的,本发明实施例还提供一种视频对比装置,该视频对比装置具体可以集成在终端中。
参考图4,该装置包括:
获取单元401,用于获取第一视频和第二视频;
序列提取单元402,用于从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
第一特征提取单元403,用于通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
第二特征提取单元404,用于通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;
清晰度差分析单元405,用于通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
可选的,获取单元,用于:
获取原始视频;
对所述原始视频按照第一视频转码方式进行转换,得到第一视频;
对所述原始视频按照第二视频转码方式进行转换,得到第二视频。
可选的,获取单元,用于:
基于待评估的视频客户端提供的第一视频转码方式,对所述原始视频进行转换,得到第一视频;
所述对所述原始视频按照第二视频转码方式进行转换,得到第二视频,包括:
基于所述视频客户端的竞品视频客户端提供的第二视频转码方式,对所述原始视频进行转换,得到第二视频。
可选的,序列提取单元,用于:
从所述第一视频中提取预设数量的第一图像,组成第一图像序列;
从所述第二视频中,提取与所述第一视频中的第一图像位置相同的第二图像,组成第二图像序列。
可选的,第一特征提取单元,用于:
通过所述第一特征提取模块,将所述第一图像序列中的第一图像从像素空间映射到目标嵌入空间,得到所述第一图像序列的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的第一图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列对应的第一清晰度特征向量;
对应的,第二特征提取单元,用于:
通过所述第二特征提取模块,将所述第二图像序列中的第二图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的第二图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列对应的第二清晰度特征向量。
可选的,清晰度差分析单元,用于:
通过所述视频对比模型的清晰度差分析模块计算所述第一清晰度特征向量和所述第二清晰度特征向量的向量差值;
基于所述向量差值确定所述第一视频和第二视频的清晰度差。
可选的,所述第二视频转码方式为预设参考视频转码方式;本实施例的视频对比装置还包括:转码性能分析单元,用于在清晰度差分析单元,通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差后,基于所述清晰度差,分析所述第一视频转码方式相较于所述预设参考视频转码方式的转码性能优劣程度。
可选的,本实施例的视频对比装置还包括:训练单元,用于在通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取前,获取训练样本对,其中,训练样本对中包括第一图像序列样本和第二图像序列样本,同一训练样本对中的第一图像序列样本来自同一个第一视频样本,同一训练样本对中的第二图像序列样本来自同一个第二视频样本,所述训练样本对的样本标签包括对应的第一视频样本和第二视频样本的期望清晰度差;获取待训练的视频对比模型,所述视频对比模型包括第一特征提取模块,第二特征提取模块,和清晰度差分析模块;通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取;通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块的网络结构和网络参数相同;通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差;基于训练样本对的预测清晰度差和对应的期望清晰度差,调整所述视频对比模型的参数,直到所述视频对比模型训练完成,其中,在每一次参数调整后,所述第一特征提取模块和第二特征提取模块的参数相同。
可选的,训练单元,用于:
通过所述第一特征提取模块,将所述第一图像序列样本中的图像从像素空间映射到目标嵌入空间,得到所述第一图像序列样本的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列样本的第一清晰度特征向量;
通过所述第二特征提取模块,将所述第二图像序列样本中的图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列样本的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列样本的第二清晰度特征向量。
可选的,训练单元,用于:
通过所述清晰度差分析模块,计算同一训练样本对所对应的所述第一清晰度特征向量和第二清晰度特征向量之间的向量差值;
基于所述训练样本对的向量差值,确定训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
采用本实施例的方案,能够对视频进行准确有效的清晰度对比分析,一定程度上提升无参考视频清晰度分析的准确性,同时端到端的解决方案也方便了模型的部署。
此外,本发明实施例还提供一种计算机设备,该计算机设备可以为终端或者服务器,如图5所示,其示出了本发明实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图5中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:
获取第一视频和第二视频;
从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块相同;
通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
采用本实施例的方案,能够对视频进行准确有效的清晰度对比分析,一定程度上提升无参考视频清晰度分析的准确性,同时端到端的解决方案也方便了模型的部署。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本发明实施例涉及的系统可以是由客户端、多个节点(接入网络中的任意形式的计算机设备,如服务器、终端)通过网络通信的形式连接形成的分布式系统。
以分布式系统为区块链系统为例,参见图6,图6是本发明实施例提供的分布式系统100应用于区块链系统的一个可选的结构示意图,由多个节点(接入网络中的任意形式的计算设备,如服务器、用户终端)和客户端形成,节点之间形成组成的点对点(P2P,Peer ToPeer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。本实施例中,原始视频,第一视频、第二视频,训练样本对,第一视频样本、第二视频样本以及清晰度差等等,都可以通过节点被存储在区域链系统的共享账本中,计算机设备(例如终端或服务器)可以基于共享账本存储的记录数据获取清晰度差。
参见图6示出的区块链系统中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
例如,应用实现的业务包括:
2.1)钱包,用于提供进行电子货币的交易的功能,包括发起交易(即,将当前交易的交易记录发送给区块链系统中的其他节点,其他节点验证成功后,作为承认交易有效的响应,将交易的记录数据存入区块链的临时区块中;当然,钱包还支持查询电子货币地址中剩余的电子货币;
2.2)共享账本,用于提供账目数据的存储、查询和修改等操作的功能,将对账目数据的操作的记录数据发送到区块链系统中的其他节点,其他节点验证有效后,作为承认账目数据有效的响应,将记录数据存入临时区块中,还可以向发起操作的节点发送确认。
2.3)智能合约,计算机化的协议,可以执行某个合约的条款,通过部署在共享账本上的用于在满足一定条件时而执行的代码实现,根据实际的业务需求代码用于完成自动化的交易,例如查询买家所购买商品的物流状态,在买家签收货物后将买家的电子货币转移到商户的地址;当然,智能合约不仅限于执行用于交易的合约,还可以执行对接收的信息进行处理的合约。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
参见图7,图7是本发明实施例提供的区块结构(Block Structure)一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例还提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的视频对比方法。
由此,能够对两视频进行准确有效的清晰度对比分析,一定程度上提升无参考视频清晰度分析的准确性,同时端到端的解决方案也方便了模型的部署。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的视频对比方法中的步骤,因此,可以实现本发明实施例所提供的视频对比方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种视频对比方法、装置、计算机设备和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种视频对比方法,其特征在于,包括:
获取训练样本对,其中,训练样本对中包括第一图像序列样本和第二图像序列样本,同一训练样本对中的第一图像序列样本来自同一个第一视频样本,同一训练样本对中的第二图像序列样本来自同一个第二视频样本,所述训练样本对的样本标签包括对应的第一视频样本和第二视频样本的期望清晰度差;
获取待训练的视频对比模型,所述视频对比模型包括第一特征提取模块,第二特征提取模块,和清晰度差分析模块;
通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取;
通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块的网络结构和网络参数相同;
通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差;
基于训练样本对的预测清晰度差和对应的期望清晰度差,调整所述视频对比模型的参数,直到所述视频对比模型训练完成,其中,在每一次参数调整后,所述第一特征提取模块和第二特征提取模块的参数相同;
获取第一视频和第二视频;
从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取;
通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
2.根据权利要求1所述的视频对比方法,其特征在于,所述获取第一视频和第二视频包括:
获取原始视频;
对所述原始视频按照第一视频转码方式进行转换,得到第一视频;
对所述原始视频按照第二视频转码方式进行转换,得到第二视频。
3.根据权利要求2所述的视频对比方法,其特征在于,所述对原始视频按照第一视频转码方式进行转换,得到第一视频,包括:
基于待评估的视频客户端提供的第一视频转码方式,对所述原始视频进行转换,得到第一视频;
所述对所述原始视频按照第二视频转码方式进行转换,得到第二视频,包括:
基于所述视频客户端的竞品视频客户端提供的第二视频转码方式,对所述原始视频进行转换,得到第二视频。
4.根据权利要求2所述的视频对比方法,其特征在于,所述从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列,包括:
从所述第一视频中提取预设数量的第一图像,组成第一图像序列;
从所述第二视频中,提取与所述第一视频中的第一图像位置相同的第二图像,组成第二图像序列。
5.根据权利要求1所述的视频对比方法,其特征在于,所述通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取,包括:
通过所述第一特征提取模块,将所述第一图像序列中的第一图像从像素空间映射到目标嵌入空间,得到所述第一图像序列的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的第一图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列对应的第一清晰度特征向量;
所述通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取,包括:
通过所述第二特征提取模块,将所述第二图像序列中的第二图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的第二图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列对应的第二清晰度特征向量。
6.根据权利要求1所述的视频对比方法,其特征在于,所述通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差,包括:
通过所述视频对比模型的清晰度差分析模块计算所述第一清晰度特征向量和所述第二清晰度特征向量的向量差值;
基于所述向量差值确定所述第一视频和第二视频的清晰度差。
7.根据权利要求2所述的视频对比方法,其特征在于,所述第二视频转码方式为预设参考视频转码方式;
所述通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差后,还包括:
基于所述清晰度差,分析所述第一视频转码方式相较于所述预设参考视频转码方式的转码性能优劣程度。
8.根据权利要求1所述的视频对比方法,其特征在于,所述通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取,包括:
通过所述第一特征提取模块,将所述第一图像序列样本中的图像从像素空间映射到目标嵌入空间,得到所述第一图像序列样本的第一图像特征向量;
通过所述第一特征提取模块,基于所述第一图像特征向量对应的图像之间的时序关系,对所述第一图像特征向量进行分析,得到所述第一图像序列样本的第一清晰度特征向量;
所述通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,包括:
通过所述第二特征提取模块,将所述第二图像序列样本中的图像从像素空间映射到所述目标嵌入空间,得到所述第二图像序列样本的第二图像特征向量;
通过所述第二特征提取模块,基于所述第二图像特征向量对应的图像之间的时序关系,对所述第二图像特征向量进行分析,得到所述第二图像序列样本的第二清晰度特征向量。
9.根据权利要求1所述的视频对比方法,其特征在于,所述通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差,包括:
通过所述清晰度差分析模块,计算同一训练样本对所对应的所述第一清晰度特征向量和第二清晰度特征向量之间的向量差值;
基于所述训练样本对的向量差值,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差。
10.一种视频对比装置,其特征在于,包括:
训练单元,用于在通过视频对比模型的第一特征提取模块对第一图像序列进行第一清晰度特征向量的提取前,获取训练样本对,其中,训练样本对中包括第一图像序列样本和第二图像序列样本,同一训练样本对中的第一图像序列样本来自同一个第一视频样本,同一训练样本对中的第二图像序列样本来自同一个第二视频样本,所述训练样本对的样本标签包括对应的第一视频样本和第二视频样本的期望清晰度差;获取待训练的视频对比模型,所述视频对比模型包括第一特征提取模块,第二特征提取模块,和清晰度差分析模块;通过所述第一特征提取模块,对所述第一图像序列样本进行第一清晰度特征向量的提取;通过所述第二特征提取模块,对所述第二图像序列样本进行第二清晰度特征向量的提取,其中,所述第一特征提取模块和第二特征提取模块的网络结构和网络参数相同;通过所述清晰度差分析模块,对同一训练样本对对应的所述第一清晰度特征向量和第二清晰度特征向量进行分析,确定所述训练样本对对应的第一视频样本和第二视频样本的预测清晰度差;基于训练样本对的预测清晰度差和对应的期望清晰度差,调整所述视频对比模型的参数,直到所述视频对比模型训练完成,其中,在每一次参数调整后,所述第一特征提取模块和第二特征提取模块的参数相同;
获取单元,用于获取第一视频和第二视频;
序列提取单元,用于从所述第一视频中获取第一图像序列,从所述第二视频中获取第二图像序列;
第一特征提取单元,用于通过视频对比模型的第一特征提取模块对所述第一图像序列进行第一清晰度特征向量的提取;
第二特征提取单元,用于通过所述视频对比模型的第二特征提取模块对所述第二图像序列进行第二清晰度特征向量的提取;
清晰度差分析单元,用于通过所述视频对比模型的清晰度差分析模块基于所述第一清晰度特征向量和所述第二清晰度特征向量,确定所述第一视频和所述第二视频的清晰度差。
11.一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-9任一项所述方法的步骤。
12.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1-9任一项所述方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010187813.1A CN111414842B (zh) | 2020-03-17 | 2020-03-17 | 一种视频对比方法、装置、计算机设备和存储介质 |
PCT/CN2020/122626 WO2021184754A1 (zh) | 2020-03-17 | 2020-10-22 | 视频对比方法、装置、计算机设备和存储介质 |
US17/722,300 US20220237917A1 (en) | 2020-03-17 | 2022-04-15 | Video comparison method and apparatus, computer device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010187813.1A CN111414842B (zh) | 2020-03-17 | 2020-03-17 | 一种视频对比方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111414842A CN111414842A (zh) | 2020-07-14 |
CN111414842B true CN111414842B (zh) | 2021-04-13 |
Family
ID=71491293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010187813.1A Active CN111414842B (zh) | 2020-03-17 | 2020-03-17 | 一种视频对比方法、装置、计算机设备和存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220237917A1 (zh) |
CN (1) | CN111414842B (zh) |
WO (1) | WO2021184754A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414842B (zh) * | 2020-03-17 | 2021-04-13 | 腾讯科技(深圳)有限公司 | 一种视频对比方法、装置、计算机设备和存储介质 |
CN112580577B (zh) * | 2020-12-28 | 2023-06-30 | 出门问问(苏州)信息科技有限公司 | 一种基于面部关键点生成说话人图像的训练方法及装置 |
CN112926496B (zh) * | 2021-03-19 | 2024-08-23 | 京东方科技集团股份有限公司 | 用于预测图像清晰度的神经网络、训练方法及预测方法 |
CN115529457B (zh) * | 2022-09-05 | 2024-05-14 | 清华大学 | 基于深度学习的视频压缩方法和装置 |
CN115689819B (zh) * | 2022-09-23 | 2023-06-30 | 河北东来工程技术服务有限公司 | 一种船舶应急训练方法、系统、装置及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103331A (zh) * | 2017-04-01 | 2017-08-29 | 中北大学 | 一种基于深度学习的图像融合方法 |
CN108682024A (zh) * | 2018-04-20 | 2018-10-19 | 长沙学院 | 一种图像清晰度匹配方法和系统 |
CN110689524A (zh) * | 2019-09-04 | 2020-01-14 | 华南理工大学 | 一种无参考在线图像清晰度评价方法与系统 |
US10574890B2 (en) * | 2018-01-12 | 2020-02-25 | Movidius Ltd. | Methods and apparatus to operate a mobile camera for low-power usage |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050036702A1 (en) * | 2003-08-12 | 2005-02-17 | Xiaoli Yang | System and method to enhance depth of field of digital image from consecutive image taken at different focus |
US7483054B2 (en) * | 2006-03-16 | 2009-01-27 | Altek Corporation | Image unsharpness test method for a camera device |
US8451384B2 (en) * | 2010-07-08 | 2013-05-28 | Spinella Ip Holdings, Inc. | System and method for shot change detection in a video sequence |
CN105469411B (zh) * | 2015-11-27 | 2018-07-06 | 小米科技有限责任公司 | 用于检测图像清晰度的方法、装置及终端 |
CN108540807B (zh) * | 2018-02-28 | 2019-05-31 | 北京达佳互联信息技术有限公司 | 视频文件转码的方法、装置及终端 |
CN110826475B (zh) * | 2019-11-01 | 2022-10-04 | 北京齐尔布莱特科技有限公司 | 一种检测近重复视频的方法、装置及计算设备 |
CN111414842B (zh) * | 2020-03-17 | 2021-04-13 | 腾讯科技(深圳)有限公司 | 一种视频对比方法、装置、计算机设备和存储介质 |
-
2020
- 2020-03-17 CN CN202010187813.1A patent/CN111414842B/zh active Active
- 2020-10-22 WO PCT/CN2020/122626 patent/WO2021184754A1/zh active Application Filing
-
2022
- 2022-04-15 US US17/722,300 patent/US20220237917A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103331A (zh) * | 2017-04-01 | 2017-08-29 | 中北大学 | 一种基于深度学习的图像融合方法 |
US10574890B2 (en) * | 2018-01-12 | 2020-02-25 | Movidius Ltd. | Methods and apparatus to operate a mobile camera for low-power usage |
CN108682024A (zh) * | 2018-04-20 | 2018-10-19 | 长沙学院 | 一种图像清晰度匹配方法和系统 |
CN110689524A (zh) * | 2019-09-04 | 2020-01-14 | 华南理工大学 | 一种无参考在线图像清晰度评价方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2021184754A1 (zh) | 2021-09-23 |
CN111414842A (zh) | 2020-07-14 |
US20220237917A1 (en) | 2022-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111414842B (zh) | 一种视频对比方法、装置、计算机设备和存储介质 | |
CN111324774B (zh) | 一种视频去重方法和装置 | |
CN109344884B (zh) | 媒体信息分类方法、训练图片分类模型的方法及装置 | |
CN109492128B (zh) | 用于生成模型的方法和装置 | |
CN110276406B (zh) | 表情分类方法、装置、计算机设备及存储介质 | |
KR20160083900A (ko) | 얼굴 표현을 위한 시스템 및 방법 | |
KR20200145827A (ko) | 얼굴 특징 추출 모델 학습 방법, 얼굴 특징 추출 방법, 장치, 디바이스 및 저장 매체 | |
CN111741330A (zh) | 一种视频内容评估方法、装置、存储介质及计算机设备 | |
CN112001274A (zh) | 人群密度确定方法、装置、存储介质和处理器 | |
Göring et al. | deimeq-A Deep Neural Network Based Hybrid No-reference Image Quality Model | |
CN110598118A (zh) | 资源对象的推荐方法、装置及计算机可读介质 | |
CN112906721B (zh) | 图像处理方法、装置、设备及计算机可读存储介质 | |
CN107992937B (zh) | 基于深度学习的非结构化数据判决方法和装置 | |
CN110569380A (zh) | 一种图像标签获取方法、装置及存储介质和服务器 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN114331949A (zh) | 一种图像数据处理方法、计算机设备以及可读存储介质 | |
CN112817563B (zh) | 目标属性配置信息确定方法、计算机设备和存储介质 | |
CN114095725B (zh) | 一种判断摄像头是否异常的方法和系统 | |
CN111079930A (zh) | 数据集质量参数的确定方法、装置及电子设备 | |
CN111597361B (zh) | 多媒体数据处理方法、装置、存储介质及设备 | |
CN114332550A (zh) | 一种模型训练方法、系统及存储介质和终端设备 | |
CN113962417A (zh) | 一种视频处理方法、装置、电子设备和存储介质 | |
CN108614845A (zh) | 基于媒体文件的行为预估方法和装置 | |
CN108596068B (zh) | 一种动作识别的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40025916 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |