CN114786039B - 服务器及视频预览图的制作方法 - Google Patents
服务器及视频预览图的制作方法 Download PDFInfo
- Publication number
- CN114786039B CN114786039B CN202210439224.7A CN202210439224A CN114786039B CN 114786039 B CN114786039 B CN 114786039B CN 202210439224 A CN202210439224 A CN 202210439224A CN 114786039 B CN114786039 B CN 114786039B
- Authority
- CN
- China
- Prior art keywords
- image frame
- frame
- value
- compressed image
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 8
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 21
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8455—Structuring of content, e.g. decomposing content into time segments involving pointers to the content, e.g. pointers to the I-frames of the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请公开了一种服务器及视频预览图的制作方法,包括:根据视频文件获取原始图像帧,依次为原始图像帧标记索引值,并对其进行压缩,得到压缩图像帧;将压缩图像帧由多通道转化为单通道,得到标准图像帧;根据索引值的顺序计算标准图像帧的帧间相似度,得到时域上的相似图像帧集合;将相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧;根据关键帧的索引值获取与其连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到第一视频预览图。本申请对视频文件中的图像帧通过在时域上的划分和聚类,能够快速有效提取出视频文件中的关键帧,进而生成视频预览图,大大提高视频预览图的制作效率。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种服务器及视频预览图的制作方法。
背景技术
显示设备是一种可实现双向人机交互功能,集影音、娱乐、数据等多种功能于一体的电视产品。显示设备可通过服务器获取媒资,并于主页上进行展示。显示设备在展示媒资时,将各个媒资以不同推荐位进行展示。
服务器端存储有各种各样的时长较长的视频信息,如电影、电视剧、直播录制的视频等。为了使用户在不浏览全部视频信息的情况下快速获取视频内容,以方便知道自己是否对该视频感兴趣,通常可制作相应的视频预览图,其中,视频预览图可以为短视频或者动态图片的形式。当用户控制焦点移动至主页的推荐位上时,显示设备在推荐位上展示出视频预览图,以使用户不仅仅依靠视频的封面来了解视频。目前,视频预览图的制作过程通常采用人工剪辑的方式,即由运营人员人为的挑选视频的精彩片段然后转换为对应的短视频或动态图片进行展示。该方式需要耗费大量的人力物力,且处理效率较低。
发明内容
本申请提供了一种服务器及视频预览图的制作方法,以解决现有技术中视频预览图的制作效率较低的技术问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
第一方面,本申请实施例公开了一种服务器,所述服务器被配置为:
根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧;
将所述压缩图像帧由多通道转化为单通道,得到标准图像帧;
根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合;
将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧数据;
根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图。
第二方面,本申请实施例公开了一种视频预览图的制作方法,其特征在于,所述视频预览图的制作方法包括:
根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧;
将所述压缩图像帧由多通道转化为单通道,得到标准图像帧;
根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合;
将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧数据;
根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图。
与现有技术相比,本申请的有益效果为:
本申请提供了一种服务器及视频预览图的制作方法,服务器首先对视频文件进行处理,即将视频文件读取为连续的原始图像帧,并依次为每一原始图像帧添加索引值,且将原始图像帧进行压缩获得压缩图像帧。服务器进一步通过压缩图像帧获取标准图像帧,并基于标准图像帧继续后续处理过程。根据标准图像帧的帧间相似度,服务器按照索引值的顺序获得时域上的相似图像帧集合,并将相似图像帧集合进行跨时域的聚类处理。服务器从聚类结果中提取关键帧,根据关键帧的索引值,获取与该索引值相邻的若干连续原始图像帧,将若干连续原始图像帧按照索引值顺序排列,并根据提前预设的图像帧的展示时长进行压缩,得到该视频文件的第一视频预览图。本申请对视频文件中的图像帧通过在时域上的划分和聚类,能够快速有效提取出视频文件中的关键帧,基于提取到的关键帧生成该视频文件的视频预览图,大大提高视频文件的视频预览图的制作效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据一些实施例的显示设备与控制装置之间操作场景的示意图;
图2中示例性示出了根据一些实施例的显示设备200主页的显示效果示意图;
图3中示例性示出了根据一些实施例的视频预览图的制作方法的流程示意图;
图4中示例性示出了根据一些实施例的原始图像帧的索引值的标注示意图;
图5中示例性示出了根据一些实施例的相似图像帧集合中代表帧的平滑分布曲线。
具体实施方式
为使本申请的目的和实施方式更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
图1为根据实施例中显示设备与控制装置之间操作场景的示意图。如图1所示,用户可通过智能设备300或控制装置100操作显示设备200。
在一些实施例中,控制装置100可以是遥控器,遥控器和显示设备的通信包括红外协议通信或蓝牙协议通信,及其他短距离通信方式,通过无线或有线方式来控制显示设备200。用户可以通过遥控器上按键、语音输入、控制面板输入等输入用户指令,来控制显示设备200。
在一些实施例中,也可以使用智能设备300(如移动终端、平板电脑、计算机、笔记本电脑等)以控制显示设备200。例如,使用在智能设备上运行的应用程序控制显示设备200。
在一些实施例中,显示设备200还可以采用除了控制装置100和智能设备300之外的方式进行控制,例如,可以通过显示设备200设备内部配置的获取语音指令的模块直接接收用户的语音指令控制,也可以通过显示设备200设备外部设置的语音控制设备来接收用户的语音指令控制。
在一些实施例中,显示设备200还与服务器400进行数据通信。可允许显示设备200通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器400可以向显示设备200提供各种内容和互动。服务器400可以是一个集群,也可以是多个集群,可以包括一类或多类服务器。
基于上述显示设备200,可于服务器400请求各种各样的时长较长的视频信息,显示设备200根据服务器400反馈的视频内容,在推荐位上展示出视频预览图,即展示出与视频内容相应的短视频或动态图,以使用户通过视频预览图,在不浏览全部视频信息的情况下快速获取视频内容。图2中示例性示出了根据一些实施例的显示设备200主页的显示效果示意图,如图2所示,在显示设备200主页内,各个频道内均设置有多个推荐位,在推荐位上相应的展示有视屏内容的动态图片,当然也可仅展示出该视频内容的封面。目前,视频预览图的制作过程通常采用人工剪辑的方式,即由运营人员人为的挑选视频的精彩片段然后转换为对应的短视频或动态图片。但是,人工挑选视频中精彩片段的方式需要耗费大量的人力物力,且导致视频预览图的制作过程效率较低。为了解决上述问题,本申请在一些实施例中提供了一种服务器。下面结合附图,来介绍本申请实施例提供的视频预览图的制作过程。
图3中示例性示出了根据一些实施例的视频预览图的制作方法的流程示意图。本申请在一些实施例中所提供的服务器被配置为执行图3中的视频预览图的制作过程。结合图3,该视频预览图的制作过程如下:
S301:根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧。
在一些实施例中,视频文件由连续的图像帧组成,若想为视频文件制作相应的短视频或动态图片,需要从中提取出代表性的图像帧,因此,在进行制作视频预览图之前,需要先通过视频文件提取到组成该视频文件的连续原始图像帧。在一些实施例中,服务器400可以将视频文件输入至视频读取工具中,获取连续原始图像帧。这里,获取到的原始图像帧指的是每一帧原始图像上每一像素点的RGB值。例如,将mp4格式的视频文件输入至cv2或imageio等工具中,读取出视频文件中相应的原始图像帧。
在一些实施例中,在获取到组成视频文件的连续原始图像帧之后,服务器400按照时域从小到大的顺序,依次为每一原始图像帧标记索引值,原始图像帧的索引值指的是原始图像帧所对应的坐标值/或表征各自位置的标记值,以便后续通过索引值可以快速查找到相应的原始图像帧,以及快速查看到当前原始图像帧在整个视频文件中的相对位置。图4中示例性示出了根据一些实施例的原始图像帧的索引值的标注示意图。结合图4,原始图像帧的索引值可以为基于0开始的正整数,如,在含有100张原始图像帧的视频文件中,对应的索引值的取值为[0-99]。
在一些实施例中,服务器400将获取的到原始图像帧进行压缩,得到压缩图像帧。例如,原始图像帧的分辨率为1024*768,将其压缩为分辨率为224*224的压缩图像帧。对原始图像帧及逆行压缩,可以大大减小后续计算量。另外,对于压缩图像帧,其所对应的索引值不变,即对压缩前后的图像帧赋予同一索引值。
在得到压缩图像帧之后,可以对视频文件在时域上的区域窗口划分。
S302:将所述压缩图像帧由多通道转化为单通道,得到标准图像帧。
在一些实施例中,服务器400采用改进的平均哈希算法获取标准图像帧的特征表示,将其进行多通道到单通道化处理。处理过程如下:
首先,服务器400将所述压缩图像帧中的多通道数据经由Sigmoid函数映射,即将压缩图像帧中的RGB值均变换至(0,1)之间,计算公式如下:
Sigmoid(x)=1/(1+e-x/64)
式中,x为每一像素点的任意通道(R、G或B通道)上的值。
然后,服务器400通过转换为(0,1)之间的RGB值获取所述压缩图像帧中均值化的像素点数据,计算公式如下:
pixelnew_1=[Sigmoid(R)+Sigmoid(G)+Sigmoid(B)]/3
式中,pixelnew_1为压缩图像帧中均值化的像素点数据,Sigmoid(R)为压缩图像帧中像素点在R通道上的值转化后的值,Sigmoid(G)为压缩图像帧中像素点在G通道上的值转化后的值,Sigmoid(B)为压缩图像帧中像素点在B通道上的值转化后的值。
最后,服务器400根据所述压缩图像帧中均值化的像素点数据,将所述压缩图像帧中的像素点二值化,得到标准图像帧,计算公式如下:
式中,pixelnew_2为压缩图像帧中的像素点二值化后的值。也就是说,若压缩图像帧中均值化的像素点数据大于或等于第一预设值,则将其设置为1,若压缩图像帧中均值化的像素点数据小于第一预设值,则将其设置为0,此处,第一预设值可设置为0.5。
以上,通过上述计算可以将分辨率为224*224的压缩图像帧计算为一个新的224*224的标准图像帧(featurenew_2)。例如,对于R、G、B=[234,125,5]的一个像素点,经过计算后可获得pixelnew_1≈0.79,pixelnew_2=1,依次计算即可获得压缩图像帧中每个像素点的pixelnew_2值。
S303:根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合。
在一些实施例中,由视频文件读取出的连续图像帧通过索引值标定了先后顺序,服务器400可根据所述索引值的顺序,计算所述标准图像帧中第一个图像帧和第二个图像帧的帧间相似度。
若第一个图像帧和第二个图像帧的帧间相似度大于或等于第二预设值,则认为两张图像帧较为相似,服务器400可将第二个图像帧划分至第一个图像帧的相似图像帧集合中,且继续计算所述第一个图像帧和第三个图像帧的帧间相似度。同理,若是第一个图像帧和第三个图像帧的帧间相似度大于或等于第二预设值,则同样将第三个图像帧划分至第一个图像帧的相似图像帧集合中,且继续计算第一个图像帧和后续图像帧(第四个图像帧)的帧间相似度。
若第一个图像帧和第二个图像帧的帧间相似度小于该第二预设值,则认为两张图像帧差别较大,服务器400可将两者隶属于不同的相似图像帧集合中,再计算所述第二个图像帧和所述第三个图像帧的帧间相似度。
此处,第二预设值的取值可以为0.8。以此类推,可以将标准图像帧划分为若干相似图像帧集合。
下面以第一个图像帧和第二个图像帧为例,介绍一下两张标准图像帧的帧间相似度的计算方法。
首先,服务器400根据第一个图像帧的像素矩阵和第二个图像帧的像素矩阵,获取两者矩阵位置值相等的位置数量。计算公式如下:
然后,服务器400根据第一个图像帧的像素矩阵和第二个图像帧的像素矩阵,获取两者矩阵位置值的并集位置数量。计算公式如下:
最后,在一些实施例中,由于标准图像帧中均为0或1的值,若两帧标准图像帧中0或1的分布较为相似,即可认定两者较为相似。服务器400获取所述矩阵位置值相等的位置数量与所述矩阵位置值的并集位置数量之间的比值,得到所述第一个图像帧和所述第二个图像帧的帧间相似度。计算公式如下:
举例来说,对于矩阵[[1,0],[0,1]]和[[1,1],[0,1]], 进一步求得sim=0.6。
以上对视频文件中的连续图像帧实现了时域上的区域窗口划分,得到了若干相似图像帧集合。
S304:将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧。
在一些实施例中,服务器400对通过以上步骤获取到的若干相似图像帧集合进行跨时域的聚类处理,实现对图像帧的聚类。在聚类之前,为了自动发现最优的簇心数量,服务器400可利用核密度估计评估聚类的簇心数量。
在一些实施例中,在若干相似图像帧集合中,服务器400可获取每一所述相似图像帧集合中的首帧图像帧作为该相似图像帧集合的代表帧,并将每一代表帧中像素值求和,得到多维度的一维数组。对于一个1000维度的一维数组,即可视为由1000个相似图像帧集合的代表帧组成的一维数组。
在一些实施例中,服务器400采用核密度估计的方式来评估一维数据的簇心数量,此处获得的该簇心数量可用于后续聚类使用的簇心数量。这里,服务器400采用sklearn中的KernelDensity方法来进行计算,由此可以根据所述多维度的一维数组,获得密度平滑曲线。
在一些实施例中,对于密度平滑曲线中变化比较缓慢的地方,可视为图像帧聚集的地方,因此,可通过极大值极小值的数量获得簇心数量。考虑到曲线最后逐渐趋近于0的地方,为比较离群的数据,通常无法实现聚合,可为其另辟一个簇心。因此,根据所得密度平滑曲线,服务器400可获取局部区间的极大值和极小值的数量,并将所得数量加一作为最终的簇心数量。图5中示例性示出了根据一些实施例的相似图像帧集合中代表帧的平滑分布曲线,如图5所示,对于一个1000维度的一维数组来说,该平滑曲线中0-2之间存在一个极大值,2-4之间存在一个极小值,4-6之间存在一个极大值,故局部区间的极大值和极小值的数量总共为3个,该数量加1即为簇心数量。
在一些实施例中,在获取簇心数量后,服务器400利用Kmeans对所述相似图像帧集合进行类聚,并在每个聚类中通过欧式距离获得距离簇心最近至少一帧图像作为关键帧。此处,关键帧的数量可以配置为2,由此可以获得簇心数量*2的关键帧数量。需要说明的是,关键帧的数量可以根据需要进行配置,配置数量会影响最终的视频预览图时长。
S305:根据所述关键帧的索引值获取与所述关键帧的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图。
在一些实施例中,服务器400在获取到关键帧之后,可以进一步检测到关键帧所对应的索引值。服务器400可以根据索引值获得相应的原始图像帧。为了保证能够表达出关键帧所要表达的信息,服务器400可以根据索引值获得相应的原始图像帧之后,并根据该索引值获取前后连续的若干原始图像帧。例如,获取到的关键帧的索引值为56,服务器400可以提取索引值56-66所对应的原始图像帧。
在一些实施例中,服务器400将根据关键帧提取到的原始图像帧以预设时长进行压缩,例如,以每帧原始图像所持续的时长为25ms进行压缩,由此可以把一个长视频文件压缩为一个时长很短且能包含视频有效图像的动态预览图。例如,对于时长为11分30秒的视频文件,处理完成后获得75帧图像,压缩处理为25帧每秒,获得一个3秒的GIF动态图片文件。
在一些实施例中,由于压缩图像帧存在与原始图像帧相同的索引值,因此,若是想要获得占用空间小的视频预览图,服务器400可以根据关键帧的索引值获取与关键帧的索引值连续的若干压缩图像帧,并将若干压缩图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第二视频预览图,其中,所述第二视频预览图所占内存小于所述第一视频预览图所占内存。
本申请对视频文件中的图像帧通过在时域上的划分和聚类,能够快速有效提取出视频文件中的关键帧,基于提取到的关键帧生成该视频文件的视频预览图,大大提高视频文件的视频预览图的制作效率。
基于与上述服务器同样的发明构思,本申请实施例还提供了一种视频预览图的制作方法,所述视频预览图的制作方法包括:服务器400根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧。服务器400将所述压缩图像帧由多通道转化为单通道,得到标准图像帧。服务器400根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合。服务器400将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧数据。服务器400根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图。
在一些实施例中,在所述从聚类结果中提取关键帧数据之后,所述视频预览图的制作方法还包括:服务器400根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干压缩图像帧,并将若干压缩图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第二视频预览图,其中,所述第二视频预览图所占内存小于所述第一视频预览图所占内存。
由于以上实施方式均是在其他方式之上引用结合进行说明,不同实施例之间均具有相同的部分,本说明书中各个实施例之间相同、相似的部分互相参见即可。在此不再详细阐述。
需要说明的是,在本说明书中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或暗示这些实体或操作之间存在任何这种实际的关系或顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的电路结构、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种电路结构、物品或者设备所固有的要素。在没有更多限制的情况下,有语句“包括一个……”限定的要素,并不排除在包括要素的电路结构、物品或者设备中还存在另外的相同要素。
本领域技术人员在考虑说明书及实践这里发明的公开后,将容易想到本申请的其他实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求的内容指出。
以上的本申请实施方式并不构成对本申请保护范围的限定。
Claims (8)
1.一种服务器,其特征在于,所述服务器被配置为:
根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧;
将所述压缩图像帧由多通道转化为单通道,得到标准图像帧;
将所述压缩图像帧中的多通道数据经由Sigmoid函数映射后求取均值,得到所述压缩图像帧中均值化的像素点数据;其中,所述Sigmoid函数的计算公式如下:
Sigmoid(x)=1/(1+e-x/64)
式中,x为每一像素点的R通道、G通道或B通道上的值;
服务器通过转换为(0,1)之间的RGB值获取所述压缩图像帧中均值化的像素点数据,计算公式如下:
pixelnew_1=[Sigmoid(R)+Sigmoid(G)+Sigmoid(B)]/3
式中,pixelnew_1为压缩图像帧中均值化的像素点数据,Sigmoid(R)为压缩图像帧中像素点在R通道上的值转化后的值,Sigmoid(G)为压缩图像帧中像素点在G通道上的值转化后的值,Sigmoid(B)为压缩图像帧中像素点在B通道上的值转化后的值;
根据所述压缩图像帧中均值化的像素点数据,将所述压缩图像帧中的像素点二值化,得到标准图像帧;
根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合;
将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧;
根据所述关键帧的索引值获取与所述关键帧的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图;
或者,根据所述关键帧的索引值获取与所述关键帧的索引值连续的若干压缩图像帧,并将若干压缩图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第二视频预览图,其中,所述第二视频预览图所占内存小于所述第一视频预览图所占内存。
2.根据权利要求1所述的服务器,其特征在于,在所述根据所述压缩图像帧中均值化的像素点数据,将所述压缩图像帧中的像素点二值化的步骤中,所述服务器被配置为:
若所述像素点数据大于或等于第一预设值,则将所述像素点数据设置为1;
若所述像素点数据小于第一预设值,则将所述像素点数据设置为0。
3.根据权利要求1所述的服务器,其特征在于,在根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合的步骤中,所述服务器被配置为:
根据所述索引值的顺序,计算所述标准图像帧中第一个图像帧和第二个图像帧的帧间相似度;
若所述帧间相似度大于或等于第二预设值,则将所述第二个图像帧划分至所述第一个图像帧的相似图像帧集合中,且继续计算所述第一个图像帧和第三个图像帧的帧间相似度;
若所述帧间相似度小于所述第二预设值,则计算所述第二个图像帧和所述第三个图像帧的帧间相似度。
4.根据权利要求3所述的服务器,其特征在于,在所述计算所述标准图像帧中第一个图像帧和第二个图像帧的帧间相似度的步骤中,所述服务器被配置为:
根据所述第一个图像帧的像素矩阵和所述第二个图像帧的像素矩阵,获取矩阵位置值相等的位置数量,以及矩阵位置值的并集位置数量;
获取所述矩阵位置值相等的位置数量与所述矩阵位置值的并集位置数量之间的比值,得到所述第一个图像帧和所述第二个图像帧的帧间相似度。
5.根据权利要求1所述的服务器,其特征在于,在所述将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧的步骤中,所述服务器被配置为:
获取每一所述相似图像帧集合中的代表帧,将所述代表帧中像素值求和,得到多维度的一维数组;
根据所述多维度的一维数组,利用核密度估计评估聚类的簇心数量;
根据所述簇心数量,利用Kmeans对所述相似图像帧集合进行类聚,并在每个聚类中通过欧式距离获得距离簇心最近至少一帧图像作为所述关键帧。
6.根据权利要求5所述的服务器,其特征在于,在所述根据所述多维度的一维数组,利用核密度估计评估聚类的簇心数量的步骤中,所述服务器被配置为:
根据所述多维度的一维数组,利用核密度估计获得密度平滑曲线;
根据所述密度平滑曲线获取局部区间的极大值和极小值的数量,并将所得数量加一作为所述簇心数量。
7.一种视频预览图的制作方法,其特征在于,所述视频预览图的制作方法包括:
根据视频文件获取原始图像帧,依次为所述原始图像帧标记索引值,并将所述原始图像帧进行压缩,得到压缩图像帧;
将所述压缩图像帧由多通道转化为单通道,得到标准图像帧;
将所述压缩图像帧中的多通道数据经由Sigmoid函数映射后求取均值,得到所述压缩图像帧中均值化的像素点数据;其中,所述Sigmoid函数的计算公式如下:
Sigmoid(x)=1/(1+e-x/64)
式中,x为每一像素点的R通道、G通道或B通道上的值;
服务器通过转换为(0,1)之间的RGB值获取所述压缩图像帧中均值化的像素点数据,计算公式如下:
pixelnew_1=[Sigmoid(R)+Sigmoid(G)+Sigmoid(B)]/3
式中,pixelnew_1为压缩图像帧中均值化的像素点数据,Sigmoid(R)为压缩图像帧中像素点在R通道上的值转化后的值,Sigmoid(G)为压缩图像帧中像素点在G通道上的值转化后的值,Sigmoid(B)为压缩图像帧中像素点在B通道上的值转化后的值;
根据所述压缩图像帧中均值化的像素点数据,将所述压缩图像帧中的像素点二值化,得到标准图像帧;
根据所述索引值的顺序计算所述标准图像帧的帧间相似度,得到时域上的相似图像帧集合;
将所述相似图像帧集合进行跨时域的聚类处理,从聚类结果中提取关键帧数据;
根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干原始图像帧,并将若干原始图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第一视频预览图;
或者,根据所述关键帧的索引值获取与所述关键帧的索引值连续的若干压缩图像帧,并将若干压缩图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第二视频预览图,其中,所述第二视频预览图所占内存小于所述第一视频预览图所占内存。
8.根据权利要求7所述的视频预览图的制作方法,其特征在于,在所述从聚类结果中提取关键帧数据之后,所述视频预览图的制作方法还包括:
根据所述关键帧数据的索引值获取与所述关键帧数据的索引值连续的若干压缩图像帧,并将若干压缩图像帧按照索引值顺序以预设时长进行压缩,得到所述视频文件的第二视频预览图,其中,所述第二视频预览图所占内存小于所述第一视频预览图所占内存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210439224.7A CN114786039B (zh) | 2022-04-25 | 2022-04-25 | 服务器及视频预览图的制作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210439224.7A CN114786039B (zh) | 2022-04-25 | 2022-04-25 | 服务器及视频预览图的制作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114786039A CN114786039A (zh) | 2022-07-22 |
CN114786039B true CN114786039B (zh) | 2024-03-26 |
Family
ID=82432864
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210439224.7A Active CN114786039B (zh) | 2022-04-25 | 2022-04-25 | 服务器及视频预览图的制作方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114786039B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1557837A1 (en) * | 2004-01-26 | 2005-07-27 | Sony International (Europe) GmbH | Redundancy elimination in a content-adaptive video preview system |
CN101577824A (zh) * | 2009-06-12 | 2009-11-11 | 西安理工大学 | 基于邻近i帧dc图像相似度的压缩域关键帧提取方法 |
CN107223344A (zh) * | 2017-01-24 | 2017-09-29 | 深圳大学 | 一种静态视频摘要的生成方法及装置 |
CN107295352A (zh) * | 2017-06-14 | 2017-10-24 | 北京蜜莱坞网络科技有限公司 | 一种视频压缩方法、装置、设备及存储介质 |
CN109239719A (zh) * | 2018-10-19 | 2019-01-18 | 武汉理工大学 | 一种融合多帧信息的多波束前视声呐障碍区域提取方法 |
WO2019024257A1 (zh) * | 2017-08-03 | 2019-02-07 | 乐蜜有限公司 | 一种视频文件的发布方法及装置 |
CN110650379A (zh) * | 2019-09-26 | 2020-01-03 | 北京达佳互联信息技术有限公司 | 视频摘要生成方法、装置、电子设备及存储介质 |
CN110956219A (zh) * | 2019-12-09 | 2020-04-03 | 北京迈格威科技有限公司 | 视频数据的处理方法、装置和电子系统 |
CN112532999A (zh) * | 2020-12-09 | 2021-03-19 | 福建农林大学 | 基于深度神经网络的数字视频删帧篡改检测方法 |
CN114071226A (zh) * | 2022-01-14 | 2022-02-18 | 飞狐信息技术(天津)有限公司 | 视频预览图的生成方法及装置、存储介质及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105992068A (zh) * | 2015-05-19 | 2016-10-05 | 乐视移动智能信息技术(北京)有限公司 | 一种视频文件预览方法及装置 |
-
2022
- 2022-04-25 CN CN202210439224.7A patent/CN114786039B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1557837A1 (en) * | 2004-01-26 | 2005-07-27 | Sony International (Europe) GmbH | Redundancy elimination in a content-adaptive video preview system |
CN101577824A (zh) * | 2009-06-12 | 2009-11-11 | 西安理工大学 | 基于邻近i帧dc图像相似度的压缩域关键帧提取方法 |
CN107223344A (zh) * | 2017-01-24 | 2017-09-29 | 深圳大学 | 一种静态视频摘要的生成方法及装置 |
CN107295352A (zh) * | 2017-06-14 | 2017-10-24 | 北京蜜莱坞网络科技有限公司 | 一种视频压缩方法、装置、设备及存储介质 |
WO2019024257A1 (zh) * | 2017-08-03 | 2019-02-07 | 乐蜜有限公司 | 一种视频文件的发布方法及装置 |
CN109239719A (zh) * | 2018-10-19 | 2019-01-18 | 武汉理工大学 | 一种融合多帧信息的多波束前视声呐障碍区域提取方法 |
CN110650379A (zh) * | 2019-09-26 | 2020-01-03 | 北京达佳互联信息技术有限公司 | 视频摘要生成方法、装置、电子设备及存储介质 |
CN110956219A (zh) * | 2019-12-09 | 2020-04-03 | 北京迈格威科技有限公司 | 视频数据的处理方法、装置和电子系统 |
CN112532999A (zh) * | 2020-12-09 | 2021-03-19 | 福建农林大学 | 基于深度神经网络的数字视频删帧篡改检测方法 |
CN114071226A (zh) * | 2022-01-14 | 2022-02-18 | 飞狐信息技术(天津)有限公司 | 视频预览图的生成方法及装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114786039A (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210160556A1 (en) | Method for enhancing resolution of streaming file | |
US12118036B2 (en) | Summarizing video content | |
US11908038B2 (en) | Image transformation method and apparatus, storage medium, and computer device | |
US20190005334A1 (en) | Methods, systems, and media for generating a summarized video with video thumbnails | |
US9699476B2 (en) | System and method for video context-based composition and compression from normalized spatial resolution objects | |
CN102484712B (zh) | 用于数字视频记录器的视频格式 | |
CN102047287A (zh) | 利用稀疏变换的图像/视频质量增强和超分辨率 | |
CN105959686A (zh) | 一种视频特征提取方法、视频匹配方法及装置 | |
KR20210066653A (ko) | 전자 장치 및 그 제어 방법 | |
CN110740316A (zh) | 数据编码方法及装置 | |
WO2023071609A1 (zh) | 一种翻拍图像识别方法及其相关设备 | |
CN114786039B (zh) | 服务器及视频预览图的制作方法 | |
CN115223077A (zh) | 面向电网边缘侧的边缘视频分析智能服务方法及系统 | |
CN116320429A (zh) | 视频编码方法、装置、计算机设备及计算机可读存储介质 | |
CN112669244B (zh) | 人脸图像增强方法、装置、计算机设备以及可读存储介质 | |
CN114666477A (zh) | 一种视频数据处理方法、装置、设备及存储介质 | |
JP2009212605A (ja) | 情報処理方法、情報処理装置及びプログラム | |
JP6368149B2 (ja) | 画像伝送システム、画像処理装置、画像蓄積装置、及びそれらの制御方法 | |
CN112348627A (zh) | 应用推送方法、装置、设备及计算机可读存储介质 | |
KR20230156625A (ko) | 영상 처리 장치 및 그 동작 방법 | |
CN105120335A (zh) | 一种处理电视节目图片的方法和装置 | |
CN113423001A (zh) | 一种用于播放视频的方法、系统和装置 | |
JP2018013879A (ja) | ダイジェスト映像取得装置、ダイジェスト映像取得方法、およびプログラム | |
CN101310534A (zh) | 使用随机域模型改进图片和视频压缩以及帧速率上转换的方法和设备 | |
Zhang et al. | MLSIM: A Multi-Level Similarity index for image quality assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |