CN108235117A - 一种视频调色方法和装置 - Google Patents
一种视频调色方法和装置 Download PDFInfo
- Publication number
- CN108235117A CN108235117A CN201810084407.5A CN201810084407A CN108235117A CN 108235117 A CN108235117 A CN 108235117A CN 201810084407 A CN201810084407 A CN 201810084407A CN 108235117 A CN108235117 A CN 108235117A
- Authority
- CN
- China
- Prior art keywords
- designated
- video
- toning
- configuration file
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
Abstract
本发明公开了一种视频调色方法、装置、电子设备和计算机可读存储介质。该方法包括:根据指定视频的直方图判断该指定视频是否适合调色;如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供配置文件,以实现根据配置文件对视频进行调色处理。通过本技术方案,可以提高指定视频的展示效果,也可以避免不利于提高指定视频的展示效果的调色处理的操作,可以达到用户满意的效果,更能满足用户的播放需求,增强用户的使用体验。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种视频调色方法、装置、电子设备和计算机可读存储介质。
背景技术
随着电子设备的功能的日益增多,通过电子设备播放视频的功能也越来越完善,例如,对指定视频的播放或者网络直播等,用户在播放相应的视频时,往往视频资源是什么效果的,在播放时,视频就会展示什么样的效果。但是不可避免的,有些视频的展示效果并不理想,例如,在视频保存至服务器的视频资源库中时,其视频本身的颜色饱和度较小,使得用户在请求播放该视频后,该视频在用户处展示时会有模糊的效果,无法达到用户满意的效果,不能满足用户的需求。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的视频调色方法、装置、电子设备和计算机可读存储介质。
根据本发明的一个方面,提供了一种视频调色方法,其中,该方法包括:
根据指定视频的直方图判断该指定视频是否适合调色;
如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
可选地,所述根据指定视频的直方图判断该指定视频是否适合调色包括:
将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;
获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
可选地,该方法进一步包括:
获取一定数量的被确定为不适合调色的视频;
将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到所述用于识别不适合调色的视频的机器学习模型。
可选地,该方法进一步包括:
获取一定数量的被确定为适合调色的视频;
将这些适合调色的视频输入到所述用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
可选地,所述识别指定视频的图像内容包括:
预设不同类别的视频图像场景;
识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
可选地,所述识别指定视频的图像内容所属的视频图像场景类别包括:
将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;
获取各机器学习模型输出的识别结果。
可选地,该方法进一步包括:
对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;
以此类推,得到各类别的视频图像场景对应的机器学习模型。
可选地,所述不同类别的视频图像场景包括:
含人脸的视频图像场景;
风景类视频图像场景。
可选地,所述根据识别结果生成描述指定视频的图像内容的配置文件进一步包括:
当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
可选地,该方法进一步包括:
当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
根据本发明的另一方面,提供了一种视频调色装置,其中,该装置包括:
判断单元,适于根据指定视频的直方图判断该指定视频是否适合调色;
标记单元,适于如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
配置文件生成单元,适于反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
可选地,
所述判断单元,适于将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
可选地,该装置进一步包括:
第一机器学习模型获取单元,适于获取一定数量的被确定为不适合调色的视频;将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到所述用于识别不适合调色的视频的机器学习模型。
可选地,
第一机器学习模型获取单元,还适于获取一定数量的被确定为适合调色的视频;将这些适合调色的视频输入到所述用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
可选地,
所述配置文件生成单元,适于预设不同类别的视频图像场景;识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
可选地,
所述配置文件生成单元,适于将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;获取各机器学习模型输出的识别结果。
可选地,该装置进一步包括:
第二机器学习模型获取单元,适于对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;以此类推,得到各类别的视频图像场景对应的机器学习模型。
可选地,所述不同类别的视频图像场景包括:
含人脸的视频图像场景;
风景类视频图像场景。
可选地,
所述配置文件生成单元,适于当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
可选地,该装置进一步包括:
通用规则标记单元,适于当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
根据本发明的又一方面,提供了一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据前述的方法。
根据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现前述的方法。
根据本发明的技术方案,根据指定视频的直方图判断该指定视频是否适合调色;如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供配置文件,以实现根据配置文件对视频进行调色处理。通过本技术方案,首先判断指定视频是否适合进行调色处理,如果适合进行调色处理,则根据图像内容生成描述的配置文件,以便客户端根据配置文件进行相应的调色处理,对指定视频进行有效的调色处理,提高指定视频的展示效果,也可以避免不利于提高指定视频的展示效果的调色处理的操作,可以达到用户满意的效果,更能满足用户的播放需求,增强用户的使用体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的视频调色方法的流程示意图;
图2示出了根据本发明一个实施例的视频调色装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的视频调色方法的流程示意图。如图1所示,该方法包括:
步骤S110,根据指定视频的直方图判断该指定视频是否适合调色。
本实施例需要通过对指定视频进行调色处理,来提高指定视频的展示效果。但是,在实际应用中,也有一些视频不适合进行任何的调色处理,例如,艺术形式为二人转的舞台剧中,人物的穿着本身比较花俏,幕布颜色也会比较亮丽,如果再进行调色处理容易出现过曝的情况,反而使得视频的展示效果更差,如衣服上的衣扣会无法正常显示等。所以,在本实施例中,首先判断该指定视频是否适用调色,以防止出现调色后的视频的展示效果更差的情况,避免不利于提高指定视频的展示效果的调色处理的操作。
在本实施例中,主要是通过指定视频的直方图进行判断,这里的视频的直方图是描述视频中图像的曝光特征或者颜色特征的图谱。例如,颜色直方图所描述的是不同色彩在整幅图像中所占的比例。
步骤S120,如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理。
在进行指定视频调色处理时,是根据配置文件进行的,所以如果判断结果为该指定视频不适合调色,那么就在指定视频的配置文件中进行相应的标记,以便不对指定视频进行调色处理。
步骤S130,反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供配置文件,以实现根据配置文件对视频进行调色处理。
当机器学习模型输出的是否定结果,则说明该指定视频适合进行调色处理。因为本实施例是在服务器侧进行说明,则当指定视频适合进行调色处理时,服务器会对指定视频的图像内容进行识别,然后生成描述该指定视频的图像内容的配置文件,当客户端向服务器发送播放该指定视频的请求时,将该指定视频文件以及对应的配置文件提供给客户端,客户端侧会首先根据配置文件对指定视频进行调色处理,然后将调色处理后的指定视频进行播放。例如,从图像内容中识别出人物,那么生成的指定视频的配置文件中就包含有改指定视频的图像内容中有人物的描述,当客户端进行该指定视频播放前,根据配置文件中有人物的描述,对该指定视频进行人物的调色处理,然后播放。
在本实施例中,对指定视频进行调色处理,可以是对指定视频中的人脸进行美颜处理或者对指定视频中的风景的颜色进行调色处理,使得指定视频中的颜色的饱和度或者人脸图像的效果更加完善。
可见,通过本实施例,首先判断指定视频是否适合进行调色处理,如果适合进行调色处理,则根据图像内容生成描述的配置文件,以便客户端根据配置文件进行相应的调色处理,对指定视频进行有效的调色处理,提高指定视频的展示效果,也可以避免不利于提高指定视频的展示效果的调色处理的操作,可以达到用户满意的效果,更能满足用户的播放需求,增强用户的使用体验。
在本发明的一个实施例中,步骤S110中的根据指定视频的直方图判断该指定视频是否适合调色包括:将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
在本实施例中,在判断是否适合进行调色时,具体的是利用机器学习模型来判断指定视频是否使用调色处理通用规则,将指定视频的直方图输入用于识别不适合调色的视频的机器学习模型中,用于识别不适合调色的视频的机器学习模型会输出相应的识别结果,然后根据模型输出的结果确定该指定视频是否适合调色。
在本发明的一个实施例中,图1所示的方法进一步包括:获取一定数量的被确定为不适合调色的视频;将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到用于识别不适合调色的视频的机器学习模型。
为了利用机器学习模型来判断该指定视频是否适用调色处理通用规则,需要获取该机器学习模型,因为该机器学习模型是用于识别不适合调色的视频的,所以在获取视频样本进行训练时,获取的是不适合调色的视频的直方图。则该用于识别不适合调色的视频的机器学习模型输出的结果是确定时,则该指定视频不适合调色,即不适合调色处理通用规则;当输出的结果是否时,则该指定视频适合调色,即适合调色处理通用规则。
进一步地,图1所示的方法进一步包括:获取一定数量的被确定为适合调色的视频;将这些适合调色的视频输入到用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
在本实施例中,为了验证上述实施例获得的用于识别不适合调色的视频的机器学习模型的准确性,可以获取一定数量的已知是适合调色的视频,输入到获取的用于识别不适合调色的视频的机器学习模型中,因为输入的视频的准确的识别结果是已知的,如果机器学习模型输出的结果是否,则该机器学习模型是准确的,如果输入的结果是确定的,则该机器学习模型的准确性需要进一步提高,利用被确定为适合调色的视频进行验证,可以保证该机器学习模型的识别结果的准确度。
在本发明的一个实施例中,步骤S130中的识别指定视频的图像内容包括:预设不同类别的视频图像场景;识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
为了实现对指定视频的不同类别进行相应的不同的调色处理,以便达到更好的展示效果,在本实施例中,先预设不同类别的视频图像场景,如人物、风景等,然后识别指定视频的图像内容中的场景是否属于预设的视频图像场景的一种或多种,识别出所属的类别后,还要记录相应类别的视频图像场景在该指定视频中的起止时间,以便在客户端在根据配置文件进行调色时,获取具体调色的起止时间,防止在没有相应的视频图像场景的图像内容中也进行了对应的调色,反而影响视频的展示效果。然后将记录的图像内容所述的视频图像场景以及起始时间作为识别结果。例如,预设的视频图像场景包括人脸、天空,在一指定视频中,识别到视频的第0-5s的时间段内有人脸的视频图像场景,则记录该指定视频中的第0-5s的图像内容中有人脸的场景,作为识别结果,生成配置文件中;在第3-10s的时间段内的图像内容中有天空的视频图像场景,则记录该指定视频中第3-10s的图像内容中有天空的视频图像场景,作为识别结果,生成配置文件。当客户端对指定视频进行调色处理时,对视频的第0-5s的图像内容中的人脸进行调色处理,对视频的第3-10s的图像内容中的天空进行调色处理。也就是说,在本实施例中,可以对指定视频进行有针对性的调色处理,可以进一步提高调色处理的效率。
具体地,上述的识别指定视频的图像内容所属的视频图像场景类别包括:将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;获取各机器学习模型输出的识别结果。
在本实施例中,是通过机器学习模型进行各类的视频图像场景类别的识别。在这里,每一种类别的视频图像场景对应一种机器学习模型。例如,有人脸类的视频图像场景的机器学习模型、天空类的视频图像场景的机器学习模型和鲜花类的视频图像场景的机器学习模型,将一指定视频分别输入到上述的三种机器学习模型中,结果识别出该指定视频中的图像内容中有人脸和鲜花,也就是说,在人脸类的视频图像场景的机器学习模型和鲜花类的视频图像场景的机器学习模型输出的是存在的识别结果,而天空类的视频图像场景的机器学习模型输出的是不存在的识别结果。这样就可以对不同类别的视频图像场景进行准确的识别。
进一步地,在上述实施例的基础上,图1所示的方法进一步包括:对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;以此类推,得到各类别的视频图像场景对应的机器学习模型。
为了实现不同类别的视频图像场景的识别,需要获取各类别的视频图像场景的机器学习模型,在本实施例中,每一类别的视频图像场景,首先是获取属于该类别的视频图像场景的视频作为该类别的视频样本,进行机器学习的训练,然后得到该类别的视频图像场景的机器学习模型。例如,对于人脸类别的视频图像场景,首先获取具有人脸的视频图像场景的视频,输入到机器学习模型中训练,得到人脸类别的视频图像场景的机器学习模型;对于天空类别的视频图像场景,首先获取具有天空的视频图像场景的视频,输入到机器学习模型中训练,得到天空类别的视频图像场景的机器学习模型。
在本发明的一个实施例中,上述的不同类别的视频图像场景包括:含人脸的视频图像场景;风景类视频图像场景。
在本实施例中,优选地,视频图像场景包括含人脸的视频图像场景和风景类的视频图像场景。也就是说,优选地,识别指定视频中图像内容中包含有人脸的和/或包含有风景的视屏图像场景。当指定视频中图像内容包含有人脸时,在进行调色时,可以对人脸部分进行重点调色,例如,对人脸进行美颜处理(磨皮、美白等),这样播放后的视频中的人物人脸的效果会更好。当指定视频中的图像内容中包含有风景时,在进行调色时,可以对风景部分进行调色,这里的风景类视频图像场景,可以包括多种,如天空、草地、鲜花等风景,例如,在进行调色时,可以将天空调的更蓝、草地更绿、鲜花更红,这样,指定视频在播放时,展示效果会更加。
进一步地,步骤S130中的根据识别结果生成描述指定视频的图像内容的配置文件进一步包括:当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
在本实施例中,当指定视频中包含人脸的视屏图像场景时,可以有多种情况,有的视频中的人脸较多或较小,尺寸大小比例较小,即使进行了人脸调色处理,对指定视频的展示效果的提高不会起到太大的作用,调色处理反而会增加视频加载播放的时间,降低用户的使用体验,这种情况就不需要进行调色处理;如果指定视频中包含的人脸的比例大小较大,那么对人脸进行调色后,会明显提高视频播放的展示效果,则就需要对人脸进行调色。所以,在进行调色处理时,并非是对所有包含人脸的视频均进行调色处理,可以针对不同的情况适应性的调色,进一步提高调色处理的效率。如,主播直播时的视频,仅包含有主播一人的人脸,且人脸在视频图像中的比例较大,这时就需要进行人脸的调色处理,即判断需要进行调色处理,将该判断结果写入配置文件中,客户端会根据配置文件进行人脸调色处理;又如,在球赛现场的视频,包含的人脸较多,且每个人脸都很小,这时就不需要进行调色处理,那么就将不需要进行调色处理的判断结果写入配置文件中,客户端进行调色时,就不会对该指定视频中的人脸进行调色。
在本发明的一个实施例中,图1所示的方法进一步包括:当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
在上述的实施例中,对指定视频的图像内容进行视频图像场景类别的识别时,是根据不同类别的视屏图像场景的机器学习模型,不可避免的机器学习模型是需要不断的累计的,无法涵盖所有类别的视频图像场景。那么,在本实施例中,还设定有调色处理通用规则,当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,可以利用调色处理通用规则进行调色处理,这样可以保证指定视频的调色处理得更充分,而并非是仅对包含预设类别的视屏图像场景的视频进行调色处理,进一步提高用户的使用体验。
本实施例中,当指定视频符合调色处理通用规则时,客户端侧就可以利用通用视频调色处理模型对指定视频进行调色,这里的视频调色处理模型是在客户端侧,也可以是在配置文件中,具体是利用机器学习的方法,将现有的具有一定色彩设计的视频图像作为训练数据,生成相应的通用视频调色处理模型,使用该通用视频调色处理模型对适用调色处理通用规则的视频进行调色处理。例如,选择配色比较符合要求的若干电影,学习其配色方法,生成相应的通用视频调色处理模型,则视频输入该通用视频调色处理模型后,其色调也会呈现出与选取的电影一致的色调。
在本发明的一个实施例中,图1所示方法进一步包括:
在配置文件中写入与该配置文件中所描述的指定视频的图像内容对应的调色处理方案。
在实际使用中,服务器提供配置文件后客户端会根据配置文件进行调色处理,客户端在选择如何进行具体的调色时,可以根据客户端自身的调色处理方案进行。在本实施例中,服务器将对应的调色处理方案写入配置文件中,那么客户端就可以根据配置文件的调色处理方案进行具体的调色处理,无需客户端再次进行调色处理方案的选择,可以减少客户端侧调色处理过程的流程步骤。
例如,服务器的识别结果是该指定视频的第0-3s包含人脸的视频图像场景,客户端则会对该指定视频的第0-3s的视频图像进行人脸的调色处理,进行处理时选择对人脸进行美白、磨皮等处理。如果服务器预设该第0-3s包含人脸的视频图像场景的调色处理方案是对人脸进行美白处理,并写入配置文件中,则客户端根据配置文件,仅对对该指定视频的第0-3s的视频图像进行人脸的美白处理。又如,在指定视频的配置文件中写入在对鲜花类视频图像场景的视频进行调色时,将花的颜色的饱和度提高20%,则客户端在进行该指定视频的调色时,就将鲜花部分的颜色的饱和度提高20%。
在发明的一个实施例中,步骤S130中的提供配置文件包括:当接收到智能终端发送的请求该指定视频的配置文件的请求消息时,将该配置文件发送给智能终端,或者将该配置文件的下载地址发送给该智能终端。
在本技术方案中,服务器侧会提供指定视频的配置文件,具体的对视频进行调色处理的步骤是在客户端侧进行的,因此,服务器需要向客户端提供配置文件,具体的是在服务器接收到智能终端发送的请求该指定视频的配置文件的请求消息时,将该配置文件发送给智能终端,或者将该配置文件的下载地址发送给该智能终端,以便指定终端根据下载地址下载该指定视频的配置文件。
在客户端侧,当播放指定视频时会向服务器发送播放指定视频的请求,当获取到指定视频时,为了实现对指定视频的调色处理,需要获取该指定视频的配置文件。在播放指定视频时,首先根据配置文件进行调色处理,然后再播放调色处理后的视频,也就是说,用户感知的视频已经是经过调色处理的。在进行调色时,是根据指定视频的配置文件进行调色。
(1)当配置文件中描述该指定视频包括景色类的图像内容以及其起止时间时,将该指定视频中的景色类图像内容中的红、绿、蓝三色的饱和度增加预设数值。
例如,在指定视频中的景色类的图像内容中包括有鲜花、草地和蓝天,根据配置文件的描述,该景色类的图像内容的起止时间是第10s-25s,则在进行调色时,将视频的第10s-25s的图像内容中的红、绿、蓝三个的饱和度增加20%,则视频中的鲜花、草地和蓝天的颜色会更加亮丽,提高视频的展示效果。
(2)当配置文件描述该指定视频包括含人脸的图像内容以及其起止时间时,对该指定视频中的含人脸的图像内容进行人脸美化处理。
例如,在指定视频中的景色类的图像内容中包括有人脸,根据配置文件的描述,该包含人脸的图像内容的起止时间是第0s-20s,则在进行调色时,将视频的第0s-20s的图像内容中的人脸进行美白处理,使得视频中的人脸的展示效果更好。
(3)当配置文件描述该指定视频适用视频处理通用规则时,将该指定视频输入到通用视频调色处理模型中进行调色处理。
(4)当配置文件中描述该指定视频包括景色类的图像内容以及其起止时间时,将该指定视频中的景色类图像内容中的红、绿、蓝三色的饱和度增加预设数值;以及当配置文件描述该指定视频包括含人脸的图像内容以及其起止时间时,对该指定视频中的含人脸的图像内容进行人脸美化处理;然后,再将该指定视频输入到通用视频调色处理模型中进行调色处理。
包含景色类的图像内容以及包含人脸的图像内容在视频中的时间可以是重合的,例如,包含景色类的图像内容的起止时间是第10s-25s,包含人脸的图像内容的起止时间是第0s-20s,也就是说,在指定视频中的第10s-20s的图像内容中既包含有景色类也包含有人脸,那么就会对该时间段内容的图像内容即进行景色类的调色处理也进行人脸美化处理。
这样,在客户端侧播放调色处理后的视频,提高视频的展示效果,满足用户的播放需求。
图2示出了根据本发明一个实施例的视频调色装置的结构示意图。如图2所示,该视频调色装置200包括:
判断单元210,适于根据指定视频的直方图判断该指定视频是否适合调色。
本实施例需要通过对指定视频进行调色处理,来提高指定视频的展示效果。但是,在实际应用中,也有一些视频不适合进行任何的调色处理,例如,艺术形式为二人转的舞台剧中,人物的穿着本身比较花俏,幕布颜色也会比较亮丽,如果再进行调色处理容易出现过曝的情况,反而使得视频的展示效果更差,如衣服上的衣扣会无法正常显示等。所以,在本实施例中,首先判断该指定视频是否适用调色,以防止出现调色后的视频的展示效果更差的情况,避免不利于提高指定视频的展示效果的调色处理的操作。
在本实施例中,主要是通过指定视频的直方图进行判断。这里的视频的直方图是描述视频中图像的曝光特征或者颜色特征的图谱。例如,颜色直方图所描述的是不同色彩在整幅图像中所占的比例。
标记单元220,适于如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理。
在进行指定视频调色处理时,是根据配置文件进行的,所以如果判断结果为该指定视频不适合调色,那么就在指定视频的配置文件中进行相应的标记,以便不对指定视频进行调色处理。
配置文件生成单元230,适于反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供配置文件,以实现根据配置文件对视频进行调色处理。
当机器学习模型输出的是否定结果,则说明该指定视频适合进行调色处理。因为本实施例是在服务器侧(服务器中包含有该视频调色装置)进行说明,则当指定视频适合进行调色处理时,服务器会对指定视频的图像内容进行识别,然后生成描述该指定视频的图像内容的配置文件,当客户端向服务器发送播放该指定视频的请求时,将该指定视频文件以及对应的配置文件提供给客户端,客户端侧会首先根据配置文件对指定视频进行调色处理,然后将调色处理后的指定视频进行播放。例如,从图像内容中识别出人物,那么生成的指定视频的配置文件中就包含有改指定视频的图像内容中有人物的描述,当客户端进行该指定视频播放前,根据配置文件中有人物的描述,对该指定视频进行人物的调色处理,然后播放。
在本实施例中,对指定视频进行调色处理,可以是对指定视频中的人脸进行美颜处理或者对指定视频中的风景的颜色进行调色处理,使得指定视频中的颜色的饱和度或者人脸图像的效果更加完善。
可见,通过本实施例,首先判断指定视频是否适合进行调色处理,如果适合进行调色处理,则根据图像内容生成描述的配置文件,以便客户端根据配置文件进行相应的调色处理,对指定视频进行有效的调色处理,提高指定视频的展示效果,也可以避免不利于提高指定视频的展示效果的调色处理的操作,可以达到用户满意的效果,更能满足用户的播放需求,增强用户的使用体验。
在本发明的一个实施例中,判断单元210,适于将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
在本实施例中,在判断是否适合进行调色时,具体的是利用机器学习模型来判断指定视频是否使用调色处理通用规则,将指定视频的直方图输入用于识别不适合调色的视频的机器学习模型中,用于识别不适合调色的视频的机器学习模型会输出相应的识别结果,然后根据模型输出的结果确定该指定视频是否适合调色。
在本发明的一个实施例中,图2所示的装置进一步包括:
第一机器学习模型获取单元,适于获取一定数量的被确定为不适合调色的视频;将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到用于识别不适合调色的视频的机器学习模型。
为了利用机器学习模型来判断该指定视频是否适用调色处理通用规则,需要获取该机器学习模型,因为该机器学习模型是用于识别不适合调色的视频的,所以在获取视频样本进行训练时,获取的是不适合调色的视频的直方图。则该用于识别不适合调色的视频的机器学习模型输出的结果是确定时,则该指定视频不适合调色,即不适合调色处理通用规则;当输出的结果是否时,则该指定视频适合调色,即适合调色处理通用规则。
进一步地,第一机器学习模型获取单元,还适于获取一定数量的被确定为适合调色的视频;将这些适合调色的视频输入到用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
在本实施例中,为了验证上述实施例获得的用于识别不适合调色的视频的机器学习模型的准确性,可以获取一定数量的已知是适合调色的视频,输入到获取的用于识别不适合调色的视频的机器学习模型中,因为输入的视频的准确的识别结果是已知的,如果机器学习模型输出的结果是否,则该机器学习模型是准确的,如果输入的结果是确定的,则该机器学习模型的准确性需要进一步提高,利用被确定为适合调色的视频进行验证,可以保证该机器学习模型的识别结果的准确度。
在本发明的一个实施例中,配置文件生成单元230,适于预设不同类别的视频图像场景;识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
为了实现对指定视频的不同类别进行相应的不同的调色处理,以便达到更好的展示效果,在本实施例中,先预设不同类别的视频图像场景,如人物、风景等,然后识别指定视频的图像内容中的场景是否属于预设的视频图像场景的一种或多种,识别出所属的类别后,还要记录相应类别的视频图像场景在该指定视频中的起止时间,以便在客户端在根据配置文件进行调色时,获取具体调色的起止时间,防止在没有相应的视频图像场景的图像内容中也进行了对应的调色,反而影响视频的展示效果。然后将记录的图像内容所述的视频图像场景以及起始时间作为识别结果。例如,预设的视频图像场景包括人脸、天空,在一指定视频中,识别到视频的第0-5s的时间段内有人脸的视频图像场景,则记录该指定视频中的第0-5s的图像内容中有人脸的场景,作为识别结果,生成配置文件中;在第3-10s的时间段内的图像内容中有天空的视频图像场景,则记录该指定视频中第3-10s的图像内容中有天空的视频图像场景,作为识别结果,生成配置文件。当客户端对指定视频进行调色处理时,对视频的第0-5s的图像内容中的人脸进行调色处理,对视频的第3-10s的图像内容中的天空进行调色处理。也就是说,在本实施例中,可以对指定视频进行有针对性的调色处理,可以进一步提高调色处理的效率。
具体地,配置文件生成单元230,适于将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;获取各机器学习模型输出的识别结果。
在本实施例中,是通过机器学习模型进行各类的视频图像场景类别的识别。在这里,每一种类别的视频图像场景对应一种机器学习模型。例如,有人脸类的视频图像场景的机器学习模型、天空类的视频图像场景的机器学习模型和鲜花类的视频图像场景的机器学习模型,将一指定视频分别输入到上述的三种机器学习模型中,结果识别出该指定视频中的图像内容中有人脸和鲜花,也就是说,在人脸类的视频图像场景的机器学习模型和鲜花类的视频图像场景的机器学习模型输出的是存在的识别结果,而天空类的视频图像场景的机器学习模型输出的是不存在的识别结果。这样就可以对不同类别的视频图像场景进行准确的识别。
进一步地,在上述实施例的基础上,图2所示的装置进一步包括:
第二机器学习模型获取单元,适于对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;以此类推,得到各类别的视频图像场景对应的机器学习模型。
为了实现不同类别的视频图像场景的识别,需要获取各类别的视频图像场景的机器学习模型,在本实施例中,每一类别的视频图像场景,首先是获取属于该类别的视频图像场景的视频作为该类别的视频样本,进行机器学习的训练,然后得到该类别的视频图像场景的机器学习模型。例如,对于人脸类别的视频图像场景,首先获取具有人脸的视频图像场景的视频,输入到机器学习模型中训练,得到人脸类别的视频图像场景的机器学习模型;对于天空类别的视频图像场景,首先获取具有天空的视频图像场景的视频,输入到机器学习模型中训练,得到天空类别的视频图像场景的机器学习模型。
在本发明的一个实施例中,上述的不同类别的视频图像场景包括:含人脸的视频图像场景;风景类视频图像场景。
在本实施例中,优选地,视频图像场景包括含人脸的视频图像场景和风景类的视频图像场景。也就是说,优选地,识别指定视频中图像内容中包含有人脸的和/或包含有风景的视屏图像场景。当指定视频中图像内容包含有人脸时,在进行调色时,可以对人脸部分进行重点调色,例如,对人脸进行美颜处理(磨皮、美白等),这样播放后的视频中的人物人脸的效果会更好。当指定视频中的图像内容中包含有风景时,在进行调色时,可以对风景部分进行调色,这里的风景类视频图像场景,可以包括多种,如天空、草地、鲜花等风景,例如,在进行调色时,可以将天空调的更蓝、草地更绿、鲜花更红,这样,指定视频在播放时,展示效果会更加。
进一步地,配置文件生成单元230,适于当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
在本实施例中,当指定视频中包含人脸的视屏图像场景时,可以有多种情况,有的视频中的人脸较多或较小,尺寸大小比例较小,即使进行了人脸调色处理,对指定视频的展示效果的提高不会起到太大的作用,调色处理反而会增加视频加载播放的时间,降低用户的使用体验,这种情况就不需要进行调色处理;如果指定视频中包含的人脸的比例大小较大,那么对人脸进行调色后,会明显提高视频播放的展示效果,则就需要对人脸进行调色。所以,在进行调色处理时,并非是对所有包含人脸的视频均进行调色处理,可以针对不同的情况适应性的调色,进一步提高调色处理的效率。如,主播直播时的视频,仅包含有主播一人的人脸,且人脸在视频图像中的比例较大,这时就需要进行人脸的调色处理,即判断需要进行调色处理,将该判断结果写入配置文件中,客户端会根据配置文件进行人脸调色处理;又如,在球赛现场的视频,包含的人脸较多,且每个人脸都很小,这时就不需要进行调色处理,那么就将不需要进行调色处理的判断结果写入配置文件中,客户端进行调色时,就不会对该指定视频中的人脸进行调色。
在本发明的一个实施例中,图2所示的装置进一步包括:
通用规则标记单元,适于当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
在上述的实施例中,对指定视频的图像内容进行视频图像场景类别的识别时,是根据不同类别的视屏图像场景的机器学习模型,不可避免的机器学习模型是需要不断的累计的,无法涵盖所有类别的视频图像场景。那么,在本实施例中,还设定有调色处理通用规则,当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,可以利用调色处理通用规则进行调色处理,这样可以保证指定视频的调色处理得更充分,而并非是仅对包含预设类别的视屏图像场景的视频进行调色处理,进一步提高用户的使用体验。
本实施例中,当指定视频符合调色处理通用规则时,客户端侧就可以利用通用视频调色处理模型对指定视频进行调色,这里的视频调色处理模型是在客户端侧,也可以是在配置文件中,具体是利用机器学习的方法,将现有的具有一定色彩设计的视频图像作为训练数据,生成相应的通用视频调色处理模型,使用该通用视频调色处理模型对适用调色处理通用规则的视频进行调色处理。例如,选择配色比较符合要求的若干电影,学习其配色方法,生成相应的通用视频调色处理模型,则视频输入该通用视频调色处理模型后,其色调也会呈现出与选取的电影一致的色调。
在本发明的一个实施例中,配置文件生成单元230,适于在配置文件中写入与该配置文件中所描述的指定视频的图像内容对应的调色处理方案。
在实际使用中,服务器提供配置文件后客户端会根据配置文件进行调色处理,客户端在选择如何进行具体的调色时,可以根据客户端自身的调色处理方案进行。在本实施例中,服务器将对应的调色处理方案写入配置文件中,那么客户端就可以根据配置文件的调色处理方案进行具体的调色处理,无需客户端再次进行调色处理方案的选择,可以减少客户端侧调色处理过程的流程步骤。
例如,服务器的识别结果是该指定视频的第0-3s包含人脸的视频图像场景,客户端则会对该指定视频的第0-3s的视频图像进行人脸的调色处理,进行处理时选择对人脸进行美白、磨皮等处理。如果服务器预设该第0-3s包含人脸的视频图像场景的调色处理方案是对人脸进行美白处理,并写入配置文件中,则客户端根据配置文件,仅对对该指定视频的第0-3s的视频图像进行人脸的美白处理。又如,在指定视频的配置文件中写入在对鲜花类视频图像场景的视频进行调色时,将花的颜色的饱和度提高20%,则客户端在进行该指定视频的调色时,就将鲜花部分的颜色的饱和度提高20%。
在发明的一个实施例中,配置文件生成单元230,适于当接收到智能终端发送的请求该指定视频的配置文件的请求消息时,将该配置文件发送给智能终端,或者将该配置文件的下载地址发送给该智能终端。
在本技术方案中,服务器侧会提供指定视频的配置文件,具体的对视频进行调色处理的步骤是在客户端侧进行的,因此,服务器需要向客户端提供配置文件,具体的是在服务器接收到智能终端发送的请求该指定视频的配置文件的请求消息时,将该配置文件发送给智能终端,或者将该配置文件的下载地址发送给该智能终端,以便指定终端根据下载地址下载该指定视频的配置文件。
本发明还提供了一种电子设备,其中,该电子设备包括:
处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行根据图1所示的及其各实施例中的视频调色方法
图3示出了根据本发明一个实施例的电子设备的结构示意图。如图3所示,该电子设备300包括:
处理器310;以及被安排成存储计算机可执行指令(程序代码)的存储器320,在存储器320中,有存储程序代码的存储空间330,用于执行根据本发明的方法步骤的程序代码330存储在存储空间330中,该程序代码在被执行时使处理器310执行根据图1所示的及其各实施例中的视频调色方法。
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。如图4所示,该计算机可读存储介质400,存储一个或多个程序(程序代码)410,一个或多个程序(程序代码)410当被处理器执行时,用于执行根据本发明的方法步骤,即图1所示的以及其各实施例中的视频调色方法。
需要说明的是,图3所示的电子设备和图4所示的计算机可读存储介质的各实施例与图1所示的方法的各实施例对应相同,上文已有详细说明,在此不再赘述。
综上所述,根据本发明的技术方案,根据指定视频的直方图判断该指定视频是否适合调色;如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供配置文件,以实现根据配置文件对视频进行调色处理。通过本技术方案,首先判断指定视频是否适合进行调色处理,如果适合进行调色处理,则根据图像内容生成描述的配置文件,以便客户端根据配置文件进行相应的调色处理,对指定视频进行有效的调色处理,提高指定视频的展示效果,也可以避免不利于提高指定视频的展示效果的调色处理的操作,可以达到用户满意的效果,更能满足用户的播放需求,增强用户的使用体验。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频调色装置、电子设备和计算机可读存储介质中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备300传统上包括处理器310和被安排成存储计算机可执行指令(程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行图1所示的以及各实施例中的任何方法步骤的程序代码340的存储空间330。例如,用于程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个程序代码340。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质400。该计算机可读存储介质400可以具有与图3的电子设备中的存储器320类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元存储有用于执行根据本发明的方法步骤的程序代码410,即可以由诸如310之类的处理器读取的程序代码,当这些程序代码由电子设备运行时,导致该电子设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种视频调色方法,其中,该方法包括:
根据指定视频的直方图判断该指定视频是否适合调色;
如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
A2、如A1所述的方法,其中,所述根据指定视频的直方图判断该指定视频是否适合调色包括:
将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;
获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
A3、如A2所述的方法,其中,该方法进一步包括:
获取一定数量的被确定为不适合调色的视频;
将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到所述用于识别不适合调色的视频的机器学习模型。
A4、如A3所述的方法,其中,该方法进一步包括:
获取一定数量的被确定为适合调色的视频;
将这些适合调色的视频输入到所述用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
A5、如A1-A4中任一项所述的方法,其中,所述识别指定视频的图像内容包括:
预设不同类别的视频图像场景;
识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
A6、如A5所述的方法,其中,所述识别指定视频的图像内容所属的视频图像场景类别包括:
将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;
获取各机器学习模型输出的识别结果。
A7、如A6所述的方法,其中,该方法进一步包括:
对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;
以此类推,得到各类别的视频图像场景对应的机器学习模型。
A8、如A5所述的方法,其中,所述不同类别的视频图像场景包括:
含人脸的视频图像场景;
风景类视频图像场景。
A9、如A8所述的方法,其中,所述根据识别结果生成描述指定视频的图像内容的配置文件进一步包括:
当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
A10、如A5所述的方法,其中,该方法进一步包括:
当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
本发明还公开了B11、一种视频调色装置,其中,该装置包括:
判断单元,适于根据指定视频的直方图判断该指定视频是否适合调色;
标记单元,适于如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
配置文件生成单元,适于反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
B12、如B11所述的装置,其中,
所述判断单元,适于将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
B13、如B12所述的装置,其中,该装置进一步包括:
第一机器学习模型获取单元,适于获取一定数量的被确定为不适合调色的视频;将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到所述用于识别不适合调色的视频的机器学习模型。
B14、如B13所述的装置,其中,
第一机器学习模型获取单元,还适于获取一定数量的被确定为适合调色的视频;将这些适合调色的视频输入到所述用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
B15、如B11-B14中任一项所述的装置,其中,
所述配置文件生成单元,适于预设不同类别的视频图像场景;识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
B16、如B15所述的装置,其中,
所述配置文件生成单元,适于将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;获取各机器学习模型输出的识别结果。
B17、如B16所述的装置,其中,该装置进一步包括:
第二机器学习模型获取单元,适于对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;以此类推,得到各类别的视频图像场景对应的机器学习模型。
B18、如B15所述的装置,其中,所述不同类别的视频图像场景包括:
含人脸的视频图像场景;
风景类视频图像场景。
B19、如B18所述的装置,其中,
所述配置文件生成单元,适于当指定视频中包括含人脸的视频图像场景时,进一步根据其中的人脸的尺寸大小比例判断是否对该含人脸的视频图像场景进行调色处理,并将判断结果写入配置文件中。
B20、如B15所述的装置,其中,该装置进一步包括:
通用规则标记单元,适于当指定视频的图像内容不属于预设的任何一种视频图像场景类别时,在该指定视频的配置文件中的标记该指定视频适用调色处理通用规则。
本发明还公开了C21、一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据A1~A10中任一项所述的方法。
本发明还公开了D22、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现A1~A10中任一项所述的方法。
Claims (10)
1.一种视频调色方法,其中,该方法包括:
根据指定视频的直方图判断该指定视频是否适合调色;
如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
2.如权利要求1所述的方法,其中,所述根据指定视频的直方图判断该指定视频是否适合调色包括:
将该指定视频的直方图输入到用于识别不适合调色的视频的机器学习模型中;
获取该机器学习模型的输出确认该指定视频适合或不适合调色的结果。
3.如权利要求2所述的方法,其中,该方法进一步包括:
获取一定数量的被确定为不适合调色的视频;
将这些不适合调色的视频的直方图作为训练数据输入到机器学习模型中进行训练学习,得到所述用于识别不适合调色的视频的机器学习模型。
4.如权利要求3所述的方法,其中,该方法进一步包括:
获取一定数量的被确定为适合调色的视频;
将这些适合调色的视频输入到所述用于识别不适合调色的视频的机器学习模型中,对该机器学习模型进行验证。
5.如权利要求1-4中任一项所述的方法,其中,所述识别指定视频的图像内容包括:
预设不同类别的视频图像场景;
识别指定视频的图像内容所属的视频图像场景类别,并记录相应类别的视频图像场景在该指定视频中的起止时间。
6.如权利要求5所述的方法,其中,所述识别指定视频的图像内容所属的视频图像场景类别包括:
将指定视频依次输入到分别用于识别视频中的不同类别的视频图像场景的各机器学习模型中;
获取各机器学习模型输出的识别结果。
7.如权利要求6所述的方法,其中,该方法进一步包括:
对于一种类别的视频图像场景,获取属于该类别的视频图像场景的视频,将获取的视频作为训练数据输入到机器学习模型进行训练学习,得到用于识别视频中的该类别的视频图像场景的机器学习模型;
以此类推,得到各类别的视频图像场景对应的机器学习模型。
8.一种视频调色装置,其中,该装置包括:
判断单元,适于根据指定视频的直方图判断该指定视频是否适合调色;
标记单元,适于如果判断结果为该指定视频不适合调色,则在指定视频的配置文件中标记该指定视频不适合进行调色处理;
配置文件生成单元,适于反之,识别指定视频的图像内容,根据识别结果生成描述指定视频的图像内容的配置文件;提供所述配置文件,以实现根据所述配置文件对所述视频进行调色处理。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1~7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810084407.5A CN108235117A (zh) | 2018-01-29 | 2018-01-29 | 一种视频调色方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810084407.5A CN108235117A (zh) | 2018-01-29 | 2018-01-29 | 一种视频调色方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108235117A true CN108235117A (zh) | 2018-06-29 |
Family
ID=62669037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810084407.5A Pending CN108235117A (zh) | 2018-01-29 | 2018-01-29 | 一种视频调色方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108235117A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002857A (zh) * | 2018-07-23 | 2018-12-14 | 厦门大学 | 一种基于深度学习的视频风格变换与自动生成方法及系统 |
CN109089158A (zh) * | 2018-07-24 | 2018-12-25 | 四川长虹电器股份有限公司 | 用于智能电视的人脸画质参数处理系统及其实现方法 |
CN111225283A (zh) * | 2019-12-26 | 2020-06-02 | 新奥特(北京)视频技术有限公司 | 基于非线性编辑系统的视频调色方法、装置、设备及介质 |
CN112104891A (zh) * | 2020-11-23 | 2020-12-18 | 北京蜜莱坞网络科技有限公司 | 视频帧处理方法、装置、电子设备及存储介质 |
WO2021082171A1 (zh) * | 2019-10-28 | 2021-05-06 | 网宿科技股份有限公司 | 一种增强视频画质的方法和装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101710955A (zh) * | 2009-11-24 | 2010-05-19 | 北京中星微电子有限公司 | 亮度和对比度调整的方法及设备 |
CN101904166A (zh) * | 2007-12-19 | 2010-12-01 | 伊斯曼柯达公司 | 使用预览图像选择曝光的摄像装置 |
CN102111546A (zh) * | 2009-12-25 | 2011-06-29 | 佳能株式会社 | 图像处理方法、图像处理设备和摄像设备 |
CN102111547A (zh) * | 2009-12-25 | 2011-06-29 | 佳能株式会社 | 图像处理方法、图像处理设备和摄像设备 |
CN103617432A (zh) * | 2013-11-12 | 2014-03-05 | 华为技术有限公司 | 一种场景识别方法及装置 |
US20150227805A1 (en) * | 2014-02-07 | 2015-08-13 | Euclid Vision Technologies B.V. | Image processing based on scene recognition |
CN106657810A (zh) * | 2016-09-26 | 2017-05-10 | 维沃移动通信有限公司 | 一种视频图像的滤镜处理方法和装置 |
CN106919920A (zh) * | 2017-03-06 | 2017-07-04 | 重庆邮电大学 | 基于卷积特征和空间视觉词袋模型的场景识别方法 |
CN107368603A (zh) * | 2017-07-28 | 2017-11-21 | 上海鋆创信息技术有限公司 | 一种图片滤镜处理的方法及装置、存储介质和终端 |
-
2018
- 2018-01-29 CN CN201810084407.5A patent/CN108235117A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101904166A (zh) * | 2007-12-19 | 2010-12-01 | 伊斯曼柯达公司 | 使用预览图像选择曝光的摄像装置 |
CN101710955A (zh) * | 2009-11-24 | 2010-05-19 | 北京中星微电子有限公司 | 亮度和对比度调整的方法及设备 |
CN102111546A (zh) * | 2009-12-25 | 2011-06-29 | 佳能株式会社 | 图像处理方法、图像处理设备和摄像设备 |
CN102111547A (zh) * | 2009-12-25 | 2011-06-29 | 佳能株式会社 | 图像处理方法、图像处理设备和摄像设备 |
CN103617432A (zh) * | 2013-11-12 | 2014-03-05 | 华为技术有限公司 | 一种场景识别方法及装置 |
US20150227805A1 (en) * | 2014-02-07 | 2015-08-13 | Euclid Vision Technologies B.V. | Image processing based on scene recognition |
CN106657810A (zh) * | 2016-09-26 | 2017-05-10 | 维沃移动通信有限公司 | 一种视频图像的滤镜处理方法和装置 |
CN106919920A (zh) * | 2017-03-06 | 2017-07-04 | 重庆邮电大学 | 基于卷积特征和空间视觉词袋模型的场景识别方法 |
CN107368603A (zh) * | 2017-07-28 | 2017-11-21 | 上海鋆创信息技术有限公司 | 一种图片滤镜处理的方法及装置、存储介质和终端 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002857A (zh) * | 2018-07-23 | 2018-12-14 | 厦门大学 | 一种基于深度学习的视频风格变换与自动生成方法及系统 |
CN109002857B (zh) * | 2018-07-23 | 2020-12-29 | 厦门大学 | 一种基于深度学习的视频风格变换与自动生成方法及系统 |
CN109089158A (zh) * | 2018-07-24 | 2018-12-25 | 四川长虹电器股份有限公司 | 用于智能电视的人脸画质参数处理系统及其实现方法 |
CN109089158B (zh) * | 2018-07-24 | 2020-04-28 | 四川长虹电器股份有限公司 | 用于智能电视的人脸画质参数处理系统及其实现方法 |
WO2021082171A1 (zh) * | 2019-10-28 | 2021-05-06 | 网宿科技股份有限公司 | 一种增强视频画质的方法和装置 |
CN111225283A (zh) * | 2019-12-26 | 2020-06-02 | 新奥特(北京)视频技术有限公司 | 基于非线性编辑系统的视频调色方法、装置、设备及介质 |
CN112104891A (zh) * | 2020-11-23 | 2020-12-18 | 北京蜜莱坞网络科技有限公司 | 视频帧处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108235117A (zh) | 一种视频调色方法和装置 | |
CN107592474A (zh) | 一种图像处理方法和装置 | |
He et al. | Conditional sequential modulation for efficient global image retouching | |
US8379999B2 (en) | Methods, circuits, devices, apparatuses and systems for providing image composition rules, analysis and improvement | |
CN108024083A (zh) | 处理视频的方法、装置、电子设备和计算机可读存储介质 | |
CN110674341B (zh) | 特效处理方法、装置、电子设备及存储介质 | |
CN108431886A (zh) | 针对特定显示器优化高动态范围图像 | |
CN108322788A (zh) | 一种视频直播中的广告展示方法及装置 | |
US20170270679A1 (en) | Determining a hair color treatment option | |
CN107633541A (zh) | 一种图像特效的生成方法和装置 | |
CN106897857A (zh) | 一种工作流处理方法和系统 | |
CN108198177A (zh) | 图像获取方法、装置、终端及存储介质 | |
CN108236784A (zh) | 模型的训练方法和装置、存储介质、电子装置 | |
CN106897808A (zh) | 一种工作流创建方法和装置 | |
CN104636759A (zh) | 一种获取图片推荐滤镜信息的方法及图片滤镜信息推荐系统 | |
CN108600863A (zh) | 多媒体文件处理方法和装置、存储介质及电子装置 | |
KR102308369B1 (ko) | 인공지능 음원 분석을 통한 동영상 자동 편집 시스템 | |
CN109395383A (zh) | 一种游戏计分方法和装置 | |
CN108449626A (zh) | 视频处理、视频的识别方法、装置、设备和介质 | |
CN109195025A (zh) | 一种游戏广告制作方法及平台、存储介质 | |
CN108335260A (zh) | 一种游戏场景图像处理方法、装置、存储介质及电子装置 | |
CN108764022A (zh) | 一种图像识别方法及系统 | |
CN108648139A (zh) | 一种图像处理方法和装置 | |
CN108235118A (zh) | 一种视频调色处理方法和装置 | |
CN108495107A (zh) | 一种视频处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |
|
RJ01 | Rejection of invention patent application after publication |