CN111090778A - 一种图片生成方法、装置、设备及存储介质 - Google Patents

一种图片生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111090778A
CN111090778A CN201911365454.8A CN201911365454A CN111090778A CN 111090778 A CN111090778 A CN 111090778A CN 201911365454 A CN201911365454 A CN 201911365454A CN 111090778 A CN111090778 A CN 111090778A
Authority
CN
China
Prior art keywords
picture
key frame
pictures
target
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911365454.8A
Other languages
English (en)
Other versions
CN111090778B (zh
Inventor
王园
范学峰
李国洪
高菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911365454.8A priority Critical patent/CN111090778B/zh
Publication of CN111090778A publication Critical patent/CN111090778A/zh
Application granted granted Critical
Publication of CN111090778B publication Critical patent/CN111090778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种图片生成方法、装置、设备及存储介质,涉及机器学习技术领域。具体实现方案为:基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;从所述关键帧图片中确定出满足预设质量条件的目标图片。本申请实施例的技术方案从满足设定类别条件的视频中提取优质图片,扩展了网页或应用程序中所展现图片的图片来源,并通过预设质量条件对所提取的图片进行筛选,从而使网页或应用程序中所展现图片的图片质量得到有效保证。

Description

一种图片生成方法、装置、设备及存储介质
技术领域
本申请涉及图像处理技术,尤其涉及机器学习技术领域。
背景技术
目前,在网页或应用程序中进行图片搜索时,所展现的图片绝大部分来自于网页爬取图片或者用户上传图片。由于这些图片来源较广,加之应用场景对图片质量的要求不同,导致所展现图片的质量参差不齐。
有鉴于此,需要扩展新的图片来源,以保证网页或应用程序中所展现图片的质量。
发明内容
本申请实施例提供了一种图片生成方法、装置、设备及存储介质,以扩展新的图片来源,有效保证网页或应用程序中所展现图片的图片质量。
第一方面,本申请实施例提供了一种图片生成方法,包括:
基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;
基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;
从所述关键帧图片中确定出满足预设质量条件的目标图片。
本申请实施例通过基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;基于预设关键帧提取算法,提取目标视频中的关键帧图片;从关键帧图片中确定出满足预设质量条件的目标图片。上述技术方案从满足设定类别条件的视频中提取优质图片,扩展了网页或应用程序中所展现图片的图片来源,并通过预设质量条件对所提取的图片进行筛选,从而使网页或应用程序中所展现图片的图片质量得到有效保证。另外,基于从目标视频所提取的关键帧图片进行目标图片的确定,建立了目标图片与目标视频之间的关联关系,从而将视频类别引申至图片类别,丰富了图片的多样性,增强了图片特色,同时能够迎合视频观看用户的观看需求,进而提升了图片的浏览量和下载量,达到图片引流的效果。
可选的,所述预设关键帧提取算法包括:边缘变化率ECR算法。
上述申请中的一个可选实施方式,通过将预设关键帧提取算法细化为边缘变化率算法,完善了关键帧图片的提取方式。
可选的,基于预设关键帧提取算法,提取目标视频中的关键帧图片,包括:
检测所述目标视频中各相邻帧图片的边缘像素;
根据各相邻帧图片的边缘像素,确定各相邻帧图片的边缘变化率;
基于边缘变化率从相邻帧图片中选取关键帧图片。
上述申请中的一个可选实施方式,通过检测目标视频中各相邻帧图片的边缘像素,并根据各相邻帧图片的边缘像素,确定各相邻帧图片的边缘变化率,从而基于所确定的边缘变化率从相邻帧图片中选取关键帧图片,完善了关键帧图片的确定机制,使得所选取的关键帧图片能够有效表征目标视频,从而避免不同目标视频所确定的关键帧图片重复带来的计算冗余。
可选的,基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频,包括:
针对各待筛选视频,将所述待筛选视频中的至少一个帧图片输入所述多分类模型,获取所述多分类模型输出的各预测分值;
根据各预测分值确定所述待筛选视频的预测总分值;
根据所述预测总分值确定所述待筛选视频是否为满足设定分类条件的目标视频。
上述申请中的一个可选实施方式,通过多分类模型对待筛选视频中的帧图片进行分值预测,并通过各类别预测分值进行预测总分值的确定,从而基于预设总分值对待筛选视频进行筛选,得到目标视频,使得所筛选的视频能够综合考量用户在不同类别上的兴趣爱好,避免了所选取的视频类别单一,导致后续保存的目标图片的受众较少的情况,从而提高了所筛选视频与用户感兴趣的垂类视频的匹配度。
可选的,在基于预设关键帧提取算法,提取所述目标视频中的关键帧图片之后,在从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存之前,所述方法还包括:
确定各所述关键帧图片的属性数据,根据所述属性数据确定各所述关键帧图片的质量是否满足预设条件,并滤除质量不满足预设条件的所述关键帧图片;
其中,所述属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。
上述申请中的一个可选实施方式,通过在从关键帧图片中筛选目标图片之前,根据关键帧图片的属性数据对关键帧图片进行初步筛选,从而为后续所确定的目标图片的图片质量提供了保障。
可选的,从所述关键帧图片中确定出满足预设质量条件的目标图片,包括:
基于预先训练出的特征提取模型,获取所述关键帧图片在至少一个维度的中间特征数据;
通过对所述中间特征数据进行分析,确定所述关键帧图片在至少一个维度的目标特征数据;
根据所述目标特征数据确定所述关键帧图片对应的质量分值;
根据所述质量分值确定所述关键帧图片是否是满足预设质量条件的目标图片。
上述申请中的一个可选实施方式,通过中间特征数据的提取和分析,得到目标特征数据,并由目标特征数据确定关键帧图片的质量分值,从而基于质量分值从关键帧图片中筛选目标图片,使所筛选出的目标图片能够与目标特征数据相关联,保证了目标图片对用户的吸引性,并通过质量分值的条件限定,为所筛选目标图片的质量提供了保障。
可选的,所述中间特征数据包括:人脸特征、人体特征以及图片的属性数据中的至少一个;
所述目标特征数据包括:人脸姿态数据、人脸器官状态数据,人体占屏幕比例数据、以及人体部位占比数据中的至少一个。
上述申请中的一个可选实施方式,通过将中间特征数据和目标特征数据进行限定,以将本申请中的图片生成方法应用至人物图片生成这一实际场景。
可选的,所述方法还包括:
当检测到用户对展现的当前图片的触发操作时,确定保存的目标图片中与所述当前图片的类别一致的待推荐图片;
根据各待推荐图片对应的质量分值对各待推荐图片进行排序,根据排序结果将待推荐图片推送给客户端进行展现。
上述申请中的一个可选实施方式,通过在存储目标图片之后,根据用户对展现的当前图片的触发操作,进行一致类别的图片推荐,以通过关联图片推荐的方式,为用户提供更多选择,满足了用户的浏览需求,同时通过质量分值对待推荐图片进行展现排序,满足了用户浏览图片时的质量需求。
可选的,所述方法还包括:
根据用户对展现的图片的点击率数据,更新所述图片的质量分值,以基于更新后的质量分值重新对待推荐图片进行排序。
上述申请中的一个可选实施方式,通过用户点击率数据对图片质量分值进行更新,使得在对待推荐排序过程中,能够兼顾用户对待推荐图片的交互情况,进而提高了所推荐图片与用户的匹配度。
第二方面,本申请实施例还提供了一种图片生成装置,包括:
目标视频筛选模块,用于基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;
关键帧图片提取模块,用于基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;
目标图片确定模块,用于从所述关键帧图片中确定出满足预设质量条件的目标图片。
第三方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所提供的一种图片生成方法。
第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如第一方面实施例所提供的一种图片生成方法。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例一中的一种图片生成方法的流程图;
图2是本申请实施例二中的一种图片生成方法的流程图;
图3是本申请实施例三中的一种图片生成方法的流程图;
图4是本申请实施例四中的一种图片生成方法的流程图;
图5是本申请实施例五中的一种图片生成装置的结构图;
图6是用来实现本申请实施例的图片生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
实施例一
图1是本申请实施例一中的一种图片生成方法的流程图,本申请实施例适用于在网页或应用程序中进行图片搜索时,为搜索结果提供图片来源的情况,该方法通过图片生成装置执行,该装置由软件和/或硬件实现,并具体配置于电子设备中。
如图1所示的一种图片生成方法,包括:
S101、基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频。
其中,分类模型可以是二分类模型,还可以是由多个二分类模型组成的多分类模型。
可选的,分类模型可以基于待筛选视频中的帧图片,对待筛选视频进行分类,从而筛选出满足设定分类条件的目标视频;或者可选的,分类模型还可以基于待筛选视频中的文本标签信息,对待筛选视频进行分类,从而筛选出满足设定分类条件的目标视频;或者可选的,分类模型还可以基于待筛选视频中的字幕信息,对待筛选视频进行分类,从而筛选出满足设定分类条件的目标视频。
其中,设定分类条件可以是设定类别。其中,设定类别可以是某一具体类别(例如,游戏类),或者是视频的综合类别(例如,游戏类和动画类组合得到的动画游戏类别)。其中,设定分类条件可以由技术人员根据需要或经验值加以确定,或者根据用户在网页或应用程序界面的配置信息进行确定。
可以理解的是,为了便于对设定分类条件的评判,可以将视频的不同类别采用分值量化表示,并将各视频对应的分值与设定分值阈值进行比较,根据比较结果对视频进行筛选。其中,设定分值阈值由技术人员根据需要或经验值进行确定,或通过用户在网页或应用程序界面的配置信息进行确定。
S102、基于预设关键帧提取算法,提取所述目标视频中的关键帧图片。
其中,关键帧提取算法就是对视频进行镜头分割,再在镜头内提取出能够代表镜头内容的关键帧图片。其中,关键帧提取可以是基于镜头边界进行提取,也可以基于内容分析进行提取,或者还可以基于聚类等进行提取等。
示例性地,预设关键帧提取算法可以是边缘变化率(Edge Change Rate,ECR)算法。
在本申请实施例的一种可选实施方式中,基于预设关键帧提取算法,提取目标视频中的关键帧图片,可以是:检测目标视频中各相邻帧图片的边缘像素;根据各相邻帧图片的边缘像素,确定各相邻帧图片的边缘变化率;基于边缘变化率从相邻帧图片中选取关键帧图片。
示例性地,检测各相邻帧图片的边缘像素;针对每对相邻帧图片,根据在前帧图片的边缘像素不属于在后帧图片的边缘像素,确定第一变化率,以及根据在后帧图片新增的边缘像素,确定第二变化率;根据所述第一变化率和所述第二变化率,确定相邻帧图片的边缘变化率,并选取所述目标视频中局部边缘变化率最大时所对应的相邻帧图片中的其中一个,作为关键帧图片。
示例性地,根据所述第一变化率和所述第二变化率,确定相邻帧图片的边缘变化率,可以是:将第一变化率和第二变换率中的较大值作为边缘变化率。
其中,选取所述目标视频中局部边缘变化率最大时所对应的相邻帧图片中的其中一个,作为关键帧图片,可以是:根据设定区间长度,将目标视频中的各帧图片划分多个区间;针对每一区间的帧图片,选取边缘变化率最大时对应的相邻帧图片中的其中一个,作为关键帧图片。其中,设定区间长度可以由技术人员根据需要或经验值进行确定。其中,相邻帧图片中的其中一个可以是在前帧图片或在后帧图片。典型的,选取在后帧图片作为关键帧图片。
可以理解的是,通过上述方式进行关键帧图片的选取,使得所选取的关键帧图片能够有效表征目标视频,从而将视频类别引申至图片类别,丰富了图片的多样性,增强了图片特色,同时避免了不同目标视频所确定的关键帧图片重复带来的计算冗余。
S103、从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。
示例性地,从关键帧图片中确定出满足预设质量条件的目标图片,可以是:确定各关键帧图片的属性数据,并从关键帧图片中确定出属性数据满足设定属性阈值的目标图片。其中,属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。其中,设定属性阈值可以由技术人员根据需要或经验值进行设定,或根据用户在网页或应用程序界面的配置信息进行确定。
可以理解的是,采用上述方式进行目标图片的确定,能够有效保证所筛选的图片质量,从而增强用户的观看体验。
示例性地,从关键帧图片中确定出满足预设质量条件的目标图片,可以是:根据关键帧图片的图片类型或所包含特征数据,确定该关键帧图片的质量分值;从关键帧图片中确定出质量分值满足设定分值阈值的目标图片。其中,设定分值阈值可以由技术人员根据需要或经验值进行设定,或根据用户在网页或应用程序界面的配置信息进行确定。
示例性地,根据关键帧图片的图片类型或所包含特征数据,确定该关键帧图片的质量分值,可以预先针对不同图片类型或特征数据设定相应的质量分值,根据关键帧图片对应的图片类型或所包含的特征数据进行质量分值的运算,根据运算结果确定该关键帧图片的质量分值。其中,运算可以是累加、累乘、或通过其他预设公式进行计算。
本申请实施例基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;基于预设关键帧提取算法,提取目标视频中的关键帧图片;从关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。上述技术方案从满足设定类别条件的视频中提取优质图片,扩展了网页或应用程序中所展现图片的图片来源,并通过预设质量条件对所提取的图片进行筛选,从而使网页或应用程序中所展现图片的图片质量得到有效保证。另外,基于从目标视频所提取的关键帧图片进行目标图片的确定,建立了目标图片与目标视频之间的关联关系,从而将视频类别引申至图片类别,丰富了图片的多样性,增强了图片特色,同时能够迎合视频观看用户的观看需求,进而提升了图片的浏览量和下载量,达到图片引流的效果。
在上述各实施例的技术方案的基础上,为了在展现图片时,能够在用户触发图片时,向用户进行关联图片的推荐,还可以:当检测到用户对展现的当前图片的触发操作时,确定保存的目标图片中与所述当前图片的类别一致的待推荐图片;根据各待推荐图片对应的质量分值对各待推荐图片进行排序,根据排序结果将待推荐图片推送给客户端进行展现。
其中,可以将各待推荐图片的属性数据对应的属性数值作为质量分值;还可以是根据待推荐图片的图片类型或所包含特征数据,确定该待推荐图片的质量分值。
其中,属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。
其中,根据待推荐图片的图片类型或所包含特征数据,确定该关键帧图片的质量分值,可以参见对关键帧图片的质量分值的确定操作,在此不再赘述。
可以理解的是,为了在对待推荐排序过程中,能够兼顾用户对待推荐图片的交互情况,以提高所推荐图片与用户的匹配度,还可以:根据用户对展现的图片的点击率数据,更新所述图片的质量分值,以基于更新后的质量分值重新对待推荐图片进行排序。
示例性地,根据用户对展现的图片的点击率数据,更新图片的质量分值,可以是通过点击率数据对应的调整因子,与原始质量分值相加或相乘,得到新的质量分值,或者还可以根据预设更新公式,采用调整因子更新图片的质量分值。其中,预设更新公式可以是单调递增的函数公式。
实施例二
图2是本申请实施例二中的一种图片生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,进行了优化改进。
进一步地,将操作“基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频”细化为“针对各待筛选视频,将所述待筛选视频中的至少一个帧图片输入所述多分类模型,获取所述多分类模型输出的各预测分值;根据各预测分值确定所述待筛选视频的预测总分值;根据所述预测总分值确定所述待筛选视频是否为满足设定分类条件的目标视频”,以完善目标视频的确定机制。
如图2所示的一种图片生成方法,包括:
S201、针对各待筛选视频,将所述待筛选视频中的至少一个帧图片输入所述多分类模型,获取所述多分类模型输出的各预测分值。
其中,多分类模型可以由多个二分类模型组合得到。
其中,预测分值可以是待筛选视频的帧图片属于某一类型的预测概率值。
其中,多分类模型的输入数据为待筛选视频中的帧图片;多分类模型的输出数据为每个帧图片分别属于不同类别时对应的预测分值。
其中,待筛选视频中的帧图片可以通过对待筛选视频进行抽帧处理,或关键帧提取得到。为了保证所抽取帧图片能够涵盖整个待筛选视频,典型是对待筛选视频在时间轴上进行均匀抽帧处理。
需要说明的是,多分类模型可以通过挖掘海量视频数据,通过大规模聚簇过滤置信度高的视频库进行训练得到。其中,多分类模型可以是深度学习模型。
S202、根据各预测分值确定所述待筛选视频的预测总分值。
示例性地,针对每个帧图片,根据针对每个类别预先设置的权重,对各类别的预测分值加权求,得到该帧图片对应的预测总分值。其中,各类别对应的权重和为1。其中,不同类别对应的权重可以由技术人员根据需要或经验值进行确定,还可以通过大量试验加以确定,并在使用时进行调整;或者还可以由用户在网页或应用程序界面通过配置信息进行确定。
当获取的待筛选视频的帧图片为一个,也即输入至多分类模型的待筛选视频的帧图片为一个时,将该帧图片对应的预测总分值作为待筛选视频的预测总分值;当获取的待筛选视频的帧图片为至少两个,也即输入至多分类模型的待筛选视频的帧图片为至少两个时,确定各帧图片对应的预测总分值的均值,将所确定的均值作为待筛选视频的预测总分值。
可以理解的时,通过多分类模型的使用,能够综合考量不同用户在不同类别上的兴趣爱好,避免了所选取的视频类别单一,导致后续保存的目标图片的受众较少的情况,从而提高了所筛选视频与用户感兴趣的垂类视频的匹配度,为目标图片的引流奠定基础。
S203、根据所述预测总分值确定所述待筛选视频是否为满足设定分类条件的目标视频。
具体的,可以将预测总分值与设定预测分值阈值进行比较,若预测总分值大于设定预测分值阈值,则确定满足设定分类条件,将满足设定分类条件的视频作为目标视频。其中,设定预测分值阈值可以由技术人员根据需要或经验值进行设定。
可以理解的是,通过对待筛选视频中的至少一个帧图片的各预测分值,综合确定待筛选视频的预测总分值,以基于预测总分值进行视频筛选,并通过卡阈值的方式,从而可以精准的从海量视频数据中,选择出用户感兴趣的垂类视频。
以三分类模型为例,对目标视频的确定过程进行说明。针对每个需要分类的视频进行抽帧处理,对抽取的N(N≥1)张帧图片通过图片三分类模型,计算各帧图片对应的预测总分值。具体的,针对每个帧图片,确定帧图片对应三个不同分类的概率分数s1、s2和s3作为预测分值,然后通过加权计算该帧图片的预测总分值:f_s=s1*w1+s2*w2+s3*w3,其中,w1+w2+w3=1。计算出N张帧图片的预测总分值的平均值,作为该视频的预测总分值;将各视频的预测总分值与设定预测分值阈值进行比较;筛选出预测总分值大于设定预测分值阈值的视频作为目标视频。
S204、基于预设关键帧提取算法,提取所述目标视频中的关键帧图片。
S205、从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。
本申请实施例通过将目标视频的确定操作,细化为针对各待筛选视频中的至少一个帧图片输入多分类模型,获取多分类模型输出的各预测分值;根据各预测分值确定待筛选视频的预测总分值;根据预测总分值确定待筛选视频是否为满足设定分类条件的目标视频,从而使得所筛选的视频能够综合考量用户在不同类别上的兴趣爱好,避免了所选取的视频类别单一,导致后续保存的目标图片的受众较少的情况,从而提高了所筛选视频与用户感兴趣的垂类视频的匹配度。
实施例三
图3是本申请实施例三中的一种图片生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,进行了优化改进。
进一步地,在操作“基于预设关键帧提取算法,提取所述目标视频中的关键帧图片”之后,在操作“从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存”之前,追加“确定各所述关键帧图片的属性数据,根据所述属性数据确定各所述关键帧图片的质量是否满足预设条件,并滤除质量不满足预设条件的所述关键帧图片;其中,所述属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个”,以过滤质量较差的关键帧图片。
如图3所示的一种图片生成方法,包括:
S301、基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频。
S302、基于预设关键帧提取算法,提取所述目标视频中的关键帧图片。
S303、确定各所述关键帧图片的属性数据,根据所述属性数据确定各所述关键帧图片的质量是否满足预设条件,并滤除质量不满足预设条件的所述关键帧图片。
其中,所述属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。
示例性地,可以采用以下公式确定关键帧图片的亮度:
luminance(Irgb)=ωrIrgIgbIb
ωrgb=1;
其中,Irgb为关键帧图片的RGB图像数据;Ir、Ig、Ib分别为Irgb在红、绿、蓝颜色通道对应的像素值。ωr、ωg、ωb分别为各颜色通道对应的权重值。其中,各颜色通道对应的权重值可以由技术人员根据需要或经验值进行确定。例如,ωr=0.2126;ωg=0.7152;ωb=0.0722。
示例性地,可以采用以下公式确定关键帧图片的清晰度:
Figure BDA0002338282880000121
其中,Igray为关键帧图片的灰度图像数据,dxIgray为灰度图像在x方向的导数;dyIgray为灰度图像在y方向的导数;sharpness函数表示二维矢量(dxIgray,dyIgray)的幅值。
示例性地,可以采用以下公式确定关键帧图片的色彩单一度:
Figure BDA0002338282880000122
其中,hist()为图像直方图确定函数;sort()为排序函数;uniformity函数为设定百分比(t)的灰度值占所有像素的比例。其中,t可以由技术人员根据需要或经验值进行确定。示例性地,t=5%。
S304、从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。
本申请实施例在从关键帧图片中确定目标图片之前,通过关键帧图片的属性数据,对质量较差的关键帧图片进行过滤,得到优质图片的选择池,为后续所确定的目标图片的图片质量提供了保障。
实施例四
图4是本申请实施例四中的一种图片生成方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,进行优化改进。
进一步地,将操作“从所述关键帧图片中确定出满足预设质量条件的目标图片”细化为“基于预先训练出的特征提取模型,获取所述关键帧图片在至少一个维度的中间特征数据;通过对所述中间特征数据进行分析,确定所述关键帧图片在至少一个维度的目标特征数据;根据所述目标特征数据确定所述关键帧图片对应的质量分值;根据所述质量分值确定所述关键帧图片是否是满足预设质量条件的目标图片”,以完善目标图片的确定机制。
如图4所示的一种图片生成方法,包括:
S401、基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频。
S402、基于预设关键帧提取算法,提取所述目标视频中的关键帧图片。
S403、基于预先训练出的特征提取模型,获取所述关键帧图片在至少一个维度的中间特征数据。
其中,特征提取模型可以根据大量图片以及图片在特定维度的特征数据,作为训练样本数据,对原始构建的深度学习模型训练得到。其中,深度学习模型可以是神经网络模型。
示例性地,可以根据不同维度训练相应的特征提取模型,并使用训练好的特征提取模型,提取关键帧图片在相应维度上的特征数据,作为中间特征数据。
S404、通过对所述中间特征数据进行分析,确定所述关键帧图片在至少一个维度的目标特征数据。
示例性地,关键帧图片可以是人物图片;相应的,中间特征数据包括人脸特征、人体特征以及图片的属性数据等中的至少一个;目标特征数据包括:人脸姿态数据、人脸器官状态数据,人体占屏幕比例数据、以及人体部位占比数据等中的至少一个。
示例性地,人脸特征可以包括人脸的轮廓关键点坐标、以及戴眼镜信息等中的至少一种;人体特征可以包括人物性别、颜值以及人体的身体部位位置信息等中的至少一种。
示例性地,人脸姿态数据可以是头部角度信息,用于表征人物脸部朝向。示例性地,人脸器官状态数据,可以是眼睛坐标,用于表征人物的眼睛状态,如睁眼或闭眼等;还可以是是嘴巴坐标,用于表征人物的嘴巴状态,如张嘴或闭嘴等。示例性地,人体占屏幕比例数据可以是腿长占比,例如腿长占屏幕比例。示例性地,人体部位占比数据可以是腿长占比,例如腿长占人体比例。
S405、根据所述目标特征数据确定所述关键帧图片对应的质量分值。
示例性地,可以预先设置不同特征数据对应的质量分值,并根据关键帧图片所包含的各维度的目标特征数据对应的质量分值,加权求和后得到总质量分值,作为关键帧图片对应的质量分值。其中,不同目标特征数据的权重可以由技术人员根据需要或经验值加以确定。
S406、根据所述质量分值确定所述关键帧图片是否是满足预设质量条件的目标图片,并进行保存。
可选的,进行目标图片确定时,可以根据质量分值与设定质量分值阈值进行比较,并将质量分值大于设定质量分值阈值的关键帧图片,作为目标图片;其中,设定质量分值阈值可以由技术人员根据需要或经验值进行确定。
或者可选的,进行目标图片确定时,还可以根据质量分值对各关键帧图片进行排序,根据排序结果,选取质量分值最大的设定数量的关键帧图片作为目标图片。其中,设定数量可以由技术人员根据需要或经验值加以确定。
可以理解的是,质量分值越高,代表图片的质量越好,越容易吸引用户。当然,为了进一步提高目标图片的吸引度,还可以根据用户对关键帧图片的历史交互情况,对关键帧图片对应的质量分值进行更新,并根据更新后的质量分值确定关键帧图片是否是满足预设质量条件的目标图片,并进行保存。其中,历史交互情况可以是浏览量、点击量、点赞量、收藏量、以及下载量等中的至少一种。
本申请实施例通过将目标图片的确定操作,细化为通过中间特征数据的提取和分析,得到目标特征数据,并由目标特征数据确定关键帧图片的质量分值,从而基于质量分值从关键帧图片中筛选目标图片,使所筛选出的目标图片能够与目标特征数据相关联,保证了目标图片对用户的吸引性,并通过质量分值的条件限定,为所筛选目标图片的质量提供了保障。
实施例五
图5是本申请实施例五中的一种图片生成装置的结构图,本申请实施例适用于在网页或应用程序中进行图片搜索时,为搜索结果提供图片来源的情况,该装置由软件和/或硬件实现,并具体配置于电子设备中。
如图5所示的一种图片生成装置500,包括:目标视频筛选模块501、关键帧图片提取模块502、和目标图片确定模块503。其中,
目标视频筛选模块501,用于基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;
关键帧图片提取模块502,用于基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;
目标图片确定模块503,用于从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。
本申请实施例通过目标视频筛选模块基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;通过关键帧图片提取模块基于预设关键帧提取算法,提取目标视频中的关键帧图片;通过目标图片确定模块从关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。上述技术方案从满足设定类别条件的视频中提取优质图片,扩展了网页或应用程序中所展现图片的图片来源,并通过预设质量条件对所提取的图片进行筛选,从而使网页或应用程序中所展现图片的图片质量得到保证。另外,通过基于从目标视频所提取的关键帧图片进行目标图片的确定,建立了目标图片与目标视频之间的关联关系,从而将视频类别引申至图片类别,丰富了图片的多样性,增强了图片特色,同时能够迎合视频观看用户的观看需求,进而提升了图片的浏览量和下载量,达到图片引流的效果。
进一步地,所述预设关键帧提取算法包括:边缘变化率ECR算法。
进一步地,关键帧图片提取模块502,具体用于:
检测所述目标视频中各相邻帧图片的边缘像素;
根据各相邻帧图片的边缘像素,确定各相邻帧图片的边缘变化率;
基于所述边缘变化率从相邻帧图片中选取关键帧图片。
进一步地,目标视频筛选模块501,具体用于:
针对各待筛选视频,将所述待筛选视频中的至少一个帧图片输入所述多分类模型,获取所述多分类模型输出的各预测分值;
根据各预测分值确定所述待筛选视频的预测总分值;
根据所述预测总分值确定所述待筛选视频是否为满足设定分类条件的目标视频。
进一步地,该装置还包括,关键帧图片滤除模块,用于:
在基于预设关键帧提取算法,提取所述目标视频中的关键帧图片之后,在从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存之前,确定各所述关键帧图片的属性数据,根据所述属性数据确定各所述关键帧图片的质量是否满足预设条件,并滤除质量不满足预设条件的所述关键帧图片;
其中,所述属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。
进一步地,目标图片确定模块503,具体用于:
基于预先训练出的特征提取模型,获取所述关键帧图片在至少一个维度的中间特征数据;
通过对所述中间特征数据进行分析,确定所述关键帧图片在至少一个维度的目标特征数据;
根据所述目标特征数据确定所述关键帧图片对应的质量分值;
根据所述质量分值确定所述关键帧图片是否是满足预设质量条件的目标图片。
进一步地,所述中间特征数据包括:人脸特征、人体特征以及图片的属性数据中的至少一个;
所述目标特征数据包括:人脸姿态数据、人脸器官状态数据,人体占屏幕比例数据、以及人体部位占比数据中的至少一个。
进一步地,该装置还包括,图片推荐模块,用于:
当检测到用户对展现的当前图片的触发操作时,确定保存的目标图片中与所述当前图片的类别一致的待推荐图片;
根据各待推荐图片对应的质量分值对各待推荐图片进行排序,根据排序结果将待推荐图片推送给客户端进行展现。
进一步地,该装置还包括,质量分值更新模块,用于:
根据用户对展现的图片的点击率数据,更新所述图片的质量分值,以基于更新后的质量分值重新对待推荐图片进行排序。
上述图片生成装置可执行本申请任意实施例所提供的图片生成方法,具备执行图片生成方法相应的功能模块和有益效果。
实施例六
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是实现本申请实施例的图片生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图片生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图片生成方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图片生成方法对应的程序指令/模块(例如,附图5所示的目标视频筛选模块501、关键帧图片提取模块502、和目标图片确定模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图片生成方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据执行图片生成方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至执行图片生成方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
执行图片生成方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与执行图片生成方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;基于预设关键帧提取算法,提取目标视频中的关键帧图片;从关键帧图片中确定出满足预设质量条件的目标图片,并进行保存。上述技术方案从满足设定类别条件的视频中提取优质图片,扩展了网页或应用程序中所展现图片的图片来源,并通过预设质量条件对所提取的图片进行筛选,从而使网页或应用程序中所展现图片的图片质量得到保证。另外,基于从目标视频所提取的关键帧图片进行目标图片的确定,建立了目标图片与目标视频之间的关联关系,从而将视频类别引申至图片类别,丰富了图片的多样性,增强了图片特色,同时能够迎合视频观看用户的观看需求,进而提升了图片的浏览量和下载量,达到图片引流的效果。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (12)

1.一种图片生成方法,其特征在于,包括:
基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;
基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;
从所述关键帧图片中确定出满足预设质量条件的目标图片。
2.根据权利要求1所述的方法,其特征在于,所述预设关键帧提取算法包括:边缘变化率ECR算法。
3.根据权利要求2所述的方法,其特征在于,基于预设关键帧提取算法,提取所述目标视频中的关键帧图片,包括:
检测所述目标视频中各相邻帧图片的边缘像素;
根据各相邻帧图片的边缘像素,确定各相邻帧图片的边缘变化率;
基于所述边缘变化率从相邻帧图片中选取关键帧图片。
4.根据权利要求1所述的方法,其特征在于,基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频,包括:
针对各待筛选视频,将所述待筛选视频中的至少一个帧图片输入多分类模型,获取所述多分类模型输出的各预测分值;
根据各预测分值确定所述待筛选视频的预测总分值;
根据所述预测总分值确定所述待筛选视频是否为满足设定分类条件的目标视频。
5.根据权利要求1所述的方法,其特征在于,在基于预设关键帧提取算法,提取所述目标视频中的关键帧图片之后,在从所述关键帧图片中确定出满足预设质量条件的目标图片,并进行保存之前,所述方法还包括:
确定各所述关键帧图片的属性数据,根据所述属性数据确定各所述关键帧图片的质量是否满足预设条件,并滤除质量不满足预设条件的所述关键帧图片;
其中,所述属性数据包括:亮度、清晰度、以及色彩单一度中的至少一个。
6.根据权利要求1-5任一项所述的方法,其特征在于,从所述关键帧图片中确定出满足预设质量条件的目标图片,包括:
基于预先训练出的特征提取模型,获取所述关键帧图片在至少一个维度的中间特征数据;
通过对所述中间特征数据进行分析,确定所述关键帧图片在至少一个维度的目标特征数据;
根据所述目标特征数据确定所述关键帧图片对应的质量分值;
根据所述质量分值确定所述关键帧图片是否是满足预设质量条件的目标图片。
7.根据权利要求6所述的方法,其特征在于,所述中间特征数据包括:人脸特征、人体特征以及图片的属性数据中的至少一个;
所述目标特征数据包括:人脸姿态数据、人脸器官状态数据,人体占屏幕比例数据、以及人体部位占比数据中的至少一个。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当检测到用户对展现的当前图片的触发操作时,确定保存的目标图片中与所述当前图片的类别一致的待推荐图片;
根据各待推荐图片对应的质量分值对各待推荐图片进行排序,根据排序结果将待推荐图片推送给客户端进行展现。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
根据用户对展现的图片的点击率数据,更新所述图片的质量分值,以基于更新后的质量分值重新对待推荐图片进行排序。
10.一种图片生成装置,其特征在于,包括:
目标视频筛选模块,用于基于预先训练出的分类模型,从多个待筛选视频中筛选出满足设定分类条件的目标视频;
关键帧图片提取模块,用于基于预设关键帧提取算法,提取所述目标视频中的关键帧图片;
目标图片确定模块,用于从所述关键帧图片中确定出满足预设质量条件的目标图片。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-9中任一项所述的一种图片生成方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如权利要求1-9中任一项所述的一种图片生成方法。
CN201911365454.8A 2019-12-26 2019-12-26 一种图片生成方法、装置、设备及存储介质 Active CN111090778B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911365454.8A CN111090778B (zh) 2019-12-26 2019-12-26 一种图片生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911365454.8A CN111090778B (zh) 2019-12-26 2019-12-26 一种图片生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111090778A true CN111090778A (zh) 2020-05-01
CN111090778B CN111090778B (zh) 2023-06-27

Family

ID=70397379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911365454.8A Active CN111090778B (zh) 2019-12-26 2019-12-26 一种图片生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111090778B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783649A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 视频类型检测方法、装置、电子设备与存储介质
CN112860941A (zh) * 2021-02-04 2021-05-28 百果园技术(新加坡)有限公司 一种封面推荐方法、装置、设备及介质
CN113901263A (zh) * 2021-09-30 2022-01-07 宿迁硅基智能科技有限公司 一种视频素材的标签生成方法及装置
CN114026874A (zh) * 2020-10-27 2022-02-08 深圳市大疆创新科技有限公司 视频处理方法、装置、可移动设备及可读存储介质
CN114979728A (zh) * 2022-05-24 2022-08-30 东南大学 一种基于深度学习的联盟链场景下视频数据上链有害性审核方法
CN115966206A (zh) * 2022-11-23 2023-04-14 中创科技(广州)有限公司 Ai语音识别的智能图片生成方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930553A (zh) * 2011-08-10 2013-02-13 中国移动通信集团上海有限公司 不良视频内容识别方法及装置
CN103605991A (zh) * 2013-10-28 2014-02-26 复旦大学 一种视频广告的自动检测方法
CN104123709A (zh) * 2013-04-23 2014-10-29 中国科学院沈阳自动化研究所 一种基于字典选择的关键帧提取方法
CN106503693A (zh) * 2016-11-28 2017-03-15 北京字节跳动科技有限公司 视频封面的提供方法及装置
CN107977645A (zh) * 2017-12-19 2018-05-01 北京奇艺世纪科技有限公司 一种视频新闻海报图的生成方法及装置
CN108632641A (zh) * 2018-05-04 2018-10-09 百度在线网络技术(北京)有限公司 视频处理方法及装置
EP3543954A1 (en) * 2018-03-23 2019-09-25 Facit Data Systems Ltd Method of processing a video
CN110392306A (zh) * 2019-07-29 2019-10-29 腾讯科技(深圳)有限公司 一种数据处理方法以及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930553A (zh) * 2011-08-10 2013-02-13 中国移动通信集团上海有限公司 不良视频内容识别方法及装置
CN104123709A (zh) * 2013-04-23 2014-10-29 中国科学院沈阳自动化研究所 一种基于字典选择的关键帧提取方法
CN103605991A (zh) * 2013-10-28 2014-02-26 复旦大学 一种视频广告的自动检测方法
CN106503693A (zh) * 2016-11-28 2017-03-15 北京字节跳动科技有限公司 视频封面的提供方法及装置
CN107977645A (zh) * 2017-12-19 2018-05-01 北京奇艺世纪科技有限公司 一种视频新闻海报图的生成方法及装置
EP3543954A1 (en) * 2018-03-23 2019-09-25 Facit Data Systems Ltd Method of processing a video
CN108632641A (zh) * 2018-05-04 2018-10-09 百度在线网络技术(北京)有限公司 视频处理方法及装置
CN110392306A (zh) * 2019-07-29 2019-10-29 腾讯科技(深圳)有限公司 一种数据处理方法以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
柳雪: ""视频检索中基于多特征的关键帧提取算法研究"" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783649A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 视频类型检测方法、装置、电子设备与存储介质
CN111783649B (zh) * 2020-06-30 2024-01-23 北京百度网讯科技有限公司 视频类型检测方法、装置、电子设备与存储介质
CN114026874A (zh) * 2020-10-27 2022-02-08 深圳市大疆创新科技有限公司 视频处理方法、装置、可移动设备及可读存储介质
CN112860941A (zh) * 2021-02-04 2021-05-28 百果园技术(新加坡)有限公司 一种封面推荐方法、装置、设备及介质
CN113901263A (zh) * 2021-09-30 2022-01-07 宿迁硅基智能科技有限公司 一种视频素材的标签生成方法及装置
CN114979728A (zh) * 2022-05-24 2022-08-30 东南大学 一种基于深度学习的联盟链场景下视频数据上链有害性审核方法
CN114979728B (zh) * 2022-05-24 2024-04-02 东南大学 一种基于深度学习的联盟链场景下视频数据上链有害性审核方法
CN115966206A (zh) * 2022-11-23 2023-04-14 中创科技(广州)有限公司 Ai语音识别的智能图片生成方法、装置、设备及介质

Also Published As

Publication number Publication date
CN111090778B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN111090778B (zh) 一种图片生成方法、装置、设备及存储介质
CN110533097B (zh) 一种图像清晰度识别方法、装置、电子设备及存储介质
US10979761B2 (en) Intelligent video interaction method
US20110292051A1 (en) Automatic Avatar Creation
WO2020253127A1 (zh) 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质
CN111783647A (zh) 人脸融合模型的训练方法、人脸融合方法、装置及设备
CN110866563B (zh) 相似视频检测、推荐方法、电子设备和存储介质
Huang et al. RGB-D salient object detection by a CNN with multiple layers fusion
CN112487242A (zh) 用于识别视频的方法、装置、电子设备及可读存储介质
WO2019118236A1 (en) Deep learning on image frames to generate a summary
CN113766330A (zh) 基于视频生成推荐信息的方法和装置
CN111143613A (zh) 选择视频封面的方法、系统、电子设备与存储介质
CN111768377B (zh) 图像色彩评估方法、装置、电子设备及存储介质
CN114245155A (zh) 直播方法、装置及电子设备
CN111444819B (zh) 切割帧确定方法、网络训练方法、装置、设备及存储介质
CN110418163B (zh) 视频帧采样方法、装置、电子设备及存储介质
EP4360071A1 (en) Integrated system for detecting and correcting content
CN113507630B (zh) 比赛视频的拆条方法和装置
CN112561053B (zh) 图像处理方法、预训练模型的训练方法、装置和电子设备
CN116757923B (zh) 一种图像生成方法、装置、电子设备及存储介质
CN112269928A (zh) 用户推荐方法及装置、电子设备、计算机可读介质
CN111754492A (zh) 图像质量评估方法、装置、电子设备及存储介质
Suchecki et al. Understanding aesthetics in photography using deep convolutional neural networks
CN110738261A (zh) 图像分类和模型训练方法、装置、电子设备及存储介质
CN109948426A (zh) 应用程序调整方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant