CN114463673A - 素材推荐方法、装置、设备及存储介质 - Google Patents

素材推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114463673A
CN114463673A CN202111678972.2A CN202111678972A CN114463673A CN 114463673 A CN114463673 A CN 114463673A CN 202111678972 A CN202111678972 A CN 202111678972A CN 114463673 A CN114463673 A CN 114463673A
Authority
CN
China
Prior art keywords
style
quadrant
data
identification
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111678972.2A
Other languages
English (en)
Other versions
CN114463673B (zh
Inventor
金培银
刘杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donson Times Information Technology Co ltd
Original Assignee
Donson Times Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donson Times Information Technology Co ltd filed Critical Donson Times Information Technology Co ltd
Priority to CN202111678972.2A priority Critical patent/CN114463673B/zh
Publication of CN114463673A publication Critical patent/CN114463673A/zh
Application granted granted Critical
Publication of CN114463673B publication Critical patent/CN114463673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0276Advertisement creation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)

Abstract

本发明涉及数据处理技术领域,本发明公开了一种素材推荐方法、装置、设备及存储介质,所述方法包括:获取预设时间段内的多个在线素材的指标数据;对所有指标数据进行八象限划分及最优识别,得到最优象限数据;获取与最优象限数据对应的在线素材中的源素材,并对各源素材进行风格识别和剧情识别,得到各源素材的类型标签;对所有源素材的类型标签进行图谱聚类,得到预设时间段的素材推荐结果,因此,本发明实现了通过八象限划分和最优象限的识别,能够获取最优的源素材,并自动识别出源素材的风格和剧情的类型,自动匹配出素材推荐结果,提高素材推荐结果输出的准确性和可靠性。

Description

素材推荐方法、装置、设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种素材推荐方法、装置、设备及存储介质。
背景技术
目前,在现有的商业推广活动中,广告素材的投放起着十分重要的地位,投放的素材的好与坏直接影响到获客的好坏,然而,现有的广告素材大部分由负责处理广告事务的负责人设计素材风格,依赖个人的投放经验进行广告素材的设计,容易脱离主流风格或者风格突兀,导致素材风格不理想或者不主流,造成广告素材投放的效果不佳,回报率低,大大浪费了广告投放成本。
发明内容
本发明提供一种素材推荐方法、装置、计算机设备及存储介质,实现了自动匹配出素材推荐结果,无需人工统计及识别素材方向,提高素材推荐结果输出的准确性和可靠性。
一种素材推荐方法,包括:
获取预设时间段内的多个在线素材的指标数据;
对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;
获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;
对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果。
一种素材推荐装置,包括:
筛选单元,用于对所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据;
构建单元,用于根据所有所述有用数据,构建八象限空间;
划分单元,用于通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集;
确定单元,用于获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述素材推荐方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述素材推荐方法的步骤。
本发明提供的素材推荐方法、装置、计算机设备及存储介质,通过获取预设时间段内的多个在线素材的指标数据;对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果,因此,实现了通过八象限划分和最优象限的识别,能够获取最优的源素材,并自动识别出源素材的风格和剧情的类型,自动匹配出素材推荐结果,无需人工统计及识别素材方向,提高素材推荐结果输出的准确性和可靠性,为后续的广告投放效果提高了回报率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中素材推荐方法的应用环境示意图;
图2是本发明一实施例中素材推荐方法的流程图;
图3是本发明一实施例中素材推荐方法的步骤S20的流程图;
图4是本发明一实施例中素材推荐方法的步骤S30的流程图;
图5是本发明一实施例中素材推荐方法的步骤S40的流程图;
图6是本发明一实施例中素材推荐装置的原理框图;
图7是本发明一实施例中素材推荐装置的划分模块的原理框图;
图8是本发明一实施例中素材推荐装置的识别模块的原理框图;
图9是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的素材推荐方法,可应用在如图1的应用环境中,其中,客户端(计算机设备或终端)通过网络与服务器进行通信。其中,客户端(计算机设备或终端)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种素材推荐方法,其技术方案主要包括以下步骤S10-S40:
S10,获取预设时间段内的多个在线素材的指标数据。
可理解地,所述预设时间段可以根据需求设定,比如预设时间段为一个月或者半年等等,所述在线素材为线上已经展示或者投放过的广告素材,所述在线素材上线后会批量曝光、被点击/关注、被推荐等相关指标的统计,所述指标数据为关注的相关指标的统计数据,所述指标数据包括日常消耗指标、点击指标、转化指标,例如:批量曝光对应日常消耗指标,点击量对应点击指标,转化数对应转化指标,所述指标数据还可以包含其他关注的指标数据,比如被推荐转发量对应被推荐指标等,所述在线素材可以通过服务端获取。
S20,对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据。
可理解地,对获取的所有所述指标数据进行八象限划分以及最优识别,可得到所述最优象限数据,所述八象限划分为对所有所述指标数据进行筛选,筛选出关注的至多三个维度的有用数据,将筛选出的所有所述有用数据按照三个维度的空间轴构建出八象限空间的划分过程,所述有用数据为一个关注的维度的指标数据,所述指标数据包括多个维度的数据,所述最优识别为识别出落入构建的八象限空间中预设最优象限中的所有所述有用数据的识别过程,将经过最优识别获得的所有所述有用数据记录为所述最优象限数据。
在一实施例中,如图3所示,所述步骤S20中,即所述对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据,包括:
S201,对所有所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据。
可理解地,所述预设指标为根据需求设定,比如日常消耗指标、点击指标、转化指标,所述指标数据包括日常消耗指标和与日常消耗指标对应的日常消耗值、点击指标和与点击指标对应的点击值、转化指标和与转化指标对应的转换值,所述日常消耗值体现了在线素材的展示量或者曝光率,所述点击值体现了在线素材的点击量或者点击率,所述转化指标体现了在线素材的转化率,从所有所述指标数据中筛选出日常消耗指标、点击指标、转化指标等三个维度的指标数据,可以得到每个所述在线素材对应的日常消耗指标和与日常消耗指标对应的日常消耗值、点击指标和与点击指标对应的点击值、转化指标和与转化指标对应的转换值等有用数据。
S202,根据所有所述有用数据,构建八象限空间。
可理解地,构建八象限空间的过程为:以至少三个有用数据的维度作为坐标轴,比如日常消耗指标、点击指标、转化指标分别作为x轴、y轴、z轴,x轴、y轴和z轴相交的原点坐标取值(x0,y0,z0)可以为由所有日常消耗值的均值、所有点击值的均值和所有转化值的均值组成的坐标值,也可以为由日常消耗中位均值、点击中位均值和转化中位均值组成的坐标值,以原点坐标为中心向三维的x轴、y轴、z轴方向构建的过程,所述八象限空间为根据三维的x轴、y轴、z轴方向划分出八个三维空间,将大于x0,大于y0和大于z0围成的三维空间记录为第一象限,将小于x0,大于y0和大于z0围成的三维空间记录为第二象限,将小于x0,小于y0和大于z0围成的三维空间记录为第三象限,将大于x0,小于y0和大于z0围成的三维空间记录为第四象限,将大于x0,大于y0和小于z0围成的三维空间记录为第五象限,将小于x0,大于y0和小于z0围成的三维空间记录为第六象限,将小于x0,小于y0和小于z0围成的三维空间记录为第七象限,将大于x0,小于y0和小于z0围成的三维空间记录为第八象限,如此,将所有所述有用数据在构建的所述八象限空间中进行描点或者定位,得到基于所有所述有用数据的所述八象限空间。
其中,所述日常消耗中位均值的获取方式为:首先,对所有日常消耗值进行排序,对排序的所有所述日常消耗值取中位数;其次,获取与排序的所有所述日常消耗值取中位数相邻的两个日常消耗值;最后,对排序的所有所述日常消耗值取中位数和相应相邻的两个日常消耗值求平均值获得的方式,所述点击中位均值的获取方式为:首先,对所有点击值进行排序,对排序的所有所述点击值取中位数;其次,获取与排序的所有所述点击值取中位数相邻的两个点击值;最后,对排序的所有所述点击值取中位数和相应相邻的两个点击值求平均值获得的方式,所述转化中位均值的获取方式为:首先,对所有转化值进行排序,对排序的所有所述转化值取中位数;其次,获取与排序的所有所述转化值取中位数相邻的两个转化值;最后,对排序的所有所述转化值取中位数和相应相邻的两个转化值求平均值获得的方式,中位数又称中值,是按顺序排列的所有数据中居于中间位置的数,也可理解为所有数据的一半,将所有数据划分为相等的两部分,如果所有数据数为偶数时,将最中间的两个数作为中位数。
S203,通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集。
可理解地,在所述八象限空间中落入第一象限的所有所述有用数据记录为第一象限对应的数据集,在所述八象限空间中落入第二象限的所有所述有用数据记录为第二象限对应的数据集,在所述八象限空间中落入第三象限的所有所述有用数据记录为第三象限对应的数据集,在所述八象限空间中落入第四象限的所有所述有用数据记录为第四象限对应的数据集,在所述八象限空间中落入第五象限的所有所述有用数据记录为第五象限对应的数据集,在所述八象限空间中落入第六象限的所有所述有用数据记录为第六象限对应的数据集,在所述八象限空间中落入第七象限的所有所述有用数据记录为第七象限对应的数据集,在所述八象限空间中落入第八象限的所有所述有用数据记录为第八象限对应的数据集。
S204,获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据。
可理解地,所述预设最优象限为历史统计最优而设定的象限,比如预设最优象限为第一象限、第四象限、第五象限和第八象限,获取与第一象限对应的数据集、与第四象限对应的数据集、与第五象限对应的数据集和与第八象限对应的数据集,将获取的所有所述数据集确定为所述最优象限数据。
本发明实现了通过对所有所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据;根据所有所述有用数据,构建八象限空间;通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集;获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据,如此,实现了自动筛选有用数据,构建八象限空间,划分出各象限对应的数据集,并得出最优象限数据,无需人工划分最优象限数据,自动构建八象限空间获得最优象限数据,通过八象限空间能够快速定位各个有用数据的位置,提高了最优象限数据的效率,以及能够有效地提取出有用的数据,为后续的识别提供准确地数据基础。
S30,获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签。
可理解地,获取与所述最优象限数据对应的有用数据对应的所述在线素材,所述在线素材包含源素材,所述源素材为向用户展示的图像或者视频,对获取的所述在线素材中的所述源素材进行风格识别,识别出源素材的风格标签组,再根据所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到所述源素材的剧情标签结果,最后根据所述源素材的所述风格标签结果和所述剧情标签结果,确定出所述源素材的所述类型标签,所述类型标签体现了源素材的在风格和/或剧情上的类型。
在一实施例中,如图4所示,所述步骤S30中,即所述对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签,包括:
S301,对各所述源素材进行风格识别,得到各所述源素材的风格标签组。
可理解地,所述风格识别为对源素材进行自适应的格式类型的图像分割,并对图像分割后的图像进行风格特征提取,根据提取的风格特征确定出每个图像的风格,并汇总获得该源素材的风格标签组的过程,所述风格标签组体现了源素材中的图像或者视频所体现的风格类型的集合。
在一实施例中,所述步骤S301中,即所述对各所述源素材进行风格识别,得到各所述源素材的风格标签组,包括:
对各所述源素材进行图像分割,得到与各所述源素材关联的待识别图像。
可理解地,对所述源素材进行图像分割的过程为:首先,检测所述源素材的格式类型,即识别所述源素材的后缀名,根据后缀名确定出源素材的格式类型;其次,在检测到所述源素材的格式类型为视频时,对所述源素材进行分帧处理,所述分帧处理为对输入的视频的每一帧进行分割或者抽取出一帧图像的操作过程,得到一帧一帧的待处理图像,在检测到所述源素材的格式类型为图像时,将所述源素材记录为待处理图像;最后,对待处理图像进行自适应显著的图像分割,得到与待处理图像一一对应的待识别图像,所述自适应显著的图像分割为:第一,对待处理图像进行二值化处理,将超过阈值的像素点二值化成白色,将不超过阈值的像素点二值化成黑色,该阈值的取值可以为所述待处理图像所有像素点所对应的像素值的均值;第二,将待处理图像二值化后的各个像素值进行白色的像素点的像素尺寸放大,即扩大白色的像素点的尺寸至两倍或者三倍;第三,提取最大的白色像素区域,即对扩大后的白色的像素点围成的区域进行面积对比,对比出最大的白色像素区域,根据最大的白色像素区域,从待处理图像中进行最小矩形提取,即通过最小矩形包含白色像素区域的方式,获得相应的待识别图像的过程,所述待识别图像为源素材体现风格显著的图像,一个所述源素材关联至少一个所述待识别图像。
对各所述待识别图像进行风格特征提取,并根据提取的风格特征进行风格识别,识别出各所述待识别图像的风格识别结果。
可理解地,所述对各所述待识别图像进行风格特征提取,并根据提取的风格特征进行风格识别的过程可以通过训练完成的图像风格检测模型实现,所述图像风格检测模型的训练过程为通过历史收集的标有风格标签的样本进行识别,得到识别结果,再根据风格标签和识别结果之间的损失值,迭代更新图像风格检测模型的参数,直至损失值达到收敛的条件,停止训练,所述图像风格检测模型的网络结构可以根据需求设定,比如图像风格检测模型的网络结构为CNN的网络结构,或者为VGG16的网络结构,其风格识别过程为:首先,通过图像风格检测模型对所述待识别图像进行图像预处理,通过图像预处理可以将待识别图像中的线条的纹理特征进行增强,所述图像预处理为运用图像增强算法对所述待识别图像进行处理的过程,所述图像增强算法包括图像去燥、增加清晰度(对比度)、灰度化或者获取图像边缘特征或者对图像进行卷积、二值化、直方图均衡化、拉普拉斯变换和伽马变换等算法,从而得到预处理图像;其次,对所述预处理图像进行风格特征提取,所述风格特征提取可以为基于统计分布的参数化纹理特征提取方法,也可以为基于马尔科夫随机场的非参数化纹理特征提取方法,其中,所述基于统计分布的参数化纹理特征提取方法为通过统计学的方式对提取的纹理进行参数化向量体现的统计方法,所述基于马尔科夫随机场的非参数化纹理特征提取方法为运用马尔科夫网络提取纹理特征;最后,对提取的纹理特征进行分类,以及预测各素材风格的类别的概率分布,将超过预设阈值的素材风格的类别进行汇总,从而得到风格识别结果的过程,风格类型包括唯美、复古、现代、深沉等类别。
将与同一所述源素材关联的所述待识别图像的所述风格识别结果进行拼接,得到该源素材的所述风格标签组。
可理解地,将与相同的源素材关联的所有所述待识别图像所识别出的所述风格识别结果进行汇总,得到与该源素材的所述风格标签组。
本发明实现了通过对各所述源素材进行图像分割,得到与各所述源素材关联的待识别图像;对各所述待识别图像进行风格特征提取,并根据提取的风格特征进行风格识别,识别出各所述待识别图像的风格识别结果;将与同一所述源素材关联的所述待识别图像的所述风格识别结果进行拼接,得到该源素材的所述风格标签组,如此,能够运用自适应格式类型的图像分割和风格特征提取,自动识别出源素材的风格标签组,无需人工识别,提高了风格标签组输出的准确性。
S302,对各所述源素材的风格标签组进行聚类,得到各所述源素材的风格标签结果。
可理解地,针对每一个所述源素材的所述风格标签组,对所述源素材的风格标签组进行聚类的处理,所述聚类的处理的过程可以根据需求设定,比如聚类的处理过程可以为运用K-means算法对所述风格标签组进行K个风格类型的寻找,聚类的处理还可以为去重的处理;最后,将寻找出的K个风格类型和去重后的风格类型确定为该源素材的风格标签结果。
S303,根据各所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到各所述源素材的剧情标签结果。
可理解地,所述剧情识别的过程可以通过训练完成的剧情识别模型实现,剧情识别模型的训练过程输入训练的含有剧情标签的样本数组,所述样本数组为历史的视频经过风格识别后输出的数组,通过含有初始参数的该模型对样本数组进行剧情特征的提取,并根据提取的剧情特征进行分类,分类出体现剧情的样本识别结果,计算该样本识别结果和该样本数组关联的剧情标签之间的损失值,根据损失值迭代更新该剧情识别模型的初始参数,直至损失值达到收敛条件,其中,收敛条件可以为损失值不再变化或者迭代次数达到预设次数,停止训练,将收敛之后的剧情识别模型记录为训练完成的剧情识别模型,所述剧情特征为通过风格类型的时序性体现的剧情风格的特征,通过训练完成的剧情识别模型对输入的风格标签组进行剧情特征的提取,并根据提取的剧情特征进行分类,分类出体现剧情风格类型的剧情标签结果,所述剧情标签结果体现了源素材的剧情风格类型的结果。
其中,所述剧情识别的过程还可以为:首先,对所述源素材的所述风格标签组进行向量转换,即将所述风格标签组中每个风格类型进行数值转换,将相同的风格类型映射成一个相同的数值,并将转换后的数值进行拼接,得到该风格标签组所对应的标签组向量;其次,从历史库中获取历史的在线素材经风格识别及数值转换后的历史标签组向量;最后,运用余弦相似度算法,计算获得的标签组向量与各历史标签组向量的相似度,查找出最大的相似度所对应的历史标签组向量对应的历史的在线素材,将查找出的历史的在线素材所对应的剧情风格类型确定为该源素材的剧情标签结果的过程。
S304,根据各所述源素材的所述风格标签结果和所述剧情标签结果,得到各所述源素材的所述类型标签。
可理解地,将所述源素材的所述风格标签结果和所述剧情标签结果确定为该源素材的所述类型标签,所述类型标签体现了风格类型和剧情风格类型两个维度的标签集合。
本发明实现了通过对各所述源素材进行风格识别,得到各所述源素材的风格标签组;对各所述源素材的风格标签组进行聚类,得到各所述源素材的风格标签结果;根据各所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到各所述源素材的剧情标签结果;根据各所述源素材的所述风格标签结果和所述剧情标签结果,得到各所述源素材的所述类型标签,如此,通过风格识别、聚类识别出风格标签结果,再通过剧情识别,自动识别出剧情标签结果,结合风格标签结果和剧情标签结果,自动输出类型标签,通过多维度的标签结合,最终得到类型标签,提高了素材推荐的准确性和可靠性。
S40,对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果。
可理解地,所述图谱聚类的过程为:对所有所述类型标签进行图谱节点构建,构建各所述类型标签的节点;对各所述节点进行概念跨级,得到跨级节点;对所有所述跨级节点进行聚类处理,得到所述素材推荐结果的过程,所述素材推荐结果为在大量的在线素材中当前风格类型的主流或者最有效推广的结果,通过所述素材推荐结果能够为后续的素材设计提供方向,提高后续广告设计的素材的有效性和准确性,节省了不理想的风格类型的素材带来的成本浪费。
本发明实现了通过获取预设时间段内的多个在线素材的指标数据;对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果,因此,实现了通过八象限划分和最优象限的识别,能够获取最优的源素材,并自动识别出源素材的风格和剧情的类型,自动匹配出素材推荐结果,无需人工统计及识别素材方向,提高素材推荐结果输出的准确性和可靠性,为后续的广告投放效果提高了回报率。
在一实施例中,如图5所示,所述步骤S40中,即所述对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果,包括:
S401,对所有所述类型标签进行图谱节点构建,构建各所述类型标签的节点。
可理解地,所述图谱节点构建过程:为将各个所述类型标签作为一个图谱节点,该图谱节点下关联与其包含的风格类型和剧情风格类型,每一个风格类型作为该图谱的节点的子节点,每一个剧情风格类型作为该图谱节点的子节点,如此,能够将一个图谱的节点为中心,网状关联各个风格类型和剧情风格类型,每个子节点的边长可以为预设边长,也可以为累计的风格类型的个数的对数值,以及累计的剧情风格类型的个数的对数值,所述风格标签结果还包括各风格类型所累计出现的个数,所述剧情标签结果还包括各剧情风格类型所累计出现的个数,从而构建出图谱,及图谱下的节点。
S402,对各所述节点进行概念跨级,得到跨级节点。
可理解地,对每个所述节点进行概念跨级,得到与各个所述节点对应的所述跨级节点,所述概念跨级为将各个节点下的剧情风格类型进行风格类型的概念转换,将剧情风格类型分解成一个或者多个风格类型,将与剧情风格类型的概念相似或者相近的风格类型转换成子节点,其中,所述相似或者相近的风格类型转换的过程为:对一个子节点的剧情风格类型与各风格类型进行文本匹配,获得该剧情风格类型与各风格类型一一对应的相似度,通过相似度与相似度阈值相比,将大于或者相似度阈值的风格类型确定为转换后的风格类型的过程,所述文本匹配的过程为将剧情风格类型进行词向量转换,分别与各个风格类型所对应的词向量转换进行余弦相似度算法的计算,得到相应的相似度,所述余弦相似度算法为计算两个文本向量的余弦值作为两个文本的相似度的算法,在将剧情风格类型的子节点转换后的风格类型的子节点之后,将此时的图谱节点确定为跨级节点,将概念跨级转换后的图谱的所有节点记录为跨级节点。
S403,对所有所述跨级节点进行聚类处理,得到所述素材推荐结果。
可理解地,对所有所述跨级节点进行聚类处理,所述聚类处理为图聚类的处理过程,即将每个跨级节点、每个子节点以及每个子节点的边长进行关系图谱的聚类处理过程,即将相同或者存在关系的子节点在图谱中体现,将跨级节点之间的关联关系体现,根据关联关系及边长的联系进行聚类,即对各风格类型、存在关联的风格类型和边长进行聚类,对各风格类型进行评分,获取其评分最高的风格类型,将该风格类型记录为所述素材推荐结果。
本发明实现了通过对所有所述类型标签进行图谱节点构建,构建各所述类型标签的节点;对各所述节点进行概念跨级,得到跨级节点;对所有所述跨级节点进行聚类处理,得到所述素材推荐结果,如此,实现了通过图谱节点构建和概念跨级,自动识别出素材推荐结果,无需人工识别,提高了素材推荐的准确性和可靠性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种素材推荐装置,该素材推荐装置与上述实施例中素材推荐方法一一对应。如图6所示,该素材推荐装置包括获取模块11、划分模块12、识别模块13和聚类模块14。各功能模块详细说明如下:
获取模块11,用于获取预设时间段内的多个在线素材的指标数据;
划分模块12,用于对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;
识别模块13,用于获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;
聚类模块14,用于对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果。
在一实施例中,如图7所示,所述划分模块12包括:
筛选单元21,用于对所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据;
构建单元22,用于根据所有所述有用数据,构建八象限空间;
划分单元23,用于通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集;
确定单元24,用于获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据。
在一实施例中,如图8所示,所述识别模块13包括:
风格识别单元31,用于对各所述源素材进行风格识别,得到各所述源素材的风格标签组;
聚类单元32,用于对各所述源素材的风格标签组进行聚类,得到各所述源素材的风格标签结果;
剧情识别单元33,用于根据各所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到各所述源素材的剧情标签结果;
输出单元34,用于根据各所述源素材的所述风格标签结果和所述剧情标签结果,得到各所述源素材的所述类型标签。
关于素材推荐装置的具体限定可以参见上文中对于素材推荐方法的限定,在此不再赘述。上述素材推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端或者服务端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种素材推荐方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中素材推荐方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中素材推荐方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种素材推荐方法,其特征在于,包括:
获取预设时间段内的多个在线素材的指标数据;
对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;
获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;
对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果。
2.如权利要求1所述的素材推荐方法,其特征在于,所述对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据,包括:
对所有所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据;
根据所有所述有用数据,构建八象限空间;
通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集;
获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据。
3.如权利要求1所述的素材推荐方法,其特征在于,所述对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签,包括:
对各所述源素材进行风格识别,得到各所述源素材的风格标签组;
对各所述源素材的风格标签组进行聚类,得到各所述源素材的风格标签结果;
根据各所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到各所述源素材的剧情标签结果;
根据各所述源素材的所述风格标签结果和所述剧情标签结果,得到各所述源素材的所述类型标签。
4.如权利要求3所述的素材推荐方法,其特征在于,所述对各所述源素材进行风格识别,得到各所述源素材的风格标签组,包括:
对各所述源素材进行图像分割,得到与各所述源素材关联的待识别图像;
对各所述待识别图像进行风格特征提取,并根据提取的风格特征进行风格识别,识别出各所述待识别图像的风格识别结果;
将与同一所述源素材关联的所述待识别图像的所述风格识别结果进行拼接,得到该源素材的所述风格标签组。
5.如权利要求1所述的素材推荐方法,其特征在于,所述对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果,包括:
对所有所述类型标签进行图谱节点构建,构建各所述类型标签的节点;
对各所述节点进行概念跨级,得到跨级节点;
对所有所述跨级节点进行聚类处理,得到所述素材推荐结果。
6.一种素材推荐装置,其特征在于,包括:
获取模块,用于获取预设时间段内的多个在线素材的指标数据;
划分模块,用于对所有所述指标数据进行八象限划分及最优识别,得到最优象限数据;
识别模块,用于获取与所述最优象限数据对应的所述在线素材中的源素材,并对各所述源素材进行风格识别和剧情识别,得到各所述源素材的类型标签;
聚类模块,用于对所有所述源素材的类型标签进行图谱聚类,得到所述预设时间段的素材推荐结果。
7.如权利要求6所述的素材推荐装置,其特征在于,所述划分模块包括:
筛选单元,用于对所述指标数据进行基于预设指标的筛选,筛选出各在线素材的至多三个有用数据;
构建单元,用于根据所有所述有用数据,构建八象限空间;
划分单元,用于通过所述八象限空间,对所有所述有用数据划分出各象限所对应的数据集;
确定单元,用于获取与预设最优象限相同的象限所对应的所述数据集,将其记录为所述最优象限数据。
8.如权利要求6所述的素材推荐装置,其特征在于,所述识别模块包括:
风格识别单元,用于对各所述源素材进行风格识别,得到各所述源素材的风格标签组;
聚类单元,用于对各所述源素材的风格标签组进行聚类,得到各所述源素材的风格标签结果;
剧情识别单元,用于根据各所述源素材的所述风格标签组,对各所述源素材进行剧情识别,得到各所述源素材的剧情标签结果;
输出单元,用于根据各所述源素材的所述风格标签结果和所述剧情标签结果,得到各所述源素材的所述类型标签。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述素材推荐方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述素材推荐方法。
CN202111678972.2A 2021-12-31 2021-12-31 素材推荐方法、装置、设备及存储介质 Active CN114463673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111678972.2A CN114463673B (zh) 2021-12-31 2021-12-31 素材推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111678972.2A CN114463673B (zh) 2021-12-31 2021-12-31 素材推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114463673A true CN114463673A (zh) 2022-05-10
CN114463673B CN114463673B (zh) 2023-04-07

Family

ID=81408471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111678972.2A Active CN114463673B (zh) 2021-12-31 2021-12-31 素材推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114463673B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340991A (zh) * 2023-02-02 2023-06-27 魔萌动漫文化传播(深圳)有限公司 Ip图库素材资源的大数据管理方法、装置以及电子设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014207527A (ja) * 2013-04-11 2014-10-30 キヤノン株式会社 映像生成装置及びその制御方法
CN104765025A (zh) * 2015-03-31 2015-07-08 浙江大学 一种车载雷达数据的处理方法和处理系统
CN107454346A (zh) * 2017-07-03 2017-12-08 李洪海 影视数据解析方法、视频制作模板推荐方法、装置及设备
CN109409928A (zh) * 2018-09-14 2019-03-01 上海晶赞融宣科技有限公司 一种素材推荐方法、装置、存储介质、终端
CN110766470A (zh) * 2019-10-28 2020-02-07 晓推(武汉)信息科技有限公司 广告账户投放数据的设置方法、装置、设备和存储介质
CN110880120A (zh) * 2018-09-06 2020-03-13 阿里巴巴集团控股有限公司 一种广告方法和广告系统以及识别装置
CN111125495A (zh) * 2019-12-19 2020-05-08 京东方科技集团股份有限公司 一种信息推荐方法、设备及存储介质
CN111787395A (zh) * 2020-05-27 2020-10-16 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN112348566A (zh) * 2020-10-15 2021-02-09 北京捷通华声科技股份有限公司 推荐广告的确定方法、装置及存储介质
CN112565825A (zh) * 2020-12-02 2021-03-26 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
WO2021104242A1 (zh) * 2019-11-26 2021-06-03 Oppo广东移动通信有限公司 视频处理方法、电子装置和存储介质
CN113204320A (zh) * 2021-04-30 2021-08-03 北京有竹居网络技术有限公司 信息显示方法及设备
CN113518256A (zh) * 2021-07-23 2021-10-19 腾讯科技(深圳)有限公司 视频处理方法、装置、电子设备及计算机可读存储介质
CN113743982A (zh) * 2021-08-05 2021-12-03 深圳市东信时代信息技术有限公司 广告投放方案推荐方法、装置、计算机设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014207527A (ja) * 2013-04-11 2014-10-30 キヤノン株式会社 映像生成装置及びその制御方法
CN104765025A (zh) * 2015-03-31 2015-07-08 浙江大学 一种车载雷达数据的处理方法和处理系统
CN107454346A (zh) * 2017-07-03 2017-12-08 李洪海 影视数据解析方法、视频制作模板推荐方法、装置及设备
CN110880120A (zh) * 2018-09-06 2020-03-13 阿里巴巴集团控股有限公司 一种广告方法和广告系统以及识别装置
CN109409928A (zh) * 2018-09-14 2019-03-01 上海晶赞融宣科技有限公司 一种素材推荐方法、装置、存储介质、终端
CN110766470A (zh) * 2019-10-28 2020-02-07 晓推(武汉)信息科技有限公司 广告账户投放数据的设置方法、装置、设备和存储介质
WO2021104242A1 (zh) * 2019-11-26 2021-06-03 Oppo广东移动通信有限公司 视频处理方法、电子装置和存储介质
CN111125495A (zh) * 2019-12-19 2020-05-08 京东方科技集团股份有限公司 一种信息推荐方法、设备及存储介质
CN111787395A (zh) * 2020-05-27 2020-10-16 北京达佳互联信息技术有限公司 视频生成方法、装置、电子设备及存储介质
CN112348566A (zh) * 2020-10-15 2021-02-09 北京捷通华声科技股份有限公司 推荐广告的确定方法、装置及存储介质
CN112565825A (zh) * 2020-12-02 2021-03-26 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN113204320A (zh) * 2021-04-30 2021-08-03 北京有竹居网络技术有限公司 信息显示方法及设备
CN113518256A (zh) * 2021-07-23 2021-10-19 腾讯科技(深圳)有限公司 视频处理方法、装置、电子设备及计算机可读存储介质
CN113743982A (zh) * 2021-08-05 2021-12-03 深圳市东信时代信息技术有限公司 广告投放方案推荐方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHAN LIU ET AL.: "Soundtrack Matching and Recommendation System of Film and TV Series", 《2020 13TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING, BIOMEDICAL ENGINEERING AND INFORMATICS》 *
王灿华: "基于改进坝美林时钟分析框架的理财产品设汁方案与启示", 《债券》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116340991A (zh) * 2023-02-02 2023-06-27 魔萌动漫文化传播(深圳)有限公司 Ip图库素材资源的大数据管理方法、装置以及电子设备
CN116340991B (zh) * 2023-02-02 2023-11-07 魔萌动漫文化传播(深圳)有限公司 Ip图库素材资源的大数据管理方法、装置以及电子设备

Also Published As

Publication number Publication date
CN114463673B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN107944020B (zh) 人脸图像查找方法及装置、计算机装置和存储介质
CN110555372A (zh) 数据录入方法、装置、设备及存储介质
CN108805076B (zh) 环境影响评估报告书表格文字的提取方法及系统
CN112395500B (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN112926654B (zh) 预标注模型训练、证件预标注方法、装置、设备及介质
CN102708360A (zh) 一种指纹模板生成及自动更新的方法
CN110516712B (zh) 虫害图像识别方法、虫害监控方法、装置、设备及介质
CN112419202B (zh) 基于大数据及深度学习的野生动物图像自动识别系统
CN113204660B (zh) 多媒体数据处理方法、标签识别方法、装置及电子设备
CN112257801B (zh) 图像的增量聚类方法、装置、电子设备及存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN112528022A (zh) 主题类别对应的特征词提取和文本主题类别识别方法
CN111209929A (zh) 访问数据处理方法、装置、计算机设备及存储介质
CN111783681A (zh) 大规模人脸库识别方法、系统、计算机设备及存储介质
CN115115825B (zh) 图像中的对象检测方法、装置、计算机设备和存储介质
CN113963303A (zh) 图像处理方法、视频识别方法、装置、设备及存储介质
CN114463673B (zh) 素材推荐方法、装置、设备及存储介质
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
CN114359787A (zh) 目标属性识别方法、装置、计算机设备及存储介质
CN114201652A (zh) 一种基于标签分级的资讯召回排序方法、装置和设备
CN111382638A (zh) 一种图像检测方法、装置、设备和存储介质
CN113704534A (zh) 图像处理方法、装置及计算机设备
CN112069269A (zh) 基于大数据和多维特征的数据溯源方法及大数据云服务器
CN116433653A (zh) 一种基于机器视觉的产品生产管理方法及系统
CN111191706A (zh) 图片识别的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant