CN115689616A - 基于大数据特征分析的云端内容推送方法及系统 - Google Patents
基于大数据特征分析的云端内容推送方法及系统 Download PDFInfo
- Publication number
- CN115689616A CN115689616A CN202211638565.3A CN202211638565A CN115689616A CN 115689616 A CN115689616 A CN 115689616A CN 202211638565 A CN202211638565 A CN 202211638565A CN 115689616 A CN115689616 A CN 115689616A
- Authority
- CN
- China
- Prior art keywords
- content
- cloud
- cloud content
- target
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004458 analytical method Methods 0.000 title claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 404
- 238000012549 training Methods 0.000 claims description 12
- 238000013461 design Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 9
- 230000006399 behavior Effects 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 2
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种基于大数据特征分析的云端内容推送方法及系统,包括:首先在接收到指定云端平台的用户预设触发操作后,获取用户预设触发操作对应的操作特征;然后基于预先构建的大数据行为分析模型,获取操作特征对应的需求云端内容;进而获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据目标业务特征向量和目标内容特征向量得到与需求云端内容匹配的目标云端内容序列;最终生成指向目标云端内容序列的推送链接,并显示至预设界面位置,如此设计,利用了大数据行为分析模型确定出需求云端内容,在结合需求云端内容的目标业务特征向量和目标内容特征向量进行目标云端内容序列的获取,以实现精确地云端内容推送。
Description
技术领域
本发明涉及内容推送领域,具体而言,涉及一种基于大数据特征分析的云端内容推送方法及系统。
背景技术
目前,随着网络化的普及,网络云端内容的推送既能够给商家带来利润,又能够方便用户进行对应需求的获取。在现有技术中,一般会采取用户最近搜索或者浏览过的内容的语义信息进行相似内容推荐,而随着用户所用场景的增多以及各个场景下云端内容的丰富化、复杂化,仅凭单一的语义信息进行内容推送并不精确,已经无法满足用户和商家的需求。
发明内容
本发明的目的在于提供一种基于大数据特征分析的云端内容推送方法及系统。
第一方面,本发明实施例提供一种基于大数据特征分析的云端内容推送方法,包括:
在接收到指定云端平台的用户预设触发操作后,获取用户预设触发操作对应的操作特征;
基于预先构建的大数据行为分析模型,获取操作特征对应的需求云端内容;
获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据目标业务特征向量和目标内容特征向量得到与需求云端内容匹配的目标云端内容序列;
基于目标云端内容序列,生成指向目标云端内容序列的推送链接;
按照预设推送周期将推送链接显示至预设界面位置。
在一种可能的实施方式中,获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据目标业务特征向量和目标内容特征向量得到与需求云端内容匹配的目标云端内容序列,包括:
将需求云端内容输入预选完成训练的业务特征识别网络,获得目标业务特征向量;业务特征识别网络根据样本云端内容集合完成训练,样本云端内容集合中的每个样本云端内容对包括初始云端内容、与初始云端内容接近的云端内容、与初始云端内容不接近的云端内容;
将需求云端内容输入预选完成训练的内容特征识别网络,获得目标内容特征向量;内容特征识别网络根据配置了用户画像类型的样本云端内容集合完成训练;
从云端内容池中的多个业务特征向量标识中,选择多个业务比对标识;每个业务特征向量标识为相关的多个业务特征向量的向量类别中心,多个业务比对标识各自与目标业务特征向量的业务关联度不小于第一预置关联度系数;
获取多个业务比对标识各自相关的多个业务特征向量;
根据获取的各个业务特征向量匹配的云端内容,以及多个业务比对标识匹配的云端内容,生成第一云端内容序列;第一云端内容序列包含的各个云端内容分别对应的业务特征向量,与目标业务特征向量的业务关联度达到第一预置标准;
从第一云端内容序列中选择多个待处理云端内容;多个待处理云端内容分别对应的内容特征向量,与目标内容特征向量的内容关联度达到第二预置标准;
基于多个待处理云端内容,从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待处理云端内容的内容特征向量的内容关联度,不小于第二预置关联度系数;
获取多个内容对比标识各自相关的多个内容特征向量;
根据获取的各个内容特征向量匹配的云端内容,以及多个内容对比标识匹配的云端内容,生成相应的第二云端内容序列;每个第二云端内容序列包含的各个云端内容,与相应待处理云端内容的内容特征向量之间的内容关联度达到第三预置标准;
根据获取的多个第二云端内容序列以及第一云端内容序列,确定匹配的目标云端内容序列。
在一种可能的实施方式中,根据获取的多个第二云端内容序列以及第一云端内容序列,确定匹配的目标云端内容序列,包括:
基于多个第二云端内容序列以及第一云端内容序列包含的各个云端内容,根据各个云端内容分别对应的业务特征向量与目标业务特征向量的业务关联度,以及各个云端内容分别对应的内容特征向量与目标内容特征向量的内容关联度,将各个云端内容进行整理;
从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列。
在一种可能的实施方式中,方法还包括:
获取需求云端内容的目标用户画像向量,目标用户画像向量用于表征需求云端内容所包含的用户画像类型;
获取第三云端内容序列;第三云端内容序列包含的各个云端内容分别对应的用户画像向量与目标用户画像向量相同;
根据第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度达到第五预置标准;
根据获取的多个第二云端内容序列以及第一云端内容序列,确定匹配的目标云端内容序列,包括:
根据第一云端内容序列、多个第二云端内容序列、第三云端内容序列以及多个第四云端内容序列,确定匹配的目标云端内容序列。
在一种可能的实施方式中,获取第三云端内容序列,包括:
从云端内容池中的多个用户画像类型标识中,选择与目标用户画像向量匹配的至少一个用户画像类型标识;每个用户画像类型标识与多个包含相应用户画像类型的云端内容存在关联;
获取选择的至少一个用户画像类型标识各自相关的多个云端内容,并根据获取的各个云端内容,生成第三云端内容序列。
在一种可能的实施方式中,根据第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,包括:
从第三云端内容序列中选择多个待定云端内容,并将需求云端内容作为一个待定云端内容;其中,多个待定云端内容分别对应的内容特征向量,与目标内容特征向量的内容关联度,不小于第三预置关联度系数;
分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度,不小于第四预置关联度系数。
在一种可能的实施方式中,分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,包括:
基于多个待定云端内容分别对应的内容特征向量,从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待定云端内容的内容特征向量的内容关联度,不小于第四预置关联度系数;
获取多个内容对比标识各自相关的多个内容特征向量;
根据获取的各个内容特征向量匹配的云端内容,以及多个内容对比标识匹配的云端内容,生成相应的第四云端内容序列。
在一种可能的实施方式中,获取需求云端内容的目标内容特征向量,包括:
将需求云端内容输入预选完成训练的内容特征识别网络,获得目标内容特征向量;
其中,内容特征识别网络至根据配置了用户画像类型的样本云端内容集合完成训练,样本云端内容集合中的每个样本云端内容对包括初始云端内容、与初始云端内容接近的云端内容、与初始云端内容不接近的云端内容;
获取需求云端内容的目标用户画像向量,包括:
将需求云端内容输入预选完成训练的内容特征识别网络,获得预测的目标用户画像向量。
在一种可能的实施方式中,根据第一云端内容序列、多个第二云端内容序列、第三云端内容序列以及多个第四云端内容序列,确定匹配的目标云端内容序列,包括:
基于第一云端内容序列、多个第二云端内容序列、第三云端内容序列以及多个第四云端内容序列包含的各个云端内容,根据各个云端内容分别对应的业务特征向量与目标业务特征向量的业务关联度,各个云端内容分别对应的内容特征向量与目标内容特征向量的内容关联度,以及各个云端内容分别对应的用户画像向量的优先等级,将各个云端内容进行整理;
从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列;
各个云端内容分别对应的用户画像向量的优先等级,通过如下方式获得:
确定目标用户画像向量中包含的至少一个用户画像类型,并获取至少一个用户画像类型分别对应的第一归属权重;
基于各个云端内容,
根据一个云端内容的用户画像向量中,至少一个用户画像类型分别对应的第二归属权重,以及至少一个用户画像类型分别对应的第一归属权重,确定一个云端内容的用户画像向量的优先等级。
第二方面,本发明实施例提供一种云服务器系统,包括服务器;服务器用于执行第一方面至少一种可能的实施方式中的方法。
相比现有技术,本发明提供的有益效果包括:采用本发明公开的一种基于大数据特征分析的云端内容推送方法及系统,通过在接收到指定云端平台的用户预设触发操作后,获取用户预设触发操作对应的操作特征;然后基于预先构建的大数据行为分析模型,获取操作特征对应的需求云端内容;进而获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据目标业务特征向量和目标内容特征向量得到与需求云端内容匹配的目标云端内容序列;最终生成指向目标云端内容序列的推送链接,并显示至预设界面位置,如此设计,利用了大数据行为分析模型确定出需求云端内容,在结合需求云端内容的目标业务特征向量和目标内容特征向量进行目标云端内容序列的获取,能够进行精确地云端内容推送。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的基于大数据特征分析的云端内容推送方法的步骤流程示意图;
图2为本发明实施例提供的用于执行图1中基于大数据特征分析的云端内容推送方法的计算机设备的结构示意框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
请结合参阅图1,图1为本申请实施例提供的一种基于大数据特征分析的云端内容推送方法的实施流程图,该方法的具体实施流程如下:
S201,在接收到指定云端平台的用户预设触发操作后,获取用户预设触发操作对应的操作特征。
S202,基于预先构建的大数据行为分析模型,获取操作特征对应的需求云端内容。
S203,获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据目标业务特征向量和目标内容特征向量得到与需求云端内容匹配的目标云端内容序列。
S204,基于目标云端内容序列,生成指向目标云端内容序列的推送链接。
S205,按照预设推送周期将推送链接显示至预设界面位置。
在本发明实施例中,指定云端平台可以是指购物平台、也可以是指社交平台在此不做限制,相应的,例如在购物平台场景下,用户预设触发操作可以是点击、浏览、购买、收藏、加入购物车等操作,在社交平台上则可以是点击、转发、评论等操作,在此不做限制。对用户的用户预设触发操作进行特征提取,得到对应的操作特征,及行为特征,将其输入至预先构建的大数据行为分析模型,便能够得到用户在该行为下需求的云端内容,例如,在购物平台场景下,对应输出的需求云端内容则可以为商品,而在社交平台场景下,输出的云端内容则可以为文章,在此不做限制。为了能够在各个场景下针对性的为用户进行云端内容推送,可以先获取需求云端内容的目标业务特征向量和目标内容特征向量,其中,业务特征向量可以理解为云端内容的基础属性关联参数,而内容特征向量可以理解为云端内容的文字描述关联参数,通过对端内容的目标业务特征向量和目标内容特征向量进行处理,能得到包括多个云端内容的目标云端内容序列,该目标云端内容序列中的内容就是具备针对性推送的内容。可以基于该目标云端内容序列,生成能够指向目标云端内容序列的推送链接,应当理解的是,在本发明实施例中,推送链接可以是以在用户终端上的“弹窗”、“通知”等形式展示,在此不做限定。最终可以按照预设推送周期将推送链接显示至预设界面位置,例如,预设推送周期可以设定为在用户预设触发操作发生后的5分钟内,又或者每隔1小时进行推送,在此不做限制。
为了能够更加清楚的描述本申请实施例提供的方案,前述步骤S203可以通过以下详细的实施方式实施实现。
S101,获取需求云端内容的目标业务特征向量和目标内容特征向量。
其中,服务器可以接收用户的终端设备发送的需求云端内容,然后提取需求云端内容的目标业务特征向量以及目标内容特征向量。可选地,可以根据上述业务特征识别网络以及内容特征识别网络,分别提取需求云端内容的目标业务特征向量以及目标内容特征向量,具体实施步骤如下:
A1、将需求云端内容输入预选完成训练的业务特征识别网络,获得目标业务特征向量。
由本申请本发明实施例可知,业务特征识别网络是根据样本云端内容集合完成训练,样本云端内容集合中的每个样本云端内容对包括初始云端内容、与初始云端内容接近的云端内容、与初始云端内容不接近的云端内容,该模型的具体结构以及训练过程参见本发明实施例,在此不再赘述。
根据业务特征识别网络提取的目标业务特征向量,用于计算需求云端内容与其他云端内容之间的相似度,可以理解为本发明实施例中的相似度embedding。
A2、将需求云端内容输入预选完成训练的内容特征识别网络,获得目标内容特征向量。
由本申请本发明实施例可知,内容特征识别网络根据配置了多标签的样本云端内容集合完成训练,其中,多标签可以理解为多个用户画像类型,该模型的具体结构以及训练过程参见本发明实施例,在此不再赘述。
可选地,内容特征识别网络包括卷积神经网络模块、深度度量学习模块,将需求云端内容输入内容特征识别网络的卷积神经网络模块,然后将输出结果输入深度度量学习模块,输出目标内容特征向量,可以理解为本发明实施例中的内容embedding。
为了能够更加清楚的描述本申请实施例提供的方案,下面对内容特征识别网络、业务特征识别网络进行介绍。
本申请实施例中,内容特征识别网络可以包括以下几个模块:卷积神经网络模块、深度度量学习模块、类别预测模块。
可选地,卷积神经网络模块可以采用深度残差网络(Deep residual network,ResNet),ResNet具体可以是ResNet 101;深度度量学习模块可以包括最大池化层和全连接层,;类别预测模块为分类模块,可以包括全连接层。
需要说明的是,上述各个模块的具体结构只是示例性的,还可以根据需要选择其他模型结构,例如,卷积神经网络模块还可以采用resnet50、inceptionv4、resnet等,在此不作限定。
业务特征识别网络可以包括卷积神经网络模块和深度度量学习模块,这两个模块的结构可以与内容特征识别网络相同。
该模型学习时采用上述样本云端内容对集。在损失计算时,仅需要计算样本云端内容对损失,该模型的学习方法与上述内容特征识别网络一致,在此不再赘述。
根据样本云端内容对集训练后的业务特征识别网络,可以提取云端内容的相似度embedding,可以理解为云端内容的业务特征向量。
在介绍完上述模型后,下面对根据上述模型构建的云端内容池的推送系统进行介绍。
在本发明实施例中,云端内容池的推送系统的构建过程包括:
1)基于云端内容池中的所有云端内容,进行如下处理:
采用上述训练后的业务特征识别网络,分别提取所有云端内容的相似度embedding,在获得所有云端内容的相似度embedding后,训练这些相似度embedding的向量类别中心,例如,采用kmeans算法对所有相似度embedding进行聚类,如采用1000万个相似度embedding训练1万个向量类别中心。
同样地,采用上述训练后的内容特征识别网络,分别提取所有云端内容的内容embedding,在获得所有云端内容的内容embedding后,训练这些内容embedding的向量类别中心,例如,采用kmeans算法对所有相似度embedding进行聚类,如采用1000万个内容embedding训练1万个向量类别中心。
2)业务推送系统:将获得各个相似度embedding向量类别中心,作为检索的业务特征向量标识,云端内容池中的各个云端内容,分别与距离最近的一个业务特征向量标识(向量类别中心)中心进行关联,建立云端内容与业务特征向量标识的关联关系。
3)内容推送系统:将获得各个内容embedding向量类别中心,作为检索的内容特征向量标识,将云端内容池中的各个云端内容,分别与距离最近的一个内容特征向量标识(向量类别中心)中心进行关联,建立各个云端内容与内容特征向量标识的关联关系。
4)云端内容推荐系统:对云端内容池中的各个云端内容,通过内容特征识别网络预测每个云端内容包含的多个用户画像类型,每个用户画像类型可以通过一个标签表示。例如,一共有1000个用户画像类型,以每个用户画像类型为一个用户画像类型标识,其中,每个用户画像类型标识与包含该用户画像类型的所有云端内容进行关联。
下面对本申请实施例提供的基于大数据特征分析的云端内容推送方法的具体实施方式进行介绍。
S102,获取第一云端内容序列;第一云端内容序列包含的各个云端内容分别对应的业务特征向量,与目标业务特征向量的业务关联度达到第一预置标准。
该步骤中,可以计算云端内容池中的各个云端内容的业务特征向量,与需求云端内容的目标业务特征向量的业务关联度,然后获取业务关联度达到第一预置标准的多个云端内容,获得第一云端内容序列。具体地,业务特征向量可以表现为一个特征向量,通过计算业务特征向量之间的距离(即向量之间的距离),可以确定业务特征向量之间的业务关联度。
其中,云端内容池中的各个云端内容的业务特征向量,也可以预先采用上述业务特征识别网络获得。第一预置标准可以是:业务关联度不小于预设的预置关联度系数,该预置关联度系数可以根据需要设置,例如为0.9、0.95等,在此不作限定。
S103,从第一云端内容序列中选择多个待处理云端内容;多个待处理云端内容分别对应的内容特征向量,与目标内容特征向量的内容关联度达到第二预置标准。
该步骤中,可以计算第一云端内容序列中的各个云端内容的内容特征向量,与需求云端内容的目标内容特征向量的内容关联度,然后选择内容关联度达到第二预置标准的多个待处理云端内容。其中,第一云端内容序列中的各个云端内容的内容特征向量,也可以预先采用上述内容特征识别网络获得。
例如,第二预置标准可以是:内容关联度不小于预设的预置关联度系数,该预置关联度系数可以与前述的预置关联度系数相同,也可以不同,具体根据需要设置,在此不作限定。
S104,分别根据多个待处理云端内容分别对应的内容特征向量,获取相应的第二云端内容序列;每个第二云端内容序列包含的各个云端内容,与相应待处理云端内容的内容特征向量之间的内容关联度达到第三预置标准。
该步骤中,根据每个待处理云端内容的内容特征向量,可以获取一个第二云端内容序列,具体地,可以计算云端内容池中各个云端内容的内容特征向量,与待处理云端内容的内容特征向量的内容关联度,然后获取内容关联度达到第三预置标准的多个云端内容,获得第二云端内容序列。其中,云端内容池中的各个云端内容的业务特征向量,也可以预先采用上述业务特征识别网络获得。
例如,第三预置标准可以是:内容关联度不小于预设的预置关联度系数,该预置关联度系数可以与前述的预置关联度系数相同,也可以不同,具体根据需要设置,在此不作限定。
S105,根据获取的多个第二云端内容序列以及第一云端内容序列,确定匹配的目标云端内容序列。
具体地,对于获取的各个云端内容,可以根据各个图象与需求云端内容之间的业务关联度以及内容关联度,确定各个云端内容的总分,然后按照总分从大到小(或者从小到大)进行整理,选取排在前m位(或者后m位)的m个云端内容生成目标云端内容序列。其中,各个云端内容的总分可以是将业务关联度和内容关联度进行加权求和的结果。
在一些可能的实施例中,S105具体可以包括如下实施流程:
B1、基于多个第二云端内容序列以及第一云端内容序列包含的各个云端内容,根据各个云端内容分别对应的业务特征向量与目标业务特征向量的业务关联度,以及各个云端内容分别对应的内容特征向量与目标内容特征向量的内容关联度,将各个云端内容进行整理;
具体地,可以分别将各个云端内容的业务关联度和内容关联度进行加权求和,得到各个云端内容的总分,然后按照总分从大到小或者从小到大进行排列。例如:云端内容K的业务关联度为D1,内容关联度为D2,则云端内容K的总分D=w1*D1+ w2*D2,其中,w1、w2分别为权重,可以根据需要设置,以此类推,可以计算出各个云端内容的总分。
B2、从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列。
其中,当各个云端内容按照总分从大到小进行排列时,可以从整理后的各个云端内容中选择排在前m位的m个云端内容,将这m个云端内容作为目标云端内容序列;同样地,当各个云端内容按照总分从小到大进行排列时,可以从整理后的各个云端内容中选择排在后m位的m个云端内容,将这m个云端内容作为目标云端内容序列;其中,m的值可以根据需要设置,在此不作限定。
在上述实施方式中,通过业务关联度和内容关联度将各个云端内容进行整理,使得业务关联度和内容关联度对整理结果联合起作用,使得整理结果更准确。
本申请实施例的上述方案,根据需求云端内容的目标业务特征向量以及目标内容特征向量,进行深度获取,不仅可以获取与需求云端内容具有相似业务特征向量的云端内容,还可以进一步补获取与需求云端内容具有相似内容特征向量的云端内容,从而获取足够多的云端内容,提高检索获取率,进而提高检索结果的准确性。
考虑到云端内容池中的云端内容数量巨大,可以根据本申请本发明实施例建立的业务特征向量标识系统,根据需求云端内容的目标业务特征向量,从云端内容池中获取上述第一云端内容序列。
在一些实施例中,上述S102中根据需求云端内容的目标业务特征向量,获取第一云端内容序列,具体可以包括如下步骤:
S1021,从云端内容池中的多个业务特征向量标识中,选择多个业务比对标识;每个业务特征向量标识为相关的多个业务特征向量的向量类别中心,多个业务比对标识各自与目标业务特征向量的业务关联度不小于第一预置关联度系数。
本申请本发明实施例中,建立的云端内容池的业务特征向量标识系统包括多个业务特征向量标识,每个业务特征向量标识为相关的多个业务特征向量的向量类别中心。
该步骤中,可以计算多个业务特征向量标识分别与需求云端内容的目标业务特征向量的业务关联度,然后从多个业务特征向量标识中,选择业务关联度不小于第一预置关联度系数的业务特征向量标识,将选择的每个业务特征向量标识作为一个业务比对标识;其中,第一预置关联度系数可以根据需要设置,例如为0.9、0.95等,在此不作限定。
S1022,获取多个业务比对标识各自相关的多个业务特征向量。
由于每个业务特征向量标识关联有多个业务特征向量,因此,可以获取每个业务比对标识各相关的多个业务特征向量。
S1023,根据获取的各个业务特征向量匹配的云端内容,以及多个业务比对标识匹配的云端内容,生成第一云端内容序列。
示例性的,从多个业务特征向量标识中,选择与目标业务特征向量最接近的业务特征向量标识j、业务特征向量标识k、业务特征向量标识l,作为3个业务比对标识,这3个业务比对标识分别关联多个业务特征向量,将这3个业务比对标识对应的云端内容,以及各自相关的多个业务特征向量对应的云端内容,共同生成第一云端内容序列。
本申请实施例中,在根据目标业务特征向量,获取第一云端内容序列时,先从业务特征向量标识中获取最接近的多个业务特征向量标识,再获取获取的多个业务特征向量标识各自相关的业务特征向量,进而获取对应的第一云端内容序列,可以提高检索的获取效率。
进一步地,在获取第一云端内容序列之后,根据第一云端内容序列进行补获取时,即根据第一云端内容序列的内容特征向量以及需求云端内容的目标内容特征向量,获取第二云端内容序列时,可以根据本身申请本发明实施例建立的内容特征向量标识系统,进行补获取。
在一些可选的实施例中,上述S104中分别根据多个待处理云端内容分别对应的内容特征向量,获取相应的第二云端内容序列,可以包括如下步骤:
S1041,基于多个待处理云端内容,从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待处理云端内容的内容特征向量的内容关联度,不小于第二预置关联度系数。
本申请本发明实施例中,建立的云端内容池的内容特征向量标识系统包括多个内容特征向量标识,每个内容特征向量标识为相关的多个内容特征向量的向量类别中心。
该步骤中,可以计算多个内容特征向量标识分别与一个待处理云端内容的内容特征向量的内容关联度,然后从多个内容特征向量标识中,选择内容关联度不小于第二预置关联度系数的内容特征向量标识,将选择的每个内容特征向量标识作为一个内容对比标识;其中,第二预置关联度系数可以根据需要设置,例如为0.9、0.95等,在此不作限定。
S1042,获取多个内容对比标识各自相关的多个内容特征向量。
由于每个业务特征向量标识关联有多个业务特征向量,因此,可以获取每个业务比对标识各相关的多个业务特征向量。
S1043,根据获取的各个内容特征向量匹配的云端内容,以及多个内容对比标识匹配的云端内容,生成相应的第二云端内容序列。
示例性的,从多个内容特征向量标识中,选择与一个待处理云端内容的内容特征向量最接近的内容特征向量标识1、内容特征向量标识2、内容特征向量标识3,作为3个内容对比标识,这3个内容对比标识分别关联多个内容特征向量,将这3个内容对比标识对应的云端内容,以及各自相关的多个内容特征向量对应的云端内容,共同生成第二云端内容序列。
通过上述实施方式,在根据一个待处理云端内容的内容特征向量,获取一个第二云端内容序列时,先从内容特征向量标识中获取最接近的多个内容特征向量标识,再获取多个内容特征向量标识各自相关的内容特征向量,进而获取对应的第二云端内容序列,可以提高检索的获取效率。
本申请实施例中,根据需求云端内容的目标业务特征向量以及目标内容特征向量,采用深度获取方式获取了第一云端内容序列以及多个第二云端内容序列,在此基础上,还可以根据需求云端内容的目标用户画像向量以及目标内容特征向量,进一步采用深度获取方式获取更多的云端内容。
在一些实施例中,在本发明实施例的S101-S104的基础上,基于大数据特征分析的云端内容推送方法还可以包括如下实施流程:
S106,获取需求云端内容的目标用户画像向量,目标用户画像向量用于表征需求云端内容所包含的用户画像类型;
其中,需求云端内容的目标用户画像向量具体可以包括多个标签,每个标签表示一种用户画像类型。
由本申请本发明实施例可知,上述预选完成训练的内容特征识别网络不仅可以提取云端内容的内容特征向量,还可以预测云端内容所包含的用户画像类型,具体可以输出多个标签,即用户画像向量。
因此,在一些可选的实施方式中,可以将需求云端内容输入上述预选完成训练的内容特征识别网络,获得目标用户画像向量。
S107,获取第三云端内容序列;第三云端内容序列包含的各个云端内容分别对应的用户画像向量与目标用户画像向量相同。
该步骤中,可以确定需求云端内容的目标用户画像向量中所包含的多个用户画像类型,例如包含用户画像类型x、用户画像类型y、用户画像类型z,然后从云端内容池中的所有云端内容中,查找用户画像向量与目标用户画像向量相同的各个云端内容进行获取,也就是说,获取的各个云端内容的用户画像向量也包含上述用户画像类型x、用户画像类型y、用户画像类型z。其中,云端内容池中的各个云端内容的用户画像向量,也可以预先采用上述内容特征识别网络获得。
S108,根据第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度达到第五预置标准。
其中,第三云端内容序列中的多个待定云端内容可以是,与需求云端内容具有相似内容特征向量的云端内容,具体地,可以计算第三云端内容序列中所有云端内容各自与需求云端内容的内容关联度,然后,根据所有云端内容的内容关联度,从所有云端内容中选择与需求云端内容的描述内容最接近的多个待定云端内容。
进一步地,根据每个待定云端内容的内容特征向量,可以获取一个第四云端内容序列,具体地,可以计算云端内容池中各个云端内容的内容特征向量,与待定云端内容的内容特征向量的内容关联度,然后获取内容关联度达到第五预置标准的多个云端内容,获得第四云端内容序列。例如,第五预置标准可以是:内容关联度不小于预设的预置关联度系数,该预置关联度系数具体可以根据需要设置,在此不作限定。
本申请本发明实施例中,在根据需求云端内容的目标业务特征向量以及目标内容特征向量,进行深度获取的基础上,根据需求云端内容的目标用户画像向量以及内容特征向量,实现另一个深度获取过程,不仅可以获取与需求云端内容具有相同用户画像向量的云端内容,还可以进一步获取与需求云端内容具有相似内容特征向量的云端内容,从而进一步获取足够多的云端内容,提高检索获取率,进而提高检索结果的准确性。
在执行上述S106-S108之后,上述S105根据获取的多个第二云端内容序列以及第一云端内容序列,确定匹配的目标云端内容序列,具体可以包括以下步骤:
S109,根据第一云端内容序列、多个第二云端内容序列、第三云端内容序列以及多个第四云端内容序列,确定匹配的目标云端内容序列。
具体地,对于获取的各个云端内容,可以根据各个图象与需求云端内容之间的业务关联度、内容关联度以及用户画像向量的优先等级,确定各个云端内容的总分,然后按照总分从大到小(或者从小到大)进行整理,选取排在前m位(或者后m位)的m个云端内容生成目标云端内容序列。其中,各个云端内容的总分可以是将业务关联度、内容关联度和用户画像向量的优先等级进行加权求和的结果。
在一些可选的实施方式中,S109具体可以包括如下实施流程:
C1、基于第一云端内容序列、多个第二云端内容序列、第三云端内容序列以及多个第四云端内容序列包含的各个云端内容,根据各个云端内容分别对应的业务特征向量与目标业务特征向量的业务关联度,各个云端内容分别对应的内容特征向量与目标内容特征向量的内容关联度,以及各个云端内容分别对应的用户画像向量的优先等级,将各个云端内容进行整理;
具体地,可以分别将各个云端内容的业务关联度、内容关联度、用户画像向量的优先等级进行加权求和,得到各个云端内容的总分,然后按照总分从大到小或者从小到大进行排列。例如:云端内容K的业务关联度为D1,内容关联度为D2,用户画像向量的优先等级为D3,则云端内容K的总分D=w1*D1+w2*D2+ w3*D3,其中,w1、w2、w3分别为权重,可以根据需要设置,以此类推,可以计算出各个云端内容的总分。
在一些可选的实施方式中,各个云端内容分别对应的用户画像向量的优先等级,可以通过如下方式获得:
确定目标用户画像向量中包含的至少一个用户画像类型,并获取至少一个用户画像类型分别对应的第一归属权重。
进一步地,基于各个云端内容,
根据一个云端内容的用户画像向量中,至少一个用户画像类型分别对应的第二归属权重,以及至少一个用户画像类型分别对应的第一归属权重,确定一个云端内容的用户画像向量的优先等级。
假设,需求云端内容的目标用户画像向量中包含用户画像类型x、用户画像类型y、用户画像类型z、用户画像类型t,例如这四个用户画像类型分别对应:低消费能力、中消费能力、高消费能力和超高消费能力;其中,上述内容特征识别网络对这四个用户画像类型的归属权重大于概率阈值,该概率阈值可以根据需要设置,例如为0.5。
由于获取的各个云端内容的用户画像向量与目标用户画像向量相同,因为各个云端内容的用户画像向量也包含上述四个用户画像类型。上述内容特征识别网络在预测每个云端内容的用户画像向量时,还可以输出用户画像向量中包含的各个用户画像类型的归属权重,也就是说,可以获得获取的每个云端内容,对应的上述四个用户画像类型的第二归属权重。
例如,需求云端内容的目标用户画像向量中,上述四个用户画像类型分别对应的第一归属权重分别为P1、P2、P3、P4,这几个第一归属权重均大于概率阈值;获取的一个云端内容的用户画像向量中,上述四个用户画像类型分别对应的的第二归属权重分别为P1’、P2’、P3’、P4’,则该获取云端内容的用户画像向量的优先等级P可以进行计算:P= P1* P1’+P2* P2’+ P3* P4’+ P4* P4’。
C2、从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列。
其中,当各个云端内容按照总分从大到小进行排列时,可以从整理后的各个云端内容中选择排在前m位的m个云端内容,将这m个云端内容作为目标云端内容序列;同样地,当各个云端内容按照总分从小到大进行排列时,可以从整理后的各个云端内容中选择排在后m位的m个云端内容,将这m个云端内容作为目标云端内容序列;其中,m的值可以根据需要设置,在此不作限定。
本申请上述实施方式中,获得获取的所有云端内容后,按照业务关联度、内容关联度、用户画像向量的优先等级的综合得分,将各个云端内容进行整理,选择排在前面的多个目标云端内容。这样,使得业务关联度、内容关联度、用户画像向量对整理结果联合起作用,进一步使得整理结果更准确。
本申请实施例中,可以根据预先建立的云端内容池中的云端内容推荐系统,根据需求云端内容的目标用户画像向量,从云端内容池中获取上述第三云端内容序列,其中,云端内容池中的云端内容推荐系统的建立过程参见本申请本发明实施例,在此不再赘述。
在一些实施例中,上述S107中获取第三云端内容序列,具体可以包括以下步骤:
S1071,从云端内容池中的多个用户画像类型标识中,选择与目标用户画像向量匹配的至少一个用户画像类型标识;每个用户画像类型标识关联有多个包含相应用户画像类型的云端内容。
本申请本发明实施例中,建立的云端内容池的云端内容推荐系统包括多个用户画像类型标识,每个用户画像类型标识关联有多个包含相应用户画像类型的云端内容,在获得需求云端内容的目标用户画像向量后,可以确定需求云端内容所包含的多个用户画像类型,然后,从云端内容推荐系统中选择确定的多个用户画像类型,分别对应的用户画像类型标识。
S1072,获取选择的至少一个用户画像类型标识各自相关的多个云端内容,并根据获取的各个云端内容,生成第三云端内容序列。
示例性的,假设需求云端内容包含用户画像类型x、用户画像类型y、用户画像类型z,从多个用户画像类型标识中,选择用户画像类型x、用户画像类型y、用户画像类型z分别对应的用户画像类型标识A、用户画像类型标识B、用户画像类型标识C,然后获取这3个用户画像类型标识各自相关的多个云端内容,根据获得的各个云端内容生成第三云端内容序列。
进一步地,在获取第三云端内容序列之后,根据第三云端内容序列以及需求云端内容进行补获取时,即根据第三云端内容序列的内容特征向量以及需求云端内容的目标内容特征向量,获取第四云端内容序列时,可以根据本申请本发明实施例建立的内容特征向量标识系统,进行补获取。
在一些实施例中,上述S108中根据第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,可以包括以下实施流程:
S1081,从第三云端内容序列中选择多个待定云端内容,并将需求云端内容作为一个待定云端内容;其中,多个待定云端内容分别对应的内容特征向量,与目标内容特征向量的内容关联度,不小于第三预置关联度系数。
该步骤中,可以计算第三云端内容序列中的各个云端内容的内容特征向量,与需求云端内容的目标内容特征向量的内容关联度,然后选择内容关联度不小于第三预置关联度系数的多个待定云端内容。其中,第三预置关联度系数具体可以根据需要设置,在此不作限定。
S1082,分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度,不小于第四预置关联度系数。
该步骤中,根据每个待定云端内容的内容特征向量,可以获取一个第四云端内容序列,具体地,可以计算云端内容池中各个云端内容的内容特征向量,与该待定云端内容的内容特征向量的内容关联度,然后获取内容关联度不小于第四预置关联度系数的多个云端内容,获得第四云端内容序列。其中,第三预置关联度系数具体可以根据需要设置,在此不作限定。
在一些可选的实施方式中,S1082中分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,可以包括如下实施流程:
a、基于多个待定云端内容分别对应的内容特征向量,从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待定云端内容的内容特征向量的内容关联度,不小于第四预置关联度系数;
该步骤中,可以计算多个内容特征向量标识分别与一个待定云端内容的内容特征向量的内容关联度,然后从多个内容特征向量标识中,选择内容关联度不小于上述第四预置关联度系数的内容特征向量标识,将选择的每个内容特征向量标识作为一个内容对比标识。
b、获取多个内容对比标识各自相关的多个内容特征向量;
由于每个内容特征向量标识关联有多个内容特征向量,因此,可以获取每个内容对比标识各相关的多个内容特征向量。
c、根据获取的各个内容特征向量匹配的云端内容,以及多个内容对比标识匹配的云端内容,生成相应的第四云端内容序列。
示例性的,从多个内容特征向量标识中,选择与一个待定云端内容的内容特征向量最接近的内容特征向量标识3、内容特征向量标识4、内容特征向量标识5,作为3个内容对比标识,这3个内容对比标识分别关联多个内容特征向量,将这3个内容对比标识对应的云端内容,以及各自相关的多个内容特征向量对应的云端内容,共同生成第四云端内容序列。
需要说明的是,本申请本发明实施例涉及的多个预置关联度系数,例如:第一预置关联度系数、第二预置关联度系数、第三预置关联度系数、第四预置关联度系数,它们可以相同,也可以不同,在此不作限定。
本申请实施例可以将根据业务特征向量以及内容特征向量的深度获取方式,以及根据用户画像向量和内容特征向量的深度获取方式相结合,下面分别对这两个深度获取过程进行介绍。
本申请实施例的基于大数据特征分析的云端内容推送方法可以包括以下具体实施流程:
a、业务特征向量一级获取:在检索中,根据需求云端内容(用户查询内容)的相似度embedding(即目标业务特征向量),在业务特征向量标识系统中,获取与用户查询内容的相似度embedding距离最近的topK(例如K为5)个业务特征向量标识,获取这些业务特征向量标识下的云端内容,记为Q1,业务特征向量一级获取的两个第一类云端内容和一个第二类云端内容。
b、业务特征向量深度获取:基于业务特征向量一级获取的Q1云端内容,获取这些云端内容的内容embedding(即内容特征向量),根据其内容embedding与用户查询内容的内容embedding计算距离,取Q1中距离小于距离阈值(例如0.05)的云端内容作为深度用户查询内容,根据这些深度用户查询内容的内容embedding,在内容特征向量标识系统中,获取与深度用户查询内容的内容embedding距离最近的topL(例如L为5)个内容特征向量标识,把这些内容特征向量标识下相关的云端内容进行获取,记为Q2,业务特征向量深度获取的三个第一类云端内容和一个第二类云端内容。
其中,两个云端内容的内容embedding之间的距离越小,表示相似度越高。例如在业务特征向量获取中,一级获取3个云端内容,但由于获取的第二类云端内容被业务特征向量一级获取,但由于其内容embedding与用户查询内容的内容embedding的相似度不足,因此没有被用作业务特征向量深度获取,仅剩余两个飞机用于深度获取。
c、用户画像向量一级获取:基于用户查询内容预测的多标签(即本发明实施例中的用户画像向量)中,找到被预测的标签(即用户画像类型),并把该标签下的所有云端内容获取,记为P1,用户画像向量一级获取的两个第一类云端内容。
d、用户画像向量深度获取:对于用户画像向量一级获取的云端内容P1,根据P1的内容embedding与用户查询内容的内容embedding计算内容关联度,选取内容关联度大于预置关联度系数(例如0.90)的云端内容,将选取的云端内容以及原始用户查询内容作为深度用户查询内容,根据深度用户查询内容的内容embedding,在内容特征向量标识系统中,获取与深度用户查询内容的内容embedding距离最近的topK(例如K为5)个内容特征向量标识,把这些内容特征向量标识下相关的云端内容进行获取,记为P2,用户画像向量深度获取的两个第一类云端内容。
e、将上述获取的Q1、Q2、P1、P2合并,得到对应的整理结果。
基于上述获取的所有云端内容,获取所有云端内容在用户画像向量预测中,初始的用户查询内容被激活的多标签的归属权重,比如,用户查询内容被激活了第10位标签、第12位标签,即第10位标签的归属权重、第12位标签的归属权重均大于概率阈值(例如为0.5),则取这些获取云端内容的类别预测中第10位标签的归属权重、第12位标签的归属权重。
根据所有云端内容的被激活的多标签的归属权重、内容embedding、相似度embedding三个信息,计算加权总距离,并根据总距离从小到大整理,得到整理结果。
本发明实施例提供一种计算机设备100,计算机设备100包括处理器及存储有计算机指令的非易失性存储器,计算机指令被处理器执行时,计算机设备100执行前述的基于大数据特征分析的云端内容推送方法。如图2所示,图2为本发明实施例提供的计算机设备100的结构框图。计算机设备100包括存储器111、处理器112及通信单元113。
为实现数据的传输或交互,存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接。例如,可通过一条或多条通讯总线或信号线实现这些元件相互之间电性连接。
出于说明目的,前面的描述是参考具体实施例而进行的。但是,上述说明性论述并不打算穷举或将本公开局限于所公开的精确形式。根据上述教导,众多修改和变化都是可行的。选择并描述这些实施例是为了最佳地说明本公开的原理及其实际应用,从而使本领域技术人员最佳地利用本公开,并利用具有不同修改的各种实施例以适于预期的特定应用。出于说明目的,前面的描述是参考具体实施例而进行的。但是,上述说明性论述并不打算穷举或将本公开局限于所公开的精确形式。根据上述教导,众多修改和变化都是可行的。选择并描述这些实施例是为了最佳地说明本公开的原理及其实际应用,从而使本领域技术人员最佳地利用本公开,并利用具有不同修改的各种实施例以适于预期的特定应用。
Claims (10)
1.一种基于大数据特征分析的云端内容推送方法,其特征在于,包括:
在接收到指定云端平台的用户预设触发操作后,获取所述用户预设触发操作对应的操作特征;
基于预先构建的大数据行为分析模型,获取所述操作特征对应的需求云端内容;
获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据所述目标业务特征向量和目标内容特征向量得到与所述需求云端内容匹配的目标云端内容序列;
基于所述目标云端内容序列,生成指向目标云端内容序列的推送链接;
按照预设推送周期将所述推送链接显示至预设界面位置。
2.根据权利要求1所述的方法,其特征在于,所述获取需求云端内容的目标业务特征向量和目标内容特征向量,并根据所述目标业务特征向量和目标内容特征向量得到与所述需求云端内容匹配的目标云端内容序列,包括:
将所述需求云端内容输入预选完成训练的业务特征识别网络,获得所述目标业务特征向量;所述业务特征识别网络根据样本云端内容集合完成训练,所述样本云端内容集合中的每个样本云端内容对包括初始云端内容、与所述初始云端内容接近的云端内容、与所述初始云端内容不接近的云端内容;
将所述需求云端内容输入预选完成训练的内容特征识别网络,获得所述目标内容特征向量;所述内容特征识别网络根据配置了用户画像类型的样本云端内容集合完成训练;
从云端内容池中的多个业务特征向量标识中,选择多个业务比对标识;每个业务特征向量标识为相关的多个业务特征向量的向量类别中心,所述多个业务比对标识各自与所述目标业务特征向量的业务关联度不小于第一预置关联度系数;
获取所述多个业务比对标识各自相关的多个业务特征向量;
根据获取的各个业务特征向量匹配的云端内容,以及所述多个业务比对标识匹配的云端内容,生成第一云端内容序列;所述第一云端内容序列包含的各个云端内容分别对应的业务特征向量,与所述目标业务特征向量的业务关联度达到第一预置标准;
从所述第一云端内容序列中选择多个待处理云端内容;所述多个待处理云端内容分别对应的内容特征向量,与所述目标内容特征向量的内容关联度达到第二预置标准;
基于所述多个待处理云端内容,
从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待处理云端内容的内容特征向量的内容关联度,不小于第二预置关联度系数;
获取所述多个内容对比标识各自相关的多个内容特征向量;
根据获取的各个内容特征向量匹配的云端内容,以及所述多个内容对比标识匹配的云端内容,生成相应的第二云端内容序列;每个第二云端内容序列包含的各个云端内容,与相应待处理云端内容的内容特征向量之间的内容关联度达到第三预置标准;
根据获取的多个第二云端内容序列以及所述第一云端内容序列,确定匹配的目标云端内容序列。
3.根据权利要求2所述的方法,其特征在于,所述根据获取的多个第二云端内容序列以及所述第一云端内容序列,确定匹配的目标云端内容序列,包括:
基于所述多个第二云端内容序列以及所述第一云端内容序列包含的各个云端内容,根据所述各个云端内容分别对应的业务特征向量与所述目标业务特征向量的业务关联度,以及所述各个云端内容分别对应的内容特征向量与所述目标内容特征向量的内容关联度,将所述各个云端内容进行整理;
从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述需求云端内容的目标用户画像向量,所述目标用户画像向量用于表征所述需求云端内容所包含的用户画像类型;
获取第三云端内容序列;所述第三云端内容序列包含的各个云端内容分别对应的用户画像向量与所述目标用户画像向量相同;
根据所述第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度达到第五预置标准;
所述根据获取的多个第二云端内容序列以及所述第一云端内容序列,确定匹配的目标云端内容序列,包括:
根据所述第一云端内容序列、所述多个第二云端内容序列、所述第三云端内容序列以及所述多个第四云端内容序列,确定匹配的目标云端内容序列。
5.根据权利要求4所述的方法,其特征在于,所述获取第三云端内容序列,包括:
从云端内容池中的多个用户画像类型标识中,选择与所述目标用户画像向量匹配的至少一个用户画像类型标识;每个用户画像类型标识与多个包含相应用户画像类型的云端内容存在关联;
获取选择的至少一个用户画像类型标识各自相关的多个云端内容,并根据获取的各个云端内容,生成所述第三云端内容序列。
6.根据权利要求4所述的方法,其特征在于,所述根据所述第三云端内容序列包含的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,包括:
从所述第三云端内容序列中选择多个待定云端内容,并将所述需求云端内容作为一个待定云端内容;其中,所述多个待定云端内容分别对应的内容特征向量,与所述目标内容特征向量的内容关联度,不小于第三预置关联度系数;
分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列;每个第四云端内容序列包含的各个云端内容,与相应待定云端内容的内容特征向量之间的内容关联度,不小于第四预置关联度系数。
7.根据权利要求6所述的方法,其特征在于,所述分别根据获得的多个待定云端内容分别对应的内容特征向量,获取相应的第四云端内容序列,包括:
基于所述多个待定云端内容分别对应的内容特征向量,从云端内容池中的多个内容特征向量标识中,选择多个内容对比标识;每个内容特征向量标识为相关的多个内容特征向量的向量类别中心,选择的多个内容对比标识各自与一个待定云端内容的内容特征向量的内容关联度,不小于所述第四预置关联度系数;
获取所述多个内容对比标识各自相关的多个内容特征向量;
根据获取的各个内容特征向量匹配的云端内容,以及所述多个内容对比标识匹配的云端内容,生成相应的第四云端内容序列。
8.根据权利要求4所述的方法,其特征在于,所述获取所述需求云端内容的目标内容特征向量,包括:
将所述需求云端内容输入预选完成训练的内容特征识别网络,获得所述目标内容特征向量;
其中,所述内容特征识别网络至根据配置了用户画像类型的样本云端内容集合完成训练,所述样本云端内容集合中的每个样本云端内容对包括初始云端内容、与所述初始云端内容接近的云端内容、与所述初始云端内容不接近的云端内容;
所述获取所述需求云端内容的目标用户画像向量,包括:
将所述需求云端内容输入所述预选完成训练的内容特征识别网络,获得预测的所述目标用户画像向量。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一云端内容序列、所述多个第二云端内容序列、所述第三云端内容序列以及所述多个第四云端内容序列,确定匹配的目标云端内容序列,包括:
基于所述第一云端内容序列、所述多个第二云端内容序列、所述第三云端内容序列以及所述多个第四云端内容序列包含的各个云端内容,根据所述各个云端内容分别对应的业务特征向量与所述目标业务特征向量的业务关联度,所述各个云端内容分别对应的内容特征向量与所述目标内容特征向量的内容关联度,以及所述各个云端内容分别对应的用户画像向量的优先等级,将所述各个云端内容进行整理;
从整理后的各个云端内容中选择多个目标云端内容,获得匹配的目标云端内容序列;
所述各个云端内容分别对应的用户画像向量的优先等级,通过如下方式获得:
确定所述目标用户画像向量中包含的至少一个用户画像类型,并获取所述至少一个用户画像类型分别对应的第一归属权重;
基于所述各个云端内容,
根据一个云端内容的用户画像向量中,所述至少一个用户画像类型分别对应的第二归属权重,以及所述至少一个用户画像类型分别对应的第一归属权重,确定所述一个云端内容的用户画像向量的优先等级。
10.一种云服务器系统,其特征在于,包括服务器;所述服务器用于执行权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211638565.3A CN115689616B (zh) | 2022-12-20 | 2022-12-20 | 基于大数据特征分析的云端内容推送方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211638565.3A CN115689616B (zh) | 2022-12-20 | 2022-12-20 | 基于大数据特征分析的云端内容推送方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115689616A true CN115689616A (zh) | 2023-02-03 |
CN115689616B CN115689616B (zh) | 2023-11-17 |
Family
ID=85056430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211638565.3A Active CN115689616B (zh) | 2022-12-20 | 2022-12-20 | 基于大数据特征分析的云端内容推送方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689616B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737582A (zh) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN112650946A (zh) * | 2020-12-30 | 2021-04-13 | 中国联合网络通信集团有限公司 | 产品信息的推荐方法、装置、系统及存储介质 |
CN112989824A (zh) * | 2021-05-12 | 2021-06-18 | 武汉卓尔数字传媒科技有限公司 | 信息推送方法及装置、电子设备及存储介质 |
CN113326426A (zh) * | 2020-11-17 | 2021-08-31 | 崔海燕 | 基于大数据定位和人工智能的信息推送方法及系统 |
CN113361795A (zh) * | 2021-06-21 | 2021-09-07 | 深圳市鸿业电线有限公司 | 基于电商产品推送和大数据的信息展示方法及云计算系统 |
CN114119106A (zh) * | 2021-12-09 | 2022-03-01 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
CN114168841A (zh) * | 2021-10-29 | 2022-03-11 | 中国建设银行股份有限公司 | 内容推荐方法及其装置 |
CN114817692A (zh) * | 2021-01-20 | 2022-07-29 | 腾讯科技(深圳)有限公司 | 确定推荐对象的方法、装置和设备及计算机存储介质 |
CN115170168A (zh) * | 2021-04-07 | 2022-10-11 | 中移(苏州)软件技术有限公司 | 一种广告推送方法、装置、云服务器和存储介质 |
-
2022
- 2022-12-20 CN CN202211638565.3A patent/CN115689616B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737582A (zh) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN113326426A (zh) * | 2020-11-17 | 2021-08-31 | 崔海燕 | 基于大数据定位和人工智能的信息推送方法及系统 |
CN112650946A (zh) * | 2020-12-30 | 2021-04-13 | 中国联合网络通信集团有限公司 | 产品信息的推荐方法、装置、系统及存储介质 |
CN114817692A (zh) * | 2021-01-20 | 2022-07-29 | 腾讯科技(深圳)有限公司 | 确定推荐对象的方法、装置和设备及计算机存储介质 |
CN115170168A (zh) * | 2021-04-07 | 2022-10-11 | 中移(苏州)软件技术有限公司 | 一种广告推送方法、装置、云服务器和存储介质 |
CN112989824A (zh) * | 2021-05-12 | 2021-06-18 | 武汉卓尔数字传媒科技有限公司 | 信息推送方法及装置、电子设备及存储介质 |
CN113361795A (zh) * | 2021-06-21 | 2021-09-07 | 深圳市鸿业电线有限公司 | 基于电商产品推送和大数据的信息展示方法及云计算系统 |
CN114168841A (zh) * | 2021-10-29 | 2022-03-11 | 中国建设银行股份有限公司 | 内容推荐方法及其装置 |
CN114119106A (zh) * | 2021-12-09 | 2022-03-01 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115689616B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107835496B (zh) | 一种垃圾短信的识别方法、装置和服务器 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN109857844B (zh) | 基于点餐对话文本的意图识别方法、装置、电子设备 | |
CN105022754B (zh) | 基于社交网络的对象分类方法及装置 | |
CN110348362B (zh) | 标签生成、视频处理方法、装置、电子设备及存储介质 | |
CN114549874B (zh) | 多目标图文匹配模型的训练方法、图文检索方法及装置 | |
CN112035599B (zh) | 基于垂直搜索的查询方法、装置、计算机设备及存储介质 | |
CN111507350B (zh) | 一种文本识别方法和装置 | |
CN110598037A (zh) | 一种图像搜索方法、装置和存储介质 | |
CN111931859B (zh) | 一种多标签图像识别方法和装置 | |
CN113434716B (zh) | 一种跨模态信息检索方法和装置 | |
CN111914159B (zh) | 一种信息推荐方法及终端 | |
CN113255370A (zh) | 基于语义相似度的行业类型推荐方法、装置、设备及介质 | |
CN110795527A (zh) | 候选实体排序方法、训练方法及相关装置 | |
US20200210776A1 (en) | Question answering method, terminal, and non-transitory computer readable storage medium | |
CN111159409A (zh) | 基于人工智能的文本分类方法、装置、设备、介质 | |
CN110765292A (zh) | 图像检索方法、训练方法及相关装置 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
KR101472451B1 (ko) | 디지털 콘텐츠 관리 시스템 및 방법 | |
CN113947701B (zh) | 训练方法、对象识别方法、装置、电子设备以及存储介质 | |
CN113326363B (zh) | 搜索方法及装置、预测模型训练方法及装置、电子设备 | |
CN111382254A (zh) | 电子名片推荐方法、装置、设备及计算机可读存储介质 | |
CN115689616B (zh) | 基于大数据特征分析的云端内容推送方法及系统 | |
CN115730217A (zh) | 模型的训练方法、物料的召回方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231023 Address after: 9th Floor, Building 3, Zone 6, No. 188 South Fourth Ring West Road, Fengtai District, Beijing, 100070 Applicant after: Beijing Guolian video information technology Co.,Ltd. Address before: 710075 No. 153, Jinghe New Town, Xixian New District, Yanta District, Xi'an City, Shaanxi Province Applicant before: Shaanxi Changjin Network Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |