CN110704728A - 信息推荐的方法、装置、电子设备及存储介质 - Google Patents
信息推荐的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110704728A CN110704728A CN201910842046.0A CN201910842046A CN110704728A CN 110704728 A CN110704728 A CN 110704728A CN 201910842046 A CN201910842046 A CN 201910842046A CN 110704728 A CN110704728 A CN 110704728A
- Authority
- CN
- China
- Prior art keywords
- user
- identification
- identifier
- vector
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 239000013598 vector Substances 0.000 claims abstract description 117
- 238000003062 neural network model Methods 0.000 claims abstract description 67
- 230000006399 behavior Effects 0.000 claims description 76
- 238000012549 training Methods 0.000 claims description 52
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000003796 beauty Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种信息推荐的方法、装置、电子设备及存储介质,其中所述方法包括:确定第一标识以及多个候选的第二标识;将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量;分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。在高维空间实现的信息推荐,可以规避直接构建显式的用户标识进行匹配的诸多限制条件,提高了推荐的效率以及准确率。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及信息推荐的方法、装置、电子设备及存储介质。
背景技术
随着互联网广告技术与业务的发展,人群定向几乎是每个广告平台的基本功能之一。用户兴趣标签是实现人群精准定向的基础。
在相关技术中,通过建立基于用户行为数据的兴趣标签模型来确定用户兴趣标签,该模型通过对视频标题和描述分词提取视频标签,同时维护用户兴趣标签体系,建立视频标签和用户兴趣标签的映射关系。
然而,相关技术中用户兴趣标签为显式的兴趣标签,存在诸多限制条件,如根据显式标签召回相似内容的难度较大等。
发明内容
本公开提供信息推荐的方法及装置,以至少解决相关技术中显式的用户兴趣标签召回相似内容的难度较大的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种信息推荐的方法,所述信息推荐的方法包括:
确定第一标识以及多个候选的第二标识,其中,所述第一标识及所述第二标识包括目标用户标识及目标标签标识的一种;
将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量,其中,所述神经网络模型根据用户历史行为数据确定的指定维度的样本向量生成;
分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;
将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
根据本公开实施例的第二方面,提供一种信息推荐的装置,所述信息推荐的装置包括:
标识确定模块,被配置为确定第一标识以及多个候选的第二标识,其中,所述第一标识及所述第二标识包括目标用户标识及目标标签标识的一种;
第一标识向量获取模块,被配置为将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量,其中,所述神经网络模型根据用户历史行为数据确定的指定维度的样本向量生成;
第二标识向量获取模块,被配置为分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;
待推荐标识确定模块,被配置为将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述的方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由所述设备的处理器执行时,使得所述电子设备能够执行上述的方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括可执行程序代码,其中,所述程序代码在通过上述装置执行时实施上述的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
在本实施例中,在进行信息推荐时,当获得第一标识以及多个候选的第二标识以后,通过分别将该第一标识以及多个第二标识分别输入至已训练的神经网络模型来获取该神经网络模型的中间层输出的、与第一标识对应的指定维度的隐式第一标识向量,以及与各第二标识对应的指定维度的隐式第二标识向量,通过将第一标识向量与各第二标识向量进行匹配的匹配结果则可以从多个第二标识中选择待推荐至第一标识的第二标识,在高维空间实现的信息推荐,可以规避直接构建显式的用户标识进行匹配的诸多限制条件,提高了推荐的效率以及准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种信息推荐的方法实施例的流程图。
图2是根据一示例性实施例示出的一种获取神经网络模型的方法实施例的流程图。
图3是根据一示例性实施例示出的确定训练样本的方法实施例的流程图。
图4是根据一示例性实施例示出的一种信息推荐的装置框图。
图5是根据一示例性实施例示出的一种用于执行上述方法实施例的装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种信息推荐的方法实施例的流程图,可以包括以下步骤。
在步骤101中,确定第一标识以及多个候选的第二标识;
在该实施例中,第一标识可以包括目标用户标识及目标标签标识的一种;第二标识也可以包括目标用户标识及目标标签标识的一种。示例性地,目标用户标识可以为用户账号等用户ID,目标标签标识可以为用户行为标签、视频标签、网页标签等标签的标识。
在步骤102中,将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量。
在该实施例中,为了提高数据处理效率,神经网络模型可以为离线训练好的网络模型,该模型的中间层可以包括一embedding(嵌入)层,该embedding层可以输出指定维度的embedding向量。示例性的,该指定维度可以为16维等高维维度。
当获得第一标识以后,可以将第一标识输入至该神经网络模型,然后获取该神经网络模型的中间层输出的与第一标识对应的指定维度的第一标识向量。
在一种实施方式中,神经网络模型可以根据用户历史行为数据确定的指定维度的样本向量生成,关于神经网络模型的生成方式在后续实施例中进行详细说明。
在步骤103中,分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量。
在该步骤中,与上述第一标识类似,当获得多个候选的第二标识以后,可以分别将每个第二标识输入至该神经网络模型,然后获取该神经网络模型的中间层输出的与该第二标识对应的指定维度的第二标识向量。
在本实施例中,第一标识向量以及各第二标识向量均为高维的隐式向量,其与显式向量的区别是,显式向量具有具体的含义,隐式向量没有具体的含义。
在步骤104中,将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
在该步骤中,当获得第一标识对应的第一标识向量,以及每个第二标识对应的第二标识向量以后,则可以根据获得的多个第二标识向量,从候选的多个第二标识中选取用于推荐至第一标识的第二标识。
在一种实施方式中,可以分别计算第一标识向量与每个第二标识向量的相似度,并选取相似度符合预设条件的第二标识向量对应的第二标识,推荐至第一标识。
在一种例子中,相似度符合预设条件的第二标识向量可以包括但不限于:相似度排序在前N的第二标识向量,或者,相似度大于预设阈值的第二标识向量,等等。
为了便于对本实施例的理解,示例性地列举如下场景对本实施例进行说明,但应当理解的是,本实施例并不限于下述例子,这些例子也不应该理解为对本实施例的限制:
场景一:当前用户的用户标签有多个,如何确定这些用户标签与当前用户的匹配程度,并根据匹配程度确定较为匹配的用户标签。
按照本实施例的方法,可以将当前用户的用户标识输入至已训练的神经网络模型,并获取该神经网络模型的中间层输出的、与当前用户的用户标识对应的隐式高维向量,以及,分别将各用户标签输入至已训练的神经网络模型,并获取该神经网络模型的中间层输出的、与该用户标签对应的隐式高维向量。通过计算用户标识的隐式高维向量与各用户标签的隐式高维向量的相似度来确定匹配程度,并将相似度符合预设条件的用户标签作为匹配的用户标签。
在上述场景的一种扩展场景中,当确当匹配的用户标签以后,还可以根据该匹配的用户标签进行信息推荐,例如,确定该用户标签的高维隐式向量后,根据该用户标签的高维隐式向量与其他视频标识的高维隐式向量的相似度,可以向用户推荐视频。或者,确定该用户标签的高维隐式向量后,根据该用户标签的高维隐式向量与用户标识的高维隐式向量的相似度,可以向用户推荐好友,等等。
场景二:给用户推荐视频等信息的场景。
按照本实施例的方法,可以将用户标识输入至已训练的神经网络模型,并获取该神经网络模型的中间层输出的、与该用户标识对应的隐式高维向量,以及,分别将各视频标识输入至已训练的神经网络模型,并获取该神经网络模型的中间层输出的、与该视频标识对应的隐式高维向量。计算用户标识的隐式高维向量与各视频标识的隐式高维向量的相似度,并将相似度符合预设条件的视频标识对应的视频推荐给用户。
需要说明的是,上述例子中,除了推荐视频以外,还可以推荐其他具有标识的对象,只要将视频标识替换为其他对象的标识即可,例如,推荐商品,就将视频标识替换为商品标识;推荐好友,就将视频标识替换为其他用户的用户标识,等等。
在本实施例中,在进行信息推荐时,当获得第一标识以及多个候选的第二标识以后,通过分别将该第一标识以及多个第二标识分别输入至已训练的神经网络模型来获取该神经网络模型的中间层输出的、与第一标识对应的指定维度的隐式第一标识向量,以及与各第二标识对应的指定维度的隐式第二标识向量,通过将第一标识向量与各第二标识向量进行匹配的匹配结果则可以从多个第二标识中选择待推荐至第一标识的第二标识,在高维空间实现的信息推荐,可以规避直接构建显式的用户标识进行匹配的诸多限制条件,提高了推荐的效率以及准确率。
图2是根据一示例性实施例示出的一种获取神经网络模型的方法实施例的流程图,可以包括以下步骤。
在步骤201中,获取用户历史行为数据,并根据所述用户历史行为数据确定训练样本,所述训练样本包括用户标识以及所述用户标识对应的用户行为标签。
在该步骤中,训练样本可以从用户历史行为数据中提取得到。在一种实现方式中,可以从记录的日志中获取各用户标识在过去预设时间段内的历史行为数据,例如,视频生产商可以将广告数据以监控链接的形式发送给广告代理商,其中正样本为广告代理商回传的带有激活标签的日志,其余为负样本。则可以从该回传的日志种提取历史行为数据。
当然,本实施例并不限于上述提取历史行为数据的方式,也可以采用其他方式获取样本用户标识在过去预设时间段内的历史行为数据。
在实际中,过去预设时间段可以为根据实际需求确定的过去的一段时间,例如,过去7天等。
作为一种示例,训练样本可以包括用户标识、该用户标识对应的用户行为标签等。
在一种实施方式中,用户历史行为数据可以包括多个用户的历史行为数据,可以从用户历史行为数据中提取各用户的用户标识。
在一种实施方式中,参考图3所示的确定训练样本的方法实施例的流程图所示,当训练样本包括用户标识对应的用户行为标签,则步骤201中根据用户历史行为数据确定训练样本的步骤可以进一步包括如下步骤:
在步骤201-1中,从所述用户历史行为数据中提取所述用户标识操作的视频标识列表。
示例性地,用户的历史行为数据可以包括用户对视频的曝光、点击、点赞等行为数据,则用户的每一种历史行为数据都可以携带对应的视频标识,提取用户历史行为数据中的视频标识可以组织成视频标识列表。
例如,用户在一段时间内分别点击了视频A、视频B和视频C,则可以得到视频标识列表为(视频A,视频B,视频C)。
在步骤201-2中,获取所述视频标识列表中各视频标识对应的视频标签,并统计各视频标签的数量。
在步骤201-3中,将数量最多的前M个视频标签作为用户行为标签,其中,M为大于0的正整数。
在一种例子中,视频在发布时发布该视频的发布者会给视频打上若干视频标签,该视频标签与视频标识可以关联存储,则根据两者的关联关系可以获得视频标识列表中各视频标识对应的视频标签。
当获得视频标识列表中各视频标识对应的视频标签以后,可以聚合所有视频标签,在一种例子中,可以以视频标签为对象,统计各个视频标签出现的数量,然后将数量排列在前的若干个视频标签作为用户行为标签。
例如,各视频标识关联的视频标签如下:
视频1:游戏、宅男
视频2:美女、游戏
视频3:游戏、体育
视频4:体育、教育、娱乐、美女
假设用户最近n次点击的视频(即视频标识列表)包括:视频1、视频2和视频4。则对该视频标识列表中出现的视频标签进行统计后得到的结果为:游戏:2;宅男:1;美女:2;体育:1;教育:1;娱乐:1;假设M取值为2,则用户行为标签为:{用户:[游戏:2,美女:2]}。
又如,假设通过对用户最近的50次点击行为聚合而成的top10个视频标签表示用户行为标签,比如为:用户A[标签1:40,标签10:21,标签6:17,标签211:9,标签39:4,…],在上述标签中,每个用户对应着一个长度最大为10的由视频标签和命中次数的数据对pair组成的列表。
在本实施例的一种可能的实施方式中,在步骤201-3之前,步骤201还可以包括如下步骤:
当数量最多的N个视频标签中包括指定标签,则过滤所述指定标签,其中,N大于M。
作为一种示例,指定标签可以包括一些平台相关的标签,如“感谢”、“双击”、“点赞”或平台标识等带有平台属性的标签,这些标签一般为高频标签,大部分发布的视频作品都携带此类标签,但此类标签与视频作品本身的属性没有太大关联,因此可以过滤掉数量最多的指定标签,以使得过滤后的视频标签更具有代表性。
在另一些例子中,还可以过滤掉出现次数最少的低频标签,以减少计算量。
在一种实现方式中,指定标签可以人为确定,也可以在统计平台出现的所有标签以后,将出现次数在10%(当然也可以按需设置其他数据)上分位的词作为指定标签,本实施例对此不作限制。
在步骤202中,将所述训练样本转换为指定维度的样本向量。
在该步骤中,当确定训练样本以后,由于训练样本的维度比较大,因此在对训练样本进行训练前,可以先将该训练样本转换为指定维度的样本向量,以对训练样本进行降维,并且在模型训练时对样本向量进行训练,使得训练得到的模型具有输出指定维度的向量的功能。
在本实施例的一种可能的实施方式中,在步骤202中可以采用如下方式将训练样本转换为指定维度的样本向量:
分别对所述用户标识以及所述用户行为标签进行哈希运算;基于所述用户标识的哈希运算结果将对应的用户行为标签的哈希运算结果进行偏移,以使得所述用户标识的哈希运算结果与所述用户行为标签的哈希运算结果的哈希范围不同;将得到的用户标识的哈希运算结果以及偏移后的用户行为标签的哈希运算结果作为指定维度的样本向量。
在该实施例中,可以分别对用户标识以及用户行为标签进行哈希hash运算,以使得两者均转换为固定hash size(哈希大小,即指定维度)的向量。
得到用户标识的哈希运算结果以及用户行为标签的哈希运算结果以后,还可以基于各用户标识的哈希运算结果(假设为hash 1)对该用户对应的用户行为标签的哈希运算结果(假设为hash 2)做偏移,以确保该用户标识的哈希运算结果与该用户的用户行为标签的哈希运算结果取不同的hash范围。
例如,假设用户id的哈希运算结果为100001,则该用户标识对应的用户行为标签的hash结果可以通过将offset(偏移值)设置为100001,从而实现其hash结果的偏移,即将用户行为标签的hash值都增加offset。
在本实施例中,在得到用户标识的哈希运算结果以及偏移后的用户行为标签的哈希运算结果以后,该哈希运算结果可以作为指定维度的样本向量。
在步骤203中,将所述样本向量以及在先获取的原始特征向量组合成特征集合,并采用基于深度学习的模型训练算法对所述特征集合进行训练,生成所述神经网络模型。
在该步骤中,在进行模型训练时,用于训练的特征数据可以包括两部分,一部分是上述得到的样本向量(即embedding向量),另一部分是原有的用于训练该模型的原始特征向量。
在一种例子中,样本向量可以包括如下的一种:批量用户标识的哈希运算结果;批量用户行为标签的哈希运算结果;批量用户标识的哈希运算结果及批量用户行为标签的哈希运算结果进行shuffle(shuffle的目的是让数据分布更随机)后的向量。
示例性地,原始特征向量可以为用于训练神经网络模型的原始数据,例如,其可以包括具有具体含义的离散特征,如用户年龄、性别、用户位置、安装app等稀疏特征。
本实施例在原始特征向量的基础上,增加基于用户历史数据获取的样本向量,以此丰富了训练的数据量,完善了神经网络模型的性能,使得该模型的中间层可以输出高维的隐性向量。
在一种例子中,在进行神经网络的训练时,可以分别以提高ctr(Click ThroughRate,点击率,即广告的每次曝光用户的点击率)及wtr(watching Through Rate,曝光率,即广告的每次曝光用户的关注率)作为优化目标来训练神经网络。
除此以外,神经网络模型还可以包括激活层以及作为神经网络的输出层的softmax(网络分类)层。
在一种实施例中,训练得到神经网络模型以后,还可以调用Tensorflow调试程序的接口,将该神经网络模型实例化(dump)。
在本实施例中,在训练神经网络模型时,训练的数据既可以包括显式语义的原始特征向量,还可以包括基于用户的历史行为数据确定的隐式语义的高维空间的用户标识和用户行为标签,丰富了模型训练的训练数据,提升了模型确定用户兴趣标签的准确率。
图4是根据一示例性实施例示出的一种信息推荐的装置框图。参照图4,该装置包括标识确定模块401、第一标识向量获取模块402、第二标识向量获取模块403以及待推荐标识确定模块404。
标识确定模块401,被配置为确定第一标识以及多个候选的第二标识,其中,所述第一标识及所述第二标识包括目标用户标识及目标标签标识的一种;
第一标识向量获取模块402,被配置为将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量,其中,所述神经网络模型根据用户历史行为数据确定的指定维度的样本向量生成;
第二标识向量获取模块403,被配置为分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;
待推荐标识确定模块404,被配置为将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
在本实施例的一种可能的实施方式中,所述装置还包括用于获取神经网络模型的模型获取模块,所述模型获取模块包括:
训练样本确定子模块,被配置为获取用户历史行为数据,并根据所述用户历史行为数据确定训练样本,所述训练样本包括用户标识以及所述用户标识对应的用户行为标签;
样本向量转换子模块,被配置为将所述训练样本转换为指定维度的样本向量;
模型训练子模块,被配置为将所述样本向量以及在先获取的原始特征向量组合成特征集合,并采用基于深度学习的模型训练算法对所述特征集合进行训练,生成所述神经网络模型。
在本实施例的一种可能的实施方式中,当所述训练样本包括用户标识对应的用户行为标签,所述训练样本确定子模块具体被配置为:
从所述用户历史行为数据中提取所述用户标识操作的视频标识列表;
获取所述视频标识列表中各视频标识对应的视频标签,并统计各视频标签的数量;
将数量最多的前M个视频标签作为用户行为标签,其中,M为大于0的正整数。
在本实施例的一种可能的实施方式中,所述训练样本确定子模块还被配置为:
在所述将数量最多的前M个视频标签作为用户行为标签的步骤之前,当数量最多的N个视频标签中包括指定标签,则过滤所述指定标签,其中,N大于M。
在本实施例的一种可能的实施方式中,所述样本向量转换子模块具体被配置为:
分别对所述用户标识以及所述用户行为标签进行哈希运算;
基于所述用户标识的哈希运算结果将对应的用户行为标签的哈希运算结果进行偏移,以使得所述用户标识的哈希运算结果与所述用户行为标签的哈希运算结果的哈希范围不同;
将得到的用户标识的哈希运算结果以及偏移后的用户行为标签的哈希运算结果作为指定维度的样本向量。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种用于执行上述方法实施例的装置的框图。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由装置的处理器执行以完成上述图1-图5的方法实施例。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例还提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述图1-图5实施例的方法。
本公开实施例还提供一种存储介质,当所述存储介质中的指令由所述设备的处理器执行时,使得所述设备能够执行上述图1-图3实施例的方法。
本公开实施例还提供一种计算机程序产品,包括可执行程序代码,其中,所述程序代码在通过上述装置执行时实施根据图1-图3实施例的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种信息推荐的方法,其特征在于,所述信息推荐的方法包括:
确定第一标识以及多个候选的第二标识,其中,所述第一标识及所述第二标识包括目标用户标识及目标标签标识的一种;
将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量,其中,所述神经网络模型根据用户历史行为数据确定的指定维度的样本向量生成;
分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;
将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
2.根据权利要求1所述的信息推荐的方法,其特征在于,所述方法还包括获取神经网络模型的步骤,包括:
获取用户历史行为数据,并根据所述用户历史行为数据确定训练样本,所述训练样本包括用户标识以及所述用户标识对应的用户行为标签;
将所述训练样本转换为指定维度的样本向量;
将所述样本向量以及在先获取的原始特征向量组合成特征集合,并采用基于深度学习的模型训练算法对所述特征集合进行训练,生成所述神经网络模型。
3.根据权利要求2所述的信息推荐的方法,其特征在于,当所述训练样本包括用户标识对应的用户行为标签,所述根据所述用户历史行为数据确定训练样本,包括:
从所述用户历史行为数据中提取所述用户标识操作的视频标识列表;
获取所述视频标识列表中各视频标识对应的视频标签,并统计各视频标签的数量;
将数量最多的前M个视频标签作为用户行为标签,其中,M为大于0的正整数。
4.根据权利要求3所述的信息推荐的方法,其特征在于,在所述将数量最多的前M个视频标签作为用户行为标签的步骤之前,所述根据所述用户历史行为数据确定训练样本还包括:
当数量最多的N个视频标签中包括指定标签,则过滤所述指定标签,其中,N大于M。
5.根据权利要求2或3所述的信息推荐的方法,其特征在于,所述将所述训练样本转换为指定维度的样本向量,包括:
分别对所述用户标识以及所述用户行为标签进行哈希运算;
基于所述用户标识的哈希运算结果将对应的用户行为标签的哈希运算结果进行偏移,以使得所述用户标识的哈希运算结果与所述用户行为标签的哈希运算结果的哈希范围不同;
将得到的用户标识的哈希运算结果以及偏移后的用户行为标签的哈希运算结果作为指定维度的样本向量。
6.一种信息推荐的装置,其特征在于,所述信息推荐的装置包括:
标识确定模块,被配置为确定第一标识以及多个候选的第二标识,其中,所述第一标识及所述第二标识包括目标用户标识及目标标签标识的一种;
第一标识向量获取模块,被配置为将所述第一标识输入至已训练的神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第一标识对应的指定维度的第一标识向量,其中,所述神经网络模型根据用户历史行为数据确定的指定维度的样本向量生成;
第二标识向量获取模块,被配置为分别将所述第二标识输入至所述神经网络模型,并获取所述神经网络模型的中间层输出的、与所述第二标识对应的指定维度的第二标识向量;
待推荐标识确定模块,被配置为将所述第一标识向量与各第二标识向量进行匹配,并根据匹配的结果从所述多个第二标识中确定待推荐至所述第一标识的第二标识。
7.根据权利要求6所述的信息推荐的装置,其特征在于,所述装置还包括用于获取神经网络模型的模型获取模块,所述模型获取模块包括:
训练样本确定子模块,被配置为获取用户历史行为数据,并根据所述用户历史行为数据确定训练样本,所述训练样本包括用户标识以及所述用户标识对应的用户行为标签;
样本向量转换子模块,被配置为将所述训练样本转换为指定维度的样本向量;
模型训练子模块,被配置为将所述样本向量以及在先获取的原始特征向量组合成特征集合,并采用基于深度学习的模型训练算法对所述特征集合进行训练,生成所述神经网络模型。
8.根据权利要求6或7所述的信息推荐的装置,其特征在于,当所述训练样本包括用户标识对应的用户行为标签,所述训练样本确定子模块具体被配置为:
从所述用户历史行为数据中提取所述用户标识操作的视频标识列表;
获取所述视频标识列表中各视频标识对应的视频标签,并统计各视频标签的数量;
将数量最多的前M个视频标签作为用户行为标签,其中,M为大于0的正整数。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5任一项所述的方法。
10.一种存储介质,当所述存储介质中的指令由所述设备的处理器执行时,使得所述电子设备能够执行如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910842046.0A CN110704728A (zh) | 2019-09-06 | 2019-09-06 | 信息推荐的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910842046.0A CN110704728A (zh) | 2019-09-06 | 2019-09-06 | 信息推荐的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110704728A true CN110704728A (zh) | 2020-01-17 |
Family
ID=69194472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910842046.0A Pending CN110704728A (zh) | 2019-09-06 | 2019-09-06 | 信息推荐的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110704728A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308166A (zh) * | 2020-11-09 | 2021-02-02 | 建信金融科技有限责任公司 | 一种处理标签数据的方法和装置 |
CN112836128A (zh) * | 2021-02-10 | 2021-05-25 | 脸萌有限公司 | 信息推荐方法、装置、设备和存储介质 |
WO2022017001A1 (zh) * | 2020-07-21 | 2022-01-27 | 百果园技术(新加坡)有限公司 | 一种推荐方法、在线预测模型的发布方法和装置 |
CN116232770A (zh) * | 2023-05-08 | 2023-06-06 | 中国石油大学(华东) | 一种基于sdn控制器的企业网络安全防护系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846097A (zh) * | 2018-06-15 | 2018-11-20 | 北京搜狐新媒体信息技术有限公司 | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 |
CN109241440A (zh) * | 2018-09-29 | 2019-01-18 | 北京工业大学 | 一种基于深度学习的面向隐式反馈推荐方法 |
CN109684510A (zh) * | 2018-10-31 | 2019-04-26 | 北京达佳互联信息技术有限公司 | 视频排序方法、装置、电子设备及存储介质 |
US20190251446A1 (en) * | 2018-02-15 | 2019-08-15 | Adobe Inc. | Generating visually-aware item recommendations using a personalized preference ranking network |
-
2019
- 2019-09-06 CN CN201910842046.0A patent/CN110704728A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190251446A1 (en) * | 2018-02-15 | 2019-08-15 | Adobe Inc. | Generating visually-aware item recommendations using a personalized preference ranking network |
CN108846097A (zh) * | 2018-06-15 | 2018-11-20 | 北京搜狐新媒体信息技术有限公司 | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 |
CN109241440A (zh) * | 2018-09-29 | 2019-01-18 | 北京工业大学 | 一种基于深度学习的面向隐式反馈推荐方法 |
CN109684510A (zh) * | 2018-10-31 | 2019-04-26 | 北京达佳互联信息技术有限公司 | 视频排序方法、装置、电子设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022017001A1 (zh) * | 2020-07-21 | 2022-01-27 | 百果园技术(新加坡)有限公司 | 一种推荐方法、在线预测模型的发布方法和装置 |
CN111859133B (zh) * | 2020-07-21 | 2023-11-14 | 有半岛(北京)信息科技有限公司 | 一种推荐方法及在线预测模型的发布方法和装置 |
CN112308166A (zh) * | 2020-11-09 | 2021-02-02 | 建信金融科技有限责任公司 | 一种处理标签数据的方法和装置 |
CN112836128A (zh) * | 2021-02-10 | 2021-05-25 | 脸萌有限公司 | 信息推荐方法、装置、设备和存储介质 |
CN116232770A (zh) * | 2023-05-08 | 2023-06-06 | 中国石油大学(华东) | 一种基于sdn控制器的企业网络安全防护系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704728A (zh) | 信息推荐的方法、装置、电子设备及存储介质 | |
CN110737783B (zh) | 一种推荐多媒体内容的方法、装置及计算设备 | |
CN109522531B (zh) | 文案生成方法和装置、存储介质及电子装置 | |
CN110472154B (zh) | 一种资源推送方法、装置、电子设备及可读存储介质 | |
CN106126582A (zh) | 推荐方法及装置 | |
CN112164391A (zh) | 语句处理方法、装置、电子设备及存储介质 | |
CN111898031A (zh) | 一种获得用户画像的方法及装置 | |
CN109992781B (zh) | 文本特征的处理方法、装置和存储介质 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN112015986B (zh) | 数据推送方法、装置、电子设备及计算机可读存储介质 | |
CN113222653A (zh) | 一种程序化广告用户受众扩展方法、系统、设备及存储介质 | |
CN111368138A (zh) | 视频类别标签的排序方法、装置、电子设备及存储介质 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN113570416B (zh) | 投放内容确定方法、装置、电子设备及存储介质 | |
CN114090401A (zh) | 处理用户行为序列的方法及装置 | |
US20180239790A1 (en) | Provision device, provision method and non-transitory computer readable storage medium | |
CN112330426A (zh) | 一种产品推荐方法、装置及存储介质 | |
CN117611272A (zh) | 商品推荐方法、装置及电子设备 | |
CN113011911A (zh) | 基于人工智能的数据预测方法、装置、介质及电子设备 | |
CN117036783A (zh) | 低延时纵向联邦学习的信息分类系统、方法及应用 | |
CN115344774A (zh) | 用户账号的筛选方法、装置及服务器 | |
CN114463590A (zh) | 信息处理方法、装置、设备、存储介质及程序产品 | |
GB2608112A (en) | System and method for providing media content | |
CN115392943A (zh) | 发送展示信息的方法、装置、设备和存储介质 | |
CN112446738A (zh) | 广告数据处理方法、装置、介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |