CN117408786B - 一种基于门控机制的物品推荐方法及装置 - Google Patents
一种基于门控机制的物品推荐方法及装置 Download PDFInfo
- Publication number
- CN117408786B CN117408786B CN202311686377.2A CN202311686377A CN117408786B CN 117408786 B CN117408786 B CN 117408786B CN 202311686377 A CN202311686377 A CN 202311686377A CN 117408786 B CN117408786 B CN 117408786B
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- target
- features
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000007246 mechanism Effects 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 57
- 230000004927 fusion Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 16
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000003542 behavioural effect Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种基于门控机制的物品推荐方法及装置。该方法包括:确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;将各抽象特征与目标权重进行加权融合,以确定目标用户的组合特征;将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征;利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。本申请解决了物品推荐时的新用户冷启动问题。
Description
技术领域
本申请涉及物品推荐技术领域,尤其涉及一种基于门控机制的物品推荐方法及装置。
背景技术
在房源推荐等序列推荐任务中,目前常用的技术手段是基于卷积神经网络的序列推荐模型。该模型通过卷积层提取输入序列的局部特征,池化层提取特征,再通过全连接层实现特征组合和分类。但是,这种模型过分强调性能,只关注局部特征提取,更容易受数据稀疏问题影响,导致对新用户的推荐效果较差。
而在房源推荐系统实际应用中,由于新用户在平台上的行为数据较少,传统模型训练时往往优化了对老用户的拟合,对新用户的特点拟合不足。直接将新老用户的特征输入同一模型,也无法解决新用户的冷启动问题。
发明内容
有鉴于此,本申请实施例提供了一种基于门控机制的物品推荐方法及装置,以解决现有技术中用户信息不足时推荐系统效果不佳的问题。
本申请实施例的第一方面,提供了一种基于门控机制的物品推荐方法,包括:
确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;
将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;
将各抽象特征与目标权重进行加权融合,以确定目标用户的组合特征;
将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征;
利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。
本申请实施例的第二方面,提供了一种基于门控机制的物品推荐装置,包括:
数据确定模块,被配置为确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;
目标权重确定模块,被配置为将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;
组合特征确定模块,被配置为将各抽象特征与目标权重进行加权融合,以确定目标用户的组合特征;
第一匹配特征确定模块,被配置为将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征;
推荐结果确定模块,被配置为利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种可读存储介质,该可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:通过确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;根据各抽象特征和目标权重,确定目标用户的组合特征;将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定匹配特征; 利用组合特征和匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。本申请实施例解决了物品推荐时的新用户冷启动问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例提供的一种基于门控机制的物品推荐方法的流程示意图;
图2是本申请实施例提供的一种基于门控机制的物品推荐装置的结构示意图;
图3是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
下面将结合附图详细说明根据本申请实施例的一种基于门控机制的物品推荐方法和装置。
图1是本申请实施例提供的一种基于门控机制的物品推荐方法的流程示意图。如图1所示,该基于门控机制的物品推荐方法包括:
S101,确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;
S102,将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;
S103,将各抽象特征与目标权重进行加权融合,以确定目标用户的组合特征;
S104,将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征;
S105,利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。
具体地,当前的推荐系统面临着严峻的新用户冷启动问题,主要因为新用户的可训练数据相对较少,而传统推荐算法主要依赖于用户历史行为数据进行建模。这数据稀疏性使得传统方法在新用户情境下很难提供准确的推荐,因为模型无法充分理解这些新用户的兴趣和需求。此外,随着时间的推移,传统模型更容易过度适应老用户的行为数据,导致在新用户冷启动情况下推荐效果下降。
新用户通常只有很少的历史行为数据可供分析和建模。传统的协同过滤和个性化推荐算法依赖于用户历史行为数据,如房源点击、购买或评分等,以理解用户的兴趣和喜好。由于新用户缺乏这些数据,模型无法准确地了解他们的兴趣,从而导致冷启动问题。
新用户的信息不足以支持准确的推荐。传统推荐系统可能需要多次与用户进行交互才能逐渐了解其兴趣。然而,这种初始互动可能需要很长时间,而用户可能在等待期间失去兴趣,从而降低了推荐系统的效用。
传统推荐系统倾向于过度适应老用户的行为数据。这意味着模型更侧重于向老用户提供相关推荐,而对于新用户的需求则不够敏感。因此,在新用户冷启动时,模型可能会继续为老用户提供推荐,导致效果下降。
一种解决方法是将每个用户都训练一个独立的模型,以确保新用户不受老用户的影响。然而,这种方法在模型的训练和维护方面存在巨大的挑战,特别是随着用户数量的增加,系统的复杂性急剧上升。
每个用户训练一个独立模型可能需要大量的计算资源和存储空间。这会导致高昂的计算成本和需求更多的硬件基础设施,特别是在具有大量用户的平台上。此外,为每个用户维护模型还需要额外的工程和人力资源,增加了系统的管理和维护难度。
冷启动问题的本质在于新用户或信息不足的用户缺乏足够的历史操作记录,这使得传统的物品推荐方法难以提供准确的推荐。因此,可以通过结合多个用户的数据,以减少模型的数量和复杂性。例如,将用户分为不同的抽象群体,从而降低计算复杂性,同时可以更好地考虑用户之间的多样性和相似性。这样可以更好地平衡资源消耗和推荐质量,提高新用户冷启动问题的解决方案的实际可行性。
进一步地,在推荐系统中,确定目标用户的用户信息和目标物品的物品特征是为了建立用户和物品的描述性特征,以便进行个性化推荐。确定目标用户的用户信息是推荐系统的基础之一。这些信息通常包括用户的基本属性,例如在房源推荐中,确定目标用户的用户信息可能包括用户的年龄、性别、家庭成员构成,以及用户的特殊需求,如是否需要饲养宠物、是否有特殊的偏好,比如靠近学校或公共交通。例如,如果系统知道用户有两个孩子、有一只狗,就可以根据这些信息为其推荐适合该家庭的房源。
目标物品的物品特征描述了物品的各种属性,以帮助系统理解物品的特点和特性。这些特征通常包括物品的基本信息,如名称、类别、价格、销售情况,以及更具体的特征,如描述、标签、关键词、图片等。这些特征有助于区分不同物品,从而为用户提供更相关的推荐。
对于房源推荐,物品特征包括了房屋的各种属性。这可以包括房屋的类型(公寓、别墅)、价格范围、卧室和卫生间数量、面积大小、地理位置、设施(花园、停车位等)以及房屋的描述和图片。例如,如果用户正在寻找一间位于市中心、有三个卧室、有花园和停车位的别墅,系统需要根据这些特征匹配合适的房源。
用户类型标签是用于表示目标用户分类信息的特征。根据用户信息,系统可以将用户分类为不同的类型或群体,以更好地理解他们的需求。设置用户类型标签的目的是为了区分不同类型的用户,从而建立适合不同用户的个性化推荐模型。
用户类型标签可以表示用户是新用户还是老用户,新老用户在平台上的数据量存在明显差异。新用户通常没有足够的历史行为数据,如点击、购买或评分记录,供推荐系统建立个性化推荐。传统的协同过滤和个性化推荐算法依赖于用户的历史行为来了解其兴趣和偏好。由于新用户缺乏这些数据,传统算法很难提供准确的推荐,导致新用户冷启动问题。
用户特征是有关用户的详细描述,包括年龄、性别、家庭成员、特殊需求、偏好等。用户特征用于更细致的了解用户的兴趣和需求。除了用户类型标签之外,用户特征还可以包括,用户的偏好:如地段、户型、价格、装修、房龄;用户的行为:如点击、关注、线上咨询置业顾问、分享等。
即使是新用户,他们在注册时通常会提供一些基本信息,如年龄、性别、地理位置等。这些信息可以用于创建用户特征。虽然这些信息可能有限,但它们仍然是有用的。新用户虽然没有显式的历史行为数据,也可以利用隐式反馈数据。例如,他们的搜索关键词、浏览页面、停留时间等信息可以提供有关其兴趣的线索,并根据这些线索确定用户的用户特征。
每个抽象特征可以被设计成专注于描述某一特定类型用户的行为和兴趣。例如,一个抽象特征可以被训练来捕捉家庭用户的行为,如寻找大型住宅。另一个抽象特征可以专注于交通,寻找交通便利的房源。
抽象特征可以使用各种机器学习模型来构建。这可以包括神经网络、决策树、聚类模型等。不同模型可能对不同类型的数据分布更有效。例如,神经网络可能适用于复杂的数据模式,而决策树可以更好地处理离散型特征。
根据标签类型对应的标签特征作为门控网络的输入,用于让门控网络区分不同类型的用户。标签特征是指能够区分新老用户的特征,比如用户信息完整度、用户活跃时长等与新老用户属性强相关的特征。而一些与新老用户无关的特征,比如用户的姓名、职业等,则不用作为标签特征。
为了输入到门控网络中,这些标签需要转化为连续的标签特征。这可以通过词嵌入技术或独热编码等方式实现。标签特征的目的是将离散的标签映射到向量表示,以便神经网络能够处理它们。
门控网络通常是一个神经网络结构,其任务是根据标签特征来调整抽象特征的权重。这个网络接受标签特征作为输入,并生成用于加权抽象特征的权重系数。门控网络可以由多个分支或子网络组成,每个分支负责确定一个抽象特征的权重。门控网络的核心机制是确定各个抽象特征的目标权重。目标权重的作用是确保在不同用户类型之间分配适当的模型权重,以提供更准确和个性化的推荐。目标门控网络根据标签特征的输入来动态地分配权重,以便更好地适应不同类型用户的需求。
一旦门控网络确定了各个抽象特征的目标权重,这些权重被用来调整抽象特征的输出。不同权重的组合决定了每个抽象特征在组合特征中的贡献程度。这使得系统能够在不同用户类型之间灵活地适应,提供更准确的个性化推荐。
组合特征是根据目标用户选择多个相关的抽象特性进行组合,不同用户具有不同的特点和需求。通过组合特征,系统可以更好地捕捉用户多样性,综合抽象特征对目标用户进行建模,实现个性化推荐的效果。
利用用户类型标签,可以获得表示该标签的特征向量,即标签特征。标签特征包含了用户类别信息,输入门控网络,可以得到目标权重,它表示不同抽象特征的权重分布。而每个抽象特征本身也可以表示为一个特征向量,向量中的每个元素表示对应一种用户类型的建模能力。例如,元素1可以代表对新用户的拟合程度,元素2代表对女性用户的拟合程度,依此类推。
确定了目标权重和多个抽象特征后,就可以进行加权融合。在向量运算中,目标权重与抽象特征向量对应元素相乘,再求和,得到融合后的组合特征向量。这一组合特征向量即代表了基于目标用户确定的组合特征。
举例来说,假设有3个抽象特征,其向量分别为(0.7,0.3,0.5)、(0.5,0.8,0.4)、(0.6,0.2,0.9)。而根据某用户的标签特征,门控网络输出目标权重为(0.6,0.3,0.1)。针对第一个抽象特征,使用对应的目标权重:(0.7x0.6, 0.3x0.6, 0.5x0.6) = (0.42, 0.18,0.3);针对第二个抽象特征,使用对应的目标权重:(0.5x0.3, 0.8x0.3, 0.4x0.3) =(0.15, 0.24, 0.12);针对第三个抽象特征,使用对应的目标权重:(0.6x0.1, 0.2x0.1,0.9x0.1) = (0.06, 0.02, 0.09)。因此,组合结果为这三个部分的和,即(0.42+0.15+0.06, 0.18+0.24+0.02, 0.3+0.12+0.09) = (0.63, 0.44, 0.51)。所以,组合后的向量为(0.63, 0.44, 0.51)。这是根据目标权重对每个抽象特征向量进行加权平均得到的,代表了一个融合多个抽象特征的组合特征。
由于将其他同类用户的信息整合到组合特征中,并对各个抽象特征进行权重计算,系统能够在没有足够历史数据的情况下,反映新用户的潜在特性和兴趣。这种方法对解决用户冷启动问题非常有成效,因为它允许系统根据用户的属性和相似性信息生成有意义的推荐,从而提高了物品推荐的质量。
匹配模型的作用是用于计算用户和物品之间匹配程度的模型。通常采用多层全连接神经网络的结构,这样可以确定用户特征和物品特征之间的复杂关联。全连接网络由输入层、多隐藏层和输出层构成。输入层将用户和物品的特征向量拼接后输入。隐藏层对特征进行非线性转换,提取用户物品关联的抽象表示。输出层给出0-1范围的匹配分数。
第一匹配特征用于表示第一层全连接层中用户与物品之间的匹配程度,通常是向量表示,其中每个元素对应于不同的特征或维度。这些特征可以是连续值、二进制值或离散值,具体取决于问题的性质和模型的设计。
用户特征和物品特征先要进行预处理,将其转换为向量的形式。将用户特征向量和物品特征向量拼接在一起,输入到匹配模型的第一层全连接层。该层通常包含一个权重矩阵,将拼接后的拼接特征向量映射到一个新的隐层向量空间。这个映射实现了对输入特征的重新组合和转换,得到的隐层向量带有第一匹配特征包含的信息。
匹配模型的训练目标是最大化用户真实行为与模型输出匹配度之间的相关性。经过大量训练,匹配模型可以捕捉到用户对不同类型物品的偏好模式。但传统匹配网络存在过度泛化的问题。对于新用户,其特征较为匮乏,直接输入匹配模型,得到的初始匹配度准确性很低。
本申请实施例将组合特征与匹配模型进行连接,以解决这个问题。组合特征可以被视为一个用户的综合向量特征表示,其中包括了用户的类型信息、抽象特征和标签特征。这一综合特征考虑了用户的个性化属性和类型信息,有助于减轻新用户的数据稀疏问题。
全连接层后通常会将生成的匹配特征与组合特征进行相乘。组合特征通常包括用户特征和物品特征的元素级别相乘或其他操作。这一步的目的是进一步加强用户和物品之间的交互,从而更好地捕捉组合特征包含的用户标签。
将组合特征连接到匹配模型的隐藏层允许在整个模型中传递和整合这些特征。这可以增加特征的可用性,并在模型的多个层中进行信息传递,有助于更好地捕获用户的兴趣和偏好。隐藏层允许模型进行非线性建模,这对于处理用户冷启动问题很重要。通过非线性变换,模型可以更好地适应新用户和物品之间的复杂匹配关系。
将组合特征和匹配特征进行向量计算,通常在非底层的全连接层对这两个特征向量按元素相乘,这将产生一个是中间向量。其中,这个中间向量可以包含了更多的信息,用于后续的神经网络层,如全连接层,以更深入地挖掘用户和物品之间的关系和匹配特性,以进一步提高推荐系统的性能。这个中间向量作为下层全连接层的输入,通常会经过一系列的神经网络层次,以更好地建模用户和物品之间的关系。
将组合特征和匹配特征进行向量计算,通常在底层的全连接层对这两个特征向量进行点积运算,这将产生一个0-1之间的标量数值。通常在匹配模型的最后一层全连接层中用于计算用户对目标物品的点击率时使用点积运算。点击率可以被视为用户对目标物品的兴趣度,或者在推荐系统中常用的评分预测值。
根据点击率,可以确定目标物品的推荐结果。通常,会选择具有最高点击率的物品作为主要推荐。或者,也可以使用排序算法,将候选物品按点击率或互动度量排序,然后为用户提供排名较高的物品作为推荐结果。
根据本申请实施例提供的技术方案,通过确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;根据各抽象特征和目标权重,确定目标用户的组合特征;将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定匹配特征; 利用组合特征和匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。本申请实施例解决了物品推荐时的新用户冷启动问题。
在一些实施例中,用户类型标签包括,新用户标签和老用户标签,则根据用户信息确定目标用户的用户类型标签包括:确定用户信息与预设的全部信息之间的信息完整度;确定预设的完整度阈值;当信息完整度小于完整度阈值时,确定用户类型标签为新用户标签;当信息完整度不小于完整度阈值时,确定用户类型标签为老用户标签。
具体地,系统会考察目标用户提供的信息以及系统事先设定的期望的全部信息。这包括用户的基本属性、历史行为、兴趣等等。信息完整度表示用户提供的信息与期望信息的匹配度或覆盖度。如果用户提供的信息足够详尽,以至于它们涵盖了系统事先定义的全部信息,那么信息完整度就会很高。
预设的完整度阈值是一个系统事先设定的参数,它用于划定信息完整度的界限。预设的完整度阈值可以基于系统的需求和策略来确定。这个阈值通常会根据数据科学进行设定,以平衡用户体验和数据可用性。
当信息完整度与预设的完整度阈值进行比较,系统就可以确定目标用户的用户类型标签。如果信息完整度小于完整度阈值,系统会将用户类型标签确定为“新用户标签”。这意味着用户提供的信息相对较少或不够详尽,所以被视为新用户。如果信息完整度不小于完整度阈值,系统会将用户类型标签确定为“老用户标签”。这表示用户提供的信息足够详尽,因此可以视为老用户。
总之,确定新老用户标签是为了将用户分类为新用户和老用户,以便系统更好地针对他们的需求进行推荐。这个分类方法基于信息完整度,可以帮助系统更准确地处理新用户冷启动问题,同时也能更好地对待老用户。不同的阈值选择将在实践中根据系统的具体要求和用户群体的特点而有所不同。
在一些实施例中,还包括:利用聚类算法将样本用户进行分群处理,以确定样本用户对应的多个用户群体;提取用户群体对应的群体特征数据;基于群体特征数据确定抽象特征。
具体地,将用户分成不同的群体,每个群体具有相似的兴趣、行为。这使得系统能够更好地理解用户的需求,从而提供更个性化的推荐。例如,某些用户可能对公寓感兴趣,而另一些用户可能更倾向于别墅。分群可以帮助系统更好地区分这些不同的购房目标。
对于新用户,由于缺乏历史行为数据,传统的推荐系统难以提供准确的推荐。通过将新用户划分到相似的群体中,系统可以使用该群体的兴趣信息来进行初步的推荐,从而改善新用户的体验。
进一步地,采用聚类算法,例如K均值聚类、层次聚类等,对样本用户进行分群处理。这意味着用户将根据其相似性被分成不同的群体,其中相似性是根据用户的特征向量,如年龄、性别、地理位置等来定义的。聚类的目的是将具有相似特征的样本用户放在同一组,以后可以更好地理解他们的兴趣和行为。
当样本用户被分成不同的群体,就可以为每个群体提取群体特征数据。这些特征数据可以包括该群体的平均行为、偏好、兴趣等信息。这有助于更好地理解每个群体的特点。
当提取了每个用户群体的群体特征数据,接下来就是确定抽象特征。抽象特征通常是针对用户群体的一种高级描述,可以反映用户群体的共同特征。这些抽象特征可以是用户群体的平均兴趣、行为模式或特定特征的集合。基于群体特征数据,可以确定抽象特征来描述不同用户群体。
以在线房源出租推荐为例,用户可以根据其行为和属性被分为不同的群体,如“度假旅行者”、“商务旅行者”和“长期租户”。为每个群体提取群体特征数据,比如每个群体的平均预算、住宿类型偏好和入住时期。然后,基于这些群体特征数据,可以确定抽象特征,以更好地理解每个用户群体的特点
抽象特征通常采用向量的形式表示,使用向量形式的抽象特征可以更容易地与其他特征和权重进行数学运算,例如加权融合、点积等。这使得系统可以更有效地处理和计算这些特征。向量化的抽象特征通常具有相同的维度,这使得它们可以在数学上更容易地进行比较和组合。这种一致性有助于确保数据的完整性和兼容性。
在一些实施例中,还包括:确定初始门控网络;构建初始门控网络的训练数据集;训练数据集包括,训练用户的训练特征;确定训练特征对应的标注信息;标注信息包括训练特征对应的各抽象特征的实际权重;将训练特征输入初始门控网络,以使初始门控网络输出预测权重;利用预测权重和标注信息,基于预设的损失函数确定初始门控网络的损失指数;当损失指数不满足预设的训练条件时,调整初始门控网络的超参数;当损失指数满足训练条件时,确定初始门控网络为目标门控网络。
具体地,推荐系统的一个主要目标是提供个性化的建议,以满足不同用户的兴趣和需求。训练门控网络可以帮助系统理解用户的兴趣,因为不同用户可能对不同的特征或属性有不同的偏好。通过为每个用户动态确定抽象特征的权重,可以更好地满足其需求,提供个性化的推荐。
通过学习,门控网络可以更准确地为每个用户衡量不同抽象特征的重要性。这可以帮助推荐系统更精确地预测用户是否会对某个物品产生兴趣,从而提高推荐的准确性。
进一步地,首先,需要确定门控网络的初始结构。这包括确定网络的层数、每个层的神经元数量、激活函数等。初始门控网络需要一组权重参数来执行标签特征到抽象特征的映射。这些参数通常在训练之前需要初始化。初始化的方法可以包括随机初始化、零初始化或者使用预训练的模型参数。合适的初始化方法有助于网络在训练初期更容易收敛到合适的解。
初始门控网络的结构包括网络的深度、每一层的神经元数量等。这些结构参数需要在设计网络时确定。一般来说,门控网络的结构需要足够的容量来捕获标签特征与抽象特征之间的复杂关系,但同时需要避免过拟合。
为了训练初始门控网络,需要准备训练数据集。这个数据集应包括大量的训练样本,每个样本包括用户的训练特征。训练特征指的是训练数据集中的标签特征,它们是从用户的数据中提取出来的用于训练门控网络的特征。这些特征可能包括用户的个人信息、历史行为、兴趣等,用于描述用户的属性和偏好。
标注信息的目的是为了指导门控网络在训练期间学习如何映射标签特征到抽象特征对应的权重。标注信息提供了网络在前向传播和反向传播期间计算误差的关键依据。标注信息通常是真实或合成的数据,用于告诉门控网络它的权重输出应该接近什么。
在门控网络中,抽象模型的实际权重是门控网络需要学习的参数。每个抽象特征都有一个对应的权重,这个权重决定了标签特征如何映射到抽象特征。实际权重是需要在训练中不断调整以获得最佳性能的参数。
生成标注信息通常需要一些先验知识或合成数据。在实际应用中,可以使用用户行为数据来获得实际的权重信息。例如,可以使用用户的点击数据或购买行为来估计用户对抽象特征的偏好权重。在一些标签特征对应的抽象特征中,权重可能被设定为0,表示它们对该抽象特征没有影响。
损失函数是用于衡量门控网络的预测权重与标注信息之间的误差的度量。损失函数的选择取决于具体的问题和模型架构。常见的损失函数包括均方误差、均方根误差、交叉熵损失等。选择适当的损失函数有助于优化门控网络的权重预测。
训练条件是定义何时停止训练的条件。这些条件通常包括损失指数达到某个阈值、训练轮次达到某个限制、验证集性能不再提高等。训练终止条件的设置是为了避免过拟合,同时确保模型能够充分学习。
损失指数是损失函数计算的结果,代表了门控网络在当前权重预测下的性能。损失指数通常在训练过程中会被监测,以了解模型的训练进展。如果损失指数不满足预设的训练条件,通常是要求它逐渐减小,那么需要调整门控网络的超参数以改进模型。
门控网络的性能和训练速度可能受到超参数的影响。当损失指数不满足训练条件时,可能需要尝试不同的学习率、正则化参数、隐藏层的大小等来调整门控网络的超参数,以获得更好的训练结果。
当损失指数满足训练条件时,所述初始门控网络将被确定为目标门控网络。这意味着门控网络已经学会了准确预测标签特征与抽象特征之间的权重,可以用于推荐系统中。
总的来说,整个训练过程的目标是优化门控网络,以使其能够准确地学习标签特征与抽象特征之间的关系,从而提高推荐的准确性和个性化。这需要经过多轮的训练和参数调整,以确保最终确定的目标门控网络在训练集和验证集上都表现良好。
在一些实施例中,匹配模型包括多个全连接层,各全连接层包括权重特征;则将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征包括:在第一全连接层将用户特征和物品特征进行拼接,以得到拼接特征;根据拼接特征和第一全连接层对应的第一权重特征的第一数量乘积确定第一匹配特征。
具体地,匹配模型通常由多个全连接层组成,每个全连接层包含了一组权重特征。这些层可以是神经网络的一部分,用于在输入数据上执行线性变换和非线性激活函数,以学习和捕捉用户和物品之间的复杂关系。第一全连接层通常是指在神经网络的隐藏层中的第一个全连接层。
在第一全连接层,用户特征和物品特征通常被拼接在一起以创建一个更大的特征向量。用户特征和物品特征通常都以向量的形式表示,这些向量包括各种信息,如用户的年龄、性别、历史行为,以及物品的属性、类别、质量等。这种向量化表示使得可以在匹配模型中进行有效处理和分析,以便确定用户与物品之间的匹配程度。向量化的特点使得计算和处理更为灵活,同时也有助于模型捕捉不同特征之间的交互信息,以提供更准确和个性化的推荐结果。例如,如果用户特征是一个长度为A的向量,而物品特征是一个长度为B的向量,那么拼接特征将成为一个长度为A+B的向量。
将用户特征和物品特征的信息结合在一起,以便模型能够在这些特征之间建立关系。拼接特征是将用户和物品特征组合在一起后的结果。这个拼接特征是一个更大的向量,包含了用户和物品信息,可以更好地用于后续的计算。
进一步地,通常情况下,全连接层中的权重特征以权重矩阵的形式存在。多层全连接层中的每层的权重矩阵是不同的。每个全连接层都有自己独立的权重矩阵,这些权重矩阵用于学习该层的特定特征表示和模型参数。权重特征可以在全连接层中被用来调整不同特征的影响程度。它们帮助网络自动地学习哪些特征更重要,而哪些特征不那么关键。
每个全连接层都有相应的权重特征,这些权重特征用于学习如何将输入特征映射到输出特征。在第一全连接层,拼接特征将与该层对应的第一权重特征进行相乘操作。这通常是一个逐元素的相乘操作,其中拼接特征的每个元素都与相应的权重特征元素相乘。
相乘操作的结果是第一匹配特征。这个特征可以被视为一个表示用户与物品之间匹配程度的特征。它的值表示用户特征和物品特征如何相互作用,从而反映了用户对特定物品的兴趣程度或匹配度。第一匹配特征通常是一个向量形式的特征,这个特征向量包含了关于用户与物品之间的匹配程度的信息,它的值可以表示用户对特定物品的兴趣或推荐的程度。
在一些实施例中,利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率包括:在第一全连接层中,将组合特征和第一匹配特征进行元素相乘,以生成第一融合特征;将第一融合特征传递至第二全连接层;在第二全连接层中,根据第一融合特征与第二全连接层对应的第二权重特征的第二数量乘积确定第二匹配特征;当第二全连接层为非底层全连接层时,将组合特征和第二匹配特征进行元素相乘,以生成第二融合特征;将第二融合特征传递至第三全连接层;当第二全连接层为底层全连接层时,将组合特征和第二匹配特征进行点积相乘,以生成目标用户对于目标物品的点击率。
具体地,在第一全连接层,组合特征和第一匹配特征通常会逐元素相乘。这意味着相乘操作会将这两个特征向量的相应元素相乘,生成一个新的向量,这个新向量被称为第一融合特征。
第一融合特征是通过元素相乘操作生成的。它包含了组合特征和第一匹配特征之间的元素级乘积结果。通过元素相乘,组合特征中的用户类型标签可以与其他特征进行交互。这意味着用户类型标签可能对于描述用户与物品之间的匹配程度或兴趣度起到重要作用。可以通过如下公式表示第一融合特征的计算过程:
其中,表示第一融合特征;/>表示超参数,是在目标门控网络建立的过程中确定的;/>表示标签特征;/>表示目标门控网络,其输入/>后可以输出组合特征;/>表示第一权重特征;/>表示拼接特征,是由用户特征和物品特征进行向量拼接后确定的。
生成的第一融合特征通常会被传递到匹配模型中的下一层,即第二全连接层。在第二全连接层中,第一融合特征通常会被与该层对应的第二权重特征进行操作。这个操作通常是逐元素相乘,类似于第一全连接层的操作。逐元素相乘的结果将生成第二匹配特征,这个特征反映了第一融合特征与第二全连接层的第二权重特征之间的交互信息。
如果第二全连接层不是底层全连接层,即最后一层的全连接层,通常会进行组合特征和第二匹配特征之间的元素相乘,以生成第二融合特征。这个操作类似于前一层的操作,它有助于更深层次地改进特征表示,捕捉到第二匹配特征与组合特征之间的交互信息。
生成的第二融合特征通常会被传递到模型的下一个全连接层,即第三全连接层。在这一层中,它将与该层对应的权重特征进行操作,通常是逐元素相乘或其他线性操作。这将生成下一层的匹配特征,以进一步改进特征表示。
当第二全连接层是底层全连接层时,将组合特征和第二匹配特征进行点积相乘是为了生成目标用户对于目标物品的点击率估计。这个步骤将产生一个标量值,该值表示用户对目标物品的兴趣程度或点击率的估计。
点积操作是一种数学操作,通常用于计算两个向量之间的相似度或匹配度。在这种情况下,组合特征和第二匹配特征是两个向量,它们被点积相乘以生成一个标量值。这个标量值表示了用户与目标物品之间的匹配程度。
生成的标量值代表目标用户对目标物品的点击率估计。如果这个值较高,那么模型认为用户更有可能对该物品产生兴趣并点击它。这是推荐系统的核心目标之一,即为每个用户对每个物品生成个性化的点击率。
点击率通常表示为介于0和1之间的标量数值,用于表示用户对某个物品的兴趣程度或点击的概率。0表示用户对物品没有兴趣或者不太可能点击该物品。1表示用户对物品非常感兴趣或者非常可能点击该物品。0到1之间的值:表示兴趣程度的相对程度,越接近1表示用户对物品的兴趣越高。
在一些实施例中,根据点击率确定目标物品的推荐结果包括:根据各点击率,将各目标物品进行点击排序;基于点击排序的排序结果确定推荐结果。
具体地,根据用户的个性化点击率,每个目标物品都有一个相应的点击率。这些点击率是实数数值,通常介于0和1之间,表示用户对每个物品的兴趣程度。点击率排序的目标是将这些点击率从高到低排序,以确定用户对哪些物品可能更感兴趣。
一旦计算出每个物品的点击率并进行排序,就可以生成排序结果。物品按照它们的点击率从高到低排列。排在前面的物品被认为是用户最可能感兴趣的,因此它们将包括在推荐列表的顶部。
最终的推荐结果是基于排序结果生成的。通常,系统会根据用户的需求或平台的规则,确定推荐的数量,例如,可以生成一个包含前N个物品的推荐列表。这个推荐列表将被呈现给用户,供其选择和互动。
每个用户都会根据他们的点击率估计看到不同的推荐列表。这种个性化方法旨在提高用户体验,帮助用户找到他们最有兴趣的物品。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图2是本申请实施例提供的一种基于门控机制的物品推荐装置的示意图。如图2所示,该基于门控机制的物品推荐装置包括:
数据确定模块201,被配置为确定目标用户的用户信息;并确定目标物品的物品特征;根据用户信息确定目标用户的用户类型标签,以及目标用户的用户特征;
目标权重确定模块202,被配置为将用户类型标签对应的标签特征输入预设的目标门控网络,以使目标门控网络基于标签特征确定预设的各抽象特征对应的目标权重;
组合特征确定模块203,被配置为将各抽象特征与目标权重进行加权融合,以确定目标用户的组合特征;
第一匹配特征确定模块204,被配置为将用户特征和物品特征输入预设的匹配模型,以使匹配模型基于用户特征和物品特征确定第一匹配特征;
推荐结果确定模块205,被配置为利用组合特征和第一匹配特征进行向量计算,以确定目标用户对于目标物品的点击率,并根据点击率确定目标物品的推荐结果。
在一些实施例中,图2中的数据确定模块201确定用户信息与预设的全部信息之间的信息完整度;确定预设的完整度阈值;当信息完整度小于完整度阈值时,确定用户类型标签为新用户标签;当信息完整度不小于完整度阈值时,确定用户类型标签为老用户标签。
在一些实施例中,图2中的目标权重确定模块202利用聚类算法将样本用户进行分群处理,以确定样本用户对应的多个用户群体;提取用户群体对应的群体特征数据;基于群体特征数据确定抽象特征。
在一些实施例中,图2中的目标权重确定模块202确定初始门控网络;构建初始门控网络的训练数据集;训练数据集包括,训练用户的训练特征;确定训练特征对应的标注信息;标注信息包括训练特征对应的各抽象特征的实际权重;将训练特征输入初始门控网络,以使初始门控网络输出预测权重;利用预测权重和标注信息,基于预设的损失函数确定初始门控网络的损失指数;当损失指数不满足预设的训练条件时,调整初始门控网络的超参数;当损失指数满足训练条件时,确定初始门控网络为目标门控网络。
在一些实施例中,图2中的第一匹配特征确定模块204在第一全连接层将用户特征和物品特征进行拼接,以得到拼接特征;根据拼接特征和第一全连接层对应的第一权重特征的第一数量乘积确定第一匹配特征。
在一些实施例中,图2中的推荐结果确定模块205在第一全连接层中,将组合特征和第一匹配特征进行元素相乘,以生成第一融合特征;将第一融合特征传递至第二全连接层;在第二全连接层中,根据第一融合特征与第二全连接层对应的第二权重特征的第二数量乘积确定第二匹配特征;当第二全连接层为非底层全连接层时,将组合特征和第二匹配特征进行元素相乘,以生成第二融合特征;将第二融合特征传递至第三全连接层;当第二全连接层为底层全连接层时,将组合特征和第二匹配特征进行点积相乘,以生成目标用户对于目标物品的点击率。
在一些实施例中,图2中的推荐结果确定模块205根据各点击率,将各目标物品进行点击排序;基于点击排序的排序结果确定推荐结果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图3是本申请实施例提供的电子设备3的示意图。如图3所示,该实施例的电子设备3包括:处理器301、存储器302以及存储在该存储器302中并且可在处理器301上运行的计算机程序303。处理器301执行计算机程序303时实现上述各个方法实施例中的步骤。或者,处理器301执行计算机程序303时实现上述各装置实施例中各模块/单元的功能。
电子设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备3可以包括但不仅限于处理器301和存储器302。本领域技术人员可以理解,图3仅仅是电子设备3的示例,并不构成对电子设备3的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器301可以是中央处理单元(CentralProcessingUnit,CPU),也可以是其它通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器302可以是电子设备3的内部存储单元,例如,电子设备3的硬盘或内存。存储器302也可以是电子设备3的外部存储设备,例如,电子设备3上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。存储器302还可以既包括电子设备3的内部存储单元也包括外部存储设备。存储器302用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质(例如计算机可读存储介质)中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (9)
1.一种基于门控机制的物品推荐方法,其特征在于,包括:
确定目标用户的用户信息;并确定目标物品的物品特征;根据所述用户信息确定所述目标用户的用户类型标签,以及所述目标用户的用户特征;
将所述用户类型标签对应的标签特征输入预设的目标门控网络,以使所述目标门控网络基于所述标签特征确定预设的各抽象特征对应的目标权重;
将各所述抽象特征与所述目标权重进行加权融合,以确定所述目标用户的组合特征;
将所述用户特征和所述物品特征输入预设的匹配模型,以使所述匹配模型基于所述用户特征和所述物品特征确定第一匹配特征;
利用所述组合特征和所述第一匹配特征进行向量计算,以确定所述目标用户对于所述目标物品的点击率,并根据所述点击率确定所述目标物品的推荐结果;
所述匹配模型包括多个全连接层,各所述全连接层包括权重特征;所述利用所述组合特征和所述第一匹配特征进行向量计算,以确定所述目标用户对于所述目标物品的点击率,包括:
在第一全连接层中,将所述组合特征和所述第一匹配特征进行元素相乘,以生成第一融合特征;将所述第一融合特征传递至第二全连接层;
在所述第二全连接层中,根据所述第一融合特征与所述第二全连接层对应的第二权重特征的第二数量乘积确定第二匹配特征;
当所述第二全连接层为非底层全连接层时,将所述组合特征和所述第二匹配特征进行元素相乘,以生成第二融合特征;将所述第二融合特征传递至第三全连接层;
当所述第二全连接层为底层全连接层时,将所述组合特征和所述第二匹配特征进行点积相乘,以生成所述目标用户对于所述目标物品的所述点击率。
2.根据权利要求1所述的方法,其特征在于,所述用户类型标签包括,新用户标签和老用户标签,则所述根据所述用户信息确定所述目标用户的用户类型标签包括:
确定所述用户信息与预设的全部信息之间的信息完整度;
确定预设的完整度阈值;
当所述信息完整度小于所述完整度阈值时,确定所述用户类型标签为所述新用户标签;
当所述信息完整度不小于所述完整度阈值时,确定所述用户类型标签为所述老用户标签。
3.根据权利要求1所述的方法,其特征在于,还包括:
利用聚类算法将样本用户进行分群处理,以确定所述样本用户对应的多个用户群体;
提取所述用户群体对应的群体特征数据;
基于所述群体特征数据确定所述抽象特征。
4.根据权利要求3所述的方法,其特征在于,还包括:
确定初始门控网络;构建所述初始门控网络的训练数据集;所述训练数据集包括,训练用户的训练特征;
确定所述训练特征对应的标注信息;所述标注信息包括所述训练特征对应的各所述抽象特征的实际权重;
将所述训练特征输入所述初始门控网络,以使所述初始门控网络输出预测权重;
利用所述预测权重和所述标注信息,基于预设的损失函数确定所述初始门控网络的损失指数;
当所述损失指数不满足预设的训练条件时,调整所述初始门控网络的超参数;
当所述损失指数满足所述训练条件时,确定所述初始门控网络为所述目标门控网络。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述将所述用户特征和所述物品特征输入预设的匹配模型,以使所述匹配模型基于所述用户特征和所述物品特征确定第一匹配特征包括:
在第一全连接层将所述用户特征和所述物品特征进行拼接,以得到拼接特征;
根据所述拼接特征和所述第一全连接层对应的第一权重特征的第一数量乘积确定所述第一匹配特征。
6.根据权利要求1所述的方法,其特征在于,所述根据所述点击率确定所述目标物品的推荐结果包括:
根据各所述点击率,将各所述目标物品进行点击排序;
基于所述点击排序的排序结果确定所述推荐结果。
7.一种基于门控机制的物品推荐装置,其特征在于,包括:
数据确定模块,被配置为确定目标用户的用户信息;并确定目标物品的物品特征;根据所述用户信息确定所述目标用户的用户类型标签,以及所述目标用户的用户特征;
目标权重确定模块,被配置为将所述用户类型标签对应的标签特征输入预设的目标门控网络,以使所述目标门控网络基于所述标签特征确定预设的各抽象特征对应的目标权重;
组合特征确定模块,被配置为将各所述抽象特征与所述目标权重进行加权融合,以确定所述目标用户的组合特征;
第一匹配特征确定模块,被配置为将所述用户特征和所述物品特征输入预设的匹配模型,以使所述匹配模型基于所述用户特征和所述物品特征确定第一匹配特征;
推荐结果确定模块,被配置为利用所述组合特征和所述第一匹配特征进行向量计算,以确定所述目标用户对于所述目标物品的点击率,并根据所述点击率确定所述目标物品的推荐结果;
所述匹配模型包括多个全连接层,各所述全连接层包括权重特征;所述推荐结果确定模块具体被配置为:在第一全连接层中,将所述组合特征和所述第一匹配特征进行元素相乘,以生成第一融合特征;将所述第一融合特征传递至第二全连接层;在所述第二全连接层中,根据所述第一融合特征与所述第二全连接层对应的第二权重特征的第二数量乘积确定第二匹配特征;当所述第二全连接层为非底层全连接层时,将所述组合特征和所述第二匹配特征进行元素相乘,以生成第二融合特征;将所述第二融合特征传递至第三全连接层;当所述第二全连接层为底层全连接层时,将所述组合特征和所述第二匹配特征进行点积相乘,以生成所述目标用户对于所述目标物品的所述点击率。
8.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述方法的步骤。
9.一种可读存储介质,所述可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311686377.2A CN117408786B (zh) | 2023-12-11 | 2023-12-11 | 一种基于门控机制的物品推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311686377.2A CN117408786B (zh) | 2023-12-11 | 2023-12-11 | 一种基于门控机制的物品推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117408786A CN117408786A (zh) | 2024-01-16 |
CN117408786B true CN117408786B (zh) | 2024-04-16 |
Family
ID=89496431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311686377.2A Active CN117408786B (zh) | 2023-12-11 | 2023-12-11 | 一种基于门控机制的物品推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117408786B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860998A (zh) * | 2021-02-08 | 2021-05-28 | 浙江大学 | 一种基于多任务学习机制的点击率预估方法 |
CN115510322A (zh) * | 2022-09-28 | 2022-12-23 | 西安工业大学 | 一种基于深度学习的多目标优化推荐方法 |
CN115618235A (zh) * | 2022-11-04 | 2023-01-17 | 支付宝(杭州)信息技术有限公司 | 一种推荐模型的训练方法及装置 |
CN116257691A (zh) * | 2023-04-12 | 2023-06-13 | 杭州电子科技大学上虞科学与工程研究院有限公司 | 基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法 |
CN116308634A (zh) * | 2023-02-20 | 2023-06-23 | 达而观信息科技(上海)有限公司 | 基于行为序列和权重共享的双塔模型推荐方法及装置 |
CN116340635A (zh) * | 2023-03-30 | 2023-06-27 | 中国农业银行股份有限公司 | 物品推荐方法、模型训练方法、装置及设备 |
CN116578875A (zh) * | 2023-07-12 | 2023-08-11 | 深圳须弥云图空间科技有限公司 | 基于多行为的点击预测模型训练方法及装置 |
CN116757747A (zh) * | 2023-05-17 | 2023-09-15 | 河南大学 | 基于行为序列和特征重要性的点击率预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114519143B (zh) * | 2022-02-18 | 2024-05-14 | 北京百度网讯科技有限公司 | 课程推荐模型的训练方法、课程推荐方法及装置 |
-
2023
- 2023-12-11 CN CN202311686377.2A patent/CN117408786B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860998A (zh) * | 2021-02-08 | 2021-05-28 | 浙江大学 | 一种基于多任务学习机制的点击率预估方法 |
CN115510322A (zh) * | 2022-09-28 | 2022-12-23 | 西安工业大学 | 一种基于深度学习的多目标优化推荐方法 |
CN115618235A (zh) * | 2022-11-04 | 2023-01-17 | 支付宝(杭州)信息技术有限公司 | 一种推荐模型的训练方法及装置 |
CN116308634A (zh) * | 2023-02-20 | 2023-06-23 | 达而观信息科技(上海)有限公司 | 基于行为序列和权重共享的双塔模型推荐方法及装置 |
CN116340635A (zh) * | 2023-03-30 | 2023-06-27 | 中国农业银行股份有限公司 | 物品推荐方法、模型训练方法、装置及设备 |
CN116257691A (zh) * | 2023-04-12 | 2023-06-13 | 杭州电子科技大学上虞科学与工程研究院有限公司 | 基于潜在图结构挖掘和用户长短期兴趣融合的推荐方法 |
CN116757747A (zh) * | 2023-05-17 | 2023-09-15 | 河南大学 | 基于行为序列和特征重要性的点击率预测方法 |
CN116578875A (zh) * | 2023-07-12 | 2023-08-11 | 深圳须弥云图空间科技有限公司 | 基于多行为的点击预测模型训练方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117408786A (zh) | 2024-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021159776A1 (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
Pan et al. | Study on convolutional neural network and its application in data mining and sales forecasting for E-commerce | |
US20210004682A1 (en) | Adapting a sequence model for use in predicting future device interactions with a computing system | |
Yang et al. | Plateclick: Bootstrapping food preferences through an adaptive visual interface | |
El-Amir et al. | Deep learning pipeline: building a deep learning model with TensorFlow | |
US20220171760A1 (en) | Data processing method and apparatus, computer-readable storage medium, and electronic device | |
El Mohadab et al. | Predicting rank for scientific research papers using supervised learning | |
Li et al. | Universal representations: A unified look at multiple task and domain learning | |
CN114511387A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
Pang et al. | Efficient deep reinforcement learning-enabled recommendation | |
Nazari et al. | Scalable and data-independent multi-agent recommender system using social networks analysis | |
CN109885745A (zh) | 一种用户画像方法、装置、可读存储介质及终端设备 | |
Kuo et al. | An application of differential evolution algorithm-based restricted Boltzmann machine to recommendation systems | |
Latha et al. | Product recommendation using enhanced convolutional neural network for e-commerce platform | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
CN117408786B (zh) | 一种基于门控机制的物品推荐方法及装置 | |
CN109886299A (zh) | 一种用户画像方法、装置、可读存储介质及终端设备 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
Nguyen et al. | Short-term forecasting electricity load by long short-term memory and reinforcement learning for optimization of hyper-parameters | |
Xu et al. | Dynamic context removal: A general training strategy for robust models on video action predictive tasks | |
KR102536172B1 (ko) | 인공지능 기반 스포츠 창업 지원 플랫폼 서비스 제공 방법, 장치 및 시스템 | |
Li et al. | Key product review extraction based on the RLRSA-CL algorithm | |
Li et al. | Lean improvement of the stage shows in theme park based on consumer preferences correlation deep mining | |
KR102637198B1 (ko) | 인공지능 모델 제작 플랫폼을 통한 인공지능 모델 공유, 대여 및 판매방법, 장치 및 컴퓨터프로그램 | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |