CN117390295B - 基于掩码模块推荐对象的方法及装置 - Google Patents
基于掩码模块推荐对象的方法及装置 Download PDFInfo
- Publication number
- CN117390295B CN117390295B CN202311705866.8A CN202311705866A CN117390295B CN 117390295 B CN117390295 B CN 117390295B CN 202311705866 A CN202311705866 A CN 202311705866A CN 117390295 B CN117390295 B CN 117390295B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- mask
- module
- mask module
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 296
- 238000012545 processing Methods 0.000 claims abstract description 60
- 238000001914 filtration Methods 0.000 claims abstract description 39
- 238000013507 mapping Methods 0.000 claims description 25
- 230000002776 aggregation Effects 0.000 claims description 17
- 238000004220 aggregation Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 17
- 238000007499 fusion processing Methods 0.000 claims description 17
- 230000000873 masking effect Effects 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims 2
- 230000003993 interaction Effects 0.000 abstract description 19
- 239000010410 layer Substances 0.000 description 52
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 1
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000013047 polymeric layer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及数据处理技术领域,提供了一种基于掩码模块推荐对象的方法及装置,该方法包括:获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。本公开的技术方案可以引入掩码模块,能够更好地建模特征之间的交互关系,从而提升模型对特征交互的学习能力。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种基于掩码模块推荐对象的方法及装置。
背景技术
推荐系统在人们的日常生活中扮演着重要角色,无论是在网络购物、新闻阅读还是视频观看等方面,都可以看到其应用。其中,用户点击预测(Click Through Rate,CTR)模型是推荐系统中的关键任务之一,它用于估计用户点击某个物品的概率。CTR模型预估在推荐系统排序环节中起着重要的作用,通过对用户和商品特征进行建模和表达,将最有可能被用户点击的物品优先推送给用户,从而提升用户满意度和整个推荐系统的效率。
CTR模型预测的关键挑战之一是如何有效选择模型特征的交互。传统的线性模型(如线性回归)在实际应用中表现良好,但缺乏学习特征交互的能力。为了克服这一限制,基于因子分解机(Factorization Machine,FM)的模型被提出,通过特征向量的内积来建模特征之间的交互,并取得了良好的效果。
随着深度学习在计算机视觉和自然语言处理等领域的成功应用,越来越多的深度学习模型也被引入到CTR模型预测任务中,例如结合宽度和深度的模型(Wide and Deep,WDL)等。这些模型将原始的特征输入深度神经网络(DNN)中,学习显式或隐式的特征交互。
然而,上述CTR模型存在两个缺点。首先,它们的特征交互较为有限,有些特征是通过人工经验设计的,这种设计过程比较昂贵。其次,有用的特征交互往往很稀疏,使得模型从大量参数学习中有效地学习交互特征变得困难。
发明内容
有鉴于此,本公开实施例提供了一种基于掩码模块推荐对象的方法、装置、电子设备及计算机可读存储介质,以解决现有技术中模型从大量参数学习中有效地学习交互特征变得困难的技术问题。
本公开实施例的第一方面,提供了一种基于掩码模块推荐对象的方法,推荐模型中包含一个掩码模块,该方法包括:获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。
本公开实施例的第二方面,提供了一种基于掩码模块推荐对象的装置,推荐模型中包含一个掩码模块,该装置包括:获取模块,用于获取用户数据对应的初始特征向量;特征处理模块,用于对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;融合处理模块,用于对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;确定模块,用于根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;推荐模块,用于对目标特征向量进行预测处理,得到向用户推荐的对象集合。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:本公开实施例可以获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。本公开的技术方案可以引入掩码模块,能够更好地建模特征之间的交互关系,从而提升模型对特征交互的学习能力。通过掩码模块的权重调整,可以自动选择和调整不同特征的重要性,减少了人工设计特征的工作量。通过融合初始特征向量和掩码特征向量,以及利用目标特征向量进行预测处理,能够提升模型的预测准确性和推荐效果。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图;
图2是本公开实施例提供的一种基于掩码模块推荐对象的方法的流程示意图;
图3是本公开实施例提供的对初始特征向量进行特征处理的步骤的流程图;
图4是本公开实施例提供的确定掩码模块的目标特征向量的步骤的流程图;
图5是本公开实施例提供的一种基于掩码模块推荐对象的装置的结构示意图;
图6是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
需要说明的是,本公开所涉及的用户信息(包括但不限于终端设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
图1示出了可以应用本发明实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构100可以包括第一终端设备101、第二终端设备102、第三终端设备103中的一种或多种,网络104和服务器105。网络104用以在第一终端设备101、第二终端设备102、第三终端设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
用户可以使用第一终端设备101、第二终端设备102、第三终端设备103通过网络104与服务器105交互,以接收或发送数据等。第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器。例如服务器105可以从第一端设备103(也可以是第二终端设备102或第三终端设备103)获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。本公开的技术方案可以引入掩码模块,能够更好地建模特征之间的交互关系,从而提升模型对特征交互的学习能力。通过掩码模块的权重调整,可以自动选择和调整不同特征的重要性,减少了人工设计特征的工作量。通过融合初始特征向量和掩码特征向量,以及利用目标特征向量进行预测处理,能够提升模型的预测准确性和推荐效果。
在一些实施例中,本发明实施例所提供的基于掩码模块推荐对象的方法一般由服务器105执行,相应地,基于掩码模块推荐对象的装置一般设置于服务器105中。在另一些实施例中,某些终端设备可以具有与服务器相似的功能从而执行本方法。因此,本发明实施例所提供的基于掩码模块推荐对象的方法不限定在服务器端执行。
下面将结合附图详细说明根据本公开实施例的基于掩码模块推荐对象的方法和装置。
图2是本公开实施例提供的一种基于掩码模块推荐对象的方法的流程示意图。本公开实施例提供的方法可以由任意具备计算机处理能力的电子设备执行,例如电子设备可以是图1示出的服务器。
如图2所示,该基于掩码模块推荐对象的方法包括步骤S210至步骤S250。
在步骤S210中,获取用户数据对应的初始特征向量。
步骤S220,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。
在步骤S230中,对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量。
在步骤S240中,根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量。
在步骤S250中,对目标特征向量进行预测处理,得到向用户推荐的对象集合。
该方法可以获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。本公开的技术方案可以引入掩码模块,能够更好地建模特征之间的交互关系,从而提升模型对特征交互的学习能力。通过掩码模块的权重调整,可以自动选择和调整不同特征的重要性,减少了人工设计特征的工作量。通过融合初始特征向量和掩码特征向量,以及利用目标特征向量进行预测处理,能够提升模型的预测准确性和推荐效果。
在本公开一些实施例中,用户数据可以包括用户信息和用户与对象的交互信息。例如,用户信息可以是关于用户自身的一些信息,例如,性别、年龄、身高、体重、工作等等。用户与对象的交互信息可以是用户在过去一段时间内浏览过的物品、收藏过的物品、购买过的物品、转发过的商品等等。
在本公开一些实施例中,上述推荐模型可以是CTR模型,该推荐模型中可以包含嵌入层(即embedding层)、一个或多个掩码模块、预测层。掩码模块中包含归一化层、前馈网络、隐藏层。其中,前馈网络包括聚合层和映射层。在本实施例中,多个掩码模块通过自嵌套的方式进行连接。
在本公开一些实施例中,用户数据包括离散型数据集合和连续型数据集合。例如,离散型数据是指只能取有限个或可数个数值的数据。这些数据通常表示某种计数或计量的结果,例如性别、浏览次数、购买次数等。离散型数据的取值通常是整数或离散的类别,它们之间没有连续的数值关系。连续型数据是指可以取任意实数值的数据。这些数据通常表示某种测量或观测的结果,例如身高、体重、年龄等。连续型数据的取值可以是无限个,它们之间存在连续的数值关系。
在本公开一些实施例中,获取用户数据对应的初始特征向量包括:通过推荐模型中的嵌入层对离散型数据集合中的各个离散型数据进行处理,得到各个离散型数据对应的特征向量;通过推荐模型中的预设维度的特征向量,对连续型数据集合中的各个连续型数据进行处理,得到各个连续型数据对应的特征向量;根据各个离散型数据对应的特征向量和各个连续型数据对应的特征向量,确定用户数据对应的初始特征向量。例如,将离散型数据输入至embedding层,通过embedding层将离散型数据转化k为特征向量。对于连续型数据,通过乘一个k维特征向量将连续型数据转化成k为特征向量。将各个离散型数据对应的特征向量和各个连续型数据对应的特征向量进行拼接,得到用户数据对应的初始特征向量。具体参考下面公式:
其中,Vemb表示用户数据对应的初始特征向量,e1到ef表示各个离散型数据对应的特征向量或各个连续型数据对应的特征向量。
在公开一些实施例中,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。例如,将初始特征向量输入至掩码模块的前馈网络。通过该前馈网络中的聚合层和映射层进行处理,以此方式得到掩码模块的掩码特征向量。具体地,可以在前馈网络中应用实例引导的掩码(Instance-guided mask)方法来得到掩码特征向量。在本实施例中,聚合层可以从初始特征向量中提取全局上下文信息。映射层可以降低聚合层输出的结果的维度,以防止过拟合。
在公开一些实施例中,对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量。例如,使用元素积算法(例如,对应位置元素相乘)对初始特征向量和掩码特征向量进行融合,以此对特征层和前馈网络中重要的包含信息的特征进行强化,并且在掩码模块中引入了乘法操作,使得模型更加有效的捕捉到复杂的交互特征。
在公开一些实施例中,根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量。例如,将融合后的掩码过滤特征向量输入至掩码模块 的隐藏层,通过该隐藏层的权重来对掩码过滤特征向量进行优化,然后将对优化后的中间特征向量进行非线性映射处理,得到掩码模块的目标特征向量,以此方式得到的目标特征向量能够更好地表示输入特征的重要信息和关联关系。
在本公开一些实施例中,对目标特征向量进行预测处理,得到向用户推荐的对象集合。例如,将目标特征向量输入至推荐模型中的预测层,通过预测层对特征进行处理和学习,得出对不同对象的预测结果。根据预测结果,可以对对象集合进行排序或筛选,最终确定向用户推荐的对象集合,以此方式得到推荐结果更加准确。
在本公开一些实施例中,推荐模型中包含多个掩码模块,在对目标特征向量进行预测处理之前,方法还包括:将掩码模块的目标特征向量输入至与掩码模块相邻的下一个掩码模块;对掩码模块的目标特征向量和掩码特征向量进行融合处理,得到下一个掩码模块的掩码过滤特征向量;根据下一个掩码模块的掩码过滤特征向量和下一个掩码模块的权重,确定下一个掩码模块的目标特征向量;循环将上一个掩码模块的输出作为下一个掩码模块的输入,直至得到最后一个掩码模块的目标特征向量。例如,推荐模型中包含三个掩码模块,分别为掩码模块A、掩码模块B、掩码模块C。将初始特征向量输入至掩码模块A,经过归一化层、前馈网络、隐藏层的一系列处理得到掩码模块A的目标特征向量,然后将掩码模块A的目标特征向量和初始特征向量输入至掩码模块B,通过掩码模块B中的前馈网络对初始特征向量进行处理,得到掩码模块B的掩码特征向量,然后掩码模块A的目标特征向量和掩码模块B的掩码特征向量进行融合处理,得到掩码模块B的掩码过滤特征向量,通过掩码模块B的隐藏层对该掩码过滤特征向量进行处理,得到掩码模块B的目标特征向量,将掩码模块B的目标特征向量和初始特征向量输入至掩码模块C,然后进行同样的操作,得到掩码模块C的目标特征向量。这样能够对特征的交互信息进行不断的强化,以使得后续预测基于该掩码模块C的目标特征向量进行预测的结果更加准确,进一步提高向用户推荐对象的准确度。在本实施例中,掩码模块A、掩码模块B、掩码模块C通过自嵌套的连接,即串联连接形成掩码网络。
在本公开一些实施例中,方法还包括:对最后一个掩码模块的目标特征向量进行预测,得到多个待推荐对象的推荐概率;根据多个待推荐对象的推荐概率,向用户推荐目标对象。基于前述实施例,对掩码模块C的目标特征向量进行预测,得到多个待推荐对象的推荐概率,按照概率由大到小的顺序对多个待推荐对象的推荐概率进行排序,根据预设值k从排序结果取topk个待推荐对象的推荐概率,将k个待推荐对象推荐给用户,以此方式可以进一步提高推荐的准确度,进而提高用户点击推荐对象的概率。
图3是本公开实施例提供的对初始特征向量进行特征处理的步骤的流程图,如图3所示,步骤S220具体可以包括步骤S310和步骤S320。
在步骤S310中, 获取聚合层的权重和偏置参数和映射层的权重和偏置参数。
在步骤S320中,根据聚合层的权重和偏置参数和映射层的权重和偏置参数,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。
该方法可以根据聚合层的权重和偏置参数和映射层的权重和偏置参数,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量,以此方式可以提取初始特征向量中的全局上下文信息,还可以通过降低维度来避免过拟合。
在本公开一些实施例中,根据聚合层的权重和偏置参数和映射层的权重和偏置参数,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。例如,可以通过下面公式计算掩码模块的掩码特征向量:
其中,Vmask表示掩码模块的掩码特征向量,Wd1表示聚合层的权重,βd1表示聚合层的偏置参数,Wd2表示映射层的权重,βd2表示映射层的偏置参数,Relu为激活函数,Vemb表示用户数据对应的初始特征向量。
在本公开一些实施例中,在对初始特征向量和掩码特征向量进行融合处理之前,方法还包括:通过掩码模块中的归一化层对初始特征向量进行归一化处理,得到掩码模块的归一化特征向量。例如,通过下面公式对初始特征向量进行归一化处理,具体如下:
其中,Vemb表示用户数据对应的初始特征向量,LN_EMB(Vemb) 表示掩码模块的归一化特征向量,e1到ef表示各个离散型数据对应的特征向量或各个连续型数据对应的特征向量,LN表示归一化处理。
在本公开一些实施例中,对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量包括:通过元素积算法对归一化特征向量和掩码特征向量进行融合处理,获取掩码模块的掩码过滤特征向量。例如,元素积算法如下所示:
其中,VmaskedEMB表示掩码模块的掩码过滤特征向量,Vmask表示掩码模块的掩码特征向量,LN_EMB(Vemb) 表示掩码模块的归一化特征向量。
图4是本公开实施例提供的确定掩码模块的目标特征向量的步骤的流程图,如图4所示,步骤S240具体可以包括步骤S410和步骤S420。
在步骤S410中, 根据掩码过滤特征向量和隐藏层的权重,确定掩码模块的中间特征向量。
在步骤S420中,对掩码模块的中间特征向量进行非线性映射处理,得到掩码模块的目标特征向量。
该方法可以通过将融合后的掩码过滤特征向量输入到掩码模块的隐藏层,并通过隐藏层的权重进行优化和非线性映射处理,可以得到掩码模块的目标特征向量,该向量能够更好地表示输入特征的重要信息和关联关系。
在本公开一些实施例中,根据掩码过滤特征向量和隐藏层的权重,确定掩码模块的中间特征向量,并对掩码模块的中间特征向量进行非线性映射处理,得到掩码模块的目标特征向量。例如,通过下面公式计算掩码模块的目标特征向量,具体如下:
其中,Voutput表示掩码模块的目标特征向量,Relu为激活函数,Vmask表示掩码模块的掩码特征向量,LN_EMB(Vemb) 表示掩码模块的归一化特征向量,Wi表示掩码模块i中隐藏层的权重,LN表示归一化处理。
下述为本公开装置实施例,可以用于执行本公开方法实施例。下文描述的基于掩码模块推荐对象的装置与上文描述的基于掩码模块推荐对象的方法可相互对应参照。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图5是本公开实施例提供的一种基于掩码模块推荐对象的装置的结构示意图。
如图5所示,该基于掩码模块推荐对象的装置500包括获取模块510、特征处理模块520、融合处理模块530、确定模块540和推荐模块550。
具体地,获取模块510,用于获取用户数据对应的初始特征向量。
特征处理模块520,用于对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。
融合处理模块530,用于对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量。
确定模块540,用于根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量。
推荐模块550,用于对目标特征向量进行预测处理,得到向用户推荐的对象集合。
该基于掩码模块推荐对象的装置500可以获取用户数据对应的初始特征向量;对初始特征向量进行特征处理,得到掩码模块的掩码特征向量;对初始特征向量和掩码特征向量进行融合处理,得到掩码模块的掩码过滤特征向量;根据掩码过滤特征向量和掩码模块的权重,确定掩码模块的目标特征向量;对目标特征向量进行预测处理,得到向用户推荐的对象集合。本公开的技术方案可以引入掩码模块,能够更好地建模特征之间的交互关系,从而提升模型对特征交互的学习能力。通过掩码模块的权重调整,可以自动选择和调整不同特征的重要性,减少了人工设计特征的工作量。通过融合初始特征向量和掩码特征向量,以及利用目标特征向量进行预测处理,能够提升模型的预测准确性和推荐效果。
在本公开一些实施例中,掩码模块中包含聚合层和映射层,特征处理模块520被配置为:获取聚合层的权重和偏置参数和映射层的权重和偏置参数;根据聚合层的权重和偏置参数和映射层的权重和偏置参数,对初始特征向量进行特征处理,得到掩码模块的掩码特征向量。
在本公开一些实施例中,掩码模块中还包含归一化层;在对初始特征向量和掩码特征向量进行融合处理之前,基于掩码模块推荐对象的装置500还用于:通过掩码模块中的归一化层对初始特征向量进行归一化处理,得到掩码模块的归一化特征向量。
在本公开一些实施例中,融合处理模块530被配置为:通过元素积算法对归一化特征向量和掩码特征向量进行融合处理,获取掩码模块的掩码过滤特征向量。
在本公开一些实施例中,掩码模块中还包含隐藏层,掩码模块的权重为隐藏层的权重;确定模块540被配置为:根据掩码过滤特征向量和隐藏层的权重,确定掩码模块的中间特征向量;对掩码模块的中间特征向量进行非线性映射处理,得到掩码模块的目标特征向量。
在本公开一些实施例中,推荐模型中包含多个掩码模块,在对目标特征向量进行预测处理之前,基于掩码模块推荐对象的装置500还用于:将掩码模块的目标特征向量输入至与掩码模块相邻的下一个掩码模块;对掩码模块的目标特征向量和掩码特征向量进行融合处理,得到下一个掩码模块的掩码过滤特征向量;根据下一个掩码模块的掩码过滤特征向量和下一个掩码模块的权重,确定下一个掩码模块的目标特征向量;循环将上一个掩码模块的输出作为下一个掩码模块的输入,直至得到最后一个掩码模块的目标特征向量。
在本公开一些实施例中,基于掩码模块推荐对象的装置500还用于:对最后一个掩码模块的目标特征向量进行预测,得到多个待推荐对象的推荐概率;根据多个待推荐对象的推荐概率,向用户推荐目标对象。
在本公开一些实施例中,用户数据包括离散型数据集合和连续型数据集合,获取模块510被配置为:通过推荐模型中的嵌入层对离散型数据集合中的各个离散型数据进行处理,得到各个离散型数据对应的特征向量;通过推荐模型中的预设维度的特征向量,对连续型数据集合中的各个连续型数据进行处理,得到各个连续型数据对应的特征向量;根据各个离散型数据对应的特征向量和各个连续型数据对应的特征向量,确定用户数据对应的初始特征向量。
图6是本公开实施例提供的电子设备6的示意图。如图6所示,该实施例的电子设备6包括:处理器601、存储器602以及存储在该存储器602中并且可在处理器601上运行的计算机程序603。处理器601执行计算机程序603时实现上述各个方法实施例中的步骤。或者,处理器601执行计算机程序603时实现上述各装置实施例中各模块的功能。
电子设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备6可以包括但不仅限于处理器601和存储器602。本领域技术人员可以理解,图6仅仅是电子设备6的示例,并不构成对电子设备6的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器601可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器602可以是电子设备6的内部存储单元,例如,电子设备6的硬盘或内存。存储器602也可以是电子设备6的外部存储设备,例如,电子设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器602还可以既包括电子设备6的内部存储单元也包括外部存储设备。存储器602用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。
Claims (8)
1.一种基于掩码模块推荐对象的方法,其特征在于,推荐模型中包含多个所述掩码模块,该方法包括:
获取用户数据对应的初始特征向量;
对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量;
对所述初始特征向量和所述掩码特征向量进行融合处理,得到所述掩码模块的掩码过滤特征向量;
根据所述掩码过滤特征向量和所述掩码模块的权重,确定所述掩码模块的目标特征向量;
对所述目标特征向量进行预测处理,得到向用户推荐的对象集合;
其中,所述掩码模块中包含聚合层和映射层,对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量包括:
获取所述聚合层的权重和偏置参数和所述映射层的权重和偏置参数;
根据所述聚合层的权重和偏置参数和所述映射层的权重和偏置参数,对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量;
所述掩码模块中还包含隐藏层,所述掩码模块的权重为所述隐藏层的权重;
根据所述掩码过滤特征向量和所述掩码模块的权重,确定所述掩码模块的目标特征向量包括:根据所述掩码过滤特征向量和所述隐藏层的权重,确定所述掩码模块的中间特征向量;对所述掩码模块的中间特征向量进行非线性映射处理,得到所述掩码模块的目标特征向量;
所述对所述目标特征向量进行预测处理,得到向用户推荐的对象集合包括:将所述目标特征向量输入至推荐模型中的预测层,通过所述预测层对特征进行处理和学习,得出对不同对象的预测结果;根据所述预测结果,对所述对象集合进行排序或筛选,确定向用户推荐的对象集合。
2.根据权利要求1所述的方法,其特征在于,所述掩码模块中还包含归一化层;
在对所述初始特征向量和所述掩码特征向量进行融合处理之前,所述方法还包括:
通过所述掩码模块中的归一化层对所述初始特征向量进行归一化处理,得到所述掩码模块的归一化特征向量;
对所述初始特征向量和所述掩码特征向量进行融合处理,得到所述掩码模块的掩码过滤特征向量包括:
通过元素积算法对所述归一化特征向量和所述掩码特征向量进行融合处理,获取所述掩码模块的掩码过滤特征向量。
3.根据权利要求1所述的方法,其特征在于,所述推荐模型中包含多个所述掩码模块,在对所述目标特征向量进行预测处理之前,所述方法还包括:
将所述掩码模块的目标特征向量输入至与所述掩码模块相邻的下一个掩码模块;
对所述掩码模块的目标特征向量和所述掩码特征向量进行融合处理,得到所述下一个掩码模块的掩码过滤特征向量;
根据所述下一个掩码模块的掩码过滤特征向量和所述下一个掩码模块的权重,确定所述下一个掩码模块的目标特征向量;
循环将上一个掩码模块的输出作为下一个掩码模块的输入,直至得到最后一个掩码模块的目标特征向量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对所述最后一个掩码模块的目标特征向量进行预测,得到多个待推荐对象的推荐概率;
根据多个所述待推荐对象的推荐概率,向所述用户推荐目标对象。
5.根据权利要求1所述的方法,其特征在于,所述用户数据包括离散型数据集合和连续型数据集合,获取所述用户数据对应的初始特征向量包括:
通过所述推荐模型中的嵌入层对所述离散型数据集合中的各个离散型数据进行处理,得到各个离散型数据对应的特征向量;
通过所述推荐模型中的预设维度的特征向量,对所述连续型数据集合中的各个连续型数据进行处理,得到各个连续型数据对应的特征向量;
根据各个离散型数据对应的特征向量和各个连续型数据对应的特征向量,确定所述用户数据对应的初始特征向量。
6.一种基于掩码模块推荐对象的装置,其特征在于,推荐模型中包含一个所述掩码模块,该装置包括:
获取模块,用于获取用户数据对应的初始特征向量;
特征处理模块,用于对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量;
融合处理模块,用于对所述初始特征向量和所述掩码特征向量进行融合处理,得到所述掩码模块的掩码过滤特征向量;
确定模块,用于根据所述掩码过滤特征向量和所述掩码模块的权重,确定所述掩码模块的目标特征向量;
推荐模块,用于对所述目标特征向量进行预测处理,得到向用户推荐的对象集合;
其中,所述掩码模块中包含聚合层和映射层,对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量包括:
获取所述聚合层的权重和偏置参数和所述映射层的权重和偏置参数;
根据所述聚合层的权重和偏置参数和所述映射层的权重和偏置参数,对所述初始特征向量进行特征处理,得到所述掩码模块的掩码特征向量;
所述掩码模块中还包含隐藏层,所述掩码模块的权重为所述隐藏层的权重;
根据所述掩码过滤特征向量和所述掩码模块的权重,确定所述掩码模块的目标特征向量包括:根据所述掩码过滤特征向量和所述隐藏层的权重,确定所述掩码模块的中间特征向量;对所述掩码模块的中间特征向量进行非线性映射处理,得到所述掩码模块的目标特征向量;
所述对所述目标特征向量进行预测处理,得到向用户推荐的对象集合包括:将所述目标特征向量输入至推荐模型中的预测层,通过所述预测层对特征进行处理和学习,得出对不同对象的预测结果;根据所述预测结果,对所述对象集合进行排序或筛选,确定向用户推荐的对象集合。
7.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311705866.8A CN117390295B (zh) | 2023-12-13 | 2023-12-13 | 基于掩码模块推荐对象的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311705866.8A CN117390295B (zh) | 2023-12-13 | 2023-12-13 | 基于掩码模块推荐对象的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117390295A CN117390295A (zh) | 2024-01-12 |
CN117390295B true CN117390295B (zh) | 2024-03-15 |
Family
ID=89465336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311705866.8A Active CN117390295B (zh) | 2023-12-13 | 2023-12-13 | 基于掩码模块推荐对象的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117390295B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116450860A (zh) * | 2023-03-08 | 2023-07-18 | 清华大学 | 媒体资源推荐方法、推荐模型的训练方法及相关设备 |
CN117150145A (zh) * | 2023-10-31 | 2023-12-01 | 成都企软数字科技有限公司 | 一种基于大语言模型的个性化新闻推荐方法及系统 |
CN117171447A (zh) * | 2023-04-21 | 2023-12-05 | 江西师范大学 | 一种基于自注意力和对比学习的在线兴趣组推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220058489A1 (en) * | 2020-08-19 | 2022-02-24 | The Toronto-Dominion Bank | Two-headed attention fused autoencoder for context-aware recommendation |
-
2023
- 2023-12-13 CN CN202311705866.8A patent/CN117390295B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116450860A (zh) * | 2023-03-08 | 2023-07-18 | 清华大学 | 媒体资源推荐方法、推荐模型的训练方法及相关设备 |
CN117171447A (zh) * | 2023-04-21 | 2023-12-05 | 江西师范大学 | 一种基于自注意力和对比学习的在线兴趣组推荐方法 |
CN117150145A (zh) * | 2023-10-31 | 2023-12-01 | 成都企软数字科技有限公司 | 一种基于大语言模型的个性化新闻推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于半监督学习的骨科植入物推荐系统应用研究;邱禧荷;李琼;谭晓宇;陈珏;;传感器与微系统;20201027(11);第17-19页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117390295A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
WO2022041982A1 (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN112085565A (zh) | 基于深度学习的信息推荐方法、装置、设备及存储介质 | |
US12020267B2 (en) | Method, apparatus, storage medium, and device for generating user profile | |
Wang et al. | Recurrent recommendation with local coherence | |
CN115631012A (zh) | 目标推荐方法及装置 | |
CN112116426A (zh) | 一种推送物品信息的方法和装置 | |
CN116911954B (zh) | 基于兴趣和流行度推荐物品的方法及装置 | |
CN110085292A (zh) | 药品推荐方法、装置及计算机可读存储介质 | |
CN115482021A (zh) | 多媒体信息推荐方法、装置、电子设备及存储介质 | |
CN112258285A (zh) | 一种内容推荐方法及装置、设备、存储介质 | |
CN117390295B (zh) | 基于掩码模块推荐对象的方法及装置 | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN116127083A (zh) | 内容推荐方法、装置、设备及存储介质 | |
CN116501993B (zh) | 房源数据推荐方法及装置 | |
CN110162714A (zh) | 内容推送方法、装置、计算设备和计算机可读存储介质 | |
CN116911955B (zh) | 目标推荐模型的训练方法及装置 | |
Hien et al. | A Deep Learning Model for Context Understanding in Recommendation Systems | |
CN115455306B (zh) | 推送模型训练、信息推送方法、装置和存储介质 | |
CN116468507A (zh) | 目标推荐方法及装置 | |
CN118364172A (zh) | 对象推荐方法、装置、电子设备及可读存储介质 | |
CN117573970A (zh) | 一种基于内容理解的信息流推荐系统、方法、设备及介质 | |
CN117473155A (zh) | 一种交互结果预估模型的训练方法及装置 | |
CN118628201A (zh) | 产品推荐方法、产品推荐模型的训练方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |