CN113761359B - 数据包推荐方法、装置、电子设备和存储介质 - Google Patents

数据包推荐方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113761359B
CN113761359B CN202110523329.6A CN202110523329A CN113761359B CN 113761359 B CN113761359 B CN 113761359B CN 202110523329 A CN202110523329 A CN 202110523329A CN 113761359 B CN113761359 B CN 113761359B
Authority
CN
China
Prior art keywords
data packet
recommended
user
candidate data
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110523329.6A
Other languages
English (en)
Other versions
CN113761359A (zh
Inventor
陆元福
王伟
杨海力
谢若冰
张旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110523329.6A priority Critical patent/CN113761359B/zh
Publication of CN113761359A publication Critical patent/CN113761359A/zh
Application granted granted Critical
Publication of CN113761359B publication Critical patent/CN113761359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请公开了一种数据包推荐方法、装置、电子设备和存储介质;本申请获取待推荐用户对应的候选数据包;针对每个候选数据包,对候选数据包中各类型的待推荐对象进行特征提取,得到候选数据包中各类型待推荐对象的对象特征信息;对候选数据包中各类型待推荐对象的对象特征信息进行融合,得到候选数据包的包内特征信息;获取与候选数据包具有至少一个相同待推荐对象的关联数据包的包内特征信息;基于候选数据包和关联数据包的包内特征信息,从候选数据包中选取目标数据包;向待推荐用户推荐目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。

Description

数据包推荐方法、装置、电子设备和存储介质
技术领域
本申请涉及计算机技术领域,具体涉及一种数据包推荐方法、装置、电子设备和存储介质。
背景技术
随着计算机技术的发展,多媒体的应用越来越广泛,同时也带来了海量的数据信息。如何从海量的数据信息中选取用户感兴趣的内容,以精准地向用户进行信息推荐,如今已成为很多网络平台关注的重点。在当前的推荐场景中,一般只向用户推荐单个项目或项目列表,如对于某商品的推荐场景,推荐结果通常只包含商品,推荐类型单一。
对于包含多类型的待推荐对象的数据包推荐场景,在目前的相关技术中,缺少对各类型待推荐对象的关系的建模,这样信息推荐的精确度较低。
发明内容
本申请实施例提供一种数据包推荐方法、装置、电子设备和存储介质,可以提高数据包推荐的精确度。
本申请实施例提供一种数据包推荐方法,包括:
获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;
针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;
对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;
获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;
基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;
向所述待推荐用户推荐所述目标数据包。
相应的,本申请实施例提供一种数据包推荐装置,包括:
第一获取单元,用于获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;
提取单元,用于针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;
融合单元,用于对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;
第二获取单元,用于获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;
选取单元,用于基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;
推荐单元,用于向所述待推荐用户推荐所述目标数据包。
可选的,在本申请的一些实施例中,所述选取单元可以包括确定子单元、预测子单元和选取子单元,如下:
所述确定子单元,用于基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息;
预测子单元,用于根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;
选取子单元,用于根据所述互动概率,从所述候选数据包中选取目标数据包。
可选的,在本申请的一些实施例中,所述确定子单元具体可以用于对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息。
可选的,在本申请的一些实施例中,所述选取单元还可以包括数据包获取子单元、第一融合子单元和第二融合子单元,如下:
所述数据包获取子单元,用于获取所述待推荐用户的至少一个历史数据包,所述历史数据包包括至少一个类型的历史推荐对象;
第一融合子单元,用于针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息;
第二融合子单元,用于对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
可选的,在本申请的一些实施例中,所述第二融合子单元具体可以用于对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的第一用户特征信息;获取各个历史数据包的包内特征信息,并将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;对所述第一用户特征信息和所述第二用户特征信息进行融合,得到所述待推荐用户的用户特征信息。
可选的,在本申请的一些实施例中,所述融合单元可以包括组合子单元、第三融合子单元和第四融合子单元,如下:
所述组合子单元,用于对所述候选数据包中各个类型的待推荐对象进行组合处理,得到至少一个类型组合,每个类型组合包括至少一个类型的待推荐对象;
第三融合子单元,用于针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息;
第四融合子单元,用于将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
可选的,在本申请的一些实施例中,所述至少一个类型的待推荐对象包括至少一个与所述待推荐用户具有关联关系的关联用户;
所述提取单元可以包括获取子单元、解耦子单元、第五融合子单元和第六融合子单元,如下:
所述获取子单元,用于获取所述候选数据包中各关联用户的用户信息;
解耦子单元,用于对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息;
第五融合子单元,用于针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;
第六融合子单元,用于将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
可选的,在本申请的一些实施例中,所述第六融合子单元具体可以用于基于所述待推荐用户的用户信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重;根据所述注意力权重,将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息。
可选的,在本申请的一些实施例中,所述提取单元具体可以用于通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
可选的,在本申请的一些实施例中,所述数据包推荐装置还可以包括训练单元,所述训练单元用于训练推荐模型;具体如下:
所述训练单元,用于获取训练数据,所述训练数据包括样本用户和样本数据包、以及所述样本用户对所述样本数据包的期望互动概率,所述样本数据包包括至少一个类型的推荐对象;
通过预设推荐模型,对所述样本数据包中各类型的推荐对象进行特征提取,得到所述样本数据包中各类型推荐对象对应的对象特征信息,并对所述样本数据包中各类型推荐对象对应的对象特征信息进行融合,得到所述样本数据包的包内特征信息;
获取样本关联数据包的包内特征信息,并基于所述样本数据包和所述样本关联数据包的包内特征信息,确定所述样本数据包的目标特征信息,所述样本关联数据包与所述样本数据包具有至少一个相同的推荐对象;
根据所述样本数据包的目标特征信息和所述样本用户的用户特征信息,预测所述样本用户对所述样本数据包的实际互动概率;
根据所述样本用户对所述样本数据包的实际互动概率和期望互动概率,对所述预设推荐模型中的参数进行调整,得到训练后的推荐模型。
本申请实施例提供的一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令,以执行本申请实施例提供的数据包推荐方法中的步骤。
此外,本申请实施例还提供一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本申请实施例提供的数据包推荐方法中的步骤。
本申请实施例提供了一种数据包推荐方法、装置、电子设备和存储介质,可以获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的数据包推荐方法的场景示意图;
图1b是本申请实施例提供的数据包推荐方法的流程图;
图1c是本申请实施例提供的数据包推荐方法的说明示意图;
图2a是本申请实施例提供的数据包推荐方法的另一流程图;
图2b是本申请实施例提供的数据包推荐方法的另一流程图;
图3a是本申请实施例提供的数据包推荐装置的结构示意图;
图3b是本申请实施例提供的数据包推荐装置的另一结构示意图;
图3c是本申请实施例提供的数据包推荐装置的另一结构示意图;
图3d是本申请实施例提供的数据包推荐装置的另一结构示意图;
图3e是本申请实施例提供的数据包推荐装置的另一结构示意图;
图3f是本申请实施例提供的数据包推荐装置的另一结构示意图;
图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种数据包推荐方法、装置、电子设备和存储介质。该数据包推荐装置具体可以集成在电子设备中,该电子设备可以是终端或服务器等设备。
可以理解的是,本实施例的数据包推荐方法可以是在终端上执行的,也可以是在服务器上执行,还可以由终端和服务器共同执行的。以上举例不应理解为对本申请的限制。
如图1a所示,以终端和服务器共同执行数据包推荐方法为例。本申请实施例提供的数据包推荐系统包括终端10和服务器11等;终端10与服务器11之间通过网络连接,比如,通过有线或无线网络连接等,其中,数据包推荐装置可以集成在服务器中。
其中,服务器11,可以用于:获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。其中,服务器11可以是单台服务器,也可以是由多个服务器组成的服务器集群或云服务器。如本申请所公开的数据包推荐方法或装置,其中多个服务器可组成为一区块链,而服务器为区块链上的节点。
其中,终端10可以接收服务器11选取到的目标数据包,并向待推荐用户推荐目标数据包,具体可以在相应的推荐页面上展示该目标数据包。其中,终端10可以包括手机、智能电视、平板电脑、笔记本电脑、或个人计算机(PC,Personal Computer)等。终端10上还可以设置客户端,该客户端可以是应用程序客户端或者浏览器客户端等等。
上述服务器11获取目标数据包的步骤,也可以由终端10执行。
本申请实施例提供的数据包推荐方法涉及人工智能领域中的机器学习。本申请实施例可以提高数据包推荐的精确度。
其中,人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。其中,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等方向。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从数据包推荐装置的角度进行描述,该数据包推荐装置具体可以集成在电子设备中,该电子设备可以是服务器或终端等设备。
本申请实施例的数据包推荐方法可以应用于各种推荐场景中。例如,某网络平台需要向用户推荐包含多类型对象的数据包,可以通过本实施例提供的数据包推荐方法,可快速地确定待推荐的目标数据包,且本实施例提供的数据包推荐方法在数据包推荐上的准确率较高。
如图1b所示,该数据包推荐方法的具体流程可以如下:
101、获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象。
其中,该信息推荐系统可以向用户推荐数据包。候选数据包可以包括一个或多个类型的待推荐对象;比如,候选数据包可以包括与待推荐用户具有关联关系的关联用户、业务服务媒体(如业务服务账号)以及业务服务媒体的发布内容等类型的待推荐对象。一个候选数据包中某个类型的待推荐对象可以是一个,也可以是多个,本实施例对此不作限制。需要说明的是,待推荐对象可以以视频、图像、音频以及文字等形式进行展示。
本实施例中,可以应用在打包推荐(packagerecommendation)的场景中,将各种类型的待推荐对象组合在一起形成数据包,再通过数据包的形式进行组合推荐,可以更大程度地吸引用户的注意力。例如,一个数据包中可以包含新闻文章,新闻媒体和阅读过此新闻的朋友;在向待推荐用户推荐数据包时,可以在推荐页面上显式地展示数据包中包含的各类型的待推荐对象,比如在推荐页面上可以显式地展示该数据包中新闻文章的标题、以及新闻媒体和阅读过此新闻的朋友,用户可能由于对阅读过此新闻的朋友有较大的兴趣,从而阅读该新闻文章;若只是单一类型的待推荐对象的推荐,如只在推荐页面上显示新闻文章的标题,用户可能不会阅读该新闻文章。
其中,候选数据包具体为待推荐用户对应的候选数据包,比如,可以将包含有与待推荐用户关联的关联用户的数据包作为待推荐用户对应的候选数据包。
在一具体实施例中,一个候选数据包可以包括一篇文章、发布该文章的业务服务媒体、以及至少一个阅读过该文章且与待推荐用户具有关联关系的关联用户。其中,待推荐用户与关联用户之间的关联关系具体可以表现为待推荐用户与关联用户之间互相关注。
102、针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
一些实施例中,候选数据包中不同的关联用户对待推荐用户的行为具有不同的社会影响。例如,当候选数据包中的文章与技术相关时,技术专家朋友可能会对待推荐用户产生更大的影响,而亲密的朋友可能会在娱乐方面的文章影响更大。因此,可以对待推荐用户对应的关联用户的用户信息进行解耦,来得到关联用户在不同解耦空间中的社会影响力。
可选地,本实施例中,所述至少一个类型的待推荐对象包括至少一个与所述待推荐用户具有关联关系的关联用户;
步骤“对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息”,可以包括:
获取所述候选数据包中各关联用户的用户信息;
对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息;
针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;
将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
其中,关联用户的用户信息具体可以是关联用户的用户画像,它可以包括关联用户与待推荐用户的互动度、关联用户浏览过的内容信息等等,本实施例对此不作限制。
其中,对关联用户的用户信息进行多个维度的解耦处理,具体可以先确定k个解耦维度,再对关联用户的用户信息进行k个维度的解耦处理。
其中,步骤“针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息”之前,还可以包括:
对所述待推荐对象进行多个维度的解耦处理,得到所述待推荐对象在多个维度下的对象子特征信息,所述维度为与所述关联用户对应的解耦处理过程中维度关联的关联维度;
步骤“针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息”,包括:
针对每个维度,基于所述维度下各关联用户的子特征信息和对应的关联维度下的对象子特征信息,确定所述维度下的各关联用户的子特征信息对应的注意力权重;
根据所述注意力权重,将所述维度下各关联用户的子特征信息进行融合,得到所述维度下的特征信息。
其中,根据注意力权重,对所述维度下各关联用户的子特征信息的融合方式可以有多种,比如该融合方式可以是加权求和等。
可选地,本实施例中,步骤“将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息”,可以包括:
基于所述待推荐用户的用户信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重;
根据所述注意力权重,将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息。
其中,对各维度的总特征信息的融合方式有多种,本实施例对此不作限制。比如该融合方式可以是加权融合。
其中,步骤“基于所述待推荐用户的用户信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重”,可以包括:
将各维度的总特征信息和所述待推荐用户的用户信息进行拼接处理,得到各维度对应的处理后特征信息;
根据各维度对应的处理后特征信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重。
本实施例中,可以将待推荐用户记为u,u也可以表示待推荐用户的用户信息;将数据包记为其中,/>是对象类型集合,τ表示待推荐对象的类型,具体地,数据包可以为/>其中/> 是类型/>的待推荐对象集合。
可选地,一些实施例中,候选数据包可以包含三种类型的待推荐对象,分别为与待推荐用户关联的关联用户(记为friend好友)、该关联用户互动过的文章(记为article),发布该文章的业务服务媒体(记为media),也即其中,一个候选数据包可以包含一篇文章a、一个业务服务媒体m以及x个与文章a有互动的关联用户(分别记为u1,u2,…,ux),则有/>
其中,对文章a进行K个维度的解耦处理,对关联用户ui进行K个维度的解耦处理,则有
其中,和ak分别代表关联用户ui和候选数据包中文章a的第k个解耦嵌入(即第k个解耦维度对应的特征),k∈[1,K]。ui和a是关联用户ui和文章a的初始表示,而/>和/>表示第k个解耦维度的解耦矩阵。
对于候选数据包中的文章a,关联用户/>的第k个解耦嵌入fk可以用式子(1)和(2)进行表示:
其中,tanh表示双曲正切函数运算,||表示两个向量的拼接,是注意力机制的训练参数,/>表示实数,d表征矩阵维度。注意力权重/>用于捕获关联用户ui对于文章a在第k个解耦空间的社会影响力。
其中,表示第k个解耦维度下关联用户ui的子特征信息,/>表示第k个解耦维度下关联用户ui的子特征信息对应的注意力权重,ak表示文章在第k个解耦维度下的对象子特征信息(即第k个维度对应的关联维度下的对象子特征信息)。
不同解耦空间中的关联用户表示对当前用户u的社会影响的贡献不同,可以将K个解耦空间的表示通过注意力机制融合起来,如式子(3)和(4)所示:
其中,u是待推荐用户u的初始表示,而f是关联用户的初始表示对待推荐用户u进行复杂社会影响力编码之后的最终表示。
具体地,fk可以表示关联用户在第k个解耦维度的总特征信息(也即上述实施例中各维度的总特征信息),βk表示第k个维度的总特征信息对应的注意力权重,f表示该候选数据包中关联用户对应的对象特征信息。
103、对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息。
其中,对候选数据包中各类型待推荐对象对应的对象特征信息的融合方式有多种,本实施例对此不作限制。比如,可以将各类型待推荐对象对应的对象特征信息进行两两特征交互,来得到候选数据包的包内特征信息,也可以采用注意力机制进行融合。
可选地,本实施例中,步骤“对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息”,可以包括:
对所述候选数据包中各类型待推荐对象对应的对象特征信息进行注意力处理,得到所述候选数据包中各类型待推荐对象对应的对象特征信息对应的注意力权重;
根据所述注意力权重,对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息。
其中,该融合方式可以有多种,本实施例对此不作限制。比如可以是加权融合等。
其中,步骤“对所述候选数据包中各类型待推荐对象对应的对象特征信息进行注意力处理,得到所述候选数据包中各类型待推荐对象对应的对象特征信息对应的注意力权重”,可以包括:
对所述候选数据包中各类型待推荐对象对应的对象特征信息进行双曲正切处理,得到处理结果;
对所述处理结果进行非线性映射处理,得到所述候选数据包中各类型待推荐对象对应的对象特征信息对应的注意力权重。
可选地,本实施例中,步骤“对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息”,可以包括:
对所述候选数据包中各个类型的待推荐对象进行组合处理,得到至少一个类型组合,每个类型组合包括至少一个类型的待推荐对象;
针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息;
将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
其中,步骤“针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息”中,融合方式具体可以是级联、加法或按元素乘积等,本实施例对此不作限制。
其中,步骤“将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息”,可以包括:
根据所述待推荐用户的用户信息,对各个类型组合的组合特征信息进行注意力处理,得到各个类型组合的组合特征信息对应的注意力权重;
根据所述注意力权重,将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
其中,步骤“根据所述待推荐用户的用户信息,对各个类型组合的组合特征信息进行注意力处理,得到各个类型组合的组合特征信息对应的注意力权重”,具体可以包括:
将各个类型组合的组合特征信息和所述待推荐用户的用户信息进行拼接处理,得到各个类型组合的拼接后特征信息;
对各个类型组合的拼接后特征信息进行双曲正切处理,得到处理结果;
将所述处理结果进行非线性映射处理,得到各个类型组合的组合特征信息对应的注意力权重。
本实施例中,通过对各类型待推荐对象的对象特征信息进行交互,可以协同融合候选数据包中异质、多样化的信息,这样可以充分利用不同方面的信息,挖掘候选数据包对于用户的吸引力。
在一实施例中,对于数据包有文章a,业务服务媒体m和关联用户{u1,u2,…,ux},对应的对象特征信息分别记为a,m和f,对其进行组合处理,每个组合包含至少一个类型的待推荐对象,则可以得到七个类型组合,有:
其中,Γ作为融合函数,可以是级联,加法或按元素乘积等;将组合特征集中各元素记为c。然后,利用注意力机制来提取用户u对于多方面信息的不同偏好,并将其融合得到包内特征信息,如式子(5)和(6)所示:
其中,p是数据包的表示向量(即包内特征信息),而/>是某个类型组合对应的组合特征信息;γc表示各个类型组合的组合特征信息对应的注意力权重。
104、获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象。
其中,对于数据包,除了数据包中各类型待推荐对象的内部连接(也即内部关联交互)之外,数据包之间还可以存在外部连接,这些外部连接可以表征为数据包的包间特征信息,某数据包的包间特征信息可以表示该数据包注入了关联数据包的协同信息。比如,两个数据包和/>共享一个或多个类型t的待推荐对象g,则这两个数据包之间的连接关系定义为通过类型t的外部连接,数据包/>和/>互为关联数据包。
其中,关联数据包的包内特征信息的计算过程可以参考上述候选数据包的包内特征信息的计算过程,此处不再赘述。
105、基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包。
可选地,本实施例中,步骤“基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包”,可以包括:
基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息;
根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;
根据所述互动概率,从所述候选数据包中选取目标数据包。
一些实施例中,可以将互动概率大于预设概率的候选数据包作为目标数据包,该预设概率可以根据实际情况进行设置,本实施例对此不作限制。另一些实施例中,可以基于互动概率,对候选数据包从大到小进行排序,得到排序后候选数据包,将排序后候选数据包中前N个候选数据包选取为目标数据包。
可选地,本实施例中,步骤“基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息”,可以包括:
对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;
将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息。
其中,该逻辑运算具体可以是同或运算等,本实施例对此不作限制。对候选数据包的包内特征信息和包间特征信息进行融合的方式有多种,比如可以是加权融合等。
具体地,给定一个包集其中每个数据包/>与当前数据包/>有一个外部连接(互连),为了融合协同信息,获取数据包/>的包间特征信息,可以将包集通过门过滤器聚合在一起,如下式(8)和(9)所示:
其中,⊙表示同或运算,pi和p分别表示数据包和/>的包内特征信息,W1,W2和/>是门过滤器的学习参数,gi可以表示门过滤噪声信息,σ是激活函数,该激活函数具体可以是sigmoid函数(S型生长曲线)或tanh函数(双曲正切函数)等。
其中,可以表示数据包/>的包间特征信息,对数据包/>的包间特征信息和包内特征信息进行融合,可以得到数据包/>的目标特征信息/>
一些实施例中,步骤“根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率”,可以包括:
计算所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息之间的匹配度;
根据所述匹配度,确定所述待推荐用户对各候选数据包的互动概率。
其中,可以计算所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息之间的向量距离,该向量距离可以表征二者之间的匹配度。向量距离越大,匹配度越低,反之,向量距离越小,匹配度越高。
可选地,本实施例中,步骤“根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率”之前,还可以包括:
获取所述待推荐用户的至少一个历史数据包,所述历史数据包包括至少一个类型的历史推荐对象;
针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息;
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
本实施例中,可以通过待推荐用户对应的历史数据包中的特征信息,来获取待推荐用户的用户特征信息,该历史数据包具体可以是待推荐用户之前互动过的数据包等,本实施例对此不作限制,该交互方式具体可以是点击等方式。
其中,步骤“针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息”,可以包括:
针对每个类型,对各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行注意力处理,得到各个历史数据包中所述类型的历史推荐对象对应的对象特征信息的注意力权重;
根据所述注意力权重,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息。
其中,注意力处理的方式具体可以包括:
对各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行双曲正切处理,得到处理结果;
对所述处理结果进行非线性映射处理,得到各个历史数据包中所述类型的历史推荐对象对应的对象特征信息的注意力权重。
一些实施例中,步骤“对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息”,可以包括:
基于所述待推荐用户的用户信息,对各个类型的融合后对象特征信息进行注意力处理,得到各个类型的融合后对象特征信息对应的注意力权重;
根据所述注意力权重,对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
其中,步骤“基于所述待推荐用户的用户信息,对各个类型的融合后对象特征信息进行注意力处理,得到各个类型的融合后对象特征信息对应的注意力权重”,可以包括:
将各个类型的融合后对象特征信息和所述待推荐用户的用户信息进行拼接处理,得到各个类型对应的拼接后特征信息;
对各个类型对应的拼接后特征信息进行双曲正切处理,得到处理结果;
将所述处理结果进行非线性映射处理,得到各个类型的融合后对象特征信息对应的注意力权重。
具体地,对于待推荐用户u,可以将与u关联的不同类型的对象表示为例如u阅读的文章或u订阅的公众号。本实施例可以获取与用户交互过的历史数据包中的所有历史推荐对象,以在细粒度级别捕获用户偏好。首先,可以区分多个相同类型的不同对象对用户偏好的不同贡献,对于/>中的所有类型为t的历史推荐对象,以节点级的注意力机制将它们聚集到类型空间t中,如式子(10)和(11)所示:
其中,σ是激活函数,该激活函数具体可以是sigmoid函数(S型生长曲线)或tanh函数(双曲正切函数)等。
其中,ut是t类型空间下待推荐用户u的表示,而v是历史推荐对象的初始嵌入向量。/>是t类型空间下的学习参数。
具体地,v表示各个历史数据包中类型t的历史推荐对象对应的对象特征信息,ηuv表示各个历史数据包中类型t的历史推荐对象对应的对象特征信息的注意力权重,ut表示类型t的融合后对象特征信息。
此外,确定到用户u在各种类型空间中的多个嵌入表示ut后,本实施例还可以获取不同类型空间中多样信息的注意力权值,然后将其通过类型级注意力机制融合得到用户特征信息,如式子(12)和(13)所示:
其中是细粒度的用户表示,可以捕获细粒度级别的用户偏好。参数z和w可以在模型训练中学习优化。/>表示类型t的融合后对象特征信息对应的注意力权重。
一些实施例中,还可以进一步捕获粗粒度的用户偏好,将粗粒度的用户偏好与细粒度的用户偏好进行融合,得到表征力更强的用户特征信息。
可选地,本实施例中,步骤“对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息”,可以包括:
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的第一用户特征信息;
获取各个历史数据包的包内特征信息,并将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;
对所述第一用户特征信息和所述第二用户特征信息进行融合,得到所述待推荐用户的用户特征信息。
其中,第一用户特征信息和第二用户特征信息进行融合的方式可以是加权融合等,本实施例对此不作限制。
其中,步骤“将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息”,可以包括:
针对每个历史数据包,对所述历史数据包的包内特征信息和所述待推荐用户的第一用户特征信息进行逻辑运算,得到所述历史数据包对应的交互特征信息;
将各个历史数据包对应的交互特征信息进行融合,得到第二用户特征信息。
具体地,为了进一步在粗粒度级别捕获用户偏好,本实施例可以通过门控机制聚合用户u历史交互过的数据包,如下式(14)和(15)所示:
其中,H是用户u交互过的历史数据包的集合,pi表示历史数据包的包内特征信息,W3、W4是学习参数。gi表示门过滤噪声信息,/>表示第一用户特征信息,/>表示第二用户特征信息;将第一用户特征信息和第二用户特征信息进行融合,可以得到最终的待推荐用户的用户特征信息/>
其中,第一用户特征信息是通过各类型历史推荐对象的对象特征信息的交互融合得到的,第一用户特征信息包含了细粒度的用户特征信息,第二用户特征信息是通过各个历史数据包的包内特征信息融合得到的,它包含了粗粒度的用户特征信息。
数据包中异质的对象和不同数据包都提供了多方面的用户偏好信息,它们从不同的角度揭示了用户的兴趣。因此,可以在两种不同的粒度上融合这些多方面和异质的用户偏好信息。
其中,第一用户特征信息考虑到多种类型的历史推荐对象具有不同的特征,其特征可能落在不同的特征空间中,通过注意力机制对对象特征信息进行聚合,能够捕获不同节点和类型的异质信息。
可以理解的是,本实施例也可以采取其他方法获取待推荐用户的用户特征信息,比如采用GNN(Graph Neural Networks)等图卷积方式学习用户表示,即用户特征信息。
可选地,步骤“根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率”,可以包括:
对所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息进行融合处理,得到融合后目标特征信息;
基于融合后目标特征信息,预测所述待推荐用户对各候选数据包的互动概率。
其中,该融合过程具体可以是拼接处理等,本实施例对此不作限制。
其中,可以通过分类器基于融合后目标特征信息,预测所述待推荐用户对各候选数据包的互动概率。该分类器可以是多层感知器(MLP,Multilayer Perceptron),也可以是支持向量机等。
在一具体实施例中,获得待推荐用户u的用户特征信息以及候选数据包/>的目标特征信息/>可以将二者拼接起来,得到融合后目标特征信息,将融合后目标特征信息输入到MLP中预测待推荐用户u对该候选数据包/>的互动概率(具体为点击概率),如式子(16)所示:
其中,表示待推荐用户u对该候选数据包/>的互动概率,σ具体可以是激活函数,||表示两个特征信息的拼接。
可选地,本实施例中,步骤“针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息”,可以包括:
通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
其中,该推荐模型可以是残差网络(ResNet,Residual Network)和密集连接卷积网络(DenseNet,Dense Convolutional Network)等等,但是应当理解的是,本实施例的推荐模型并不仅限于上述列举的几种类型。
需要说明的是,该推荐模型具体可以由其他设备进行训练后,提供给该数据包推荐装置,或者,也可以由该数据包推荐装置自行进行训练。
若由该数据包推荐装置自行进行训练,则在步骤“通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息”之前,还可以包括:
获取训练数据,所述训练数据包括样本用户和样本数据包、以及所述样本用户对所述样本数据包的期望互动概率,所述样本数据包包括至少一个类型的推荐对象;
通过预设推荐模型,对所述样本数据包中各类型的推荐对象进行特征提取,得到所述样本数据包中各类型推荐对象对应的对象特征信息,并对所述样本数据包中各类型推荐对象对应的对象特征信息进行融合,得到所述样本数据包的包内特征信息;
获取样本关联数据包的包内特征信息,并基于所述样本数据包和所述样本关联数据包的包内特征信息,确定所述样本数据包的目标特征信息,所述样本关联数据包与所述样本数据包具有至少一个相同的推荐对象;
根据所述样本数据包的目标特征信息和所述样本用户的用户特征信息,预测所述样本用户对所述样本数据包的实际互动概率;
根据所述样本用户对所述样本数据包的实际互动概率和期望互动概率,对所述预设推荐模型中的参数进行调整,得到训练后的推荐模型。
其中,可以通过反向传播算法对预设推荐模型的参数进行调整,基于样本用户对所述样本数据包的实际互动概率和期望互动概率,优化预设推荐模型的参数,使得样本用户对所述样本数据包的实际互动概率趋近于期望互动概率,得到训练后的推荐模型。具体的,可以使样本用户对所述样本数据包的实际互动概率和期望互动概率之间的损失值小于预设值,该预设值可以根据实际情况进行设置。
其中,该损失值可以是交叉熵损失值。交叉熵损失函数是深度学习中的一种损失函数,它可以用于度量预测结果分布和真实标记之间的相似性,包括样本预测结果(0~1之间)以及真实标记(0或1)。假设样本预测为真的概率为y′,真实标签为y,则对应的交叉熵损失为-ylog(y′)-(1-y)log(1-y′)。
具体地,可以使用以下交叉熵损失函数来优化预设推荐模型的参数θ:
其中,表示实际互动概率和期望互动概率之间的损失值,yup为期望互动概率,为实际互动概率,而λ是用于减少过度拟合的L2(范数2)正则化参数。
其中,训练数据具体可以包含一个样本用户集U=(u1,u2,…,um),一个包集及其交互矩阵/>交互矩阵中各个元素/>的值表示对应的样本用户对样本数据包的期望互动概率,其中/>表示样本用户u已与样本数据包/>进行了交互,期望互动概率为1;/>表示样本用户u未与样本数据包/>进行交互,期望互动概率为0。
106、向所述待推荐用户推荐所述目标数据包。
其中,可以在推荐页面上显式地展示目标数据包中各类型的待推荐对象。
在一具体的场景中,获取如表1所示的三个数据集来进行实验,以评估本申请的数据包推荐方法提供的推荐模型的性能,并进行可解释的分析。其中,采集的数据集时间范围可以为一个月,由时间尺度不同分别命名为3-day(3天)、5-day(5天)和10-day(10天)数据集。每个数据集包含数百万用户和数据包生成的数百万条交互记录,每个数据包包含一篇文章、发布文章的媒体(如公众号)以及与文章有过互动的朋友。对于每个样本,基于用户是否与数据包中的文章进行交互,有则样本标签为1,反之则样本标签为0。对于每个数据集,可以以7:1:2的比例将其分割为训练集、验证集和测试集。为了验证本申请的数据包推荐方法的推荐模型的鲁棒性,可以将每个训练集的大小从40%依次增大到100%。
表1数据集统计信息
具体地,可以将本申请的数据包推荐方法与其他四类推荐方法进行比较,其他四类方法分别为(1)协同过滤算法(MF、DeepMF、NeuCF),(2)社交推荐算法(TrustMF、DiffNet),(3)图神经网络算法(GC-MC、NGCF)和(4)商品集推荐算法(triple2vec、DAM)。其中,商品集推荐算法可以将数据包视为一个购物篮,将数据包中不同类型的对象视为同一类型的商品。而对于协同过滤算法、社交推荐算法和图神经网络算法,可以将文章作为推荐项目。
其中,MF全称为Matrix Factorization,即矩阵分解;
DeepMF全称为DeepMatrix Factorization,即深度矩阵分解;
NeuCF全称为NeuralCollaborative Filtering,即神经协同过滤;
TrustMF全称为TrustMatrix Factorization,即信托矩阵分解;
DiffNet全称为Difference network,即差异网络;
GC-MC全称为Graph convolution matrix completion,即图卷积矩阵补全;
NGCF全称为NeuralGraphCollaborative Filtering,即神经图协同滤波;
triple2vec全称为triple to vector,即三元到矢量;
DAM全称为DeepAttentionModel,即深度注意力模型。
其中,本申请的数据包推荐方法可以记为IPRec。
对于以上各个方法,可以应用网格搜索选择超参数;学习率,批处理大小和正则化参数分别设置为0.0001、512和1e-5。对于所有模型,可以将表示向量维度设置为d=64。对于NeuMF和DiffNet,可以将学习率设置为0.001。对于本申请的IPRec,解耦空间K的数量设置为4,使用Xavier initializer(泽维尔初始化器)随机初始化模型参数。使用Tensorflow(张量流)实现IPRec,并采用RMSProp(root mean square prop,均方根比例)优化器来训练优化IPRec。为了避免过度拟合,可以应用提前停止策略和dropout(丢弃率)(dropout大小为0.4)。
其中,可以将本申请的数据包推荐方法和协同过滤算法、社交推荐算法、图神经网络算法、商品集推荐算法进行比较,并将训练数据比例从40%变化到100%,以得出更加鲁棒的实验结果。表2列出了各个方法在三个数据集上的推荐性能,本方案分析可以得出以下结论。
总的来说,本申请提出的IPRec在三个数据集上的所有方法中始终具有最好的推荐性能,与最佳性能的对比方法相比,它在AUC(Area Under Curve,即ROC曲线下方的面积)上仍然带来了2.05%-4.66%的提高,分析认为这些显著的性能提升归功于针对异质和协同信息的包内特征信息和包间特征信息的提取。
在不同的对比方法中,传统的矩阵分解方法是最不具竞争力的,因为在打包推荐场景中,矩阵分解方法很难处理多方面的信息。NGCF的性能比NeuCF差,分析其原因是因为在数据集中一篇文章会被大量用户点击,而基于图的方法(即NGCF)聚合所有邻居会导致过平滑问题,降低推荐性能。
社交推荐方法(如TrustMF和DiffNet)由于融入了社交关系的影响而表现得更好,但在所有数据集上仍然不如本申请的IPRec。原因可能是他们都只是将社交关系作为辅助信息,而没有探究朋友对用户行为的复杂和多方面的影响。而本申请的IPRec通过获取针对特定数据包的好友解耦表示,从而仔细捕捉数据包中复杂的社会影响和用户意图。
商品集推荐方法利用数据包中的所有对象,性能略有提高,但仍然低于本申请提出的IPRec。因为这些方法将异质对象视为同一类型的商品,从而忽略了多方面的信息。
从纵向比较来看,IPRec在不同规模的训练数据中表现最好,这意味着本申请的数据包推荐方法的稳定性和鲁棒性。而且,随着数据规模的增大,本申请的IPRec的提升也更加明显,说明IPRec更适合实际工业应用中的大规模数据。相反,基于图卷积网络的方法对于大规模数据集计算效率低下,甚至由于内存不足而无法进行训练。
表2
其中,表2展示了在三个数据集上的各个方法的性能实验结果。其中最好的方法用粗体表示,次优的方法用下划线表示。最后一列显示了IPRec相对于次优模型的提升。'-'表示由于内存不足,模型无法训练获得结果。
在具体场景中,如图1c所示,图左侧展示了本申请的数据包推荐方法对应的推荐页面,其中,推荐页面上显示了数据包的推荐结果,每个数据包中包含一篇文章、发布文章的媒体(如公众号)、以及与文章互动的好友。比如,图1c左侧的数据包1包含了发布文章的公众号——xx影院、与该篇文章互动的好友abc、以及文章对应的标题和封面信息。
图1c右侧对比了本申请的数据包推荐方法和当前传统推荐方法的区别,本申请的数据包推荐可以推荐一组不同类型的对象给用户(例如推荐文章+公众号+好友的组合);而传统的推荐方法的推荐类型单一。
由上可知,本实施例可以获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。
根据前面实施例所描述的方法,以下将以该数据包推荐装置具体集成在服务器举例作进一步详细说明。
本申请实施例提供一种数据包推荐方法,如图2a所示,该数据包推荐方法的具体流程可以如下:
201、服务器获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象。
其中,该信息推荐系统可以向用户推荐数据包。候选数据包可以包括一个或多个类型的待推荐对象;比如,候选数据包可以包括与待推荐用户具有关联关系的关联用户、业务服务媒体(如业务服务账号)以及业务服务媒体的发布内容等类型的待推荐对象。一个候选数据包中某个类型的待推荐对象可以是一个,也可以是多个,本实施例对此不作限制。
202、服务器针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
一些实施例中,候选数据包中不同的关联用户对待推荐用户的行为具有不同的社会影响。例如,当候选数据包中的文章与技术相关时,技术专家朋友可能会对待推荐用户产生更大的影响,而亲密的朋友可能会在娱乐方面的文章影响更大。因此,可以对待推荐用户对应的关联用户的用户信息进行解耦,来得到关联用户在不同解耦空间中的社会影响力。
可选地,本实施例中,所述至少一个类型的待推荐对象包括至少一个与所述待推荐用户具有关联关系的关联用户;
步骤“对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息”,可以包括:
获取所述候选数据包中各关联用户的用户信息;
对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息;
针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;
将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
203、服务器对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息。
其中,对候选数据包中各类型待推荐对象对应的对象特征信息的融合方式有多种,本实施例对此不作限制。比如,可以将各类型待推荐对象对应的对象特征信息进行两两特征交互,来得到候选数据包的包内特征信息,也可以采用注意力机制进行融合。
可选地,本实施例中,步骤“对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息”,可以包括:
对所述候选数据包中各类型待推荐对象对应的对象特征信息进行注意力处理,得到所述候选数据包中各类型待推荐对象对应的对象特征信息对应的注意力权重;
根据所述注意力权重,对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息。
可选地,本实施例中,步骤“对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息”,可以包括:
对所述候选数据包中各个类型的待推荐对象进行组合处理,得到至少一个类型组合,每个类型组合包括至少一个类型的待推荐对象;
针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息;
将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
204、服务器获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象。
其中,对于数据包,除了数据包中各类型待推荐对象的内部连接(也即内部关联交互)之外,数据包之间还可以存在外部连接,这些外部连接可以表征为数据包的包间特征信息,某数据包的包间特征信息可以表示该数据包注入了关联数据包的协同信息。比如,两个数据包和/>共享一个或多个类型t的待推荐对象g,则这两个数据包之间的连接关系定义为通过类型t的外部连接,数据包/>和/>互为关联数据包。
其中,关联数据包的包内特征信息的计算过程可以参考上述候选数据包的包内特征信息的计算过程,此处不再赘述。
205、服务器基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息。
可选地,本实施例中,步骤“基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息”,可以包括:
对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;
将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息。
206、服务器根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率。
可选地,本实施例中,步骤“根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率”之前,还可以包括:
获取所述待推荐用户的至少一个历史数据包,所述历史数据包包括至少一个类型的历史推荐对象;
针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息;
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
本实施例中,可以通过待推荐用户对应的历史数据包中的特征信息,来获取待推荐用户的用户特征信息,该历史数据包具体可以是待推荐用户之前互动过的数据包等,本实施例对此不作限制,该交互方式具体可以是点击等方式。
可选地,本实施例中,步骤“对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息”,可以包括:
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的第一用户特征信息;
获取各个历史数据包的包内特征信息,并将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;
对所述第一用户特征信息和所述第二用户特征信息进行融合,得到所述待推荐用户的用户特征信息。
其中,第一用户特征信息和第二用户特征信息进行融合的方式可以是加权融合等,本实施例对此不作限制。
207、服务器根据所述互动概率,从所述候选数据包中选取目标数据包。
一些实施例中,可以将互动概率大于预设概率的候选数据包作为目标数据包,该预设概率可以根据实际情况进行设置,本实施例对此不作限制。另一些实施例中,可以基于互动概率,对候选数据包从大到小进行排序,得到排序后候选数据包,将排序后候选数据包中前N个候选数据包选取为目标数据包。
208、服务器向所述待推荐用户推荐所述目标数据包。
在一具体实施例中,如图2b所示,为本申请的数据包推荐方法对应的推荐模型的框架示意图,该推荐模型主要包含包建模模块(PackageModeling)和用户建模模块(UserModeling)和概率预测模块,该推荐模型可以用于预测用户u是否点击候选数据包图2b中,/>是用户u历史交互过的数据包序列,/>为与/>关联的关联数据包,也即/>与/>存在外部连接。
其中,包建模模块可以包括包内注意力网络(Intra-packageAttention)和包间注意力网络(Inter-packageAttention),用户建模模块可以包括细粒度聚合网络(Fine-grainedAggregation)和粗粒度聚合网络(Coarse-grainedAggregation),通过细粒度聚合网络和粗粒度聚合网络对不同粒度的用户偏好进行建模;概率预测模块可以用于根据数据包的目标特征信息和用户对应的用户特征信息,预测用户对数据包的互动概率。
其中,包内注意力网络可以捕捉用户与数据包交互的对象级意图,包内注意力网络还包含了一个社交影响力编码器,可以分解出多方面的社交影响力,并提供一个协同交互层(CollaborativeInteractionLayer)对来自不同对象的复杂和异构影响力进行编码。
具体地,候选数据包包含文章a、发布文章a的媒体m、以及与文章a互动过的关联用户u1、u2、u3三个类型的待推荐对象,包内注意力网络可以对文章a和媒体m分别进行特征提取,得到文章a和媒体m对应的对象特征信息,还可以对关联用户进行k个维度的解耦处理,得到候选数据包/>中各关联用户在k个维度下的子特征信息,再针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息,获得k个维度下的总特征信息f1、f2…fk,进而将k个维度下的总特征信息f1、f2…fk进行融合,得到候选数据包中关联对象对应的对象特征信息f,然后,通过包内注意力网络的协同交互层对候选数据包/>中各类型推荐对象对应的对象特征信息进行融合,也即将文章a、媒体m和关联对象对应的对象特征信息进行融合,得到候选数据包/>的包内特征信息;其他数据包的包内特征信息的获取过程类似。
在通过包内注意力网络得到各个数据包的包内特征信息后,可以通过包间注意力网络来提取候选数据包的包间特征信息,进而得到候选数据包的目标特征信息包间注意力网络充当包层级的信息编码器,可以捕捉外部连接的关联数据包的协同特征。其中,具体可以通过门函数对候选数据包的包内特征信息和关联数据包的包内特征信息进行逻辑运算,得到候选数据包的包间特征信息,再通过求和运算对候选数据包的包内特征信息和包间特征信息进行融合,从而得到候选数据包的目标特征信息/>
对于用户特征信息,则可以通过用户建模模块获取,用户建模模块包含细粒度聚合网络和粗粒度聚合网络,细粒度聚合网络可以将对象级别的节点和类型特征聚合融合在一起,粗粒度聚合网络可以聚合历史交互过的数据包特征。具体地,可以获取与待推荐用户历史交互过的历史数据包针对历史数据包中的每个类型,可以通过节点-集中注意力网络将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息,如得到媒体对应的融合后对象特征信息u1、文章对应的融合后对象特征信息u2以及关联用户对应的融合后对象特征信息u3,通过细粒度聚合网络中的类型-集中注意力网络,对各个类型的融合后对象特征信息进行融合,即将u1、u2、u3进行融合,得到待推荐用户的第一用户特征信息/>然后,可以获取各个历史数据包的包内特征信息,通过粗粒度聚合网络将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;最后对第一用户特征信息和第二用户特征信息进行融合,即可得到待推荐用户的用户特征信息/>
通过概率预测模块将候选数据包的目标特征信息和待推荐用户的用户特征信息进行串联,得到串联后特征信息,再通过MLP基于串联后特征信息,预测待推荐用户对候选数据包的互动概率
由上可知,本实施例可以通过服务器获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息;根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;根据所述互动概率,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。
为了更好地实施以上方法,本申请实施例还提供一种数据包推荐装置,如图3a所示,该数据包推荐装置可以包括第一获取单元301、提取单元302、融合单元303、第二获取单元304、选取单元305和推荐单元306,如下:
(1)第一获取单元301;
第一获取单元301,用于获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象。
(2)提取单元302;
提取单元302,用于针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
可选的,在本申请的一些实施例中,所述至少一个类型的待推荐对象包括至少一个与所述待推荐用户具有关联关系的关联用户;
所述提取单元302可以包括获取子单元3021、解耦子单元3022、第五融合子单元3023和第六融合子单元3024,参见图3b,如下:
所述获取子单元3021,用于获取所述候选数据包中各关联用户的用户信息;
解耦子单元3022,用于对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息;
第五融合子单元3023,用于针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;
第六融合子单元3024,用于将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
可选的,在本申请的一些实施例中,所述第六融合子单元3024具体可以用于基于所述待推荐用户的用户信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重;根据所述注意力权重,将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息。
(3)融合单元303;
融合单元303,用于对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息。
可选的,在本申请的一些实施例中,所述融合单元303可以包括组合子单元3031、第三融合子单元3032和第四融合子单元3033,参见图3c,如下:
所述组合子单元3031,用于对所述候选数据包中各个类型的待推荐对象进行组合处理,得到至少一个类型组合,每个类型组合包括至少一个类型的待推荐对象;
第三融合子单元3032,用于针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息;
第四融合子单元3033,用于将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
(4)第二获取单元304;
第二获取单元304,用于获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象。
(5)选取单元305;
选取单元305,用于基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包。
可选的,在本申请的一些实施例中,所述选取单元305可以包括确定子单元3051、预测子单元3052和选取子单元3053,参见图3d,如下:
所述确定子单元3051,用于基于所述候选数据包和所述关联数据包的包内特征信息,确定所述候选数据包的目标特征信息;
预测子单元3052,用于根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;
选取子单元3053,用于根据所述互动概率,从所述候选数据包中选取目标数据包。
可选的,在本申请的一些实施例中,所述确定子单元3051具体可以用于对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息。
可选的,在本申请的一些实施例中,所述选取单元305还可以包括数据包获取子单元3054、第一融合子单元3055和第二融合子单元3056,参见图3e,如下:
所述数据包获取子单元3054,用于获取所述待推荐用户的至少一个历史数据包,所述历史数据包包括至少一个类型的历史推荐对象;
第一融合子单元3055,用于针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息;
第二融合子单元3056,用于对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
可选的,在本申请的一些实施例中,所述第二融合子单元3056具体可以用于对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的第一用户特征信息;获取各个历史数据包的包内特征信息,并将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;对所述第一用户特征信息和所述第二用户特征信息进行融合,得到所述待推荐用户的用户特征信息。
(6)推荐单元306;
推荐单元306,用于向所述待推荐用户推荐所述目标数据包。
可选的,在本申请的一些实施例中,所述提取单元302具体可以用于通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
可选的,在本申请的一些实施例中,所述数据包推荐装置还可以包括训练单元307,参见图3f,所述训练单元307用于训练推荐模型;具体如下:
所述训练单元307,用于获取训练数据,所述训练数据包括样本用户和样本数据包、以及所述样本用户对所述样本数据包的期望互动概率,所述样本数据包包括至少一个类型的推荐对象;
通过预设推荐模型,对所述样本数据包中各类型的推荐对象进行特征提取,得到所述样本数据包中各类型推荐对象对应的对象特征信息,并对所述样本数据包中各类型推荐对象对应的对象特征信息进行融合,得到所述样本数据包的包内特征信息;
获取样本关联数据包的包内特征信息,并基于所述样本数据包和所述样本关联数据包的包内特征信息,确定所述样本数据包的目标特征信息,所述样本关联数据包与所述样本数据包具有至少一个相同的推荐对象;
根据所述样本数据包的目标特征信息和所述样本用户的用户特征信息,预测所述样本用户对所述样本数据包的实际互动概率;
根据所述样本用户对所述样本数据包的实际互动概率和期望互动概率,对所述预设推荐模型中的参数进行调整,得到训练后的推荐模型。
由上可知,本实施例由第一获取单元301获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;通过提取单元302针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;由融合单元303对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;由第二获取单元304获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;通过选取单元305基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;通过推荐单元306向所述待推荐用户推荐所述目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。
本申请实施例还提供一种电子设备,如图4所示,其示出了本申请实施例所涉及的电子设备的结构示意图,该电子设备可以是终端或者服务器等,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,该电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例可以获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。本申请通过对数据包中各类型待推荐对象的关系进行建模,并结合关联数据包的包内特征信息来进行数据包推荐,有利于提高数据包推荐的准确度。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种数据包推荐方法中的步骤。例如,该指令可以执行如下步骤:
获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包包括至少一个类型的待推荐对象;针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;基于所述候选数据包和所述关联数据包的包内特征信息,从所述候选数据包中选取目标数据包;向所述待推荐用户推荐所述目标数据包。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种数据包推荐方法中的步骤,因此,可以实现本申请实施例所提供的任一种数据包推荐方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述数据包推荐方面的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种数据包推荐方法、装置、电子设备和存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种数据包推荐方法,其特征在于,包括:
获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包由多个类型的待推荐对象组成,所述多个类型的待推荐对象包括与所述待推荐用户具有关联关系的关联用户、以及所述关联用户对应的互动内容,所述关联用户对所述待推荐用户的行为具有社会影响;
针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;
对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;
获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;
对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;
将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息;
根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;
根据所述互动概率,从所述候选数据包中选取目标数据包;
向所述待推荐用户组合推荐包含多类型对象的所述目标数据包;
其中,所述对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息,包括:
获取所述候选数据包中各关联用户的用户信息;
对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息,所述关联用户在不同维度下的子特征信息表征所述关联用户在不同解耦空间中的社会影响力;
针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;
将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率之前,还包括:
获取所述待推荐用户的至少一个历史数据包,所述历史数据包包括多个类型的历史推荐对象;
针对每个类型,将各个历史数据包中所述类型的历史推荐对象对应的对象特征信息进行融合,得到所述类型的融合后对象特征信息;
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息。
3.根据权利要求2所述的方法,其特征在于,所述对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的用户特征信息,包括:
对各个类型的融合后对象特征信息进行融合,得到所述待推荐用户的第一用户特征信息;
获取各个历史数据包的包内特征信息,并将各个历史数据包的包内特征信息进行融合,得到第二用户特征信息;
对所述第一用户特征信息和所述第二用户特征信息进行融合,得到所述待推荐用户的用户特征信息。
4.根据权利要求1所述的方法,其特征在于,所述对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息,包括:
对所述候选数据包中各个类型的待推荐对象进行组合处理,得到至少一个类型组合,每个类型组合包括至少一个类型的待推荐对象;
针对每个类型组合,将所述类型组合中各类型待推荐对象对应的对象特征信息进行融合,得到所述类型组合的组合特征信息;
将各个类型组合的组合特征信息进行融合,得到所述候选数据包的包内特征信息。
5.根据权利要求1所述的方法,其特征在于,所述将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,包括:
基于所述待推荐用户的用户信息,对各维度的总特征信息进行注意力处理,得到各维度的总特征信息对应的注意力权重;
根据所述注意力权重,将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息。
6.根据权利要求1所述的方法,其特征在于,所述针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息,包括:
通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息。
7.根据权利要求6所述的方法,其特征在于,所述通过推荐模型,针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息之前,还包括:
获取训练数据,所述训练数据包括样本用户和样本数据包、以及所述样本用户对所述样本数据包的期望互动概率,所述样本数据包包括多个类型的推荐对象;
通过预设推荐模型,对所述样本数据包中各类型的推荐对象进行特征提取,得到所述样本数据包中各类型推荐对象对应的对象特征信息,并对所述样本数据包中各类型推荐对象对应的对象特征信息进行融合,得到所述样本数据包的包内特征信息;
获取样本关联数据包的包内特征信息,并基于所述样本数据包和所述样本关联数据包的包内特征信息,确定所述样本数据包的目标特征信息,所述样本关联数据包与所述样本数据包具有至少一个相同的推荐对象;
根据所述样本数据包的目标特征信息和所述样本用户的用户特征信息,预测所述样本用户对所述样本数据包的实际互动概率;
根据所述样本用户对所述样本数据包的实际互动概率和期望互动概率,对所述预设推荐模型中的参数进行调整,将调整后的预设推荐模型确定为推荐模型。
8.一种数据包推荐装置,其特征在于,包括:
第一获取单元,用于获取信息推荐系统中待推荐用户对应的至少一个候选数据包,所述候选数据包由多个类型的待推荐对象组成,所述多个类型的待推荐对象包括与所述待推荐用户具有关联关系的关联用户、以及所述关联用户对应的互动内容,所述关联用户对所述待推荐用户的行为具有社会影响;
提取单元,用于针对每个候选数据包,对所述候选数据包中各类型的待推荐对象进行特征提取,得到所述候选数据包中各类型待推荐对象对应的对象特征信息;
融合单元,用于对所述候选数据包中各类型待推荐对象对应的对象特征信息进行融合,得到所述候选数据包的包内特征信息;
第二获取单元,用于获取关联数据包的包内特征信息,所述关联数据包与所述候选数据包具有至少一个相同的待推荐对象;
选取单元,用于对所述候选数据包的包内特征信息和所述关联数据包的包内特征信息进行逻辑运算,得到所述候选数据包的包间特征信息;将所述候选数据包的包内特征信息和所述包间特征信息进行融合,得到所述候选数据包的目标特征信息;根据所述候选数据包的目标特征信息和所述待推荐用户的用户特征信息,预测所述待推荐用户对各候选数据包的互动概率;根据所述互动概率,从所述候选数据包中选取目标数据包;
推荐单元,用于向所述待推荐用户组合推荐包含多类型对象的所述目标数据包;
所述提取单元,还用于获取所述候选数据包中各关联用户的用户信息;对各关联用户的用户信息进行多个维度的解耦处理,得到各关联用户在所述多个维度下的子特征信息,所述关联用户在不同维度下的子特征信息表征所述关联用户在不同解耦空间中的社会影响力;针对每个维度,对所述维度下各关联用户的子特征信息进行融合,得到所述维度的总特征信息;将各维度的总特征信息进行融合,得到所述候选数据包中所述关联用户对应的对象特征信息,获得所述候选数据包中各类型待推荐对象对应的对象特征信息。
9.一种电子设备,其特征在于,包括存储器和处理器;所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至7任一项所述的数据包推荐方法中的操作。
10.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的数据包推荐方法中的步骤。
CN202110523329.6A 2021-05-13 2021-05-13 数据包推荐方法、装置、电子设备和存储介质 Active CN113761359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110523329.6A CN113761359B (zh) 2021-05-13 2021-05-13 数据包推荐方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110523329.6A CN113761359B (zh) 2021-05-13 2021-05-13 数据包推荐方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN113761359A CN113761359A (zh) 2021-12-07
CN113761359B true CN113761359B (zh) 2024-02-02

Family

ID=78787081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110523329.6A Active CN113761359B (zh) 2021-05-13 2021-05-13 数据包推荐方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113761359B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113987326B (zh) * 2021-12-28 2022-03-25 北京达佳互联信息技术有限公司 资源推荐方法、装置、计算机设备及介质
CN114528496B (zh) * 2022-04-22 2022-07-08 腾讯科技(深圳)有限公司 多媒体数据处理方法、装置、设备及存储介质
CN115203577B (zh) * 2022-09-14 2023-04-07 北京达佳互联信息技术有限公司 对象推荐方法、对象推荐模型的训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN112148889A (zh) * 2020-09-23 2020-12-29 平安直通咨询有限公司上海分公司 一种推荐列表的生成方法及设备
CN112650907A (zh) * 2020-12-25 2021-04-13 百度在线网络技术(北京)有限公司 搜索词的推荐方法、目标模型的训练方法、装置及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069625A (zh) * 2017-09-22 2019-07-30 腾讯科技(深圳)有限公司 一种内容分类方法、装置及服务器
CN112148889A (zh) * 2020-09-23 2020-12-29 平安直通咨询有限公司上海分公司 一种推荐列表的生成方法及设备
CN112650907A (zh) * 2020-12-25 2021-04-13 百度在线网络技术(北京)有限公司 搜索词的推荐方法、目标模型的训练方法、装置及设备

Also Published As

Publication number Publication date
CN113761359A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN107330115B (zh) 一种信息推荐方法及装置
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
WO2023065859A1 (zh) 物品推荐方法、装置及存储介质
CN112380453B (zh) 物品推荐方法、装置、存储介质及设备
US20220237917A1 (en) Video comparison method and apparatus, computer device, and storage medium
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN112418256A (zh) 分类、模型训练、信息搜索方法、系统及设备
CN116521908A (zh) 一种基于人工智能的多媒体内容个性化推荐方法
CN114842247B (zh) 基于特征累加的图卷积网络半监督节点分类方法
CN116361643A (zh) 实现对象推荐的模型训练方法及对象推荐方法及相关装置
CN112989182B (zh) 信息处理方法、装置、信息处理设备及存储介质
CN114417161A (zh) 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN113821634A (zh) 内容分类方法、装置、电子设备和存储介质
CN115062230B (zh) 数据处理方法、装置、设备、介质和程序产品
US20240037133A1 (en) Method and apparatus for recommending cold start object, computer device, and storage medium
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
CN116777529B (zh) 一种对象推荐的方法、装置、设备、存储介质及程序产品
CN116501993B (zh) 房源数据推荐方法及装置
CN117743673A (zh) 资源召回方法
Pan et al. Explainable Artificial Intelligence
CN117708403A (zh) 一种数据推荐方法、计算机设备以及存储介质
CN117216362A (zh) 内容推荐方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant