CN117056619A - 确定用户行为特征的方法和装置 - Google Patents

确定用户行为特征的方法和装置 Download PDF

Info

Publication number
CN117056619A
CN117056619A CN202310954574.1A CN202310954574A CN117056619A CN 117056619 A CN117056619 A CN 117056619A CN 202310954574 A CN202310954574 A CN 202310954574A CN 117056619 A CN117056619 A CN 117056619A
Authority
CN
China
Prior art keywords
hypergraph
user
target
sample
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310954574.1A
Other languages
English (en)
Inventor
蒋俊极
何明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lenovo Software Ltd
Original Assignee
Beijing Lenovo Software Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Lenovo Software Ltd filed Critical Beijing Lenovo Software Ltd
Priority to CN202310954574.1A priority Critical patent/CN117056619A/zh
Publication of CN117056619A publication Critical patent/CN117056619A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种确定用户行为特征的方法和装置,该方法包括:获得用户的至少一个历史行为序列,历史行为序列包括:一个历史时段内的用户行为信息;依据历史行为序列,构建目标超图,目标超图中包括多个节点以及不同节点之间的超边,目标超图中不同节点表征历史时段内不同历史时刻的用户行为,目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;基于目标超图中的节点以及节点之间的超边,利用超图神经网络确定目标超图表现出的用户行为特征,以将用户行为特征确定为向用户进行对象推荐的依据信息。

Description

确定用户行为特征的方法和装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种确定用户行为特征的方法和装置。
背景技术
在基于网络平台的电商购物或者多媒体服务场景中,经常需要根据用户的历史行为序列确定用户感兴趣的商品或者多媒体等对象,以便更有针对性地向用户推荐用户感兴趣的对象。
为了准确向用户推荐对象,需要集合用户的历史行为序列确定出用户的行为特征,以便基于用户的行为特征以及不同对象的对象特征,合理确定需要推荐的对象。基于此,基于用户在网络平台中的历史行为序列,如何较为准确地确定用户的行为特征,以提高对象推荐的精准度是本领域技术人员需要解决的技术问题。
发明内容
一方面,本申请提供了一种确定用户行为特征的方法,包括:
获得用户的至少一个历史行为序列,所述历史行为序列包括:一个历史时段内的用户行为信息;
依据所述历史行为序列,构建目标超图,所述目标超图中包括多个节点以及不同节点之间的超边,所述目标超图中不同节点表征所述历史时段内不同历史时刻的用户行为,所述目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;
基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,以将所述用户行为特征确定为向所述用户进行对象推荐的依据信息。
在一种可能的实现方式中,所述目标超图中连接不同节点的超边包括如下至少一种:
表征节点之间在时间维度上的依赖关系的至少一个第一超边,所述第一超边为基于所述历史行为序列中各用户行为的先后顺序确定出的,至少一个所述第一超边用于连接所述历史行为序列中先后顺序连续的目标数量个用户行为对应的节点;
表征节点之间在属性维度上的依赖关系的至少一个第二超边,所述第二超边为基于所述历史行为序列中用户行为之间的关联关系确定出的,至少一个所述第二超边用于连接所述历史行为序列中具有所述关联关系的至少两个用户行为对应的节点。
在又一种可能的实现方式中,所述超图神经网络为利用至少一个正样本对和至少一个负样本对,以最大化正样本对中两个超图样本对应的用户行为特征之间的特征相似性,且最小化负样本对中两个超图样本对应的用户行为特征之间的特征相似性为训练目标训练得到的;
其中,正样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边相似;
所述负样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边至少部分不相似。
在又一种可能的实现方式中,所述正样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第一超图样本和第二超图样本。
在又一种可能的实现方式中,所述第一超图样本包括:基于历史行为序列样本中多个第一用户行为之间的第一关联关系,确定出的至少一个第一目标超边,所述第一目标超边用于连接具有所述第一关联关系的至少两个第一用户行为对应的节点;
所述第二超图样本包括:基于历史行为序列样本中多个第二用户行为之间的第二关联关系,确定出的至少一个第二目标超边,所述第二目标超边用于连接具有所述第二关联关系的至少两个第二用户行为对应的节点;
其中,所述第一用户行为是历史行为序列样本中处于第一时间周期内的用户行为,所述第二用户行为是历史行为序列样本中处于第二时间周期内的用户行为,所述第一时间周期与第二时间周期属于所述样本用户的历史行为序列对应的历史时段中两个相邻的时间周期。
在又一种可能的实现方式中,所述负样本对包括:基于不同样本用户的历史行为序列样本,构建出的第三超图样本和第四超图样本;
或者,
所述负样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第五超图样本和第六超图样本;且,
所述第五超图样本包括:基于历史行为序列样本中多个第三用户行为之间的第三关联关系,确定出的至少一个第三目标超边,所述第三目标超边用于连接具有所述第三关联关系的至少两个第三用户行为对应的节点;
所述第六超图样本包括:基于历史行为序列样本中多个第四用户行为之间的第四关联关系,确定出的至少一个第四目标超边,所述第四目标超边用于连接具有所述第四关联关系的至少两个第四用户行为对应的节点;
其中,第三用户行为是历史行为序列样本中处于第三时间周期内的用户行为,所述第四用户行为是历史行为序列样本中处于第四时间周期内的用户行为,所述第三时间周期与第四时间周期属于历史行为序列对应的历史时段中两个不相邻的时间周期。
在又一种可能的实现方式中,所述超图神经网络通过如下方式训练得到:
获得多个正样本对和多个负样本对;
对于每个正样本对和负样本对中的每个超图样本,利用待训练的超图神经网络确定所述超图样本对应的用户行为特征;
对于每个正样本对,确定所述正样本对中两个超图样本对应的用户行为特征之间的第一特征相似度;
对于每个负样本对,确定所述负样本对中两个超图样本对应的用户行为特征之间的第二特征相似度;
如果基于各正样本对的第一特征相似度以及各负样本对的第二特征相似度确定未满足所述训练目标,调整所述超图神经网络的参数,直至满足所述训练目标,得到训练出的所述超图神经网络。
在又一种可能的实现方式中,所述基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,包括:
对于所述目标超图中的每个节点,基于所述节点表征的用户行为,通过超图神经网络确定所述节点的第一节点特征;
针对所述目标超图中每个超边,通过所述超图神经网络确定出所述超边连接的各个节点的权重,基于所述超边连接的各个节点的第一节点特征和权重,确定出所述超边的超边特征;
对于所述目标超图中每个节点,通过所述超图神经网络确定出所述节点连接的各个超边的权重,基于所述节点连接的各个超边的超边特征和权重,聚合出所述节点的第二节点特征;
基于所述目标超图中各个节点的第二节点特征,利用所述超图神经网络确定出所述目标超图表现出的用户行为特征。
在又一种可能的实现方式中,还包括:
获得可供推荐的多个对象各自的对象特征;
基于所述目标超图表现出的用户行为特征以及所述多个对象各自的对象特征,确定向所述用户推荐的至少一个目标对象,所述目标对象属于所述多个对象。
又一方面,本申请还提供了一种确定用户行为特征的装置,包括:
序列获得单元,用于获得用户的至少一个历史行为序列,所述历史行为序列包括:一个历史时段内的用户行为信息;
超图构建单元,用于依据所述历史行为序列,构建目标超图,所述目标超图中包括多个节点以及不同节点之间的超边,所述目标超图中不同节点表征所述历史时段内不同历史时刻的用户行为,所述目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;
特征确定单元,用于基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,以将所述用户行为特征确定为向所述用户进行对象推荐的依据信息。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请实施例提供的确定用户行为特征的方法的一种流程示意图;
图2示出了本申请实施例利用超图神经网络确定所述目标超图表现出的用户行为特征的一种实现流程示意图;
图3示出了本申请实施例中基于历史行为序列,在两种不同维度上构建超边及目标超图的原理示意图;
图4示出了本申请实施例中基于样本对训练超图神经网络的一种实现原理示意图;
图5示出了本申请实施例中训练超图神经网络的一种流程示意图;
图6示出了本申请实施例提供的确定用户行为特征的装置的一种组成结构示意图;
图7示出了本申请实施例中提供的电子设备的一种组成架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,其示出了本申请实施例提供的确定用户行为特征的方法的一种流程示意图,本实施例的方法可以应用于电子设备,该电子设备可以为独立的计算机设备,独立的服务器,或者是云平台等系统中的节点或者服务器,对此不加限制。
本实施例的方法可以包括:
S101,获得用户的至少一个历史行为序列。
其中,历史行为序列包括:一个历史时段内的用户行为信息。
可以理解的是,对于每个历史行为序列而言,该历史行为序列中的用户行为信息可以反映历史时段内不同时刻的用户行为。如,该历史行为序列可以包括:多个用户行为信息,该多个用户行为信息分别为该用户在一个历史时段的不同时刻的用户行为信息。
其中,用户行为信息可以包括用户在网络平台中的操作行为,操作行为针对的对象的信息以及操作行为的时长等信息。根据推荐场景以及用户所在网络平台的不同,用户行为信息也可能会有所差别,对此不加限制。
为了便于理解,以两种情况进行说明:
如,以电商购物平台为例,在电商购物平台的场景中,可以获得如下部分或者全部用户行为信息:
用户在电商平台的浏览或者点击商品的用户行为信息,如用户浏览或者点击的商品信息或者商品链接信息,以及浏览商品或者商品页面的时间等信息;
用户在电商平台收藏商品链接的行为,如具体收藏的商品名称、类型以及收藏时间等;
用户在电商平台与客服交流的用户行为,如,交流的商品以及发起客服交互的商品页面等等信息,对此加限制。
又如,以多媒体平台的用户行为信息为例,获得的用户行为信息可以包括如下部分或者全部用户行为信息:
用户下载多媒体资源的用户行为信息,包括用户下载多媒体资源的名称以及类型等媒体资源信息,用户下载多媒体的时刻,以及用户下载次数等;
用户收听或者播放多媒体资源的用户行为信息,包括用户收听或者观看的多媒体资源的名称以及类型等媒体资源信息,用户收听或者播放多媒体资源的时刻以及时长等;
用户转发或者分享多媒体资源的用户行为信息,包括用户转发或者分享的多媒体资源的名称以及类型等媒体资源信息,以及转发或者分享的人数以及时间等。
当然,以上仅仅是举例说明,在实际应用中,每个用户行为信息涉及到的信息种类还可以更多或者更少,对此不加限制。
需要说明的是,在本申请中获得的用户的历史行为序列等用户相关信息,都是经过用户同意且通过合法渠道获得的信息。
S102,依据历史行为序列,构建目标超图。
在本申请中,为了便于区分,将基于用户的历史行为序列构建出的超图称为目标超图。
其中,目标超图中包括多个节点以及不同节点之间的超边。
在本申请中,目标超图中不同节点表征该历史行为序列对应的历史时段内不同历史时刻的用户行为。如,历史行为序列包括对应不同历史时刻的多个用户行为信息,那么目标超图中的每个节点代表一个用户行为信息,且每个节点用于表征一个用户行为信息对应的用户行为。
目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系。
可以理解的是,超图中的超边可以连接两个或者两个以上的节点,因此,通过目标超图中的超边可以反映出该超边连接的至少两个节点在一种或者多种维度上的依赖关系。
其中,节点之间的依赖关系反映的是节点表征的用户行为之间的依赖关系,具体可以为用户行为在时间、行为属性上或者其他维度的依赖关系,对此不加限制。
S103,基于目标超图中的节点以及节点之间的超边,利用超图神经网络确定目标超图表现出的用户行为特征,以将用户行为特征确定为向用户进行对象推荐的依据信息。
其中,超图神经网络是一种应用于图数据结构的深度学习模型,其可以对超图中的节点和超边进行嵌入式学习和表示学习,最终得到超图整体表现的特征。
在本申请中,由于目标超图中的节点以及节点之间的超边反映的是用户的用户行为以及用户行为之间的依赖关系,因此,通过超图神经网络确定出的超图的特征本质上是该用户的用户行为特征。
可以理解的是,该超图神经网络的网络结构形式可以有多种,本申请对此不加限制。
在本申请中,该超图神经网络可以采用已有的超图神经网络。
在一种可选方式中,为了使得该超图神经网络能够更为准确地分析出目标超图中与用户行为有关的用户行为特征,本申请还可以预先训练超图神经网络。如,该超图神经网络可以利用至少一个正样本对和至少一个负样本对,以最大化正样本对中两个超图样本对应的用户行为特征之间的特征相似性,且最小化负样本对中两个超图样本对应的用户行为特征之间的特征相似性为训练目标训练得到的。
其中,每个正样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边相似。每个负样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边至少部分不相似。
其中,对于正样本对和负样本对中任意一个超图样本,该超图样本对应用户行为特征为利用需要训练的超图神经网络确定出的该超图样本表现出的用户行为特征。
由以上可知,在本申请中,根据用户的历史行为序列构建出目标超图。通过目标超图中的节点可以表征该历史行为序列中对应的历史时段内不同用户时刻的用户行为,且通过目标超图中的超边可以表征该超边连接的节点之间在至少一种维度上的依赖关系,使得目标超图能够更为全面且清晰地表现出历史行为序列中用户不同时刻的用户行为之间潜在的依赖关系,因此,利用超图神经网络确定出的该目标超图表现用户行为特征,能够更为准确且全面地反映出用户历史上的行为特征,从而基于该用户行为特征能够实现更为精准地对象推荐。
可以理解的是,在本申请实施例中,在基于用户的历史行为序列构建出目标超图,并确定出目标超图表现的用户行为特征之后,便可以基于该用户的用户行为特征来向该用户进行对象推荐。
如,在一种可能的实现方式中,可以获得可供推荐的多个对象各自的对象特征。在此基础上,可以基于该目标超图表现出的用户行为特征以及该多个对象各自的对象特征,确定向该用户推荐的至少一个目标对象。其中,该目标对象属于该多个对象。
其中,根据推荐场景的不同,对象也可以有多种可能,如,对象可以为电商平台中的商品,多媒体资源平台中的多媒体(比如,音乐,视频、或者新闻资讯等),还可以是一些论文服务平台中的论文等,对此不加限制。
其中,对象的对象特征用于表现对象的感兴趣用户的特征,确定对象的对象特征的方式可以有多种可能,对此不加限制。如,对象的对象特征可以是基于对象自身的属性、用户对该对象的评价信息以及历史上对该对象感应区的用户特征确定出的。
结合用户的用户行为特征以及各对象的对象特征,确定适合向该用户推荐的对象的具体实现也可以有多种可能,本申请对此不加限制。
在本申请实施例中,超图神经网络确定超图表现的用户行为特征的具体实现可以有多种可能,本申请对此不加限制。
下面以一种实现方式为例进行说明。如图2所示,其示出了本申请实施例中利用超图神经网络确定所述目标超图表现出的用户行为特征的一种实现流程示意图,本实施例的方法可以包括:
S201,对于目标超图中的每个节点,基于节点表征的用户行为,通过超图神经网络确定节点的第一节点特征。
可以理解的是,虽然超图神经网络的网络结构可以有多种可能,但是超图神经网络一般都包括多层网络或者多层模块。不同层网络或者模块侧重分析或者提取的特征也会有所差别。
在本申请中,超图神经网络比较靠前的网络层或者模块会先分析目标超图中各个节点代表的特征,分别确定每个节点表征的用户行为所反映出的用户行为特征。在本申请中,基于节点分析出的该节点表征的用户行为对应的特征称为第一节点特征。
S202,针对该目标超图中每个超边,通过该超图神经网络确定出该超边连接的各个节点的权重,基于该超边连接的各个节点的第一节点特征和权重,确定出该超边的超边特征。
可以理解的是,由于超边连接的至少两个节点之间具有至少一种维度的依赖关系,因此,可以通过将超边连接的各个节点的第一节点特征确定出超边的超边特征。
如,超边的超边特征可以是该超边连接的各个节点的第一节点特征的加权和,或者是,结合超边连接的各个节点的权重对各个节点的第一节点特征进行特征拼接或者融合,得到该超边的超边特征,对此不加限制。
S203,对于目标超图中每个节点,通过该超图神经网络确定出该节点连接的各个超边的权重,基于该节点连接的各个超边的超边特征和权重,聚合出节点的第二节点特征。
其中,节点连接的各个超边也就是连接有该节点的各条超边。
可以理解的是,结合节点连接的各个超边的超边特征和权重确定节点的第二节点特征的过程可以与步骤S202中确定超边的超边特征的具体实现方式类似,对此不再赘述。
S204,基于目标超图中各个节点的第二节点特征,利用超图神经网络确定出目标超图表现出的用户行为特征。
如,可以将各个节点的第二节点特征进行融合或者拼接,以合成为该目标超图的特征,该特征就是目标超图表现出的用户行为特征。
当然,结合目标超图中各个节点的第二节点特征确定目标超图的特征的具体实现可以有其他多种可能,对此不加限制。
可以理解的是,在结合节点表征的用户行为确定出节点的第一节点特征后,基于超边连接的各节点的第一节点特征,确定超边的超边特征,并最终基于节点连接的超边的超边特征重新确定节点的第二节点特征,可以使得节点的第二节点特征不仅能够反映出节点自身表现的用户行为的特征,还可以体现出与该节点存在依赖关系的各节点表征的用户行为之间的关系,因此,结合各个节点的第二节点特征能够更为准确地反映出目标超图表现的用户行为特征。
在本申请中构建出的目标超图的超边所表征的节点之间的依赖关系可以有多种维度。
为了能够更好地反映出历史行为序列中不同用户行为信息对应的用户行为之间的依赖关系,本申请在构建目标超图时,可以基于时间维度和属性维度这两种维度中的一种或者两种来构建目标超图的超边。
相应的,目标超图中连接不同节点的超边可以包括如下至少一种:
表征节点之间在时间维度上的依赖关系的至少一个第一超边。
表征节点之间在属性维度上的依赖关系的至少一个第二超边。
其中,第一超边为基于该用户的历史行为序列中各用户行为的先后顺序确定出的超边。每个第一超边用于连接该历史行为序列中先后顺序连续的目标数量个用户行为对应的节点。
可以理解的是,历史行为序列中用户行为信息是按照时间先后顺序排列的,相应的,历史行为序列中用户行为信息表征的用户行为也是具有先后顺序的。可以理解的是,历史行为序列中用户行为信息表征的用户行为反映的是用户的兴趣喜好,如,用户对于对象的兴趣,因此,基于历史行为序列中用户行为信息对应的各用户行为以及各用户行为的先后顺序可以反映出用户的兴趣喜好的偏移以及变化。
在实际应用中,短时间内或者说相邻较近的几次用户行为会更为相似,而较长时间内或者相隔较远的用户行为的差异性较大,从而使得较长的行为序列中会存在用户兴趣的偏移。
举例说明:
用户A最初希望买台电脑,那么用户可能会在电商平台上大量搜索以及浏览电脑产品,但是在用户购买了电脑之后,用户可能就不再关注电脑,可能会在电商平台上搜索以及浏览电脑配件产品。
基于此,在获得用户A的历史行为序列中时间比较靠前的用户行为信息可以表明用户的兴趣是电脑,但是时间较为靠后的用户行为信息就会表明用户感兴趣的是电脑配件。
可见,如果历史行为序列较长,即包含的较长时间内的用户行为信息,就会存在兴趣偏移的问题,因此,结合历史行为序列中所有的用户行为信息来确定用户行为之间的关联关系,必然会存在兴趣分析不准确的问题。
基于此,为了减少由于历史行为序列较长而导致的兴趣偏移问题,本申请可以在时间维度上对历史行为序列进行分割,并分别确定分割后的较短的历史行为序列中用户行为之间的关联关系。
在此基础上,在基于历史行为序列中用户行为信息构建出目标超图中的各个节点之后,本申请会基于该用户的历史行为序列中各用户行为的先后顺序,仅将该历史行为序列中先后顺序连续的目标数量个节点连接到一起,构成第一超边。
在目标超图中的第一超边本质上可以看成是,将历史行为序列分割为较短的序列,并构建分割出的各较短序列中用户行为对应的节点之间的超边,这样基于超图神经网络的自回归模式,在对目标超图进行分析过程中,能够更多地学到最近时间段内多个节点的特征,从而可以侧重抽取出目标超图中比较重要的超边的特征,以准确反映用户行为特征。
其中,该目标数量可以根据需要设定,而且,在实际应用中,还可以设定有多个不同的目标数量。如,目标数量可以包括3和4,相应的,目标超图中可以包括连接历史行为序列中先后顺序连续的3个用户行为对应节点的至少一个第一超边,以及,连接历史行为序列中先后顺序连续的4个用户行为对应的节点的至少一个第一超边。
为了便于理解第一超边及其构建过程,结合图3进行说明。
在图3中以历史行为序列包括对应不同时刻的6个用户行为信息为例进行说明,每个用户行为信息用于表征用户的一种用户行为,当然,不同用户行为信息所表征的用户行为的类型以及用户行为针对的对象可以相同,也可以不同。
在图3中每个圆圈代表一个用户行为信息。图3中历史行为序列中6个用户行为信息的先后顺序如图3中6个圆圈代表的用户行为信息从上到下的排序。为了便于描述,按照历史行为序列中6个用户行为信息的先后顺序,依次将这6个用户行为信息对应的用户行为称为行为1、行为2、行为3、行为4、行为5和行为6,如图3中圆圈内的文字所示。
在图3中还标示出了每个用户行为信息表征的用户行为所针对的对象。如图3所示,行为1针对的对象为对象1,如行为1可能是浏览对象1等。类似的,行为2针对的对象为对象2,行为3针对对象3、行为4针对对象4、行为5针对对象5,行为6针对对象6。
在图3的基础上,在构建目标超图时,针对用户行为信息构建一个节点,因此,每个节点表征一个用户行为信息对应的用户行为。基于此,图3中每个圆圈就可以表示为一个节点。
在此基础上,我们可以设定目标数量为2和3。如图3所示,在时间维度上示出了三种构建超边的情况,依次为情况1到情况3。每种情况示出了一条超边所可能连接的节点,其中,每条超边所需连接的节点用虚线框标出。
由图3可见,对于目标数量为2,可以参见情况1和情况2所示,可以按照图3中历史行为序列对应的6个行为,将先后顺序相邻(也可以看成是对应的时刻点相邻或者最接近)的2个行为对应的节点连接为一个超边。比如图3中情况1所示,将时间最靠前的行为1和行为2对应的节点连接为一个超边。类似的,对于情况2是将排序处于第二位和第三位的用户行为信息对应的节点连接为一个超边,即行为2和行为3对应的节点连接为一条超边。
在目标数量为3时,可以参见图3中的情况3对应的一列所示,如情况3所示,将相邻的三个用户行为对应的节点连接为一条超边,如历史行为序列中相邻的行为3、行为4和行为5被虚线框图,表示这三个行为各自对应的节点连接为一条超边。
相应的,在图3中构建出的目标超图同样会包含以上提到的三条超边。在图3中目标超图中每个圆圈代表一个用户行为对应的节点,圆圈之间的连线代表超边,且为了区分不同的超边,在图3中采用了不同粗细或者线型的线来表示不同的超边。
如图3中目标超图包括:行为1与行为2对应的节点之间的超边;行为2和行为3对应的节点之间的超边;以及,行为3、行为4和行为5对应的节点之间的超边。
可以理解的是,图3中是以基于时间维度构建的三条超边为例进行简单说明,在应用中对于图3中示出的历史行为序列而言,在目标数量为2或3的情况下,构建出的时间维度的超边还可以有其他可能。比如,将行为3和行为4对应的节点构成一条超边,类似的,行为4、行为5和行为6对应的节点也可以构成一条超边,不再赘述。
在本申请中,第二超边为基于用户的历史行为序列中用户行为之间的关联关系确定出的超边。其中,每个第二超边用于连接该历史行为序列中具有该关联关系的至少两个用户行为对应的节点。
其中,历史行为序列中用户行为之间的关联关系可以表征历史行为序列中用户行为信息表征的不同用户行为在行为属性上的关联性。基于历史行为序列中用户行为之间的关联关系确定第二超边可以将表征相似用户行为的节点连接到一起,从而能够通过第二超边反映出不同节点之间在用户行为属性(即属性维度)上存在关联。
如,用户行为之间的关联关系可以包括如下至少一种可能:
用户行为的操作类型相同或者相似,如,用户行为的操作类型可以分为点击、收藏或者滑动浏览等;
用户行为所针对的对象的对象类型相同或者相似,如,用户行为都是针对同一类型的电子产品、多媒体或者文档等;
用户行为产生的网络平台相同或者相似。
当然,用户行为之间的关联关系还可以有其他可能,在此不再赘述。
可以理解的是,相同属性的用户行为代表了用户相同的兴趣,因此,通过将表征的用户行为具有关联关系的节点相连来构建第二超边,可以通过每条第二超边连接的节点来确定出历史行为序列中表征相同兴趣的用户行为,从而能够更好地体现出用户行为序列中不同用户行为所表征的兴趣类别,有利于通过目标超图更好地体现出用户的兴趣特征。
为了便于理解第二超边及其构建过程,仍结合图3进行说明。
如图3所示,基于图3示出的历史行为序列,还可以从属性维度方面来构建节点之间的超边(即第二超边)。
为了便于描述,在图3中以用户行为之间的关联关系为用户行为所针对的是同一类型对象为例说明。
在基于历史行为序列构建出六个节点之后,可以基于节点表征的用户行为所针对的对象,将针对相同类型对象的节点采用超边连接。如图3所示,行为2对应的节点和行为6对应的节点都是针对对象3,那么这两个节点之间在属性维度上具有依赖关系,因此,需要构建这两个节点之间的超边。
类似的,行为1对应的节点、行为3对应的节点以及行为5对应的节点所针对的对象都是同一类型的对象1,因此,这三个节点也在属性维度上具有依赖关系,所以需要构建出连接这三个节点的一条超边。
由图3可以看出,在属性维度上构建的两条超边最终会呈现在图3构建出的目标超图中。
相应的,在图3中目标超图最终包括:表征节点在时间维度上依赖关系的三条第一超边以及表征节点在属性维度上依赖关系的两条第二超边。
在本申请以上实施例中,训练超图神经网络的正样本对和负样本对及其构建过程也可以有多种可能,只要是保证每个正样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边相似,而每个负样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边至少部分不相似即可。
在一种可能的实现方式中,考虑到相对不同用户的用户行为序列而言,同一用户的用户行为序列中包含的用户行为之间的相似程度会相对较高。基于此,本申请中正样本对可以包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第一超图样本和第二超图样本。
如,第一超图样本和第二超图样本中包含的节点以及各节点表征的用户行为均相同,但是第一超图样本和第二超图样本中超边的数量或者包含的超边不完全相同。
又如,考虑到时间较为相近的用户行为,如果在属性维度上存在关联关系的用户行为可以较为准确地反映出用户的兴趣,但是如果相隔时间较远的用户行为,即使在属性维度上存在关联关系也可能无法准确反映用户的兴趣。
基于此,本申请中,对于基于同一用户的历史行为序列构建的一个正样本对而言,第一超图样本可以是包括:基于历史行为序列样本中多个第一用户行为之间的第一关联关系,确定出的至少一个第一目标超边。该第一目标超边用于连接具有所述第一关联关系的至少两个第一用户行为对应的节点。相应的,第二超图样本包括:基于该历史行为序列样本中多个第二用户行为之间的第二关联关系,确定出的至少一个第二目标超边。其中,该第二目标超边用于连接具有该第二关联关系的至少两个第二用户行为对应的节点。
其中,第一用户行为是该历史行为序列样本中处于第一时间周期内的用户行为。该第二用户行为是历史行为序列样本中处于第二时间周期内的用户行为。且该第一时间周期与第二时间周期属于该样本用户的历史行为序列对应的历史时段中两个相邻的时间周期。
时间周期可以为设定时长区间,具体可以根据需要设定,如,时间周期为一天,也可以为两天等,对此不加限制。在本申请中,第一时间周期和第二时间周期仅仅是为了区分不同时间周期,但是这两个时间周期的时长可以相同。
可以理解的是,以上便于区分,将历史行为序列中处于第一时间周期内的用户行为和第二时间周期内的用户行为分别称为第一用户行为和第二用户行为,相应的,将第一用户行为之间的关联关系称为第一关联关系,并将第二用户行为之间的关联关系称为第二关联关系。
第一用户行为之间的第一关联关系以及第二用户行为之间的第二关联关系与前面用户行为之间的关联关系相似,具体均可以参见前面的相关介绍,在此不再赘述。
类似的,为了便于区分,将第一超图样本中基于历史行为序列样本中多个第一用户行为之间的第一关联关系,确定出的超边称为第一目标超边。但是可以理解的是,第一目标超边实际上是基于用户行为对应的节点在属性维度上构建出的超边。基于此,确定第一目标超边的过程与前面确定第二超边的过程相似,确定第二目标超边的过程也与前面确定第二超边的过程,只不过是第二目标超边和第二目标超边是基于不同时间周期内产生的用户行为确定的。
由以上可知,第一超图样本和第二超图样本所包含的节点相同及其表征的用户行为相似或相同,只不过第一超图样本和第二超图样本中构建出的超边不完全相同。
可以理解的是,第一超图样本和第二超图样本除了包括不同的超边外,还可以包括相同的超边,如,第一超图样本和第二超图样本中都包括:基于同一样本用户的历史行为序列样本中各用户行为的先后顺序确定出的至少一条样本超边。每条样本超边用于连接该历史行为序列样本中先后顺序连续的目标数量个用户行为对应的节点。
在第一超图样本和第二超图样本包括样本超边的情况下,既可以体现出样本用户的历史行为序列样本中不同用户行为在时间上的先后顺序,又可以减少用户兴趣偏移的问题。
可以理解的是,第一超图样本和第二超图样本的构建方式可以有多种可能,如,可以直接基于同一样本用户的历史行为序列样本构建出满足如上要求的第一超图样本和第二超图样本。
又如,还可以是基于一个样本用户的历史行为序列样本,结合前面生成目标超图的方式,构建出该样本用户的超图样本,然后再通过对超图样本进行分割或者说剔除不符合条件的超边,分别得到第一超图样本和第二超图样本。为了便于理解该种方式,可以参见图4,其示出了基于训练超图神经网络的一种原理示意图。
在图4中仅示出了构建训练超图神经网络模型的正样本对的示例过程。
为了便于介绍,假设基于样本用户的历史行为序列样本构建出的超图样本为图3示出的目标超图。在此基础上,将图3的目标超图作为超图样本,如图4右侧的超图样本所示。
由于该超图样本实际上除了包括表征节点在时间维度上的依赖关系的所有第一超边之外,还包括表征节点在属性维度上的依赖关系的所有第二超边。
然而,为了能够基于该超图样本拆分出表征的用户行为特征相近且超边又不完全相同的第一超图样本和第二超图样本,那么可以对超图样本中的部分第二超边进行去除。
首先说明基于超图样本构建第一超图样本(对应图4中子超图样本1)的过程:
为了便于描述,在图4中第一个时间周期包括了行为1、行为2和行为3对应的用户行为信息,而行为3处于第一个时间周期和第二时间周期的交界处,所以第二个时间周期包括行为3、行为4和行为5对应的用户行为信息。由于第一个时间周期和第二个时间周期为两个相邻的时间周期,因此,第一个时间周期和第二个时间周期可以作为相互相邻的第一时间周期和第二时间周期。
在此基础上,以第一个时间周期为第一时间周期为例,那么行为1和行为3对应的对象相同且均属于第一时间周期,但是行为5不属于该第一时间周期,所以需要在样本超图的基础上,将原来连接行为1、行为3和行为5对应节点的第二超边(图4超图样本中最粗的一个线条)中去除连接行为5对应的节点的超边部分,仅可以保留该包含行为1和行为3之间连接的第二超边,得到如图4中的子超图样本1。
而对于第一时间周期相邻的第二时间周期,由于行为3和行为5针对同一对象且均属于该第二时间周期,但是行为1却不属于第二个时间周期,所有仅仅保留行为3和行为5对应节点之间的第二超边,得到如图4中子超图样本2。
对比超图样本、子超图样本1和子超图样本2可知,子超图样本1和子超图样本2都属于该超图样本的子超图,且包含的节点以及节点表征的用户行为均相同,但是子超图样本1和子超图样本中表征节点在属性维度上的依赖关系的第二超边仅仅保留了属于同一时间周期内的用户行为对应节点之间的第二超边。而且由于子超图样本1和子超图样本2中第二超边连接的各个节点所表征的用户行为所归属的时间周期属于两个相邻时间周期,使得这两个子超图样本表征出的用户行为特征相似。
结合图4可见,相对基于样本用户的历史行为序列样本构建出的完整的超图样本而言,正样本对中第一超图样本和第二超图样本相对于对超图样本进行了裁剪,保留了基于较短时间段内的历史行为序列样本能够构建出的第二超边,从而减少了由于序列过长而导致的训练学习困难,且还可以避免过拟合。
在本申请中,负样本对也可以有多种可能。
在一种可能的情况中,考虑到不同用户样本的差异,负样本对可以包括:基于不同样本用户的历史行为序列样本,构建出的第三超图样本和第四超图样本。
其中,第三超图样本和第四超图样本可以是按照前面构建目标超图的方式,基于不同样本用户的历史行为序列样本构建出的超图样本;也可以是在构建出不同样本用户的超图样本后,分别从不同样本用户的超图样本中分割出子超图样本,以将来源于不同样本用户的子超图样本分别作为第三超图样本和第四超图样本,对此不加限制。
在又一种可能的情况中,负样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第五超图样本和第六超图样本。
而且,为了避免第五超图样本和第六超图样本表现出的用户行为特征相似,该第五超图样本包括:基于历史行为序列样本中多个第三用户行为之间的第三关联关系,确定出的至少一个第三目标超边,第三目标超边用于连接具有第三关联关系的至少两个第三用户行为对应的节点。
相应的,该第六超图样本包括:基于历史行为序列样本中多个第四用户行为之间的第四关联关系,确定出的至少一个第四目标超边,第四目标超边用于连接具有第四关联关系的至少两个第四用户行为对应的节点;
其中,第三用户行为是历史行为序列样本中处于第三时间周期内的用户行为,第四用户行为是历史行为序列样本中处于第四时间周期内的用户行为。第三时间周期与第四时间周期属于历史行为序列对应的历史时段中两个不相邻的时间周期。
由于第三时间周期与第四时间周期相邻较远,因此,两个时间周期内用户行为的差异性较大,进而使得构建出的第五超图样本和第六超图样本所保证的用户行为特征具有较大差异性。
其中,单独构建第五超图样本以及第六超图样本的过程与前面构建第一超图样本的过程相似,仅仅是第五超图样本、第六超图样本以及第一超图样本可能对应的时间周期不同而言,具体过程如前面所述,在此不再赘述。
可以理解的是,在确定出多个正样本对和负样本对的情况下,训练超图神经网络模型的方式可以有多种。下面结合图4,以训练超图神经网络的一种实现方式为例进行说明。
如图5所示,其示出了本申请实施例提供的训练超图神经网络的一种训练流程示意图,本流程可以包括:
S501,获得多个正样本对和多个负样本对。
在本实施例中,正样本对和负样本对可以为前面提到的任意一种情况,相应的,获得正样本对和负样本对的具体方式可以参见前面的相关介绍,对此不再赘述。
特别的,为了提升训练效果,每个正样本对可以包括前面提到的第一超图样本和第二超图样本。而多个负样本对中可以每个负样本对可以都是基于不同样本用户的历史行为序列样本构建的负样本对,也可以有部分负样本对为包括第五超图样本和第二超图样本的负样本对,对此不加限制。
S502,对于每个正样本对和负样本对中的每个超图样本,利用待训练的超图神经网络确定超图样本对应的用户行为特征。
对于每个超图样本,将该超图样本输入到该超图神经网络之后,超图神经网络确定该超图样本表现的用户行为特征的具体方式,与前面超图神经网络确定目标超图的用户行为特征的过程相似。具体可以参见前面的相关介绍,在此不再赘述。
S503,对于每个正样本对,确定正样本对中两个超图样本对应的用户行为特征之间的第一特征相似度。
S504,对于每个负样本对,确定负样本对中两个超图样本对应的用户行为特征之间的第二特征相似度。
为了便于区分,将正样本对中两个超图样本的用户行为特征之间的相似度称为第一特征相似度,而将负样本对中两个超图样本的用户行为特征之间的相似度称为第二特征相似度。
可以理解的是,对于任意两个超图样本而言,计算这两个超图样本的用户行为特征之间的特征相似的方式可以有多种方式,对此不加限制。
如图4中以正样本对为例,将构成正样本对的子超图样本1和子超图样本2分别输入到超图神经网络,可以得到这两个子超图样本各自的用户行为特征。在此基础上,基于图对比学习,需要确定这两个子超图样本的用户行为特征之间的相似度,对于负样本对也类似,不再赘述。
需要说明的是,图4为了便于理解画出了两个超图神经网络,但是实际上这两个超图神经网络可以为同一个,图4仅仅是为了说明两个作为正样本的子超图样本分别输入超图神经网络的过程。
S505,基于各正样本对的第一特征相似度以及各负样本对的第二特征相似度,确定当前是否满足训练目标,如果否,调整超图神经网络的参数,并返回步骤S502;如果是,结束训练,得到训练出的超图神经网络。
该训练目标为最大化正样本对中两个超图样本对应的用户行为特征之间的特征相似性,且最小化负样本对中两个超图样本对应的用户行为特征之间的特征相似性。
其中,满足训练目标可以是各正样本对的第一特征相似度均超过第一设定阈值,且各负样本对的第二特征相似度均小于第二设定阈值,第一设定阈值大于第二设定阈值;或者是,训练迭代次数达到设定次数;还可以是各正样本对的第一特征相似度以及各负样本对的第二特征相似度达到收敛。当然,还可以有其他判断方式,对此不加限制。
对应本申请实施例提供的确定用户行为特征的方法,本申请还提供了一种确定用户行为特征的装置。
如图6所示,其示出了本申请实施例提供的确定用户行为特征的装置的一种组成结构示意图,本实施例的装置可以包括:
序列获得单元601,用于获得用户的至少一个历史行为序列,所述历史行为序列包括:一个历史时段内的用户行为信息;
超图构建单元602,用于依据所述历史行为序列,构建目标超图,所述目标超图中包括多个节点以及不同节点之间的超边,所述目标超图中不同节点表征所述历史时段内不同历史时刻的用户行为,所述目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;
特征确定单元603,用于基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,以将所述用户行为特征确定为向所述用户进行对象推荐的依据信息。
在一种可能的实现方式中,该目标超图中连接不同节点的超边包括如下至少一种:
表征节点之间在时间维度上的依赖关系的至少一个第一超边,所述第一超边为基于所述历史行为序列中各用户行为的先后顺序确定出的,至少一个所述第一超边用于连接所述历史行为序列中先后顺序连续的目标数量个用户行为对应的节点;
表征节点之间在属性维度上的依赖关系的至少一个第二超边,所述第二超边为基于所述历史行为序列中用户行为之间的关联关系确定出的,至少一个所述第二超边用于连接所述历史行为序列中具有所述关联关系的至少两个用户行为对应的节点。
在又一种可能的实现方式中,该超图神经网络为利用至少一个正样本对和至少一个负样本对,以最大化正样本对中两个超图样本对应的用户行为特征之间的特征相似性,且最小化负样本对中两个超图样本对应的用户行为特征之间的特征相似性为训练目标训练得到的;
其中,正样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边相似;
该负样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边至少部分不相似。
在又一种可能的实现方式中,正样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第一超图样本和第二超图样本。
在一种可选方式中,该第一超图样本包括:基于历史行为序列样本中多个第一用户行为之间的第一关联关系,确定出的至少一个第一目标超边,所述第一目标超边用于连接具有所述第一关联关系的至少两个第一用户行为对应的节点;
该第二超图样本包括:基于历史行为序列样本中多个第二用户行为之间的第二关联关系,确定出的至少一个第二目标超边,所述第二目标超边用于连接具有所述第二关联关系的至少两个第二用户行为对应的节点;
其中,该第一用户行为是历史行为序列样本中处于第一时间周期内的用户行为,该第二用户行为是历史行为序列样本中处于第二时间周期内的用户行为,该第一时间周期与第二时间周期属于该样本用户的历史行为序列对应的历史时段中两个相邻的时间周期。
在又一种可能的实现方式中,该负样本对包括:基于不同样本用户的历史行为序列样本,构建出的第三超图样本和第四超图样本;
或者,
该负样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第五超图样本和第六超图样本;且,
该第五超图样本包括:基于历史行为序列样本中多个第三用户行为之间的第三关联关系,确定出的至少一个第三目标超边,所述第三目标超边用于连接具有所述第三关联关系的至少两个第三用户行为对应的节点;
该第六超图样本包括:基于历史行为序列样本中多个第四用户行为之间的第四关联关系,确定出的至少一个第四目标超边,所述第四目标超边用于连接具有所述第四关联关系的至少两个第四用户行为对应的节点;
其中,第三用户行为是历史行为序列样本中处于第三时间周期内的用户行为,所述第四用户行为是历史行为序列样本中处于第四时间周期内的用户行为,所述第三时间周期与第四时间周期属于历史行为序列对应的历史时段中两个不相邻的时间周期。
在又一种可能的实现方式中,该装置还包括:训练单元,用于通过如下方式训练该超图神经网络:
获得多个正样本对和多个负样本对;
对于每个正样本对和负样本对中的每个超图样本,利用待训练的超图神经网络确定所述超图样本对应的用户行为特征;
对于每个正样本对,确定所述正样本对中两个超图样本对应的用户行为特征之间的第一特征相似度;
对于每个负样本对,确定所述负样本对中两个超图样本对应的用户行为特征之间的第二特征相似度;
如果基于各正样本对的第一特征相似度以及各负样本对的第二特征相似度确定未满足所述训练目标,调整所述超图神经网络的参数,直至满足所述训练目标,得到训练出的所述超图神经网络。
在又一种可能的实现方式中,该特征确定单元,包括:
第一特征确定单元,用于对于所述目标超图中的每个节点,基于所述节点表征的用户行为,通过超图神经网络确定所述节点的第一节点特征;
第二特征确定单元,用于针对所述目标超图中每个超边,通过所述超图神经网络确定出所述超边连接的各个节点的权重,基于所述超边连接的各个节点的第一节点特征和权重,确定出所述超边的超边特征;
第三特征确定单元,用于对于所述目标超图中每个节点,通过所述超图神经网络确定出所述节点连接的各个超边的权重,基于所述节点连接的各个超边的超边特征和权重,聚合出所述节点的第二节点特征;
第四特征确定单元,用于基于所述目标超图中各个节点的第二节点特征,利用所述超图神经网络确定出所述目标超图表现出的用户行为特征。
在又一种可能的实现方式中,该装置还包括:
对象特征确定单元,用于获得可供推荐的多个对象各自的对象特征;
推荐处理单元,用于基于所述目标超图表现出的用户行为特征以及所述多个对象各自的对象特征,确定向所述用户推荐的至少一个目标对象,所述目标对象属于所述多个对象。
又一方面,本申请还提供了一种电子设备,如图7所示,其示出了该电子设备的一种组成结构示意图,该电子设备可以为任意类型的电子设备,该电子设备至少包括处理器701和存储器702;
其中,处理器701用于执行如上任意一个实施例中的确定用户行为特征的方法。
该存储器702用于存储处理器执行操作所需的程序。
可以理解的是,该电子设备还可以包括显示单元703以及输入单元704。
当然,该电子设备还可以具有比图7更多或者更少的部件,对此不加限制。
另一方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上任意一个实施例所述的确定用户行为特征的方法。
本申请还提出了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机程序在电子设备上运行时,用于执行如上任意一个实施例中的确定用户行为特征的方法。
可以理解的是,在本申请中,说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。同时,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种确定用户行为特征的方法,包括:
获得用户的至少一个历史行为序列,所述历史行为序列包括:一个历史时段内的用户行为信息;
依据所述历史行为序列,构建目标超图,所述目标超图中包括多个节点以及不同节点之间的超边,所述目标超图中不同节点表征所述历史时段内不同历史时刻的用户行为,所述目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;
基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,以将所述用户行为特征确定为向所述用户进行对象推荐的依据信息。
2.根据权利要求1所述的方法,所述目标超图中连接不同节点的超边包括如下至少一种:
表征节点之间在时间维度上的依赖关系的至少一个第一超边,所述第一超边为基于所述历史行为序列中各用户行为的先后顺序确定出的,至少一个所述第一超边用于连接所述历史行为序列中先后顺序连续的目标数量个用户行为对应的节点;
表征节点之间在属性维度上的依赖关系的至少一个第二超边,所述第二超边为基于所述历史行为序列中用户行为之间的关联关系确定出的,至少一个所述第二超边用于连接所述历史行为序列中具有所述关联关系的至少两个用户行为对应的节点。
3.根据权利要求1所述的方法,所述超图神经网络为利用至少一个正样本对和至少一个负样本对,以最大化正样本对中两个超图样本对应的用户行为特征之间的特征相似性,且最小化负样本对中两个超图样本对应的用户行为特征之间的特征相似性为训练目标训练得到的;
其中,正样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边相似;
所述负样本对中两个超图样本中的节点表征的用户行为以及节点之间的超边至少部分不相似。
4.根据权利要求3所述的方法,所述正样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第一超图样本和第二超图样本。
5.根据权利要求4所述的方法,所述第一超图样本包括:基于历史行为序列样本中多个第一用户行为之间的第一关联关系,确定出的至少一个第一目标超边,所述第一目标超边用于连接具有所述第一关联关系的至少两个第一用户行为对应的节点;
所述第二超图样本包括:基于历史行为序列样本中多个第二用户行为之间的第二关联关系,确定出的至少一个第二目标超边,所述第二目标超边用于连接具有所述第二关联关系的至少两个第二用户行为对应的节点;
其中,所述第一用户行为是历史行为序列样本中处于第一时间周期内的用户行为,所述第二用户行为是历史行为序列样本中处于第二时间周期内的用户行为,所述第一时间周期与第二时间周期属于所述样本用户的历史行为序列对应的历史时段中两个相邻的时间周期。
6.根据权利要求3所述的方法,所述负样本对包括:基于不同样本用户的历史行为序列样本,构建出的第三超图样本和第四超图样本;
或者,
所述负样本对包括:基于同一样本用户的历史行为序列样本,构建出的节点相同且超边至少部分不同的第五超图样本和第六超图样本;且,
所述第五超图样本包括:基于历史行为序列样本中多个第三用户行为之间的第三关联关系,确定出的至少一个第三目标超边,所述第三目标超边用于连接具有所述第三关联关系的至少两个第三用户行为对应的节点;
所述第六超图样本包括:基于历史行为序列样本中多个第四用户行为之间的第四关联关系,确定出的至少一个第四目标超边,所述第四目标超边用于连接具有所述第四关联关系的至少两个第四用户行为对应的节点;
其中,第三用户行为是历史行为序列样本中处于第三时间周期内的用户行为,所述第四用户行为是历史行为序列样本中处于第四时间周期内的用户行为,所述第三时间周期与第四时间周期属于历史行为序列对应的历史时段中两个不相邻的时间周期。
7.根据权利要求3所述的方法,所述超图神经网络通过如下方式训练得到:
获得多个正样本对和多个负样本对;
对于每个正样本对和负样本对中的每个超图样本,利用待训练的超图神经网络确定所述超图样本对应的用户行为特征;
对于每个正样本对,确定所述正样本对中两个超图样本对应的用户行为特征之间的第一特征相似度;
对于每个负样本对,确定所述负样本对中两个超图样本对应的用户行为特征之间的第二特征相似度;
如果基于各正样本对的第一特征相似度以及各负样本对的第二特征相似度确定未满足所述训练目标,调整所述超图神经网络的参数,直至满足所述训练目标,得到训练出的所述超图神经网络。
8.根据权利要求1所述的方法,所述基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,包括:
对于所述目标超图中的每个节点,基于所述节点表征的用户行为,通过超图神经网络确定所述节点的第一节点特征;
针对所述目标超图中每个超边,通过所述超图神经网络确定出所述超边连接的各个节点的权重,基于所述超边连接的各个节点的第一节点特征和权重,确定出所述超边的超边特征;
对于所述目标超图中每个节点,通过所述超图神经网络确定出所述节点连接的各个超边的权重,基于所述节点连接的各个超边的超边特征和权重,聚合出所述节点的第二节点特征;
基于所述目标超图中各个节点的第二节点特征,利用所述超图神经网络确定出所述目标超图表现出的用户行为特征。
9.根据权利要求1所述的方法,还包括:
获得可供推荐的多个对象各自的对象特征;
基于所述目标超图表现出的用户行为特征以及所述多个对象各自的对象特征,确定向所述用户推荐的至少一个目标对象,所述目标对象属于所述多个对象。
10.一种确定用户行为特征的装置,包括:
序列获得单元,用于获得用户的至少一个历史行为序列,所述历史行为序列包括:一个历史时段内的用户行为信息;
超图构建单元,用于依据所述历史行为序列,构建目标超图,所述目标超图中包括多个节点以及不同节点之间的超边,所述目标超图中不同节点表征所述历史时段内不同历史时刻的用户行为,所述目标超图中连接不同节点的超边表征节点之间在至少一种维度上的依赖关系;
特征确定单元,用于基于所述目标超图中的节点以及节点之间的超边,利用超图神经网络确定所述目标超图表现出的用户行为特征,以将所述用户行为特征确定为向所述用户进行对象推荐的依据信息。
CN202310954574.1A 2023-07-31 2023-07-31 确定用户行为特征的方法和装置 Pending CN117056619A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310954574.1A CN117056619A (zh) 2023-07-31 2023-07-31 确定用户行为特征的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310954574.1A CN117056619A (zh) 2023-07-31 2023-07-31 确定用户行为特征的方法和装置

Publications (1)

Publication Number Publication Date
CN117056619A true CN117056619A (zh) 2023-11-14

Family

ID=88658095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310954574.1A Pending CN117056619A (zh) 2023-07-31 2023-07-31 确定用户行为特征的方法和装置

Country Status (1)

Country Link
CN (1) CN117056619A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556150A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 多目标预测方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556150A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 多目标预测方法、装置、设备及存储介质
CN117556150B (zh) * 2024-01-11 2024-03-15 腾讯科技(深圳)有限公司 多目标预测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Li et al. Combining usage, content, and structure data to improve web site recommendation
US8738436B2 (en) Click through rate prediction system and method
CN111159564A (zh) 信息推荐方法、装置、存储介质及计算机设备
US8032469B2 (en) Recommending similar content identified with a neural network
CN101166102A (zh) 信息处理设备及方法
CN111126495B (zh) 模型训练方法、信息预测方法、装置、存储介质及设备
TWI454945B (zh) 大規模之搜尋引擎優化
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
CN117235586B (zh) 酒店客户画像构建方法、系统、电子设备及存储介质
Grolman et al. Utilizing transfer learning for in-domain collaborative filtering
Tondji Web recommender system for job seeking and recruiting
CN117056619A (zh) 确定用户行为特征的方法和装置
KR20130038889A (ko) 오브젝트 커스터마이제이션 및 관리 시스템
JP2022035314A (ja) 情報処理装置及びプログラム
KR20030058660A (ko) 개인화 시스템에서 사용자의 컨텐트 선호도를 이용한협업필터링 학습방법
CN117271905B (zh) 基于人群画像的侧向需求分析方法及系统
CN111931069B (zh) 用户兴趣确定方法、装置及计算机设备
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
Bogers Recommender systems for social bookmarking
Markellou et al. Personalized e-commerce recommendations
Zhang et al. Predicting temporary deal success with social media timing signals
Johari et al. The Hybrid Recommender System of the Indonesian Online Market Products using IMDb weight rating and TF-IDF
CN110188277A (zh) 一种资源的推荐方法及装置
CN115392992A (zh) 商品推荐方法、终端设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination