CN110569437B - 点击概率预测、页面内容推荐方法和装置 - Google Patents

点击概率预测、页面内容推荐方法和装置 Download PDF

Info

Publication number
CN110569437B
CN110569437B CN201910837319.2A CN201910837319A CN110569437B CN 110569437 B CN110569437 B CN 110569437B CN 201910837319 A CN201910837319 A CN 201910837319A CN 110569437 B CN110569437 B CN 110569437B
Authority
CN
China
Prior art keywords
node
content
predicted
nodes
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910837319.2A
Other languages
English (en)
Other versions
CN110569437A (zh
Inventor
郁振庭
邹远航
王亚龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910837319.2A priority Critical patent/CN110569437B/zh
Publication of CN110569437A publication Critical patent/CN110569437A/zh
Application granted granted Critical
Publication of CN110569437B publication Critical patent/CN110569437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种点击概率预测、页面内容推荐方法和装置,所述方法包括:获取异构图;在异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;根据异构图中各个节点之间的节点关系边,在异构图中查找待预测节点的邻居节点;将邻居节点的节点特征汇聚至待预测节点,得到待预测节点的汇聚特征向量;根据待预测用户节点和待预测内容节点各自的汇聚特征向量,预测点击概率。本申请提供的方案可以更准确地反映出用户对页面内容的感兴趣的程度,基于所预测的点击概率向用户推荐的页面内容更符合用户兴趣。

Description

点击概率预测、页面内容推荐方法和装置
技术领域
本申请涉及数据处理技术领域,特别是涉及点击概率预测方法和装置、页面内容推荐方法和装置、计算机可读存储介质和计算机设备。
背景技术
目前,随着互联网技术的发展,越来越多的用户通过网页浏览视频、图片、文章等的页面内容。为了精准地向用户推荐其真正感兴趣的页面内容,需要对用户对页面内容的点击概率进行预测,将点击概率较高的页面内容推荐给用户。
传统的点击概率预测方法中,主要是根据用户的个人特征和页面内容的内容特征之间的相关性,预测出用户点击该页面内容的点击概率。
然而,传统的点击概率预测方法仅仅考虑到用户自身的特征和所要推荐的页面内容的特征,所预测的点击概率并不准确,因此,推荐给用户的页面内容,可能并非用户真正感兴趣的页面内容。
因此,传统的点击概率预测方法存在着所预测的点击概率不准确的问题。
发明内容
基于此,有必要针对点击概率预测不准确的技术问题,提供一种点击概率预测方法和装置、页面内容推荐方法和装置、计算机可读存储介质和计算机设备。
一种点击概率预测方法,包括:
获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
一种页面内容推荐方法,包括:
获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
一种点击概率预测装置,包括:
异构图获取模块,用于获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
节点选取模块,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块,用于根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
特征汇聚模块,用于将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
预测模块,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
一种页面内容推荐装置,包括:
异构图获取模块,用于获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
节点选取模块,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块,用于根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
特征汇聚模块,用于将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
预测模块,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
推荐模块,用于根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
上述的点击概率预测方法和装置、页面内容推荐方法和装置、计算机可读存储介质和计算机设备,通过在根据用户与页面内容之间的点击关系和页面内容之间的关联关系所生成的异构图中选取待预测节点,根据异构图中各个节点之间的节点关系边,在异构图中查找待预测节点的邻居节点,从而利用了异构图中不同节点类型的节点和不同关系类型的节点关系边,挖掘出隐含的、与待预测的用户和页面内容相关的用户和页面内容,然后,通过将邻居节点的节点特征汇聚至待预测节点得到待预测节点的汇聚特征向量,从而将与待预测的用户、页面内容相关的特征,融合至待预测的用户、页面内容自身的特征,得到了可以全面、准确反映待预测的用户、页面内容的汇聚特征向量,相比起传统的仅仅采用用户自身的特征和所要推荐的页面内容的特征预测点击概率的方法,基于用户、页面内容的汇聚特征向量预测点击概率具有较高的准确性,可以更准确地反映出用户对页面内容的感兴趣的程度,基于所预测的点击概率向用户推荐的页面内容更符合用户兴趣。
附图说明
图1为一个实施例中的一种点击概率预测方法的的应用环境图;
图2为一个实施例中的一种点击概率预测方法的流程示意图;
图3为一个实施例中的一种异构图生成流程的流程示意图;
图4A为一个实施例的一种生成异构图节点的示意图;
图4B为一个实施例的一种生成异构图节点的用户点击边的示意图;
图4C为一个实施例的一种生成异构图节点的连续点击边的示意图;
图4D为一个实施例的一种生成异构图节点的内容相似边的示意图;
图4E为一个实施例的一种异构图的示意图;
图5A为一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之一;
图5B为一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之二;
图5C为一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之三;
图6为一个实施例的一种页面内容的推荐界面的示意图;
图7为一个实施例中的一种页面内容推荐方法的流程示意图;
图8为一个实施例中的一种具体的页面内容推荐方法的流程示意图;
图9为一个实施例中的一种点击概率预测装置的结构框图;
图10为一个实施例中的一种页面内容推荐装置的结构框图;
图11A为一个实施例的一种数据共享系统的结构框图;
图11B为一个实施例的一种区块链的数据结构的示意图;
图11C为一个实施例的一种新区块产生过程的示意图;
图12为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中的一种点击概率预测方法的应用环境图。参照图1,该点击概率预测方法可以应用于页面内容推荐系统。该页面内容推荐系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个页面内容推荐场景中,页面内容提供方可以将文章、视频等的页面内容推送至终端110,以向用户推荐该页面内容,用户可以通过终端110浏览网页的页面内容,用户对某个推荐的页面内容感兴趣,则会点击该页面内容以浏览该页面内容更详细的内容细节。例如,网页播放有某个视频的片段,用户看完视频的片段之后,点击该视频以播放完整的视频。
如图2所示,在一个实施例中,提供了一种点击概率预测方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该点击概率预测方法具体包括如下步骤:
S202,获取异构图;异构图由节点以及连接节点的节点关系边构成;节点包括内容节点和用户节点;内容节点用于记录页面内容;用户节点用于记录点击页面内容的用户;用户节点与内容节点之间的节点关系边用于记录用户与用户点击的页面内容之间的点击关系;内容节点之间的节点关系边用于记录页面内容之间的关联关系。
其中,页面内容(item)可以为用于在网页页面上显示的内容。例如,页面上的视频、图片、文章等的内容。
其中,点击关系可以为记录用户对页面内容进行点击行为的信息。例如,用户点击了某个页面内容,用户与页面内容之间存在点击关系。
其中,关联关系可以为记录页面内容之间存在关联的信息。例如,页面内容之间相似,页面内容之间存在关联关系。
其中,异构图可以为由记录不同内容类型的多个节点、以及连接各个节点的记录不同的连接关系类型的节点关系边所构成的网状图。例如,节点的内容类型可以分别为用户和页面内容,节点关系边的连接关系类型可以分别为用户点击页面内容的点击关系和页面内容之间的关联关系。
其中,节点关系边可以为节点之间的用于记录用户点击页面内容的点击关系和页面内容之间的关联关系的连接线。
其中,用户节点可以为代表用户的节点。异构图中的不同用户节点代表不同的用户。
其中,内容节点可以为代表页面内容的节点。异构图中的不同内容节点代表不同的页面内容。
其中,待预测节点可以为异构图中的任意选取的至少一个用户节点和至少一个内容节点。
具体实现中,终端110会记录用户点击视频该页面内容的点击行为,并上传该点击行为至服务器120,服务器120则会记录该点击行为,形成该用户的点击日志。该用户的点击日志可以通过session(一种基于时间段的数据记录方式)的方式记录有用户所点击的页面内容。例如,用户的点击日志包括有多条session,每条session记录有用户在一段时间内所点击的一个或多个页面内容。
由此,服务器120可以得到大量用户的点击日志,根据大量用户的点击日志中所记录的对页面内容的点击行为和所点击的页面内容,可以生成大规模的异构图。
更具体地,服务器120可以针对每个用户分别生成用户节点,以及,针对点击日志中出现的页面内容以及可推荐给用户的页面内容,生成对应的内容节点,生成对应的内容节点。由此,得到了大量的用户节点和内容节点。
服务器120可以在点击日志中的各条session中查找出用户点击过的页面内容,在相应的用户节点和被点击过的页面内容对应的内容节点之间,生成一条连接线,作为记录点击关系的节点关系边。
服务器120还可以针对点击日志中的各条session,得到在一条session中用户点击过的多个页面内容,即,用户在一段时间内连续点击的多个页面内容,在该多个页面内容对应的内容节点之间,分别生成连接线,作为记录页面内容之间的关联关系的节点关系边。
服务器120还可以针对多个内容节点对应的页面内容之间的相似度,在内容节点之间生成连接线,作为记录页面内容之间的关联关系的节点关系边。例如,计算内容节点的节点特征之间的相似度,如果相似度高于预设的相似度阈值,则确定页面节点对应的页面内容相似,生成内容节点之间的节点关系边。
当然,实际应用中,本领域技术人员根据实际需要设定记录页面内容之间不同关联关系的节点关系边。例如,当页面内容属于相同的内容类型,则确定页面内容之间具有关联关系,生成内容节点之间的节点关系边。
在生成了记录用户的用户节点、记录页面内容的内容节点、记录用户与页面内容之间的点击关系的节点关系边、记录页面内容之间的关联关系的节点关系边之后,得到了由多个节点和节点之间的节点关系边所组成的网状图,由于各个节点的节点类型存在差异,而且形成各个节点之间的节点关系边所依据的连接关系类型存在差异,因此,所构造的各个节点及节点关系边通常称为异构图。
S204,在异构图的用户节点中选取待预测用户节点,以及,在异构图的内容节点中选取待预测内容节点。
具体实现中,服务器120生成异构图之后,可以在该异构图中的节点中选取待预测节点。更具体地,可以生成一个点击实例,该点击实例包括有至少一个用户和至少一个页面内容,根据该点击实例,从异构图中各个用户节点中选取相应的用户节点作为待预测用户节点,从异构图中各个内容节点中选取相应的内容节点作为待预测用户节点。该待预测用户节点和待预测用户节点,即为上述的待预测节点。
在实际应用中,在选取待预测用户节点时,可以将当前进行页面内容推荐的用户所对应的用户节点,作为待预测用户节点。在选取待预测内容节点时,可以通过召回方法在多个页面内容中筛选出若干个页面内容,根据筛选出的若干个页面内容选取待预测内容节点。
S206,根据异构图中各个所述节点之间的节点关系边,在异构图中查找待预测节点的邻居节点;待预测节点包括待预测用户节点和待预测内容节点。
其中,邻居节点可以为异构图中与待预测节点之间存在节点关系边的节点。
一种具体实现中,服务器120可以将在异构图中遍历与待预测节点通过节点关系边连接的另一个节点,作为邻居节点。
例如,待预测节点为待预测用户节点,待预测用户节点与另一个内容节点之间存在有记录点击关系的节点关系边,因此,将该内容节点作为待预测用户节点的邻居节点。
又例如,待预测节点为待预测内容节点,待预测内容节点与另一个内容节点之间存在记录关联关系的节点关系边,因此,将该内容节点作为待预测内容节点的邻居节点。
另一种具体实现中,服务器120可以将在异构图中遍历与待预测节点通过节点关系边连接的1-K阶的节点,作为邻居节点。其中,K用于反映邻居节点与待预测节点之间的距离。例如,在1-K阶的邻居节点中,与待预测节点存在节点关系边的节点,为待预测节点的第1阶邻居节点,与第1阶邻居节点存在节点关系边的节点,为待预测节点的第2阶邻居节点。
在遍历与待预测节点通过节点关系边连接的1-K阶的节点的示例中,假设待预测节点为待预测用户节点,查找与待预测用户节点存在有记录点击关系的节点关系边的内容节点,作为第1阶的邻居节点,然后,查找与作为第1阶的邻居节点的内容节点存在有记录关联关系的节点关系边的内容节点,作为第2阶的邻居节点,重复上述步骤,直至得到待预测节点的1-K阶的邻居节点。
S208,将邻居节点的节点特征汇聚至待预测节点,得到待预测节点的汇聚特征向量。
其中,节点特征可以为节点所代表的用户、内容所具有的特征。例如,用户节点的节点特征可以为用户的个人基础信息、感兴趣内容类型、历史浏览内容等的特征;内容节点的节点特征可以为页面内容的内容类型、内容标题、内容关键词等的特征。
具体实现中,服务器120可以将异构图输入至图卷积网络,图卷积网络可以获取邻居节点的多个节点特征,通过建立哈希表的方式,计算出对应于多个节点特征的多个语义向量,使得语义向量与节点特征一一对应。其中,图卷积网络可以为将多个节点的不同数据结构的特征进行汇聚的数学模型。
然后,通过图卷积网络可以计算多个语义向量的平均值,作为邻居节点的初始特征向量。通过相似的方式,可以计算得到待预测节点的初始特征向量。
最后,图卷积网络将邻居节点的初始特征向量与待预测节点的初始特征向量进行聚合,得到了待预测节点的汇聚特征向量。
在另一种具体实现中,针对待预测节点的1-K阶的邻居节点,计算出1-K阶的邻居节点的初始特征向量,最后将待预测节点的初始特征向量与1-K阶的邻居节点的初始特征向量进行聚合,得到了待预测节点的汇聚特征向量,从而将邻居节点的节点特征汇聚至待预测节点。
S210,根据待预测用户节点和待预测内容节点各自的汇聚特征向量,预测点击概率。
具体实现中,服务器120可以通过各种方式,针对待预测用户节点和待预测内容节点各自的汇聚特征向量,预测上述的点击实例中用户对页面内容的点击概率。
其中一种方式可以是通过深度神经网络根据待预测用户节点和待预测内容节点各自的汇聚特征向量预测点击概率。具体地,将待预测用户节点和待预测内容节点各自的汇聚特征向量输入至深度神经网络(DNN,Deep Neural Networks),由深度神经网络根据待预测用户节点和待预测内容节点各自的汇聚特征向量,预测待预测用户节点和待预测内容节点之间存在节点关系边的概率,如果待预测用户节点和待预测内容节点之间存在节点关系边的概率较高,表明用户点击页面内容的点击概率较高,反之则较低。因此,可以将深度神经网络输出的概率作为点击概率。
需要说明的是,深度神经网络可以为一种模仿人脑思考方式的数学模型,深度神经网络可以根据输入的特征预测类别及相应的概率。例如,将用户节点和内容节点的汇聚特征向量输入至深度神经网络,深度神经网络可以预测出属于“点击”类别的概率为70%,属于“不点击”类别的概率为30%。
实际应用中,本领域技术人员可以根据实际需要设计深度神经网络的具体网络结构,本申请实施例对深度神经网络的具体网络结构不作限制。
在上述的点击概率预测方法中,通过在根据用户与页面内容之间的点击关系和页面内容之间的关联关系所生成的异构图中选取待预测节点,根据异构图中各个节点之间的节点关系边,在异构图中查找待预测节点的邻居节点,从而利用了异构图中不同节点类型的节点和不同关系类型的节点关系边,挖掘出隐含的、与待预测的用户和页面内容相关的用户和页面内容,然后,通过将邻居节点的节点特征汇聚至待预测节点得到待预测节点的汇聚特征向量,从而将与待预测的用户、页面内容相关的特征,融合至待预测的用户、页面内容自身的特征,得到了可以全面、准确反映待预测的用户、页面内容的汇聚特征向量,相比起传统的仅仅采用用户自身的特征和所要推荐的页面内容的特征预测点击概率的方法,基于用户、页面内容的汇聚特征向量预测点击概率具有较高的准确性,可以更准确地反映出用户对页面内容的感兴趣的程度,基于所预测的点击概率向用户推荐的页面内容更符合用户兴趣。
参考图3,示出了一个实施例的一种异构图生成流程的流程示意图,在一个实施例中,在步骤S202之前,可以还包括以下步骤:
S302,获取点击日志;所述点击日志记录有所述用户对所述页面内容的点击行为;生成所述用户的节点,得到所述用户节点,以及,生成所述页面内容的节点,得到所述内容节点。
具体实现中,服务器120可以将用户点击页面内容的点击行为形成点击日志。例如,用户user_1的点击日志记录有[session1:Item_01、Item_02、Item_05],即用户user_1在一段时间内点击了页面内容Item_01、Item_02和Item_05;用户user_2的点击日志记录有[session2:Item_03、Item_02、Item_04],即用户user_2在一段时间内点击了页面内容Item_03、Item_02和Item_04。
服务器120可以生成用户对应的节点作为用户节点,生成页面内容对应的节点作为内容节点。
图4A是一个实施例的一种生成异构图节点的示意图。基于上述的例子,参考图4A,根据用户user_1的点击日志和用户user_2的点击日志,可以生成user_1和user_2等用户节点,还可以生成Item_01、Item_02、Item_03、Item_04、Item_05等内容节点。还可以针对待推荐的页面内容生成对应的Item_05该内容节点。
S304,根据所述用户对所述页面内容的点击行为,在所述用户节点与所述内容节点之间生成用户点击边,作为所述用户节点与所述内容节点之间的节点关系边。
具体实现中,服务器120可以针对用户所点击的页面内容,在相应的用户节点与相应的内容节点之间生成用户点击边。
图4B是一个实施例的一种生成异构图节点的用户点击边的示意图。参考图4B,根据用户user_1的点击日志,用户user_1点击了Item_01、Item_02、Item_05,因此,将user_1与Item_01、Item_02、Item_05之间分别生成连接线,作为用户点击边。根据用户user_2的点击日志,用户user_2点击了Item_03、Item_02、Item_04,因此,将user_1与Item_03、Item_02、Item_04之间分别生成连接线,作为用户点击边。为了便于区分,采用带箭头的虚线示意用户点击边。
S306,根据设定时间内所述用户分别对多个所述页面内容的连续的点击行为,在多个所述页面内容对应的内容节点之间,分别生成连续点击边,作为所述内容节点之间的节点关系边。
具体实现中,服务器120可以针对用户在设定时间内连续点击的多个页面内容,在相应的多个内容节点之间分别生成连续点击边。
图4C是一个实施例的一种生成异构图节点的连续点击边的示意图。参考图4C,根据用户user_1的点击日志,用户user_1在一个session中连续点击了Item_01、Item_02、Item_05,因此,在Item_01、Item_02、Item_05之间分别生成连接线,作为连续点击边。根据用户user_2的点击日志,用户user_2在一个session中连续点击了Item_03、Item_02、Item_04,因此,在Item_03、Item_02、Item_04之间分别生成连接线,作为连续点击边。为了便于区分,采用实线示意连续点击边。
S308,根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边,作为所述内容节点之间的节点关系边。
具体实现中,服务器120可以判断页面内容之间是否相似,若相似,则在相应的内容节点之间生成内容相似边。
图4D是一个实施例的一种生成异构图节点的内容相似边的示意图。参考图4D,假设Item_01与Item_05相似、Item_05与Item_06相似、Item_06与Item_04相似,因此,在Item_01与Item_05之间、Item_05与Item_06之间、Item_06与Item_04之间分别生成连接线,作为内容相似边。为了便于区分,采用虚实线示意内容相似边。
通过上述步骤,得到了用户节点、内容节点等的不同节点类型的节点,还得到了节点之间的用户点击边、连续点击边、内容相似边等的不同连接关系类型的节点关系边,从而,由多个节点和节点之间的节点关系边形成了如图4E所示的异构图。
需要说明的是,上述的步骤S304、S306和S308并非对各个步骤的执行顺序进行限制。本领域技术人员可以根据实际需要调整执行顺序,还可以同时执行上述的步骤S304、S306和S308。
上述的点击概率预测方法,通过生成节点之间的点击关系边、连续点击边、内容相似边该三种节点关系边,通过连接节点的方式提供了用户和页面内容之间、用户之间、页面内容之间隐含的关联关系,便于挖掘出与待预测的用户、页面内容相关的大量的用户和页面内容,提升点击概率预测的准确率。
在一个实施例中,所述根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边,作为所述内容节点之间的节点关系边,包括:
在所述异构图中选取第一内容节点和第二内容节点;获取所述第一内容节点和所述第二内容节点各自的节点特征;计算所述第一内容节点和所述第二内容节点各自的节点特征的相似度;当所述第一内容节点和所述第二内容节点各自的节点特征的相似度高于预设的相似度阈值,在所述第一内容节点和所述第二内容节点之间,生成所述内容相似边。
具体实现中,服务器120可以在异构图中选取至少两个内容节点,作为上述的第一内容节点和第二内容节点。然后,分别获取第一内容节点和第二内容节点所对应的页面内容的特征,作为节点特征。获取节点特征的方式可以有多种,其中一种获取节点特征的方式中,可以从页面内容所标记的标签得到节点特征,例如,页面内容可以标记有旅游、体育、娱乐等不同内容类型的标签,从所标记的标签中,即可以得到页面内容的内容类型,作为一种节点特征。另一种获取节点特征的方式中,可以从页面内容中提取出标题和具有代表性的关键词,作为页面内容的内容标题、内容关键词,作为另一种节点特征。
页面内容的内容类型、内容标题、内容关键词等特征的集合,通常也称为页面内容的内容画像。
在得到第一内容节点和第二内容节点所对应的节点特征后,可以通过建立哈希表的方式,将节点特征转换为语义向量,然后计算语义向量之间的相似度,当计算出的相似度高于预设的相似度阈值,表明页面内容之间相似,因此,在第一内容节点和第二内容节点之间生成内容相似边。
在一个实施例中,上述的步骤S206,可以具体包括:
在所述异构图中,查找与所述待预测节点存在所述节点关系边的节点,得到所述待预测节点的下一阶邻居节点;在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点,得到所述下一阶邻居节点的邻居节点;将所述下一阶邻居节点的邻居节点作为更新的下一阶邻居节点,并返回至所述在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点的步骤,直至得到1-K阶邻居节点;其中,K≥1;
将所述1-K阶邻居节点作为所述待预测节点的邻居节点。
具体实现中,可以首先确定上述的图卷积网络中所包含的卷积层的层数K,即该图卷积网络的网络深度。然后,从待预测节点出发,遍历异构图中与待预测节点存在节点关系边的节点,得到待预测节点的下一阶邻居节点。从待预测节点的下一阶邻居节点出发,遍历异构图中与下一阶邻居节点存在节点关系边的节点,得到下一阶邻居节点的邻居节点,将得到的下一阶邻居节点的邻居节点,作为更新的下一阶邻居节点,并重复遍历异构图中与下一阶邻居节点存在节点关系边的节点,直至得到了第K阶邻居节点。将得到的第1阶至第K阶的节点,作为待预测节点的1-K阶邻居节点。
图5A是一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之一。假设待预测节点为Item_04,在异构图中的各个节点中,查找到与Item_04存在节点关系边的至少包括item_06,因此,将item_06作为Item_04的第1阶邻居节点,由此,得到待预测节点Item_04的下一阶邻居节点item_06。
图5B是一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之二。针对下一阶邻居节点item_06,在异构图中的各个节点中,查找到与Item_06存在节点关系边的至少包括item_05,因此,将item_05作为Item_04的第2阶邻居节点,由此,得到下一阶邻居节点item_06的邻居节点。将item_06作为更新的下一阶节点继续查找其邻居节点,直至得到第K阶的邻居节点。
图5C是一个实施例的一种在异构图中查找1-K阶邻居节点的示意图之三。参考图5C,假设K为4,通过上述的方式,可以得到待预测节点Item_04的1-4阶的邻居节点,分别为item_06、item_05、item_01和user_1。
上述以待预测节点为内容节点为例进行了说明,待预测节点为用户节点时,查找邻居节点的方法相似,在此不再赘述。
上述的点击概率预测方法,通过以节点之间的节点关系边为依据查找待预测节点的1-K阶邻居节点,从而挖掘出与待预测的用户、页面内容相关的大量的用户和页面内容,提升点击概率预测的准确率。
在一个实施例中,上述的步骤S208,可以具体包括:
通过所述图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量;其中,1≤k≤K;通过所述图卷积网络的拼接层,将所述第k层卷积层输出的特征向量与根据第k-1阶邻居节点的汇聚特征向量进行拼接,并对拼接后的特征向量进行加权激活,得到所述第k阶邻居节点的汇聚特征向量;返回至所述通过所述图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量的步骤,直至得到所述待预测节点的汇聚特征向量。
具体实现中,图卷积网络的网络结构中,可以包含有K层卷积层,每一层卷积层通过聚合函数进行聚合处理。更具体地,可以首先对第k阶邻居节点的多个节点特征进行哈希计算,得到对应的多个潜在语义向量,对多个潜在语义向量进行聚合,得到第k阶邻居节点的初始特征向量。
图卷积网络的第k层卷积层可以对多个第k阶邻居节点的初始特征向量进行聚合,得到第k层卷积层输出的特征向量。然后,通过图卷积网络的拼接层,将第k层卷积层输出的特征向量,与根据k-1层卷积层所输出的第k-1阶邻居节点的初始特征向量进行拼接。采用第k层卷积层对应的权重参数对拼接得到的特征向量进行加权求和,将加权求和后的特征向量,通过激活函数进行激活,得到第k阶邻居节点的汇聚特征向量。
由此,通过k-1层卷积层与第k层卷积层所输出的特征向量进行拼接,将第k-1阶邻居节点的初始特征向量传递至第k阶邻居节点。通过相似的方式,将各阶邻居节点的初始特征向量在图卷积网络中的各层卷积层传递至待预测节点,得到待预测节点的汇聚特征向量。
在实际应用中,可以通过下列公式表示图卷积网络的计算过程:
Figure BDA0002192598630000171
Figure BDA0002192598630000172
Figure BDA0002192598630000173
Figure BDA0002192598630000174
其中,k∈{1,2…,K},N(v)为用于选取节点v的邻居节点u的函数,AGGREGATEk为第k层卷积层的聚合函数,CONCAT为用于拼接向量的函数,
Figure BDA0002192598630000175
为节点v在第k层卷积层的对邻居节点的特征向量聚合后的结果,Wk为权重参数矩阵,σ为激活函数,
Figure BDA0002192598630000176
为节点v在第k层卷积层对邻居节点u的汇聚特征向量进行拼接后的结果,zv为节点v的汇聚特征向量。
上述的点击概率预测方法,通过图卷积网络将1-k阶邻居节点的节点特征汇聚至待预测节点,使得待预测节点上的汇聚特征向量隐含有相关用户、页面内容的特征。
在一个实施例中,上述的方法可以还包括:
确定所述节点的多个节点特征;所述用户节点的节点特征包括个人基础信息、感兴趣内容类型、历史浏览内容中的至少一种;所述内容节点的节点特征包括内容类型、内容标题、内容关键词中的至少一种;分别对多个所述节点特征进行哈希计算,得到多个潜在语义向量;对多个所述潜在语义向量进行聚合,得到所述初始特征向量。
具体实现中,服务器120可以将构成用户的用户画像的个人基础信息、感兴趣内容类型、历史浏览内容等特征,作为用户节点的节点特征。服务器120可以将构成页面内容的内容画像的内容类型、内容标题、内容关键词等特征,作为内容节点的节点特征。由此,得到节点的多个节点特征。
服务器120可以对多个节点特征分别进行哈希计算,得到与节点特征对应的潜在语义向量,由此得到多个潜在语义向量。通过将多个潜在语义向量求平均、叠加等的手段,聚合多个潜在语义向量,得到了节点的初始特征向量。
用户节点的节点特征可以为个人基础信息、感兴趣内容类型、历史浏览内容等,而内容节点的节点特征可以为内容类型、内容标题、内容关键词等。用户节点与内容节点的节点特征在数据结构上存在差异,因此异构图中的各个节点的节点特征之间属于非结构化数据。通过对非结构化数据转换为结构化的初始特征向量,为后续的节点特征汇聚的处理提供了实现基础。
在一个实施例中,上述的步骤S210,可以具体包括:
将所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,输入至点击概率预估模型;所述点击概率预估模型用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量之间的关联关系输出所述点击概率。
其中,点击概率预估模型可以为基于深度神经网络训练得到的用于进行点击概率预测的模型。
具体实现中,服务器120可以将待预测用户节点的汇聚特征向量和待预测内容节点的汇聚特征向量,输入至点击概率预估模型。点击概率预估模型可以根据待预测用户节点的汇聚特征向量和待预测内容节点的汇聚特征向量之间的关联关系,预测待预测用户节点与待预测内容节点之间存在节点关系边的概率,该概率即为用户点击页面内容的点击概率。
在一个实施例中,上述的方法可以还包括:
根据所述点击概率预估模型输出的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户;获取所述目标用户对所述推荐页面内容的实际点击结果,并根据所述实际点击结果计算实际点击概率;通过交叉熵损失函数计算所述实际点击概率与所述点击概率预估模型输出的所述点击概率之间的损失值,并根据所述损失值对所述点击概率预估模型进行机器训练。
其中,实际点击结果可以为用户对所推荐的页面内容是否点击的结果。例如,实际点击结果可以为“点击”或“未点击”。
一种具体实现中,服务器120在得到待预测用户节点针对于一个待预测内容节点的点击概率之后,当点击概率高于预设的概率阈值,将待预测内容节点对应的页面内容,推荐给待预测用户节点对应的用户,即,将页面内容推送至终端110,终端110则可以向用户展示相应的页面内容。
另一种具体实现中,得到多个待预测内容节点对应的点击概率,然后按照点击概率对多个待预测内容节点进行降序排序,将排序靠前的若干个待预测内容节点对应的页面内容,推荐给待预测用户节点对应的用户。
服务器120可以获取到用户对推荐的页面内容的实际点击结果。例如,用户未点击推荐的页面内容,实际点击结果即为“未点击”,代表用户对推荐的页面内容不感兴趣。因此,可以根据实际点击结果,可以通过交叉熵损失函数对点击概率预估模型进行机器训练。
更具体地,如果实际点击结果为“未点击”,可以计算得到实际点击概率yi=1-点击概率pi,通过下列的交叉熵函数可以计算得到本次点击概率预测的损失值logloss:
Figure BDA0002192598630000191
然后,服务器120可以根据损失值logloss,通过反向传导算法修正点击概率预估模型中的权重值、偏置值等的参数,从而对点击概率预估模型进行机器训练。
上述的点击概率预测方法,通过获取用户对推荐的页面内容的实际点击结果,并根据实际点击结果,通过交叉熵损失函数计算出反映预测的点击概率与实际的点击概率之间的偏差的损失值,并根据损失值对点击概率预估模型进行机器训练,从而提升点击概率预估模型进行点击概率的预测准确性。
在一个实施例中,所述待预测内容节点具有N个,所述根据预测的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户,包括:
按照所述点击概率对N个所述待预测内容节点进行降序排序;选取排序前M个所述待预测内容节点;其中,M<N;将排序前M个的所述待预测内容节点对应的页面内容,作为所述推荐页面内容,推荐给所述目标用户。
具体实现中,服务器120可以通过召回方法在可用于推荐给用户的多个页面内容中,筛选出若干个页面内容,根据筛选出的N个页面内容,选取N个页面内容对应的内容节点,得到N个待预测内容节点。针对N个待预测内容节点,分别得到了N个对应的点击概率。按照点击概率将N个待预测内容节点进行降序排序,将排序前M个待预测内容节点所对应的页面内容,作为推荐页面内容,推送至目标用户的终端110,终端110可以在页面内容的推荐界面上,显示一个或多个页面内容,供用户点击阅读。
图6是一个实施例的一种页面内容的推荐界面的示意图。参考图6,在一个页面内容的推荐界面中,可以包括有文章、视频、图片等的页面内容。用户可以在推荐界面上点击某个页面内容,以浏览该页面内容的详细内容。
上述的点击概率预测方法中,通过将N个待预测内容节点按照对应的点击概率进行排序,将点击概率较高的M个待预测内容节点对应的页面内容推荐给用户,从而可以将用户感兴趣的页面内容推荐给用户。
如图7所示,提供了一个实施例的一种页面内容推荐方法的流程示意图,上述的页面内容推荐方法,包括以下步骤:
S702,获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
S704,在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
S706,根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
S708,将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
S710,根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
S712,根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
由于上述的各个步骤在前述实施例中已有详细说明,在此不再赘述。
在上述的页面内容推荐方法中,通过在根据用户与页面内容之间的点击关系和页面内容之间的关联关系所生成的异构图中选取待预测节点,根据异构图中各个节点之间的节点关系边,在异构图中查找待预测节点的邻居节点,从而利用了异构图中不同节点类型的节点和不同关系类型的节点关系边,挖掘出隐含的、与待预测的用户和页面内容相关的用户和页面内容,然后,通过将邻居节点的节点特征汇聚至待预测节点得到待预测节点的汇聚特征向量,从而将与待预测的用户、页面内容相关的特征,融合至待预测的用户、页面内容自身的特征,得到了可以全面、准确反映待预测的用户、页面内容的汇聚特征向量,相比起传统的仅仅采用用户自身的特征和所要推荐的页面内容的特征预测点击概率的方法,基于用户、页面内容的汇聚特征向量预测点击概率具有较高的准确性,可以更准确地反映出用户对页面内容的感兴趣的程度,基于所预测的点击概率向用户推荐的页面内容更符合用户兴趣。
图8为一个实施例中一种具体的页面内容推荐方法的流程示意图。应该理解的是,虽然图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。如图8所示,一种具体的页面内容推荐流程可以包括以下步骤:
S802,获取点击日志;
S804,根据点击日志中所记录的用户及对页面内容的点击行为,生成用户节点和内容节点;
S806,根据用户所点击的页面内容,在用户节点与内容节点之间生成用户点击边;
S808,根据用户在单个session内连续点击的多个页面内容,在多个内容节点之间分别生成连续点击边;
S810,根据页面内容之间的相似度,在内容节点之间生成内容相似边;
S812,将用户的个人基础信息、感兴趣内容类型、历史浏览内容作为用户节点的节点特征,将页面内容的内容类型、内容标题、内容关键词作为内容节点的节点特征;
S814,对多个节点特征进行哈希计算,建立哈希表,生成与各个节点特征对应的潜在语义向量,对多个潜在语义向量进行平均,得到节点的初始特征向量;
S816,选取待预测的用户节点user和内容节点item作为待预测节点v,并在异构图中遍历与待预测节点v存在节点关系边的节点,直至获取到待预测节点的1-K阶邻居节点μk,k∈K;
S818,通过图卷积网络的K层卷积层,将邻居节点μk的节点特征汇聚至待预测节点v,得到待预测节点v的汇聚特征向量Zv;
S820,将待预测用户节点user和待预测内容节点item各自的汇聚特征向量Zv,输入至点击概率预估模型,得到输出的点击概率pi
S822,根据点击概率预估模型输出的点击概率pi,将推荐页面内容推荐给目标用户;
S824,获取目标用户对推荐页面内容的实际点击结果,并根据实际点击结果计算实际点击概率yi,通过交叉熵损失函数计算损失值logloss,并根据损失值logloss对点击概率预估模型进行机器训练。
如图9所示,在一个实施例中,提供了一种点击概率预测装置900,包括:
异构图获取模块902,用于获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系
节点选取模块904,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块906,用于根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
特征汇聚模块908,用于将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
预测模块910,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
如图10所示,在一个实施例中,提供了一种页面内容推荐装置1000,包括:
异构图获取模块1002,用于获取异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括内容节点和用户节点;所述内容节点用于记录页面内容;所述用户节点用于记录点击所述页面内容的用户;所述用户节点与所述内容节点之间的节点关系边用于记录所述用户与所述用户点击的页面内容之间的点击关系;所述内容节点之间的节点关系边用于记录所述页面内容之间的关联关系;
节点选取模块1004,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块1006,用于根据所述异构图中各个所述节点之间的节点关系边,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;
特征汇聚模块1008,用于将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
预测模块1010,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
推荐模块1012,用于根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
在一个实施例中,还包括:
日志获取模块,用于获取点击日志;所述点击日志记录有所述用户对所述页面内容的点击行为;
节点生成模块,用于生成所述用户的节点,得到所述用户节点,以及,生成所述页面内容的节点,得到所述内容节点;
第一关系边生成模块,用于根据所述用户对所述页面内容的点击行为,在所述用户节点与所述内容节点之间生成用户点击边,作为所述用户节点与所述内容节点之间的节点关系边;
第二关系边生成模块,用于根据设定时间内所述用户分别对多个所述页面内容的连续的点击行为,在多个所述页面内容对应的内容节点之间,分别生成连续点击边,作为所述内容节点之间的节点关系边;
第三关系边生成模块,用于根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边,作为所述内容节点之间的节点关系边。
在一个实施例中,所述第三关系边生成模块,具体用于:
在所述异构图中选取第一内容节点和第二内容节点;获取所述第一内容节点和所述第二内容节点各自的节点特征;计算所述第一内容节点和所述第二内容节点各自的节点特征的相似度;当所述第一内容节点和所述第二内容节点各自的节点特征的相似度高于预设的相似度阈值,在所述第一内容节点和所述第二内容节点之间,生成所述内容相似边。
在一个实施例中,所述邻居查找模块906和所述邻居查找模块1006,具体用于:
在所述异构图中,查找与所述待预测节点存在所述节点关系边的节点,得到所述待预测节点的下一阶邻居节点;在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点,得到所述下一阶邻居节点的邻居节点;将所述下一阶邻居节点的邻居节点作为更新的下一阶邻居节点,并返回至所述在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点的步骤,直至得到1-K阶邻居节点;其中,K≥1;将所述1-K阶邻居节点作为所述待预测节点的邻居节点。
在一个实施例中,所述邻居查找模块906和所述邻居查找模块1006,还具体用于:
通过图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量;所述图卷积网络包括K层卷积层;1≤k≤K;
通过所述图卷积网络的拼接层,将所述第k层卷积层输出的特征向量与根据第k-1阶邻居节点的汇聚特征向量进行拼接,并对拼接后的特征向量进行加权激活,得到所述第k阶邻居节点的汇聚特征向量;
返回至所述通过所述图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量的步骤,直至得到所述待预测节点的汇聚特征向量。
在一个实施例中,还包括:
初始特征向量计算模块,用于确定所述节点的多个节点特征;所述用户节点的节点特征包括个人基础信息、感兴趣内容类型、历史浏览内容中的至少一种;所述内容节点的节点特征包括内容类型、内容标题、内容关键词中的至少一种;分别对多个所述节点特征进行哈希计算,得到多个潜在语义向量;对多个所述潜在语义向量进行聚合,得到所述初始特征向量。
在一个实施例中,所述预测模块910和所述预测模块1010,具体用于:
将所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,输入至点击概率预估模型;所述点击概率预估模型用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量之间的关联关系输出所述点击概率;
所述装置还包括:
推荐模块,根据所述点击概率预估模型输出的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户;
训练模块,用于获取所述目标用户对所述推荐页面内容的实际点击结果,并根据所述实际点击结果计算实际点击概率;通过交叉熵损失函数计算所述实际点击概率与所述点击概率预估模型输出的所述点击概率之间的损失值,并根据所述损失值对所述点击概率预估模型进行机器训练。
在一个实施例中,所述待预测内容节点具有N个,所述推荐模块1012,具体用于:
按照所述点击概率对N个所述待预测内容节点进行降序排序;选取排序前M个所述待预测内容节点;其中,M<N;将排序前M个的所述待预测内容节点对应的页面内容,作为所述推荐页面内容,推荐给所述目标用户。
在一个实施例中,还包括:
区块链确定模块,用于确定与所述异构图对应的目标区块链;
区块生成模块,用于基于所述异构图以及所述目标区块链中第一区块的区块头特征值,在所述目标区块链上生成第二区块,所述第一区块为所述第二区块的上一个区块,所述第二区块用于记录所述异构图。
在上述的点击概率预测装置和页面内容推荐装置,通过在根据用户与页面内容之间的点击关系和页面内容之间的关联关系所生成的异构图中选取待预测节点,根据异构图中各个节点之间的节点关系边,在异构图中查找待预测节点的邻居节点,从而利用了异构图中不同节点类型的节点和不同关系类型的节点关系边,挖掘出隐含的、与待预测的用户和页面内容相关的用户和页面内容,然后,通过将邻居节点的节点特征汇聚至待预测节点得到待预测节点的汇聚特征向量,从而将与待预测的用户、页面内容相关的特征,融合至待预测的用户、页面内容自身的特征,得到了可以全面、准确反映待预测的用户、页面内容的汇聚特征向量,相比起传统的仅仅采用用户自身的特征和所要推荐的页面内容的特征预测点击概率的方法,基于用户、页面内容的汇聚特征向量预测点击概率具有较高的准确性,可以更准确地反映出用户对页面内容的感兴趣的程度,基于所预测的点击概率向用户推荐的页面内容更符合用户兴趣。
在一个实施例中,上述的点击概率预测方法,可以还包括:
确定与所述异构图对应的目标区块链;基于所述异构图以及所述目标区块链中第一区块的区块头特征值,在所述目标区块链上生成第二区块,所述第一区块为所述第二区块的上一个区块,所述第二区块用于记录所述异构图。
具体实现中,还可以将异构图通过数据共享系统进行区块链存证。参见图11A所示的数据共享系统1100,数据共享系统1100是指用于进行节点与节点之间数据共享的系统,该数据共享系统中可以包括多个节点1101,多个节点1101可以是指数据共享系统中各个客户端。上述的服务器120可以作为该数据共享系统1100中的其中一个或多个节点1101。
每个节点1101在进行正常工作可以接收到异构图该输入信息,并基于接收到的输入信息维护该数据共享系统内的共享数据。为了保证数据共享系统内的信息互通,数据共享系统中的每个节点1101之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。例如,当数据共享系统中的任意节点接收到输入信息时,数据共享系统中的其他节点便根据共识算法获取该输入信息,将该输入信息作为共享数据中的数据进行存储,使得数据共享系统中全部节点上存储的数据均一致。
对于数据共享系统1100中的每个节点1101,均具有与其对应的节点标识,而且数据共享系统1100中的每个节点1101均可以存储有数据共享系统1100中其他节点的节点标识,以便后续根据其他节点的节点标识,将生成的区块广播至数据共享系统中的其他节点。每个节点1101中可维护一个如下表所示的节点标识列表,将节点名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。
Figure BDA0002192598630000271
Figure BDA0002192598630000281
表1
数据共享系统1100中的每个节点均存储一条相同的区块链。区块链由多个区块组成,参见图11B,区块链由多个区块组成,创始块中包括区块头和区块主体,区块头中存储有输入信息特征值、版本号、时间戳和难度值,区块主体中存储有输入信息;创始块的下一区块以创始块为父区块,下一区块中同样包括区块头和区块主体,区块头中存储有当前区块的输入信息特征值、父区块的区块头特征值、版本号、时间戳和难度值,并以此类推,使得区块链中每个区块中存储的区块数据均与父区块中存储的区块数据存在关联,保证了区块中输入信息的安全性。
在生成区块链中的各个区块时,参见图11C,区块链所在的节点在接收到输入信息时,对输入信息进行校验,完成校验后,将输入信息存储至内存池中,并更新其用于记录输入信息的哈希树;之后,将更新时间戳更新为接收到输入信息的时间,并尝试不同的随机数,多次进行特征值计算,使得计算得到的特征值可以满足下述公式:
SHA256(SHA256(version+prev_hash+merkle_root+ntime+nbits+x))<TARGET
其中,SHA256为计算特征值所用的特征值算法;version(版本号)为区块链中相关区块协议的版本信息;prev_hash为当前区块的父区块的区块头特征值;merkle_root为输入信息的特征值;ntime为更新时间戳的更新时间;nbits为当前难度,在一段时间内为定值,并在超出固定时间段后再次进行确定;x为随机数;TARGET为特征值阈值,该特征值阈值可以根据nbits确定得到。
这样,当计算得到满足上述公式的随机数时,便可将信息对应存储,生成区块头和区块主体,得到当前区块。随后,区块链所在节点根据数据共享系统中其他节点的节点标识,将新生成的区块分别发送给其所在的数据共享系统中的其他节点,由其他节点对新生成的区块进行校验,并在完成校验后将新生成的区块添加至其存储的区块链中。
图12示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图12所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现点击概率预测方法或页面内容推荐方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行点击概率预测方法或页面内容推荐方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的点击概率预测装置、页面内容推荐装置可以实现为一种计算机程序的形式,计算机程序可在如图12所示的计算机设备上运行。计算机设备的存储器中可存储组成该点击概率预测装置、页面内容推荐装置的各个程序模块,比如,图9所示的节点选取模块904、图10所示的节点选取模块1004。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的点击概率预测方法、页面内容推荐方法中的各个步骤。
例如,图12所示的计算机设备可以通过如图9所示的点击概率预测装置900中的节点选取模块904执行在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点的步骤。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述点击概率预测方法、页面内容推荐方法的步骤。此处点击概率预测方法、页面内容推荐方法的步骤可以是上述各个实施例的点击概率预测方法、页面内容推荐方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述点击概率预测方法、页面内容推荐方法的步骤。此处点击概率预测方法、页面内容推荐方法的步骤可以是上述各个实施例的点击概率预测方法、页面内容推荐方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (19)

1.一种点击概率预测方法,包括:
获取记录有用户对页面内容的点击行为的点击日志;所述点击日志采用基于时间段的数据记录方式记录所述点击行为;
根据所述点击日志,生成用户节点和内容节点,以及根据所述点击行为,在所述用户节点与所述内容节点之间生成用户点击边,根据设定时间内所述用户分别对多个页面内容的连续的点击行为,在所述多个页面内容对应的内容节点之间分别生成连接线作为连续点击边,根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边;其中,所述用户在所述设定时间内连续点击的多个页面内容包括第一页面内容、第二页面内容和第三页面内容;所述连续点击边包括所述第一页面内容与第二页面内容对应的内容节点之间的连续点击边、所述第二页面内容与第三页面内容对应的内容节点之间的连续点击边和所述第三页面内容与第一页面内容对应的内容节点之间的连续点击边;
根据所述用户节点和内容节点以及所述用户点击边、连续点击边和内容相似边生成异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括所述内容节点和用户节点;所述节点关系边包括所述用户点击边、连续点击边和内容相似边;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边以及图卷积网络中所包含的卷积层的层数K,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;所述待预测节点的邻居节点包括1-K阶邻居节点;
通过所述图卷积网络将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
2.根据权利要求1所述的方法,其特征在于,所述根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边,包括:
在所述异构图中选取第一内容节点和第二内容节点;
获取所述第一内容节点和所述第二内容节点各自的节点特征;
计算所述第一内容节点和所述第二内容节点各自的节点特征的相似度;
当所述第一内容节点和所述第二内容节点各自的节点特征的相似度高于预设的相似度阈值,在所述第一内容节点和所述第二内容节点之间,生成所述内容相似边。
3.根据权利要求1所述的方法,其特征在于,所述根据所述异构图中各个所述节点之间的节点关系边以及图卷积网络中所包含的卷积层的层数K,在所述异构图中查找待预测节点的邻居节点,包括:
在所述异构图中,查找与所述待预测节点存在所述节点关系边的节点,得到所述待预测节点的下一阶邻居节点;
在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点,得到所述下一阶邻居节点的邻居节点;
将所述下一阶邻居节点的邻居节点作为更新的下一阶邻居节点,并返回至所述在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点的步骤,直至得到1-K阶邻居节点;其中,K≥1;
将所述1-K阶邻居节点作为所述待预测节点的邻居节点。
4.根据权利要求3所述的方法,其特征在于,所述通过所述图卷积网络将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量,包括:
通过图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量;所述图卷积网络包括K层卷积层;1≤k≤K;
通过所述图卷积网络的拼接层,将所述第k层卷积层输出的特征向量与根据第k-1阶邻居节点的汇聚特征向量进行拼接,并对拼接后的特征向量进行加权激活,得到所述第k阶邻居节点的汇聚特征向量;
返回至所述通过所述图卷积网络的第k层卷积层,对根据第k阶邻居节点的节点特征得到的初始特征向量进行聚合,得到所述第k层卷积层输出的特征向量的步骤,直至得到所述待预测节点的汇聚特征向量。
5.根据权利要求4所述的方法,其特征在于,还包括:
确定所述节点的多个节点特征;所述用户节点的节点特征包括个人基础信息、感兴趣内容类型、历史浏览内容中的至少一种;所述内容节点的节点特征包括内容类型、内容标题、内容关键词中的至少一种;
分别对多个所述节点特征进行哈希计算,得到多个潜在语义向量;
对多个所述潜在语义向量进行聚合,得到所述初始特征向量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率,包括:
将所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,输入至点击概率预估模型;所述点击概率预估模型用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量之间的关联关系输出所述点击概率;
所述方法还包括:
根据所述点击概率预估模型输出的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
7.根据权利要求6所述的方法,其特征在于,还包括:
获取所述目标用户对所述推荐页面内容的实际点击结果,并根据所述实际点击结果计算实际点击概率;
通过交叉熵损失函数计算所述实际点击概率与所述点击概率预估模型输出的所述点击概率之间的损失值;
根据所述损失值对所述点击概率预估模型进行机器训练。
8.根据权利要求6所述的方法,其特征在于,所述待预测内容节点具有N个,所述根据预测的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户,包括:
按照所述点击概率对N个所述待预测内容节点进行降序排序;
选取排序前M个所述待预测内容节点;其中,M<N;
将排序前M个的所述待预测内容节点对应的页面内容,作为所述推荐页面内容,推荐给所述目标用户。
9.一种页面内容推荐方法,包括:
获取记录有用户对页面内容的点击行为的点击日志;所述点击日志采用基于时间段的数据记录方式记录所述点击行为;
根据所述点击日志,生成用户节点和内容节点,以及根据所述点击行为,在所述用户节点与所述内容节点之间生成用户点击边,根据设定时间内所述用户分别对多个页面内容的连续的点击行为,在所述多个页面内容对应的内容节点之间分别生成连接线作为连续点击边,根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边;其中,所述用户在所述设定时间内连续点击的多个页面内容包括第一页面内容、第二页面内容和第三页面内容;所述连续点击边包括所述第一页面内容与第二页面内容对应的内容节点之间的连续点击边、所述第二页面内容与第三页面内容对应的内容节点之间的连续点击边和所述第三页面内容与第一页面内容对应的内容节点之间的连续点击边;
根据所述用户节点和内容节点以及所述用户点击边、连续点击边和内容相似边生成异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括所述内容节点和用户节点;所述节点关系边包括所述用户点击边、连续点击边和内容相似边;
在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
根据所述异构图中各个所述节点之间的节点关系边以及图卷积网络中所包含的卷积层的层数K,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;所述待预测节点的邻居节点包括1-K阶邻居节点;
通过所述图卷积网络将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
10.一种点击概率预测装置,包括:
日志获取模块,用于获取记录有用户对页面内容的点击行为的点击日志;所述点击日志采用基于时间段的数据记录方式记录所述点击行为;
节点生成模块,用于根据所述点击日志,生成用户节点和内容节点;
第一关系边生成模块,用于根据所述点击行为,在所述用户节点与所述内容节点之间生成用户点击边;
第二关系边生成模块,用于根据设定时间内所述用户分别对多个页面内容的连续的点击行为,在所述多个页面内容对应的内容节点之间分别生成连接线作为连续点击边;其中,所述用户在所述设定时间内连续点击的多个页面内容包括第一页面内容、第二页面内容和第三页面内容;所述连续点击边包括所述第一页面内容与第二页面内容对应的内容节点之间的连续点击边、所述第二页面内容与第三页面内容对应的内容节点之间的连续点击边和所述第三页面内容与第一页面内容对应的内容节点之间的连续点击边;
第三关系边生成模块,用于根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边;
异构图获取模块,用于根据所述用户节点和内容节点以及所述用户点击边、连续点击边和内容相似边生成异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括所述内容节点和用户节点;所述节点关系边包括所述用户点击边、连续点击边和内容相似边;
节点选取模块,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块,用于根据所述异构图中各个所述节点之间的节点关系边以及图卷积网络中所包含的卷积层的层数K,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;所述待预测节点的邻居节点包括1-K阶邻居节点;
特征汇聚模块,用于通过所述图卷积网络将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;
预测模块,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率。
11.根据权利要求10所述的装置,其特征在于,所述第三关系边生成模块,具体用于:在所述异构图中选取第一内容节点和第二内容节点;获取所述第一内容节点和所述第二内容节点各自的节点特征;计算所述第一内容节点和所述第二内容节点各自的节点特征的相似度;当所述第一内容节点和所述第二内容节点各自的节点特征的相似度高于预设的相似度阈值,在所述第一内容节点和所述第二内容节点之间,生成所述内容相似边。
12.根据权利要求10所述的装置,其特征在于,所述邻居查找模块,具体用于:在所述异构图中,查找与所述待预测节点存在所述节点关系边的节点,得到所述待预测节点的下一阶邻居节点;在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点,得到所述下一阶邻居节点的邻居节点;将所述下一阶邻居节点的邻居节点作为更新的下一阶邻居节点,并返回至所述在所述异构图中查找与所述下一阶邻居节点存在所述节点关系边的节点的步骤,直至得到1-K阶邻居节点;其中,K≥1;将所述1-K阶邻居节点作为所述待预测节点的邻居节点。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:初始特征向量计算模块,用于确定所述节点的多个节点特征;所述用户节点的节点特征包括个人基础信息、感兴趣内容类型、历史浏览内容中的至少一种;所述内容节点的节点特征包括内容类型、内容标题、内容关键词中的至少一种;分别对多个所述节点特征进行哈希计算,得到多个潜在语义向量;对多个所述潜在语义向量进行聚合,得到所述初始特征向量。
14.根据权利要求10所述的装置,其特征在于,
所述预测模块,具体用于:将所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,输入至点击概率预估模型;所述点击概率预估模型用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量之间的关联关系输出所述点击概率;
所述装置还包括:推荐模块,用于根据所述点击概率预估模型输出的所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:训练模块,用于获取所述目标用户对所述推荐页面内容的实际点击结果,并根据所述实际点击结果计算实际点击概率;通过交叉熵损失函数计算所述实际点击概率与所述点击概率预估模型输出的所述点击概率之间的损失值,并根据所述损失值对所述点击概率预估模型进行机器训练。
16.根据权利要求14所述的装置,其特征在于,所述待预测内容节点具有N个,所述推荐模块,具体用于:按照所述点击概率对N个所述待预测内容节点进行降序排序;选取排序前M个所述待预测内容节点;其中,M<N;将排序前M个的所述待预测内容节点对应的页面内容,作为所述推荐页面内容,推荐给所述目标用户。
17.一种页面内容推荐装置,包括:
日志获取模块,用于获取记录有用户对页面内容的点击行为的点击日志;所述点击日志采用基于时间段的数据记录方式记录所述点击行为;
节点生成模块,用于根据所述点击日志,生成用户节点和内容节点;
第一关系边生成模块,用于根据所述点击行为,在所述用户节点与所述内容节点之间生成用户点击边;
第二关系边生成模块,用于根据设定时间内所述用户分别对多个页面内容的连续的点击行为,在所述多个页面内容对应的内容节点之间分别生成连接线作为连续点击边;其中,所述用户在所述设定时间内连续点击的多个页面内容包括第一页面内容、第二页面内容和第三页面内容;所述连续点击边包括所述第一页面内容与第二页面内容对应的内容节点之间的连续点击边、所述第二页面内容与第三页面内容对应的内容节点之间的连续点击边和所述第三页面内容与第一页面内容对应的内容节点之间的连续点击边;
第三关系边生成模块,用于根据所述页面内容之间的相似度,在所述内容节点之间生成内容相似边;
异构图获取模块,用于根据所述用户节点和内容节点以及所述用户点击边、连续点击边和内容相似边生成异构图;所述异构图由节点以及连接所述节点的节点关系边构成;所述节点包括所述内容节点和用户节点;所述节点关系边包括所述用户点击边、连续点击边和内容相似边;
节点选取模块,用于在所述异构图的用户节点中选取待预测用户节点,以及,在所述异构图的内容节点中选取待预测内容节点;
邻居查找模块,用于根据所述异构图中各个所述节点之间的节点关系边以及图卷积网络中所包含的卷积层的层数K,在所述异构图中查找待预测节点的邻居节点;所述待预测节点包括所述待预测用户节点和所述待预测内容节点;所述待预测节点的邻居节点包括1-K阶邻居节点;
特征汇聚模块,用于通过所述图卷积网络将所述邻居节点的节点特征汇聚至所述待预测节点,得到所述待预测节点的汇聚特征向量;预测模块,用于根据所述待预测用户节点和所述待预测内容节点各自的汇聚特征向量,预测点击概率;
推荐模块,用于根据所述点击概率,将所述待预测内容节点对应的推荐页面内容,推荐给所述待预测用户节点对应的目标用户。
18.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至9中任一项所述方法的步骤。
19.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至9中任一项所述方法的步骤。
CN201910837319.2A 2019-09-05 2019-09-05 点击概率预测、页面内容推荐方法和装置 Active CN110569437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910837319.2A CN110569437B (zh) 2019-09-05 2019-09-05 点击概率预测、页面内容推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910837319.2A CN110569437B (zh) 2019-09-05 2019-09-05 点击概率预测、页面内容推荐方法和装置

Publications (2)

Publication Number Publication Date
CN110569437A CN110569437A (zh) 2019-12-13
CN110569437B true CN110569437B (zh) 2022-03-04

Family

ID=68778030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910837319.2A Active CN110569437B (zh) 2019-09-05 2019-09-05 点击概率预测、页面内容推荐方法和装置

Country Status (1)

Country Link
CN (1) CN110569437B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10936950B1 (en) 2019-08-15 2021-03-02 Advanced New Technologies Co., Ltd. Processing sequential interaction data
CN110555469B (zh) * 2019-08-15 2020-07-24 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110838060A (zh) * 2019-10-30 2020-02-25 成都数融科技有限公司 金融风险度量方法、装置及电子设备
CN111178944B (zh) * 2019-12-16 2023-05-05 贝壳找房(北京)科技有限公司 房源转化率的预测方法和装置、存储介质、设备
CN111177479B (zh) * 2019-12-23 2023-08-18 北京百度网讯科技有限公司 获取关系网络图中节点的特征向量的方法以及装置
CN113127669B (zh) * 2020-01-15 2023-10-10 百度在线网络技术(北京)有限公司 广告配图方法、装置、设备和存储介质
CN111368050B (zh) * 2020-02-27 2023-07-21 腾讯科技(深圳)有限公司 文档页面的推送方法、装置
CN111475750B (zh) * 2020-03-04 2021-05-28 百度在线网络技术(北京)有限公司 页面预加载控制方法、装置、系统、设备和存储介质
CN111400560A (zh) * 2020-03-10 2020-07-10 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和系统
CN111414408B (zh) * 2020-03-11 2023-08-01 成都数融科技有限公司 基于区块链的数据可信表示的方法及装置
CN111523933B (zh) * 2020-04-21 2021-02-02 北京嘀嘀无限科技发展有限公司 一种下单概率预测方法、装置、电子设备及可读存储介质
CN111709246A (zh) * 2020-04-27 2020-09-25 北京百度网讯科技有限公司 节点特征的生成方法、装置、电子设备和存储介质
CN111860403B (zh) * 2020-07-28 2024-06-14 商汤国际私人有限公司 场景信息的检测方法和装置、电子设备
CN112507185B (zh) * 2020-10-22 2022-08-19 复旦大学 用户肖像的确定方法和装置
CN112446812B (zh) * 2020-12-14 2023-07-21 恒瑞通(福建)信息技术有限公司 一种基于区块链的政务信息自动推送方法及终端
CN112668703A (zh) * 2021-01-19 2021-04-16 上海优扬新媒信息技术有限公司 一种用户收入确定方法及装置
CN112862092B (zh) * 2021-01-26 2021-11-26 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN113191539B (zh) * 2021-04-15 2022-03-15 电子科技大学 一种基于异构图聚合网络的高密度复合场景轨迹预测方法
CN115495598A (zh) * 2021-06-17 2022-12-20 腾讯科技(深圳)有限公司 一种对多媒体资源的推荐方法、装置、设备及存储介质
CN113255844B (zh) * 2021-07-06 2021-12-10 中国传媒大学 基于图卷积神经网络交互的推荐方法及系统
CN113641930A (zh) * 2021-08-24 2021-11-12 北京有竹居网络技术有限公司 信息输出方法、装置和电子设备
CN113987087A (zh) * 2021-10-27 2022-01-28 北京达佳互联信息技术有限公司 帐户处理方法、装置、电子设备及存储介质
CN114518912B (zh) * 2022-02-21 2023-04-25 度小满科技(北京)有限公司 一种页面加载方法、装置、设备及可读存储介质
CN114707070A (zh) * 2022-04-12 2022-07-05 华为技术有限公司 一种用户行为预测方法及其相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195941B2 (en) * 2013-04-23 2015-11-24 International Business Machines Corporation Predictive and descriptive analysis on relations graphs with heterogeneous entities
CN109919670A (zh) * 2019-02-27 2019-06-21 重庆金窝窝网络科技有限公司 广告点击概率的预测方法、装置、服务器和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299373A (zh) * 2018-10-20 2019-02-01 上海交通大学 基于图卷积技术的推荐系统
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统

Also Published As

Publication number Publication date
CN110569437A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
CN110569437B (zh) 点击概率预测、页面内容推荐方法和装置
CN108804619B (zh) 兴趣偏好预测方法、装置、计算机设备及存储介质
Zhou et al. Interactive recommender system via knowledge graph-enhanced reinforcement learning
CN110321422B (zh) 在线训练模型的方法、推送方法、装置以及设备
Sun et al. A framework for recommending accurate and diverse items using bayesian graph convolutional neural networks
Ahmadian et al. A social recommender system based on reliable implicit relationships
Zhao et al. Seismic: A self-exciting point process model for predicting tweet popularity
Deng et al. Social network-based service recommendation with trust enhancement
US8412726B2 (en) Related links recommendation
Liu et al. A hybrid collaborative filtering recommendation mechanism for P2P networks
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
Kermarrec et al. Application of random walks to decentralized recommender systems
Yu et al. A prediction method of peak time popularity based on twitter hashtags
Huang et al. Learning to learn a cold-start sequential recommender
Khan et al. Collaborative filtering based online recommendation systems: A survey
CN111506821A (zh) 推荐模型、方法、装置、设备及存储介质
Truyen et al. Preference networks: Probabilistic models for recommendation systems
Liu et al. Towards context-aware collaborative filtering by learning context-aware latent representations
CN112989179B (zh) 模型训练、多媒体内容推荐方法和装置
CN114282077A (zh) 一种基于会话数据的会话推荐方法及系统
Shambour et al. A framework of hybrid recommendation system for government-to-business personalized e-services
Sharma et al. Adaptive matrix completion for the users and the items in tail
CN113468403A (zh) 基于大数据挖掘的用户信息预测方法及云计算ai服务系统
Gorripati et al. Community-based collaborative filtering to alleviate the cold-start and sparsity problems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant