CN112148975A - 会话推荐方法、装置及设备 - Google Patents

会话推荐方法、装置及设备 Download PDF

Info

Publication number
CN112148975A
CN112148975A CN202010996994.2A CN202010996994A CN112148975A CN 112148975 A CN112148975 A CN 112148975A CN 202010996994 A CN202010996994 A CN 202010996994A CN 112148975 A CN112148975 A CN 112148975A
Authority
CN
China
Prior art keywords
node
feature vector
determining
nodes
neighbor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010996994.2A
Other languages
English (en)
Inventor
何天健
刘毅
董大祥
于佃海
马艳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010996994.2A priority Critical patent/CN112148975A/zh
Publication of CN112148975A publication Critical patent/CN112148975A/zh
Priority to US17/399,016 priority patent/US20210374356A1/en
Priority to KR1020210105265A priority patent/KR20210106398A/ko
Priority to EP21190808.2A priority patent/EP3901788A3/en
Priority to JP2021148407A priority patent/JP7262539B2/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本申请公开了会话推荐方法、装置、电子设备及存储介质,涉及深度学习等人工智能技术领域。具体实现方案为:获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据;根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重;针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量;根据每个节点的新的特征向量,确定当前会话的特征向量;以及根据当前会话的特征向量进行对象推荐,可高效学习有用的信息,能够提升会话推荐结果的准确性。

Description

会话推荐方法、装置及设备
技术领域
本申请涉及计算机技术领域,具体涉及深度学习等人工智能技术领域,尤其涉及一种会话推荐方法、装置、电子设备及存储介质。
背景技术
在计算机领域中,图是一种自然的数据结构,它能够对一组对象(节点)及其关系(边)进行建模。近年来,由于图结构的强大表现力,用机器学习方法分析图的研究越来越受到重视。
目前,在推荐系统中可结合图结构数据进行推荐,在进行推荐的过中,准确对图结构数据进行处理,对实现准确推荐是十分重要的,如果不能准确从图结构数据中学习到有用的信息,导致推荐结果不准确。因此,如何更好的实现会话推荐成为亟待解决的问题。
发明内容
本申请提供了一种会话推荐方法、装置、电子设备以及存储介质。
根据第一方面,提供了一种会话推荐方法,包括:
获取当前会话对应的有向图,其中,所述当前对话包括多个已点击对象,所述有向图包括多个节点以及节点之间的有向边,且所述多个节点分别与所述多个已点击对象对应,所述有向边用于表示节点之间的关系数据;
根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重;
针对每个所述节点,根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量;
根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;以及
根据所述当前会话的特征向量进行对象推荐。
根据第二方面,提供了一种会话推荐装置,包括:
第一获取模块,用于获取当前会话对应的有向图,其中,所述当前对话包括多个已点击对象,所述有向图包括多个节点以及节点之间的有向边,且所述多个节点分别与所述多个已点击对象对应,所述有向边用于表示节点之间的关系数据;
第一确定模块,用于根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重;
第二确定模块,用于针对每个所述节点,根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量;
第三确定模块,用于根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;以及
第一执行模块,用于根据所述当前会话的特征向量进行对象推荐。
根据第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面所述的会话推荐方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请第一方面所述的会话推荐方法。
本申请提供的实施例,至少具有如下有益技术效果:
获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据,然后根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重,之后针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量,然后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。由此,可通过获取当前会话对应的有向图,并结合有向图中节点的特征向量以及关系数据自适应确定有向图中有向边的权重,继而可基于所确定出的权重对节点进行表示,可高效学习有用的信息,能够提升会话推荐结果的准确性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的示意图;
图2是根据本申请第二实施例的示意图;
图3是根据本申请第三实施例的示意图;
图4是根据本申请第四实施例的示意图;
图5是根据本申请第五实施例的示意图;
图6是根据本申请第六实施例的示意图;
图7是根据本申请第七实施例的示意图;
图8是根据本申请第八实施例的示意图;
图9是用来实现本申请实施例的会话推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,在推荐系统中,通常基于图神经网络对会话对应的有向图进行相关处理,然而,相关技术中的图神经网络在理解图结构信息进行节点的聚合操作时,仅是利用对应节点的其邻居节点的特征向量取平均,由于在实际应用场景中,节点和邻居节点的关系可能是多样的,利用特征向量取平均不容易高效的学习到有用的信息,导致推荐结果不准确。为了可以实现准确结果,本申请提出了一种会话推荐方法、装置、电子设备及存储介质,本申请通过获取当前会话对应的有向图,并根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重,之后针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量,然后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。由此,可通过获取当前会话对应的有向图,并结合有向图中节点的特征向量以及关系数据自适应确定有向图中有向边的权重,继而可基于所确定出的权重对节点进行表示,可高效学习有用的信息,能够提升会话推荐结果的准确性。
下面参考附图描述本申请实施例的会话推荐方法、装置、电子设备以及存储介质。
图1是根据本申请一个实施例的会话推荐方法的流程图。需要说明的是,本申请实施例的会话推荐方法可应用于本申请实施例的会话推荐装置,该装置可应用在电子设备中,其中,电子设备可以包括终端设备或者服务器。例如移动终端包括智能手机、平板电脑、PAD、个人数字助理等。本申请实施例对此不作限定。
S101、获取当前会话对应的有向图。其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据。
其中,当前会话是指从某用户打开某个网站开始,在一段时间内与该网站的交互记录,即点击对象序列。
其中,本实施例中的对象是一个广义概念,与具体的应用场景有关,该对象包括但不仅限于商品、小说、视频、新闻等。
在本申请的一个实施例中,可从用户的网页浏览日志中获取当前会话。其中,对于网站收集的用户浏览日志数据,可按照设定时间间隔将一个用户的日志记录划分为若干条会话,每条会话中包括用户点击过的对象。
举例而言,用户通过电子设备浏览A网站,其中,在浏览该A网站过程的一段时间内连续点击了10个商品,其中,可将该连续点击10个商品行为理解为当前对话,可结合当前会话中的商品构建当前会话对应的有向图有向图,其中,有向图中每个节点对应每个已点击的商品,有向图中的每一有向边表示在当前会话中用户点击了有向边的起点节点所对应的商品后,又点击了有向边所指向的目标节点所对应的商品。
其中,有向图的示例图,如图2所示,为了使得本领域技术人员清楚了解节点与节点之间的关系数据,下面结合图2进行示例性说明。
在本申请的一个实施例中,可通过邻接矩阵对有向图关系,也就是说,通过邻接矩阵对有向边所对应的权重进行表示,在通过邻接矩阵对有向图关系进行表示时,分为入度矩阵与出度矩阵,如图2中的a所示。
对于图2所示的有向图而言,在未结合节点的特征向量以及关系数据确定有向图中有向边的权重之前,该有向图对应的有向图关系所对应的邻接矩阵,如图2中的b所示。
需要说明的是,在每个会话的图表示中,每个点击的对象都被嵌入到统一的embedding(嵌入)空间,因此,可以利用每个节点的特征向量来表示与该节点所对应的对象的特征向量,即,本实施例中的节点的特征向量,和与该节点对应的对象的特征向量对应。
S102、根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重。
在本申请的实施例中,获取到当前会话对应的有向图,可将有向图中的每个节点的特征向量和关系数据,输入至预先训练的图注意力网络模型(Graph AttentionNetworks,GAT)中,以便通过图注意力网络模型中的注意力层确定有向图中节点对应的每个有向边的注意力权重。
其中,节点的特征向量可理解为当前会话中对象对应的特征向量,例如对象的词义特征、字符特征、词性特征、位置特征、实体特征等。
其中,词义特征可使用BERT预训练的向量进行单词词义的特征表示;字符特征:为了得到更加丰富的单词语义特征,如时态、词缀等,可以通过将字符进行编码,并输入到不同卷积核的卷积神经网络中,使用最大池进行抽取单词中特征最大的部分,作为单词特征向量的一部分特征表示;词性特征可通过查找随机初始化的词性矩阵进行特征表示;位置特征可通过使用句子中的每个单词的绝对位置进行编码,并输入到随机初始化的编码层中进行位置向量的特征表示;实体特征可使用BIO标注格式对识别类型标签,本说明书实施例使用语料库标注的所有的实体标签,并求和所有可能的实体类型特征。
作为一种实现的实施方式,将有向图中的每个节点的特征向量和关系数据,输入至预先训练的图注意力网络模型中,图注意力网络模型可针对每个节点,根据关系数据,获取节点的邻居节点,然后根据节点的特征向量和邻居节点的特征向量,确定节点与邻居节点之间的相关系数权重,以及根据相关系数权重,确定节点针对邻居节点的注意力权重。具体的实现过程可参考后续实施例。
S103、针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量。
在本申请的实施例中,图注意力网络模型在确定有向图中节点对应的每个有向边的注意力权重后,可针对每个节点,根据节点之间的关系数据,可确定节点的新的特征向量。
作为一种实施例的实现方式,可根据关系数据,获取节点的邻居节点,然后获取节点与邻居节点之间的对应有向边,获取对应有向边的注意力权重,之后根据邻居节点的特征向量和对应有向边的注意力权重,确定节点的新的特征向量。具体的实现过程可参考后续实施例。
S104、根据每个节点的新的特征向量,确定当前会话的特征向量。
也就是说,在确定每个节点的新的特征向量后,可根据每个节点的新的特征向量,确定当前会话的特征向量。
在本申请的一个实施例中,可将节点的新的特征向量进行拼接,以确定当前会话的特征向量,或者,可将节点的特征向量进行求和,以得到当前会话的特征向量,在实际应用中,可结合应用需求,应用其他的方式来确定出该当前会话的特征向量,该实施例不对根据有向图中每个节点的新的特征向量,确定当前会话的特征向量的具体实现方式进行限定。
作为另一种示例性的实施方式,对于当前会话对应的已点击对象序列而言,通常在已点击序列中不同位置上的对象,对当前会话的影响通常是不同的,为了后续可对当前会话进行准确对象推荐,上述步骤104的一种可能实现方式为:可对当前会话中已点击对象进行排序,进而获取当前会话中已点击对象的排序顺序,之后根据排列顺序,确定有向图中每个节点的位置信息,然后对每个节点的位置信息进行向量表示,以得到每个节点的位置表示向量,针对每个节点,根据节点的位置表示向量和新的特征向量,确定节点的目标特征向量,之后根据每个节点的目标特征向量,确定当前会话的特征向量。
S105、根据当前会话的特征向量进行对象推荐。
在本实施例中,在确定当前会话的特征向量后,可根据当前会话的特征向量,对用户的下一次行为进行对象推荐。
根据本申请实施例的会话推荐方法,可获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据,然后根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重,之后针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量,然后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。由此,可通过获取当前会话对应的有向图,并结合有向图中节点的特征向量以及关系数据自适应确定有向图中有向边的权重,继而可基于所确定出的权重对节点进行表示,可高效学习有用的信息,能够提升会话推荐结果的准确性。
在本实施例中,在具体实现时,在根据每个所述节点的特征向量和所述关系数据后,可将有向图中所有节点的特征向量和所述关系数据输入到图注意力网络模型中,以通过该注意力网络模型中得到每个节点的特征向量的新的特征向量。
其中,注意力网络模型中得到每个节点的特征向量的新的特征向量的具体实现方式为:注意力网络模型中的注意力层结合每个节点特征向量,得到每个有向边的注意力权重,然后,输出层结合每个节点的新的特征向量和有向边的注意力权重,得到每个节点的新的特征向量。
为了更进一步提升注意力层的表达能力,如图3所示,本申请中预设的图注意力神经网络还可采用多头注意力机制,其中,上述对每个节点的特征向量的更新过程为图注意力网络模型中每一头注意力机制结合有向图中每个所述节点的特征向量和所述关系数据进行计算,然后,结合每头注意力机制得到对应节点的特征向量,并对所得到的特征向量进行拼接,以得到对应节点的最终的新的特征向量。其中,图3是根据本申请实施例的多头注意力机制的示意图,对调用K组相互独立的注意力机制,可将输出结果融合在一起:
Figure BDA0002692937910000061
其中,
Figure BDA0002692937910000062
表示第i个节点的新特征向量,
Figure BDA0002692937910000063
表示第j个节点的原始特征向量,
Figure BDA0002692937910000064
表示第i节点和第j节点的归一化系数,Wk表示K个注意力机制对应的权重矩阵,σ表示非线性激活函数。
为了本领域的技术人员更容易理解本申请,图4是根据本申请一个具体实施例的会话推荐方法的流程图。如图4所示,该会话推荐方法可以包括:
S401、获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据。
举例而言,用户通过电子设备浏览A网站,其中,在浏览该A网站过程的一段时间内连续点击了10个商品,其中,可将该连续点击10个商品行为理解为当前对话,可结合当前会话中的商品构建当前会话对应的有向图有向图,其中,有向图中每个节点对应每个已点击的商品,有向图中的每一有向边表示在当前会话中用户点击了有向边的起点节点所对应的商品后,又点击了有向边所指向的目标节点所对应的商品。
S402、针对每个节点,根据关系数据,获取节点的邻居节点。
也就是说,根据有向图中的多个节点以及节点之间的关系数据,可确定节点的邻居节点,进而获取节点的邻居节点。
S403、根据节点的特征向量和邻居节点的特征向量,确定节点与邻居节点之间的相关系数权重。
可理解为,根据节点的特征向量和邻居节点的特征向量,可确定邻居节点的特征相对于节点的重要性。
在本申请的实施例中,可通过对节点的特征向量和邻居节点的特征向量分别进行线性变换,以得到节点的中间特征向量和邻居节点的中间特征向量,然后根据节点的中间特征向量和邻居节点的中间特征向量,确定节点与邻居节点之间的相似度,之后根据相似度,确定节点与邻居节点之间的相关系数权重。
其中,对节点的特征向量和邻居节点的特征向量分别进行线性变换,可理解为是在两个向量空间之间的函数,保持向量加法和标量乘法的运算,其中,线性变换的节点特征向量和邻居节点特征向量是指在变换下方向不变。
其中,在本申请的实施例中,根据节点的中间特征向量和邻居节点的中间特征向量,可通过欧式距离确定节点与邻居节点之间的相似度。
在本申请的一个实施例中,根据节点的中间特征向量和邻居节点的中间特征向量,可通过向量空间余弦算法,确定节点与邻居节点之间的相似度
举例而言,所有节点的特征向量集为:
Figure BDA0002692937910000071
其中,N表示节点的个数,F表示特征向量的维度。
其中,邻居节点vj到节点vi的权重系数为:
Figure BDA0002692937910000072
其中,vi表示有向图中第i个节点,W表示该层节点特征变换的权重参数,a()表示节点和邻居节点两个节点之间相似度函数。其中,相似度函数可选择向量的内积,也可选择一种带参数的神经网络。
S404、根据相关系数权重,确定节点针对邻居节点的注意力权重。
为了更好的分配权重,在本申请的实施例中,在确定节点与邻居节点之间的相关系数权重之后,可对相关系数权重进行归一化处理,以得到归一化的相关系数权重,根据归一化的相关系数权重,确定节点针对邻居节点的注意力权重。
其中,在本申请的一个实施例中,可通过归一化指数函数(softmax函数)对相关系数权重进行归一化。例如归一化的相关系数权重为:
Figure BDA0002692937910000081
其中,aij为归一化后的相关系数权重,eij为归一化前的相关系数权重,k代表节点i的所有邻居节点。
将上述若干表达式整合起来,可以得到完整的注意力权重系数的计算公式:
Figure BDA0002692937910000082
其中,T代表转置,||代表拼接操作,LeakyReLU是一种非线性激活函数。
S405、根据关系数据,获取节点的邻居节点,获取节点与邻居节点之间的对应有向边,以及获取对应有向边的注意力权重。
也就是说,根据有向图中多个节点以及多个节点之间关系数据,可确定节点的邻居节点,进而可获取节点的邻居节点以及节点与邻居节点之间的对应有向边。
在本申请的实施例中,在确定节点针对邻居节点的注意力权重,可获取节点针对邻居节点的注意力权重,并将节点针对邻居节点的注意力权重作为节点对应有向边的注意力权重。
S406、根据邻居节点的特征向量和对应有向边的注意力权重,确定节点的新的特征向量。
在本申请的一个实施例中,可对邻居节点的特征向量进行线性变换,以得到邻居节点的中间特征向量,之后根据对应有向边的注意力权重,对中间特征向量进行加权求和,以得到节点的新的特征向量。
举例而言,完成权重系数计算之后,按照加权求和的思路,可以求得新的特征向量为:
Figure BDA0002692937910000083
S407、根据每个节点的新的特征向量,确定当前会话的特征向量。
也就是说,在确定每个节点的新的特征向量后,可根据每个节点的新的特征向量,确定当前会话的特征向量。例如,新的节点特征向量集为
Figure BDA0002692937910000084
在本申请的一个实施例中,获取当前会话中已点击对象的排序顺序,之后根据排列顺序,确定有向图中每个节点的位置信息,然后对每个节点的位置信息进行向量表示,以得到每个节点的位置表示向量,针对每个节点,根据节点的位置表示向量和新的特征向量,确定节点的目标特征向量,之后根据每个节点的目标特征向量,确定当前会话的特征向量。
S408、根据当前会话的特征向量进行对象推荐。
也就是说,在确定当前会话的特征向量后,可根据当前会话的特征向量,对用户的下一次行为进行对象推荐。
在本申请的一个实施例中,可通过计算对象数据库中每个对象的特征向量与当前会话的特征向量之间的相似度,根据相似度,确定在当前会话中对对象数据库中每个对象的点击概率,然后按照点击概率从大到小的顺序,对对象数据库中每个对象进行排序,以得到排序结果,之后从排序结果中选择排序在前的K个对象,并根据K个对象进行对象推荐,其中,K为大于或者等于1的整数。
本实施例,在结合当前会话中节点的新的特征向量,得到当前会话的特征向量后,通过当前会话的特征向量与对象数据库中每个节点的特征向量进行相似度计算,并根据相似度计算,准确确定出针对当前会话的对象推荐结果,进一步提高了会话推荐的准确性。
作为一种可能实现的实施方式,可通过夹角余弦算法,计算对象数据库中每个对象的特征向量与当前会话的特征向量之间的相似度。其中,对象数据库中每个对象的特征向量与当前会话的特征向量之间的相似度越高,对对象数据库中每个对象的点击概率越大。
作为另一种可能实现的实施方式,可通过Jaccard相似系数,计算对象数据库中每个对象的特征向量与当前会话的特征向量之间的相似度。
作为又一种可能实现的实施方式,可通过相关系数函数,计算对象数据库中每个对象的特征向量与当前会话的特征向量之间的相似度。
根据本申请实施例的会话推荐方法,获取用户的当前会话后,根据当前会话中的已经点击的对象,建立当前会话对应的有向图,其中,有向图中的各节点分别为当前会话中的对象,针对每个节点,根据关系数据,获取节点的邻居节点,根据节点的特征向量和邻居节点的特征向量,确定节点与邻居节点之间的相关系数权重,之后根据相关系数权重,确定节点针对邻居节点的注意力权重,并对相关系数权重进行归一化处理,以确定节点针对邻居节点的注意力权重,然后根据邻居节点的特征向量和对应有向边的注意力权重,确定节点的新的特征向量,之后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。实现了对不同邻居权重的自适应分配,更好的实现了分配权重,从而提高了图神经网络模型的表达能力,进而可高效学习有用的信息,使得推荐结果更准确。
在本申请的一个具体实施例中,基于图注意力网络GAT的网络架构,假设某个会话序列查完embedding的结果为:S=[v1,v2,…,vn],之后分别计算两个线性变换Fkout*Fqout=[Wkin,Wkout]*S,[Fqin,Fqout]=[Wqin,Wqout]*S,然后基于该会话对应的有向图,计算所有相邻元素之间基于Fkin和Fkout的相似度,并做归一化,进而求出权重参数矩阵Hin和Hout。此处的相似度可采用神经网络进行模拟,最后分别计算加权和Hin*Fqin,Hout*Fqout,并将结果进行拼接,得到每个节点的新的特征向量,然后,根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;以及根据所述当前会话的特征向量进行对象推荐。
例如,有向图,如图对于图2中的a图所示,对于a图中的V2节点来说,有到达V3和V4的有向路径,在SR-GNN中进行信息聚合的时,V2从V3和V4中获得的信息量是相同的,而基于图注意力网络GAT的架构,得到的权重可能是和它们潜在表征的含义相关的,所以V2和V3之间的权重可能远大于V2和V4之间的权重,从而可高效学到更加有意义的信息,进而使得推荐结果更准确。
为了使得高效学习有用的信息,在本申请的一个实施例中,在应用图注意力网络模型后,再叠加上位置信息编码,可更高效学习到有用信息,使得推荐结果更准确。
在Diginetica、Yoochoose4、Yoochoose64三个数据集上进行了验证。在测试集上的P@20指标值的对比如下表所示。其中SR-GNN列表示原始论文给出的测试结果,而SR-GNN-POS给出的是加入了PositionalEncoding之后的测试结果,而SR-GAT-POS是采用了本发明提出的GAT架构,再加上PositionalEncoding之后的测试结果。三个实验都是重复运行三次之后取平均值的结论。
对比SR-GNN-POS和SR-GAT-POS两列,能够看到采用GAT网络可以对效果带来明显的提升。在这三个数据集上均超过了目前最好的效果(SOTA:SR-GNN)。
试验ID 数据集 SR-GNN SR-GNN-POS SR-GAT-POS
1 Diginetica(exp) 51.24 51.69 51.95(hidden32:52.02)
2 Diginetica(piece) 50.24 50.77 51.12
3 Yoochoose4 71.38 71.49 71.53
4 Yoochoose64 70.11 70.58 70.77
注:
实验1和2的区别在于学习率衰减策略的不同,实验1采用的是指数衰减,实验2采取的是分段递减的方案。
GAT架构均使用了多头注意力机制,head_num=8,key和value的映射维度均为8。
所有GAT架构实验的超参数都取自对齐SR-GNN的,实际上我们相信,如果经过详尽的超参搜索,预期能够得到更好的效果。
上述GAT的网络结构中,未加任何的正则化操作。实际上在Attention架构里,dropout,包括新进提出的dropedge等方案,都值得进行尝试。
与上述几种实施例提供的会话推荐方法相对应,本申请的一种实施例还提供一种会话推荐装置,由于本申请实施例提供的会话推荐装置与上述几种实施例提供的会话推荐方法相对应,因此在会话推荐方法的实施方式也适用于本实施例提供的会话推荐装置,在本实施例中不再详细描述。图5~图8是根据本申请一个实施例的会话推荐装置的结构示意图。
如图5所示,该会话推荐装置500包括:第一获取模块501、第一确定模块502、第二确定模块503、第三确定模块504和第一执行模块505。其中:
第一获取模块501用于获取当前会话对应的有向图,其中,所述当前对话包括多个已点击对象,所述有向图包括多个节点以及节点之间的有向边,且所述多个节点分别与所述多个已点击对象对应,所述有向边用于表示节点之间的关系数据。
第一确定模块502用于根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重;作为一种示例,所述第一确定模块502,包括:第一获取单元5021,用于针对每个所述节点,根据所述关系数据,获取所述节点的邻居节点;第一确定单元5022,用于根据所述节点的特征向量和所述邻居节点的特征向量,确定所述节点与所述邻居节点之间的相关系数权重;以及第二确定单元5023,用于根据所述相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
在本申请的实施例中,第一确定单元5022,用于:对所述节点的特征向量和所述邻居节点的特征向量分别进行线性变换,以得到所述节点的中间特征向量和所述邻居节点的中间特征向量;根据所述节点的特征向量和所述邻居节点的中间特征向量,确定所述节点与所述邻居节点之间的相似度;以及根据所述相似度,确定所述节点与所述邻居节点之间的相关系数权重。
在本申请的实施例中,所述第二确定单元5023,用于:对所述相关系数权重进行归一化处理,以得到归一化的相关系数权重;以及根据所述归一化的相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
第二确定模块503用于针对每个所述节点,根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量。作为一种示例,所述第二确定模块503,包括:第二获取单元5031,用于根据所述关系数据,获取所述节点的邻居节点;第三获取单元5032,用于获取所述节点与所述邻居节点之间的对应有向边;第四获取单元5033,用于获取所述对应有向边的注意力权重;以及第三确定单元5034,用于根据所述邻居节点的特征向量和所述对应有向边的注意力权重,确定所述节点的新的特征向量。
在本申请的实施例中,所述第三确定单元6034,用于:对所述邻居节点的特征向量进行线性变换,以得到所述邻居节点的中间特征向量;根据所述对应有向边的注意力权重,对所述中间特征向量进行加权求和,以得到所述节点的新的特征向量。
第三确定模块504用于根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;作为一种示例,所述第三确定模块504,包括:第五获取单元5041,用于获取所述当前会话中已点击对象的排序顺序;第四确定单元5042,用于根据所述排列顺序,确定所述有向图中每个所述节点的位置信息;第五确定单元5043,用于对所述每个所述节点的位置信息进行向量表示,以得到每个所述节点的位置表示向量;第六确定单元5044,用于针对每个所述节点,根据所述节点的位置表示向量和所述新的特征向量,确定所述节点的目标特征向量;以及第七确定单元5045,用于根据每个所述节点的目标特征向量,确定所述当前会话的特征向量。
第一执行模块505用于根据所述当前会话的特征向量进行对象推荐。作为一种示例,所述第一执行模块505用于:计算对象数据库中每个对象的特征向量与所述当前会话的特征向量之间的相似度;根据所述相似度,确定在所述当前会话中对所述对象数据库中每个对象的点击概率;按照所述点击概率从大到小的顺序,对所述对象数据库中每个对象进行排序,以得到排序结果;以及从所述排序结果中选择排序在前的K个对象,并根据所述K个对象进行对象推荐。
根据本申请实施例的会话推荐装置,可获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据,然后根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重,之后针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量,然后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。由此,可通过获取当前会话对应的有向图,并结合有向图中节点的特征向量以及关系数据自适应确定有向图中有向边的权重,继而可基于所确定出的权重对节点进行表示,可高效学习有用的信息,能够提升会话推荐结果的准确性。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,是根据本申请实施例的用以实现会话推荐方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的会话推荐方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的会话推荐方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的会话推荐方法对应的程序指令/模块(例如,附图5所示的第一获取模块501、第一确定模块502、第二确定模块503、第三确定模块504和第一执行模块505)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的会话推荐方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据会话推荐的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至会话推荐的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用以实现会话推荐方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与会话推荐的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,获取当前会话对应的有向图,其中,当前对话包括多个已点击对象,有向图包括多个节点以及节点之间的有向边,且多个节点分别与多个已点击对象对应,有向边用于表示节点之间的关系数据,然后根据每个节点的特征向量和关系数据,确定有向图中节点对应的每个有向边的注意力权重,之后针对每个节点,根据关系数据以及注意力权重,确定节点的新的特征向量,然后根据每个节点的新的特征向量,确定当前会话的特征向量,进而根据当前会话的特征向量进行对象推荐。由此,可通过获取当前会话对应的有向图,并结合有向图中节点的特征向量以及关系数据自适应确定有向图中有向边的权重,继而可基于所确定出的权重对节点进行表示,可高效学习有用的信息,能够提升会话推荐结果的准确性。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (18)

1.一种会话推荐方法,包括:
获取当前会话对应的有向图,其中,所述当前对话包括多个已点击对象,所述有向图包括多个节点以及节点之间的有向边,且所述多个节点分别与所述多个已点击对象对应,所述有向边用于表示节点之间的关系数据;
根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重;
针对每个所述节点,根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量;
根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;以及
根据所述当前会话的特征向量进行对象推荐。
2.根据权利要求1所述的方法,其中,所述根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重,包括:
针对每个所述节点,根据所述关系数据,获取所述节点的邻居节点;
根据所述节点的特征向量和所述邻居节点的特征向量,确定所述节点与所述邻居节点之间的相关系数权重;以及
根据所述相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
3.根据权利要求2所述的方法,其中,所述根据所述节点的特征向量和所述邻居节点的特征向量,确定所述节点与所述邻居节点之间的相关系数权重,包括:
对所述节点的特征向量和所述邻居节点的特征向量分别进行线性变换,以得到所述节点的中间特征向量和所述邻居节点的中间特征向量;
根据所述节点的特征向量和所述邻居节点的中间特征向量,确定所述节点与所述邻居节点之间的相似度;以及
根据所述相似度,确定所述节点与所述邻居节点之间的相关系数权重。
4.根据权利要求2所述的方法,其中,所述根据所述相关系数权重,确定所述节点针对所述邻居节点的注意力权重,包括:
对所述相关系数权重进行归一化处理,以得到归一化的相关系数权重;以及
根据所述归一化的相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
5.根据权利要求1所述的方法,其中,所述根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量,包括:
根据所述关系数据,获取所述节点的邻居节点;
获取所述节点与所述邻居节点之间的对应有向边;
获取所述对应有向边的注意力权重;以及
根据所述邻居节点的特征向量和所述对应有向边的注意力权重,确定所述节点的新的特征向量。
6.根据权利要求5所述的方法,其中,所述根据所述邻居节点的特征向量和所述对应有向边的注意力权重,确定所述节点的新的特征向量,包括:
对所述邻居节点的特征向量进行线性变换,以得到所述邻居节点的中间特征向量;
根据所述对应有向边的注意力权重,对所述中间特征向量进行加权求和,以得到所述节点的新的特征向量。
7.根据权利要求1所述的方法,其中,所述根据每个所述节点的新的特征向量,确定所述当前会话的特征向量,包括:
获取所述当前会话中已点击对象的排序顺序;
根据所述排列顺序,确定所述有向图中每个所述节点的位置信息;
对所述每个所述节点的位置信息进行向量表示,以得到每个所述节点的位置表示向量;
针对每个所述节点,根据所述节点的位置表示向量和所述新的特征向量,确定所述节点的目标特征向量;以及
根据每个所述节点的目标特征向量,确定所述当前会话的特征向量。
8.根据权利要求1所述的方法,其中,根据所述当前会话的特征向量进行对象推荐,包括:
计算对象数据库中每个对象的特征向量与所述当前会话的特征向量之间的相似度;
根据所述相似度,确定在所述当前会话中对所述对象数据库中每个对象的点击概率;
按照所述点击概率从大到小的顺序,对所述对象数据库中每个对象进行排序,以得到排序结果;以及
从所述排序结果中选择排序在前的K个对象,并根据所述K个对象进行对象推荐,其中,K为大于或者等于1的整数。
9.一种会话推荐装置,包括:
第一获取模块,用于获取当前会话对应的有向图,其中,所述当前对话包括多个已点击对象,所述有向图包括多个节点以及节点之间的有向边,且所述多个节点分别与所述多个已点击对象对应,所述有向边用于表示节点之间的关系数据;
第一确定模块,用于根据每个所述节点的特征向量和所述关系数据,确定所述有向图中所述节点对应的每个所述有向边的注意力权重;
第二确定模块,用于针对每个所述节点,根据所述关系数据以及所述注意力权重,确定所述节点的新的特征向量;
第三确定模块,用于根据每个所述节点的新的特征向量,确定所述当前会话的特征向量;以及
第一执行模块,用于根据所述当前会话的特征向量进行对象推荐。
10.根据权利要求9所述的装置,其中,所述第一确定模块,包括:
第一获取单元,用于针对每个所述节点,根据所述关系数据,获取所述节点的邻居节点;
第一确定单元,用于根据所述节点的特征向量和所述邻居节点的特征向量,确定所述节点与所述邻居节点之间的相关系数权重;以及
第二确定单元,用于根据所述相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
11.根据权利要求10所述的装置,其中,第一确定单元,用于:
对所述节点的特征向量和所述邻居节点的特征向量分别进行线性变换,以得到所述节点的中间特征向量和所述邻居节点的中间特征向量;
根据所述节点的特征向量和所述邻居节点的中间特征向量,确定所述节点与所述邻居节点之间的相似度;以及
根据所述相似度,确定所述节点与所述邻居节点之间的相关系数权重。
12.根据权利要求10所述的装置,其中,所述第二确定单元,用于:
对所述相关系数权重进行归一化处理,以得到归一化的相关系数权重;以及
根据所述归一化的相关系数权重,确定所述节点针对所述邻居节点的注意力权重。
13.根据权利要求9所述的装置,其中,所述第二确定模块,包括:
第二获取单元,用于根据所述关系数据,获取所述节点的邻居节点;
第三获取单元,用于获取所述节点与所述邻居节点之间的对应有向边;
第四获取单元,用于获取所述对应有向边的注意力权重;以及
第三确定单元,用于根据所述邻居节点的特征向量和所述对应有向边的注意力权重,确定所述节点的新的特征向量。
14.根据权利要求13所述的装置,其中,所述第三确定单元,用于:
对所述邻居节点的特征向量进行线性变换,以得到所述邻居节点的中间特征向量;
根据所述对应有向边的注意力权重,对所述中间特征向量进行加权求和,以得到所述节点的新的特征向量。
15.根据权利要求9所述的装置,其中,所述第三确定模块,包括:
第五获取单元,用于获取所述当前会话中已点击对象的排序顺序;
第四确定单元,用于根据所述排列顺序,确定所述有向图中每个所述节点的位置信息;
第五确定单元,用于对所述每个所述节点的位置信息进行向量表示,以得到每个所述节点的位置表示向量;
第六确定单元,用于针对每个所述节点,根据所述节点的位置表示向量和所述新的特征向量,确定所述节点的目标特征向量;以及
第七确定单元,用于根据每个所述节点的目标特征向量,确定所述当前会话的特征向量。
16.根据权利要求9所述的装置,其中,所述第一执行模块,用于:
计算对象数据库中每个对象的特征向量与所述当前会话的特征向量之间的相似度;
根据所述相似度,确定在所述当前会话中对所述对象数据库中每个对象的点击概率;
按照所述点击概率从大到小的顺序,对所述对象数据库中每个对象进行排序,以得到排序结果;以及
从所述排序结果中选择排序在前的K个对象,并根据所述K个对象进行对象推荐,其中,K为大于或者等于1的整数。
17.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的会话推荐方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的会话推荐方法。
CN202010996994.2A 2020-09-21 2020-09-21 会话推荐方法、装置及设备 Pending CN112148975A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010996994.2A CN112148975A (zh) 2020-09-21 2020-09-21 会话推荐方法、装置及设备
US17/399,016 US20210374356A1 (en) 2020-09-21 2021-08-10 Conversation-based recommending method, conversation-based recommending apparatus, and device
KR1020210105265A KR20210106398A (ko) 2020-09-21 2021-08-10 세션 추천 방법, 장치 및 기기
EP21190808.2A EP3901788A3 (en) 2020-09-21 2021-08-11 Conversation-based recommending method, conversation-based recommending apparatus, and device
JP2021148407A JP7262539B2 (ja) 2020-09-21 2021-09-13 会話推薦方法、装置及び機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010996994.2A CN112148975A (zh) 2020-09-21 2020-09-21 会话推荐方法、装置及设备

Publications (1)

Publication Number Publication Date
CN112148975A true CN112148975A (zh) 2020-12-29

Family

ID=73893950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010996994.2A Pending CN112148975A (zh) 2020-09-21 2020-09-21 会话推荐方法、装置及设备

Country Status (5)

Country Link
US (1) US20210374356A1 (zh)
EP (1) EP3901788A3 (zh)
JP (1) JP7262539B2 (zh)
KR (1) KR20210106398A (zh)
CN (1) CN112148975A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733018A (zh) * 2020-12-31 2021-04-30 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN113868537A (zh) * 2021-10-19 2021-12-31 山东省人工智能研究院 一种基于多行为会话图融合的推荐方法
WO2023197910A1 (zh) * 2022-04-12 2023-10-19 华为技术有限公司 一种用户行为预测方法及其相关设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579851B (zh) * 2022-02-25 2023-03-14 电子科技大学 一种基于自适应性节点特征生成的信息推荐方法
US20230306204A1 (en) * 2022-03-22 2023-09-28 International Business Machines Corporation Mining asynchronous support conversation using attributed directly follows graphing
CN115221413B (zh) * 2022-08-03 2023-04-14 湖北工业大学 一种基于交互式图注意力网络的序列推荐方法及系统
CN116342228B (zh) * 2023-05-18 2023-10-20 云筑信息科技(成都)有限公司 一种基于有向图神经网络的相关推荐的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046257A (zh) * 2019-12-09 2020-04-21 北京百度网讯科技有限公司 一种会话推荐方法、装置以及电子设备
US20200285944A1 (en) * 2019-03-08 2020-09-10 Adobe Inc. Graph convolutional networks with motif-based attention

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098845A (ja) 2010-10-29 2012-05-24 Rakuten Inc 情報処理装置、情報処理システム、情報処理プログラム、情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体、及び情報処理方法
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统
CN110490717B (zh) * 2019-09-05 2021-11-05 齐鲁工业大学 基于用户会话及图卷积神经网络的商品推荐方法及系统
CN111667067A (zh) 2020-05-28 2020-09-15 平安医疗健康管理股份有限公司 基于图神经网络的推荐方法、装置和计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200285944A1 (en) * 2019-03-08 2020-09-10 Adobe Inc. Graph convolutional networks with motif-based attention
CN111046257A (zh) * 2019-12-09 2020-04-21 北京百度网讯科技有限公司 一种会话推荐方法、装置以及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PETAR VELIČKOVIĆ等: "Graph Attention Networks", 《ICLR 2018 CONFERENCE ACCEPTANCE》 *
SHU WU等: "Session-Based Recommendation with Graph Neural Networks", 《PROCEEDINGS OF THE AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733018A (zh) * 2020-12-31 2021-04-30 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN113868537A (zh) * 2021-10-19 2021-12-31 山东省人工智能研究院 一种基于多行为会话图融合的推荐方法
CN113868537B (zh) * 2021-10-19 2022-07-05 山东省人工智能研究院 一种基于多行为会话图融合的推荐方法
WO2023197910A1 (zh) * 2022-04-12 2023-10-19 华为技术有限公司 一种用户行为预测方法及其相关设备

Also Published As

Publication number Publication date
EP3901788A2 (en) 2021-10-27
EP3901788A3 (en) 2022-03-09
JP2021193595A (ja) 2021-12-23
JP7262539B2 (ja) 2023-04-21
KR20210106398A (ko) 2021-08-30
US20210374356A1 (en) 2021-12-02

Similar Documents

Publication Publication Date Title
CN112148975A (zh) 会话推荐方法、装置及设备
CN111639710A (zh) 图像识别模型训练方法、装置、设备以及存储介质
CN111311321B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
KR102476056B1 (ko) 아이템 추천방법, 시스템, 전자기기 및 기록매체
CN111667056B (zh) 用于搜索模型结构的方法和装置
CN110019736B (zh) 基于语言模型的问答匹配方法、系统、设备及存储介质
CN111582479B (zh) 神经网络模型的蒸馏方法和装置
WO2023065859A1 (zh) 物品推荐方法、装置及存储介质
CN112905897B (zh) 相似用户确定方法、向量转化模型、装置、介质及设备
US20210406993A1 (en) Automated generation of titles and descriptions for electronic commerce products
CN112307352B (zh) 内容推荐方法、系统、装置和存储介质
CN111429204A (zh) 酒店推荐方法、系统、电子设备和存储介质
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
CN114036398A (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN111563198A (zh) 一种物料召回方法、装置、设备及存储介质
CN115423037A (zh) 一种基于大数据的用户分类方法及系统
CN111966782B (zh) 多轮对话的检索方法、装置、存储介质及电子设备
CN111311000B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN112580723A (zh) 多模型融合方法、装置、电子设备和存储介质
CN112052402B (zh) 信息推荐方法、装置、电子设备及存储介质
CN111274497B (zh) 社区推荐及模型训练方法、装置、电子设备及存储介质
Ghebriout et al. Harmonic-NAS: Hardware-Aware Multimodal Neural Architecture Search on Resource-constrained Devices
CN112734519A (zh) 一种基于卷积自编码器网络的商品推荐方法
CN112989219A (zh) 兴趣点推荐方法、装置、电子设备及存储介质
CN111782794A (zh) 问答响应方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination