CN112765413A - 一种基于用户特征的图数据查询推荐方法 - Google Patents

一种基于用户特征的图数据查询推荐方法 Download PDF

Info

Publication number
CN112765413A
CN112765413A CN202110068350.1A CN202110068350A CN112765413A CN 112765413 A CN112765413 A CN 112765413A CN 202110068350 A CN202110068350 A CN 202110068350A CN 112765413 A CN112765413 A CN 112765413A
Authority
CN
China
Prior art keywords
query
user
node
nodes
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110068350.1A
Other languages
English (en)
Inventor
宋骐
罗刚
汪国航
田宝同
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Song Qi
Original Assignee
Hefei Hongqi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Hongqi Technology Co ltd filed Critical Hefei Hongqi Technology Co ltd
Priority to CN202110068350.1A priority Critical patent/CN112765413A/zh
Publication of CN112765413A publication Critical patent/CN112765413A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及图结构数据处理领域,具体的是一种基于用户特征的图数据查询推荐方法,所述方法包括以下步骤:一、用户给出查询,系统通过子图同构应答该查询并返回一组查询结果;二、在训练节点,系统将查询结果发送给用户选择,收集用户点击的产品,生成包含用户‑产品对的训练数据;三、机器学习模型基于此训练数据训练出一个新的模型,即一组新的参数;四、在应用阶段,该模型将查询结果进行排序,并将排序后的结果发送给用户作为查询结果。本发明在结合了传统的图数据查询的基础上,通过机器学习的方式发现用户特征与产品特征之间的关系,对不同用户提供个性化的查询结果,进而更好的满足用户的查询需要。

Description

一种基于用户特征的图数据查询推荐方法
技术领域
本发明涉及图结构数据处理领域,具体的是一种基于用户特征的图数据查询推荐方法。
背景技术
近年来,图数据被广泛应用于电子商务、社交网络、知识图谱等领域,其特征在于可以表示数据之间的关联关系,例如在电子商务中,图数据包含代表产品或者其相关属性的节点(例如生产公司等)和表示它们之间关联关系的边,每个节点或者边也可能包含一组属性及对应的属性值。这类图数据通常可以被用来回答用户的查询请求,如图1所示,节点包含手机及其配件信息,例如用户想查询华为生产的黑色手机,那么该查询可以被表示为一个小的查询子图,通过回答该查询,系统会告诉用户其想查询的手机的具体名称。该类查询已被广泛应用于各大电商,用于帮助用户发现他们想寻找的产品。
当用户给出的查询条件较为宽泛时,系统可能会返回大量的查询结果,从而让用户很难发现最有用的信息,因而如何针对不同的用户提供定制化的查询推荐是图查询领域一个挑战。针对不同的用户,他们对不同产品的偏好程度不同,例如男性和女性对电子产品的偏好度有差异,同时,相同类型用户之间的查询也能帮助他们互相之间的查询结果推荐。
发明内容
为解决上述背景技术中提到的不足,本发明的目的在于提供一种基于用户特征的图数据查询推荐方法,在结合了传统的图数据查询的基础上,通过机器学习的方式发现用户特征与产品特征之间的关系,对不同用户提供个性化的查询结果,进而更好的满足用户的查询需要。
本发明的目的可以通过以下技术方案实现:
一种基于用户特征的图数据查询推荐方法,所述方法包括以下步骤:
一、用户给出查询,系统通过子图同构应答该查询并返回一组查询结果;
二、在训练节点,系统将查询结果发送给用户选择,收集用户点击的产品,生成包含用户-产品对的训练数据;
三、机器学习模型基于此训练数据训练出一个新的模型,即一组新的参数;
四、在应用阶段,该模型将查询结果进行排序,并将排序后的结果发送给用户作为查询结果。
进一步地,所述图数据G被表现为一个三元组G=(V,E,F),V是一组节点,E是一组连接节点的边,
Figure BDA0002905039800000021
每个节点或边拥有一组属性及对应的属性值;图查询为一个小的子图,节点和边的数量均小于10个节点,图查询被定义为G’=(V’,E’,F’),包含一组节点V’、边E’和属性F’,给了一个图查询之后,采用子图同构的方法来回答该查询,即找到G中所有与该子图匹配的子图。
进一步地,所述子图同构被定义为一个节点对应关系,即V与V’中节点的对应。
进一步地,所述查询推荐模型在机器学习中的神经网络理论中定义,该模型的输入是一个用户和一个节点的特征向量,输出是一个0-1之间的数值,用以表现该用户对该节点的偏好程度。
进一步地,所述特征向量对于用户或者某个节点来说,需要使用其属性及值来计算得到特征向量,特征向量为1个n-元组<x1,x2…xn>,其中每个向量xi表示一个特征的值。
进一步地,给定一个用户u和一个节点v,其所述特征向量分别是h(u)和h(v),模型的目的是生成一个函数f(u,v),模型中包括多个神经节点,每个神经节点是一个特征向量的值,每个神经节点和它下一层的所有神经节点之间都有一条边,这条边上有一个权重w,那么中间层每个隐藏节点的值,都是由其上一层的所有节点和对应边上的权重所决定的,即
A[l]=g(W[l]A[l-1]+b[l])
其中g是tanh函数
Figure BDA0002905039800000031
它将任意实数的值转换到0-1之间,因而保证了所有的隐藏节点和输出节点的值都在0-1中间。
进一步地,所述步骤三中的训练数据D是一个三元组的集合,每个三元组是<u,v,xuv>,其中u是用户,v是某个在查询结果中的节点,xuv=1,如果该用户在训练过程中选择了该节点,否则xuv=0;
假设需要训练的参数为W,那么目标函数的定义为:
Figure BDA0002905039800000032
训练的目的是最小化函数J(W)的值,因为W有无数种可能的值,采用反向传播算法来计算W的最优值。
本发明的有益效果:
1、本发明整合了图查询与基于神经网络的查询结果推荐,在结合了传统的图数据查询的基础上,通过机器学习的方式发现用户特征与产品特征之间的关系,对不同用户提供个性化的查询结果,进而更好的满足用户的查询需要;
2、本发明基于用户特征的个性化推荐,在模型训练的过程中考虑到了用户的特征,即训练出的参数中隐含了不同用户的偏好习惯;
3、本发明设计新的神经网络结构,能够同时输入用户和节点的特征并生成偏好值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1是现有技术中图数据被用来回答用户的查询请求示意图;
图2是本发明基于用户特征的图数据查询推荐方法示意图;
图3是本发明基于用户特征的查询推荐模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
一种基于用户特征的图数据查询推荐方法,如图2所示为该方法的结构图,其主要包含以下过程:
一、用户给出查询,系统通过子图同构应答该查询并返回一组查询结果;
二、在训练节点,系统将查询结果发送给用户选择,收集用户点击的产品,生成包含用户-产品对的训练数据;
三、机器学习模型基于此训练数据训练出一个新的模型,即一组新的参数;
四、在应用阶段,该模型将查询结果进行排序,并将排序后的结果发送给用户作为查询结果。
具体地,将从以下四个方面对本发明进行详细阐述:
一、图数据及图查询的定义
首先定义图数据,图数据G可以被表现为一个三元组G=(V,E,F)。其中V是一组节点,E是一组连接节点的边
Figure BDA0002905039800000051
每个节点或边拥有一组属性及对应的属性值,例如某公司节点可以有属性-属性值“类别-国家”“名称-XX公司”、“收入-XX万元”等,参考图1。同样,该定义可以被广泛地应用于表现其他类别的图结构数据,例如针对社交网络数据,节点可以定义为“用户”,其拥有“年龄、注册时间、职业”等属性,用户与用户之间有“好友”、“关注”等关系。
在定义了图数据之后,然后定义图查询以及如何图查询的结果。首先,图查询是一个非常小的子图(通常只有<10个节点和边)。与图的定义类似,图查询可以被定义为G’=(V’,E’,F’),其也包含一组节点V’、边E’和属性F’,参照图1中左边的图和右边的图查询,给了一个图查询之后,通常采用子图同构的方法来回答该查询,即找到G中所有与该子图匹配的子图。
子图同构可以定义为一个节点对应关系,即V与V’中节点的对应,假设该对应可以表现为一个对应函数f(),例如图3中,摘要里的公司节点可以对应到匹配中的公司节点。用
Figure BDA0002905039800000052
表示两个图中所有的节点对应关系,如果u是摘要中的节点,那么f(u)就是对应的在G中的节点,如果该对应函数满足以下条件,那么它就是一个子图同构。
1、
Figure BDA0002905039800000053
2、
Figure BDA0002905039800000054
3、
Figure BDA0002905039800000055
4、
Figure BDA0002905039800000061
5、
Figure BDA0002905039800000062
f(u)中的属性能对应/匹配上u的属性及值
6、
Figure BDA0002905039800000063
f(u)和f(u’)之间的边上的属性能对应/匹配上u,u’之间的边上的属性及值。
例如图1中,所有与该查询匹配的子图都是描述的华为的黑色手机。
二、基于用户特征的查询推荐模型的定义
基于机器学习中的神经网络理论定义了查询推荐模型,该模型的输入是一个用户和一个节点的特征向量,输出是一个0-1之间的数值,用以表现该用户对该节点的偏好程度,例如一个用户对某个产品的偏好程度。
首先定义特征向量。对于用户或者某个节点,使用其属性及值来计算它的特征向量。特征向量为1个n-元组<x1,x2…xn>,其中每个向量xi表示一个特征的值,例如对用户考虑其4个属性:年龄、性别、身高、体重,那么一个可能的特征值就是<20,1,170,65>,1表示女性,即将所有属性量化。同样对某个节点,例如某个产品(如手机),其属性可能包括颜色、重量、是否防水等。
给定一个用户u和一个节点v,他们的特征向量分别是h(u)和h(v),模型的目的是生成一个函数f(u,v),模型的具体定义如图3所示,最左边的第0层包含了h(u)和h(v),其中每个圆圈(神经节点)是一个特征向量的值,中间的第1-3层包含了多个隐藏神经节点,最终最右边的第4层是一个0-1之间的数值,成为输出节点,即f(u,v)的值。
每个神经节点和它下一层的所有神经节点之间都有一条边,这条边上有一个权重w,那么中间层每个隐藏节点的值,都是由其上一层的所有节点和对应边上的权重所决定的,即
A[l]=g(W[l]A[l-1]+b[l])
其中g是tanh函数
Figure BDA0002905039800000071
它将任意实数的值转换到0-1之间,因而保证了所有的隐藏节点和输出节点的值都在0-1中间。
需要注意的是,节点之间的权重值是未知的,而训练模型的目的就是发现这些权重的值,也称为训练参数。当这些参数/权重的值确定下来之后,给定1个用户和1个节点(例如产品),就可以通过运行该模型生成他们之间的关联数值,该数值越高,说明该用户更偏好该节点。
三、推荐模型的训练
为了训练该机器学习模型,首先定义目标函数,即训练的过程要不停修改参数/权重的值,使得这个目标函数的值被最小化,即达到最优的参数值。
首先定义训练数据,训练数据D是一个三元组的集合,每个三元组是<u,v,xuv>,其中u是用户,v是某个在查询结果中的节点,xuv=1。如果该用户在训练过程中选择了该节点,否则xuv=0。
假设需要训练的参数为W,那么目标函数的定义为:
Figure BDA0002905039800000072
训练的目的是最小化函数J(W)的值,因为W有无数种可能的值,采用反向传播算法来计算W的最优值。
其算法的过程在于反向传播函数的错误:
Figure BDA0002905039800000073
Figure BDA0002905039800000081
反向传播算法属于神经网络计算中的经典训练算法,具体过程为现有技术(https://www.cnblogs.com/charlotte77/p/5629865.html),在此不再阐述。
四、推荐模型的应用
在完成了训练之后,使用得到的参数值更新训练模型,用户给定一个查询时,首先使用子图同构发现所有的匹配,然后将该用户和每一个匹配生成一个用户-节点对,之后使用推荐模型计算该用户-节点对的偏好数值,将数值高的节点优先推荐给用户,从而达到个性化推荐的目的。
本发明在于构建一个基于用户特征的图数据查询推荐方法,使用传统的子图同构方法来回答用户的查询请求,并基于用户特征训练一个推荐模型,将查询请求中的结果进行排序。
本发明将用户属性和图中节点的属性作为输入,训练出一个基于用户特征的节点推荐模型,收集用户点击数据,即用户具体点击了查询结果中的哪些实体,作为训练数据。随后用机器学习模型,将用户节点和产品节点的原始属性映射到特征值空间,训练出一个推荐模型,即一个用户会不会“潜在的”对某个产品感兴趣。同时,我们也在用户节点之间建立相互的好友关系,推荐的时候,首先基于推荐模型生成针对本用户的推荐值,然后加上好友的推荐结果信息(用户之间的信任值作为权重,2个用户搜索的共同结果越多,权重越大),从而生成最终的查询推荐结果。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (7)

1.一种基于用户特征的图数据查询推荐方法,其特征在于,所述方法包括以下步骤:
一、用户给出查询,系统通过子图同构应答该查询并返回一组查询结果;
二、在训练节点,系统将查询结果发送给用户选择,收集用户点击的产品,生成包含用户-产品对的训练数据;
三、机器学习模型基于此训练数据训练出一个新的模型,即一组新的参数;
四、在应用阶段,该模型将查询结果进行排序,并将排序后的结果发送给用户作为查询结果。
2.根据权利要求1所述的一种基于用户特征的图数据查询推荐方法,其特征在于,所述图数据G被表现为一个三元组G=(V,E,F),V是一组节点,E是一组连接节点的边,
Figure FDA0002905039790000011
每个节点或边拥有一组属性及对应的属性值;图查询为一个小的子图,节点和边的数量均小于10个节点,图查询被定义为G’=(V’,E’,F’),包含一组节点V’、边E’和属性F’,给了一个图查询之后,采用子图同构的方法来回答该查询,即找到G中所有与该子图匹配的子图。
3.根据权利要求2所述的一种基于用户特征的图数据查询推荐方法,其特征在于,所述子图同构被定义为一个节点对应关系,即V与V’中节点的对应。
4.根据权利要求1所述的一种基于用户特征的图数据查询推荐方法,其特征在于,所述查询推荐模型在机器学习中的神经网络理论中定义,该模型的输入是一个用户和一个节点的特征向量,输出是一个0-1之间的数值,用以表现该用户对该节点的偏好程度。
5.根据权利要求4所述的一种基于用户特征的图数据查询推荐方法,其特征在于,所述特征向量对于用户或者某个节点来说,需要使用其属性及值来计算得到特征向量,特征向量为1个n-元组<x1,x2…xn>,其中每个向量xi表示一个特征的值。
6.根据权利要求1所述的一种基于用户特征的图数据查询推荐方法,其特征在于,给定一个用户u和一个节点v,其所述特征向量分别是h(u)和h(v),模型的目的是生成一个函数f(u,v),模型中包括多个神经节点,每个神经节点是一个特征向量的值,每个神经节点和它下一层的所有神经节点之间都有一条边,这条边上有一个权重w,那么中间层每个隐藏节点的值,都是由其上一层的所有节点和对应边上的权重所决定的,即
A[l]=g(W[l]A[l-1]+b[l])
其中g是tanh函数
Figure FDA0002905039790000021
它将任意实数的值转换到0-1之间,因而保证了所有的隐藏节点和输出节点的值都在0-1中间。
7.根据权利要求1所述的一种基于用户特征的图数据查询推荐方法,其特征在于,所述步骤三中的训练数据D是一个三元组的集合,每个三元组是<u,v,xuv>,其中u是用户,v是某个在查询结果中的节点,xuv=1,如果该用户在训练过程中选择了该节点,否则xuv=0;
假设需要训练的参数为W,那么目标函数的定义为:
Figure FDA0002905039790000022
训练的目的是最小化函数J(W)的值,因为W有无数种可能的值,采用反向传播算法来计算W的最优值。
CN202110068350.1A 2021-01-19 2021-01-19 一种基于用户特征的图数据查询推荐方法 Withdrawn CN112765413A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110068350.1A CN112765413A (zh) 2021-01-19 2021-01-19 一种基于用户特征的图数据查询推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110068350.1A CN112765413A (zh) 2021-01-19 2021-01-19 一种基于用户特征的图数据查询推荐方法

Publications (1)

Publication Number Publication Date
CN112765413A true CN112765413A (zh) 2021-05-07

Family

ID=75703076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110068350.1A Withdrawn CN112765413A (zh) 2021-01-19 2021-01-19 一种基于用户特征的图数据查询推荐方法

Country Status (1)

Country Link
CN (1) CN112765413A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656678A (zh) * 2021-10-19 2021-11-16 杭州电子科技大学 一种基于近邻图的多模态搜索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656678A (zh) * 2021-10-19 2021-11-16 杭州电子科技大学 一种基于近邻图的多模态搜索方法

Similar Documents

Publication Publication Date Title
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN110275964B (zh) 基于知识图谱与循环神经网络的推荐模型
CN112989064B (zh) 一种聚合知识图神经网络和自适应注意力的推荐方法
CN109785062B (zh) 一种基于协同过滤模型的混合神经网络推荐系统
CN112232925A (zh) 一种融合知识图谱对商品进行个性化推荐的方法
CN112613602A (zh) 基于知识感知超图神经网络的推荐方法及系统
Park et al. A comparative study of matrix factorization and random walk with restart in recommender systems
CN106411572B (zh) 一种结合节点信息和网络结构的社区发现方法
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
CN110175286A (zh) 结合成对优化和矩阵分解的产品推荐方法及系统
CN113807422A (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN113918833A (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN112131261A (zh) 基于社区网络的社区查询方法、装置和计算机设备
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN116166875A (zh) 基于元路径增强的异质图神经网络的双向跨域推荐方法
CN113918834A (zh) 融合社交关系的图卷积协同过滤推荐方法
CN115329215A (zh) 异构网络中基于自适应动态知识图谱的推荐方法及系统
CN115374288A (zh) 一种基于知识图谱与注意力机制的推荐方法
CN112861017A (zh) 一种基于图卷积的神经协同过滤的信息推荐方法
CN113849725B (zh) 一种基于图注意力对抗网络的社会化推荐方法及系统
CN112765413A (zh) 一种基于用户特征的图数据查询推荐方法
CN117495511A (zh) 一种基于对比学习和社区感知的商品推荐系统及方法
Hao et al. Enhancing cross domain recommendation with domain dependent tags
CN118246939A (zh) 一种基于注意力机制的DeepFM模型浏览数据处理的方法及系统
CN114611013A (zh) 基于用户兴趣和评分偏好差异自适应结合的协同过滤推荐算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220117

Address after: 230000 big data Industrial Demonstration Park, building D9, Zhong'an Chuang Valley, high tech Zone, Hefei, Anhui Province

Applicant after: Song Qi

Address before: 230088 station 3009, Hefei international talent City, floor 3, zone B, building G3, phase II, innovation industrial park, high tech Zone, Hefei, Anhui Province

Applicant before: Hefei Hongqi Technology Co.,Ltd.

WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210507