CN113806633A - 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法 - Google Patents

融入用户画像与社交关系相似度的数字商务智能跨域推荐方法 Download PDF

Info

Publication number
CN113806633A
CN113806633A CN202110994949.8A CN202110994949A CN113806633A CN 113806633 A CN113806633 A CN 113806633A CN 202110994949 A CN202110994949 A CN 202110994949A CN 113806633 A CN113806633 A CN 113806633A
Authority
CN
China
Prior art keywords
user
similarity
domain
social
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110994949.8A
Other languages
English (en)
Inventor
郭飞鹏
周伟
卢琦蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN202110994949.8A priority Critical patent/CN113806633A/zh
Publication of CN113806633A publication Critical patent/CN113806633A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

融入用户画像与社交关系相似度的数字商务智能跨域推荐方法。首先,该方法采用0‑1标量,融入用户年龄、性别及项目偏好等,构建用户画像向量,并以此计算用户画像的相似度;其次,该方法通过改进共同邻居算法,融入一阶与二阶邻居来计算用户社交关系相似度;在此基础上,融合用户画像相似度和用户社交关系相似度,将评分矩阵进行分解,对涉及参数利用概率图模型进行表征,并利用交替最小二乘法对得出的目标函数进行参数学习,最终利用优化后的参数进行评分预测。整个推荐过程充分利用了用户基本信息、偏好程度、社交关系等,有助于解决已有跨域推荐的冷启动、稀疏性等问题,且使得推荐结果更精准和多样化。

Description

融入用户画像与社交关系相似度的数字商务智能跨域推荐 方法
技术领域
本发明涉及一种数字商务智能跨域推荐方法,适用于大数据环境下社交网络与数字商务间的跨域推荐。
技术背景
随着5G、人工智能、大数据等新型基础设施的快速推进,数字商务服务在社会经济中全面渗透,满足了用户对电商、社交等跨域活动中商品或者服务的多样化需求。然而,通过移动终端、传感器、4G/5G等在数字商务中以内容产生、直播交互、社交分享等方式贡献的跨域大数据却使用户淹没在“信息洪流”中。作为数字商务服务中“杀手锏”应用的智能推荐技术通过分析用户的偏好行为,针对每个用户的特点提供精准的个性化服务,能有效缓解“信息过载”带来的系列问题。但目前大多数推荐技术仅是适用于单领域,能获取的信息十分有限,往往只有用户的一部分记录,难以全面了解用户,进而使得推荐效果变得不可靠,准确度较低,由此跨领域推荐应运而生。
跨领域推荐技术能综合考虑用户在不同领域的相关信息,相对于单领域推荐,冷启动、稀疏性等问题有了明显的改善。不仅如此,跨领域推荐系统还能通过分析用户在不同领域的偏好,形成推荐结果更具有多样化的特点,突破信息茧房地困境,并使得其他领域的优质长尾内容可以推送至用户。然而,现有的短视频社交与数字商务间跨域推荐的相关技术较为欠缺,大都忽略了跨域链路中群体的相似度及用户间偏好的差异,使得推荐性能下降。因此,本发明从用户的基本信息、偏好及社交关系等方面出发,考虑在进行推荐时将用户画像和用户社交关系相似度融合,实现数字商务下满足用户精准化、多样化、个性化服务需求的跨领域推荐目标,且通过提升用户留存率,支持数字商务企业的可持续发展。
发明内容
为了解决现有技术中跨域推荐中冷启动、稀疏性等问题,缓解目前数字商务企业在现实应用中较少利用社交网络分析、智能跨域推荐等技术上的困境,本发明提供一种融入用户画像信息与社交网络关系结构,通过融合用户画像、社交关系相似度进行跨域推荐的方法。
本发明解决其技术问题所采用的技术方案是:
融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
1.融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
步骤1,计算数字商务(目标域)的用户画像相似度,考虑到用户画像中包含用户对项目类型的偏好程度以及用户的基本信息,本发明利用二进制(0,1)标量将上述信息进行融合,并计算用户画像的相似度。
输入:用户-项目评分矩阵,用户年龄、性别;
输出:用户画像相似度
Figure BDA0003233662170000031
具体包括:
步骤11:用户-项目评分矩阵之中,每个项目均具有特定的类型Gg。首先针对用户已评分的各项目中评分较高的项目类型,分别计算相对类型评分RGR,及修正的相对类型频率MRGF。在此基础上,获取用户对各类型项目的偏好程度UP(u,g)
Figure BDA0003233662170000032
Figure BDA0003233662170000033
Figure BDA0003233662170000034
其中,TR(u)是用户u对项目的评分之和,GR(u,g)是用户u对类型Gg高评分的集合(如1-5分的评分范围中,>=3即算高评分),Su是用户u评分的项目集,Si是用户u评分的项目个数,
Figure BDA0003233662170000035
Figure BDA0003233662170000036
s.t.k∈3,4,5,即若用户对项目的评分为k时则δk(r(u,s))取值为1,否则为0,nf为归一化因子,是各项系数平方和的平方根,即
Figure BDA0003233662170000037
步骤12:提取目标域中用户的年龄和性别信息,并利用二进制0-1标量对其进行向量化表示。本发明将年龄分段为(1-17,18-24,25-34,35-44,45-49,50-55,56+),用户年龄处于某个阶段则将其标为1,性别则将男标为1,女标为0。如(0,1,0,0,0,0,0,1)编码向量表示为用户年龄在18-24之间,性别为男;
步骤13:计算好上述两种信息后,将两个向量进行联合,得到用户画像向量Pk,以此计算出目标域中任意两个用户间的用户画像相似度:
Figure BDA0003233662170000041
步骤2,为了进一步提升跨域用户间相似度计算的可靠性,本发明融合社交网络(源域)和数字商务(目标域)的用户相似度。利用域间重叠用户的社交网络,计算用户社交关系相似度。为了提升社交网络中的用户关系相似度的准确性,本发明基于共同邻居相似度的链路预测算法,融入用户社交中的潜在关系,即用户的二阶邻居,提出基于一阶、二阶共同邻居用户社交关系相似度的链路预测算法;
输入:社交网络用户连接图G(V,E);
输出:用户社交关系相似度DICNij
具体包括:
步骤21:对比源域中与目标域重叠的用户z与用户i的连接关系,并赋予邻域向量Ni不同的值。具体包括:(1)用户z即用户i,Ni为di;(2)用户z为用户i的二阶邻居,Ni为CNiz;(3)用户z为用户i的一阶邻居,Ni为CNiz+1;(4)用户z与用户i既不是一阶邻居,也不是二阶邻居,邻域为0,由等式可表示为:
Figure BDA0003233662170000051
其中,di代表用户i的度,CNiz=|Γi∩Γz|代表一阶共同邻居相似度,Γk代表节点k的一阶邻居集合;
步骤22:为了评估用户i与用户j之间的相似度,它们的并集邻域集UNij计算为:
UNij={z|(Ni[z]>0)Or(Nj[z]>0)}#(6)
步骤23:利用皮尔逊相关系数计算用户间的二阶邻居相关性:
Figure BDA0003233662170000052
其中,
Figure BDA0003233662170000053
为邻域向量Ni的并集邻域集UNij的均值,可由下式得到:
Figure BDA0003233662170000054
步骤24:进一步融合一阶邻居与二阶邻居的相似度,计算源域中任意两个用户间的用户社交关系相似度:
DICNij=(1+CNij)(1+Corrij)#(9)
步骤3,将用户画像相似度、用户社交关系相似度进行加权融合,得到跨域中重叠用户的综合相似度,并建立概率图模型,运用概率矩阵分解,利用联合分布、条件分布、乘积规则等建立目标函数,以及交替最小二乘法对损失函数进行学习更新,最终完成跨域评分预测:
输入:用户画像相似度
Figure BDA0003233662170000061
与用户社交关系相似度DICNij,目标领域评分矩阵Rij
输出:预测用户评分矩阵
Figure BDA0003233662170000062
具体包括:
步骤31:将上述基于源域和目标域分别得到的用户社交关系相似度和用户画像相似度进行加权融合,得到用户综合相似度。其中α∈(0,1),为调谐参数,可针对不同数据集取不同的值,实现最优预测:
Figure BDA0003233662170000063
接着将目标域的评分矩阵R进行概率矩阵分解,得到用户潜在特征向量Ut,项目潜在特征向量Vt
Rij=Ut×Vt#(11)
步骤32:将各变量绘制成概率图模型,并利用图模型理论得到各变量的联合分布,接着忽略常数的先验概率,并在潜在变量加上对数后得到对数后验概率:
Figure BDA0003233662170000064
Figure BDA0003233662170000065
其中,
Figure BDA0003233662170000071
代表变量ζ的方差;
步骤33:依据独立同分布,分别得到评分矩阵R、用户综合相似度S的条件概率密度。对于用户、项目潜在特征向量,假设均服从正态分布,则有均值为0的球形高斯先验:
Figure BDA0003233662170000072
Figure BDA0003233662170000073
Figure BDA0003233662170000074
Figure BDA0003233662170000075
其中,
Figure BDA0003233662170000076
表示均值为μ,方差为
Figure BDA0003233662170000077
的正态分布;
Figure BDA0003233662170000078
是指标函数,若用户i在目标域中对项目j进行了评分,则其为1,否则为0。然后将上述公式代入式(13)可得:
Figure BDA0003233662170000079
Figure BDA00032336621700000710
其中,C是不依赖参数的常量,将式(18)采用对数似然估计后,得到代价函数如下;
Figure BDA0003233662170000081
步骤34:本发明假设各变量的方差相等,即
Figure BDA0003233662170000082
最大化式(19)的似然等价于最小化下述二次优化目标的函数:
Figure BDA0003233662170000083
其中,λUV是为了避免过拟合所设的恒定的折衷参数和惩罚参数的大小,λS同样是用来约束用户相似度影响的恒定的折衷参数。
接着对参数Ut、Vt进行损失函数求解,并分别求偏导,且令其为零,得到参数各自的梯度。
Figure BDA0003233662170000084
Figure BDA0003233662170000085
接着以此进行参数学习,直至收敛到局部最优。γ是目标函数的学习率。
Figure BDA0003233662170000086
步骤35:通过上述的计算,对目标函数中的2个参数Ut与Vt学习完毕后,依此进行评分矩阵预测:
Figure BDA0003233662170000091
与本发明融入用户画像与社交关系相似度的数字商务智能跨域推荐方法相关的定义如下:
定义1用户画像向量是用户的偏好和个体特征的表征,本发明综合考虑了用户的年龄与性别,以及用户对各类型项目的偏好信息。
定义2RGR(Relative Genre Ratings)考虑用户的评分高低,表示用户高评分频数与用户总评分频数的比值,MRGF(Modified Relative Genre Frequency)融入评分项目的类型,表示项目各类型的高评分频数与用户的评分频数的比值。
本发明的技术构思为:传统的跨域推荐往往未考虑用户社交关系的相似度,仅考虑用户基本信息、项目偏好的相似度,推荐精度不够准确。因此,本发明提出一种融入用户画像与社交关系相似度的数字商务智能跨域推荐方法。首先,该方法采用0-1标量,融入用户年龄、性别及项目偏好等,构建用户画像向量,并以此计算用户画像的相似度;其次,该方法通过改进共同邻居算法,融入一阶与二阶邻居来计算用户社交关系相似度;在此基础上,融合用户画像相似度和用户社交关系相似度,将评分矩阵进行分解,对涉及参数利用概率图模型进行表征,并利用交替最小二乘法对得出的目标函数进行参数学习,最终利用优化后的参数进行评分预测。整个推荐过程充分利用了用户基本信息、偏好程度、社交关系,有助于解决已有跨域推荐的冷启动、稀疏性等问题,且使得推荐结果更精准和多样化。
本发明的有益效果在于:有效解决了跨域推荐的用户兴趣考虑不全问题,提升了个性化推荐的精准度,并在一定程度上解决了跨域推荐中的稀疏性、冷启动问题。本发明融合用户画像与社交关系相似度,将源域中的用户社交关系网络信息迁移至目标域中,在数字商务领域的跨域推荐中具有良好的实际应用价值。
附图说明
图1是本发明的流程图。
图2是本发明的跨域用户社交关系信息转移图。
图3是本发明方法所涉及各参数的概率图模型。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
1.融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
步骤1,计算数字商务(目标域)的用户画像相似度,考虑到用户画像中包含用户对项目类型的偏好程度以及用户的基本信息,本发明利用二进制(0,1)标量将上述信息进行融合,并计算用户画像的相似度。
输入:用户-项目评分矩阵,用户年龄、性别;
输出:用户画像相似度
Figure BDA0003233662170000111
具体包括:
步骤11:用户-项目评分矩阵之中,每个项目均具有特定的类型Gg。首先针对用户已评分的各项目中评分较高的项目类型,分别计算相对类型评分RGR,及修正的相对类型频率MRGF。在此基础上,获取用户对各类型项目的偏好程度UP(u,g)
Figure BDA0003233662170000112
Figure BDA0003233662170000113
Figure BDA0003233662170000114
其中,TR(u)是用户u对项目的评分之和,GR(u,g)是用户u对类型Gg高评分的集合(如1-5分的评分范围中,>=3即算高评分),Su是用户u评分的项目集,Si是用户u评分的项目个数,
Figure BDA0003233662170000115
Figure BDA0003233662170000116
s.t.k∈3,4,5,即若用户对项目的评分为k时则δk(r(u,s))取值为1,否则为0,nf为归一化因子,是各项系数平方和的平方根,即
Figure BDA0003233662170000117
步骤12:提取目标域中用户的年龄和性别信息,并利用二进制0-1标量对其进行向量化表示。本发明将年龄分段为(1-17,18-24,25-34,35-44,45-49,50-55,56+),用户年龄处于某个阶段则将其标为1,性别则将男标为1,女标为0。如(0,1,0,0,0,0,0,1)编码向量表示为用户年龄在18-24之间,性别为男;
步骤13:计算好上述两种信息后,将两个向量进行联合,得到用户画像向量Pk,以此计算出目标域中任意两个用户间的用户画像相似度:
Figure BDA0003233662170000121
步骤2,为了进一步提升跨域用户间相似度计算的可靠性,本发明融合社交网络(源域)和数字商务(目标域)的用户相似度。利用域间重叠用户的社交网络,计算用户社交关系相似度。为了提升社交网络中的用户关系相似度的准确性,本发明基于共同邻居相似度的链路预测算法,融入用户社交中的潜在关系,即用户的二阶邻居,提出基于一阶、二阶共同邻居用户社交关系相似度的链路预测算法;
具体包括:
输入:社交网络用户连接图G(V,E);
输出:用户社交关系相似度DICNij
步骤21:对比源域中与目标域重叠的用户z与用户i的连接关系,并赋予邻域向量Ni不同的值。具体包括:(1)用户z即用户i,Ni为di;(2)用户z为用户i的二阶邻居,Ni为CNiz;(3)用户z为用户i的一阶邻居,Ni为CNiz+1;(4)用户z与用户i既不是一阶邻居,也不是二阶邻居,邻域为0,由等式可表示为:
Figure BDA0003233662170000131
其中,di代表用户i的度,CNiz=|Γi∩Γz|代表一阶共同邻居相似度,Γk代表节点k的一阶邻居集合;
步骤22:为了评估用户i与用户j之间的相似度,它们的并集邻域集UNij计算为:
UNij={z|(Ni[z]>0)Or(Nj[z]>0)}#(6)
步骤23:利用皮尔逊相关系数计算用户间的二阶邻居相关性:
Figure BDA0003233662170000132
其中,
Figure BDA0003233662170000133
为邻域向量Ni的并集邻域集UNij的均值,可由下式得到:
Figure BDA0003233662170000134
步骤24:进一步融合一阶邻居与二阶邻居的相似度,计算源域中任意两个用户间的用户社交关系相似度:
DICNij=(1+CNij)(1+Corrij)#(90
步骤3,将用户画像相似度、用户社交关系相似度进行加权融合,得到跨域中重叠用户的综合相似度,并建立概率图模型,运用概率矩阵分解,利用联合分布、条件分布、乘积规则等建立目标函数,以及交替最小二乘法对损失函数进行学习更新,最终完成跨域评分预测:
输入:用户画像相似度
Figure BDA0003233662170000141
与用户社交关系相似度DICNij,目标领域评分矩阵Rij
输出:预测用户评分矩阵
Figure BDA0003233662170000142
具体包括:
步骤31:将上述基于源域和目标域分别得到的用户社交关系相似度和用户画像相似度进行加权融合,得到用户综合相似度。其中α∈(0,1),为调谐参数,可针对不同数据集取不同的值,实现最优预测:
Figure BDA0003233662170000143
接着将目标域的评分矩阵R进行概率矩阵分解,得到用户潜在特征向量Ut,项目潜在特征向量Vt
Rij=Ut×Vt#(11)
步骤32:将各变量绘制成概率图模型,并利用图模型理论得到各变量的联合分布,接着忽略常数的先验概率,并在潜在变量加上对数后得到对数后验概率:
Figure BDA0003233662170000151
Figure BDA0003233662170000152
其中,
Figure BDA0003233662170000153
代表变量ζ的方差;
步骤33:依据独立同分布,分别得到评分矩阵R、用户综合相似度S的条件概率密度。对于用户、项目潜在特征向量,假设均服从正态分布,则有均值为0的球形高斯先验:
Figure BDA0003233662170000154
Figure BDA0003233662170000155
Figure BDA0003233662170000156
Figure BDA0003233662170000157
其中,
Figure BDA0003233662170000158
表示均值为μ,方差为
Figure BDA0003233662170000159
的正态分布;
Figure BDA00032336621700001510
是指标函数,若用户i在目标域中对项目j进行了评分,则其为1,否则为0。然后将上述公式代入式(13)可得:
Figure BDA00032336621700001511
Figure BDA0003233662170000161
其中,C是不依赖参数的常量,将式(18)采用对数似然估计后,得到代价函数如下;
Figure BDA0003233662170000162
步骤34:本发明假设各变量的方差相等,即
Figure BDA0003233662170000163
最大化式(19)的似然等价于最小化下述二次优化目标的函数:
Figure BDA0003233662170000164
其中,λUV是为了避免过拟合所设的恒定的折衷参数和惩罚参数的大小,λS同样是用来约束用户相似度影响的恒定的折衷参数。
接着对参数Ut、Vt进行损失函数求解,并分别求偏导,且令其为零,得到参数各自的梯度。
Figure BDA0003233662170000165
Figure BDA0003233662170000166
接着以此进行参数学习,直至收敛到局部最优。γ是目标函数的学习率。
Figure BDA0003233662170000171
步骤35:通过上述的计算,对目标函数中的2个参数Ut与Vt学习完毕后,依此进行评分矩阵预测:
Figure BDA0003233662170000172
本发明适用于大数据环境下社交网络与数字商务间的跨域推荐,有利于解决用户或项目的冷启动、评分数据稀疏,以及信息茧房等问题。通过迁移社交网络(源域)中的用户社交关系,融合用户画像相似度与用户社交关系相似度,充分挖掘领域间重叠用户的偏好,提高数字商务(目标域)推荐结果的准确性和多样性,并可推广应用到数字金融产品推荐等数字经济相关领域。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (1)

1.融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
步骤1,计算数字商务(目标域)的用户画像相似度,考虑到用户画像中包含用户对项目类型的偏好程度以及用户的基本信息,利用二进制(0,1)标量将上述信息进行融合,并计算用户画像的相似度;
输入:用户项目评分矩阵,用户年龄、性别;
输出:用户画像相似度
Figure FDA0003233662160000015
具体包括:
步骤11:用户-项目评分矩阵之中,每个项目均具有特定的类型Gg;首先针对用户已评分的各项目中评分较高的项目类型,分别计算相对类型评分RGR,及修正的相对类型频率MRGF,在此基础上,获取用户对各类型项目的偏好程度UP(u,g)
Figure FDA0003233662160000011
Figure FDA0003233662160000012
Figure FDA0003233662160000013
其中,TR(u)是用户u对项目的评分之和,GR(u,g)是用户u对类型Gg高评分的集合(如1-5分的评分范围中,>=3即算高评分),Su是用户u评分的项目集,Si是用户u评分的项目个数,
Figure FDA0003233662160000014
Figure FDA0003233662160000021
即若用户对项目的评分为k时则δk(r(u,s))取值为1,否则为0,nf为归一化因子,是各项系数平方和的平方根,即
Figure FDA0003233662160000022
步骤12:提取目标域中用户的年龄和性别信息,并利用二进制0-1标量对其进行向量化表示;将年龄分段为(1-17,18-24,25-34,35-44,45-49,50-55,56+),用户年龄处于某个阶段则将其标为1,性别则将男标为1,女标为0;
步骤13:计算好上述两种信息后,将两个向量进行联合,得到用户画像向量Pk,以此计算出目标域中任意两个用户间的用户画像相似度:
Figure FDA0003233662160000023
步骤2,为了进一步提升跨域用户间相似度计算的可靠性,融合社交网络(源域)和数字商务(目标域)的用户相似度;利用域间重叠用户的社交网络,计算用户社交关系相似度;为了提升社交网络中的用户关系相似度的准确性,基于共同邻居相似度的链路预测算法,融入用户社交中的潜在关系,即用户的二阶邻居,提出基于一阶、二阶共同邻居用户社交关系相似度的链路预测算法;
输入:社交网络用户连接图G(V,E);
输出:用户社交关系相似度DICNij
具体包括:
步骤21:对比源域中与目标域重叠的用户z与用户i的连接关系,并赋予邻域向量Ni不同的值;具体包括:(1)用户z即用户i,Ni为di;(2)用户z为用户i的二阶邻居,Ni为CNiz;(3)用户z为用户i的一阶邻居,Ni为CNiz+1;(4)用户z与用户i既不是一阶邻居,也不是二阶邻居,邻域为0,由等式可表示为:
Figure FDA0003233662160000031
其中,di代表用户i的度,CNiz=|Γi∩Γz|代表一阶共同邻居相似度,Γk代表节点k的一阶邻居集合;
步骤22:为了评估用户i与用户j之间的相似度,它们的并集邻域集UNij计算为:
UNij={z|(Ni[z]>0)Or(Nj[z]>0)}# (6)
步骤23:利用皮尔逊相关系数计算用户间的二阶邻居相关性:
Figure FDA0003233662160000032
其中,
Figure FDA0003233662160000033
为邻域向量Ni的并集邻域集UNij的均值,可由下式得到:
Figure FDA0003233662160000034
步骤24:进一步融合一阶邻居与二阶邻居的相似度,计算源域中任意两个用户间的用户社交关系相似度:
DICNij=(1+CNij)(1+Corrij)# (9)
步骤3,将用户画像相似度、用户社交关系相似度进行加权融合,得到跨域中重叠用户的综合相似度,并建立概率图模型,运用概率矩阵分解,利用联合分布、条件分布、乘积规则等建立目标函数,以及交替最小二乘法对损失函数进行学习更新,最终完成跨域评分预测:
输入:用户画像相似度
Figure FDA0003233662160000043
与用户社交关系相似度DICNij,目标领域评分矩阵Rij
输出:预测用户评分矩阵
Figure FDA0003233662160000041
具体包括:
步骤31:将上述基于源域和目标域分别得到的用户社交关系相似度和用户画像相似度进行加权融合,得到用户综合相似度;其中α∈(0,1),为调谐参数,可针对不同数据集取不同的值,实现最优预测:
Figure FDA0003233662160000042
接着将目标域的评分矩阵R进行概率矩阵分解,得到用户潜在特征向量Ut,项目潜在特征向量Vt
Rij=Ut×Vt# (11)
步骤32:将各变量绘制成概率图模型,并利用图模型理论得到各变量的联合分布,然后,忽略常数的先验概率,并在潜在变量加上对数后得到对数后验概率:
Figure FDA0003233662160000051
Figure FDA0003233662160000052
其中,
Figure FDA0003233662160000053
代表变量ζ的方差;
步骤33:依据独立同分布,分别得到评分矩阵R、用户综合相似度S的条件概率密度;对于用户、项目潜在特征向量,假设均服从正态分布,则有均值为0的球形高斯先验:
Figure FDA0003233662160000054
Figure FDA0003233662160000055
Figure FDA0003233662160000056
Figure FDA0003233662160000057
其中,
Figure FDA0003233662160000058
表示均值为μ,方差为
Figure FDA0003233662160000059
的正态分布;
Figure FDA00032336621600000510
是指标函数,若用户i在目标域中对项目j进行了评分,则其为1,否则为0;然后将上述公式代入式(13)可得:
Figure FDA00032336621600000511
Figure FDA0003233662160000061
其中,C是不依赖参数的常量,将式(18)采用对数似然估计,得到代价函数如下;
Figure FDA0003233662160000062
步骤34:假设各变量的方差相等,即
Figure FDA0003233662160000063
最大化式(19)的似然等价于最小化下述二次优化目标的函数:
Figure FDA0003233662160000064
其中,λU,λV是为了避免过拟合所设的恒定的折衷参数和惩罚参数的大小,λS同样是用来约束用户相似度影响的恒定的折衷参数;
接着对参数Ut、Vt进行损失函数求解,并分别求偏导,且令其为零,得到参数各自的梯度;
Figure FDA0003233662160000065
Figure FDA0003233662160000066
接着以此进行参数学习,直至收敛到局部最优;γ是目标函数的学习率;
Figure FDA0003233662160000071
步骤35:通过上述的计算,对目标函数中的2个参数Ut与Vt学习完毕后,依此进行评分矩阵预测:
Figure FDA0003233662160000072
CN202110994949.8A 2021-08-27 2021-08-27 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法 Pending CN113806633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110994949.8A CN113806633A (zh) 2021-08-27 2021-08-27 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110994949.8A CN113806633A (zh) 2021-08-27 2021-08-27 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法

Publications (1)

Publication Number Publication Date
CN113806633A true CN113806633A (zh) 2021-12-17

Family

ID=78894209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110994949.8A Pending CN113806633A (zh) 2021-08-27 2021-08-27 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法

Country Status (1)

Country Link
CN (1) CN113806633A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155067A (zh) * 2022-02-10 2022-03-08 北京派瑞威行互联技术有限公司 一种用户画像的建立方法及系统
CN116452304A (zh) * 2023-06-16 2023-07-18 深圳迅销科技股份有限公司 一种跨领域绿色消费场景整合与优惠推荐方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155067A (zh) * 2022-02-10 2022-03-08 北京派瑞威行互联技术有限公司 一种用户画像的建立方法及系统
CN116452304A (zh) * 2023-06-16 2023-07-18 深圳迅销科技股份有限公司 一种跨领域绿色消费场景整合与优惠推荐方法
CN116452304B (zh) * 2023-06-16 2023-09-01 深圳迅销科技股份有限公司 一种跨领域绿色消费场景整合与优惠推荐方法

Similar Documents

Publication Publication Date Title
Darban et al. GHRS: Graph-based hybrid recommendation system with application to movie recommendation
CN111859166B (zh) 一种基于改进的图卷积神经网络的物品评分预测方法
CN111949865A (zh) 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN112364976B (zh) 基于会话推荐系统的用户偏好预测方法
CN113806633A (zh) 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法
CN112950324A (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
Li et al. Content-based filtering recommendation algorithm using HMM
US20230206076A1 (en) Graph structure aware incremental learning for recommender system
CN115618108A (zh) 新零售模式下基于知识图谱的卷烟品牌推荐方法
CN112948625A (zh) 一种基于属性异质信息网络嵌入的电影推荐方法
CN113536105A (zh) 推荐模型训练方法和装置
CN111681084A (zh) 一种基于社交关系影响因素的电商平台推荐方法
CN109857928B (zh) 基于多元信用评估的用户偏好预测方法
Huang et al. Accurate Item Recommendation Algorithm of itemrank based on tag and context information
CN115238191A (zh) 对象推荐方法以及装置
CN115269977A (zh) 一种基于图神经网络的融合知识与协同信息的推荐方法
CN114997476A (zh) 一种融合商品关联关系的商品预测方法
CN113051468B (zh) 一种基于知识图谱和强化学习的电影推荐方法及系统
CN111967946B (zh) 一种基于面向用户多关系信息网络的商品推荐方法及系统
CN112199550B (zh) 一种基于情感胶囊网络的短视频点击率预测方法
CN113744023B (zh) 一种基于图卷积网络的双通道协同过滤推荐方法
CN116541592A (zh) 向量生成方法、信息推荐方法、装置、设备及介质
CN116304332A (zh) 一种知识图谱混合推荐方法
Chae et al. Adversarial training of deep autoencoders towards recommendation tasks
Sun et al. Research of Personalized Recommendation Algorithm Based on Trust and User's Interest

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination