CN106991592B - 一种基于购买用户行为分析的个性化推荐方法 - Google Patents
一种基于购买用户行为分析的个性化推荐方法 Download PDFInfo
- Publication number
- CN106991592B CN106991592B CN201710172596.7A CN201710172596A CN106991592B CN 106991592 B CN106991592 B CN 106991592B CN 201710172596 A CN201710172596 A CN 201710172596A CN 106991592 B CN106991592 B CN 106991592B
- Authority
- CN
- China
- Prior art keywords
- product
- user
- item
- purchasing
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于购买用户行为分析的个性化推荐方法,首先通过基于修正PageRank方法计算出的产品权值,然后生成每个购买用户的兴趣模式特征向量。对每个用户兴趣模式的权值进行规范化处理,即采用每个用户最大频次去除其向量每一个频次值的方法进行规范化处理;对每两个用户兴趣模式特征向量求取最终的用户相似度;在个性化推荐环节上对于目标用户得到最为相似的其他用户序列。本发明改变了传统推荐方法中只考虑用户与产品的兴趣关联度的做法,增加产品本身质量的识别,以此改进推荐系统的效果。
Description
技术领域
本发明属于基于大数据的个性化推荐技术领域,具体涉及一种基于购买用户行为分析的个性化推荐方法。
背景技术
互联网技术的迅速发展导致大众获得的信息呈爆炸式增长的局面。信息过快增长会降低信息的使用率,也就是所谓的“信息超载”。个性化推荐是当前研究的热门领域,它可以在大量冗余信息中找到贴合用户需求的信息,因此,可以很好地提升用户体验,从而提升企业营销。通过相关的机器学习及数据挖掘技术,推荐系统挖掘用户的购买倾向,将用户可能感兴趣的物品推荐给用户。一个良好的推荐系统可以挖掘出用户潜在的消费偏好,为不同的用户提供针对性的服务。
已有的基于用户或者物品的个性化推荐方法,其精度对用户数量、物品数量以及评价矩阵稀疏性具有依赖性,实践证明预测的精度很难让人满意。一般的网络建立方法都是从很多推荐客体关系中抽取出所需的相关性链接。如按照用户购买产品的先后次序,或者按照根据购买此产品用户之间的社交网络关系,据此建立产品之间的链接关系得到相关性链接网络图。这种产品相关性链接图应该是一个典型的网络结构,从实验分析来看,它也具有复杂网络的典型特点。值得说明的是,产品相关性链接图有很多生成方法,传统方法往往通过共同购买关系来构造,比如利用产品购买相关度计算的产品质量测度方法。可以认为对于同一用户而言,产品Item1如果能经常在购买过产品Item2后一个时间范围内被购买,则产品Item1和产品Item2就具有一定的产品购买相关性。该方法可以避免传统方法中认为购买量较高产品往往具有较高链入节点的特点,相反,只有具有较多产品购买相关性的产品才能形成较高的链入节点或者链出节点。从购买用户行为的角度来分析,可以认为用户在连续购买行为中,随着不断地了解所购商品的内容,更易于在后续的购买行为中购买到与产品内容相关的更为合适的相关产品资源。因此,该方法所获得的优质推荐产品往往在内容上更符合用户的预期兴趣特征,从而为个性化推荐服务提供了良好的推荐客体资源。
在复杂网络结构中使用迭代计算方法可以得到权值收敛后的节点信息,如PageRank方法等。PageRank是Google专有的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度,由Larry Page和Sergey Brin在20世纪90年代后期发明。PageRank实现了将链接价值概念作为排名因素,然而这些传统方法在分配节点权值和权值扩散策略选择上,并没有考虑到特定应用领域中的特点。
发明内容
本发明要解决的技术问题是针对现有利用产品购买相关度计算的产品质量测度方法的不足,提出一种产品质量测度依据和用户相似度测度依据,以提高推荐系统的效果。
为实现上述目的,本发明提出的技术方案为一种基于购买用户行为分析的个性化推荐方法,包含以下步骤:
S1:通过以下方式计算产品权值:
Value为基于修正PageRank方法计算出的产品权值,F(Itemi)集合表示产品Itemi在产品相关性链接关系图中所有链入产品的集合,NF(Itemi)表示该链入产品集合的产品数量,Counti,j表示对应产品Itemi和Itemj之间链接关系的数量;
S2:得到每个购买用户的兴趣模式特征向量:Useri={(产品购买相关性链接j,频次j)}(1<=j<=n,n为产品购买相关性链接总数量);
S3:对每个用户兴趣模式的频次进行规范化处理;
S4:对每两个用户兴趣模式特征向量求取最终的用户相似度;
S5:在个性化推荐环节上,首先对于目标用户,得到最为相似的其他用户序列。
进一步,上述步骤3中所述规范化处理是采用每个用户最大频次去除其向量每一个频次值的方法进行规范化处理。
进一步,上述步骤4中求取最终的用户相似度可以采用皮尔逊系数或者余弦夹角系数方法。
进一步,上述步骤5中个性化推荐环节可以选择长期兴趣推荐和短期兴趣即时推荐。
上述长期兴趣推荐又包含以下步骤:
1、根据目标用户所有的购买情况,获取相关购买产品信息;
2、据此得到最为相似的其他用户序列中,汇总得到推荐产品列表;
3、按照产品权值,倒序输出推荐产品列表。
上述短期兴趣即时推荐包含以下步骤:
1、根据最近n次目标用户的购买情况获取相关购买产品的类别信息;
2、据此得到最为相似的其他用户序列中,按照最近一次购买情况,汇总得到推荐产品列表;
3、按照优质产品识别标准,倒序输出即时推荐产品列表。
与现有技术相比,本发明的有益效果在于:
1,本发明改变了传统推荐方法中只考虑用户与产品的兴趣关联度的做法,增加产品本身质量的识别,以此改进推荐系统的效果。
2,本发明结合用户购买产品的历史信息记录弥补单纯使用文本语义和协同过滤方法的不足。
3,本发明产品质量识别为线下计算,不影响线上计算性能,因此最终的推荐计算性能较为理想。
附图说明
图1为本发明的方法流程图。
具体实施方式
现结合附图对本发明作进一步详细的说明。
如图1所示,本发明的方法流程依次包含计算产品权值、生成用户兴趣模式特征向量、对权值进行规范化处理、求取最终的用户相似度和得到最为相似的其他用户序列。
鉴于产品购买相关性是建立在具有一定出现频次的这个重要前提上,不管是对于单一用户而言,还是对于所有用户而言,经常出现的产品相关性链接关系能够更能说明相关链出和链入产品节点的购买相关性。按照这个设计原则,需要对传统网络节点迭代算法进行必要的修正。
在标准PageRank方法的基础上,本发明提出的算法思路如:
这里,Value表示基于修正PageRank方法的产品权值,F(Itemi)集合表示产品Itemi在产品相关性链接关系图中所有链入产品的集合,NF(Itemi)表示该链入产品集合的产品数量。Counti,j表示对应产品Itemi和Itemj之间链接关系的数量,通过该系数放大每个链入产品权值的影响程度,据此反映经常出现的产品相关性链接关系更能说明相关链出和链入产品节点的购买相关性。Itemi和Itemj并非一定是不同的产品。相反,这种连续购买同一产品的行为也更能反映该产品的质量和兴趣相关度,保留此类链接关系有助于发掘高质量的产品。
以所有产品购买相关性链接为向量单元,频次信息作为向量单元值,就可以得到每个购买用户的兴趣特征向量。如对于每个用户i,都可以得到的用户兴趣模式为:
Useri={(产品购买相关性链接j,频次j)}(1<=j<=n,n为产品购买相关性链接总数量)
具体的用户相似度计算方法可以采用皮尔逊系数或者余弦夹角系数等,最终可以得到每位用户与其他相关用户的相似度。由于用户数量和产品相关性链接数量众多,在实际计算中,可以通过设定用户具有相同产品相关性链接的数量阈值来限定比较范围。
首先对每个用户兴趣模式的权值进行规范化处理,为避免单个用户频次绝对数量的影响,采用每个用户最大频次去除其向量每一个频次值的方法进行规范化处理。然后,对每两个用户兴趣模式向量采用余弦夹角系数得到最终的用户相似度。
在个性化推荐环节上,首先对于目标用户,得到最为相似的其他用户序列,在实际计算中,可以设定相似度阈值来控制该序列的大小。同时可以设计两种具有不同服务目标的个性化产品推荐服务形式:
1)长期兴趣推荐
根据目标用户所有的购买情况,获取相关购买产品信息,据此到最为相似的其他用户序列中,汇总得到推荐产品列表,并按照前述的优质产品识别标准,倒序输出推荐产品列表。该种推荐形式主要面向用户的长期兴趣特征,所推荐的内容具有一定的稳定性和用户关联性。
2)短期兴趣的即时推荐
根据最近n次目标用户的购买情况(n可以根据实验数据情况选择,如2次或者3次等),获取相关购买产品的类别信息,据此到最为相似的其他用户序列中,按照最近一次购买情况,汇总得到推荐产品列表,并按照前述的优质产品识别标准,倒序输出即时推荐产品列表。该种推荐形式主要面向用户的短期兴趣特征,所推荐的内容具有强的时效性。
以上所述并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于购买用户行为分析的个性化推荐方法,其特征在于包含以下步骤:
S1:通过以下方式计算产品权值:
c为衰减系数,Vij表示产品Itemi在产品购买相关性链接关系图中所有链入产品集合中的每一个产品元素,Value(Itemij)是产品Itemij利用上述公式计算得到的Value数值,Value为基于修正PageRank方法计算出的产品权值,F(Itemi)集合表示产品Itemi在产品购买相关性链接关系图中所有链入产品的集合,NF(Itemi)表示该链入产品集合的产品数量,Counti,j表示对应产品Itemi和Itemj之间链接关系的数量;对于同一用户而言,产品Item1如果能经常在购买过产品Item2后一个时间范围内被购买,则产品Item1和产品Item2就具有产品购买相关性,据此建立产品之间的购买相关性链接;
S2:生成每个购买用户的兴趣模式特征向量:Useri={(产品购买相关性链接j,频次j)}(1<=j<=n,n为产品购买相关性链接总数量);
S3:对每个用户兴趣模式的频次采用每个用户最大频次去除其向量每一个频次值的方法进行规范化处理;
S4:对每两个用户兴趣模式特征向量利用皮尔逊系数或者余弦夹角系数方法求取最终的用户相似度;
S5:在个性化推荐环节,根据步骤S1生成的产品权值形成优质产品识别标准,倒序输出推荐产品列表选择长期兴趣推荐和短期兴趣即时推荐对于目标用户得到最为相似的其他用户序列。
2.根据权利要求1所述的基于购买用户行为分析的个性化推荐方法,其特征在于所述长期兴趣推荐包含以下步骤:
2.1、根据目标用户所有的购买情况,获取相关购买产品信息;
2.2、据此得到最为相似的其他用户序列中,汇总得到推荐产品列表;
2.3、按照优质产品识别标准,倒序输出推荐产品列表。
3.根据权利要求1所述的基于购买用户行为分析的个性化推荐方法,其特征在于所述短期兴趣即时推荐包含以下步骤:
3.1、根据最近n次目标用户的购买情况获取相关购买产品的类别信息;
3.2、据此得到最为相似的其他用户序列中,按照最近一次购买情况,汇总得到推荐产品列表;
3.3、按照优质产品识别标准,倒序输出即时推荐产品列表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710172596.7A CN106991592B (zh) | 2017-03-22 | 2017-03-22 | 一种基于购买用户行为分析的个性化推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710172596.7A CN106991592B (zh) | 2017-03-22 | 2017-03-22 | 一种基于购买用户行为分析的个性化推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106991592A CN106991592A (zh) | 2017-07-28 |
CN106991592B true CN106991592B (zh) | 2021-01-01 |
Family
ID=59411706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710172596.7A Expired - Fee Related CN106991592B (zh) | 2017-03-22 | 2017-03-22 | 一种基于购买用户行为分析的个性化推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106991592B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020098163A1 (zh) * | 2018-11-12 | 2020-05-22 | 平安科技(深圳)有限公司 | 产品数据推送方法及装置、计算机非易失性可读存储介质 |
CN110210905A (zh) * | 2019-05-31 | 2019-09-06 | 拉扎斯网络科技(上海)有限公司 | 特征相似度计算方法、装置、电子设备及计算机存储介质 |
CN110270093B (zh) * | 2019-07-04 | 2023-05-09 | 珠海西山居数字科技有限公司 | 一种智能导购方法、装置、计算设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398814B (zh) * | 2007-09-26 | 2010-08-25 | 北京大学 | 一种同时抽取文档摘要和关键词的方法及系统 |
US9208776B2 (en) * | 2009-10-05 | 2015-12-08 | At&T Intellectual Property I, L.P. | System and method for speech-enabled access to media content by a ranked normalized weighted graph |
JP6005583B2 (ja) * | 2013-05-23 | 2016-10-12 | 日本電信電話株式会社 | 検索装置、検索方法および検索プログラム |
CN104391982B (zh) * | 2014-12-08 | 2018-07-20 | 畅捷通信息技术股份有限公司 | 信息推荐方法和信息推荐系统 |
CN106327227A (zh) * | 2015-06-19 | 2017-01-11 | 北京航天在线网络科技有限公司 | 一种信息推荐系统及信息推荐方法 |
-
2017
- 2017-03-22 CN CN201710172596.7A patent/CN106991592B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN106991592A (zh) | 2017-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101641697B (zh) | 对网页的相关搜索查询及其应用 | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
CN103886001A (zh) | 一种个性化商品推荐系统 | |
KR20140091530A (ko) | 소셜 네트워크 피쳐들을 갖는 이름 및 기타 검색 질의의 적합도 | |
CN102902691A (zh) | 推荐方法及系统 | |
CN110175895B (zh) | 一种物品推荐方法及装置 | |
US20140288999A1 (en) | Social character recognition (scr) system | |
CN106991592B (zh) | 一种基于购买用户行为分析的个性化推荐方法 | |
US20100121844A1 (en) | Image relevance by identifying experts | |
CN105894310A (zh) | 一种个性化推荐方法 | |
Ben-Shimon et al. | An ensemble method for top-N recommendations from the SVD | |
Babu et al. | An implementation of the user-based collaborative filtering algorithm | |
CN116362811A (zh) | 一种基于大数据的广告自动化投放管理系统 | |
CN110083766B (zh) | 一种基于元路径引导嵌入的查询推荐方法及装置 | |
Zhao et al. | Personalized recommendation by exploring social users’ behaviors | |
CN110765346A (zh) | 用户意图挖掘方法、装置以及设备 | |
CN112541806A (zh) | 一种基于异质信息网络的推荐方法及装置 | |
WO2020150163A1 (en) | Encoding textual data for personalized inventory management | |
Wang et al. | Incremental collaborative filtering considering temporal effects | |
Agagu et al. | Context-aware recommendation methods | |
CN112307343B (zh) | 基于双层迭代补偿和全貌表示的跨电商书城用户对齐方法 | |
Regi et al. | A survey on recommendation techniques in E-Commerce | |
Hooda et al. | Social commerce hybrid product recommender | |
CN113034231A (zh) | 一种基于SaaS云服务的多供应链商品智能推荐系统及方法 | |
CN110083773B (zh) | 个性化知识推荐方法及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210101 |
|
CF01 | Termination of patent right due to non-payment of annual fee |