CN105512919A - 基于时间与区域粒度的农资协同过滤算法 - Google Patents
基于时间与区域粒度的农资协同过滤算法 Download PDFInfo
- Publication number
- CN105512919A CN105512919A CN201610098741.7A CN201610098741A CN105512919A CN 105512919 A CN105512919 A CN 105512919A CN 201610098741 A CN201610098741 A CN 201610098741A CN 105512919 A CN105512919 A CN 105512919A
- Authority
- CN
- China
- Prior art keywords
- user
- time
- region granularity
- represent
- granularity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0253—During e-commerce, i.e. online transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于时间与区域粒度的农资协同过滤算法,包括步骤:通过已有的农业统计规律调研结果建立时间与地域粒度矩阵;进行用户行为数据采集;将采集来的用户行为数据按照时间与区域粒度矩阵划分;建立用户所在时间与区域粒度的用户商品评分矩阵;根据用户商品评分矩阵计算用户相似度;找到最相似的N个用户,基于N个最相似的用户的兴趣给当前用户进行推荐。与传统基于用户的协同过滤算法相比,本算法解决了协同过滤算法在农资领域预测准确度较低和相似度计算时用户商品评分矩阵过于庞大的缺陷。
Description
技术领域
本发明涉及人工智能领域的个性化服务技术,具体来说是一种基于时间与区域粒度的农资协同过滤算法。
背景技术
在现在电子商务中往往使用个性化服务技术,来挖掘用户潜在需求,提高用户使用体验。协同过滤算法是个性化服务技术中应用最成功最广泛的算法之一,协同过滤算法是根据某顾客以往的购买行为以及从具有相似购买行为的顾客群的购买行为去推荐这个顾客其“可能喜欢的品项”,也就是借由社群的喜好提供个人化的资讯、商品等的推荐服务。在用户个性化需求挖掘中,需找用户相似群体的用户相似度计算方法成为重中之重。如何更真实的找到和目标用户相似的用户成为学术界的一个研究热点。
发明内容
本发明的目的是为了解决现有协同过滤算法在农资领域预测准确度较低和相似度计算时用户商品评分矩阵过于庞大的缺陷,提供了一种基于时间与区域粒度的农资协同过滤算法。本发明采用的技术方案是:
一种基于时间与区域粒度的农资协同过滤算法,包括下述步骤:
步骤S1,通过已有的农业统计规律调研结果建立时间与地域粒度矩阵Am*n;
步骤S2,进行K个年度的用户行为数据采集,将采集来的用户行为数据按照数据年份划分为K份,对每份数据再按照时间与地域粒度划分为m*n粒度;
步骤S3,根据划分后的数据建立K个年度的用户所在时间与区域粒度的用户商品评分矩阵;
步骤S4,分别对K个矩阵的用户相似度进行计算,将K个年度的用户商品评分矩阵得到的用户相似度加权后求和得到基于时间与区域粒度的用户相似度;找到和目标用户最相似的N个用户;
步骤S5,基于N个最相似的用户的兴趣给当前目标用户进行推荐。
进一步地,步骤S4中具体包括:分别对K个矩阵的用户相似度进行计算,加权后求和得到基于时间与区域粒度的用户相似度TA-S(a,b),计算公式如公式(1)和(2)所示:
其中,K表示实验数据所选用的年数(K∈[1,3]),λi表示年度权重值λ∈(0,1),且与K值成反比;分别表示用户a,用户b的评分平均值,rai表示用户a对物品i的评分,rbi表示用户b对物品i的评分;
进一步地,步骤S5中,基于N个最相似的用户的兴趣给当前目标用户进行推荐,推荐算法公式如公式(3)所示:
其中I(a,i)表示用户a对物品i的预测评分值,分别表示用户a,用户b的评分平均值,rbi表示用户b对物品i的评分,KNSa表示用户a的近邻集合。
本发明的优点:本发明提供的基于时间与区域粒度的农资协同过滤算法,与现有技术相比,引入了时间与区域粒度的概念。该方法通过对用户不同年度同一时间粒度的用户相似度加权求和得到新的用户相似度,能够更贴切真实的反映农资领域的用户的相似度。在评分预测的准确性上有所提高。
附图说明
图1为本发明的算法流程图。
图2为本发明与现有算法性能对比图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
基于时间与区域粒度的农资协同过滤算法,包括下述步骤:
步骤S1,时间与区域粒度划分,根据农业规律,将全国全年的数据划分为M*N个粒度;也就是通过已有的农业统计规律调研结果建立时间与地域粒度矩阵Am*n;
步骤S2,进行K个年度的用户行为数据采集,将采集来的用户行为数据按照数据年份划分为K份,对每份数据再按照时间与地域粒度划分为m*n粒度;这样就可以将采集来的用户行为数据按照年度与时间与区域粒度矩阵划分为K*m*n个粒度;
步骤S3,根据划分后的数据建立K个年度的用户所在时间与区域粒度的用户商品评分矩阵;
步骤S4,分别对K个矩阵的用户相似度进行计算,加权后求和得到基于时间与区域粒度的用户相似度TA-S(a,b),计算公式如公式(1)和(2)所示:
其中,K表示实验数据所选用的年数(K∈[1,3]),λi表示年度权重值λ∈(0,1),且与K值成反比;分别表示用户a,用户b的评分平均值,rai表示用户a对物品i的评分,rbi表示用户b对物品i的评分;
然后找到和目标用户最相似的N个用户;
步骤S5中,基于N个最相似的用户的兴趣给当前目标用户进行推荐,推荐算法公式如公式(3)所示:
其中I(a,i)表示用户a对物品i的预测评分值,分别表示用户a,用户b的评分平均值,rbi表示用户b对物品i的评分,KNSa表示用户a的近邻集合。
预测目标用户对物品的评分值(根据公式三计算),然后将预测评分值最高的几个物品推荐给目标用户。
在针对本算法的实验过程中,本文选用某省2013年1月到2016年1月,328个用户对150个农资物品(包括农药,种子种苗,肥料,农膜,中小农具等)所产生的8167条交易与评价数据,评分值范围为1—5。实验中随机选用整个实验数据集的80%作为训练集,剩余的作为测试集。与传统基于用户的协同过滤算法性能对比如图2所示。图2中的纵坐标为用户对物品的预测评分和真实评分的RMSE(均方根误差)指标,越小代表性能越好。
Claims (3)
1.一种基于时间与区域粒度的农资协同过滤算法,其特征在于,包括下述步骤:
步骤S1,通过已有的农业统计规律调研结果建立时间与地域粒度矩阵Am*n;
步骤S2,进行K个年度的用户行为数据采集,将采集来的用户行为数据按照数据年份划分为K份,对每份数据再按照时间与地域粒度划分为m*n粒度;
步骤S3,根据划分后的数据建立K个年度的用户所在时间与区域粒度的用户商品评分矩阵;
步骤S4,分别对K个矩阵的用户相似度进行计算,将K个年度的用户商品评分矩阵得到的用户相似度加权后求和得到基于时间与区域粒度的用户相似度;找到和目标用户最相似的N个用户;
步骤S5,基于N个最相似的用户的兴趣给当前目标用户进行推荐。
2.如权利要求1所述的基于时间与区域粒度的农资协同过滤算法,其特征在于;
步骤S4中具体包括:分别对K个矩阵的用户相似度进行计算,加权后求和得到基于时间与区域粒度的用户相似度TA-S(a,b),计算公式如公式(1)和(2)所示:
其中,K表示实验数据所选用的年数(K∈[1,3]),λi表示年度权重值λ∈(0,1),且与K值成反比;分别表示用户a,用户b的评分平均值,rai表示用户a对物品i的评分,rbi表示用户b对物品i的评分。
3.如权利要求2所述的基于时间与区域粒度的农资协同过滤算法,其特征在于;
步骤S5中,基于N个最相似的用户的兴趣给当前目标用户进行推荐,推荐算法公式如公式(3)所示:
其中I(a,i)表示用户a对物品i的预测评分值,分别表示用户a,用户b的评分平均值,rbi表示用户b对物品i的评分,KNSa表示用户a的近邻集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610098741.7A CN105512919A (zh) | 2016-02-23 | 2016-02-23 | 基于时间与区域粒度的农资协同过滤算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610098741.7A CN105512919A (zh) | 2016-02-23 | 2016-02-23 | 基于时间与区域粒度的农资协同过滤算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105512919A true CN105512919A (zh) | 2016-04-20 |
Family
ID=55720879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610098741.7A Pending CN105512919A (zh) | 2016-02-23 | 2016-02-23 | 基于时间与区域粒度的农资协同过滤算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105512919A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876562A (zh) * | 2018-08-02 | 2018-11-23 | 浙江中农在线电子商务有限公司 | 农资电商平台的商品推荐方法及装置 |
CN109389442A (zh) * | 2017-08-04 | 2019-02-26 | 北京京东尚科信息技术有限公司 | 商品推荐方法及装置、存储介质及电子终端 |
-
2016
- 2016-02-23 CN CN201610098741.7A patent/CN105512919A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389442A (zh) * | 2017-08-04 | 2019-02-26 | 北京京东尚科信息技术有限公司 | 商品推荐方法及装置、存储介质及电子终端 |
CN108876562A (zh) * | 2018-08-02 | 2018-11-23 | 浙江中农在线电子商务有限公司 | 农资电商平台的商品推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Krysanova et al. | How the performance of hydrological models relates to credibility of projections under climate change | |
Dengiz | Soil quality index for paddy fields based on standard scoring functions and weight allocation method | |
Danso-Abbeam et al. | Adoption of improved maize variety among farm households in the northern region of Ghana | |
Samal et al. | GIS based drainage morphometry and its influence on hydrology in parts of Western Ghats region, Maharashtra, India | |
Van Buuren et al. | Fully conditional specification in multivariate imputation | |
Matsumura et al. | Maize yield forecasting by linear regression and artificial neural networks in Jilin, China | |
Zhang et al. | Predicting hydrological signatures in ungauged catchments using spatial interpolation, index model, and rainfall–runoff modelling | |
CN105956089B (zh) | 一种针对具备项目的分类信息的推荐方法 | |
Bagherzadeh et al. | Modeling land suitability evaluation for wheat production by parametric and TOPSIS approaches using GIS, northeast of Iran | |
CN105260390B (zh) | 一种面向群组的基于联合概率矩阵分解的项目推荐方法 | |
Zhao et al. | What to value and how? Ecological indicator choices in stated preference valuation | |
Kim et al. | Triple helix in the agricultural sector of Northeast Asian countries: a comparative study between Korea and China | |
Sneddon et al. | Modelling the faddish, fashionable and efficient diffusion of agricultural technologies: A case study of the diffusion of wool testing technology in Australia | |
Maltais‐Landry et al. | Evaluating the contribution of weather to maize and wheat yield trends in 12 US counties | |
Özçelık et al. | Artificial neural network models: an alternative approach for reliable aboveground pine tree biomass prediction | |
Adeloye et al. | Kohonen self‐organizing map estimator for the reference crop evapotranspiration | |
Zhang et al. | How off‐farm employment affects technical efficiency of China's farms: The case of Jiangsu | |
Etienne et al. | Development of a Demand Sensitive Drought Index and its application for agriculture over the conterminous United States | |
CN104346425A (zh) | 一种层次化的互联网舆情指标体系的方法及系统 | |
Swain et al. | Impact of catchment classification on streamflow regionalization in ungauged catchments | |
Fay et al. | Management performance of ecological indicators in the Georges Bank finfish fishery | |
Li et al. | Survival analysis of loblolly pine trees with spatially correlated random effects | |
Pagès et al. | Links between root length density profiles and models of the root system architecture | |
Lenzen | Aggregating input–output systems with minimum error | |
CN105512919A (zh) | 基于时间与区域粒度的农资协同过滤算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160420 |