CN112256958A - 一种商品推荐方法 - Google Patents

一种商品推荐方法 Download PDF

Info

Publication number
CN112256958A
CN112256958A CN202011033009.4A CN202011033009A CN112256958A CN 112256958 A CN112256958 A CN 112256958A CN 202011033009 A CN202011033009 A CN 202011033009A CN 112256958 A CN112256958 A CN 112256958A
Authority
CN
China
Prior art keywords
user
enterprise
users
employee
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011033009.4A
Other languages
English (en)
Inventor
王婉莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongzhi Guanaitong Shanghai Technology Co ltd
Original Assignee
Zhongzhi Guanaitong Shanghai Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongzhi Guanaitong Shanghai Technology Co ltd filed Critical Zhongzhi Guanaitong Shanghai Technology Co ltd
Priority to CN202011033009.4A priority Critical patent/CN112256958A/zh
Publication of CN112256958A publication Critical patent/CN112256958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1057Benefits or employee welfare, e.g. insurance, holiday or retirement packages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种商品推荐方法,包括以下步骤:获取用户数据,所述用户数据包括用户基础数据和用户行为数据;根据用户数据生成用户标签;根据用户标签,通过热搜分词算法和协同过滤算法对商品进行聚类;根据商品聚类的结果向用户进行商品推荐。与现有技术相比,福利发放建立在科学依据之上,大大提高了精确度和个性化满意度,提升效率和效果。

Description

一种商品推荐方法
技术领域
本发明涉及商品推荐领域,尤其是涉及一种商品推荐方法。
背景技术
就目前而言,福利发放行业属于人力资源细分市场,行业内针对企业和员工用户缺少用户洞察积累;产品逐渐倾向高度个性化、复杂化;企业用户涉及行业广泛,不同行业的员工福利采购决策体系复杂程度不同,但均逐渐复杂化。并且在既定预算下,不同行业甚至企业对福利方案的实施要求不同,员工对于不同的福利方案和产品偏好度也不同,这就要求对企业用户和员工用户福利方案实现千人千面,以更高地提升服务效果和员工满意度。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种商品推荐方法。
本发明的目的可以通过以下技术方案来实现:
一种商品推荐方法,该方法包括以下步骤:
步骤S1:获取用户数据,所述用户数据包括用户基础数据和用户行为数据;
步骤S2:根据用户数据生成用户标签;
步骤S3:根据用户标签,通过热搜分词算法和协同过滤算法对商品进行聚类;
步骤S4:根据商品聚类的结果向用户进行商品推荐。
所述的用户包括企业用户。
针对企业用户,所述用户行为数据包括企业用户充值月份和向员工发放金额。
针对企业用户,所述用户标签包括企业用户流失标签和企业用户所属分类标签,所述企业用户所属分类标签通过向员工发放金额获得,所述企业用户流失标签通过企业用户充值月份得到。
所述的用户包括员工用户。
针对员工用户,所述用户行为数据包括消费次数和消费种类。
针对员工用户,所述用户标签包括员工用户消费种类占比标签,所述员工用户消费种类占比标签通过员工用户的消费次数和消费种类得到。
所述的热搜分词算法通过有向无环图方式进行,有向无环图以字典结构存储,所述字典结构描述为:{key:list[i,j…],…},其中,key是语句中词的开始位置,list存放的是在语句中以key开始的可能的词语的结束位置。
所述的协同过滤算法通过最近相邻搜索找到类似的用户群,将用户群的商品与该用户进行关联。
步骤S2之前,对用户数据进行数据清洗。
与现有技术相比,本发明具有以下优点:
根据用户数据生成用户标签,根据用户标签,通过热搜分词算法和协同过滤算法对商品进行聚类,根据商品聚类的结果向用户进行商品推荐;更加快速准确找出企业和员工用户的偏好,福利发放建立在科学依据之上,大大提高了精确度和个性化满意度,提升效率和效果。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
本实施例提供一种商品推荐方法,该方法中的用户包括企业用户或员工用户,针对企业用户,包括步骤:
1)获取企业用户基础数据、企业用户充值月份和向员工发放金额;
2)基于企业用户基础数据、企业用户充值月份和向员工发放金额,生成企业用户流失标签和企业用户所属分类标签;
3)依据企业用户流失标签和企业用户所属分类标签,通过热搜分词算法和协同过滤算法对商品进行聚类;
4)根据商品聚类的结果向企业用户进行商品推荐。
针对员工用户,包括步骤:
1)获取员工用户消费次数和消费种类;
2)基于消费次数和消费种类,生成员工用户消费种类占比标签;
3)依据员工用户消费种类占比标签,通过热搜分词算法和协同过滤算法对商品进行聚类;
4)根据商品聚类的结果向员工用户进行商品推荐。
1)对企业用户设定的标签
企业用户流失标签:通过企业用户充值月份计算企业用户平均充值间隔月数,其中,需要对充值月数进行去重,定义充值月份为M1、M2和M3,通过M2-M1得一充值间隔月数,同时M3-M2得另一充值间隔月数,依次类推,一个充值间隔月数=M(当月)-M(上次充值月份),平均充值间隔月数为各充值间隔月数的和除以充值间隔月数的个数N,并计算充值间隔月数方差,通过充值间隔月数方差得到当前企业用户的流失情况。
企业用户所属分类标签:由于企业用户主要分为日常消费企业用户和年节企业用户,因此通过企业用户近一年的向员工发放金额对企业用户进行分类,具体为根据企业向员工发放金额最大的节日定义企业用户所属分类。
2)对员工用户设定的标签
员工用户消费种类占比标签:例如某员工用户购买10次电子卡,10次中5次是电商购物卡,3次生鲜卡,2次交通出行,则得到电商购物占比=5/10=50%,生鲜购物占比=3/10=30%,交通出行占比=2/10=2%,从而得到员工用户消费种类占比标签。
对商品进行聚类通过热搜分词算法和协同过滤算法进行。
热搜分词算法,主要是利用了自然语言处理算法,分词是通过DAG(有向无环图)方式来进行的。一个DAG的语句是以{key:list[i,j…],…}的字典结构存储,其中key是词在语句中的位置,list存放的是在语句中以key开始的可能的词语的结束位置,这样通过查字典得到词的开始位置+结束位置列表,这里的词指用户标签中的关键词。
协同过滤算法,通过用户的标签找到类似的用户群,将他们进行关联。将分词后得到的关键词进行最近相邻搜索,计算用户之间的相似度,相似度越高,代表用户之间越相似,则可通过用户之间购买商品的差异进行商品推荐。

Claims (10)

1.一种商品推荐方法,其特征在于,该方法包括以下步骤:
步骤S1:获取用户数据,所述用户数据包括用户基础数据和用户行为数据;
步骤S2:根据用户数据生成用户标签;
步骤S3:根据用户标签,通过热搜分词算法和协同过滤算法对商品进行聚类;
步骤S4:根据商品聚类的结果向用户进行商品推荐。
2.根据权利要求1所述的一种商品推荐方法,其特征在于,所述的用户包括企业用户。
3.根据权利要求2所述的一种商品推荐方法,其特征在于,针对企业用户,所述用户行为数据包括企业用户充值月份和向员工发放金额。
4.根据权利要求3所述的一种商品推荐方法,其特征在于,针对企业用户,所述用户标签包括企业用户流失标签和企业用户所属分类标签,所述企业用户所属分类标签通过向员工发放金额获得,所述企业用户流失标签通过企业用户充值月份得到。
5.根据权利要求1所述的一种商品推荐方法,其特征在于,所述的用户包括员工用户。
6.根据权利要求5所述的一种商品推荐方法,其特征在于,针对员工用户,所述用户行为数据包括消费次数和消费种类。
7.根据权利要求6所述的一种商品推荐方法,其特征在于,针对员工用户,所述用户标签包括员工用户消费种类占比标签,所述员工用户消费种类占比标签通过员工用户的消费次数和消费种类得到。
8.根据权利要求1所述的一种商品推荐方法,其特征在于,所述的热搜分词算法通过有向无环图方式进行,有向无环图以字典结构存储,所述字典结构描述为:{key:list[i,j…],…},其中,key是语句中词的开始位置,list存放的是在语句中以key开始的可能的词语的结束位置。
9.根据权利要求1所述的一种商品推荐方法,其特征在于,所述的协同过滤算法通过最近相邻搜索找到类似的用户群,将用户群的商品与该用户进行关联。
10.根据权利要求1所述的一种商品推荐方法,其特征在于,步骤S2之前,对用户数据进行数据清洗。
CN202011033009.4A 2020-09-27 2020-09-27 一种商品推荐方法 Pending CN112256958A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011033009.4A CN112256958A (zh) 2020-09-27 2020-09-27 一种商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011033009.4A CN112256958A (zh) 2020-09-27 2020-09-27 一种商品推荐方法

Publications (1)

Publication Number Publication Date
CN112256958A true CN112256958A (zh) 2021-01-22

Family

ID=74233740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011033009.4A Pending CN112256958A (zh) 2020-09-27 2020-09-27 一种商品推荐方法

Country Status (1)

Country Link
CN (1) CN112256958A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016101777A1 (zh) * 2014-12-26 2016-06-30 中国银联股份有限公司 用户兴趣数据分析和收集系统及其方法
CN106570031A (zh) * 2015-10-13 2017-04-19 阿里巴巴集团控股有限公司 一种业务对象的推荐方法和装置
CN107633430A (zh) * 2017-09-20 2018-01-26 哈尔滨工业大学 一种基于群体社区的商品推荐方法
CN111709812A (zh) * 2020-06-19 2020-09-25 山东财经大学 基于用户动态分类的电商平台商品推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016101777A1 (zh) * 2014-12-26 2016-06-30 中国银联股份有限公司 用户兴趣数据分析和收集系统及其方法
CN106570031A (zh) * 2015-10-13 2017-04-19 阿里巴巴集团控股有限公司 一种业务对象的推荐方法和装置
CN107633430A (zh) * 2017-09-20 2018-01-26 哈尔滨工业大学 一种基于群体社区的商品推荐方法
CN111709812A (zh) * 2020-06-19 2020-09-25 山东财经大学 基于用户动态分类的电商平台商品推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韦人予: "中文分词技术研究", 信息与电脑(理论版), vol. 32, no. 10, pages 26 - 29 *

Similar Documents

Publication Publication Date Title
CN107633007B (zh) 一种基于层次化ap聚类的商品评论数据标签化系统和方法
CN109903117B (zh) 一种用于商品推荐的知识图谱处理方法及装置
WO2018068603A1 (zh) 基于大数据技术的供应链管理决策支持系统
CN110648163A (zh) 一种基于用户评论的推荐算法
US8688603B1 (en) System and method for identifying and correcting marginal false positives in machine learning models
US20070214140A1 (en) Assigning into one set of categories information that has been assigned to other sets of categories
CN107632984A (zh) 一种聚类数据表的展现方法、装置和系统
CN112700271A (zh) 一种基于标签模型的大数据画像方法及系统
CN111563168B (zh) 一种基于ai知识图谱算法用于通关商品智能归类的方法
Fry et al. Can we group similar amazon reviews: a case study with different clustering algorithms
Patil et al. Online review spam detection using language model and feature selection
CN116823321B (zh) 一种电商用经济管理数据分析方法及系统
Jiang et al. Durable product review mining for customer segmentation
CN113744019A (zh) 一种商品推荐方法、装置、设备及存储介质
CN112256958A (zh) 一种商品推荐方法
Yoshida et al. Extracting attributes and their values from web pages
Wu et al. [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing
CN111339303B (zh) 一种基于聚类与自动摘要的文本意图归纳方法及装置
CN114564956A (zh) 一种细粒度属性自动提取的用户评论文本情感挖掘模型
Jie et al. An Efficient Group-based Search Engine Marketing System for E-Commerce
CN112560433A (zh) 一种信息处理的方法及装置
CN109902180A (zh) 一种电商评论多类目多客户快速定制化模型的方法和装置
Purnamasari et al. Consumer Behavior Analysis of Leathercraft Small and Medium-Sized Enterprises (SME) Using Market Basket Analysis and Clustering Algorithms
Aggarwal et al. Artificial intelligence based marketing: a bibliometric analysis
US20240037482A1 (en) Machine Learning Based Spend Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination