CN110348895A - 一种基于用户标签的个性化推荐方法、装置和电子设备 - Google Patents
一种基于用户标签的个性化推荐方法、装置和电子设备 Download PDFInfo
- Publication number
- CN110348895A CN110348895A CN201910581499.2A CN201910581499A CN110348895A CN 110348895 A CN110348895 A CN 110348895A CN 201910581499 A CN201910581499 A CN 201910581499A CN 110348895 A CN110348895 A CN 110348895A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- user interest
- dimensional data
- personalized recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0254—Targeted advertisements based on statistics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于用户标签的个性化推荐方法、装置、电子设备及计算机可读介质,包括:根据用户的多维度数据创建用户兴趣标签;基于所述用户兴趣标签,建立用户兴趣图谱;按照所述用户兴趣图谱,向用户进行个性化推荐。本发明能够通过对用户的多维度数据进行挖掘,建立用户兴趣标签体系,根据标签体系向不同的用户推荐商品或投放广告,有利于提升营销效果和用户体验。
Description
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于用户标签的个性化推荐方法、装置、电子设备及计算机可读介质。
背景技术
随着互联网技术的发展,用户的各种行为都已经线上化,则收集用户在各个场景下的行为数据,就变得更加容易。尤其是在电商环境下,通过对用户的行为数据采集分析,对每一个用户从不同维度进行打标,从而更加全面的了解用户,实现对用户精准的商品推荐,广告投放。例如,通过对人的基本属性、设备属性、业务属性、业务行为、营销行为这些维度对用户进行打标,或通过对人的基本属性、会员信息、购物行为、购物偏好、兴趣偏好、APP行为这些维度对用户进行打标。
兴趣图谱是以人与人之间的共同兴趣为线索的图谱,以分享共同的兴趣为基础,但是不一定认识人,是一种表明"我喜欢这个"的网络图谱。兴趣图谱是靠用户所关注的订阅,购买的产品,进行的评级、搜索,或者对某些口味的评论而产生的。
很早之前,电商平台提出千人千面的概念。所谓千人千面,就是不同的人,在搜索同一个关键词时,看到的宝贝是不一样的。
现有技术中,通过分析用户的多维度数据建立兴趣图谱,并根据用户兴趣图谱对用户进行个性化推荐的技术方案还有很多不足。
发明内容
本发明要解决的技术问题是如何根据用户的多维度数据,实现对用户的个性化推荐。
本发明的一方面提供一种基于用户标签的个性化推荐方法,其特征在于,包括:根据用户的多维度数据创建用户兴趣标签;基于所述用户兴趣标签,建立用户兴趣图谱;按照所述用户兴趣图谱,向用户进行个性化推荐。
根据本发明的一种优选实施方式,所述根据用户的多维度数据创建用户标签的步骤,进一步包括:基于所述用户的多维度数据,建立至少一个用户兴趣模型;通过至少一个用户兴趣模型,生成用户兴趣标签。
根据本发明的一种优选实施方式,所述基于所述用户的多维度数据,建立至少一个用户兴趣模型的步骤,进一步包括:获取用户的多维度数据;对所述用户的多维度数据进行预处理,生成标准数据;对所述标准数据进行特征工程,获取用户特征数据;基于所述用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
根据本发明的一种优选实施方式,所述对所述用户的多维度数据进行预处理,生成标准数据的步骤,进一步包括:对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
根据本发明的一种优选实施方式,所述对所述标准数据进行特征工程,获取用户特征数据的步骤,进一步包括:对所述标准数据进行特征获取、特征处理、特征监控,获取用户特征数据。
根据本发明的一种优选实施方式,还包括:通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
根据本发明的一种优选实施方式,所述基于所述用户兴趣标签,建立用户兴趣图谱的步骤,进一步包括:将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
根据本发明的一种优选实施方式,所述按照所述用户兴趣图谱,向用户进行个性化推荐的步骤,进一步包括:按照所述用户兴趣图谱,获取与用户兴趣匹配的推荐商品;生成推荐商品排名;按照所述推荐商品排名,向用户进行个性化推荐。
根据本发明的一种优选实施方式,所述生成推荐商品排名的步骤,进一步包括:按照用户对推荐商品的喜爱程度,生成推荐商品排名;和/或通过相同或相似用户对推荐商品的喜爱程度,使用协同过滤、逻辑回归、和/或朴素贝叶斯方法,生成推荐商品排名。
本发明的第二方面提供一种基于用户标签的个性化推荐装置,其特征在于,包括:用户兴趣标签创建模块,用于根据用户的多维度数据创建用户兴趣标签;用户兴趣图谱建立模块,用于基于所述用户兴趣标签,建立用户兴趣图谱;个性化推荐模块,用于按照所述用户兴趣图谱,向用户进行个性化推荐。
根据本发明的一种优选实施方式,所述用户兴趣标签创建模块,进一步包括:用户兴趣模型建立单元,用于基于所述用户的多维度数据,建立至少一个用户兴趣模型;用户兴趣标签生成单元,用于通过至少一个用户兴趣模型,生成用户兴趣标签。
根据本发明的一种优选实施方式,所述用户兴趣模型建立单元,进一步包括:多维度数据获取子单元,用于获取用户的多维度数据;标准数据生成子单元,用于对所述用户的多维度数据进行预处理,生成标准数据;用户特征数据获取子单元,用于对所述标准数据进行特征工程,获取用户特征数据;用户兴趣模型建立子单元,用于基于所述用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
根据本发明的一种优选实施方式,所述标准数据生成子单元,进一步包括:生成标准数据的算法子单元,用于对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
根据本发明的一种优选实施方式,所述用户特征数据获取子单元,进一步包括:特征工程子单元,用于对所述标准数据进行特征获取、特征处理、特征监控,获取用户特征数据。
根据本发明的一种优选实施方式,还包括:用户兴趣模型优化子单元,用于通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
根据本发明的一种优选实施方式,所述用户兴趣图谱建立模块,进一步包括:用户兴趣图谱建立单元,用于将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
根据本发明的一种优选实施方式,所述个性化推荐模块,进一步包括:推荐商品获取单元,用于按照所述用户兴趣图谱,获取与用户兴趣匹配的推荐商品;推荐商品排名生成单元,用于生成推荐商品排名;个性化推荐单元,用于按照所述推荐商品排名,向用户进行个性化推荐。
根据本发明的一种优选实施方式,所述推荐商品排名生成单元,进一步包括:第一推荐商品排名生成子单元,用于按照用户对推荐商品的喜爱程度,生成推荐商品排名;和/或第二推荐商品排名生成子单元,用于通过相同或相似用户对推荐商品的喜爱程度,使用协同过滤、逻辑回归、和/或朴素贝叶斯方法,生成推荐商品排名。
本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行任一项所述的方法。
本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。
本发明的技术方案,具有如下有益效果:
本发明通过通过对用户的多维度数据进行挖掘,建立用户兴趣标签体系,根据标签体系向不同的用户推荐商品或投放广告,有利于提升营销效果和用户体验。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是本发明的基于用户标签的个性化推荐方法流程示意图;
图2是本发明的基于用户标签的个性化推荐方法中建立用户兴趣模型的步骤示意图;
图3是本发明一具体实施例的基于用户标签的个性化推荐方法的建立用户模型的步骤示意图;
图4是本发明的基于用户标签的个性化推荐方法的个性化推荐示意图;
图5是本发明的基于用户标签的个性化推荐装置架构示意图;
图6是本发明的基于用户标签的个性化推荐装置的用户兴趣模型建立单元架构示意图;
图7是本发明的基于用户标签的个性化推荐电子设备结构框架示意图;
图8是本发明的计算机可读存储介质示意图。
具体实施方式
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
图1是本发明的基于用户标签的个性化推荐方法流程示意图;如图1所示,本发明的方法包括:
S101:根据用户的多维度数据创建用户兴趣标签。
其中,所述根据用户的多维度数据创建用户兴趣标签的步骤,进一步包括:基于所述用户的多维度数据,建立至少一个用户兴趣模型;通过至少一个用户兴趣模型,生成用户兴趣标签。
图2是本发明的基于用户标签的个性化推荐方法中建立用户兴趣模型的步骤示意图;如图2所示,所述基于所述用户的多维度数据,建立至少一个用户兴趣模型的步骤,进一步包括:
S201:获取用户的多维度数据;
S202:对所述用户的多维度数据进行预处理,生成标准数据;
S203:对所述标准数据进行特征工程,获取用户特征数据;
S204:基于所述用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
其中,所述对所述用户的多维度数据进行预处理,生成标准数据的步骤,进一步包括:对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
其中,所述对所述标准数据进行特征工程,获取用户特征数据的步骤,进一步包括:对所述标准数据进行特征获取、特征处理、特征监控,获取用户特征数据。
其中,本发明的基于用户标签的个性化推荐方法,还包括:通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
S102:基于所述用户兴趣标签,建立用户兴趣图谱。
其中,所述基于所述用户兴趣标签,建立用户兴趣图谱的步骤,进一步包括:将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
S103:按照所述用户兴趣图谱,向用户进行个性化推荐。
其中,所述按照所述用户兴趣图谱,向用户进行个性化推荐的步骤,进一步包括:按照所述用户兴趣图谱,获取与用户兴趣匹配的推荐商品;生成推荐商品排名;按照所述推荐商品排名,向用户进行个性化推荐。
其中,所述生成推荐商品排名的步骤,进一步包括:按照用户对推荐商品的喜爱程度,生成推荐商品排名;和/或通过相同或相似用户对推荐商品的喜爱程度,使用协同过滤、逻辑回归、和/或朴素贝叶斯方法,生成推荐商品排名。
获取用户的多维度数据。
电商平台每个用户的行为非常多且复杂,对于互联网金融用户来讲,因为从用户注册为新客到授信再到发生动支、还款甚至是逾期,一整条链路流程非常清晰,所有对用户数据的收集也较为容易。
但电商用户的行为可用多且复杂来讲,一个用户浏览产品之后,打开了哪些页面,看了哪些商品,收藏了哪些商品,咨询过哪些商品,搜索过哪些商品,购买了哪些商品,以及下单之后的商品评价等等,数据维度之多,数据量之大。
电商平台收集很多用户数据,获取这些数据需基于用户对产品的黏性、需求或用户的使用场景状况的了解。
获取到用户的多维度数据后,对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
获取到的大数据用Hadoop存日志,怎样做到在线进行推荐,和存储结构相关。这些数据要能够用来做推荐,数据清晰很重要。比如,一个用户打开APP以后,都不做操作,这种数据对实际分析来说应该去掉,因为没有提供任何价值。还有同样测试时,对产品功能性的验证,这种数据在做预处理时删掉。
确定数据集后,就开始对数据进行预处理使得数据能够为电商平台所用。数据预处理提高数据质量:准确性、完整性和一致性,包括数据清理、数据集成、数据规约和数据变换方法。
其中数据清理过程包括:忽略元祖、人工填写缺失值、使用属性的中心度量填充、给定同一类所有样本的属性均值或中位数填充、最可能的值填充。
元组:数据元组称为记录,一个数据表中的每一个记录均有一个惟一的编号(记录号),一个记录也就是数据表中的一行。
缺失值:粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。
数据集成过程包括:实体识别、冗余和相关分析(卡方检验,相关系数,协方差等,用spss比较方便)。
数据规约,指在尽可能保持数据原貌的前提下,最大限度地精简数据量,完成该任务的必要前提是理解挖掘任务和熟悉数据本身内容。
数据规约的方法包括:维规约(小波变换和主成分分析,最常用)、数量规约(较小的数据替代原始数据)、数据压缩(有损无损两种,尤其对于图像视频等多媒体常用)。
数据变换,指在对数据进行统计分析时,要求数据必须满足一定的条件。
数据变换的过程包括:光滑,属性构造,聚集,规范化,离散化和概念分层。
数据离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。
生成标准数据后,需对所述标准数据进行特征工程,获取用户特征数据。
特征工程,需确定特征使用方案,特征获取方案,进行特征处理和特征监控。
特征使用方案,首先,需要基于业务理解,尽可能找出对因变量有影响的所有自变量。其次,需要对特征的获取难度,覆盖率和准确率进行可行性评估。
特征获取方案,解决如何获取特征,以及如何实现特征存储的问题。
特征处理过程,进一步包括:特征清洗和特征预处理。
特征清洗包括:清洗异常样本和对数据不均衡、样本权重的采样。
特征预处理包括:对单个特征的预处理,对多个特征的预处理,以及衍生变量。
其中,对单个特征的预处理包括:归一化,离散化,Dummy Coding,缺失值处理,以及数据变换(log,指数,Box-Cox)。
对多个特征的预处理包括:降维(PCA,LDA)处理,以及特征选择。其中,特征选择又包括:Filter,Wrapper,Embedded过程。
Filter方法,旨在建立自变量和目标变量之间的关联,包括获取相关系数,卡方检验,信息增益、互信息。
Wrapper方法,旨在通过目标函数来决定是否如加入一个变量。,通过完全搜索,启发式搜索和随机搜索(GA、SA)的迭代方法产生特征子集的评价.
Embedded方法,旨在使学习器自身自动选择特征。通过正则化、决策树和深度学习实现。其中,正则化包括L1和L2方法,分别对应Lasso和Ridge。决策树用于获取熵信息增益。
衍生变量,旨在对原始数据加工,生成有商业意义的变量。
特征监控,包括:特征有效性分析和监控重要特征。
其中,特征有效性分析主要通过获取特征的权重来确定特征的重要性。
其中,监控重要特征主要防止特征质量下降,影响模型。
在拿到有效数据后,会分析用户行为特征,比如通过聚类,看用户到底有哪些特征,比如聚成30多类用户,有些用户特征明显,喜欢上午浏览并进行下单的,有的用户每天打开APP就是逛逛的;还有用户下单之后不支付的,最终建立用户模型。
基于通过特征工程获取的用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
本发明的方法,还包括:通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
另外,还需要调整模型的参数,使得模型表现尽可能最优。主要方法有手动调优、网格搜索、随机搜索以及基于贝叶斯的参数调优方法。
根据机器学习模型优缺点,选择适宜的最佳模型。其中一种方式是对每个模型都进行训练,再统计测试数据的误差,选择误差最小的模型即可。
图3是本发明一具体实施例的基于用户标签的个性化推荐方法的建立用户模型的步骤示意图;如图3所示,本发明的方法还包括:模型的评估。
模型的评估,分析的对象主要是模型的优缺点,客观公正的评判机器学习的认知,改进就是从分析当中来。
通过至少一个用户兴趣模型,生成用户兴趣标签。
在多维度数据通过建立模型生成用于兴趣标签之后,基于所述用户兴趣标签,建立用户兴趣图谱的步骤。其中,将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
按照所述用户兴趣图谱,向用户进行个性化推荐。
图4是本发明的基于用户标签的个性化推荐方法的个性化推荐示意图;如图4所示,本发明的方法能够根据不同的用户推荐不同的商品。
兴趣图谱能够针对每个用户建立一个推荐商品的列表,也就是给他一个排序,根据商品库中所有商品,每个用户兴趣点不同,如果他非常喜欢某分类,这个分类的排名就靠前,有些不喜欢的商品排名就非常低,甚至通过一些过滤条件把不喜欢的商品排除掉,除了用数据做分析,我们也可以用到数据挖掘,同样类型的用户通过使用协同过滤、逻辑回归、朴素贝叶斯等方法协助生成每一个用户商品的排名。哪些用户喜欢这个商品的小池子,就放到他的喜欢池里。
标签系统的应用就是针对不同用户推荐商品和投放广告。
通过算法对用户进行建模分析,是在继电商用户购买行为的基础上再次进行分析。
本发明的方法,可以对不同的人群有针对性的推荐商品、投放广告,提升用户体验,以及提升广告和商品的转化率。
同时,积淀的用户数据可以对用户进行全方位的进行分析,用户数据也将成为促进业务快速发展的利器。
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、ROM、RAM等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
图5是本发明的基于用户标签的个性化推荐装置架构示意图;如图5所示,该装置500包括:用户兴趣标签创建模块501,用户兴趣图谱建立模块502,个性化推荐模块503。
用户兴趣标签创建模块,用于根据用户的多维度数据创建用户兴趣标签。
用户兴趣图谱建立模块,用于基于所述用户兴趣标签,建立用户兴趣图谱。
个性化推荐模块,用于按照所述用户兴趣图谱,向用户进行个性化推荐。
其中,用户兴趣标签创建模块,进一步包括:用户兴趣模型建立单元,用户兴趣标签生成单元。
用户兴趣模型建立单元,用于基于所述用户的多维度数据,建立至少一个用户兴趣模型。
用户兴趣标签生成单元,用于通过至少一个用户兴趣模型,生成用户兴趣标签。
图6是本发明的基于用户标签的个性化推荐装置的用户兴趣模型建立单元架构示意图;如图6所示,用户兴趣模型建立单元600,进一步包括:多维度数据获取子单元601,标准数据生成子单元602,用户特征数据获取子单元603,用户兴趣模型建立子单元604。
多维度数据获取子单元,用于获取用户的多维度数据。
标准数据生成子单元,用于对所述用户的多维度数据进行预处理,生成标准数据。
用户特征数据获取子单元,用于对所述标准数据进行特征工程,获取用户特征数据。
用户兴趣模型建立子单元,用于基于所述用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
其中,所述标准数据生成子单元,进一步包括:
生成标准数据的算法子单元,用于对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
其中,所述用户特征数据获取子单元,进一步包括:
特征工程子单元,用于对所述标准数据进行特征获取、特征处理、特征监控,获取用户特征数据。
其中,还包括:用户兴趣模型优化子单元,用于通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
其中,所述用户兴趣图谱建立模块,进一步包括:用户兴趣图谱建立单元,用于将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
其中,所述个性化推荐模块,进一步包括:
推荐商品获取单元,用于按照所述用户兴趣图谱,获取与用户兴趣匹配的推荐商品;
推荐商品排名生成单元,用于生成推荐商品排名;
个性化推荐单元,用于按照所述推荐商品排名,向用户进行个性化推荐。
其中,所述推荐商品排名生成单元,进一步包括:
第一推荐商品排名生成子单元,用于按照用户对推荐商品的喜爱程度,生成推荐商品排名;和/或
第二推荐商品排名生成子单元,用于通过相同或相似用户对推荐商品的喜爱程度,使用协同过滤、逻辑回归、和/或朴素贝叶斯方法,生成推荐商品排名。
下面描述本发明的电子设备实施例,该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明电子设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
图7是根据本发明的一种电子设备的示例性实施例的结构框图。下面参照图7来描述根据本发明该实施例的的电子设备700。图7显示的电子设备700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:至少一个处理单元710、至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730、显示单元740等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元710可以执行如图1所示的步骤。
所述存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
所述存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器770与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器770可以通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机可读介质能够实现本发明的上述方法,即:根据用户的多维度数据创建用户兴趣标签;基于所述用户兴趣标签,建立用户兴趣图谱;按照所述用户兴趣图谱,向用户进行个性化推荐。
所述计算机程序可以存储于一个或多个计算机可读介质上,如图7所示。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于用户标签的个性化推荐方法,其特征在于,包括:
根据用户的多维度数据创建用户兴趣标签;
基于所述用户兴趣标签,建立用户兴趣图谱;
按照所述用户兴趣图谱,向用户进行个性化推荐。
2.如权利要求1所述的方法,其特征在于,所述根据用户的多维度数据创建用户兴趣标签的步骤,进一步包括:
基于所述用户的多维度数据,建立至少一个用户兴趣模型;
通过至少一个用户兴趣模型,生成用户兴趣标签。
3.如权利要求1或2所述的方法,其特征在于,所述基于所述用户的多维度数据,建立至少一个用户兴趣模型的步骤,进一步包括:
获取用户的多维度数据;
对所述用户的多维度数据进行预处理,生成标准数据;
对所述标准数据进行特征工程,获取用户特征数据;
基于所述用户特征数据,通过回归分析、决策树、人工神经网络、支持向量机、K-Means、关联规则、和/或时序模式算法,建立至少一个用户兴趣模型。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述对所述用户的多维度数据进行预处理,生成标准数据的步骤,进一步包括:
对所述用户的多维度数据进行数据清洗、数据集成、数据规约和数据变换,生成标准数据。
5.如权利要求1至4中任一项所述的方法,其特征在于,所述对所述标准数据进行特征工程,获取用户特征数据的步骤,进一步包括:
对所述标准数据进行特征获取、特征处理、特征监控,获取用户特征数据。
6.如权利要求1至5中任一项所述的方法,其特征在于,还包括:
通过手动调优、网格搜索、随机搜索、和/或基于贝叶斯的参数调优方法,调整所述用户兴趣模型的参数,优化所述用户兴趣模型。
7.如权利要求1至6中任一项所述的方法,其特征在于,所述基于所述用户兴趣标签,建立用户兴趣图谱的步骤,进一步包括:
将所述用户兴趣标签和用户作为用户兴趣图谱的节点,建立用户兴趣图谱。
8.一种基于用户标签的个性化推荐装置,其特征在于,包括:
用户兴趣标签创建模块,用于根据用户的多维度数据创建用户兴趣标签;
用户兴趣图谱建立模块,用于基于所述用户兴趣标签,建立用户兴趣图谱;
个性化推荐模块,用于按照所述用户兴趣图谱,向用户进行个性化推荐。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910581499.2A CN110348895A (zh) | 2019-06-29 | 2019-06-29 | 一种基于用户标签的个性化推荐方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910581499.2A CN110348895A (zh) | 2019-06-29 | 2019-06-29 | 一种基于用户标签的个性化推荐方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110348895A true CN110348895A (zh) | 2019-10-18 |
Family
ID=68177307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910581499.2A Pending CN110348895A (zh) | 2019-06-29 | 2019-06-29 | 一种基于用户标签的个性化推荐方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110348895A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143609A (zh) * | 2019-12-20 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN111667355A (zh) * | 2020-05-29 | 2020-09-15 | 北京睿知图远科技有限公司 | 一种大数据分析方法与系统 |
CN111737382A (zh) * | 2020-05-15 | 2020-10-02 | 百度在线网络技术(北京)有限公司 | 地理位置点的排序方法、训练排序模型的方法及对应装置 |
CN111861697A (zh) * | 2020-07-02 | 2020-10-30 | 北京睿知图远科技有限公司 | 一种基于贷款多头数据的用户画像生成方法及系统 |
CN111861679A (zh) * | 2020-08-04 | 2020-10-30 | 深圳市创智园知识产权运营有限公司 | 一种基于人工智能的商品推荐方法 |
CN111949776A (zh) * | 2020-07-17 | 2020-11-17 | 上海淇馥信息技术有限公司 | 一种用户标签评估的方法、装置和电子设备 |
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN113553499A (zh) * | 2021-06-22 | 2021-10-26 | 杭州摸象大数据科技有限公司 | 一种基于营销裂变的作弊探测方法、系统和电子设备 |
CN113656125A (zh) * | 2021-07-30 | 2021-11-16 | 阿波罗智联(北京)科技有限公司 | 一种虚拟助手生成的方法、装置及电子设备 |
CN116910362A (zh) * | 2023-07-18 | 2023-10-20 | 中国电子科技集团公司第五十四研究所 | 一种感知数据智能推荐方法、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110173176A1 (en) * | 2009-12-16 | 2011-07-14 | International Business Machines Corporation | Automatic Generation of an Interest Network and Tag Filter |
CN103218407A (zh) * | 2013-03-22 | 2013-07-24 | 南京信通科技有限责任公司 | 一种基于兴趣图谱的推荐引擎 |
CN107729937A (zh) * | 2017-10-12 | 2018-02-23 | 北京京东尚科信息技术有限公司 | 用于确定用户兴趣标签的方法及装置 |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN109299370A (zh) * | 2018-10-09 | 2019-02-01 | 中国科学技术大学 | 多对级个性化推荐方法 |
CN109684548A (zh) * | 2018-11-30 | 2019-04-26 | 内江亿橙网络科技有限公司 | 一种基于用户图谱的数据推荐方法 |
US20190163782A1 (en) * | 2017-11-29 | 2019-05-30 | Business Objects Software Ltd. | Learning user interests for recommendations in business intelligence interactions |
-
2019
- 2019-06-29 CN CN201910581499.2A patent/CN110348895A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110173176A1 (en) * | 2009-12-16 | 2011-07-14 | International Business Machines Corporation | Automatic Generation of an Interest Network and Tag Filter |
CN103218407A (zh) * | 2013-03-22 | 2013-07-24 | 南京信通科技有限责任公司 | 一种基于兴趣图谱的推荐引擎 |
CN107729937A (zh) * | 2017-10-12 | 2018-02-23 | 北京京东尚科信息技术有限公司 | 用于确定用户兴趣标签的方法及装置 |
US20190163782A1 (en) * | 2017-11-29 | 2019-05-30 | Business Objects Software Ltd. | Learning user interests for recommendations in business intelligence interactions |
CN108960975A (zh) * | 2018-06-15 | 2018-12-07 | 广州麦优网络科技有限公司 | 基于用户画像的个性化精准营销方法、服务器及存储介质 |
CN109299370A (zh) * | 2018-10-09 | 2019-02-01 | 中国科学技术大学 | 多对级个性化推荐方法 |
CN109684548A (zh) * | 2018-11-30 | 2019-04-26 | 内江亿橙网络科技有限公司 | 一种基于用户图谱的数据推荐方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143609B (zh) * | 2019-12-20 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN111143609A (zh) * | 2019-12-20 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN111737382A (zh) * | 2020-05-15 | 2020-10-02 | 百度在线网络技术(北京)有限公司 | 地理位置点的排序方法、训练排序模型的方法及对应装置 |
US11556601B2 (en) | 2020-05-15 | 2023-01-17 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method for sorting geographic location point, method for training sorting model and corresponding apparatuses |
CN111667355A (zh) * | 2020-05-29 | 2020-09-15 | 北京睿知图远科技有限公司 | 一种大数据分析方法与系统 |
CN111861697A (zh) * | 2020-07-02 | 2020-10-30 | 北京睿知图远科技有限公司 | 一种基于贷款多头数据的用户画像生成方法及系统 |
CN111861697B (zh) * | 2020-07-02 | 2021-05-18 | 北京睿知图远科技有限公司 | 一种基于贷款多头数据的用户画像生成方法及系统 |
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN112017062B (zh) * | 2020-07-15 | 2024-06-07 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN111949776A (zh) * | 2020-07-17 | 2020-11-17 | 上海淇馥信息技术有限公司 | 一种用户标签评估的方法、装置和电子设备 |
CN111949776B (zh) * | 2020-07-17 | 2023-09-22 | 上海淇馥信息技术有限公司 | 一种用户标签评估的方法、装置和电子设备 |
CN111861679A (zh) * | 2020-08-04 | 2020-10-30 | 深圳市创智园知识产权运营有限公司 | 一种基于人工智能的商品推荐方法 |
CN113553499A (zh) * | 2021-06-22 | 2021-10-26 | 杭州摸象大数据科技有限公司 | 一种基于营销裂变的作弊探测方法、系统和电子设备 |
CN113656125A (zh) * | 2021-07-30 | 2021-11-16 | 阿波罗智联(北京)科技有限公司 | 一种虚拟助手生成的方法、装置及电子设备 |
CN116910362A (zh) * | 2023-07-18 | 2023-10-20 | 中国电子科技集团公司第五十四研究所 | 一种感知数据智能推荐方法、计算机设备及存储介质 |
CN116910362B (zh) * | 2023-07-18 | 2024-04-16 | 中国电子科技集团公司第五十四研究所 | 一种感知数据智能推荐方法、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348895A (zh) | 一种基于用户标签的个性化推荐方法、装置和电子设备 | |
CN106485562B (zh) | 一种基于用户历史行为的商品信息推荐方法及系统 | |
CN101990670B (zh) | 使用编辑距离和文档信息进行搜索结果排名 | |
CN110008973B (zh) | 一种模型训练方法、基于模型确定目标用户的方法及装置 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN108198019A (zh) | 物品推荐方法及装置、存储介质、电子设备 | |
CN110111139A (zh) | 行为预估模型生成方法、装置、电子设备及可读介质 | |
Banik | Hands-on recommendation systems with Python: start building powerful and personalized, recommendation engines with Python | |
US20190080352A1 (en) | Segment Extension Based on Lookalike Selection | |
CN111754278A (zh) | 物品推荐方法、装置、计算机存储介质和电子设备 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
US20180349476A1 (en) | Evaluating theses using tree structures | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN114579858A (zh) | 内容推荐方法和装置、电子设备、存储介质 | |
CN114820121A (zh) | 一种保险业务推送系统及方法 | |
Pamungkas et al. | Measurement of Similarity Between Requirement Elicitation and Requirement Specification Using Text Pre-Processing in the Cinemaloka Application | |
CN113837843B (zh) | 产品推荐方法、装置、介质及电子设备 | |
CN112328899B (zh) | 信息处理方法、信息处理装置、存储介质与电子设备 | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN110069691A (zh) | 用于处理点击行为数据的方法和装置 | |
Apriliani et al. | SentiHotel: a sentiment analysis application of hotel services using an optimized neural network | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN115618126A (zh) | 搜索处理方法、系统、计算机可读存储介质及计算机设备 | |
Phyu et al. | Short survey of data mining and web mining using cloud computing | |
CN113947431A (zh) | 一种用户行为质量评估方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |