CN113837842A - 一种基于用户行为数据的商品推荐方法及设备 - Google Patents
一种基于用户行为数据的商品推荐方法及设备 Download PDFInfo
- Publication number
- CN113837842A CN113837842A CN202111147775.8A CN202111147775A CN113837842A CN 113837842 A CN113837842 A CN 113837842A CN 202111147775 A CN202111147775 A CN 202111147775A CN 113837842 A CN113837842 A CN 113837842A
- Authority
- CN
- China
- Prior art keywords
- commodity
- user
- commodities
- data
- browsing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000011218 segmentation Effects 0.000 claims abstract description 26
- 230000006399 behavior Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0603—Catalogue ordering
Abstract
本申请公开了一种基于用户行为数据的商品推荐方法及设备,用以解决电商平台在为用户推荐商品时针对性不强的技术问题。其中,按照预设的时间间隔,获取用户的行为数据;其中,行为数据包括用户的搜索数据、浏览数据和购买数据;以及根据购买数据和浏览数据,确定用户是否为新用户;在用户为新用户的情况下,对用户的搜索数据进行分词,以确定对应的搜索关键词;确定其他用户针对搜索关键词所最终购买的商品,并对商品进行推荐;以及在用户不为新用户的情况下,确定各商品类型对应的总浏览次数和总浏览时长,以确定用户感兴趣的商品;根据用户感兴趣的商品所对应的浏览数据,确定针对用户的若干推荐商品。
Description
技术领域
本申请涉及大数据技术领域,尤其涉及一种基于用户行为数据的商品推荐方法及设备。
背景技术
互联网的兴起带动了互联网市场的发展,而“互联网+”时代的到来更是为电子商务的发展开辟了新的前景。随着网络购物的市场消费占比越来越大,各种电商平台蓬勃发展,从而积累了庞大的用户数据资源,面向海量信息资源的商品推荐技术也因此有了较大发展。
商品推荐技术具有强大的营销优势,它可以向消费者提供商品和信息的建议,模拟销售人员帮助客户完成购买决策过程,为电商网站提供有效的营销决策支持。然而,现今的信息过载问题日益严重,电商平台在进行商品推荐时针对性不强,影响消费者购物体验。
发明内容
本申请公开了一种基于用户行为数据的商品推荐方法及设备,用以解决电商平台进行在为用户推荐商品时针对性不强的技术问题。
一方面,本申请实施例提供了一种基于用户行为数据的商品推荐方法,方法包括:按照预设的时间间隔,获取用户的行为数据;其中,行为数据包括用户的搜索数据、浏览数据和购买数据;以及根据购买数据和浏览数据,确定用户是否为新用户;在用户为新用户的情况下,对用户的搜索数据进行分词,以确定对应的搜索关键词;其中,搜索关键词至少包括商品类型;根据用户的第一搜索关键词,以及其他用户的第二搜索关键词、购买数据,确定其他用户针对所述第一搜索关键词所最终购买的商品,并对商品进行推荐;以及在用户不为新用户的情况下,根据用户针对各商品类型对应商品的浏览数据,确定各商品类型对应的总浏览次数和总浏览时长,以确定用户感兴趣的商品;根据用户感兴趣的商品所对应的浏览数据,确定针对用户的若干推荐商品。
在本申请的一种实现方式中,根据用户感兴趣的商品所对应的浏览数据,确定针对用户的若干推荐商品,具体包括:对所述用户感兴趣的商品所对应的浏览数据进行分词,得到相应的浏览关键词;将所述浏览关键词与预设商品信息库中的商品关键词进行对比,计算所述浏览关键词与所述商品关键词的相似度;确定相似度大于第一预设阈值的商品为待推荐商品,并根据所述相似度和用户的消费水平,从所述待推荐商品中确定针对用户的若干推荐商品。
在本申请的一种实现方式中,根据相似度和用户的消费水平,从待推荐商品中确定针对用户的若干推荐商品之前,所述方法还包括:针对所述预设商品信息库中存在的各商品,获取各所述商品对应的商品类型和商品价格;以及确定各所述商品所属的商品类型对应的价格区间,以对各所述商品的层次进行划分;根据所述用户的购买数据,确定所述用户针对不同商品类型的各商品的成交价格;根据各所述商品的成交价格及对应的层次,确定用户针对该商品类型的消费水平。
在本申请的一种实现方式中,根据相似度和用户的消费水平,从待推荐商品中确定针对用户的若干推荐商品,具体包括:按照相似度由大到小的顺序,对各待推荐商品进行排序,以得到相应的待推荐商品序列;针对不同的商品类型,从所述待推荐商品序列中,根据用户的消费水平,依次确定推荐商品。
在本申请的一种实现方式中,根据用户的第一搜索关键词,以及其他用户的第二搜索关键词、购买数据,确定其他用户针对所述第一搜索关键词所最终购买的商品,并对商品进行推荐,具体包括:根据所述用户的第一搜索关键词和其他用户的第二搜索关键词,确定搜索过所述第一搜索关键词的目标用户;根据各所述目标用户对应的购买数据,确定针对所述第一搜索关键词对应的不同商品风格的成交率;按照所述成交率由高到低的顺序,依次对相应的商品进行推荐。
在本申请的一种实现方式中,确定用户感兴趣的商品,具体包括:分别确定各商品类型对应的第一权重和第二权重;其中,所述第一权重对应商品类型的总浏览次数,所述第二权重对应商品类型的总浏览时长;确定所述总浏览次数和所述总浏览时长分别对应的加权系数,根据所述第一权重、所述第二权重以及所述加权系数,对所述总浏览次数和所述总浏览时长进行加权求和;将加权求和结果大于第二预设阈值的商品类型对应的各商品,作为用户的感兴趣商品。
在本申请的一种实现方式中,对用户感兴趣的商品所对应的浏览数据进行分词,得到相应的浏览关键词,具体包括:基于预设的MapReduce模型,将所述用户感兴趣的商品对应的浏览数据以行为单位进行分割,以将所述浏览数据拆分为键值和商品信息;其中,一行浏览数据对应一个商品信息,所述键值用于标记其所在行的商品;提取各所述键值,并基于IKAnalyzer分词工具包,对各所述键值对应的商品信息进行分词,以得到相应的浏览关键词;将所述浏览关键词输入至Hadoop分布式文件系统中,以将所述浏览关键词与所述预设商品信息库中的商品关键词进行对比。
在本申请的一种实现方式中,获取用户在当前时间段内的行为数据之前,所述方法还包括:获取电商平台的各商品数据,并对各所述商品数据进行分词处理,以确定各所述商品对应的商品关键词;其中,所述商品关键词至少包括商品类型、商品名称、商品价格;针对各所述商品,确定所述商品的唯一编码,以根据所述唯一编码和所述商品关键词,构建商品信息库;将所述商品信息库存入所述Hadoop分布式文件系统中。
在本申请的一种实现方式中,确定针对用户的若干推荐商品之后,所述方法还包括:基于电商平台,获取各所述推荐商品对应的图片信息;按照各所述推荐商品的排列顺序,依次将各所述推荐商品对应的图片信息与其他推荐商品对应的图片信息进行对比,以确定任意两个推荐商品之间的图片相似度;在所述图片相似度大于第三预设阈值的情况下,从各所述推荐商品中删除重复的推荐商品。
另一方面,本申请实施例还提供了一种基于用户行为数据的商品推荐设备,设备包括:处理器;及存储器,其上存储有可执行代码,当可执行代码被执行时,使得处理器执行如上述的一种基于用户行为数据的商品推荐方法。
本申请实施例提供的一种基于用户行为数据的商品推荐方法及设备,通过获取用户行为数据对不同用户进行个性化的商品推荐,既能够对商品进行潜在客户的挖掘,还为用户解决了信息过载的问题,使用户在面对海量商品信息时能快速获得满足自己需求的商品,提高用户购物满意度和用户忠诚度,实现数据的增值。同时,还可以模拟销售人员帮助客户完成购买决策过程,为电商平台提供有效的营销决策支持。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种基于用户行为数据的商品推荐方法流程图;
图2为本申请实施例提供的一种浏览数据分词流程图;
图3为本申请实施例提供的一种基于用户行为数据的商品推荐设备结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
图1为本申请实施例提供的一种基于用户行为数据的商品推荐方法流程图。如图1所示,本申请实施例提供的一种基于用户行为数据的商品推荐方法主要包括以下步骤:
S101、服务器按照预设的时间间隔,获取用户的行为数据。
需要说明的是,用户行为通俗来讲就是用户的所作所为,对于线上商城来说,用户对物品的搜索、浏览、加入购物车、购买和退换货等行为都可作为用户行为。在本申请实施例中,用户行为数据包括用户的搜索数据、浏览数据和购买数据。
服务器按照预设的时间间隔,获取用户行为数据,并基于用户行为数据,每间隔一段时间更新推荐商品,确保了推荐机制的实时性和针对性。若用户为新注册的用户,电商平台中没有对应的购买数据和浏览数据,那么将无法根据该用户的历史行为数据确定其使用偏好。因此,服务器在获取到用户行为数据之后,首先需根据购买数据和浏览数据是否为空值,确定用户是否为新用户。
需要说明的是,本申请实施例服务器作为执行主体,只是示例性的存在,不局限于服务器作为执行主体,具体可根据实际情况调整。
S102、在用户为新用户的情况下,服务器对用户的搜索数据进行分词,以确定对应的搜索关键词;其中,搜索关键词至少包括商品类型和商品名称;
在用户为新用户的情况下,服务器能够根据用户的搜索关键词进行跟踪推荐。具体地,服务器首先需通过IKAnalyzer分词工具包,对用户的搜索数据进行分词。IKAnalyzer是一个基于java语言开发的开源的轻量级中文分词工具包,其中IKAnalyzer2012采用了特有的正向迭代最细粒度切分算法,支持细粒度和智能分词两种切分模式,在中文分词领域具有极高的准确性。对搜索数据进行分词后便得到了相应的搜索关键词,其中,搜索关键词至少包括商品类型。例如,用户的搜索数据若为“秋季连衣裙”,通过分词可获得搜索关键词“秋季”和“连衣裙”,其中的“连衣裙”则为商品类型。
S103、服务器根据用户的搜索关键词,以及其他用户的搜索关键词、购买数据,确定其他用户针对搜索关键词所最终购买的商品,并对商品进行推荐。
对于新用户来说,电商平台中没有与之相关的历史行为数据,此时服务器能够根据其他用户的购买偏好对新用户进行相同商品类型的商品推荐。
具体地,服务器根据用户的第一搜索关键词和其他用户的第二搜索关键词,确定搜索过第一搜索关键词的目标用户;根据各目标用户对应的购买数据,确定针对第一搜索关键词对应的不同商品风格的成交率;按照成交率由高到低的顺序,依次对相应的商品进行推荐。
例如,若用户搜索“连衣裙”这一关键词,市面上连衣裙的风格有韩版、法式、小清新等风格。通过确定搜索过“连衣裙”关键词的其他用户的最终购买数据,可确定不同风格的连衣裙分别对应的成交率,若韩版的成交率为70%,法式为50%,小清新为23%,那么可按照成交率由高到低的顺序依次推荐韩版、法式、小清新风格的连衣裙给用户。
需要说明的是,本申请实施例也能够根据不同商品风格的评价、价格等排序条件对用户进行商品推荐,具体过程与上述成交率类似,本申请对此不进行赘述。
本申请实施例根据用户行为数据对用户的身份进行了确定,这样在用户不具有浏览和购买行为时,也能够根据搜索数据进行相应商品的推荐,提高了商品推荐的用户针对性,并且,根据其他用户的行为数据对新用户进行推荐,能够使得商品的推荐更具有参考性。
需要说明的是,可以先执行步骤S102、S103再执行S104和S105,或者可以先执行S104、S105再执行S102、S103,亦或者可以S102、S103和S104、S105同时执行,在本申请实施例中不做限定。
S104、在用户不为新用户的情况下,服务器根据用户针对各商品类型对应商品的浏览数据,确定各商品类型对应的总浏览次数和总浏览时长,以确定用户感兴趣的商品。
用户浏览行为是商品推荐的重要依据,大型电商平台一般都会记录用户浏览行为的时间脉络,可以掌握用户在何时看到了什么商品以及对该商品的浏览次数和浏览时长。浏览行为的时长及次数可以表明用户是否对此商品感兴趣,因此,服务器能够根据各商品类型对应的总浏览次数和总浏览时长,确定用户感兴趣的商品。
具体地,服务器根据用户对于各商品类型的商品的总浏览次数和总浏览时长,分别确定各商品类型对应的第一权重和第二权重;其中,第一权重对应商品类型的总浏览次数,第二权重对应商品类型的总浏览时长。需要说明的是,总浏览次数和总浏览时长为预设时间间隔内的浏览行为数据,可随着时间不断进行更新。
进一步地,服务器确定总浏览次数和总浏览时长分别对应的加权系数,根据第一权重、第二权重以及加权系数,对总浏览次数和总浏览时长进行加权求和。
进一步地,将加权求和结果大于第二预设阈值的商品类型对应的各商品,作为用户的感兴趣商品。只有当用户对商品的感兴趣程度超过一定水平时,才会认定该商品为感兴趣商品。商品的浏览次数越多、浏览时长越长,用户对该商品的感兴趣程度就越高。
本申请实施例根据用户的浏览次数和浏览时长对商品赋予权重,并根据加权求和的结果作为最后的商品筛选结果,更加直观且准确。
S105、根据用户感兴趣的商品所对应的浏览数据,确定针对用户的若干推荐商品。
服务器在锁定用户感兴趣的商品之后,首先对感兴趣商品对应的浏览数据进行分词,从而得到相应的浏览关键词。需要说明的是,浏览数据至少包括商品名称、浏览时长、浏览次数,而浏览关键词是将各商品名称进行分词得到的。
在一个实施例中,为保证灵活性和可扩展性,服务器通过预设的MapReduce模型以及IKAnalyzer分词工具包进行数据分词。其处理过程包括:
首先,服务器基于预设的MapReduce模型,将用户感兴趣的商品对应的浏览数据以行为单位进行分割。浏览数据一般包括多条商品信息,将浏览数据按行分割后,一行浏览数据则对应一个商品信息。在进行分割时,各行浏览数据会生成相应的键值,键值用于标记其所在行的商品。
其次,浏览数据进行分割后,每一行均包括键值和对应的商品名称。服务器提取各键值,然后通过IKAnalyzer分词工具包,对各键值对应的商品信息进行分词,从而得到相应的浏览关键词。
最后,服务器将各行的浏览关键词汇总后,输入至Hadoop分布式文件系统(HadoopDistributed File System,HDFS)中去。这样通过HDFS系统便可完成后续的相似度对比,相较于普通数据库,数据容纳量更大,处理速度也相应更快。
图2为本申请实施例提供的一种浏览数据分词流程图。如图2所示,对于HDFS中的海量数据来说,单机处理的效率较低。因此,用户浏览数据在进行分词时可通过多个Mapper类将数据打散。之后,各Mapper类再进行局部处理,执行按行分割文件,从而得到多行的商品浏览数据。对于每行数据来说,提取其中的键值,并对键值标识的各商品名称进行文本分词,之后将分词后的浏览关键词输入至预设商品信息库中进行关键词之间的相似度分析。最后,通过MapReduce模型内置的reduce函数,对每个Mapper的数据进行汇总,从而得到最终的推荐结果。通过MapReduce模型将数据处理任务分解为多个任务并进行初步处理,之后再把各个Mapper的处理结果汇总起来得到最终结果,这种打散再重组的机制实现了多任务并发式处理,提升了数据处理效率。
服务器在得到浏览关键词后,会将各商品对应的浏览关键词与预设商品信息库中存有的各商品对应的商品关键词进行对比,并计算重复关键词的数量,这样便可根据重复关键词的数量确定浏览关键词和商品关键词的相似度。需要说明的是,预设商品信息库中存有电商平台中全部商品的商品关键词
例如,用户的浏览数据为“PRADA早春无袖连衣裙女”,对其进行分词后可得到浏览关键词“PRADA”“早春”“无袖”“连衣裙”“女”。假设预设商品信息库存有的商品关键词为“1,短裙,李宁,PRADA,夏”“2,连衣裙,GUCCI,早春”“3,连衣裙,PRADA,早春,长袖”,将浏览关键词依次与上述商品对应的商品关键词进行对比,可知1号商品重复关键词数为1,2号商品重复关键词数为2,3号商品重复关键词数为3。关键度则由重复关键词数与浏览关键词之间的比值确定。因此,可确定3号商品是与用户浏览商品相似度最高的商品。
需要说明的是,服务器在获取用户的行为数据之前,会预先构建商品信息库并将其存入HDFS中去,以便在后续进行商品推荐时,能够直接对比调用,提高了处理速度。
具体地,服务器获取电商平台的各商品数据,并对各商品数据进行分词处理,得到各商品对应的商品关键词。其中,商品关键词至少包括商品类型、商品名称、商品价格。之后针对各商品,确定用于标识商品的唯一编码(id),从而根据唯一编码和商品关键词,构建商品信息库。并在构建完存有商品关键词的商品信息库后,将其存入HDFS中。HDFS适合大规模数据集上的应用,将商品信息库存入HDFS中能为海量的用户行为数据提供存储,提高访问量和数据吞吐量。
服务器在得到用户浏览商品与预设商品信息库中存在商品的相似度后,需将相似度大于第一预设阈值的商品列为待推荐商品,只有相似度符合一定标准的商品才能够被推荐,这样进一步保证了推荐的准确性。然后,服务器根据相似度和用户的消费水平,从待推荐商品中确定针对用户的若干推荐商品。
具体地,服务器按照相似度由大到小的顺序,对各待推荐商品进行排序,以得到相应的待推荐商品序列。用户浏览数据一般为多条,且从预设商品信息库中可以找到与之匹配的多件商品,因此,服务器需针对不同的商品类型,从待推荐商品序列中,找到价格与用户消费水平符合的多个商品,然后按照相似度顺序依次确定推荐商品。
在一个实施例中,服务器在从待推荐商品中确定针对用户的若干推荐商品之前,需确定用户对于各类型的商品的消费水平,避免推荐与用户预期价格不符合的商品,从而使推荐更为精准。
具体地,服务器需确定商品信息库中各商品的商品类型和商品价格,并针对不同的商品类型,根据该商品类型下的各商品的价格,确定该商品类型对应的价格区间。其中,价格区间表示商品价格的浮动区间。
在一种可能实现的方式中,服务器能够根据价格区间对商品的层次进行划分,进行层次划分时不是简单的对价格区间进行分割,而是需要确定不同价格对应的商品数量,然后根据该商品在不同价格范围内的分布密度确定其概率,从而根据概率值对商品层次进行进一步的划分。
进一步地,服务器根据用户的购买数据,确定用户针对不同商品类型的各商品的成交价格。然后将用户的成交价格与各价格层次进行匹配,从而确定出用户在购买不同商品类型的商品时的消费水平。
在一个实施例中,服务器在确定针对用户的若干推荐商品之后,会对推荐商品进行进一步的调整。
具体地,服务器基于电商平台,获取各推荐商品的图片信息。之后,按照各推荐商品的排列顺序,依次将各推荐商品对应的图片信息与其他推荐商品对应的图片信息进行两两对比,并确定任意两个商品图片信息的相似度。当图片相似度大于第三预设阈值的时候,便将顺序靠后的图片从推荐商品中删除。通过比对推荐商品对应的图片信息,能够在相似商品的基础上进一步排除重复商品,避免给用户推荐到不同品牌但是类型、样式均相同的商品,降低推荐商品的重复度,使推荐更为精准。
以上为本申请提出的方法实施例。基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备。
图3为本申请实施例提供的一种基于用户行为数据的商品推荐设备结构示意图。如图3所示,设备包括:至少一个处理器301以及与至少一个处理器301通信连接的存储器302,存储器302存储有可被至少一个处理器301执行的指令,指令被至少一个处理器301执行,以使至少一个处理器301能够执行如上所述的基于用户行为数据的商品推荐方法。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种基于用户行为数据的商品推荐方法,其特征在于,所述方法包括:
按照预设的时间间隔,获取用户的行为数据;其中,所述行为数据包括所述用户的搜索数据、浏览数据和购买数据;以及根据所述购买数据和所述浏览数据,确定所述用户是否为新用户;
在所述用户为新用户的情况下,对所述用户的搜索数据进行分词,以确定对应的搜索关键词;其中,所述搜索关键词至少包括商品类型;
根据所述用户的第一搜索关键词,以及其他用户的第二搜索关键词、购买数据,确定其他用户针对所述第一搜索关键词所最终购买的商品,并对商品进行推荐;以及
在所述用户不为新用户的情况下,根据所述用户针对各商品类型对应商品的浏览数据,确定各所述商品类型对应的总浏览次数和总浏览时长,以确定用户感兴趣的商品;
根据所述用户感兴趣的商品所对应的浏览数据,确定针对所述用户的若干推荐商品。
2.根据权利要求1所述的一种基于用户行为数据的商品推荐方法,其特征在于,根据所述用户感兴趣的商品所对应的浏览数据,确定针对所述用户的若干推荐商品,具体包括:
对所述用户感兴趣的商品所对应的浏览数据进行分词,得到相应的浏览关键词;
将所述浏览关键词与预设商品信息库中的商品关键词进行对比,计算所述浏览关键词与所述商品关键词的相似度;
确定相似度大于第一预设阈值的商品为待推荐商品,并根据所述相似度和所述用户的消费水平,从所述待推荐商品中确定针对所述用户的若干推荐商品。
3.根据权利要求2所述的一种基于用户行为数据的商品推荐方法,其特征在于,根据所述相似度和用户的消费水平,从所述待推荐商品中确定针对所述用户的若干推荐商品之前,所述方法还包括:
针对所述预设商品信息库中存在的各商品,获取各所述商品对应的商品类型和商品价格;以及确定各所述商品所属的商品类型对应的价格区间,以对各所述商品的层次进行划分;
根据所述用户的购买数据,确定所述用户针对不同商品类型的各商品的成交价格;
根据各所述商品的成交价格及对应的层次,确定用户针对该商品类型的消费水平。
4.根据权利要求3所述的一种基于用户行为数据的商品推荐方法,其特征在于,根据所述相似度和所述用户的消费水平,从所述待推荐商品中确定针对所述用户的若干推荐商品,具体包括:
按照相似度由大到小的顺序,对各所述待推荐商品进行排序,以得到相应的待推荐商品序列;
针对不同的商品类型,从所述待推荐商品序列中,根据所述用户的消费水平,依次确定推荐商品。
5.根据权利要求1所述的一种基于用户行为数据的商品推荐方法,其特征在于,根据所述用户的第一搜索关键词,以及其他用户的第二搜索关键词、购买数据,确定其他用户针对所述第一搜索关键词所最终购买的商品,并对商品进行推荐,具体包括:
根据所述用户的第一搜索关键词和其他用户的第二搜索关键词,确定搜索过所述第一搜索关键词的目标用户;
根据各所述目标用户对应的购买数据,确定针对所述第一搜索关键词对应的不同商品风格的成交率;
按照所述成交率由高到低的顺序,依次对相应的商品进行推荐。
6.根据权利要求1所述的一种基于用户行为数据的商品推荐方法,其特征在于,确定用户感兴趣的商品,具体包括:
分别确定各商品类型对应的第一权重和第二权重;其中,所述第一权重对应商品类型的总浏览次数,所述第二权重对应商品类型的总浏览时长;
确定所述总浏览次数和所述总浏览时长分别对应的加权系数,根据所述第一权重、所述第二权重以及所述加权系数,对所述总浏览次数和所述总浏览时长进行加权求和;
将加权求和结果大于第二预设阈值的商品类型对应的各商品,作为用户的感兴趣商品。
7.根据权利要求2所述的一种基于用户行为数据的商品推荐方法,其特征在于,对所述用户感兴趣的商品所对应的浏览数据进行分词,得到相应的浏览关键词,具体包括:
基于预设的MapReduce模型,将所述用户感兴趣的商品对应的浏览数据以行为单位进行分割,以将所述浏览数据拆分为键值和商品信息;其中,一行浏览数据对应一个商品信息,所述键值用于标记其所在行的商品;
提取各所述键值,并基于IKAnalyzer分词工具包,对各所述键值对应的商品信息进行分词,以得到相应的浏览关键词;
将所述浏览关键词输入至Hadoop分布式文件系统中,以将所述浏览关键词与所述预设商品信息库中的商品关键词进行对比。
8.根据权利要求7所述的一种基于用户行为数据的商品推荐方法,其特征在于,获取用户在当前时间段内的行为数据之前,所述方法还包括:
获取电商平台的各商品数据,并对各所述商品数据进行分词处理,以确定各所述商品对应的商品关键词;其中,所述商品关键词至少包括商品类型、商品名称、商品价格;
针对各所述商品,确定所述商品的唯一编码,以根据所述唯一编码和所述商品关键词,构建商品信息库;
将所述商品信息库存入所述Hadoop分布式文件系统中。
9.根据权利要求1所述的一种基于用户行为数据的商品推荐方法,其特征在于,确定针对所述用户的若干推荐商品之后,所述方法还包括:
基于电商平台,获取各所述推荐商品对应的图片信息;
按照各所述推荐商品的排列顺序,依次将各所述推荐商品对应的图片信息与其他推荐商品对应的图片信息进行对比,以确定任意两个推荐商品之间的图片相似度;
在所述图片相似度大于第三预设阈值的情况下,从各所述推荐商品中删除重复的推荐商品。
10.一种基于用户行为数据的商品推荐设备,其特征在于,所述设备包括:
处理器;
及存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-9任一项所述的一种基于用户行为数据的商品推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147775.8A CN113837842A (zh) | 2021-09-29 | 2021-09-29 | 一种基于用户行为数据的商品推荐方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147775.8A CN113837842A (zh) | 2021-09-29 | 2021-09-29 | 一种基于用户行为数据的商品推荐方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113837842A true CN113837842A (zh) | 2021-12-24 |
Family
ID=78967383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111147775.8A Pending CN113837842A (zh) | 2021-09-29 | 2021-09-29 | 一种基于用户行为数据的商品推荐方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837842A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115482065A (zh) * | 2022-09-22 | 2022-12-16 | 保利和悦生活科技服务有限公司 | 基于大数据与电子商城平台的购物数据共享方法及系统 |
CN115577167A (zh) * | 2022-08-29 | 2023-01-06 | 建信金融科技有限责任公司 | 基于Webassembly的内容推荐方法、装置、设备及存储介质 |
CN116823409A (zh) * | 2023-08-29 | 2023-09-29 | 南京大数据集团有限公司 | 一种基于目标搜索数据的智能筛选方法及系统 |
CN117132368A (zh) * | 2023-10-26 | 2023-11-28 | 深圳企域数字科技有限公司 | 一种基于ai的新媒体智能营销平台 |
CN117710054A (zh) * | 2023-12-20 | 2024-03-15 | 塞奥斯(北京)网络科技有限公司 | 线上商城商品智能化展示系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942712A (zh) * | 2014-05-09 | 2014-07-23 | 北京联时空网络通信设备有限公司 | 基于产品相似度的电子商务推荐系统及其方法 |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
EP3079116A1 (en) * | 2015-04-10 | 2016-10-12 | Tata Consultancy Services Limited | System and method for generating recommendations |
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
CN110609950A (zh) * | 2019-08-02 | 2019-12-24 | 济南大学 | 一种舆情系统搜索词推荐方法及系统 |
CN111046221A (zh) * | 2019-12-17 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 歌曲推荐方法、装置、终端设备以及存储介质 |
CN111782956A (zh) * | 2020-07-08 | 2020-10-16 | 重庆帮企科技集团有限公司 | 一种基于用户行为和关键词分类的搜索方法 |
-
2021
- 2021-09-29 CN CN202111147775.8A patent/CN113837842A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103942712A (zh) * | 2014-05-09 | 2014-07-23 | 北京联时空网络通信设备有限公司 | 基于产品相似度的电子商务推荐系统及其方法 |
EP3079116A1 (en) * | 2015-04-10 | 2016-10-12 | Tata Consultancy Services Limited | System and method for generating recommendations |
CN105224699A (zh) * | 2015-11-17 | 2016-01-06 | Tcl集团股份有限公司 | 一种新闻推荐方法及装置 |
CN110609950A (zh) * | 2019-08-02 | 2019-12-24 | 济南大学 | 一种舆情系统搜索词推荐方法及系统 |
CN110532479A (zh) * | 2019-09-05 | 2019-12-03 | 北京思维造物信息科技股份有限公司 | 一种信息推荐方法、装置及设备 |
CN111046221A (zh) * | 2019-12-17 | 2020-04-21 | 腾讯科技(深圳)有限公司 | 歌曲推荐方法、装置、终端设备以及存储介质 |
CN111782956A (zh) * | 2020-07-08 | 2020-10-16 | 重庆帮企科技集团有限公司 | 一种基于用户行为和关键词分类的搜索方法 |
Non-Patent Citations (4)
Title |
---|
姚树春: "大数据技术与应用", 30 June 2018, 成都:西南交通大学出版社, pages: 167 - 169 * |
张妍等: "基于云计算的中文分词研究", 《河北科技大学学报》, vol. 33, no. 3, 30 June 2012 (2012-06-30), pages 1 - 3 * |
改变世界的产品经理: "数据中台:从0到1打造一个离线推荐系统", Retrieved from the Internet <URL:https://www.woshipm.com/pd/4497253.html> * |
李欢;: "个性化搜索引擎中关键词推荐专利技术综述", 科技创新与应用, no. 05, 18 February 2017 (2017-02-18) * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115577167A (zh) * | 2022-08-29 | 2023-01-06 | 建信金融科技有限责任公司 | 基于Webassembly的内容推荐方法、装置、设备及存储介质 |
CN115577167B (zh) * | 2022-08-29 | 2023-11-21 | 建信金融科技有限责任公司 | 基于Webassembly的内容推荐方法、装置、设备及存储介质 |
CN115482065A (zh) * | 2022-09-22 | 2022-12-16 | 保利和悦生活科技服务有限公司 | 基于大数据与电子商城平台的购物数据共享方法及系统 |
CN116823409A (zh) * | 2023-08-29 | 2023-09-29 | 南京大数据集团有限公司 | 一种基于目标搜索数据的智能筛选方法及系统 |
CN116823409B (zh) * | 2023-08-29 | 2023-12-01 | 南京大数据集团有限公司 | 一种基于目标搜索数据的智能筛选方法及系统 |
CN117132368A (zh) * | 2023-10-26 | 2023-11-28 | 深圳企域数字科技有限公司 | 一种基于ai的新媒体智能营销平台 |
CN117132368B (zh) * | 2023-10-26 | 2024-01-30 | 深圳企域数字科技有限公司 | 一种基于ai的新媒体智能营销平台 |
CN117710054A (zh) * | 2023-12-20 | 2024-03-15 | 塞奥斯(北京)网络科技有限公司 | 线上商城商品智能化展示系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Turning clicks into purchases: Revenue optimization for product search in e-commerce | |
CN105989004B (zh) | 一种信息投放的预处理方法和装置 | |
CN111523976B (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
CN113837842A (zh) | 一种基于用户行为数据的商品推荐方法及设备 | |
CN108121737B (zh) | 一种业务对象属性标识的生成方法、装置和系统 | |
CN104866474B (zh) | 个性化数据搜索方法及装置 | |
JP2016511906A (ja) | 商品検索結果の順位付け | |
CN108073667B (zh) | 产生用户浏览属性的方法、以及非暂存计算机可读介质 | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
US9330071B1 (en) | Tag merging | |
Hung et al. | When social influence meets item inference | |
CN115544242B (zh) | 基于大数据的同类商品选型推荐方法 | |
WO2020221022A1 (zh) | 业务对象推荐方法 | |
CN112149003B (zh) | 商品社群推荐方法、装置和计算机设备 | |
CN108153792A (zh) | 一种数据处理方法和相关装置 | |
Lin et al. | A consumer review-driven recommender service for web e-commerce | |
CN114896517A (zh) | 一种商品推荐方法、系统、设备及存储介质 | |
CN111782937A (zh) | 信息排序方法、装置、电子设备和计算机可读介质 | |
US11494686B1 (en) | Artificial intelligence system for relevance analysis of data stream items using similarity groups and attributes | |
Niu et al. | Predictive analytics of E-commerce search behavior for conversion | |
Aprilianti et al. | Implementation of weighted parallel hybrid recommender systems for e-commerce in indonesia | |
US20230101928A1 (en) | User attribute preference model | |
CN110427545B (zh) | 一种信息推送方法及系统 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
Cao et al. | Distributed design and implementation of SVD++ algorithm for e-commerce personalized recommender system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |