CN103646341A - 一种网站提供对象的推荐方法和装置 - Google Patents
一种网站提供对象的推荐方法和装置 Download PDFInfo
- Publication number
- CN103646341A CN103646341A CN201310629090.6A CN201310629090A CN103646341A CN 103646341 A CN103646341 A CN 103646341A CN 201310629090 A CN201310629090 A CN 201310629090A CN 103646341 A CN103646341 A CN 103646341A
- Authority
- CN
- China
- Prior art keywords
- user
- attribute information
- website
- website providing
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000007418 data mining Methods 0.000 claims abstract description 25
- 238000005065 mining Methods 0.000 claims description 32
- 238000002372 labelling Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000002537 cosmetic Substances 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种网站提供对象的推荐方法和装置。所述方法包括:根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注,根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。本发明的技术方案,由于根据已知的数据进行数据挖掘,推测出用户的属性信息,进而结合用户的属性信息进行推荐,保证了向用户推荐的商品的多样性,及时发现用户对产品的潜在需求,同时无需所有用户填写个人的属性信息。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种网站提供对象的推荐方法和装置。
背景技术
推荐系统是目前很多视频网站、音乐网站和购物网站等后台所使用的系统。它根据来访的用户的特点,计算出最适合推荐给该用户的候选产品,然后把这些产品展现给用户,供其选择。由于产品数量和用户数量非常庞大,推荐系统大量使用到了基于云计算的数据挖掘技术,通过挖掘用户行为和商品信息,来计算推荐列表。
数据挖掘(Data Mining)又称数据库中的知识发现(Knowledge Discoverin Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助调整市场策略,减少风险,做出正确的决策。
现有的推荐产品的方法中,最具代表性的一种是同类产品推荐,该推荐方法过程如下:
1.用户在网站购物的过程中,会形成浏览记录和订单记录;
2.当用户第一次进入网站购物时,由于没有相关记录,因此向其推荐当前热门产品;
3.当用户再次进入网站购物时,根据用户的浏览记录和订单记录,向其推荐记录中同类型的产品。
上述方法的缺点是,向用户推荐的产品多样性不够,不能发现用户对其他产品的潜在需求。用户往往对已买过的产品兴趣会下降。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种网站提供对象的推荐方法和装置。
依据本发明的一个方面,提供了一种网站提供对象的推荐方法,该方法包括:
根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
可选地,该方法进一步包括:
如果一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录,则向该用户推荐热门的网站提供对象。
可选地,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息包括:
步骤A、对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
步骤B、查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
步骤C、对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
步骤D、对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
可选地,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息进一步包括:
步骤E、将步骤D中标注了属性信息的用户归并到步骤A中的所述多个用户集合,重复执行步骤B到E,如此循环迭代,直到没有的新的用户加入到所述多个用户集合中。
可选地,所述根据用户的属性信息及用户订单记录选出相应的网站提供对象包括:
从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;
或者,
从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
可选地,
所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;
所述网站为购物网站、电子书网站、音乐网站或视频网站。
依据本发明的另一个方面,提供了一种网站提供对象的推荐装置,该装置包括:
数据挖掘单元,适于根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
推荐单元,适于根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
可选地,所述推荐单元,进一步适于在一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录时,向该用户推荐热门的网站提供对象。
可选地,所述数据挖掘单元包括:
第一挖掘子单元,适于对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
第二挖掘子单元,适于查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
第三挖掘子单元,适于对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
第四挖掘子单元,适于对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
可选地,所述数据挖掘单元进一步包括:
第五挖掘子单元,将第四挖掘子单元标注了属性信息的用户归并到所述多个用户集合中;
第二到第五挖掘子单元进一步循环执行上述操作,直到没有的新的用户加入到所述多个用户集合中。
可选地,所述推荐单元,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;或者,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
可选地,
所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;
所述网站为购物网站、电子书网站、音乐网站或视频网站。
本发明的这种根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注,根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户的技术方案,由于根据已知的数据进行数据挖掘,推测出用户的属性信息,进而结合用户的属性信息进行推荐,保证了向用户推荐的商品的多样性,及时发现用户对产品的潜在需求,同时无需所有用户填写个人的属性信息。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
可以向用户推荐其没有浏览或购买过的商品类别,大大增强了多样性;无需用户填写个人信息,而是利用云计算的数据挖掘技术从用户的浏览记录和购买记录中推测出用户性别这个关键推荐依据,从而能够向用户推荐适合他/她的产品,提高推荐准确度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种网站提供对象的推荐方法的流程图;
图2示出了根据本发明一个实施例的推测未填写属性信息的用户的属性信息的方法流程;
图3示出了根据本发明一个实施例的一种网站提供对象的推荐装置的结构图;
图4示出了根据本发明一个实施例的数据挖掘单元301的内部结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种网站提供对象的推荐方法的流程图。如图1所示,该方法包括:
步骤S110,根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注。
在本发明的一个实施例中,用户在网站注册时,并不强制填写用户的属性信息,如用户性别信息、用户年龄信息和用户职业信息等。用户可以根据自己的意愿选择填写或不填写这些用户属性信息。用户在网站购物的过程形成浏览记录和订购记录(即订单)。
这里所述的网站可以是购物网站、音乐网站或视频网站或电子书网站等。如果是购物网站,则所述的网站提供对象即为网站销售的商品。如果是音乐网站,则所述网站提供对象即为网站所提供的音乐。以此类推。
在本步骤中,利用云计算的数据挖掘技术,根据部分用户已填写的属性信息、浏览记录和订购记录,推测未填写属性信息的用户的属性信息。
步骤S120,根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
在本发明的一个实施例中,当用户登录网站时,根据步骤S120的方案向用户进行推荐
在图1所示的方法中,由于根据已知的数据进行数据挖掘,推测出用户的属性信息,进而结合用户的属性信息进行推荐,保证了向用户推荐的商品的多样性,及时发现用户对产品的潜在需求,同时无需所有用户填写个人的属性信息。
在本发明的一个实施例中,图1所述的方法进一步包括:如果一个用户第一次登录网站,该用户还没有网站提供对象的浏览记录和订单记录,则向该用户推荐热门的网站提供对象。这里热门的网站提供对象可以是本网站的浏览次数最多或订购数量最多的网站提供对象。
在本发明的一个实施例中,图1所示方法中所述根据用户的属性信息及用户订单记录选出相应的网站提供对象包括:从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;或者,从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购(如浏览和/或订购次数超过预设阀值)的网站提供对象。
在本发明的一个实施例中,图1所述方法的步骤S110的一个具体实现如图2所示。
图2示出了根据本发明一个实施例的推测未填写属性信息的用户的属性信息的方法流程。图如2所示,该方法包括:
步骤S210、对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合。
本步骤,对于已填写属性信息的所有用户,按照其具有的不同的属性分为多个用户集合。例如当用户的属性信息指用户的性别时,将已填写性别的用户,按照其性别划分到男用户集合和女用户集合中。又例如,当用户的属性信息为年龄信息时,将已填写年龄的用户,按照其年龄所在的区间划分到青少年用户集合、中年用户集合和老年用户集合中。又例如,当用户的属性信息为职业信息时,将已填写职业的用户,划分到学生用户集合、白领用户集合、农民用户集合、工人用户集合等中。
步骤S220、查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合。
在本步骤中是将已填写属性信息的用户所浏览后订购过的网站提供对象查找了出来。
步骤S230、对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息。
在本步骤中,用用户的属性信息对网站提供对象进行标注,以表示那一类用户喜欢该网站提供对象。
步骤S240、对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
在本步骤中,利用已进行标注的网站提供对象,再对未填写属性信息的用户的属性信息进行推测。例如以用户属性信息为性别信息为例,如果某个用户的浏览和订购记录表明,该用户更多浏览和订购女性商品,则可以推测用户为女性。
步骤S250、将步骤S240中标注了属性信息的用户归并到所述多个用户集合,重复执行步骤S220到S250,如此循环迭代,直到没有的新的用户加入到所述多个用户集合中。
下面以网站为购物网站,用户的属性信息具体为用户的性别信息为例,对本发明的技术方案进行进一步的说明。具体包括如下几点:
一、用户在网站注册时,可自由选择是否填写个人信息中的性别信息,并不强制。同时,用户在网站购物的过程中,形成浏览记录和订单记录。
二、如果用户是第一次进入网站购物,由于没有相关记录,那么根据各种商品的受欢迎情况,向其推荐当前热门产品,不区分性别。例如向其推荐“手机、化妆品”等。
三、如果用户以后再次访问此网站,那么运用基于云计算的数据挖掘技术,根据用户的浏览记录和订单记录,推测出用户的性别。由于商品数量和用户数量都会非常庞大,因此需要在云计算平台上完成数据挖掘和推荐计算任务。具体的云计算挖掘策略如下:
1.从已注册的所有用户中,找出填写了性别的用户,得到区分性别用户集合;
2.从浏览和订单记录中找出区分性别用户集合中的所有用户浏览和购买过的商品,作为性别区分商品集合;
3.对性别区分商品集合中的每件商品,统计出在区分性别用户集合中的用户有多少人浏览或购买了它,以及其男女比例。若其中某个商品的男性浏览或购买比例超过80%,则将此商品自动标注为男性喜爱商品;若女性购买比例超过80%,则自动标注为女性喜爱商品;若都不符合上述情况,则自动标注为中性商品。注意此步骤仅对性别区分商品集中的商品进行标注,而集合外的商品不会进行标注;
4.使用自动标注后的性别区分商品集合,对那些没有填写性别的用户,统计其浏览或购买过的在性别区分商品集合中的商品数量,并计算出其中男性喜爱商品、女性喜爱商品、中性商品的比例。若某个用户浏览或购买的商品中超过一半商品不在区分性别商品集合中,则不对此用户进行自动性别标注。若超过一半(含一半)商品都在区分性别商品集合中,则如果这些商品里男性喜爱商品超过80%,那么将此用户自动标注为男性;如果女性喜爱商品超过80%,那么自动标注为女性;若都不符合上述情况,则不对此用户进行自动性别标注。将已经自动标注出性别的用户,跟之前的区分性别用户集合进行合并,就得到了新的区分性别用户集合。
5.对于新的区分性别用户集合,重新用于2-4的步骤,又可得到更大的区分性别用户集合。这样不断重复2-4步骤,直到没有新的用户加入区分性别用户集合,则挖掘过程结束。
上述云计算挖掘过程实际上是一个循环迭代过程,从初始的主动填写性别信息的用户开始,通过云计算一轮轮地先扩大区分性别用户集合,然后再扩大区分性别商品集合,交替进行,直到集合收敛为止。
四、若推测出了用户的性别,则向用户推荐该性别人群感兴趣的各种产品,即区分性别商品集合中的商品。可以优先考虑其没买过的商品类别,例如,推测出用户是女性,并且区分性别商品集合中有“手提袋”且用户之前没有买过“手提袋”,那么就向其推荐“手提袋”相关的商品。也可以优先考虑其频繁购买的商品,例如,推测出用户是女性,该用户频繁购买化妆品,则可以向该用户推荐热卖的化妆品。
本发明的上述方案具有如下优点:
1.现有的基于同类商品的推荐方法存在多样性较差的问题,导致用户审美疲劳。而本发明可以向用户推荐其没有浏览或购买过的商品类别,大大增强了多样性。
2.现有的根据用户注册信息的推荐方法太过依赖用户填写信息的健全性,导致多数用户不填信息时,无法对这些用户进行准确的推荐。本发明无需强制用户填写个人信息,而是通过少部分主动填写性别的用户,利用云计算的数据挖掘技术从用户的浏览记录和购买记录中推测出用户性别这个关键推荐依据,从而能够向用户推荐适合他/她的产品,提高推荐准确度。
图3示出了根据本发明一个实施例的一种网站提供对象的推荐装置的结构图。如图3所示,该网站提供对象的推荐装置300包括:
数据挖掘单元301,适于根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
推荐单元302,适于根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
在本发明的一个实施例中,所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;所述网站为购物网站、音乐网站或视频网站。
在本发明的一个实施例中,所述推荐单元302,进一步适于在一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录时,向该用户推荐热门的网站提供对象。
在本发明的一个实施例中,数据挖掘单元301的内部结构如图4所示。
图4示出了根据本发明一个实施例的数据挖掘单元301的内部结构图。如图4所示,数据挖掘单元301包括:
第一挖掘子单元3011,适于对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
第二挖掘子单元3012,适于查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
第三挖掘子单元3013,适于对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
第四挖掘子单元3014,适于对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
第五挖掘子单元3015,将第四挖掘子单元标注了属性信息的用户归并到所述多个用户集合中;
第二到第五挖掘子单元进一步循环执行上述操作,直到没有的新的用户加入到所述多个用户集合中。
在本发明的一个实施例中,推荐单元302,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;或者,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
综上所述,本发明的这种根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注,根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户的技术方案,由于根据已知的数据进行数据挖掘,推测出用户的属性信息,进而结合用户的属性信息进行推荐,保证了向用户推荐的商品的多样性,及时发现用户对产品的潜在需求,同时无需所有用户填写个人的属性信息。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网站提供对象的推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种网站提供对象的推荐方法,该方法包括:根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
A2、如A1所述的方法,其中,该方法进一步包括:如果一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录,则向该用户推荐热门的网站提供对象。
A3、如A1所述的方法,其中,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息包括:
步骤A、对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
步骤B、查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
步骤C、对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
步骤D、对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
A4、如A3所述的方法,其中,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息进一步包括:
步骤E、将步骤D中标注了属性信息的用户归并到步骤A中的所述多个用户集合,重复执行步骤B到E,如此循环迭代,直到没有的新的用户加入到所述多个用户集合中。
A5、如A4所述的方法,其中,所述根据用户的属性信息及用户订单记录选出相应的网站提供对象包括:
从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;
或者,
从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
A6、如A1-5中任一项所述的方法,其中,
所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;
所述网站为购物网站、电子书网站、音乐网站或视频网站。
本发明还公开了B7、一种网站提供对象的推荐装置,该装置包括:
数据挖掘单元,适于根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
推荐单元,适于根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
B8、如B7所述的装置,其中,
所述推荐单元,进一步适于在一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录时,向该用户推荐热门的网站提供对象。
B9、如B7所述的装置,其中,所述数据挖掘单元包括:
第一挖掘子单元,适于对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
第二挖掘子单元,适于查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
第三挖掘子单元,适于对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
第四挖掘子单元,适于对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
B10、如B9所述的装置,其中,所述数据挖掘单元进一步包括:
第五挖掘子单元,将第四挖掘子单元标注了属性信息的用户归并到所述多个用户集合中;
第二到第五挖掘子单元进一步循环执行上述操作,直到没有的新的用户加入到所述多个用户集合中。
B11、如B10所述的装置,其中,
所述推荐单元,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;或者,适于从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
B12、如B7-11中任一项所述的装置,其中,
所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;
所述网站为购物网站、电子书网站、音乐网站或视频网站。
Claims (10)
1.一种网站提供对象的推荐方法,该方法包括:
根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
2.如权利要求1所述的方法,其中,该方法进一步包括:
如果一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录,则向该用户推荐热门的网站提供对象。
3.如权利要求1所述的方法,其中,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息包括:
步骤A、对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
步骤B、查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
步骤C、对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
步骤D、对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
4.如权利要求3所述的方法,其中,所述根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息进一步包括:
步骤E、将步骤D中标注了属性信息的用户归并到步骤A中的所述多个用户集合,重复执行步骤B到E,如此循环迭代,直到没有的新的用户加入到所述多个用户集合中。
5.如权利要求4所述的方法,其中,所述根据用户的属性信息及用户订单记录选出相应的网站提供对象包括:
从被标注了该用户的属性信息的网站提供对象中选出,该用户没有浏览或订购过的网站提供对象;
或者,
从被标注了该用户的属性信息的网站提供对象中选出,该用户频繁浏览或订购的网站提供对象。
6.如权利要求1-5中任一项所述的方法,其中,
所述属性信息为:用户性别信息、用户年龄信息或者用户职业信息;
所述网站为购物网站、电子书网站、音乐网站或视频网站。
7.一种网站提供对象的推荐装置,该装置包括:
数据挖掘单元,适于根据用户对网站提供对象的浏览记录和订单记录,和部分用户已填写的属性信息,推测未填写属性信息的用户的属性信息并进行相应标注;
推荐单元,适于根据用户的属性信息及用户浏览记录和订单记录选出相应的网站提供对象,并推荐给该用户。
8.如权利要求7所述的装置,其中,
所述推荐单元,进一步适于在一个用户第一次登录网站,没有网站提供对象的浏览记录和订单记录时,向该用户推荐热门的网站提供对象。
9.如权利要求7所述的装置,其中,所述数据挖掘单元包括:
第一挖掘子单元,适于对于所有填写了属性信息的用户,按照据多个不同的属性信息,相应分为多个用户集合;
第二挖掘子单元,适于查找出所述多个用户集合中的所有用户的浏览记录和订单记录中的网站提供对象,生成用户属性区分对象集合;
第三挖掘子单元,适于对于所述用户属性区分对象集合中的每个网站提供对象,统计出不同用户集合中浏览或订购了该网站提供对象的用户数量百分比例;如果其中百分比例最高的用户集合的百分比例达到了预设第一门限,则将该网站提供对象标注为该百分比例最高的用户集合对应的属性信息;
第四挖掘子单元,适于对于每个未填写属性信息的用户,根据标注后的用户属性区分对象集合,统计该用户浏览或订购过的属于所述用户属性区分对象集合中的网站提供对象,计算被标注为不同属性信息的网站提供对象的百分比例;如果其中最高的百分比例值达到了预设第二门限,则将该用户标注为对应的属性信息。
10.如权利要求9所述的装置,其中,所述数据挖掘单元进一步包括:
第五挖掘子单元,将第四挖掘子单元标注了属性信息的用户归并到所述多个用户集合中;
第二到第五挖掘子单元进一步循环执行上述操作,直到没有的新的用户加入到所述多个用户集合中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629090.6A CN103646341B (zh) | 2013-11-29 | 2013-11-29 | 一种网站提供对象的推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310629090.6A CN103646341B (zh) | 2013-11-29 | 2013-11-29 | 一种网站提供对象的推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103646341A true CN103646341A (zh) | 2014-03-19 |
CN103646341B CN103646341B (zh) | 2018-06-22 |
Family
ID=50251551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310629090.6A Expired - Fee Related CN103646341B (zh) | 2013-11-29 | 2013-11-29 | 一种网站提供对象的推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103646341B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468762A (zh) * | 2015-12-02 | 2016-04-06 | 上海斐讯数据通信技术有限公司 | 一种推送app应用/桌面主题的方法及系统 |
CN105653833A (zh) * | 2014-11-12 | 2016-06-08 | 腾讯科技(深圳)有限公司 | 一种游戏社区推荐的方法及装置 |
CN106033577A (zh) * | 2015-03-12 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 信息的推荐方法及装置 |
CN107094161A (zh) * | 2016-02-18 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 网络服务提供方法和装置 |
CN107341703A (zh) * | 2016-04-29 | 2017-11-10 | 史迪奇菲克斯公司 | 利用批次处理和按需处理的组合以提供建议的系统和方法 |
CN107851091A (zh) * | 2015-05-19 | 2018-03-27 | 电子湾有限公司 | 物品列表特征的智能突出强调 |
CN108399269A (zh) * | 2018-03-31 | 2018-08-14 | 丁超 | 音乐推荐方法、装置及计算机存储介质 |
CN109074596A (zh) * | 2016-04-26 | 2018-12-21 | 微软技术许可有限责任公司 | 基于与促销商品相关的过去交互来强调通信 |
CN110147464A (zh) * | 2019-04-12 | 2019-08-20 | 北京三快在线科技有限公司 | 视频推荐方法、装置、电子设备及可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101521796A (zh) * | 2008-02-28 | 2009-09-02 | 株式会社日立制作所 | 内容推荐装置及内容推荐方法 |
JP4473339B1 (ja) * | 2009-09-18 | 2010-06-02 | コミュニケーション・マート株式会社 | 広告情報提供サーバ、広告情報提供システム、及び広告情報提供プログラム |
CN102222072A (zh) * | 2010-04-19 | 2011-10-19 | 腾讯科技(深圳)有限公司 | 一种信息分类的方法和装置 |
CN102521767A (zh) * | 2011-12-13 | 2012-06-27 | 亿赞普(北京)科技有限公司 | 网络广告信息发布方法及系统 |
CN102592223A (zh) * | 2011-01-18 | 2012-07-18 | 卓望数码技术(深圳)有限公司 | 一种商品推荐方法和商品推荐系统 |
CN103023971A (zh) * | 2012-11-15 | 2013-04-03 | 广州酷狗计算机科技有限公司 | 音乐共享电台的信息推送方法及其系统 |
CN103164470A (zh) * | 2011-12-15 | 2013-06-19 | 盛大计算机(上海)有限公司 | 基于用户性别判别结果的定向应用方法及其系统 |
-
2013
- 2013-11-29 CN CN201310629090.6A patent/CN103646341B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101521796A (zh) * | 2008-02-28 | 2009-09-02 | 株式会社日立制作所 | 内容推荐装置及内容推荐方法 |
JP4473339B1 (ja) * | 2009-09-18 | 2010-06-02 | コミュニケーション・マート株式会社 | 広告情報提供サーバ、広告情報提供システム、及び広告情報提供プログラム |
CN102222072A (zh) * | 2010-04-19 | 2011-10-19 | 腾讯科技(深圳)有限公司 | 一种信息分类的方法和装置 |
CN102592223A (zh) * | 2011-01-18 | 2012-07-18 | 卓望数码技术(深圳)有限公司 | 一种商品推荐方法和商品推荐系统 |
CN102521767A (zh) * | 2011-12-13 | 2012-06-27 | 亿赞普(北京)科技有限公司 | 网络广告信息发布方法及系统 |
CN103164470A (zh) * | 2011-12-15 | 2013-06-19 | 盛大计算机(上海)有限公司 | 基于用户性别判别结果的定向应用方法及其系统 |
CN103023971A (zh) * | 2012-11-15 | 2013-04-03 | 广州酷狗计算机科技有限公司 | 音乐共享电台的信息推送方法及其系统 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653833A (zh) * | 2014-11-12 | 2016-06-08 | 腾讯科技(深圳)有限公司 | 一种游戏社区推荐的方法及装置 |
CN105653833B (zh) * | 2014-11-12 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 一种游戏社区推荐的方法及装置 |
CN106033577A (zh) * | 2015-03-12 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 信息的推荐方法及装置 |
CN107851091A (zh) * | 2015-05-19 | 2018-03-27 | 电子湾有限公司 | 物品列表特征的智能突出强调 |
CN105468762A (zh) * | 2015-12-02 | 2016-04-06 | 上海斐讯数据通信技术有限公司 | 一种推送app应用/桌面主题的方法及系统 |
CN105468762B (zh) * | 2015-12-02 | 2019-10-25 | 上海斐讯数据通信技术有限公司 | 一种推送app应用/桌面主题的方法及系统 |
CN107094161A (zh) * | 2016-02-18 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 网络服务提供方法和装置 |
CN109074596A (zh) * | 2016-04-26 | 2018-12-21 | 微软技术许可有限责任公司 | 基于与促销商品相关的过去交互来强调通信 |
CN107341703A (zh) * | 2016-04-29 | 2017-11-10 | 史迪奇菲克斯公司 | 利用批次处理和按需处理的组合以提供建议的系统和方法 |
CN107341703B (zh) * | 2016-04-29 | 2022-03-01 | 史迪奇菲克斯公司 | 利用批次处理和按需处理的组合以提供建议的系统和方法 |
CN108399269A (zh) * | 2018-03-31 | 2018-08-14 | 丁超 | 音乐推荐方法、装置及计算机存储介质 |
CN110147464A (zh) * | 2019-04-12 | 2019-08-20 | 北京三快在线科技有限公司 | 视频推荐方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103646341B (zh) | 2018-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103646341B (zh) | 一种网站提供对象的推荐方法和装置 | |
CN109299994B (zh) | 推荐方法、装置、设备及可读存储介质 | |
CN111784455B (zh) | 一种物品推荐方法及推荐设备 | |
TWI787196B (zh) | 業務對象屬性標識的生成方法、裝置和系統 | |
US7805431B2 (en) | System and method for generating a display of tags | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN111798273A (zh) | 产品的购买概率预测模型的训练方法及购买概率预测方法 | |
CN103970850B (zh) | 网站信息推荐方法和系统 | |
CN108960945A (zh) | 商品推荐方法和装置 | |
CN110322300B (zh) | 数据处理方法及装置、电子设备、存储介质 | |
US9846885B1 (en) | Method and system for comparing commercial entities based on purchase patterns | |
CN110363604B (zh) | 页面生成方法和装置 | |
CN109447713A (zh) | 一种基于知识图谱的推荐方法及装置 | |
CN112132660B (zh) | 商品推荐方法、系统、设备及存储介质 | |
CN110084658B (zh) | 物品匹配的方法和装置 | |
JP6780992B2 (ja) | 判定装置、判定方法および判定プログラム | |
CN107093122B (zh) | 对象分类方法及装置 | |
JP6976207B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN104616178A (zh) | 一种基于大数据多标记分类方法的电子商务商品推荐方法 | |
CN109492607A (zh) | 一种信息推送方法、信息推送装置及终端设备 | |
CN104346428A (zh) | 信息处理装置、信息处理方法及程序 | |
CN108038217B (zh) | 信息推荐方法及装置 | |
CN104615721A (zh) | 用于基于退货关联信息推荐商品的方法和系统 | |
CN111967924A (zh) | 商品推荐方法、商品推荐装置、计算机设备和介质 | |
WO2013173194A1 (en) | A user recommendation method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180622 Termination date: 20211129 |