CN106204163A - 一种用户属性特征的确定方法和装置 - Google Patents

一种用户属性特征的确定方法和装置 Download PDF

Info

Publication number
CN106204163A
CN106204163A CN201610615832.3A CN201610615832A CN106204163A CN 106204163 A CN106204163 A CN 106204163A CN 201610615832 A CN201610615832 A CN 201610615832A CN 106204163 A CN106204163 A CN 106204163A
Authority
CN
China
Prior art keywords
user
seed
commodity
interval
property
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610615832.3A
Other languages
English (en)
Other versions
CN106204163B (zh
Inventor
闫强
王晓
葛胜利
李爱华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610615832.3A priority Critical patent/CN106204163B/zh
Publication of CN106204163A publication Critical patent/CN106204163A/zh
Application granted granted Critical
Publication of CN106204163B publication Critical patent/CN106204163B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户属性特征的确定方法和装置,涉及电子商务技术领域,其中的方法包括:基于用户属性特征确定种子用户所属的用户属性区间;确定种子用户购买的种子商品对于用户属性区间的商品归属值;基于商品归属值确定购买了种子商品的非种子用户对于用户属性区间的用户归属值;根据用户归属值确定归属于用户属性区间的非种子用户。本发明的方法、装置与终端设备,确定购买了种子商品的非种子用户归属的用户属性区间,识别出非种子用户的用户属性特征,并可以不断进行迭代运算,识别出更多用户的用户属性特征,能够有效提高用户属性特征的识别率、准确率和覆盖度,可以提高用户服务的准确性和有效性。

Description

一种用户属性特征的确定方法和装置
技术领域
本发明涉及电子商务技术领域,尤其涉及一种用户属性特征的确定方法和装置。
背景技术
随着互联网和电子商务的迅猛发展,每天都有大量的商品交易在电商网站上完成,各大电商平台的商品种类、数量增长很快。随着竞争和业务的发展,用户的价值不断在提高,精确定位用户的属性特征,通过属性特征进行精确的商品推广、信息发送等用户服务,能够提高用户的感受度并为电商提高销售量。用户在电商进行注册,在用户注册过程中,系统为用户对应的虚拟对象分派唯一的用户编码user_id,用以对用户进行标识。用户对商品进行浏览并产生订单,订单信息是用户在购买商品时的产物,记录了用户购买的商品、数量、下单时间、商品金额等一系列信息,商品通过商品sku标识进行唯一标识。
目前,对于用户属性特征的确定通常采用两种方法。规则判断:获取用户的购物信息,然后提取商品描述的关键字,再通过关键字定位该用户的年龄等属性信息。用户簇类:通过提取用户的购物特征,将购买相同群簇的用户归为一簇,同时提取每簇的属性年龄作为该簇用户的年龄。然而,在现有的用户属性特征的确定方法中,通过单一的规则关键字判断,严重的依赖商品描述,武断性太强,同时很可能会丢失商品的部分属性,从而导致用户识别错误。同时对于关键字的词库维护成本太大,往往由于关键字的数量等因素,造成用户属性判断的覆盖度严重偏低。如果通过用户群簇进行判断,群簇的交叉严重,准确度往往没有保证,普遍偏低。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种用户属性特征的确定方法和装置。
根据本发明的一个方面,提供一种用户属性特征的确定方法,包括:基于用户属性特征确定种子用户所属的用户属性区间;确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值;基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值;根据所述用户归属值确定归属于所述用户属性区间的所述非种子用户。
可选地,确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值包括:根据用户订单信息获取所述种子用户购买的所述种子商品;统计出所述种子商品被全部种子用户购买的总数量、所述种子商品被每个用户属性区间中的所有种子用户购买的区间数量;确定每个区间数量与所述总数量的比值,其中,所述种子商品对于所述用户属性区间的商品归属值为与所述用户属性区间对应的所述比值。
可选地,所述基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值包括:根据用户订单信息统计所述非种子用户购买的所述种子商品的数量和非种子商品的数量;基于所述种子商品的数量以及所述商品归属值确定所述非种子用户对于所述用户属性区间的标识商品归属值;基于所述非种子商品的数量确定所述非种子用户对于所述用户属性区间的未标识商品归属值;根据所述标识商品归属值和所述未标识商品归属值确定所述非种子用户对于所述用户属性区间的用户归属值。
可选地,计算第i个非种子用户Ci对于第j个用户属性区间的用户归属值
其中,P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为所述用户属性区间的总数。
可选地,根据所述用户归属值选出归属于所述用户属性区间的所述非种子用户包括:从所述非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定所述非种子用户归属于与最大用户归属值对应的用户属性区间。
可选地,将确定的归属于所述用户属性区间的所述非种子用户作为种子用户,通过迭代运算选出归属于所述用户属性区间的其它非种子用户。
可选地,所述用户属性特征为年龄属性特征,其中,所述基于用户属性特征确定种子用户所属的用户属性区间包括:设置年龄间隔并基于所述年龄间隔设置多个所述用户属性区间;根据所述种子用户的年龄信息将所述种子用户归类到对应的所述用户属性区间;其中,所述种子用户包括:注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户。
根据本发明的另一方面,提供一种用户属性特征的确定装置,包括:用户区间确定模块,用于基于用户属性特征确定种子用户所属的用户属性区间;商品归属确定模块,用于确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值;用户归属确定模块,用于基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值;区间归属确定模块,用于根据所述用户归属值确定归属于所述用户属性区间的所述非种子用户。
可选地,所述商品归属确定模块,包括:种子商品获取单元,用于根据用户订单信息获取所述种子用户购买的所述种子商品;商品归属计算单元,用于统计出所述种子商品被全部种子用户购买的总数量、所述种子商品被每个用户属性区间中的所有种子用户购买的区间数量;确定每个区间数量与所述总数量的比值,其中,所述种子商品对于所述用户属性区间的商品归属值为与所述用户属性区间对应的所述比值。
可选地,所述用户归属确定模块,包括:购买商品统计单元,用于根据用户订单信息统计所述非种子用户购买的所述种子商品的数量和非种子商品的数量;用户归属计算单元,用于基于所述种子商品的数量以及所述商品归属值确定所述非种子用户对于所述用户属性区间的标识商品归属值,基于所述非种子商品的数量确定所述非种子用户对于所述用户属性区间的未标识商品归属值,根据所述标识商品归属值和所述未标识商品归属值确定所述非种子用户对于所述用户属性区间的用户归属值。
可选地,所述用户归属计算单元,还用于计算第i个所述非种子用户Ci对于第j个用户属性区间的用户归属值
其中,P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为所述用户属性区间的总数。
可选地,所述属性特征确定模块,还用于从所述非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定所述非种子用户归属于与最大用户归属值对应的用户属性区间。
可选地,迭代运算处理模块,用于将确定的归属于所述用户属性区间的所述非种子用户作为种子用户,通过迭代运算选出归属于所述用户属性区间的其它非种子用户。
可选地,所述用户属性特征为年龄属性特征,其中,所述用户区间确定模块,用于设置年龄间隔并基于所述年龄间隔设置多个所述用户属性区间;根据所述种子用户的年龄信息将所述种子用户归类到对应的所述用户属性区间;其中,所述种子用户包括:注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户。
根据本发明的又一方面,提供一种用户属性特征的确定装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的用户属性特征的确定方法。
本发明中的用户属性特征的确定方法和装置,确定种子用户购买的种子商品对于用户属性区间的商品归属值,通过商品归属值确定购买了种子商品的非种子用户归属的用户属性区间,从而确定了非种子用户的用户属性特征,能够有效提高用户属性特征的识别率以及准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的用户属性特征的确定方法的一个实施例的流程示意图;
图2为根据本发明的用户属性特征的确定方法的另一个实施例的流程示意图;
图3为根据本发明的用户属性特征的确定装置的一个实施例的模块示意图;
图4为根据本发明的用户属性特征的确定装置的一个实施例中的商品归属确定模块的模块示意图;
图5为根据本发明的用户属性特征的确定装置的一个实施例中的用户归属确定模块的模块示意图;
图6为根据本发明的用户属性特征的确定装置的另一个实施例的模块示意图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合每个图和实施例对本发明的技术方案进行多方面的描述。
图1为根据本发明的用户属性特征的确定方法的一个实施例的流程示意图,如图1所示:
步骤101,基于用户属性特征确定种子用户所属的用户属性区间。
用户属性特征可以为年龄、职业、爱好等,用户属性区间是根据用户属性特性划分的一个或多个区间,可以按照用户属性特征将种子用户归类或划分到用户属性区间中。种子用户是指能够获取完整、真实或可信的用户属性特征的用户,种子用户可以是注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户等。
例如,用户属性特征为年龄属性特征,可以设置年龄间隔并基于年龄间隔设置多个年龄区间,筛选年龄信息真实的用户作为种子用户,根据种子用户的年龄信息将种子用户分配到对应的用户属性区间。
步骤102,确定种子用户购买的种子商品对于用户属性区间的商品归属值。
种子商品为种子用户所购买的商品,例如手机等,每个用户属性区间中的种子用户可以购买相同的种子商品。可以采用多种方法,确定种子商品对于每个用户属性区间的商品归属值,商品归属值可以为种子商品对于用户属性区间的区间概率、权重等,用于表征种子商品归属于用户属性区间的概率大小或紧密程度。
例如,根据用户订单信息获取种子用户购买的种子商品,统计出种子商品被全部种子用户购买的总数量,将种子商品被每个用户属性区间中的所有种子用户的购买数量与总数量的比值,确定为种子商品对于每个用户属性区间的商品归属值。
步骤103,基于商品归属值确定购买了种子商品的非种子用户对于用户属性区间的用户归属值。
非种子用户即为没有被筛选为种子用户的其它用户,非种子用户的相关用户属性特征不完整或不可信。可以采用多种方法确定出非种子用户对于每个用户属性区间的用户归属值,用户归属值可以为非种子用户对于用户属性区间的区间概率、权重等,用于表征非种子用户归属于用户属性区间的概率大小或紧密程度。
例如,根据用户订单信息统计非种子用户购买的种子商品的数量和非种子商品的数量,基于种子商品的数量以及商品归属值确定非种子用户对于用户属性区间的标识商品归属值,基于非种子商品的数量确定非种子用户对于用户属性区间的未标识商品归属值,根据标识商品归属值和未标识商品归属值确定非种子用户对于用户属性区间的用户归属值。
步骤104,根据用户归属值选出归属于用户属性区间的非种子用户。
根据非种子用户对于每个用户属性区间的用户归属值选取非种子用户,确定非种子用户归属的用户属性区间,能够确定选出的非种子用户的用户属性特征。
例如,从非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定非种子用户归属于与最大用户归属值对应的用户属性区间。如果用户在每个区间上的概率相同,则不能识别出用户的年龄,则进行下一轮的迭代运算。归属门限值能够根据具体的需求进行调整。
将新选出的归属于用户属性区间的非种子用户作为相应的用户属性区间的新种子用户,不断迭代执行步骤102、103和104,继续确定归属于用户属性区间的其它非种子用户,从而确定选出的非种子用户的用户属性特征,直至不能选出归属于任何用户属性区间的其它非种子用户为止。
上述实施例提供的用户属性特征的确定方法,对筛选出的种子用户划分为用户属性区间,确定种子用户购买的种子商品对于用户属性区间的商品归属值,通过商品归属值确定购买了种子商品的非种子用户归属的用户属性区间,从而识别出非种子用户的用户属性特征,并不断进行迭代运算,深度挖掘用户属性特征,能够识别出更多用户的用户属性特征,具有高效的扩散属性,可以提高用户属性识别的覆盖度和识别度。
图2为根据本发明的用户属性特征的确定方法的另一个实施例的流程示意图,以用户属性特征为年龄为例,如图2所示:
步骤201,筛选种子用户。
采用多种方式筛选种子用户,例如,对于电商网站的注册用户,种子用户为注册数据质量高而且可信度很大程度接近真实的用户,可以根据用户注册的年龄信息的完整性筛选种子用户。完整性检验是指判断用户在注册时填写的各部分信息的整体质量和依赖等各种逻辑校验是否合理,比如年龄和婚姻状况会存在某种程度的相关性。
通过判断用户是否购买了设定的特殊商品确定种子用户,但根据特殊商品定位用户年龄,存在一定的误差性。通过相关业务干线获取种子用户,对于像京东、亚马逊这样的大型购物网站,通常会存在部分少量实名认证用户,具有年龄信息的实名认证用户可以直接作为种子用户。
步骤202,基于年龄将种子用户划分为一个或多个年龄区间。
根据步骤201的筛选结果以及业务需求,确定年龄区间的数量和区间的年龄间隔,例如,以年龄间隔为5岁划分多个年龄区间,年龄区间分成了1-15,15-20,20-25等,确定所有种子用户归属的年龄区间。
步骤203,获取各年龄区间的种子用户购买商品的信息,确定商品对于区间集合的商品归属值。
例如,用户Ci表示第i个种子用户,订单信息上附加有用户Ci购物的商品Si和商品数量SNi,根据订单信息统计每个年龄区间中的种子用户购买的商品和商品数量,计算每个商品Si在各年龄区间Nj上的概率:P(Sij)=商品Si被年龄区间Nj中的所有种子用户购买的数量/商品Si被全部种子用户购买的总量。
例如,苹果手机为第j个商品Sj,商品Sj被所有种子用户购买的数量为1万件,商品Sj在1-15岁年龄区间(年龄区间1)中的销量为500件,商品Sj在15-20年龄区间(年龄区间2)中销量为1000件,商品Sj在20-25年龄区间(年龄区间3)中销量为500件,则P(S1j)=500/10000,P(S2j)=1000/10000,P(S3j)=5000/10000。
可以通过P(Sij)确定商品Si在年龄区间Nj上的年龄区间概率,同理可以获取每个种子商品在个年龄区间上的年龄区间概率,即商品归属值。
步骤204,确定购买了商品的其它用户,基于商品区间概率计算出其它用户归属于各年龄区间的用户归属值。
通过在步骤203计算出的种子商品的年龄区间概率,判断新的用户归属年龄区间的概率,使用如下假设条件:用户购买的商品年龄归属事件为相互独立,对于用户购买商品,种子商品和非种子商品(标识商品和未标识商品)相互独立,同时对于用户购买的商品,初始归属年龄区间的概率为相等,即1/N。
通过用户购物订单信息统计每个非种子用户的购买的商品、商品数量。可以把所有的商品分为标识商品{F1}和未标识{F2}。例如,一个非种子用户共买了苹果手机,茶具,学习机三种商品。在步骤203中,确定了种子用户购买的种子商品中已经存在苹果手机、茶具,但没有学习机,所以{F1}={苹果手机,茶具},{F2}={学习机}。
非种子用户很可能买了多件商品,但是在{F1}中只是部分,所以通过均等概率来判断商品的影响程度,即对于非种子用户购买的未标识的商品{F2}来说,每个未标识的商品归属年龄区间的概率是一致的1/N。
在一个实施例中,计算第i个非种子用户Ci对于第j个用户属性区间的用户归属值
P ( C i j ) = ( Σ l = 1 f P ( S l j ) * m l j ) * f f + k + 1 N * k f + k ; - - - ( 1 - 1 )
P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为用户属性区间的总数。f+k为第i个非种子用户购买的总商品数量,f为{F1}的数量、k为{F2}的数量。其它的非种子用户的对于用户属性区间的用户归属值的计算方法同上。
例如,筛选了种子用户,设置了2个年龄区间,分别为年龄区间1和年龄区间2,基于年龄将种子用户分别归类到年龄区间1和年龄区间2中。非种子用户C1购买了2种种子商品和3种非种子商品,2种种子商品分别为苹果手机和茶具,苹果手机购买量为2个,茶具的购买量为1个,3种非种子商品的购买数量分别为1个。
苹果手机对年龄区间1和年龄区间2的年龄区间概率,即商品归属值分别为:P(S11)=0.3,P(S12)=0.4。茶具对年龄区间1和年龄区间2的年龄区间概率,即商品归属值分别为:P(S21)=0.5,P(S22)=0.4。
将以上数值代入上述的公式(1-1)计算,其中,N=2,f=3,k=3,非种子用户Ci对于年龄区间1的用户归属值
P(C11)=(0.3×2+0.5×1)×3/6+0.5×0.5=0.8。
非种子用户Ci对于年龄区间2的用户归属值
P(C12)=(0.4×2+0.4×1)×3/6+0.5×0.5=0.85。
步骤205,根据用户归属值从其它用户中选出归属于年龄区间的新用户。
设置归属门限值a,其中a为[0,1]常数,例如,设置a=0.8。确定非种子用户在每个年龄区间上概率的最大值MAX,如果该值MAX大于a则该用户归属的年龄区间为MAX所对应的年龄区间。例如,非种子用户Ci对于年龄区间2的用户归属值0.85为最大值,并且0.85大于归属门限值a=0.8,则可以确定非种子用户C1归属于年龄区间2。
步骤206,判断选出的归属于年龄区间的新用户是否为空,如果为空,则结束,如果不为空,则进行步骤207。
步骤207,将新选出的归属于年龄区间的非种子用户作为种子用户,通过迭代运算步骤203-205,选出归属于年龄区间的其它非种子用户,直至不能选取归属于年龄区间的其它非种子用户为止。
本发明中的用户属性特征的确定方法,确定购买了种子商品的非种子用户归属的用户属性区间并识别出非种子用户的用户属性特征,可以不断进行迭代运算,从而识别出更多用户的用户属性特征,能够有效提高用户属性特征的识别率,准确率、覆盖度。
如图3所示,本发明提供一种用户属性特征的确定装置30,包括:用户区间确定模块31、商品归属确定模块32、用户归属确定模块33、区间归属确定模块34和迭代运算处理模块35。用户区间确定模块31基于用户属性特征确定种子用户所属的用户属性区间。商品归属确定模块32确定种子用户购买的种子商品对于用户属性区间的商品归属值。
用户归属确定模块33基于商品归属值确定购买了种子商品的非种子用户对于用户属性区间的用户归属值。区间归属确定模块34根据用户归属值选出归属于用户属性区间的非种子用户。迭代运算处理模块35将新选出的归属于用户属性区间的非种子用户作为种子用户,通过迭代运算选出归属于用户属性区间的其它非种子用户。
如图4所示,商品归属确定模块32包括:种子商品获取单元321和商品归属计算单元322。种子商品获取单元321根据用户订单信息获取种子用户购买的种子商品。商品归属计算单元322统计出种子商品被全部种子用户购买的总数量、种子商品被每个用户属性区间中的所有种子用户购买的区间数量;商品归属计算单元322确定每个区间数量与总数量的比值,其中,种子商品对于用户属性区间的商品归属值为与用户属性区间对应的比值。
如图5所示,用户归属确定模块33包括:购买商品统计单元331和用户归属计算单元332。购买商品统计单元331根据用户订单信息统计非种子用户购买的种子商品的数量和非种子商品的数量。用户归属计算单元332基于种子商品的数量以及商品归属值确定非种子用户对于用户属性区间的标识商品归属值,基于非种子商品的数量确定非种子用户对于用户属性区间的未标识商品归属值,用户归属计算单元332根据标识商品归属值和未标识商品归属值确定非种子用户对于用户属性区间的用户归属值。
用户归属计算单元332计算第i个非种子用户Ci对于第j个用户属性区间的用户归属值其中,其中,P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为所述用户属性区间的总数。
属性特征确定模块34从非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定非种子用户归属于与最大用户归属值对应的用户属性区间。
用户属性特征为年龄属性特征,用户区间确定模块31设置年龄间隔并基于年龄间隔设置多个用户属性区间,根据种子用户的年龄信息将种子用户分配到对应的用户属性区间。种子用户包括:注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户等。
如图6所示,该装置可包括存储器71和处理器72,存储器71用于存储指令,处理器72耦合到存储器71,处理器72被配置为基于存储器71存储的指令执行实现上述的用户属性特征的确定方法。
存储器71可以为高速RAM存储器、非易失性存储器(non-volatile memory)等,存储器71也可以是存储器阵列。存储器71还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器72可以为中央处理器CPU,或专用集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本发明的用户属性特征的确定方法的一个或多个集成电路。
上述实施例中的用户属性特征的确定方法和装置,确定种子用户归属的用户属性区间,获取种子用户购买的种子商品对于用户属性区间的商品归属值,通过商品归属值确定购买了种子商品的非种子用户归属的用户属性区间,从而识别出非种子用户的用户属性特征,并可以不断进行迭代运算,能够识别出更多用户的用户属性特征,有效提高用户属性特征的识别率以及准确率,可以提高用户属性特征识别的覆盖度,能够提高用户服务的准确性和有效性。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (15)

1.一种用户属性特征的确定方法,其特征在于,包括:
基于用户属性特征确定种子用户所属的用户属性区间;
确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值;
基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值;
根据所述用户归属值确定归属于所述用户属性区间的所述非种子用户。
2.如权利要求1所述的方法,其特征在于,确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值包括:
根据用户订单信息获取所述种子用户购买的所述种子商品;
统计出所述种子商品被全部种子用户购买的总数量、所述种子商品被每个用户属性区间中的所有种子用户购买的区间数量;
确定每个区间数量与所述总数量的比值,其中,所述种子商品对于所述用户属性区间的商品归属值为与所述用户属性区间对应的所述比值。
3.如权利要求2所述的方法,其特征在于,所述基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值包括:
根据用户订单信息统计所述非种子用户购买的所述种子商品的数量和非种子商品的数量;
基于所述种子商品的数量以及所述商品归属值确定所述非种子用户对于所述用户属性区间的标识商品归属值;
基于所述非种子商品的数量确定所述非种子用户对于所述用户属性区间的未标识商品归属值;
根据所述标识商品归属值和所述未标识商品归属值确定所述非种子用户对于所述用户属性区间的用户归属值。
4.如权利要求3所述的方法,其特征在于:
计算第i个所述非种子用户Ci对于第j个用户属性区间的用户归属值
其中,P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为所述用户属性区间的总数。
5.如权利要求3所述的方法,其特征在于,根据所述用户归属值确定归属于所述用户属性区间的所述非种子用户包括:
从所述非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定所述非种子用户归属于与最大用户归属值对应的用户属性区间。
6.如权利要求1所述的方法,其特征在于,包括:
将确定的归属于所述用户属性区间的所述非种子用户作为所述用户属性区间的种子用户,通过迭代运算选出归属于所述用户属性区间的其它非种子用户。
7.如权利要求1所述的方法,其特征在于,所述用户属性特征为年龄属性特征,其中,所述基于用户属性特征确定种子用户所属的用户属性区间包括:
设置年龄间隔并基于所述年龄间隔设置多个所述用户属性区间;
根据所述种子用户的年龄信息将所述种子用户归类到对应的所述用户属性区间;
其中,所述种子用户包括:注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户。
8.一种用户属性特征的确定装置,其特征在于,包括:
用户区间确定模块,用于基于用户属性特征确定种子用户所属的用户属性区间;
商品归属确定模块,用于确定所述用户属性区间中的种子用户所购买的种子商品对于所述用户属性区间的商品归属值;
用户归属确定模块,用于基于所述商品归属值确定购买了所述种子商品的非种子用户对于所述用户属性区间的用户归属值;
区间归属确定模块,用于根据所述用户归属值确定归属于所述用户属性区间的所述非种子用户。
9.如权利要求8所述的装置,其特征在于:
所述商品归属确定模块,包括:
种子商品获取单元,用于根据用户订单信息获取所述种子用户购买的所述种子商品;
商品归属计算单元,用于统计出所述种子商品被全部种子用户购买的总数量、所述种子商品被每个用户属性区间中的所有种子用户购买的区间数量;确定每个区间数量与所述总数量的比值,其中,所述种子商品对于所述用户属性区间的商品归属值为与所述用户属性区间对应的所述比值。
10.如权利要求9所述的装置,其特征在于:
所述用户归属确定模块,包括:
购买商品统计单元,用于根据用户订单信息统计所述非种子用户购买的所述种子商品的数量和非种子商品的数量;
用户归属计算单元,用于基于所述种子商品的数量以及所述商品归属值确定所述非种子用户对于所述用户属性区间的标识商品归属值,基于所述非种子商品的数量确定所述非种子用户对于所述用户属性区间的未标识商品归属值,根据所述标识商品归属值和所述未标识商品归属值确定所述非种子用户对于所述用户属性区间的用户归属值。
11.如权利要求10所述的装置,其特征在于:
所述用户归属计算单元,还用于计算第i个所述非种子用户Ci对于第j个用户属性区间的用户归属值
其中,P(Slj)为第i个非种子用户购买的第l种种子商品对于第j个用户属性区间的商品归属值,l为自然数,ml为第i个非种子用户购买第l种种子商品的购买数量,f为第i个非种子用户购买的种子商品的总量,k为第i个非种子用户购买的未种子商品的总量,N为所述用户属性区间的总数。
12.如权利要求8所述的装置,其特征在于:
所述属性特征确定模块,还用于从所述非种子用户对于全部用户属性区间的用户归属值中选取最大值,如果用户归属值的最大值大于归属门限值,则确定所述非种子用户归属于与最大用户归属值对应的用户属性区间。
13.如权利要求8所述的装置,其特征在于:
迭代运算处理模块,用于将确定的归属于所述用户属性区间的所述非种子用户作为所述用户属性区间的种子用户,通过迭代运算选出归属于所述用户属性区间的其它非种子用户。
14.如权利要求8至13任一所述的装置,其特征在于,所述用户属性特征为年龄属性特征,其中,
所述用户区间确定模块,用于设置年龄间隔并基于所述年龄间隔设置多个所述用户属性区间;根据所述种子用户的年龄信息将所述种子用户归类到对应的所述用户属性区间;其中,所述种子用户包括:注册信息通过完整性筛选的用户、实名认证用户、购买了特定商品的用户。
15.一种用户属性特征的确定装置,其特征在于,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1至7中任一项所述的用户属性特征的确定方法。
CN201610615832.3A 2016-07-29 2016-07-29 一种用户属性特征的确定方法和装置 Active CN106204163B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610615832.3A CN106204163B (zh) 2016-07-29 2016-07-29 一种用户属性特征的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610615832.3A CN106204163B (zh) 2016-07-29 2016-07-29 一种用户属性特征的确定方法和装置

Publications (2)

Publication Number Publication Date
CN106204163A true CN106204163A (zh) 2016-12-07
CN106204163B CN106204163B (zh) 2021-09-03

Family

ID=57498264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610615832.3A Active CN106204163B (zh) 2016-07-29 2016-07-29 一种用户属性特征的确定方法和装置

Country Status (1)

Country Link
CN (1) CN106204163B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470285A (zh) * 2017-02-23 2018-08-31 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108510336A (zh) * 2017-02-23 2018-09-07 北京京东尚科信息技术有限公司 用于确定用户数据信息的方法、装置、电子设备和存储介质
CN109658852A (zh) * 2019-01-19 2019-04-19 浙江威克特光电有限公司 一种智能灯箱系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013448A1 (en) * 2011-01-27 2013-01-10 Bradley Andrew J Behavioral filter for personalized recommendations
CN103106600A (zh) * 2012-11-15 2013-05-15 深圳中兴网信科技有限公司 商品信息推送系统和商品信息推送方法
CN104715409A (zh) * 2015-03-20 2015-06-17 北京京东尚科信息技术有限公司 一种电子商务用户购买力分类方法及系统
CN104820879A (zh) * 2015-05-27 2015-08-05 北京京东尚科信息技术有限公司 一种用户行为信息的分析方法和装置
CN104851025A (zh) * 2015-05-09 2015-08-19 湘南学院 一种基于案例推理的电商网站商品的个性化推荐方法
CN105554140A (zh) * 2015-12-24 2016-05-04 腾讯科技(深圳)有限公司 一种用户群体定位方法及服务器
CN105678570A (zh) * 2015-12-31 2016-06-15 北京京东尚科信息技术有限公司 电子商务潜在用户识别的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130013448A1 (en) * 2011-01-27 2013-01-10 Bradley Andrew J Behavioral filter for personalized recommendations
CN103106600A (zh) * 2012-11-15 2013-05-15 深圳中兴网信科技有限公司 商品信息推送系统和商品信息推送方法
CN104715409A (zh) * 2015-03-20 2015-06-17 北京京东尚科信息技术有限公司 一种电子商务用户购买力分类方法及系统
CN104851025A (zh) * 2015-05-09 2015-08-19 湘南学院 一种基于案例推理的电商网站商品的个性化推荐方法
CN104820879A (zh) * 2015-05-27 2015-08-05 北京京东尚科信息技术有限公司 一种用户行为信息的分析方法和装置
CN105554140A (zh) * 2015-12-24 2016-05-04 腾讯科技(深圳)有限公司 一种用户群体定位方法及服务器
CN105678570A (zh) * 2015-12-31 2016-06-15 北京京东尚科信息技术有限公司 电子商务潜在用户识别的方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470285A (zh) * 2017-02-23 2018-08-31 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108510336A (zh) * 2017-02-23 2018-09-07 北京京东尚科信息技术有限公司 用于确定用户数据信息的方法、装置、电子设备和存储介质
CN108470285B (zh) * 2017-02-23 2021-11-12 北京京东尚科信息技术有限公司 用于获取用户数据信息的方法、装置、电子设备和存储介质
CN108510336B (zh) * 2017-02-23 2021-11-12 北京京东尚科信息技术有限公司 用于确定用户数据信息的方法、装置、电子设备和存储介质
CN109658852A (zh) * 2019-01-19 2019-04-19 浙江威克特光电有限公司 一种智能灯箱系统

Also Published As

Publication number Publication date
CN106204163B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN107481114A (zh) 商品推荐方法、装置、电子商务系统及存储介质
CN111444334B (zh) 数据处理方法、文本识别方法、装置及计算机设备
CN104636429B (zh) 商标类别检索方法和装置
CN109598331A (zh) 一种欺诈识别模型训练方法、欺诈识别方法及装置
CN106600372A (zh) 一种基于用户行为的商品推荐方法及系统
CN103514178A (zh) 一种基于点击率的搜索排序方法及装置
CN107146089A (zh) 一种刷单识别方法及装置,电子设备
CN108764705A (zh) 一种数据质量评估平台以及方法
CN103366009B (zh) 一种基于自适应聚类的图书推荐方法
CN102609422A (zh) 类目错放识别方法和装置
CN110490625A (zh) 用户偏好确定方法及装置、电子设备、存储介质
CN105096152A (zh) 一种基于商品热度的操作执行方法及装置
CN108460618A (zh) 一种资源配置方法及装置,电子设备
CN103971256A (zh) 一种信息推送方法及设备
CN106204163A (zh) 一种用户属性特征的确定方法和装置
CN107153656A (zh) 一种信息搜索方法和装置
CN105787744A (zh) 一种基于购物需求的抗攻击信誉评价计算方法
CN103970747A (zh) 网络侧计算机对搜索结果进行排序的数据处理方法
CN106251178A (zh) 数据挖掘方法以及装置
CN110390585A (zh) 一种识别异常对象的方法及装置
CN106919611A (zh) 产品信息推送方法和装置
CN106936778A (zh) 网站流量异常的检测方法和装置
CN109034958A (zh) 一种拼单计费并提醒支付的方法
CN105468628A (zh) 一种排序方法及装置
CN107705175B (zh) 确定用户与商户之间相似度的方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant