CN108022116A - 对用户建模的方法、系统及终端设备 - Google Patents

对用户建模的方法、系统及终端设备 Download PDF

Info

Publication number
CN108022116A
CN108022116A CN201610942719.6A CN201610942719A CN108022116A CN 108022116 A CN108022116 A CN 108022116A CN 201610942719 A CN201610942719 A CN 201610942719A CN 108022116 A CN108022116 A CN 108022116A
Authority
CN
China
Prior art keywords
commodity
age
user
age bracket
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610942719.6A
Other languages
English (en)
Other versions
CN108022116B (zh
Inventor
车天博
高维国
陈海勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201610942719.6A priority Critical patent/CN108022116B/zh
Publication of CN108022116A publication Critical patent/CN108022116A/zh
Application granted granted Critical
Publication of CN108022116B publication Critical patent/CN108022116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种对用户建模的方法、系统及终端设备。该方法包括:获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。本发明提出了一种利用时间序列模型对用户建模的方法,能够准确的预测出用户所处的年龄阶段,利于根据预测的年龄段对用户进行商品推荐。

Description

对用户建模的方法、系统及终端设备
技术领域
本发明涉及用户画像领域,具体涉及一种对用户建模的方法、系统及终端设备。
背景技术
用户画像(personas)是真实用户的虚拟代表,是建立在一系列真实数据(Marketing data,Usability data)之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型。或者说,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
那么为何要建立用户画像?简而言之,用户画像是为了让团队成员在产品/商品设计或推荐的过程中能够抛开个人喜好,将焦点关注在目标用户的动机和行为上进行产品/商品设计或推荐。因为,团队成员为具体的人物做产品/商品设计或推荐要远远优于为脑中虚构的东西做产品/商品设计或推荐,也更来得容易。
对于商业领域而言,用户画像技术能够精确描述用户的信息,进而对用户进行精准的商品推荐,因此用户画像技术在电商领域得到了具有很大商业价值并得到了广泛应用。
现有用户画像方法通常从的商品中挖掘出一些能够表示用户特征(如用户年龄,性别等)的词对商品打上标签。在通过用户购买的商品集合对用户打上标签。由于考虑的信息有限,原有方法通常正确率和覆盖率较低。
因此,需要一种新的对用户画像或建模的方法。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明公开一种对用户建模的方法、系统及终端设备,能够准确的预测出用户所处的年龄阶段。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,公开一种对用户建模的方法,用于预测用户所处的年龄段,包括:
获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;
对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;
将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
根据本发明的一实施方式,通过一阶马尔科夫链模型进行建模。
根据本发明的一实施方式,利用自然语言处理软件包进行训练。
根据本发明的一实施方式,利用自然语言处理软件包通过一阶马尔科夫链模型计算商品的相似度。
根据本发明的一实施方式,所述相似度为余弦相似度。
根据本发明的一实施方式,所述对用户建模的方法还包括:根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
根据本发明的一实施方式,通过调研获取种子用户的生日信息。
根据本发明的一实施方式,所述向量为200维向量。
根据本发明的第二方面,公开一种对用户建模的系统,包括:
数据获取模块,获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
建模和训练模块,将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量,对各个年龄段购买的商品向量求均值作为各个年龄段的中心点,并将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值;
年龄预测模块,将其他用户某一时间段购买的各个商品的均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
根据本发明的一实施方式,所述对用户建模的系统还包括:
商品推荐模块,根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
根据本发明的第三方面,公开一种终端设备,包括:
处理器;
存储器,存储用于所述处理器控制以下操作的指令:
获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;
对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;以及
将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
根据本发明的一些实施方式,通过种子用户所处的年龄和其在当时年龄购买的商品计算出有年龄区分度的商品,再通过年龄区分度商品的购买行为计算出更多用户所处的年龄段。
根据本发明的另一些实施方式,创造性地利用自然语言处理领域的算法对商品购买序列建模,最终通过一系列建模,预测出用户所处的年龄段,进而可利用用户所处的年龄段对用户进行精准的商品推荐。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并非用于限制本发明。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。
图1示出根据本发明一示例实施方式的对用户建模的方法流程图。
图2示出根据本发明一示例实施方式的获取的部分种子用户数据。
图3示出根据本发明一示例实施方式的按时间顺序排列的用户购买的商品集合。
图4示出根据本发明一示例实施方式的部分预测结果。
图5示出根据本发明另一示例实施方式的对用户建模的方法流程图。
图6示出根据本发明示例实施方式的一对用户建模的系统方框图。
图7示出根据本发明一示例实施方式的终端设备。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本发明提出了一种利用时间序列模型对用户建模的方法,能够准确的预测出用户所处的年龄阶段,准确率在百分之八十八以上。通过50万种子用户的年龄和购买行为进行建模,再通过模型得到更多用户所处的年龄段。进而对用户按年龄段进行个性化推荐。简单而言,就是通过数据调研得到种子用户数据,再对种子用户购买行为建模对商品建模,将商品转化为向量,最后通过商品向量和其他用户(指除种子用户以外的用户)的购买行为预测其他用户所处的年龄段。
首先先简单介绍利用时间序列模型对用户建模的方法的基本过程,然后结合附图通过具体的实施方式进行详细说明。
用户年龄预测中,可能分成的年龄段标签包括婴儿(出生前-2岁)、儿童(3-9)、青少年(10-18)、大学生(18-24岁)、青年(24-30岁)、中年1(30-40岁)、中年2(40-50岁)和老年(50+岁)等,年龄段的划分不是绝对的,可以根据需要灵活划分。
建模的方法的基本过程如下。
1.调研数据,得到种子用户的年龄信息。当然种子用户的年龄信息也可通过其它方式获得,不限于此。
2.建立时间序列模型。
通过对用户的商品购买行为预测用户年龄,基于两个假设:
(1)不同用户在不同年龄阶段购买的商品有区别
(2)同一用户在某一年龄阶段内,购买的商品顺序有一定规律。
因此,构造时间序列模型数据如下:
User-#lable sku1sku2…….(label即年龄段标签,其中sku按购买时间的先后顺序排列)
例如:小明-#青年16516498 464949…….
按照User-#lable方式构造数据,可以将一个用户的购买行为分成多个训练数据。例如:小明-#青年、小明-#中年、小明-#老年。这么做的依据是认为同一用户在不同年龄段购买的商品是有区别的,也是能够通过商品购买集合预测用户年龄的基础。
3.获得用户购买的商品集合后,进行时间序列模型训练。
4.最后进行商品聚类与年龄预测。
在此需要特别指出的是,所谓年龄段的划分可以是如上面所述的整个年龄范围内各个大年龄段的划分,也可以是某个大年龄段内各个小年龄段的划分,如婴儿(出生前-2岁)这个大年龄段内有可以划分为3个月、6个月、1周岁或2岁等各个小年龄段,或者如青少年(10-18)这个大年龄段内有可以划分为小学生、初中生或高中生等各个小年龄段。相应的,所述的建立时间序列模型、模型训练和商品聚类与年龄预测可以针对整个年龄范围内各个大年龄段进行,也可以仅针对某个大年龄段内各个小年龄段进行。易于理解的是,一般来说,年龄段的划分越细,种子用户的数量越多,预测的准确率就越高,当然其关系不一定是线性的。
下面以细分为多个小年龄段的婴儿这个大年龄段即母婴类用户为例结合附图进行详细说明。在此需要特别说明的是,由于用户处于婴儿这个大年龄段内,由于婴儿不可能购买商品,因此此时的用户实际上是指婴儿的监护人,所以在下文中,所谓的用户的生日/年龄等将用“用户宝宝/婴儿的生日/年龄”等表达方式进行表述,由此,本领域技术人员根据上下文应易于理解下文中某处的“用户”是指婴儿本身还是指婴儿的监护人,而不必拘泥于具体的表述方式。
图1示出根据本发明示例实施方式的一对用户建模的方法的流程图。该方法可用于终端设备的应用程序。终端设备可为个人电脑、工作站或服务器等,但本发明不限于此。
如图1所示,在S102,获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段。
根据本发明的一实施方式,通过调研获取种子用户宝宝的生日信息。例如,通过调研得到50万种子用户数据,包括宝宝的生日、性别等。
本发明利用50万种子用户建立时间序列模型来预测新的用户的婴儿年龄。其中,部分用户数据如附图2所示。在附图2中,第一列是用户id,第二列是用户宝宝的生日。
已知这些用户的生日,而且从后台数据库中能够提取出这些用户所购买的商品。通过种子用户家宝宝所处的年龄和其在当时年龄购买的商品计算出有年龄区分度的商品,再以年龄区分度商品的购买行为作为后续计算出更多用户的宝宝生日的基础。
在S104,将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量。
根据本发明的一实施方式,通过一阶马尔科夫链模型进行建模。
根据本发明的一实施方式,利用自然语言处理软件包进行训练。
根据本发明的一实施方式,利用自然语言处理软件包通过一阶马尔科夫链模型计算商品的相似度。
根据本发明的一实施方式,所述向量为200维向量。
在具体描述上述建模和训练过程之前,为了能更清晰地描述本发明的模型,在这里对模型用到的算法和工具做一个通熟的介绍如下。
一阶马尔科夫链模型即n-gram模型,其基本思想是作了一个n-1阶马尔科夫(Markov)假设,即认为一个词的出现概率就只与它前面的n-1个词相关,简单来说,n-gram模型可以理解为:在一个句子中,在前n-1个词出现的情况下,第n个词出现的概率。
自然语言处理软件包word2vec,word2vec即word to vector,顾名思义,就是将词(word)转化为向量(vector)。word2vec可以理解为n-gram模型的工具包,但它学习参数的方法是通过极大似然估计得到损失函数,再通过神经网络方法学习参数。
word2vec通过n-gram模型计算两个词的相似度,举例来说,有A,B,C,D四个词,就可以计算句子中:先出现词A,再出现词B,记为AB。就可以计算P(C|AB),P(C|AB)可以理解为AB发生,AB后紧跟着的词是C的概率。
word2vec通过计算P(C|AB)来判断C、D的相似度,P(D|AB)。若P(C|AB)和P(D|AB)都较大,则可认为词C、D较相似。若P(C|AB)较大,P(D|AB)较小,则C、D不相似。
比如:
1.我/爱/爸爸
2.我/爱/妈妈
3.我/爱/坏人
通过计算我/爱/出现后,后面的词出现的概率。1,2的概率较高,则可认为爸爸、妈妈两个词相似。3的概率较低,则可得到坏人这个词,和爸爸、妈妈均不相似。
word2vec将词转化为200维向量,词间的相似度通过计算向量余弦相似度得到。
下面结合附图3详细描述上述建模和训练过程。
首先,建立时间序列模型。
n-gram算法本质上是一种时间序列模型,本发明创造性的将自然语言处理中的n-gram算法应用到商品相似度计算上来。本质上相当于对商品的购买序列建立时间序列模型。
母婴类用户购买的商品通常具有一定时间序列关系(即下单顺序跟时间有关系)。例如,不到一个月的婴儿购买的商品通常是奶粉等,而婴儿到6个月之后可以吃流体的辅食,婴儿到一年之后可以吃固体辅食。利用这一点,就可以通过用户购买的母婴类商品和购买时的时间节点预测婴儿的年龄。宝宝年龄在某个时间段(如:婴儿0-3个月)购买的商品序列也具有先后顺序,即购买的商品序列满足时间序列模型。
基于购买的商品序列满足时间序列模型这一点,本发明将出生前9个月和出生后1年的婴儿细分成7个时间段:3months(婴儿0-3个月)、6months(婴儿3-6个月)、9months(婴儿6-9个月)、1year(婴儿6-12个月)、-3months(婴儿还有0-3个月出生)、-6months(婴儿还有3-6个月出生)、-9months(婴儿还有6-9个月出生)。并求出用户在每个时间段购买的商品集合,其中商品集合按购买先后顺序排列,得到的部分数据如附图3所示,其中第一列为用户名#时间段,其他列为用户在该时间段购买的商品集合(每个商品用sku_id表示),集合按时间顺序排列(如-超级兔子-在婴儿处在3months时间段里,先购买了1595070278,再购买了1595070278,等等)。
通过这样建立的模型,就可以得到用户在不同时间段,倾向于购买哪些商品。再把每个用户在每个时间段所购买的商品当成时间序列中的状态转移,就能计算商品的相似度,计算出的结果就是:3months时间段购买的商品和3months时间段购买的商品相似,3months时间段购买的商品和6months时间段购买的商品或1year时间段购买的商品不相似。
在建立模型之后,即可进行模型训练。
在50万种子用户中,取40万作为训练集合,10万用户作为预测集合。时间序列模型的训练采用工具word2vec,训练数据是所有用户在所有时间段购买的商品集合。训练数据约1百万条,部分训练数据如附图4所示。通过训练后,word2vec将每个商品(sku_id)变成一个200维向量。
由上述详细描述可知,通过对商品购买序列进行时间序列分析建模并利用word2vec训练,已经达到使同一时间段购买的商品相似的目的。例如:用户在宝宝3months(婴儿0-3个月)倾向于购买:纸尿裤和奶瓶。通过S104,认为纸尿裤和奶瓶是相似的。
有了商品的相似关系,后续就可以利用时间段购买的商品集合和新用户即其他用户(除种子用户之外的用户)购买的商品集合进行比较,从而得到新用户宝宝所处的年龄阶段。
在S106,对各个年龄段购买的商品向量求均值作为各个年龄段的中心点。
通过S104,达到了使同一时间段购买的商品相似的目的且每个商品被转化成200维向量。在此基础上,在S106中再对每个时间段内购买的商品的200维向量求均值,得到每个时间段购买商品的中心点。
共得到:3months(婴儿0-3个月)、6months(婴儿3-6个月)、9months(婴儿6-9个月)、1year(婴儿9-12个月)、-3months(婴儿还有0-3个月出生)、-6months(婴儿还有3-6个月出生)、-9months(婴儿还有6-9个月出生)七个时间段,每个时间段的中心点200维向量。
在S108,将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
例如,一个用户购买的商品集合如下:“其实我很好//*14-01 10231617961032248520 1032425951 1040830164 10322485201023161796”,其中,第一列为用户名,第二列为下单的月份,其它为用户“其实我很好”在“2014年1月”购买的商品集合。
将商品集合输入到训练好的word2vec中,每个商品被转成一个200维向量,对集合中的所有商品向量求均值得到一个200维向量。将200维向量与时间段中心点向量求相似度,找出最近的时间段中心点向量,则这个时间段作为用户宝宝所处的时间段。通常对向量求相似度是求余弦相似度,但不限于此。对10万预测集合进行预测,部分预测结果如附图4所示。其中,第一列为用户名#月份,第二列为用户在该月份实际所处的年龄阶段,第三列为预测用户在该月份所处的年龄阶段,第四列为用户在该月份购买商品集合和预测出的时间段中心点向量的余弦相似度。
通过将附图4所示的预测结果中的预测用户在该月份所处的年龄阶段和用户在该月份实际所处的年龄阶段进行对比可以看出,本发明的利用时间序列模型对用户建模的方法,能够以很高的准确率预测出用户所处的年龄阶段。
根据如附图5所示的本发明的一实施方式,所述对用户建模的方法还包括根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
在如附图5所示的对用户建模的方法中,S502-S508与前述的对用户建模的方法的S102-S108相同,在此不再赘述。
在S510中,根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
在通过模型得到更多用户的年龄后,进而对用户按宝宝年龄进行个性化推荐。如在宝宝3个月时推荐纸尿裤,6个月时推荐流体辅食,1周岁时推荐固体辅食。
图6示出根据本发明示例实施方式的一对用户建模的系统方框图。
所述对用户建模的系统可以用于个人电脑、工作站或服务器等设备。
如附图6所示,对用户建模的系统600可包括数据获取模块602、建模和训练模块604和年龄预测模块606。
数据获取模块602,通过调研获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段。
建模和训练模块604,用于将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为200维向量,对各个年龄段购买的商品向量求均值作为各个年龄段的中心点,并将其他用户某一时间段购买的各个商品进行训练转化为200维向量并求均值。其中,建模通过一阶马尔科夫链模型即n-gram模型进行,商品的训练通过自然语言处理软件包word2vec进行。
年龄预测模块606,将其他用户某一时间段购买的各个商品200维向量的均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段即为预测的所述其他用户所处的年龄段。通常对向量求相似度是求余弦相似度,但不限于此。
根据一实施例,所述对用户建模的系统还包括商品推荐模块608,根据预测的所述其他用户所处的年龄段对所述其他用户进行个性化商品推荐。以用户处于婴儿这一年龄段为例,在宝宝3个月时推荐纸尿裤,6个月时推荐流体辅食,1周岁时推荐固体辅食。
图7示出根据本发明一示例实施方式的终端设备。
如图7所示,终端设备700可包括处理器710、存储器720。另外,根据一实施例,终端设备还可包括发射器及接收器。
处理器710可调用存储器720中存储的指令控制相关操作,如控制发射器和接收器进行数据收发等。
根据一实施例,存储器720存储用于处理器710控制以下操作的指令:获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;以及将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。处理器710可调用存储器720中存储的指令控制相关操作。易于理解,存储器720还可存储用于处理器710控制根据本发明实施例的其他操作的指令,这里不再赘述。
通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的系统和方法具有以下优点中的一个或多个。
根据本发明的一些实施方式,通过种子用户所处的年龄和其在当时年龄购买的商品计算出有年龄区分度的商品,再通过年龄区分度商品的购买行为计算出更多用户所处的年龄段。
根据本发明的另一些实施方式,创造性地利用自然语言处理领域的算法对商品购买序列建模,最终通过一系列建模,预测出用户所处的年龄段,进而可利用用户所处的年龄段对用户进行精准的商品推荐。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (11)

1.一种对用户建模的方法,用于预测用户所处的年龄段,其特征在于,包括:
获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;
对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;
将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
2.如权利要求1所述的方法,通过一阶马尔科夫链模型建立时间序列模型。
3.如权利要求1所述的方法,利用自然语言处理软件包进行训练。
4.如权利要求1所述的方法,利用自然语言处理软件包通过一阶马尔科夫链模型计算商品的相似度。
5.如权利要求1所述的方法,所述相似度为余弦相似度。
6.如权利要求1所述的方法,还包括:根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
7.如权利要求1所述的方法,通过调研获取种子用户的生日信息。
8.如权利要求1所述的方法,所述向量为200维向量。
9.一种对用户建模的系统,其特征在于,包括:
数据获取模块,获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
建模和训练模块,将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量,对各个年龄段购买的商品向量求均值作为各个年龄段的中心点,并将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值;
年龄预测模块,将其他用户某一时间段购买的各个商品的均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
10.如权利要求9所述的系统,其特征在于,还包括:
商品推荐模块,根据预测的所述其他用户所处的年龄段对所述其他用户进行商品推荐。
11.一种终端设备,其特征在于,包括:
处理器;
存储器,存储用于所述处理器控制以下操作的指令:
获取种子用户的生日信息,并据此获得种子用户购买每个商品时对应的年龄段;
将所述每个商品及购买时对应的年龄段进行建模和训练,使得同一年龄段购买的商品相似且每个商品被转化为向量;
对各个年龄段购买的商品向量求均值作为各个年龄段的中心点;以及
将其他用户某一时间段购买的各个商品进行训练转化为向量并求均值,将所得均值与各个年龄段的中心点求相似度,相似度最大的中心点所在的年龄段为预测的所述其他用户所处的年龄段。
CN201610942719.6A 2016-11-01 2016-11-01 对用户建模的方法、系统及终端设备 Active CN108022116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610942719.6A CN108022116B (zh) 2016-11-01 2016-11-01 对用户建模的方法、系统及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610942719.6A CN108022116B (zh) 2016-11-01 2016-11-01 对用户建模的方法、系统及终端设备

Publications (2)

Publication Number Publication Date
CN108022116A true CN108022116A (zh) 2018-05-11
CN108022116B CN108022116B (zh) 2021-06-29

Family

ID=62070667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610942719.6A Active CN108022116B (zh) 2016-11-01 2016-11-01 对用户建模的方法、系统及终端设备

Country Status (1)

Country Link
CN (1) CN108022116B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741105A (zh) * 2018-12-29 2019-05-10 星潮闪耀移动网络科技(中国)有限公司 一种向量生成方法及装置
CN110008973A (zh) * 2018-11-23 2019-07-12 阿里巴巴集团控股有限公司 一种模型训练方法、基于模型确定目标用户的方法及装置
CN111008333A (zh) * 2019-12-04 2020-04-14 唐杰 一种基于用户特征信息和产品成分信息的购物系统和方法
CN111325372A (zh) * 2018-12-13 2020-06-23 北京京东尚科信息技术有限公司 预测模型的建立方法、预测方法、装置、介质及设备
CN113535885A (zh) * 2021-09-09 2021-10-22 北京轻松筹信息技术有限公司 基于用户昵称的年龄预测方法、装置及电子设备
CN115775173A (zh) * 2023-02-13 2023-03-10 广东德澳智慧医疗科技有限公司 一种基于算法和人工智能的电商数据团购推演系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615248A (zh) * 2009-04-21 2009-12-30 华为技术有限公司 年龄估计方法、设备和人脸识别系统
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
CN105844302A (zh) * 2016-04-07 2016-08-10 南京新与力文化传播有限公司 基于深度学习的自动计算商品潮流指数的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615248A (zh) * 2009-04-21 2009-12-30 华为技术有限公司 年龄估计方法、设备和人脸识别系统
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
CN105844302A (zh) * 2016-04-07 2016-08-10 南京新与力文化传播有限公司 基于深度学习的自动计算商品潮流指数的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008973A (zh) * 2018-11-23 2019-07-12 阿里巴巴集团控股有限公司 一种模型训练方法、基于模型确定目标用户的方法及装置
CN110008973B (zh) * 2018-11-23 2023-05-02 创新先进技术有限公司 一种模型训练方法、基于模型确定目标用户的方法及装置
CN111325372A (zh) * 2018-12-13 2020-06-23 北京京东尚科信息技术有限公司 预测模型的建立方法、预测方法、装置、介质及设备
CN109741105A (zh) * 2018-12-29 2019-05-10 星潮闪耀移动网络科技(中国)有限公司 一种向量生成方法及装置
CN111008333A (zh) * 2019-12-04 2020-04-14 唐杰 一种基于用户特征信息和产品成分信息的购物系统和方法
CN111008333B (zh) * 2019-12-04 2023-08-25 弗雷森斯(苏州)科技有限公司 一种基于用户特征信息和产品成分信息的购物系统和方法
CN113535885A (zh) * 2021-09-09 2021-10-22 北京轻松筹信息技术有限公司 基于用户昵称的年龄预测方法、装置及电子设备
CN115775173A (zh) * 2023-02-13 2023-03-10 广东德澳智慧医疗科技有限公司 一种基于算法和人工智能的电商数据团购推演系统
CN115775173B (zh) * 2023-02-13 2023-11-03 深圳市唤醒科技传媒有限公司 一种基于算法和人工智能的电商数据团购推演系统

Also Published As

Publication number Publication date
CN108022116B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN108022116A (zh) 对用户建模的方法、系统及终端设备
Sterne Artificial intelligence for marketing: practical applications
Aaker et al. Strategic market management
Bürkner et al. Ordinal regression models in psychology: A tutorial
Dearden et al. Strategic manipulation of university rankings, the prestige effect, and student university choice
Pradeep et al. AI for marketing and product innovation: Powerful new tools for predicting trends, connecting with customers, and closing sales
Beets et al. Parental social support and the physical activity-related behaviors of youth: a review
Hills et al. Longitudinal analysis of early semantic networks: Preferential attachment or preferential acquisition?
Mahajan et al. Innovation diffusion and new product growth models in marketing
Johnson et al. Don't think pink: What really makes women buy--and how to increase your share of this crucial market
Wooliscroft et al. The hierarchy of ethical consumption behavior: The case of New Zealand
Munk et al. The Thick Machine: Anthropological AI between explanation and explication
Mechling et al. Fine and gross motor task performance when using computer-based video models by students with autism and moderate intellectual disability
Grindrod Mathematical underpinnings of analytics: theory and applications
Aroca-Ouellette et al. Prost: Physical reasoning of objects through space and time
CN109584006B (zh) 一种基于深度匹配模型的跨平台商品匹配方法
Bridges A schema unification model of brand extensions
US20180240037A1 (en) Training and estimation of selection behavior of target
Lee The effect of social networking sites’ activities on customers’ well-being
Verma et al. The art and science of customer-choice modeling: Reflections, advances, and managerial implications
CN110807691B (zh) 一种跨商品品类的商品推荐方法和装置
JP2012014466A (ja) 商品情報提供システム、商品情報提供装置、商品情報提供方法及びプログラム
Fadhil Beyond technical motives: Perceived user behavior in abandoning wearable health & wellness trackers
Cousins The semiotic coevolution of mind and culture
Timmermans et al. In search of value added in the case of complex school effects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant