CN107341679A - 获取用户画像的方法及装置 - Google Patents
获取用户画像的方法及装置 Download PDFInfo
- Publication number
- CN107341679A CN107341679A CN201610284124.6A CN201610284124A CN107341679A CN 107341679 A CN107341679 A CN 107341679A CN 201610284124 A CN201610284124 A CN 201610284124A CN 107341679 A CN107341679 A CN 107341679A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- user
- parameter matrix
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
本发明公开了一种获取用户画像的方法及装置,属于信息处理技术领域。所述方法包括:根据用户行为日志,获取M个训练样本;根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n。本发明通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
Description
技术领域
本发明实施例涉及信息处理技术领域,特别涉及一种获取用户画像的方法及装置。
背景技术
用户画像,又称用户角色(Persona),是一种用于勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域得到了广泛的应用。具体实现时,可将用户画像以用于刻画用户特征的标签(tag)集合表示,该标签集合可包括从用户社会属性、生活习惯、消费行为等角度刻画用户特征的标签。比如年龄、性别、地域、学历和用户偏好等标签。
现有技术提供了一种获取用户画像的方法。预先设定多个标签,并人工为每一个标签设定相应的标签权重,标签权重可以根据实际应用的需求或人工经验预先设定。可选的,对于每一个标签,根据具备该标签的物品在所有物品中的占比,设定该标签对应的标签权重。通常,上述占比与标签权重呈负相关关系,也即上述占比越大则标签权重越小,上述占比越小则标签权重越大。而后获取用户行为日志,用户行为日志记录有用户对各个物品执行的各种行为,比如:用户1浏览了物品1、用户2购买了物品1、用户1购买了物品2等。然后根据各个物品所具备的标签和用户对各个物品执行的行为,确定用户对各个标签的行为权重。最后分别根据每一个标签对应的标签权重和行为权重,计算得到用户对该标签的喜好程度,整合用户对各个标签的喜好程度得到用户画像。例如,用户对某一标签的喜好程度,可采用该标签对应的标签权重与行为权重的乘积表示。
然而,在现有技术中,由于需要人工为每一个标签设定相应的标签权重,而标签的数量往往较多,这就导致需要花费大量的时间和人力资源,获取用户画像所耗费的时间和人力成本较高;并且,由于人工设定标签权重的方式难免存在误差,很难保证人工设定的标签权重与实际业务相符,导致最终获取的用户画像的准确度较低。
发明内容
为了解决现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题,本发明实施例提供了一种获取用户画像的方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供了一种获取用户画像的方法,所述方法包括:
根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
根据本发明实施例的第二方面,提供了一种获取用户画像的装置,所述装置包括:
样本获取模块,用于根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
矩阵修正模块,用于根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
画像获取模块,用于根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
本发明实施例提供的技术方案带来的有益效果包括:
通过根据用户行为日志,获取M个训练样本,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,而后根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;解决了现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题;通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的获取用户画像的方法的流程图;
图2是本发明另一个实施例提供的获取用户画像的方法的流程图;
图3是图2所示实施例中步骤201的子步骤的流程图;
图4是本发明一个实施例提供的生成用户相似度矩阵的流程图;
图5是本发明一个实施例提供的获取用户画像的装置的结构方框图;
图6是本发明另一个实施例提供的获取用户画像的装置的结构方框图;
图7是本发明一个实施例提供的服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
为了便于理解,首先对本文中涉及的一些名词做介绍和说明。
物品
物品包括实体物品和虚拟物品。实体物品是指真实存在的物品,是与办公、生活消费有关的物件,如衣服、食物、办公用品等;虚拟物品是指在现实生活中摸不到的物品,诸如视频、音频、图片、应用软件、微博之类的互联网产品或内容,或者是从虚拟的网络世界里衍生出来的物品,如游戏道具、会员、图标等。
标签
标签是指用于描述物品属性的关键词。比如,衣服的标签可以包括从颜色、款式、尺寸等角度描述的关键词;再比如,视频的标签可以包括从年份、国家、类型、演员等角度描述的关键词;再比如,游戏道具的标签可以包括从分类、功能、等级等角度描述的关键词。
用户的行为类型
用户的行为类型是指用户对物品执行的行为。比如:浏览、购买、收藏、删除、使用、转发、点赞、踩、评论等。针对不同的物品,用户对该物品所能够执行的行为可能相同,也可能不同。比如,对于衣服,用户对该物品所能够执行的行为可以包括浏览、购买、收藏等;再比如,对于视频,用户对该物品所能够执行的行为可以包括浏览、预览、观看、购买、收藏等;再比如,对于微博,用户对该物品所能够执行的行为可以包括浏览、转发、收藏等。可选的,用户的行为类型还包括“未知”类型,用于表示用户未对物品执行任何行为。用户对物品的行为类型反映了用户对物品的喜好程度,根据用户对两个物品的行为类型,便可确定用户对该两个物品的喜好程度的差异。
本发明实施例提供的方法,各步骤的执行主体可以是具备数据存储和计算能力的电子设备,如服务器。在下述方法实施例中,仅以各步骤的执行主体为服务器为例进行举例说明,但对此不构成限定。
请参考图1,其示出了本发明一个实施例提供的获取用户画像的方法的流程图。该方法可以包括如下几个步骤。
步骤101,根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,M为正整数。
步骤102,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n。
其中,m表示用户个数,k表示因子个数,n表示标签个数,m为正整数,k为正整数,n为大于1的整数。
步骤103,根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n。
其中,用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,u为大于等于1且小于等于m的整数,t为大于等于1且小于等于n的整数。
综上所述,本实施例提供的方法,通过根据用户行为日志,获取M个训练样本,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,而后根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;解决了现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题;通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
请参考图2,其示出了本发明另一个实施例提供的获取用户画像的方法的流程图。在本实施例中,以各步骤的执行主体为服务器进行举例说明。该方法可以包括如下几个步骤。
步骤201,根据用户行为日志,获取M个训练样本。
训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,M为正整数。
用户行为日志用于记录用户对物品的操作行为。用户行为日志中包括用户标识、用户的行为类型、物品标识和物品标签信息。其中,用户标识是用于识别用户身份的标识号码,也称为用户帐号,是某个体系中相对唯一的编码。用户的行为类型是指用户对物品执行的行为,比如浏览、购买、收藏、删除、使用、转发、点赞、踩、评论、未知等。用户的行为类型的种类可以根据实际应用的需求进行设置。物品标识是用于识别物品的标识号码,与用户标识类似,每个物品对应有唯一的物品标识。物品标签信息是用于描述物品属性的关键词,一个物品可以包括一个或多个标签。获取用户行为日志的方式可以是服务器采集终端上的用户操作行为或终端主动上报用户操作行为到服务器。
训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异。在一种可能的实施方式中,训练样本<u,i,j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度;在另一种可能的实施方式中,训练样本<u,i,j>用于反映用户u对物品i的喜好程度小于对物品j的喜好程度。用户对物品的行为类型反映了用户对物品的喜好程度,根据用户对两个物品的行为类型,便可确定用户对该两个物品的喜好程度的差异。
可选的,根据用户付出的代价决定行为类型的权重的准则,按照行为类型的权重确定出所有行为类型之间的相对大小关系。例如,“购买”行为类型的权重大于“浏览”行为类型的权重。如果用户未对物品执行任何行为,则获取用户的行为类型是“未知”类型。一般来说,用户对其执行了某种行为的物品的喜好程度大于其对未执行过任何行为的物品的喜好程度,因此“未知”行为类型的权重最小,小于“浏览”、“购买”等行为类型的权重。例如:用户u对物品i执行了某种行为,而对物品j未执行过任何行为,则用户u对物品i的喜好程度大于对物品j的喜好程度。
例如,以训练样本<u,i,j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度为例,如果用户u喜欢物品i的程度大于喜欢物品j的程度,则得到的训练样本是<u,i,j>,相反地,则得到的训练样本是<u,j,i>。例如:用户u购买物品i、浏览物品j,则获取的训练样本是<u,i,j>;用户浏览物品i、购买物品j,则获取的训练样本是<u,j,i>。又例如:用户浏览物品i,但没有对物品j执行任何行为,则获取的训练样本是<u,i,j>。针对一个用户可以获取到一个或多个训练样本,如果用户1浏览了物品2,但对物品1、物品3和物品4并未执行任何行为,则获取到的训练样本包括<1,2,1>、<1,2,3>和<1,2,4>。
在一种可能的实施方式中,如图3所示,步骤201可以包括如下几个子步骤:
步骤201a,根据用户行为日志,获取m个用户中的每一个用户对h个物品中的每一个物品的行为类型。
其中,m表示用户个数,h表示物品个数,m为正整数,h为大于1的整数。
步骤201b,根据每一个用户对每一个物品的行为类型,获取M个训练样本。
作为一种可能的实施方式,步骤201b可以包括:
1、根据用户的行为类型获取用户物品矩阵;
可选的,用户物品矩阵Rm×h的行表示用户,列表示物品,m表示用户个数,h表示物品个数,元素Rui表示用户u对物品i是否执行了某种行为。示例性的,用户物品矩阵Rm×h中的元素用0或1表示。1表示用户对物品执行了某种行为,0表示用户对物品未执行任何行为。示例性的,当用户个数为3,物品个数为4时,用户物品矩阵Rm×h为:
其中,第一行第二列中的1表示用户1对物品2执行了某种行为。
2、根据用户的行为类型和用户物品矩阵,获取M个训练样本。
根据用户物品矩阵可以知道用户是否对物品执行了某种行为,对于用户u,根据行为类型可以确定用户u喜欢物品i的程度是否大于喜欢物品j的程度,从而得到一个训练样本。示例性的,由用户物品矩阵R3×4的第一行可知,用户1对物品2执行了某种行为,用户1对物品1、物品3和物品4并未执行任何行为,以训练样本<u,i,j>用于反映用户u对物品i的喜好程度大于对物品j的喜好程度为例,则获取到的用户1的训练样本包括:<1,2,1>、<1,2,3>和<1,2,4>。
需要说明的是,在一般情况下,用户对其执行了某种行为的物品的喜好程度大于其对未执行过任何行为的物品的喜好程度。但是,在其它可能的情况下,用户对其执行了某种行为的物品的喜好程度也有可能小于其对未执行过任何行为的物品的喜好程度。以物品为视频为例,如果用户对视频A执行的行为为踩,对视频B并未执行任何行为,则认为用户对视频A的喜好程度小于对视频B的喜好程度。
另外,由于用户个数为m,物品个数为h,因此理论上可构建个样本,在实际操作时,采用采样方式从上述个样本中选取部分较为可靠的样本作为训练样本。例如,如果用户u对物品i和物品j均未执行任何行为,或者用户u对物品i和物品j执行的行为类型相同,则无法明确用户u对物品i和物品j的喜好程度的差异,这类样本不作为训练样本。再例如,获取每一个物品的执行可能性,一个物品的执行可能性是指用户对该物品执行行为的可能性。执行可能性可基于物品在整个系统中的出现率、流行度、推荐度、显示排序等因素进行确定。例如,物品在整个系统中的出现率越大,说明用户很容易便可获取到该物品,则该物品的执行可能性越大;反之,物品在整个系统中的出现率越小,说明用户获取到该物品较为困难,则该物品的执行可能性越小。在获取训练样本时,若选择一个用户u执行了行为的物品和一个用户u未执行行为的物品构建训练样本,则可从用户u未执行行为的物品中,选择执行可能性较大的物品,以构建训练样本。通过上述方式,可以确保所获取的训练样本更加准确地反映用户对两个物品的喜好程度的差异,降低训练样本的错误风险,提高训练样本的可靠性。
步骤202,生成初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n;
其中,m表示用户个数,k表示因子个数,n表示标签个数,m为正整数,k为正整数,n为大于1的整数。在一种可能的实施方式中,采用生成呈正态分布的随机数的方式,构建初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n。也即,初始化的用户参数矩阵Wm×k中的元素为呈正态分布的随机数,初始化的标签参数矩阵Hk×n中的元素为呈正态分布的随机数。
可选的,因子个数k是预先设定的值,或,因子个数k是根据大量实验得到的经验值。
可选的,正态分布的均值设置为0,方差设置为0.01。
示例性的,随机生成的用户参数矩阵Wm×k和标签参数矩阵Hk×n如下所示:
其中,用户参数矩阵Wm×k的每一行对应一个用户的因子向量;标签参数矩阵Hk×n的每一列对应一个标签的因子向量。
下面,通过如下步骤203至步骤207修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n。首先,令a=0,并执行如下步骤203。
步骤203,根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度。
其中,a为大于等于0的整数,第0轮修正后的用户参数矩阵Wm×k为初始化的用户参数矩阵Wm×k,第0轮修正后的标签参数矩阵Hk×n为初始化的标签参数矩阵Hk×n。
当a=0时,根据初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度。
可选的,用户u对标签t的喜好程度计算公式如下:
比如:如上示例性的初始化的用户参数矩阵W和初始化的标签参数矩阵H中,用户1对标签1的喜好程度为:用户3对标签5的喜好程度为:
步骤204,根据m个用户中的每一个用户对n个标签中的每一个标签的喜好程度和物品标签矩阵Ah×n,计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度。
根据初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n计算出每一个用户对每一个标签的喜好程度后,结合物品标签矩阵Ah×n,计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度。
其中,物品标签矩阵Ah×n是根据用户行为日志中携带的物品标识和物品标签得到的矩阵。
可选的,物品标签矩阵Ah×n的行表示物品,列表示标签。示例性的,物品标签矩阵Ah×n中的元素用0或1表示。0表示物品不具有标签所描述的属性,1表示物品具有标签所描述的属性。假定物品的个数为4,标签的个数为5,则示例性的物品标签矩阵Ah×n为:
其中,物品标签矩阵A1表示物品标签矩阵的第一行,说明物品1具有标签1和标签2所描述的属性,物品1不具有标签3、标签4和标签5所描述的属性。
用户喜欢某一物品,通常是因为该物品具有用户喜好的标签(也即标签所描述的属性),用户对物品的喜好可以看成是用户对该物品具有的标签的喜好程度的综合。用户u对物品i的喜好程度可以根据用户u对物品i具有的标签的喜好程度计算得到。
可选的,本发明实施例中采用将用户u对物品i具有的标签的喜好程度进行求和计算用户u对物品i的喜好程度,计算公式为:
比如:如上示例性的初始化用户参数矩阵Wm×k、初始化标签参数矩阵Hk×n中,用户1对物品1的喜好程度用户3对物品2的喜好程度
步骤205,根据m个用户中的每一个用户对h个物品中的每一个物品的喜好程度,获取每一个训练样本对应的概率。
其中,训练样本<u,i,j>对应的概率是指用户u对物品i的喜好程度大于对物品j的喜好程度的概率。
可选的,计算用户u对物品i的喜好程度大于对物品j的喜好程度的概率的过程如下:
第一步,根据计算出的每个用户对每个物品的喜好程度,计算用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值:
第二步,根据逻辑斯蒂函数σ(x)计算用户u对物品i的喜好程度大于对物品j的喜好程度的概率:
步骤206,将M个训练样本分别对应的概率作为数据拟合模型的输入参数,计算数据拟合模型的输出结果。
可选的,数据拟合模型是采用贝叶斯最大似然估计方法构建的模型,具体的数据拟合模型如下所示:
其中,λW、λH和λS是用于防止过拟合的正则化参数,λW、λH和λS为正实数,||·||表示矩阵的二范数,Ds表示M个训练样本的集合,训练样本<u,i,j>对应的概率 表示用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值,σ(x)表示逻辑斯蒂函数,Nu表示用户u的关联用户集合,Suv是用户相似度矩阵Sm×m中第u行第v列的元素,Suv表示用户u和用户v之间的相似度,Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,Wv表示所述第a轮修正后的用户参数矩阵Wm×k中第v行对应的行向量。
Nu表示用户u的关联用户集合,也即表示与用户u之间存在关联关系的其他用户的集合。其中,关联关系可以是好友关系,例如某一用户v与用户u是社交类应用中的好友,则用户u与用户v之间具有好友关系,用户u与用户v互为关联用户;或者,关联关系也可以是非好友关系,例如某一用户v与用户u属于社交类应用中的同一群组,则用户u与用户v互为关联用户。需要说明的是,在构建用户相似度矩阵Sm×m时,用户相似度矩阵Sm×m中的任意两个用户,可以是具有好友关系的用户,也可以是并未建立好友关系(如属于同一群组,甚至为互不相识的陌生用户)的用户。
用户相似度矩阵Sm×m中包括m个用户中两两用户之间的相似度。可选的,将矩阵S对角元素设置为Suu=0,最后按行归一化以使得
步骤207,若输出结果不符合预设条件,则修正第a轮修正后的用户参数矩阵Wm×k得到第a+1轮修正后的用户参数矩阵Wm×k,以及修正第a轮修正后的标签参数矩阵Hk×n得到第a+1轮修正后的标签参数矩阵Hk×n,令a=a+1,并返回执行上述步骤203至步骤206。
预设条件包括本轮输出结果与上轮输出结果之间的差值小于预定阈值,和/或,对用户参数矩阵和标签参数矩阵的修正轮数达到预定轮数。其中,预定阈值和预定轮数综合衡量修正精度和修正效率之后进行设定。
可选的,根据第a轮修正后的用户参数矩阵Wm×k按照下述公式计算得到第a+1轮修正后的用户参数矩阵Wm×k。
其中,Wu′表示第a+1轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,Wu表示第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,表示第a轮修正后的标签参数矩阵Hk×n中第l列对应的列向量的转置向量,l为大于等于1且小于等于n的整数,α为学习效率,α为正实数。其中,α为预先设定的经验值,α可综合衡量修正速度和修正精度之后进行设定。
可选的,根据第a轮修正后的标签参数矩阵Hk×n按照下述公式计算得到第a+1轮修正后的标签参数矩阵Hk×n。
其中,Hf′表示第a+1轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,Hf表示第a轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,f为大于等于1且小于等于k的整数,α为学习效率,α为正实数。其中,α为预先设定的经验值,α可综合衡量修正速度和修正精度之后进行设定。
在每一轮修正过程中,采用M个训练样本中的每一个训练样本对应的依次逐个代入上述公式,对用户参数矩阵和标签参数矩阵进行M次修正。
也即,在对用户参数矩阵和标签参数矩阵进行第a轮修正的过程中,令x=1,将第x个训练样本对应的第x-1次修正后的用户参数矩阵和第x-1次修正后的标签参数矩阵代入上述用户参数矩阵的修正公式,计算得到第x次修正后的用户参数矩阵;将第x个训练样本对应的第x-1次修正后的标签参数矩阵和第x次修正后的用户参数矩阵代入上述标签参数矩阵的修正公式,计算得到第x次修正后的标签参数矩阵;令x=x+1,检测x是否大于M;若否,则重新从所述将第x个训练样本对应的第x-1次修正后的用户参数矩阵和第x-1次修正后的标签参数矩阵代入上述用户参数矩阵的修正公式,计算得到第x次修正后的用户参数矩阵的步骤开始执行;若是,则结束流程,完成第a轮修正。其中,第0次修正后的用户参数矩阵是第a-1轮修正后的用户参数矩阵,第0轮修正后的用户参数矩阵即为初始化的用户参数矩阵,在第a轮修正过程中得到的第M次修正后的用户参数矩阵即为第a轮修正后的用户参数矩阵;第0次修正后的标签参数矩阵是第a-1轮修正后的标签参数矩阵,第0轮修正后的标签参数矩阵即为初始化的标签参数矩阵,在第a轮修正过程中得到的第M次修正后的标签参数矩阵即为第a轮修正后的标签参数矩阵。
步骤208,若输出结果符合预设条件,则将第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n分别确定为最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n。
当数据拟合模型的输出结果符合预设条件时,停止修正用户参数矩阵Wm×k和标签参数矩阵Hk×n,确定当前的用户参数矩阵Wm×k为最终的用户参数矩阵Wm×k以及当前的标签参数矩阵Hk×n为最终的标签参数矩阵Hk×n。
步骤209,根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n。
其中,用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,u为大于等于1且小于等于m的整数,t为大于等于1且小于等于n的整数。
在反复修正用户参数矩阵和标签参数矩阵后,得到最终的用户参数矩阵和最终的标签参数矩阵,根据最终的用户参数矩阵和最终的标签参数矩阵输出用户对标签的喜好程度。
示例性的,假定拟合训练样本得到最终的用户参数矩阵和最终的标签参数矩阵分别为m=3,k=2,n=5,那么计算得到的用户画像矩阵为:
可选的,本实施例提供的方法还包括如下步骤210。
步骤210,根据获取得到的用户画像矩阵Pm×n和目标物品所具有的标签,计算用户u对目标物品的喜好程度。
可选的,将用户u对目标物品所具有的各个标签的喜好程度进行求和,计算用户u对目标物品的喜好程度。
综上所述,本实施例提供的方法,通过根据用户行为日志,获取M个训练样本,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,而后根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;解决了现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题;通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
另外,采用机器学习的方式对用户参数矩阵和标签参数矩阵进行修正,使之拟合训练样本,进而自动获取用户画像,更加准确高效。
另外,基于物以类聚人以群分的思想,两个相似度更高的用户,其用户偏好也应当更为接近,通过在数据拟合模型中增加用户相似度矩阵作为约束条件,而不仅仅单一地依赖于用户行为日志来获取用户画像,并且在修正用户参数矩阵时考虑用户相似度矩阵,体现了用户参数向量与其关联用户的用户参数向量之间的强相关性,从而更加精准地获取用户画像。
可选的,如图4所示,通过如下步骤获取用户相似度矩阵Sm×m。
步骤401,获取m个用户中的每一个用户的社交网络信息。
社交网络信息中包括用户标识、用户的关联用户列表、用户与关联用户之间的相似度。
其中,用户标识是用于识别用户身份的标识号码,也称为用户帐号,是某个体系中相对唯一的编码。用户的关联用户列表中包括用户的各个关联用户,也即与用户具有关联关系的其他用户。用户与关联用户之间的相似度是指用户与关联用户之间的相关性。其中,用户与关联用户之间的相似度可根据如下一项或者多项参数进行确定:用户与关联用户之间的交往频率、用户与关联用户之间是否为好友关系、用户与关联用户之间是否拥有相同的社交圈、用户与关联用户之间是否拥有相同的人口属性、用户与关联用户之间是否存在相同的偏好。等等。
步骤402,根据m个用户的社交网络信息,生成用户相似度矩阵Sm×m。
根据m个用户的社交网络信息,获取两两用户之间的相似度,生成用户相似度矩阵Sm×m。用户相似度矩阵Sm×m中的行和列都表示用户,比如:用户相似度矩阵Sm×m中的第二行第三列表示用户2与用户3之间的相似度。
示例性的,当用户个数为3时,用户相似度矩阵Sm×m为:
其中,第一行中的0.6表示用户1与用户2之间的相似度,0.4表示用户1与用户3之间的相似度,等等。在生成用户相似度矩阵Sm×m时,仅考虑用户与关联用户之间的相似度,而不考虑用户与其自身之间的相似度,因此将用户相似度矩阵Sm×m的对角元素Suu设为0。
综上所述,通过引入用户相似度矩阵作为数据拟合模型的约束条件,同时也作为修正用户参数矩阵的一个参数,进一步提高了最终获取的用户画像的准确度。
此外,在上述实施例中,仅以用户之间的相似度作为约束条件融入到数据拟合模型中,以体现用户参数向量与其关联用户的用户参数向量之间的强相关性。在其它可能的实施例中,也可根据需要将其它数据作为约束条件融入到数据拟合模型中。例如,将标签之间的相似度作为约束条件融入到数据拟合模型中,构建标签相似度矩阵,标签相似度矩阵中的行和列都表示标签,每个元素表示对应的行和列表示的两个标签之间的相似度,标签之间的相似度可依据标签所表达的意思的相近程度进行确定,例如两个意思越接近的标签之间的相似度越高,以体现标签参数向量与其相似标签的标签参数向量之间的强相关性。因此,上述数据拟合模型是一种比较通用的、自动地学习用户参数向量和标签参数向量从而获取用户对标签的喜好程度的框架,可根据需要加入其它数据到该模型中。
请参考图5,其示出了本发明一个实施例提供的获取用户画像的装置的结构方框图。该装置可通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该装置可以包括:样本获取模块520、矩阵修正模块540和画像获取模块560。
样本获取模块520,用于根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,M为正整数。
矩阵修正模块540,用于根据样本获取模块520获取的训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,m表示用户个数,k表示因子个数,n表示标签个数,m为正整数,k为正整数,n为大于1的整数。
画像获取模块560,用于根据矩阵修正模块540得到的最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,u为大于等于1且小于等于m的整数,t为大于等于1且小于等于n的整数。
综上所述,本实施例提供的装置,通过根据用户行为日志,获取M个训练样本,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,而后根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;解决了现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题;通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
请参考图6,其示出了本发明另一个实施例提供的获取用户画像的装置的结构方框图。该装置可通过软件、硬件或者两者的结合实现成为服务器的部分或者全部。该装置可以包括:样本获取模块610、矩阵修正模块650和画像获取模块660。
样本获取模块610,用于根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,M为正整数。
在一种可能的实现方式中,样本获取模块610包括:行为获取单元611和样本获取单元612。
行为获取单元611,用于根据用户行为日志,获取m个用户中的每一个用户对h个物品中的每一个物品的行为类型,h为大于1的整数。
样本获取单元612,用于根据行为获取单元611获取的每一个用户对每一个物品的行为类型,获取M个训练样本。
可选的,该装置还包括:第二生成模块620。
第二生成模块620,用于生成初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n。其中,初始化的用户参数矩阵Wm×k中的元素为呈正态分布的随机数,初始化的标签参数矩阵Hk×n中的元素为呈正态分布的随机数。
可选的,该装置还包括:信息获取模块630和第一生成模块640。
信息获取模块630,用于获取m个用户中的每一个用户的社交网络信息。
第一生成模块640,用于根据信息获取模块630获取的m个用户的社交网络信息,生成用户相似度矩阵Sm×m。
矩阵修正模块650,用于根据样本获取模块610获取的训练样本,采用数据拟合模型修正第二生成模块620生成的初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,m表示用户个数,k表示因子个数,n表示标签个数,m为正整数,k为正整数,n为大于1的整数。
在一种可能的实现方式中,矩阵修正模块650包括:第一计算单元651、第二计算单元652、概率获取单元653、第三计算单元654、矩阵确定单元655和矩阵修正单元656。
第一计算单元651,用于令a=0,根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度;其中,a为大于等于0的整数,第0轮修正后的用户参数矩阵Wm×k为初始化的用户参数矩阵Wm×k,第0轮修正后的标签参数矩阵Hk×n为初始化的标签参数矩阵Hk×n。
第二计算单元652,用于根据m个用户中的每一个用户对n个标签中的每一个标签的喜好程度和物品标签矩阵Ah×n,计算m个用户中的每一个用户对h个物品中的每一个物品的喜好程度;其中,h表示物品个数,h为大于1的整数。
概率获取单元653,用于根据m个用户中的每一个用户对h个物品中的每一个物品的喜好程度,获取每一个训练样本对应的概率;其中,训练样本<u,i,j>对应的概率是指用户u对物品i的喜好程度大于对物品j的喜好程度的概率。
第三计算单元654,用于将M个训练样本分别对应的概率作为数据拟合模型的输入参数,计算数据拟合模型的输出结果。
可选的,数据拟合模型为:
其中,λW、λH和λS是用于防止过拟合的正则化参数,λW、λH和λS为正实数;||·||表示矩阵的二范数,Ds表示M个训练样本的集合,训练样本<u,i,j>对应的概率 表示用户u对物品i的喜好程度与用户u对物品j的喜好程度的差值,σ(x)表示逻辑斯蒂函数,Nu表示用户u的关联用户集合,Suv是用户相似度矩阵Sm×m中第u行第v列的元素,Suv表示用户u和用户v之间的相似度,Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,Wv表示所述第a轮修正后的用户参数矩阵Wm×k中第v行对应的行向量。
矩阵确定单元655,用于在输出结果符合预设条件时,将第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n分别确定为最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n。
矩阵修正单元656,用于在输出结果不符合预设条件时,修正第a轮修正后的用户参数矩阵Wm×k得到第a+1轮修正后的用户参数矩阵Wm×k,以及修正第a轮修正后的标签参数矩阵Hk×n得到第a+1轮修正后的标签参数矩阵Hk×n,令a=a+1,并重新从根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算m个用户中的每一个用户对n个标签中的每一个标签的喜好程度的步骤开始执行。
在一种可能的实现方式中,矩阵修正单元656,具体用于按照下述公式计算第a+1轮修正后的用户参数矩阵Wm×k:
其中,Wu′表示第a+1轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,Wu表示第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,表示第a轮修正后的标签参数矩阵Hk×n中第l列对应的列向量的转置向量,l为大于等于1且小于等于n的整数,α为学习效率,α为正实数。
在一种可能的实现方式中,矩阵修正单元656,具体用于按照下述公式计算第a+1轮修正后的标签参数矩阵Hk×n:
其中,Hf′表示第a+1轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,Hf表示第a轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,f为大于等于1且小于等于k的整数,α为学习效率,α为正实数。
画像获取模块660,用于根据矩阵修正模块650得到的最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,u为大于等于1且小于等于m的整数,t为大于等于1且小于等于n的整数。
可选的,该装置还包括:喜好计算模块670。
喜好计算模块670,用于根据画像获取模块660获取的用户画像矩阵Pm×n和目标物品所具有的标签,计算用户u对目标物品的喜好程度。
综上所述,本实施例提供的装置,通过根据用户行为日志,获取M个训练样本,根据训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,而后根据最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;解决了现有技术提供的获取用户画像的方法,所耗费的时间和人力成本较高,且获取的用户画像的准确度较低的问题;通过将用户和标签参数化,并采用数据拟合模型修正用户参数矩阵和标签参数矩阵,使之拟合训练样本,无需人工为标签设定相应的标签权重,根据用户行为日志采用数据拟合方法自动地获取用户画像,达到了节省时间和人力成本,准确高效地获取用户画像的技术效果。
另外,采用机器学习的方式对用户参数矩阵和标签参数矩阵进行修正,使之拟合训练样本,进而自动获取用户画像,更加准确高效。
另外,基于物以类聚人以群分的思想,两个相似度更高的用户,其用户偏好也应当更为接近,通过在数据拟合模型中增加用户相似度矩阵作为约束条件,而不仅仅单一地依赖于用户行为日志来获取用户画像,并且在修正用户参数矩阵时考虑用户相似度矩阵,体现了用户参数向量与其关联用户的用户参数向量之间的强相关性,从而更加精准地获取用户画像。
需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的获取用户画像的装置与获取用户画像的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图7,其示出了本发明一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的获取用户画像的方法。具体来讲:
所述服务器700包括中央处理单元(CPU)701、包括随机存取存储器(RAM)702和只读存储器(ROM)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。所述服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
所述基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中所述显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。所述基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。所述大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说,所述大容量存储设备707可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
根据本发明的各种实施例,所述服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在所述系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述方法的指令。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (18)
1.一种获取用户画像的方法,其特征在于,所述方法包括:
根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n,包括:
令a=0,根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度;其中,所述a为大于等于0的整数,第0轮修正后的用户参数矩阵Wm×k为所述初始化的用户参数矩阵Wm×k,第0轮修正后的标签参数矩阵Hk×n为所述初始化的标签参数矩阵Hk×n;
根据所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度和物品标签矩阵Ah×n,计算所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度;其中,所述h表示物品个数,所述h为大于1的整数;
根据所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度,获取每一个训练样本对应的概率;其中,所述训练样本<u,i,j>对应的概率是指所述用户u对所述物品i的喜好程度大于对所述物品j的喜好程度的概率;
将所述M个训练样本分别对应的概率作为所述数据拟合模型的输入参数,计算所述数据拟合模型的输出结果;
若所述输出结果符合预设条件,则将所述第a轮修正后的用户参数矩阵Wm×k和所述第a轮修正后的标签参数矩阵Hk×n分别确定为所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n;
若所述输出结果不符合所述预设条件,则修正所述第a轮修正后的用户参数矩阵Wm×k得到第a+1轮修正后的用户参数矩阵Wm×k,以及修正所述第a轮修正后的标签参数矩阵Hk×n得到第a+1轮修正后的标签参数矩阵Hk×n,令a=a+1,并重新从所述根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度的步骤开始执行。
3.根据权利要求2所述的方法,其特征在于,所述数据拟合模型为:
<mrow>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mrow>
<mo>(</mo>
<mrow>
<mi>u</mi>
<mo>,</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mo>)</mo>
</mrow>
<mo>&Element;</mo>
<msub>
<mi>D</mi>
<mi>s</mi>
</msub>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<mi>ln</mi>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>W</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>H</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>H</mi>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>v</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>u</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>u</mi>
<mi>v</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
</mrow>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,所述λW、所述λH和所述λS是用于防止过拟合的正则化参数,所述λW、所述λH和所述λS为正实数,||·||表示矩阵的二范数,所述Ds表示所述M个训练样本的集合,所述训练样本<u,i,j>对应的概率所述表示所述用户u对所述物品i的喜好程度与所述用户u对所述物品j的喜好程度的差值,σ(x)表示逻辑斯蒂函数,所述Nu表示所述用户u的关联用户集合,所述Suv是用户相似度矩阵Sm×m中第u行第v列的元素,所述Suv表示所述用户u和用户v之间的相似度,所述Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述Wv表示所述第a轮修正后的用户参数矩阵Wm×k中第v行对应的行向量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述m个用户中的每一个用户的社交网络信息;
根据所述m个用户的社交网络信息,生成所述用户相似度矩阵Sm×m。
5.根据权利要求3所述的方法,其特征在于,所述修正所述第a轮修正后的用户参数矩阵Wm×k得到第a+1轮修正后的用户参数矩阵Wm×k,包括:
按照下述公式计算所述第a+1轮修正后的用户参数矩阵Wm×k:
<mrow>
<msup>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>&prime;</mo>
</msup>
<mo>=</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
</mrow>
</mfrac>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mi>H</mi>
<mrow>
<mo>&CenterDot;</mo>
<mi>l</mi>
</mrow>
<mi>T</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>A</mi>
<mrow>
<mi>i</mi>
<mi>l</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>A</mi>
<mrow>
<mi>j</mi>
<mi>l</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>W</mi>
</msub>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>v</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>u</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>u</mi>
<mi>v</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mo>{</mo>
<mrow>
<mi>v</mi>
<mo>|</mo>
<mi>u</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>v</mi>
</msub>
</mrow>
<mo>}</mo>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>v</mi>
<mi>u</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>w</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>v</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>v</mi>
<mi>w</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>w</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
其中,所述Wu′表示所述第a+1轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述表示所述第a轮修正后的标签参数矩阵Hk×n中第l列对应的列向量的转置向量,所述l为大于等于1且小于等于n的整数,所述α为学习效率,所述α为正实数。
6.根据权利要求3所述的方法,其特征在于,所述修正所述第a轮修正后的标签参数矩阵Hk×n得到第a+1轮修正后的标签参数矩阵Hk×n,包括:
按照下述公式计算所述第a+1轮修正后的标签参数矩阵Hk×n:
<mrow>
<msup>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>&prime;</mo>
</msup>
<mo>=</mo>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
</mrow>
</mfrac>
<msub>
<mi>W</mi>
<mrow>
<mi>u</mi>
<mi>f</mi>
</mrow>
</msub>
<mo>(</mo>
<mrow>
<msub>
<mi>A</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>A</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>H</mi>
</msub>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,所述Hf′表示所述第a+1轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,所述Hf表示所述第a轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,所述f为大于等于1且小于等于k的整数,所述α为学习效率,所述α为正实数。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据用户行为日志,获取M个训练样本,包括:
根据所述用户行为日志,获取所述m个用户中的每一个用户对h个物品中的每一个物品的行为类型,所述h为大于1的整数;
根据每一个用户对每一个物品的行为类型,获取所述M个训练样本。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n之前,还包括:
生成所述初始化的用户参数矩阵Wm×k和所述初始化的标签参数矩阵Hk×n;
其中,所述初始化的用户参数矩阵Wm×k中的元素为呈正态分布的随机数,所述初始化的标签参数矩阵Hk×n中的元素为呈正态分布的随机数。
9.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n之后,还包括:
根据所述用户画像矩阵Pm×n和目标物品所具有的标签,计算所述用户u对所述目标物品的喜好程度。
10.一种获取用户画像的装置,其特征在于,所述装置包括:
样本获取模块,用于根据用户行为日志,获取M个训练样本;其中,训练样本<u,i,j>用于反映用户u对物品i和物品j的喜好程度的差异,所述M为正整数;
矩阵修正模块,用于根据所述训练样本,采用数据拟合模型修正初始化的用户参数矩阵Wm×k和初始化的标签参数矩阵Hk×n,得到最终的用户参数矩阵Wm×k和最终的标签参数矩阵Hk×n;其中,所述m表示用户个数,所述k表示因子个数,所述n表示标签个数,所述m为正整数,所述k为正整数,所述n为大于1的整数;
画像获取模块,用于根据所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n,获取用户画像矩阵Pm×n;其中,所述用户画像矩阵Pm×n中第u行第t列的元素Put表示用户u对标签t的喜好程度,所述u为大于等于1且小于等于m的整数,所述t为大于等于1且小于等于n的整数。
11.根据权利要求10所述的装置,其特征在于,所述矩阵修正模块,包括:
第一计算单元,用于令a=0,根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度;其中,所述a为大于等于0的整数,第0轮修正后的用户参数矩阵Wm×k为所述初始化的用户参数矩阵Wm×k,第0轮修正后的标签参数矩阵Hk×n为所述初始化的标签参数矩阵Hk×n;
第二计算单元,用于根据所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度和物品标签矩阵Ah×n,计算所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度;其中,所述h表示物品个数,所述h为大于1的整数;
概率获取单元,用于根据所述m个用户中的每一个用户对所述h个物品中的每一个物品的喜好程度,获取每一个训练样本对应的概率;其中,所述训练样本<u,i,j>对应的概率是指所述用户u对所述物品i的喜好程度大于对所述物品j的喜好程度的概率;
第三计算单元,用于将所述M个训练样本分别对应的概率作为所述数据拟合模型的输入参数,计算所述数据拟合模型的输出结果;
矩阵确定单元,用于在所述输出结果符合预设条件时,将所述第a轮修正后的用户参数矩阵Wm×k和所述第a轮修正后的标签参数矩阵Hk×n分别确定为所述最终的用户参数矩阵Wm×k和所述最终的标签参数矩阵Hk×n;
矩阵修正单元,用于在所述输出结果不符合所述预设条件时,修正所述第a轮修正后的用户参数矩阵Wm×k得到第a+1轮修正后的用户参数矩阵Wm×k,以及修正所述第a轮修正后的标签参数矩阵Hk×n得到第a+1轮修正后的标签参数矩阵Hk×n,令a=a+1,并重新从所述根据第a轮修正后的用户参数矩阵Wm×k和第a轮修正后的标签参数矩阵Hk×n,计算所述m个用户中的每一个用户对所述n个标签中的每一个标签的喜好程度的步骤开始执行。
12.根据权利要求11所述的装置,其特征在于,所述数据拟合模型为:
<mrow>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mrow>
<mo>(</mo>
<mrow>
<mi>u</mi>
<mo>,</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mo>)</mo>
</mrow>
<mo>&Element;</mo>
<msub>
<mi>D</mi>
<mi>s</mi>
</msub>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mrow>
<mi>ln</mi>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>W</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>H</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<mi>H</mi>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
<mo>-</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<mn>2</mn>
</mfrac>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>v</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>u</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>u</mi>
<mi>v</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
<mo>|</mo>
<msup>
<mo>|</mo>
<mn>2</mn>
</msup>
</mrow>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,所述λW、所述λH和所述λS是用于防止过拟合的正则化参数,所述λW、所述λH和所述λS为正实数,||·||表示矩阵的二范数,所述Ds表示所述M个训练样本的集合,所述训练样本<u,i,j>对应的概率所述表示所述用户u对所述物品i的喜好程度与所述用户u对所述物品j的喜好程度的差值,σ(x)表示逻辑斯蒂函数,所述Nu表示所述用户u的关联用户集合,所述Suv是用户相似度矩阵Sm×m中第u行第v列的元素,所述Suv表示所述用户u和用户v之间的相似度,所述Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述Wv表示所述第a轮修正后的用户参数矩阵Wm×k中第v行对应的行向量。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
信息获取模块,用于获取所述m个用户中的每一个用户的社交网络信息;
第一生成模块,用于根据所述m个用户的社交网络信息,生成所述用户相似度矩阵Sm×m。
14.根据权利要求12所述的装置,其特征在于,所述矩阵修正单元,具体用于按照下述公式计算所述第a+1轮修正后的用户参数矩阵Wm×k:
<mrow>
<msup>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>&prime;</mo>
</msup>
<mo>=</mo>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
</mrow>
</mfrac>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mi>H</mi>
<mrow>
<mo>&CenterDot;</mo>
<mi>l</mi>
</mrow>
<mi>T</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>A</mi>
<mrow>
<mi>i</mi>
<mi>l</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>A</mi>
<mrow>
<mi>j</mi>
<mi>l</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>W</mi>
</msub>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>W</mi>
<mi>u</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>v</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>u</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>u</mi>
<mi>v</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mi>S</mi>
</msub>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mo>{</mo>
<mrow>
<mi>v</mi>
<mo>|</mo>
<mi>u</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>v</mi>
</msub>
</mrow>
<mo>}</mo>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>v</mi>
<mi>u</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mrow>
<msub>
<mi>W</mi>
<mi>v</mi>
</msub>
<mo>-</mo>
<munder>
<mi>&Sigma;</mi>
<mrow>
<mi>w</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>v</mi>
</msub>
</mrow>
</munder>
<msub>
<mi>S</mi>
<mrow>
<mi>v</mi>
<mi>w</mi>
</mrow>
</msub>
<msub>
<mi>W</mi>
<mi>w</mi>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
其中,所述Wu′表示所述第a+1轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述Wu表示所述第a轮修正后的用户参数矩阵Wm×k中第u行对应的行向量,所述表示所述第a轮修正后的标签参数矩阵Hk×n中第l列对应的列向量的转置向量,所述l为大于等于1且小于等于n的整数,所述α为学习效率,所述α为正实数。
15.根据权利要求12所述的装置,其特征在于,所述矩阵修正单元,具体用于按照下述公式计算所述第a+1轮修正后的标签参数矩阵Hk×n:
<mrow>
<msup>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>&prime;</mo>
</msup>
<mo>=</mo>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
<mrow>
<mn>1</mn>
<mo>+</mo>
<msup>
<mi>e</mi>
<mrow>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>^</mo>
</mover>
<mrow>
<mi>u</mi>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
</mrow>
</msup>
</mrow>
</mfrac>
<msub>
<mi>W</mi>
<mrow>
<mi>u</mi>
<mi>f</mi>
</mrow>
</msub>
<mo>(</mo>
<mrow>
<msub>
<mi>A</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>A</mi>
<mi>j</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mi>H</mi>
</msub>
<msub>
<mi>H</mi>
<mi>f</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>;</mo>
</mrow>
其中,所述Hf′表示所述第a+1轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,所述Hf表示所述第a轮修正后的标签参数矩阵Hk×n中第f行对应的行向量,所述f为大于等于1且小于等于k的整数,所述α为学习效率,所述α为正实数。
16.根据权利要求10至15任一项所述的装置,其特征在于,所述样本获取模块,包括:
行为获取单元,用于根据所述用户行为日志,获取所述m个用户中的每一个用户对h个物品中的每一个物品的行为类型,所述h为大于1的整数;
样本获取单元,用于根据每一个用户对每一个物品的行为类型,获取所述M个训练样本。
17.根据权利要求10至15任一项所述的装置,其特征在于,所述装置还包括:
第二生成模块,用于生成所述初始化的用户参数矩阵Wm×k和所述初始化的标签参数矩阵Hk×n;
其中,所述初始化的用户参数矩阵Wm×k中的元素为呈正态分布的随机数,所述初始化的标签参数矩阵Hk×n中的元素为呈正态分布的随机数。
18.根据权利要求10至15任一项所述的装置,其特征在于,所述装置还包括:
喜好计算模块,用于根据所述用户画像矩阵Pm×n和目标物品所具有的标签,计算所述用户u对所述目标物品的喜好程度。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610284124.6A CN107341679A (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法及装置 |
CN201910645998.3A CN110378731B (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法、装置、服务器及存储介质 |
KR1020187019164A KR102122373B1 (ko) | 2016-04-29 | 2017-04-25 | 사용자 포트레이트를 획득하는 방법 및 장치 |
JP2018535169A JP6615362B2 (ja) | 2016-04-29 | 2017-04-25 | ユーザー似顔絵を取得する方法及び装置 |
PCT/CN2017/081928 WO2017186106A1 (zh) | 2016-04-29 | 2017-04-25 | 获取用户画像的方法及装置 |
US16/026,420 US11394798B2 (en) | 2016-04-29 | 2018-07-03 | User portrait obtaining method, apparatus, and storage medium according to user behavior log records on features of articles |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610284124.6A CN107341679A (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法及装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910645998.3A Division CN110378731B (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法、装置、服务器及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107341679A true CN107341679A (zh) | 2017-11-10 |
Family
ID=60160755
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910645998.3A Active CN110378731B (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法、装置、服务器及存储介质 |
CN201610284124.6A Pending CN107341679A (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法及装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910645998.3A Active CN110378731B (zh) | 2016-04-29 | 2016-04-29 | 获取用户画像的方法、装置、服务器及存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11394798B2 (zh) |
JP (1) | JP6615362B2 (zh) |
KR (1) | KR102122373B1 (zh) |
CN (2) | CN110378731B (zh) |
WO (1) | WO2017186106A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063059A (zh) * | 2018-07-20 | 2018-12-21 | 腾讯科技(深圳)有限公司 | 行为日志处理方法、装置及电子设备 |
CN109447717A (zh) * | 2018-11-12 | 2019-03-08 | 万惠投资管理有限公司 | 一种标签的确定方法及系统 |
CN109785034A (zh) * | 2018-11-13 | 2019-05-21 | 北京码牛科技有限公司 | 用户画像生成方法、装置、电子设备及计算机可读介质 |
CN109949076A (zh) * | 2019-02-26 | 2019-06-28 | 北京首钢自动化信息技术有限公司 | 建立超球面映射模型的方法、信息推荐方法及装置 |
CN110020201A (zh) * | 2019-03-26 | 2019-07-16 | 中国科学院软件研究所 | 一种基于用户画像聚类的用户类型自动化标注系统 |
CN110069706A (zh) * | 2019-03-25 | 2019-07-30 | 华为技术有限公司 | 数据处理的方法、端侧设备、云侧设备和端云协同系统 |
CN110765170A (zh) * | 2019-09-26 | 2020-02-07 | 维沃移动通信有限公司 | 一种用户画像的生成方法及可穿戴设备 |
CN110992096A (zh) * | 2019-12-03 | 2020-04-10 | 秒针信息技术有限公司 | 预测模型训练方法、装置以及媒体标识预测方法及装置 |
CN114722281A (zh) * | 2022-04-07 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于用户画像及用户选课行为的培训课程配置方法、装置 |
CN115567227A (zh) * | 2022-12-02 | 2023-01-03 | 华南师范大学 | 一种基于大数据安全的身份认证方法及系统 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019208564A1 (ja) * | 2018-04-26 | 2019-10-31 | 日本電信電話株式会社 | ニューラルネットワーク学習装置、ニューラルネットワーク学習方法、プログラム |
CN109241461B (zh) * | 2018-08-10 | 2020-05-22 | 新华三信息安全技术有限公司 | 一种用户画像构建方法及装置 |
CN111506617B (zh) * | 2019-01-31 | 2023-10-20 | 华为技术有限公司 | 一种基于用户数据生成标签的方法及装置 |
CN110049446B (zh) * | 2019-03-25 | 2020-12-29 | 每日互动股份有限公司 | 一种基于移动终端数据获取终端用户属性标签的服务器 |
CN110196849B (zh) * | 2019-06-05 | 2023-04-18 | 普元信息技术股份有限公司 | 基于大数据治理技术实现用户画像构建处理的系统及其方法 |
CN110245296A (zh) * | 2019-06-14 | 2019-09-17 | 浙江华坤道威数据科技有限公司 | 一种基于大数据的pas用户画像分析系统及其方法 |
CN110852338A (zh) * | 2019-07-26 | 2020-02-28 | 平安科技(深圳)有限公司 | 用户画像的构建方法及装置 |
CN110851581B (zh) * | 2019-11-19 | 2022-11-11 | 东软集团股份有限公司 | 一种模型参数确定方法、装置、设备及存储介质 |
CN112989179B (zh) * | 2019-12-13 | 2023-07-28 | 北京达佳互联信息技术有限公司 | 模型训练、多媒体内容推荐方法和装置 |
CN111652767B (zh) * | 2020-05-21 | 2021-12-31 | 上海松鼠课堂人工智能科技有限公司 | 用户画像构建方法、装置、计算机设备和存储介质 |
CN111881191B (zh) * | 2020-08-05 | 2021-06-11 | 留洋汇(厦门)金融技术服务有限公司 | 移动互联网下的客户画像关键特征挖掘系统与方法 |
CN112507185B (zh) * | 2020-10-22 | 2022-08-19 | 复旦大学 | 用户肖像的确定方法和装置 |
CN112364008A (zh) * | 2020-11-20 | 2021-02-12 | 国网江苏省电力有限公司营销服务中心 | 一种面向电力物联网智能终端的设备画像构建方法 |
CN112732880A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 用户画像生成方法、装置、计算机设备及存储介质 |
CN113781088A (zh) * | 2021-02-04 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 一种用户标签处理方法、装置和系统 |
CN114492612A (zh) * | 2021-03-23 | 2022-05-13 | 耿赛 | 基于大数据的用户行为分析方法及服务器 |
CN113033685A (zh) * | 2021-04-01 | 2021-06-25 | 安徽理工大学 | 一种航空旅客付费选座意愿画像及分析的方法 |
CN113065069B (zh) * | 2021-04-21 | 2023-02-28 | 山大地纬软件股份有限公司 | 一种基于数据画像的双向就业推荐方法和装置 |
CN113592590A (zh) * | 2021-07-27 | 2021-11-02 | 中国联合网络通信集团有限公司 | 一种用户画像生成方法及装置 |
US11556935B1 (en) | 2021-07-28 | 2023-01-17 | International Business Machines Corporation | Financial risk management based on transactions portrait |
CN114119058B (zh) * | 2021-08-10 | 2023-09-26 | 国家电网有限公司 | 用户画像模型的构建方法、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751448A (zh) * | 2009-07-22 | 2010-06-23 | 中国科学院自动化研究所 | 一种基于情景信息的个性化资源信息的推荐方法 |
CN102722552A (zh) * | 2012-05-28 | 2012-10-10 | 重庆大学 | 一种协同过滤推荐模型中调整学习速率的方法 |
US20130246146A1 (en) * | 2012-03-13 | 2013-09-19 | American Express Travel Related Services Company, Inc. | Systems and Methods for Tailoring Marketing |
CN104090886A (zh) * | 2013-12-09 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 构建用户实时画像的方法及装置 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240055B2 (en) * | 2003-12-11 | 2007-07-03 | Xerox Corporation | Method and system for expertise mapping based on user activity in recommender systems |
US7698270B2 (en) * | 2004-12-29 | 2010-04-13 | Baynote, Inc. | Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge |
GB0506618D0 (en) * | 2005-04-01 | 2005-05-11 | Wine Science Ltd | A method of supplying information articles at a website and system for supplying such articles |
JP4353933B2 (ja) * | 2005-10-11 | 2009-10-28 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 通信装置およびコンピュータプログラム |
JP4730114B2 (ja) * | 2006-01-30 | 2011-07-20 | 日本電気株式会社 | メッセージ作成支援方法及び携帯端末 |
WO2008118884A1 (en) * | 2007-03-23 | 2008-10-02 | Ruttenberg Steven E | Method of prediciting affinity between entities |
JPWO2009104324A1 (ja) * | 2008-02-22 | 2011-06-16 | 日本電気株式会社 | 能動計量学習装置、能動計量学習方法およびプログラム |
US20090265328A1 (en) * | 2008-04-16 | 2009-10-22 | Yahool Inc. | Predicting newsworthy queries using combined online and offline models |
JP2009289092A (ja) * | 2008-05-30 | 2009-12-10 | Sony Corp | 情報処理装置、推薦方法、プログラム及び記録媒体 |
US8108406B2 (en) * | 2008-12-30 | 2012-01-31 | Expanse Networks, Inc. | Pangenetic web user behavior prediction system |
US8386519B2 (en) * | 2008-12-30 | 2013-02-26 | Expanse Networks, Inc. | Pangenetic web item recommendation system |
US9600581B2 (en) * | 2009-02-19 | 2017-03-21 | Yahoo! Inc. | Personalized recommendations on dynamic content |
US8812362B2 (en) * | 2009-02-20 | 2014-08-19 | Yahoo! Inc. | Method and system for quantifying user interactions with web advertisements |
US8306940B2 (en) * | 2009-03-20 | 2012-11-06 | Microsoft Corporation | Interactive visualization for generating ensemble classifiers |
US8838587B1 (en) * | 2010-04-19 | 2014-09-16 | Google Inc. | Propagating query classifications |
US8874727B2 (en) * | 2010-05-31 | 2014-10-28 | The Nielsen Company (Us), Llc | Methods, apparatus, and articles of manufacture to rank users in an online social network |
US8606787B1 (en) * | 2010-09-15 | 2013-12-10 | Google Inc. | Social network node clustering system and method |
JP5647500B2 (ja) * | 2010-12-06 | 2014-12-24 | 富士通テン株式会社 | コンテンツ提供サーバ、及び端末装置 |
WO2012142748A1 (en) * | 2011-04-19 | 2012-10-26 | Nokia Corporation | Method and apparatus for providing feature-based collaborative filtering |
US20120297038A1 (en) * | 2011-05-16 | 2012-11-22 | Microsoft Corporation | Recommendations for Social Network Based on Low-Rank Matrix Recovery |
WO2013024338A1 (en) * | 2011-08-15 | 2013-02-21 | Equal Media Limited | System and method for managing opinion networks with interactive opinion flows |
US8793593B2 (en) * | 2011-09-21 | 2014-07-29 | Facebook, Inc. | Integrating structured objects and actions generated on external systems into a social networking system |
US9116997B2 (en) * | 2011-09-22 | 2015-08-25 | Alibaba.Com Limited | Presenting user preference activities |
US9082082B2 (en) * | 2011-12-06 | 2015-07-14 | The Trustees Of Columbia University In The City Of New York | Network information methods devices and systems |
US8463295B1 (en) * | 2011-12-07 | 2013-06-11 | Ebay Inc. | Systems and methods for generating location-based group recommendations |
US20130159100A1 (en) * | 2011-12-19 | 2013-06-20 | Rajat Raina | Selecting advertisements for users of a social networking system using collaborative filtering |
US20130268595A1 (en) * | 2012-04-06 | 2013-10-10 | Telefonaktiebolaget L M Ericsson (Publ) | Detecting communities in telecommunication networks |
CN103377200B (zh) * | 2012-04-17 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 用户偏好信息采集方法和装置 |
US20130311222A1 (en) * | 2012-05-21 | 2013-11-21 | Vantage Agora Inc. | Social Networking System For Organization Management |
US8984082B2 (en) * | 2012-08-29 | 2015-03-17 | Wetpaint.Com, Inc. | Personalization based upon social value in online media |
CN104395901B (zh) * | 2012-09-18 | 2018-05-22 | 北京一点网聚科技有限公司 | 用于促进用户获得内容的方法和系统 |
US9058303B2 (en) * | 2012-11-30 | 2015-06-16 | Xerox Corporation | Convex collective matrix factorization |
US9721019B2 (en) * | 2012-12-10 | 2017-08-01 | Aol Inc. | Systems and methods for providing personalized recommendations for electronic content |
JP6101477B2 (ja) * | 2012-12-10 | 2017-03-22 | 日本放送協会 | コンテンツ推薦装置、及びプログラム |
US20140214895A1 (en) * | 2013-01-31 | 2014-07-31 | Inplore | Systems and method for the privacy-maintaining strategic integration of public and multi-user personal electronic data and history |
US9002755B2 (en) * | 2013-02-05 | 2015-04-07 | scenarioDNA | System and method for culture mapping |
US10467327B1 (en) * | 2013-03-15 | 2019-11-05 | Matan Arazi | Real-time event transcription system and method |
EP2860940B1 (en) * | 2013-09-27 | 2016-09-14 | Alcatel Lucent | Method for caching |
US20150178282A1 (en) * | 2013-12-23 | 2015-06-25 | Yahoo! Inc. | Fast and dynamic targeting of users with engaging content |
CN103744966B (zh) * | 2014-01-07 | 2018-06-22 | Tcl集团股份有限公司 | 一种物品推荐方法、装置 |
US9852208B2 (en) * | 2014-02-25 | 2017-12-26 | International Business Machines Corporation | Discovering communities and expertise of users using semantic analysis of resource access logs |
US20190066020A1 (en) * | 2014-03-31 | 2019-02-28 | Kountable, Inc. | Multi-Variable Assessment Systems and Methods that Evaluate and Predict Entrepreneurial Behavior |
WO2015153380A1 (en) * | 2014-03-31 | 2015-10-08 | Kountable, Inc. | Multi-variable assessment systems and methods that evaluate and predict entrepreneurial behavior |
US10832349B2 (en) * | 2014-06-02 | 2020-11-10 | International Business Machines Corporation | Modeling user attitudes toward a target from social media |
CN104111969B (zh) * | 2014-06-04 | 2017-06-20 | 百度移信网络技术(北京)有限公司 | 一种相似性度量的方法以及系统 |
US20150379609A1 (en) * | 2014-06-30 | 2015-12-31 | Kobo Incorporated | Generating recommendations for unfamiliar users by utilizing social side information |
US9953086B2 (en) * | 2014-07-15 | 2018-04-24 | Microsoft Technology Licensing, Llc | Prioritizing media based on social data and user behavior |
CN105574730A (zh) * | 2014-10-10 | 2016-05-11 | 中兴通讯股份有限公司 | 基于物联网大数据平台的智能用户画像方法及装置 |
US20160191450A1 (en) * | 2014-12-31 | 2016-06-30 | Socialtopias, Llc | Recommendations Engine in a Layered Social Media Webpage |
US20170098242A1 (en) * | 2015-10-02 | 2017-04-06 | American Express Travel Related Services Company, Inc. | Systems and methods for generating curated and custom content for data-driven applications using closed-loop data |
CN105302890A (zh) * | 2015-10-16 | 2016-02-03 | 海信集团有限公司 | 一种多媒体内容在线推荐的方法及其辅助方法和装置 |
US10191988B2 (en) * | 2015-10-28 | 2019-01-29 | Sony Mobile Communications Inc. | System and method for returning prioritized content |
CN106530010B (zh) * | 2016-11-15 | 2017-12-12 | 平安科技(深圳)有限公司 | 融合时间因素的协同过滤方法和装置 |
-
2016
- 2016-04-29 CN CN201910645998.3A patent/CN110378731B/zh active Active
- 2016-04-29 CN CN201610284124.6A patent/CN107341679A/zh active Pending
-
2017
- 2017-04-25 JP JP2018535169A patent/JP6615362B2/ja active Active
- 2017-04-25 WO PCT/CN2017/081928 patent/WO2017186106A1/zh active Application Filing
- 2017-04-25 KR KR1020187019164A patent/KR102122373B1/ko active IP Right Grant
-
2018
- 2018-07-03 US US16/026,420 patent/US11394798B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751448A (zh) * | 2009-07-22 | 2010-06-23 | 中国科学院自动化研究所 | 一种基于情景信息的个性化资源信息的推荐方法 |
US20130246146A1 (en) * | 2012-03-13 | 2013-09-19 | American Express Travel Related Services Company, Inc. | Systems and Methods for Tailoring Marketing |
CN102722552A (zh) * | 2012-05-28 | 2012-10-10 | 重庆大学 | 一种协同过滤推荐模型中调整学习速率的方法 |
CN104090886A (zh) * | 2013-12-09 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 构建用户实时画像的方法及装置 |
CN104750731A (zh) * | 2013-12-30 | 2015-07-01 | 华为技术有限公司 | 一种获取完整用户画像的方法及装置 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109063059B (zh) * | 2018-07-20 | 2021-07-27 | 腾讯科技(深圳)有限公司 | 行为日志处理方法、装置及电子设备 |
CN109063059A (zh) * | 2018-07-20 | 2018-12-21 | 腾讯科技(深圳)有限公司 | 行为日志处理方法、装置及电子设备 |
CN109447717A (zh) * | 2018-11-12 | 2019-03-08 | 万惠投资管理有限公司 | 一种标签的确定方法及系统 |
CN109785034A (zh) * | 2018-11-13 | 2019-05-21 | 北京码牛科技有限公司 | 用户画像生成方法、装置、电子设备及计算机可读介质 |
CN109949076B (zh) * | 2019-02-26 | 2022-02-18 | 北京首钢自动化信息技术有限公司 | 建立超球面映射模型的方法、信息推荐方法及装置 |
CN109949076A (zh) * | 2019-02-26 | 2019-06-28 | 北京首钢自动化信息技术有限公司 | 建立超球面映射模型的方法、信息推荐方法及装置 |
CN110069706A (zh) * | 2019-03-25 | 2019-07-30 | 华为技术有限公司 | 数据处理的方法、端侧设备、云侧设备和端云协同系统 |
CN110020201A (zh) * | 2019-03-26 | 2019-07-16 | 中国科学院软件研究所 | 一种基于用户画像聚类的用户类型自动化标注系统 |
CN110765170A (zh) * | 2019-09-26 | 2020-02-07 | 维沃移动通信有限公司 | 一种用户画像的生成方法及可穿戴设备 |
CN110992096A (zh) * | 2019-12-03 | 2020-04-10 | 秒针信息技术有限公司 | 预测模型训练方法、装置以及媒体标识预测方法及装置 |
CN110992096B (zh) * | 2019-12-03 | 2023-08-29 | 秒针信息技术有限公司 | 预测模型训练方法、装置以及媒体标识预测方法及装置 |
CN114722281A (zh) * | 2022-04-07 | 2022-07-08 | 平安科技(深圳)有限公司 | 基于用户画像及用户选课行为的培训课程配置方法、装置 |
CN114722281B (zh) * | 2022-04-07 | 2024-04-12 | 平安科技(深圳)有限公司 | 基于用户画像及用户选课行为的培训课程配置方法、装置 |
CN115567227A (zh) * | 2022-12-02 | 2023-01-03 | 华南师范大学 | 一种基于大数据安全的身份认证方法及系统 |
CN115567227B (zh) * | 2022-12-02 | 2023-04-07 | 华南师范大学 | 一种基于大数据安全的身份认证方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110378731B (zh) | 2021-04-20 |
US11394798B2 (en) | 2022-07-19 |
WO2017186106A1 (zh) | 2017-11-02 |
JP2019503006A (ja) | 2019-01-31 |
US20180316776A1 (en) | 2018-11-01 |
KR102122373B1 (ko) | 2020-06-12 |
CN110378731A (zh) | 2019-10-25 |
JP6615362B2 (ja) | 2019-12-04 |
KR20180091043A (ko) | 2018-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341679A (zh) | 获取用户画像的方法及装置 | |
Kim et al. | TWILITE: A recommendation system for Twitter using a probabilistic model based on latent Dirichlet allocation | |
CN103823908B (zh) | 基于用户偏好的内容推荐方法和服务器 | |
US8645287B2 (en) | Image tagging based upon cross domain context | |
Li et al. | Offensive pricing strategies for online platforms | |
Christakopoulou et al. | Hoslim: Higher-order sparse linear method for top-n recommender systems | |
CN108153791B (zh) | 一种资源推荐方法和相关装置 | |
CN103778235A (zh) | 一种处理商品评价信息的方法和装置 | |
CN109783539A (zh) | 用户挖掘及其模型构建方法、装置及计算机设备 | |
CN109658206A (zh) | 信息推荐方法和装置 | |
CN108509466A (zh) | 一种信息推荐方法和装置 | |
CN111144933B (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
CN108629608A (zh) | 用户数据处理方法及装置 | |
WO2009094672A2 (en) | Belief propagation for generalized matching | |
US7630916B2 (en) | Systems and methods for improving collaborative filtering | |
CN109003113A (zh) | 评价数据处理和展示的方法及装置,电子设备及存储设备 | |
Xu et al. | Graphcar: Content-aware multimedia recommendation with graph autoencoder | |
CN111768239A (zh) | 道具推荐方法、装置、系统、服务器和存储介质 | |
CN108062381A (zh) | 图像信息处理方法、装置和存储介质 | |
CN112380453A (zh) | 物品推荐方法、装置、存储介质及设备 | |
CN111429214B (zh) | 一种基于交易数据的买卖双方匹配方法及装置 | |
Tzaban et al. | Product bundle identification using semi-supervised learning | |
Singh et al. | One embedding to do them all | |
CN106156351A (zh) | 多媒体资源推荐信息生成方法及装置 | |
CN110020910A (zh) | 对象推荐方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171110 |