CN110147502A - 基于大数据分析的产品推荐方法、装置、介质及服务器 - Google Patents

基于大数据分析的产品推荐方法、装置、介质及服务器 Download PDF

Info

Publication number
CN110147502A
CN110147502A CN201910295772.5A CN201910295772A CN110147502A CN 110147502 A CN110147502 A CN 110147502A CN 201910295772 A CN201910295772 A CN 201910295772A CN 110147502 A CN110147502 A CN 110147502A
Authority
CN
China
Prior art keywords
user
product
sample set
feature vector
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910295772.5A
Other languages
English (en)
Other versions
CN110147502B (zh
Inventor
孙健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910295772.5A priority Critical patent/CN110147502B/zh
Publication of CN110147502A publication Critical patent/CN110147502A/zh
Application granted granted Critical
Publication of CN110147502B publication Critical patent/CN110147502B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于计算机技术领域,尤其涉及一种基于大数据分析的产品推荐方法、装置、计算机可读存储介质及服务器。所述方法获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量;获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,每个样本集合均对应于所述第二特征向量中的一个非零分量;根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。

Description

基于大数据分析的产品推荐方法、装置、介质及服务器
技术领域
本发明属于计算机技术领域,尤其涉及一种基于大数据分析的产品推荐方法、装置、计算机可读存储介质及服务器。
背景技术
随着大数据技术的不断发展,基于大数据分析的用户画像在实际应用中得到了迅速的普及。用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效手段,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的产品。
但在现有技术中,在进行产品推荐时,往往是将各个产品看作是完全相互独立的,并没有考虑到用户已购买产品与待推荐产品之间的相互关联关系,从而导致产品推荐的精准度较差,难以与用户的实际需求匹配。
发明内容
有鉴于此,本发明实施例提供了一种基于大数据分析的产品推荐方法、装置、计算机可读存储介质及服务器,以解决现有的产品推荐方法精准度较差,难以与用户的实际需求匹配的问题。
本发明实施例的第一方面提供了一种基于大数据分析的产品推荐方法,可以包括:
获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量;
获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
本发明实施例的第二方面提供了一种产品推荐装置,可以包括:
用户信息获取模块,用于获取用户在预设的各个评估维度上的用户信息;
第一特征向量构造模块,用于根据所述用户信息构造所述用户的第一特征向量;
第二特征向量构造模块,用于获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
样本集合选取模块,用于根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
匹配度计算模块,用于根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
优选产品选取模块,用于根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量;
获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
本发明实施例的第四方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量;
获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例首先获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量,然后获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量,再根据所述用户的第二特征向量从预设的样本库中选取样本集合,并根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度,最后根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。通过本发明实施例,在获取用户信息的同时,进一步获取用户的产品购买记录,根据样本库中的历史用户的样本充分挖掘用户已购买产品与待推荐产品之间的相互关联关系,大大提高了产品推荐的精准度,更好的与用户的实际需求相匹配。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种产品推荐方法的一个实施例流程图;
图2为获取用户在预设的各个评估维度上的用户信息的示意流程图;
图3为本发明实施例中一种产品推荐装置的一个实施例结构图;
图4为本发明实施例中一种服务器的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种产品推荐方法的一个实施例可以包括:
步骤S101、获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量。
在本实施例中,需要获取用户在各个评估维度上的用户信息,具体的评估维度可以根据实际情况进行设置,例如,若要判断用户对某些产品的购买意向,则所需的评估维度包括但不限于性别信息、年龄信息、受教育程度信息、收入水平信息、工作种类信息等等。
这些信息可以通过电子调查问卷等方式从用户处获取,也可以在取得用户授权的情况下通过如图2所示的过程从存储用户信息的各个数据源中获取:
步骤S1011、向所述用户的终端设备发送数据授权请求。
所述数据授权请求中包括执行服务器的设备标识,所示执行服务器即为本实施例的实施主体,所述设备标识为唯一代表所述执行服务器的标识。
步骤S1012、接收所述用户的终端设备反馈的所述用户的数据授权信息。
所述用户的终端设备在接收到数据授权请求后,会记录下所述执行服务器的设备标识,并向所述执行服务器反馈所述用户的数据授权信息。
步骤S1013、从预设的服务器列表中选取与第sn个数据源对应的服务器作为数据服务器。
其中,每个数据源均对应至少一个评估维度上的用户信息,这些数据源包括但不限于户籍管理机构、劳动力管理机构、工商行政机构等等。所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤sn≤SourceNum,SourceNum为数据源的总数,具体如下表所示:
步骤S1014、向所述数据服务器发送数据请求。
所述数据请求中包括所述用户的用户标识和授权信息,还包括所述执行服务器的设备标识,所述用户标识包括但不限于身份证号码、驾驶证号码、社保号码等等。
步骤S1015、接收所述数据服务器发送的所述用户的用户信息。
所述数据服务器在接收到所述数据请求后,对所述授权信息进行核对,若核对无误,则根据所述用户标识在本地数据库中查找到所述用户的用户信息,并向所述执行服务器发送所述用户的用户信息。
通过以上过程,在获得用户授权的前提下,再从各个数据服务器中获取用户的信息,保证了用户信息的安全性。
由于上述各个评估维度上的用户信息并不是数值化的信息,不利于进行分析计算,因此,需要首先对各个评估维度的用户信息进行数值化处理。
例如,对于性别信息这一评估维度而言,若性别为男性,则可将该评估维度的取值数值化为1,若性别为女性,则可将该评估维度的取值数值化为0;对于年龄这一评估维度而言,若年龄为20岁以下,则可将该评估维度的取值数值化为0,若年龄为20岁至40岁,则可将该评估维度的取值数值化为1,若年龄为40岁至60岁,则可将该评估维度的取值数值化为2,若年龄为60岁以上,则可将该评估维度的取值数值化为3;对于受教育程度这一评估维度而言,若受教育程度为高中及高中以下,则可将该评估维度的取值数值化为0,若受教育程度为本科,则可将该评估维度的取值数值化为1,若受教育程度为硕士研究生,则可将该评估维度的取值数值化为2,若受教育程度为博士研究生及以上,则可将该评估维度的取值数值化为3;其它各个评估维度的数值化处理过程与之类似,此处不再赘述。
需要注意的是,以上的数值化处理过程只是一种可能的数值化处理方式,还可以根据实际情况进行其它类似的数值化处理,此处不对其做具体限制。
在进行完数值化处理之后,则可将各个评估维度上的用户信息构造为如下所示的第一特征向量:
TgtEgVec=(TgtEgVal1,TgtEgVal2,...,TgtEgValen,...,TgtEgValEN)
其中,en为各个评估维度的序号,1≤en≤EN,EN为评估维度的总数,TgtEgValen为所述用户的第一特征向量在第en个评估维度上的分量,也即在第en个评估维度上的用户信息,TgtEgVec为所述用户的第一特征向量。
步骤S102、获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量。
在本实施例中,可以将用户各次的产品购买记录均存储在预设的数据库中,假设预设的产品库中共有N种产品进行销售,分别记为产品1、产品2、…、产品n、…、产品N。
则可构造如下所示的第二特征向量对所述用户的产品购买情况进行记录:
PurRecVec=(PdFlag1,PdFlag2,...,PdFlagn,...,PdFlagN)
其中,n为所述产品库中的各种产品的序号,1≤n≤N,N为所述产品库中的产品种类的数目,PdFlagn为所述用户的第二特征向量在第n个产品维度上的分量,也即所述用户对产品n的购买情况,一般地,若所述用户已经购买了产品n时,设置PdFlagn=1,若所述用户尚未购买产品n时,设置PdFlagn=0,PurRecVec为所述用户的第二特征向量,由于在初始状态下,所述用户并未购买任何产品,则可以根据下式初始化所述用户的第二特征向量:
需要注意的是,随着时间的推移,一个用户的产品购买记录是会不断地变化的,例如,在初始状态下,用户并未购买任何产品,此时:
PurRecVec=(0,0,0,0,0,0)(此处以N=6的情况进行示例)
之后,用户购买了产品3,则此时:
PurRecVec=(0,0,1,0,0,0)
之后,用户又购买了产品1,则此时:
PurRecVec=(1,0,1,0,0,0)
…………………
后续过程与之类似,此处不再赘述。
也即确定所述用户第k次的产品购买记录所对应的产品种类,并根据下式对所述用户的第二特征向量进行更新:
其中,1≤k≤KN,KN为所述用户的产品购买记录的数目,seqk为所述用户第k次的产品购买记录所对应的产品种类的序号。
在本实施例中,会按照顺序将所述用户完整的产品购买情况均进行记录,以备后续使用,在需要对所述用户的下次购买行为进行预估时,仅需获取其最后一次更新的第二特征向量,也即截至当前时刻所述用户所有的已购产品情况。
步骤S103、根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合。
其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品。
首先,从预设的数据库中提取各个历史用户的样本,作为评估的依据。样本数量的具体取值可以根据实际情况进行设置,一般地,为了保证评估结果的准确性,样本的数目应尽量的大,例如,可以将其设置为10000、20000、50000或者其它取值等等。
每个样本由3部分组成,第一部分为用户的用户信息(即第一特征向量),第二部分为用户的产品购买记录(即第二特征向量),第三部分为用户本次购买的产品。
需要注意的是,对于同一个历史用户而言,可能是存在多个样本的,其每一次购买产品的行为都对应一个样本,在同一用户的多个样本中,第一部分的用户信息一般是不变的,但第二部分和第三部分每次都会发生变化。
例如,若某一历史用户共进行了3次产品购买行为,分别为产品2、产品1、产品5,则在数据库中将其记录为3个样本:
第1个样本的产品购买记录为空(即未购买任何产品),向量形式为(0,0,0,0,0,0),本次购买的产品为产品2;
第2个样本的产品购买记录为已购买产品2,向量形式为(0,1,0,0,0,0),本次购买的产品为产品1;
第3个样本的产品购买记录为已购买产品2和产品1,向量形式为(1,1,0,0,0,0),本次购买的产品为产品5。
然后,将这些样本按照第三部分(也即用户本次购买的产品)进行分组,划分为多个样本集合,再根据所述用户的第二特征向量从中选取SN个样本集合,SN=N-HN,其中,HN为所述用户已经购买的产品种类的数目。
例如,若N=6,所述用户已经购买了产品1和产品2,则可选取4个样本集合,分别为与购买产品3、4、5、6对应的样本集合。
步骤S104、根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度。
首先,根据所述用户的第二特征向量分别计算各个样本集合中的各个样本的权重系数。
例如,可以根据下式分别计算各个样本集合中的各个样本的权重系数:
其中,HsRecVecs,p为第s个样本集合中第p个样本的第二特征向量,且:HsRecVecs,p=(HsFlags,p,1,HsFlags,p,2,...,HsFlags,p,n,...,HsFlags,p,N),HsFlags,p,n为HsRecVecs,p在第n个产品维度上的分量,XNOR为同或运算函数,Coefs,p为第s个样本集合中第p个样本的权重系数。
由上式可知,当某一样本与所述用户的第二特征向量越接近(也即已购买的产品越类似),则该样本的权重系数越大,对最终推荐结果的影响也越大,反之,当样本与所述用户的第二特征向量差异越大(也即已购买的产品越差异越大),则该样本的权重系数越小,对最终推荐结果的影响也越小。
然后,根据下式分别计算所述用户与各个样本集合之间的匹配度:
其中,s为各个样本集合的序号,1≤s≤SN,SN为样本集合的总数,p为各个样本的序号,1≤p≤PNs,PNs为第s个样本集合中的样本总数,HsEgVecs,p为第s个样本集合中第p个样本的第一特征向量,且:HsEgVecs,p=(HsEgVals,p,1,HsEgVals,p,2,...,HsEgVals,p,en,...,HsEgVals,p,EN),en为各个评估维度的序号,1≤en≤EN,EN为评估维度的总数,HsEgVals,p,en为HsEgVecs,p在第en个评估维度上的分量,TgtEgVec为所述用户的第一特征向量,且:TgtEgVec=(TgtEgVal1,TgtEgVal2,...,TgtEgValen,...,TgtEgValEN),TgtEgValen为所述用户的第一特征向量在第en个评估维度上的分量,MthDegs为所述用户与第s个样本集合之间的匹配度。
步骤S105、根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
例如,可以从各个样本集合中选取与所述用户的匹配度最大的一个样本集合,并将该样本集合所对应的产品作为优选产品推荐给所述用户,从而在已知用户已购买产品的基础上,为其继续匹配最符合其特征的其它产品,例如,若用户已经购买了车辆保险,但却未购买人身保险、意外保险等,则可在其尚未购买的各个产品中为其匹配中最合适的产品,向用户继续推荐,以形成链式销售。
综上所述,本发明实施例首先获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量,然后获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量,再根据所述用户的第二特征向量从预设的样本库中选取样本集合,并根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度,最后根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。通过本发明实施例,在获取用户信息的同时,进一步获取用户的产品购买记录,根据样本库中历史用户的样本充分挖掘用户已购买产品与待推荐产品之间的相互关联关系,大大提高了产品推荐的精准度,更好的与用户的实际需求相匹配。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种产品推荐方法,图3示出了本发明实施例提供的一种产品推荐装置的一个实施例结构图。
本实施例中,一种产品推荐装置可以包括:
用户信息获取模块301,用于获取用户在预设的各个评估维度上的用户信息;
第一特征向量构造模块302,用于根据所述用户信息构造所述用户的第一特征向量;
第二特征向量构造模块303,用于获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
样本集合选取模块304,用于根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
匹配度计算模块305,用于根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
优选产品选取模块306,用于根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
进一步地,所述第二特征向量构造模块可以包括:
初始化单元,用于根据下式初始化所述用户的第二特征向量:
其中,n为所述产品库中的各种产品的序号,1≤n≤N,N为所述产品库中的产品种类的数目,PdFlagn为所述用户的第二特征向量在第n个产品维度上的分量,PurRecVec为所述用户的第二特征向量;
更新单元,用于确定所述用户第k次的产品购买记录所对应的产品种类,并根据下式对所述用户的第二特征向量进行更新:
其中,1≤k≤KN,KN为所述用户的产品购买记录的数目,seqk为所述用户第k次的产品购买记录所对应的产品种类的序号。
进一步地,所述匹配度计算模块可以包括:
权重系数计算单元,用于根据所述用户的第二特征向量分别计算各个样本集合中的各个样本的权重系数;
匹配度计算单元,用于根据下式分别计算所述用户与各个样本集合之间的匹配度:
其中,s为各个样本集合的序号,1≤s≤SN,SN为样本集合的总数,p为各个样本的序号,1≤p≤PNs,PNs为第s个样本集合中的样本总数,HsEgVecs,p为第s个样本集合中第p个样本的第一特征向量,且:HsEgVecs,p=(HsEgVals,p,1,HsEgVals,p,2,...,HsEgVals,p,en,...,HsEgVals,p,EN),en为各个评估维度的序号,1≤en≤EN,EN为评估维度的总数,HsEgVals,p,en为HsEgVecs,p在第en个评估维度上的分量,TgtEgVec为所述用户的第一特征向量,且:TgtEgVec=(TgtEgVal1,TgtEgVal2,...,TgtEgValen,...,TgtEgValEN),TgtEgValen为所述用户的第一特征向量在第en个评估维度上的分量,Coefs,p为第s个样本集合中第p个样本的权重系数,MthDegs为所述用户与第s个样本集合之间的匹配度。
进一步地,所述权重系数计算单元具体用于根据下式分别计算各个样本集合中的各个样本的权重系数:
其中,HsRecVecs,p为第s个样本集合中第p个样本的第二特征向量,且:HsRecVecs,p=(HsFlags,p,1,HsFlags,p,2,...,HsFlags,p,n,...,HsFlags,p,N),HsFlags,p,n为HsRecVecs,p在第n个产品维度上的分量,XNOR为同或运算函数。
进一步地,所述用户信息获取模块可以包括:
授权请求发送单元,用于向所述用户的终端设备发送数据授权请求;
授权信息接收单元,用于接收所述用户的终端设备反馈的所述用户的数据授权信息;
数据服务器选取单元,用于从预设的服务器列表中选取与第sn个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤sn≤SourceNum,SourceNum为数据源的总数;
数据请求发送单元,用于向所述数据服务器发送数据请求,所述数据请求中包括所述用户的数据授权信息;
用户信息接收单元,用于接收所述数据服务器发送的所述用户的用户信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图4示出了本发明实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述服务器4可以包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42,例如执行上述的产品推荐方法的计算机可读指令。所述处理器40执行所述计算机可读指令42时实现上述各个产品推荐方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至306的功能。
示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述服务器4中的执行过程。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述服务器4的内部存储单元,例如服务器4的硬盘或内存。所述存储器41也可以是所述服务器4的外部存储设备,例如所述服务器4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述服务器4所需的其它指令和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于大数据分析的产品推荐方法,其特征在于,包括:
获取用户在预设的各个评估维度上的用户信息,并根据所述用户信息构造所述用户的第一特征向量;
获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
2.根据权利要求1所述的产品推荐方法,其特征在于,所述根据所述产品购买记录构造所述用户的第二特征向量包括:
根据下式初始化所述用户的第二特征向量:
其中,n为所述产品库中的各种产品的序号,1≤n≤N,N为所述产品库中的产品种类的数目,PdFlagn为所述用户的第二特征向量在第n个产品维度上的分量,PurRecVec为所述用户的第二特征向量;
确定所述用户第k次的产品购买记录所对应的产品种类,并根据下式对所述用户的第二特征向量进行更新:
其中,1≤k≤KN,KN为所述用户的产品购买记录的数目,seqk为所述用户第k次的产品购买记录所对应的产品种类的序号。
3.根据权利要求1所述的产品推荐方法,其特征在于,所述根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度包括:
根据所述用户的第二特征向量分别计算各个样本集合中的各个样本的权重系数;
根据下式分别计算所述用户与各个样本集合之间的匹配度:
其中,s为各个样本集合的序号,1≤s≤SN,SN为样本集合的总数,p为各个样本的序号,1≤p≤PNs,PNs为第s个样本集合中的样本总数,HsEgVecs,p为第s个样本集合中第p个样本的第一特征向量,且:HsEgVecs,p=(HsEgVals,p,1,HsEgVals,p,2,...,HsEgVals,p,en,...,HsEgVals,p,EN),en为各个评估维度的序号,1≤en≤EN,EN为评估维度的总数,HsEgVals,p,en为HsEgVecs,p在第en个评估维度上的分量,TgtEgVec为所述用户的第一特征向量,且:TgtEgVec=(TgtEgVal1,TgtEgVal2,...,TgtEgValen,...,TgtEgValEN),TgtEgValen为所述用户的第一特征向量在第en个评估维度上的分量,Coefs,p为第s个样本集合中第p个样本的权重系数,MthDegs为所述用户与第s个样本集合之间的匹配度。
4.根据权利要求3所述的产品推荐方法,其特征在于,所述根据所述用户的第二特征向量分别计算各个样本集合中的各个样本的权重系数包括:
根据下式分别计算各个样本集合中的各个样本的权重系数:
其中,HsRecVecs,p为第s个样本集合中第p个样本的第二特征向量,且:HsRecVecs,p=(HsFlags,p,1,HsFlags,p,2,...,HsFlags,p,n,...,HsFlags,p,N),HsFlags,p,n为HsRecVecs,p在第n个产品维度上的分量,XNOR为同或运算函数。
5.根据权利要求1至4中任一项所述的产品推荐方法,其特征在于,所述获取用户在预设的各个评估维度上的用户信息包括:
向所述用户的终端设备发送数据授权请求;
接收所述用户的终端设备反馈的所述用户的数据授权信息;
从预设的服务器列表中选取与第sn个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤sn≤SourceNum,SourceNum为数据源的总数;
向所述数据服务器发送数据请求,所述数据请求中包括所述用户的数据授权信息;
接收所述数据服务器发送的所述用户的用户信息。
6.一种产品推荐装置,其特征在于,包括:
用户信息获取模块,用于获取用户在预设的各个评估维度上的用户信息;
第一特征向量构造模块,用于根据所述用户信息构造所述用户的第一特征向量;
第二特征向量构造模块,用于获取所述用户各次的产品购买记录,并根据所述产品购买记录构造所述用户的第二特征向量;
样本集合选取模块,用于根据所述用户的第二特征向量从预设的样本库中选取SN个样本集合,其中,SN为所述第二特征向量中非零分量的个数,每个样本集合均对应于所述第二特征向量中的一个非零分量,且每个样本集合均对应于预设的产品库中的一种产品;
匹配度计算模块,用于根据所述用户的第一特征向量和所述用户的第二特征向量分别计算所述用户与各个样本集合之间的匹配度;
优选产品选取模块,用于根据所述用户与各个样本集合之间的匹配度从所述产品库中选取优选产品,并将所述优选产品推荐给所述用户。
7.根据权利要求6所述的产品推荐装置,其特征在于,所述第二特征向量构造模块包括:
初始化单元,用于根据下式初始化所述用户的第二特征向量:
其中,n为所述产品库中的各种产品的序号,1≤n≤N,N为所述产品库中的产品种类的数目,PdFlagn为所述用户的第二特征向量在第n个产品维度上的分量,PurRecVec为所述用户的第二特征向量;
更新单元,用于确定所述用户第k次的产品购买记录所对应的产品种类,并根据下式对所述用户的第二特征向量进行更新:
其中,1≤k≤KN,KN为所述用户的产品购买记录的数目,seqk为所述用户第k次的产品购买记录所对应的产品种类的序号。
8.根据权利要求6所述的产品推荐装置,其特征在于,所述匹配度计算模块包括:
权重系数计算单元,用于根据所述用户的第二特征向量分别计算各个样本集合中的各个样本的权重系数;
匹配度计算单元,用于根据下式分别计算所述用户与各个样本集合之间的匹配度:
其中,s为各个样本集合的序号,1≤s≤SN,SN为样本集合的总数,p为各个样本的序号,1≤p≤PNs,PNs为第s个样本集合中的样本总数,HsEgVecs,p为第s个样本集合中第p个样本的第一特征向量,且:HsEgVecs,p=(HsEgVals,p,1,HsEgVals,p,2,...,HsEgVals,p,en,...,HsEgVals,p,EN),en为各个评估维度的序号,1≤en≤EN,EN为评估维度的总数,HsEgVals,p,en为HsEgVecs,p在第en个评估维度上的分量,TgtEgVec为所述用户的第一特征向量,且:TgtEgVec=(TgtEgVal1,TgtEgVal2,...,TgtEgValen,...,TgtEgValEN),TgtEgValen为所述用户的第一特征向量在第en个评估维度上的分量,Coefs,p为第s个样本集合中第p个样本的权重系数,MthDegs为所述用户与第s个样本集合之间的匹配度。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的产品推荐方法的步骤。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的产品推荐方法的步骤。
CN201910295772.5A 2019-04-12 2019-04-12 基于大数据分析的产品推荐方法、装置、介质及服务器 Active CN110147502B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910295772.5A CN110147502B (zh) 2019-04-12 2019-04-12 基于大数据分析的产品推荐方法、装置、介质及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910295772.5A CN110147502B (zh) 2019-04-12 2019-04-12 基于大数据分析的产品推荐方法、装置、介质及服务器

Publications (2)

Publication Number Publication Date
CN110147502A true CN110147502A (zh) 2019-08-20
CN110147502B CN110147502B (zh) 2024-03-15

Family

ID=67588857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910295772.5A Active CN110147502B (zh) 2019-04-12 2019-04-12 基于大数据分析的产品推荐方法、装置、介质及服务器

Country Status (1)

Country Link
CN (1) CN110147502B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889748A (zh) * 2019-12-02 2020-03-17 广州伊的家网络科技有限公司 店商平台产品推荐方法、装置、计算机设备以及存储介质
CN111798273A (zh) * 2020-07-01 2020-10-20 中国建设银行股份有限公司 产品的购买概率预测模型的训练方法及购买概率预测方法
CN111861514A (zh) * 2020-07-30 2020-10-30 北京车薄荷科技有限公司 一种人员推荐方法及人员推荐系统
CN112308686A (zh) * 2020-11-26 2021-02-02 江苏科源网络技术有限公司 一种智能推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
CN105761102A (zh) * 2016-02-04 2016-07-13 杭州朗和科技有限公司 一种预测用户购买商品行为的方法和装置
US20160284007A1 (en) * 2015-03-25 2016-09-29 Nec Corporation Information processing apparatus, information processing method, and recording medium
CN108596705A (zh) * 2018-03-23 2018-09-28 郑州大学西亚斯国际学院 一种适用于电子商务的商品与信息分类推荐方法及系统
CN109214886A (zh) * 2018-08-14 2019-01-15 平安科技(深圳)有限公司 商品推荐方法、系统及存储介质
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479366A (zh) * 2010-11-25 2012-05-30 阿里巴巴集团控股有限公司 一种商品推荐方法及系统
US20160284007A1 (en) * 2015-03-25 2016-09-29 Nec Corporation Information processing apparatus, information processing method, and recording medium
CN105761102A (zh) * 2016-02-04 2016-07-13 杭州朗和科技有限公司 一种预测用户购买商品行为的方法和装置
KR20190017105A (ko) * 2017-08-10 2019-02-20 장윤식 보험 가입 희망자와 추천 보험 상품을 매칭시키는 방법
CN108596705A (zh) * 2018-03-23 2018-09-28 郑州大学西亚斯国际学院 一种适用于电子商务的商品与信息分类推荐方法及系统
CN109214886A (zh) * 2018-08-14 2019-01-15 平安科技(深圳)有限公司 商品推荐方法、系统及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889748A (zh) * 2019-12-02 2020-03-17 广州伊的家网络科技有限公司 店商平台产品推荐方法、装置、计算机设备以及存储介质
CN110889748B (zh) * 2019-12-02 2023-08-15 广州伊的家网络科技有限公司 店商平台产品推荐方法、装置、计算机设备以及存储介质
CN111798273A (zh) * 2020-07-01 2020-10-20 中国建设银行股份有限公司 产品的购买概率预测模型的训练方法及购买概率预测方法
CN111861514A (zh) * 2020-07-30 2020-10-30 北京车薄荷科技有限公司 一种人员推荐方法及人员推荐系统
CN111861514B (zh) * 2020-07-30 2023-09-12 北京车薄荷科技有限公司 一种人员推荐方法及人员推荐系统
CN112308686A (zh) * 2020-11-26 2021-02-02 江苏科源网络技术有限公司 一种智能推荐方法

Also Published As

Publication number Publication date
CN110147502B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN110147502A (zh) 基于大数据分析的产品推荐方法、装置、介质及服务器
US20240046095A1 (en) Neural embeddings of transaction data
US9195941B2 (en) Predictive and descriptive analysis on relations graphs with heterogeneous entities
US8234692B2 (en) System and method for processing an upload of a program with export compliance information
US20210350393A1 (en) Behavioral data analytics platform
WO2009094672A2 (en) Belief propagation for generalized matching
CN111985622A (zh) 一种图神经网络训练方法和系统
CN108734587A (zh) 金融产品的推荐方法及终端设备
CN108885762B (zh) 用于在数据市场中分配价格发现机制的方法和系统
CN109214585A (zh) 用户消费预测方法、装置、电子设备及存储介质
KR102434607B1 (ko) 핀 테크 플랫폼에게 사용자의 소비 성향을 반영한 추천 혜택을 제공하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
CN109241449A (zh) 一种物品推荐方法及装置
US20230368111A1 (en) System, Method, and Computer Program Product for Implementing a Hybrid Deep Neural Network Model to Determine a Market Strategy
CN112084223A (zh) 一种用户画像的生成方法、装置、设备和存储介质
US11144947B2 (en) Managing user loyalty groups at point-of-sale accesses
KR20220149645A (ko) 판매자들 사이의 경쟁 판매율에 따라 사용 허가를 선별적으로 적용하는 글로벌 이커머스 통합 관리 방법 및 시스템
CN106600360B (zh) 推荐对象的排序方法及装置
CN113269232B (zh) 模型训练方法、向量化召回方法、相关设备及存储介质
CN113095861A (zh) 目标对象成交概率的预测方法、装置、设备及存储介质
CN109543107A (zh) 数据处理方法、介质、装置和计算设备
US20190188772A1 (en) Method and system for real-time navigational guidance and purchase recommendations
US11948180B2 (en) System and method for recommending repeat-purchase products using modified self-similarity
CN107562461A (zh) 特征计算系统及方法、存储介质和电子设备
CN111105274A (zh) 数据处理方法、装置、介质及电子设备
CN110175884A (zh) 商品推荐页面的展示方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant