CN110674391B - 基于大数据的产品数据推送方法、系统和计算机设备 - Google Patents

基于大数据的产品数据推送方法、系统和计算机设备 Download PDF

Info

Publication number
CN110674391B
CN110674391B CN201910753734.XA CN201910753734A CN110674391B CN 110674391 B CN110674391 B CN 110674391B CN 201910753734 A CN201910753734 A CN 201910753734A CN 110674391 B CN110674391 B CN 110674391B
Authority
CN
China
Prior art keywords
personal
user
users
target user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910753734.XA
Other languages
English (en)
Other versions
CN110674391A (zh
Inventor
杨春春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910753734.XA priority Critical patent/CN110674391B/zh
Publication of CN110674391A publication Critical patent/CN110674391A/zh
Application granted granted Critical
Publication of CN110674391B publication Critical patent/CN110674391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Finance (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Accounting & Taxation (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种基于大数据的产品数据推送方法,所述方法包括:从至少一个信息源中爬取目标用户的目标用户原始数据;根据所述目标用户原始数据,构建所述目标用户的目标数据库;根据所述目标数据库,为所述目标用户构建目标用户画像;根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签;根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据。本发明实施例通过目标用户画像确定目标用户购买兴趣来进行数据推送,实现高效率地向不同的客户推送合适的电子凭据,且可以进一步提高消息推送效率和提送准确度,减少无效推送事件。

Description

基于大数据的产品数据推送方法、系统和计算机设备
技术领域
本发明实施例涉及数据推送领域,尤其涉及一种基于大数据的产品数据推送方法、系统、计算机设备及计算机可读存储介质。
背景技术
网上购物平台就是在虚拟的世界进行购物活动的平台,多运用数字化传递信息,达到实物交易的目的。随着互联网技术的迅猛发展,电子商务因其方便快捷的优点而得到了人们的广泛关注。但随着商品信息的细化及客户对推荐内容要求的提高,互联网的发展带动,网上购物已经成为一种时尚,并成为当下一种重要的购物形式。但是传统的商城优惠券推荐都是根据主题进行推荐,或只针对用户浏览的商品进行相似关联,关联度相对单一,这样推荐优惠券往往不是客户所想要的,所以会造成发送的优惠券没有进行消费,且不能挖掘出用户的深层次消费需求,除此以外,也会流失一部分客户来源。
因此,如何高效率地向不同的客户推送合适的电子凭据,从而进一步提高消息推送效率和提送准确度,减少无效推送事件,成为了当前要解决的技术问题之一。
发明内容
有鉴于此,有必要提供一种基于大数据的产品数据推送方法、系统、计算机设备及计算机可读存储介质,以解决如何高效率地向不同的客户推送合适的电子凭据的问题和从而进一步提高消息推送效率和提送准确度,减少无效推送事件的问题。
为实现上述目的,本发明实施例提供了基于大数据的产品数据推送方法,所述方法步骤包括:
从至少一个信息源中爬取目标用户的目标用户原始数据;
根据所述目标用户原始数据,构建所述目标用户的目标数据库;
根据所述目标数据库,为所述目标用户构建目标用户画像;
根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签;
根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据。
示例性的,所述目标数据库中包括所述目标用户行为信息;所述根据所述目标数据库,为所述目标用户构建目标用户画像的步骤,包括:
将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息;
根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
示例性的,所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重;所述根据所述目标数据库,为所述目标用户构建用户画像的步骤,包括:
将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到;
根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
示例性的,所述训练所述聚类模型的的步骤,包括:
获取N个用户的N个个人数据库;
对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;
从所述M个个人数据库集合中选择其中一个个人数据库集合;
从被选择的个人数据库集合中提取各个样本用户的用户个人特征;
根据被提取各个样本用户的用户个人特征,通过增量学习法提取未被选择的多个个人数据库集合中的每个样本用户的用户个人特征,以得到N个用户中每个用户的用户个人特征;及
根据所述N个用户的用户个人特征,将所述N个用户进行划分为所述多个聚类类别,其中,每个聚类类别对应一个聚类中心,每个聚类类别的数据都紧密的聚集在其聚类中心的周围,所述每个聚类类别还对应的一个用户类别,每个用户类别对应一个识别标签,每个用户位于一个或多个用户类别中。
示例性的,所述将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别的步骤,包括:
提取目标用户It的目标个人特征ft
根据目标个人特征ft以及多个聚类中心,使用最近邻法则确定所述目标用户It的用户类别标签Lt
根据所述用户类别标签Lt确定目标用户类别,根据目标用户类别确定对应的聚类类别。
为实现上述目的,本发明实施例还提供了一种基于大数据的产品数据推送系统,包括:
获取模块,用于从至少一个信息源中爬取目标用户的目标用户原始数据;
构建模块,用于根据所述目标用户原始数据,构建所述目标用户的目标数据库;
画像模块,用于根据所述目标数据库,为所述目标用户构建目标用户画像;
确定模块,用于根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签;及
推送模块,用于根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据。
示例性的,所述目标数据库中包括所述目标用户行为信息;所述画像模块,还用于:
将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息;
根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
示例性的,所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重;所述画像模块,还用于:
将所述目标数据库中的所述目标用户行为信息和目标用户基础信息数据输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到;
根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
为实现上述目的,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上述的基于大数据的产品数据推送方法的步骤。
为实现上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上述的基于大数据的产品数据推送方法的步骤。
本发明实施例提供的基于大数据的产品数据推送方法、系统、计算机设备及计算机可读存储介质,为产品数据提供了有效的推送方法;通过目标用户画像确定目标用户购买兴趣来进行数据推送,可以高效率地向不同的客户推送合适的电子凭据,且可以进一步提高消息推送效率和提送准确度,减少无效推送事件,还可以挖掘出用户的深层次消费需求,且可以有效的提高产品数据使用率。
附图说明
图1为本发明实施例基于大数据的产品数据推送方法的流程示意图。
图2为图1中步骤S104的具体流程示意图。
图3为图1中步骤S104的具体流程示意图。
图4为图1中步骤S104中训练所述聚类模型的的具体流程示意图。
图5为本发明基于大数据的产品数据推送系统实施例二的程序模块示意图。
图6为本发明计算机设备实施例三的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
以下实施例中,将以计算机设备2为执行主体进行示例性描述。
实施例一
参阅图1,示出了本发明实施例之基于大数据的产品数据推送方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。具体如下。
步骤S100,从至少一个信息源中爬取目标用户的目标用户原始数据。
示例性的,可以通过网络爬虫相关网站或APP(如购物网站)获取目标用户的原始操作数据以及原始基础数据。所述原始操作数据包括购买数据、加入购物车数据、收藏数据、跳过数据以及不感兴趣数据等。
步骤S102,根据所述目标用户原始数据,构建所述目标用户的目标数据库。
对所述原始操作数据、原始基础数据等目标用户原始数据进行ETL(数据清洗)处理,并根据ETL处理之后的目标用户原始数据构建目标数据库。该目标数据库可以以数据表,且该数据表中包括多个字段,不同字段对应存储不同类型的数据。例如,“收藏字段”则对应存储目标用户的网页或商品收藏数据。不难理解,该目标数据库可以字段组合区分为两类信息,即目标用户行为信息以及目标基础信息。作为一种示例性的实施例:所述目标用户行为信息可以包括以下一种或多种:商品浏览信息、商品购买信息以及商品收藏信息;所述商品浏览信息包括所述用户在各个网站的商品浏览时间、商品浏览种类、商品浏览价格以及商品浏览频次等;所述商品购买信息包括所述用户在各个网站的商品购买时间、商品购买种类、商品购买价格以及商品购买频次等。所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重。
步骤S104,根据所述目标数据库,为所述目标用户构建目标用户画像。
如上所述,所述目标数据库可以包括目标用户行为信息和目标用户基础信息。在示例性的实施例中,可以基于这些信息为所述目标用户构建目标用户画像。示例性的,步骤S104可以通过以下几种方式实现。
如图2所示,所述步骤S104可以进一步包括:
步骤S104a1,将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息。
步骤S104a2,根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
如图3所示,所述步骤S104可以进一步包括:
步骤S104b1,将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到。
步骤S104b2,根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
具体的,如图4所示,步骤S104b1中的聚类模型可以通过如下步骤训练得到:
步骤S1041,获取N个用户的N个个人数据库。
步骤S1042,对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成。
步骤S1043,从所述M个个人数据库集合中选择其中一个个人数据库集合。
步骤S1044,从被选择的个人数据库集合中提取各个样本用户的用户个人特征。
步骤S1045,根据被提取各个样本用户的用户个人特征,通过增量学习法提取未被选择的多个个人数据库集合中的每个样本用户的用户个人特征,以得到N个用户中每个用户的用户个人特征;及
步骤S1046,根据所述N个用户的用户个人特征,将所述N个用户进行划分为所述多个聚类类别,其中,每个聚类类别对应一个聚类中心,每个聚类类别的数据都紧密的聚集在其聚类中心的周围,所述每个聚类类别还对应的一个用户类别,每个用户类别对应一个识别标签,每个用户位于一个或多个用户类别中。
基于上述训练步骤训练好的聚类模型,在示例性的实施例中,所述步骤S104I可以包括步骤(1)~(2)。
步骤(1)获取N个用户的用户个人特征:
获取N个用户的N个个人数据库;对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;从所述M个个人数据库集合中选择其中一个个人数据库集合。
下面以被选择的其中一个个人数据集合为例,介绍用户的用户个人特征获取过程:
假设该被选择的个人数据库集合中一共有n个用户的个人数据库x1,x2,…,xn
从n个用户的个人数据库中先提取m个用户的个人数据库,记为x1,x2,...,xm,m<n,计算出这m个用户的个人数据库的均值和协方差矩阵
从n个用户的个人数据库中再提取一部分用户的个人数据库,记为xm+1,xm+2…,xm+p,同理,这p个用户的个人数据库的均值为协方差矩阵为Σp,并计算出这m+p个用户的个人数据库x1,x2,…,xm,xm+1,xm+2,…,xm+p的协方差矩阵为:
不断从n个用户的个人数据库中提取部分用户的个人数据库,直到n个用户的个人数据库中的所有用户的个人数据库都提取完为止,最终计算出的协方差矩阵就是PCA方法中计算的协方差矩阵
需要特别说明的是,对协方差矩阵进行特征分解,得到:Σ=PΛPT,对于每个用户的个人数据库xi,其特征就是/>即/>通过增量学习法逐步提取用户个人特征时,对于第i(1≤i≤n)个用户的个人数据库Ii,给出一个向量fi,而fi的维数小于Ii的维数。
步骤(2)根据N个用户的用户个人特征进行聚类操作:
步骤(2.1)通过聚类分析法对特征进行处理,根据N个个人数据库的用户的用户个人特征,将N个个人数据库划分M个个人数据库集合,从而将具有相似用户的用户个人特征的个人数据库聚集到一起,一个个人数据库集合对应一个聚类。
步骤(2.2)聚类结束后,第i(1≤i≤n)个用户个人的特征获得了一个用户类别标签Li,Li的取值范围为1到M,M个聚类中心分别为每个聚类中的数据都紧密的聚集在其聚类中心的周围。
不难理解,在进行查找所述用户对应的聚类类别时,只需要将待识别用户个人特征先和M个聚类中心进行比较,找到距离最近的那个聚类中心,于是待识别用户个人特征就可能属于该聚类,然后在该聚类中进行进一步的匹配,就可以获得最终的匹配结果,从而降低了在数据库中搜索的时间。
示例性的,所述步骤S104b1中“将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别”的步骤,可以包括:
步骤1,提取目标用户It的目标个人特征ft
示例性的,对目标用户It,代入函数T(x)中得到其特征ft=T(It)。
步骤2,根据目标个人特征ft以及多个聚类中心,使用最近邻法则确定所述目标用户It的用户类别标签Lt
示例性的,采用下面的公式,计算ft和每个聚类中心的差值di
其中,i=1,2,…,M。
得到M个差值d1,d2,…,dM后,确定d1,d2,…,dM中的最小值,找出该最小值对应的聚类,假设该最小值的下标为k,则目标用户It就属于第k个聚类,假设该第k个聚类的用户类别标签为Lt
步骤3,根据所述用户类别标签Lt确定目标用户类别,根据目标用户类别确定对应的聚类类别。
示例性的,将目标用户的用户个人特征与第k个聚类中的各个用户个人特征进行匹配,找到对应的聚类中心,以确定目标用户的用户个人特征所属的聚类的用户类别。
示例性的,将个人数据库中的用户行为信息进行分类,以得到多个子类信息;例如可以分为3类,包括:A类,用户购买商品的种类数据;B类,用户购买商品的时间数据;C类,用户购买商品的价格数据。
对每个个人数据库中的多个子类信息进行分类,如,将用户购买商品的种类数据分为:食品、休闲等。
对每个个人数据库的进行分析,得到分析结果,根据分析结果为每个个人数据库对应的用户构建用户画像。以其中一个用户为例:根据该用户的商品购买或浏览的种类、时间以及价格等多个维度构建用户画像,例如,根据该用户购买或商品种类判断该用户消费种类,根据该用户的消费金额进行判断该用户的消费层次,根据该用户的购物时间,判断该用户消费时间特点。
示例性的,所述用户的行为数据为通过网络爬虫的方式获取的用户对该商品过去所进行的操作记录,所述操作包括但不限于购买、加入购物车、收藏、跳过、不感兴趣。本发明中优选的量化标准设定为:购买=5,加入购物车=4,收藏=3,点赞=2,浏览=1,跳过=-2,不感兴趣=-5。
示例性的,对每个用户进行标识,将每个用户的用户标识和用户画像进行映射,用户标识可以是移动设备的MAC地址等。
步骤S106根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签。
示例性的,根据所述用户画像确定该用户在不同维度下对商品的购买频次,分别预设不同维度购买频次对应的购买兴趣;以快餐为例,预设在七天时间内购买三次快餐,则可判定用户对快餐具有购买兴趣,或是快餐购买频率在所有购买记录中最高也可判定该用户对快餐具有购买兴趣;例如某个用户购买快餐的的频率占据所有购买记录的50%以上,那么就断定该用户有吃快餐的喜好,并且消费在50-100以内的,那么就断定该用户对食物高品质要就较高;购买快餐时间段为夜晚较多,那么就断定该用户有在夜晚吃快餐习惯。
示例性的,接收到触发事件,判断用户为该商品或该类商品的新顾客还是老顾客,并将所述接收到触发事件收录进用户的个人数据库中,根据接收到触发事件通过用户画像,判断用户为该商品或该类商品的新顾客还是老顾客,若是新顾客,则可给新用户一个打折券,例如若为该商品的新顾客,可给个六折券,若为该类商品的新顾客,可给个五折券;若是老顾客,则可给老顾客一个优惠券,例如若为该商品的老顾客,可给个五元券,若为该类商品的老顾客给其100减5元的优惠券等。
示例性的,接收到触发事件,并将所述接收到触发事件收录进用户的个人数据库中,例如该次触发事件为在夜晚购买价格为10元的炸酱面,则可在消费种类为面食、时间段为夜晚、消费金额为20元以下的数量分别进行+1。
步骤S108根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据。
示例性的,所述预设产品关联的电子凭据可以是优惠券、推送券以及促销券等。
示例性的,预先建立购买兴趣标签和各类电子凭据之间的关联关系,当得到所述目标用户的购买兴趣标签时,则可以根据该目标用户的购买兴趣标签检索到对应的目标电子凭据,并将目标电子凭据关联或存储至目标用户的电子账户中,并将目标电子凭据的已发放消息推送至目标用户的用户终端中。
示例性的,以其中一个用户为例:根据用户的不同维度的购买兴趣,判断出用户有吃湘菜的爱好,那么,以后给顾客推荐优惠券的话,就优先推荐食物的相关券或者类似的券;若是金额在50元以内的话,那就推荐性价比较高的食物优惠券,若平均消费在50-100以内的,可以推荐一些高品质的食物优惠券;若是在夜晚消费的频次较多,则在夜晚推送更加优惠的优惠券。
实施例二
图5为本发明基于大数据的产品数据推送系统实施例二的程序模块示意图。产品数据推送系统20可以包括或被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明,并可实现上述基于大数据的产品数据推送方法。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合于描述文本产品数据推送系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能:
获取模块200,用于从至少一个信息源中爬取目标用户的目标用户原始数据。
构建模块202,用用于根据所述目标用户原始数据,构建所述目标用户的目标数据库。
画像模块204,用于根据所述目标数据库,为所述目标用户构建目标用户画像。
示例性的,所述目标数据库中包括所述目标用户行为信息;所述画像模块204还用于:将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息;根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
示例性的,所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重;所述画像模块204还用于:将所述目标数据库中的所述目标用户行为信息和目标用户基础信息数据输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到;
示例性的,所述画像模块204还用于:所述训练所述聚类模型的步骤,包括:获取N个用户的N个个人数据库;对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;从所述M个个人数据库集合中选择其中一个个人数据库集合;从被选择的个人数据库集合中提取各个样本用户的用户个人特征;根据被提取各个样本用户的用户个人特征,通过增量学习法提取未被选择的多个个人数据库集合中的每个样本用户的用户个人特征,以得到N个用户的用户个人特征;根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
确定模块206,用于根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签。
推送模块208,用于根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据。
实施例三
参阅图6,是本发明实施例三之计算机设备的硬件架构示意图。本实施例中,所述计算机设备2是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图所示,所述计算机设备2至少包括,但不限于,可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及产品数据推推送系统20。
本实施例中,存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例二的基于大数据的产品数据推送系统20的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器22在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2的总体操作。本实施例中,处理器22用于运行存储器21中存储的程序代码或者处理数据,例如运行基于大数据的产品数据推送系统20,以实现实施例一的基于大数据的产品数据推送方法。
所述网络接口23可包括无线网络接口或有线网络接口,该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如,所述网络接口23用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图6仅示出了具有部件20-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的基于大数据的产品数据推送系统20还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器22)所执行,以完成本发明。
例如,图5示出了本发明实施例二之所述实现基于大数据的产品数据推送系统20的程序模块示意图,该实施例中,所述基于大数据的产品数据推送系统20可以被划分为获取模块200、构建模块202、画像模块204、确定模块206、和推送模块208。其中,本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述基于大数据的产品数据推送20在所述计算机设备2中的执行过程。所述程序模块200-208的具体功能在实施例二中已有详细描述,在此不再赘述。
实施例四
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质基于大数据的产品数据推送系统20,被处理器执行时实现实施例一的基于大数据的产品数据推送方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于大数据的产品数据推送方法,其特征在于,所述方法包括:
从至少一个信息源中爬取目标用户的目标用户原始数据;
根据所述目标用户原始数据,构建所述目标用户的目标数据库;
根据所述目标数据库,为所述目标用户构建目标用户画像;
根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签;及
根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据;
其中,根据所述目标数据库,为所述目标用户构建目标用户画像,包括:
步骤(1)获取N个用户的用户个人特征,具体步骤包括:
获取N个用户的N个个人数据库;对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;从所述M个个人数据库集合中选择其中一个个人数据库集合;
用户个人特征获取过程:
设定被选择的个人数据库集合中有n个用户的个人数据库x1,x2,…,xn
从n个用户的个人数据库中先提取m个用户的个人数据库,记为x1,x2,...,xm,m<n,计算出这m个用户的个人数据库的均值和协方差矩阵/>
从n个用户的个人数据库中再提取一部分用户的个人数据库,记为xm+1,xm+2…,xm+p,同理,这p个用户的个人数据库的均值为协方差矩阵为Σp,并计算出这m+p个用户的个人数据库x1,x2,…,xm,xm+1,xm+2,…,xm+p的协方差矩阵为:
不断从n个用户的个人数据库中提取部分用户的个人数据库,直到n个用户的个人数据库中的所有用户的个人数据库都提取完为止,最终计算出的协方差矩阵就是PCA方法中计算的协方差矩阵
对协方差矩阵进行特征分解,得到:Σ=PΛPT,对于每个用户的个人数据库xi,其特征为/>即/>通过增量学习法逐步提取用户个人特征时,对于第i(1≤i≤n)个用户的个人数据库Ii,给出一个向量fi,而fi的维数小于Ii的维数;
步骤(2)根据N个用户的用户个人特征进行聚类操作,具体步骤包括:
步骤(2.1)通过聚类分析法对特征进行处理,根据N个个人数据库的用户的用户个人特征,将N个个人数据库划分M个个人数据库集合,从而将具有相似用户的用户个人特征的个人数据库聚集到一起,一个个人数据库集合对应一个聚类;步骤(2.2)聚类结束后,第i(1≤i≤n)个用户个人的特征获得了一个用户类别标签Li,Li的取值范围为1到M,M个聚类中心分别为每个聚类中的数据都紧密的聚集在其聚类中心的周围。
2.如权利要求1所述的基于大数据的产品数据推送方法,其特征在于,所述目标数据库中包括所述目标用户行为信息;所述根据所述目标数据库,为所述目标用户构建目标用户画像的步骤,包括:
将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息;
根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
3.如权利要求2所述的基于大数据的产品数据推送方法,其特征在于,所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重;所述根据所述目标数据库,为所述目标用户构建用户画像的步骤,包括:
将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到;
根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
4.如权利要求3所述的基于大数据的产品数据推送方法,其特征在于,还包括训练所述聚类模型的步骤:
获取N个用户的N个个人数据库;
对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;
从所述M个个人数据库集合中选择其中一个个人数据库集合;
从被选择的个人数据库集合中提取各个样本用户的用户个人特征;
根据被提取各个样本用户的用户个人特征,通过增量学习法提取未被选择的多个个人数据库集合中的每个样本用户的用户个人特征,以得到N个用户中每个用户的用户个人特征;及
根据所述N个用户的用户个人特征,将所述N个用户进行划分为所述多个聚类类别,其中,每个聚类类别对应一个聚类中心,每个聚类类别的数据都紧密的聚集在其聚类中心的周围,所述每个聚类类别还对应的一个用户类别,每个用户类别对应一个识别标签,每个用户位于一个或多个用户类别中。
5.如权利要求4所述的基于大数据的产品数据推送方法,其特征在于,所述将所述目标数据库中的所述目标用户行为信息和目标用户基础信息输入到聚类模型中,得到对应的聚类类别的步骤:
提取目标用户It的目标个人特征ft
根据目标个人特征ft以及多个聚类中心,使用最近邻法则确定所述目标用户It的用户类别标签Lt
根据所述用户类别标签Lt确定目标用户类别,根据目标用户类别确定对应的聚类类别。
6.一种基于大数据的产品数据推送系统,其特征在于,包括:
获取模块,用于从至少一个信息源中爬取目标用户的目标用户原始数据;
构建模块,用于根据所述目标用户原始数据,构建所述目标用户的目标数据库;
画像模块,用于根据所述目标数据库,为所述目标用户构建目标用户画像;
确定模块,用于根据所述目标用户的目标用户画像,确定所述目标用户当前的购买兴趣标签;及
推送模块,用于根据所述目标用户的购买兴趣标签,向所述目标用户的用户终端推送相应的产品数据,所述产品数据为与预设产品关联的电子凭据;
其中,根据所述目标数据库,为所述目标用户构建目标用户画像,包括:
获取N个用户的用户个人特征,具体包括:
获取N个用户的N个个人数据库;对所述N个用户的N个个人数据库进行取样,得到M个个人数据库集合,每个个人数据库集合由N个用户中的多个样本用户对应的多个个人数据库构成;从所述M个个人数据库集合中选择其中一个个人数据库集合;
用户个人特征获取过程:
设定被选择的个人数据库集合中有n个用户的个人数据库x1,x2,…,xn
从n个用户的个人数据库中先提取m个用户的个人数据库,记为x1,x2,...,xm,m<n,计算出这m个用户的个人数据库的均值和协方差矩阵/>
从n个用户的个人数据库中再提取一部分用户的个人数据库,记为xm+1,xm+2…,xm+p,同理,这p个用户的个人数据库的均值为xp,协方差矩阵为Σp,并计算出这m+p个用户的个人数据库x1,x2,…,xm,xm+1,xm+2,…,xm+p的协方差矩阵为:
不断从n个用户的个人数据库中提取部分用户的个人数据库,直到n个用户的个人数据库中的所有用户的个人数据库都提取完为止,最终计算出的协方差矩阵就是PCA方法中计算的协方差矩阵
对协方差矩阵进行特征分解,得到:Σ=PΛPT,对于每个用户的个人数据库xi,其特征为/>即/>通过增量学习法逐步提取用户个人特征时,对于第i(1≤i≤n)个用户的个人数据库Ii,给出一个向量fi,而fi的维数小于Ii的维数;
(2)根据N个用户的用户个人特征进行聚类操作,具体包括:
(2.1)通过聚类分析法对特征进行处理,根据N个个人数据库的用户的用户个人特征,将N个个人数据库划分M个个人数据库集合,从而将具有相似用户的用户个人特征的个人数据库聚集到一起,一个个人数据库集合对应一个聚类;(2.2)聚类结束后,第i(1≤i≤n)个用户个人的特征获得了一个用户类别标签Li,Li的取值范围为1到M,M个聚类中心分别为每个聚类中的数据都紧密的聚集在其聚类中心的周围。
7.如权利要求6所述的基于大数据的产品数据推送系统,其特征在于,所述目标数据库中包括所述目标用户行为信息;所述画像模块,还用于:
将所述目标用户行为信息进行分类,以得到与所述目标数据库对应的多个子类信息,所述多个子类信息包括购买种类信息、购买时间信息和/或购买价格信息;
根据所述多个子类信息,为所述目标用户构建相应的目标用户画像。
8.如权利要求7所述的基于大数据的产品数据推送系统,其特征在于,所述目标数据库还包括目标用户基础信息,所述目标用户基础信息包括所述目标用户的性别、年龄、身高和/或体重;所述画像模块,还用于:
将所述目标数据库中的所述目标用户行为信息和目标用户基础信息数据输入到聚类模型中,得到对应的聚类类别,其中,所述聚类模型预先经过海量数据训练得到;
根据所述目标用户对应的多个子类信息及聚类类别,为所述用户构建相应的目标用户画像。
9.一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的基于大数据的产品数据推送方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如权利要求1至5中任一项所述的基于大数据的产品数据推送方法的步骤。
CN201910753734.XA 2019-08-15 2019-08-15 基于大数据的产品数据推送方法、系统和计算机设备 Active CN110674391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910753734.XA CN110674391B (zh) 2019-08-15 2019-08-15 基于大数据的产品数据推送方法、系统和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910753734.XA CN110674391B (zh) 2019-08-15 2019-08-15 基于大数据的产品数据推送方法、系统和计算机设备

Publications (2)

Publication Number Publication Date
CN110674391A CN110674391A (zh) 2020-01-10
CN110674391B true CN110674391B (zh) 2024-05-03

Family

ID=69075359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910753734.XA Active CN110674391B (zh) 2019-08-15 2019-08-15 基于大数据的产品数据推送方法、系统和计算机设备

Country Status (1)

Country Link
CN (1) CN110674391B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582932A (zh) * 2020-03-25 2020-08-25 平安壹钱包电子商务有限公司 场景间信息推送方法、装置、计算机设备及存储介质
CN111612527A (zh) * 2020-04-28 2020-09-01 杭州沃朴物联科技有限公司 裂变红包发放方法、装置、设备及介质
CN111598613A (zh) * 2020-04-28 2020-08-28 杭州沃朴物联科技有限公司 红包发放方法、装置、设备及介质
CN112417251A (zh) * 2020-11-30 2021-02-26 华能大理风力发电有限公司 一种基于风电竞价的交易信息检索方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492194A (zh) * 2018-03-06 2018-09-04 平安科技(深圳)有限公司 产品推荐方法、装置及存储介质
CN108665355A (zh) * 2018-05-18 2018-10-16 深圳壹账通智能科技有限公司 金融产品推荐方法、装置、设备和计算机存储介质
CN108960975A (zh) * 2018-06-15 2018-12-07 广州麦优网络科技有限公司 基于用户画像的个性化精准营销方法、服务器及存储介质
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109657533A (zh) * 2018-10-27 2019-04-19 深圳市华尊科技股份有限公司 行人重识别方法及相关产品
CN109815381A (zh) * 2018-12-21 2019-05-28 平安科技(深圳)有限公司 用户画像构建方法、系统、计算机设备及存储介质
CN110020201A (zh) * 2019-03-26 2019-07-16 中国科学院软件研究所 一种基于用户画像聚类的用户类型自动化标注系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188965B2 (en) * 2017-12-29 2021-11-30 Samsung Electronics Co., Ltd. Method and apparatus for recommending customer item based on visual information

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108492194A (zh) * 2018-03-06 2018-09-04 平安科技(深圳)有限公司 产品推荐方法、装置及存储介质
CN108665355A (zh) * 2018-05-18 2018-10-16 深圳壹账通智能科技有限公司 金融产品推荐方法、装置、设备和计算机存储介质
CN108960975A (zh) * 2018-06-15 2018-12-07 广州麦优网络科技有限公司 基于用户画像的个性化精准营销方法、服务器及存储介质
CN109657533A (zh) * 2018-10-27 2019-04-19 深圳市华尊科技股份有限公司 行人重识别方法及相关产品
CN109815381A (zh) * 2018-12-21 2019-05-28 平安科技(深圳)有限公司 用户画像构建方法、系统、计算机设备及存储介质
CN109493199A (zh) * 2019-01-04 2019-03-19 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质
CN110020201A (zh) * 2019-03-26 2019-07-16 中国科学院软件研究所 一种基于用户画像聚类的用户类型自动化标注系统

Also Published As

Publication number Publication date
CN110674391A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN110674391B (zh) 基于大数据的产品数据推送方法、系统和计算机设备
US20240062271A1 (en) Recommendations Based Upon Explicit User Similarity
CN108121737B (zh) 一种业务对象属性标识的生成方法、装置和系统
US11823218B2 (en) Customer clustering using integer programming
US7908184B2 (en) Method of providing customized information of commodity for on-line shopping mall users
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
US20120109946A1 (en) Determination of category information using multiple
KR102042047B1 (ko) 정형 및 비정형의 빅데이터를 이용한 마케팅 서비스 시스템 및 방법
KR102000076B1 (ko) 온라인 쇼핑몰 통합 관리 시스템에서의 온라인 판매채널을 추천하는 방법 및 그 서버
CN110111167A (zh) 一种确定推荐对象的方法和装置
JP2009265747A (ja) マーケティング支援システム、マーケティング支援方法、マーケティング支援プログラム及びコンピュータ読み取り可能な媒体
JP6425297B2 (ja) 購買情報活用システム及び購買情報活用方法、及びプログラム
CN105335518A (zh) 生成用户偏好信息的方法及装置
CN109767302B (zh) 大数据精准模型的构建方法及装置
CN113077317A (zh) 基于用户数据的物品推荐方法、装置、设备及存储介质
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN114820123A (zh) 团购商品推荐方法、装置、设备及存储介质
CN109190027A (zh) 多源推荐方法、终端、服务器、计算机设备、可读介质
US20170083574A1 (en) Search system, search method, and program
CN111311381A (zh) 一种商品推荐方法及系统
CN116402569A (zh) 基于知识图谱的商品推荐方法、装置、系统及存储介质
CN111639989B (zh) 商品推荐方法和可读存储介质
CN111460300B (zh) 网络内容推送方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant