CN107193855A - 一种数据分析系统及方法 - Google Patents

一种数据分析系统及方法 Download PDF

Info

Publication number
CN107193855A
CN107193855A CN201611264025.8A CN201611264025A CN107193855A CN 107193855 A CN107193855 A CN 107193855A CN 201611264025 A CN201611264025 A CN 201611264025A CN 107193855 A CN107193855 A CN 107193855A
Authority
CN
China
Prior art keywords
data
user
submodule
module
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611264025.8A
Other languages
English (en)
Inventor
胡小飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Broadcull Network Polytron Technologies Inc
Original Assignee
Hangzhou Broadcull Network Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Broadcull Network Polytron Technologies Inc filed Critical Hangzhou Broadcull Network Polytron Technologies Inc
Priority to CN201611264025.8A priority Critical patent/CN107193855A/zh
Publication of CN107193855A publication Critical patent/CN107193855A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种数据分析系统及方法,本数据分析系统包括:数据采集筛选模块,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;数据挖掘模块,对用户行为数据进行挖掘,以获得用户特征数据;以及数据聚合模块,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息;本发明的数据分析系统及方法由数据采集筛选模块、数据挖掘模块、数据聚合模块构成,针对企业或商家独自的信息孤岛现状无法触达用户全方位信息或者无法扩大目标用户的问题和现象进行了改进和创新,通过以上各模块之间的处理与合作,实现可以让企业或商家通过数据营销手段服务好目标用户的基石,其信息全面、目标精确、价值高。

Description

一种数据分析系统及方法
技术领域
本发明属于数据应用行业,具体涉及一种数据分析系统及方法。
背景技术
随着互联网平台日益发展,当今互联网呈现一种平台化、多元化的环境。在当下互联网环境中,许多企业或商家都面临着用户分散、无处寻觅的困惑,如何把自己的产品展示给最合适的潜在客户看,如何扩展自己客户群,如何维护已有客户,并且如何区分已有客户的不同喜好和需求从而推送不同的产品,是企业或商家最需要重视的问题。而每个商家就像是一个数据孤岛一样,无法全面的了解客户的全方位信息和需求。
发明内容
本发明的目的是提供一种数据分析系统及方法,其实现对客户相关数据进行全方位分析、挖掘,以全面的了解客户的全方位信息和需求。
为了解决上述技术问题,本发明提供了一种数据分析系统,包括:
数据采集筛选模块,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
数据挖掘模块,对用户行为数据进行挖掘,以获得用户特征数据;以及
数据聚合模块,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
进一步,所述数据采集筛选模块包括:数据采集子模块、数据清洗子模块、基本数据存储子模块和原始行为数据存储子模块;其中
所述数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储。
进一步,各个企业和/或商家数据包括:DSP广告投放数据、电商数据和CRM数据;
用户基本数据包括:姓名、电话、邮箱、年龄,以及用户唯一标示;
用户行为数据包括:用户广告行为数据、用户购物行为数据。
进一步,所述数据挖掘模块包括:广告投放数据挖掘通道和电商数据挖掘通道,且适于根据用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘。
进一步,所述广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中
数据建模子模块收录不同的数据模型规则以提供给特征运算子模块进行运算,以挖掘出用户特征数据,并由用户画像存储子模块进行存储,即
所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
进一步,所述数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储。
又一方面,本发明还提供了一种数据分析方法,包括如下步骤:
步骤S1,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
步骤S2,对用户行为数据进行挖掘,以获得用户特征数据;以及
步骤S3,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
进一步,所述步骤S1中将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储的方法包括:
通过一数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储;其中
各个企业和/或商家数据包括:DSP广告投放数据、电商数据和CRM数据;
用户基本数据包括:姓名、电话、邮箱和年龄;
用户行为数据包括:用户广告行为数据、用户购物行为数据。
进一步,所述步骤S2中对用户行为数据进行挖掘,以获得用户特征数据的方法包括:
通过数据挖掘模块对用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘,即
所述数据挖掘模块中的广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中
所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
进一步,所述步骤S3中将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息的方法包括:
通过数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储,以供数据营销使用。
本发明的有益效果是,本发明的数据分析系统及方法由数据采集筛选模块、数据挖掘模块、数据聚合模块构成,针对企业或商家独自的信息孤岛现状无法触达用户全方位信息或者无法扩大目标用户的问题和现象进行了改进和创新,通过以上各模块之间的处理与合作,实现可以让企业或商家通过数据营销手段服务好目标用户的基石,其信息全面、目标精确、价值高。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的数据分析系统原理框图;
图2是本发明的数据采集筛选模块的原理框图;
图3是本发明的数据挖掘模块的原理框图;
图4是本发明的数据聚合模块的原理框图;
图5是本发明的数据分析方法流程图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
实施例1
图1是本发明的数据分析系统原理框图。
如图1所示,本发明的提供了一种数据分析系统,包括:
数据采集筛选模块,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
数据挖掘模块,对用户行为数据进行挖掘,以获得用户特征数据;以及
数据聚合模块,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
图2是本发明的数据采集筛选模块的原理框图。
如图2所示,作为数据采集筛选模块一种优选的实施方式,所述数据采集筛选模块包括:数据采集子模块、数据清洗子模块、基本数据存储子模块和原始行为数据存储子模块;其中所述数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储。
具体的,各个企业和/或商家数据包括:DSP(需求方平台)广告投放数据、电商数据和CRM(客户关系管理系统)数据;用户基本数据即为明确数据且包括:姓名、电话、邮箱、年龄,以及用户唯一标示;用户行为数据包括:用户广告行为数据、用户购物行为数据。
图3是本发明的数据挖掘模块的原理框图。
如图3所示,作为数据挖掘模块一种优选的实施方式,所述数据挖掘模块包括:广告投放数据挖掘通道和电商数据挖掘通道,且适于根据用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘。
具体的,所述广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中数据建模子模块收录不同的数据模型规则以提供给特征运算子模块进行运算,以挖掘出用户特征数据,并由用户画像存储子模块进行存储,即所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
图4是本发明的数据聚合模块的原理框图。
如图4所示,所述数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储。
其中,用户各唯一标示数据例如但不限于包括:cookieID、设备ID、MAC、IMEI、IP等设备标示信息,手机号、邮箱等用户标示信息
实施例2
图5是本发明的数据分析方法流程图。
如图5所示,在实施例1基础上,本实施例2提供了一种数据分析方法,包括如下步骤:
步骤S1,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
步骤S2,对用户行为数据进行挖掘,以获得用户特征数据;以及
步骤S3,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
所述步骤S1中将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储的方法包括:
通过一数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储;其中
各个企业和/或商家数据包括:DSP广告投放数据、电商数据和CRM数据;
用户基本数据包括:姓名、电话、邮箱和年龄;
用户行为数据包括:用户广告行为数据、用户购物行为数据。
所述步骤S2中对用户行为数据进行挖掘,以获得用户特征数据的方法包括:
通过数据挖掘模块对用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘,即
所述数据挖掘模块中的广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中
所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
所述步骤S3中将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息的方法包括:通过数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储,以供数据营销使用。
以下通过具体的实例对上述实施例1和实施例2的工作过程进行详细描述。
参照图1所示,本发明共包括三个模块,即数据采集筛选模块、数据挖掘模块和数据聚合模块。
具体用例步骤如下:
通过数据采集筛选模块例如接入外部CRM系统CRM数据,其通过自身的一些手段或线下活动等收录到了一些用户资料,例如但不限于包括:
姓名:王二丫、性别:女、年龄:31、电话:139XXXXXXXX 、座驾:路虎。
例如接入外部电商系统的电商数据,其可能会提供两部分数据,一部分数据为用户注册数据:姓名:王二丫 、性别:女、邮箱:wangerya@126.com、电话:139XXXXXXXX 、用户唯一标示(CookieID、IMEI、设备ID、MAC、IP等);另一部分用户行为数据:奶粉、尿布、财经类书籍、汽车配件、用户唯一标示(CookieID、IMEI、设备ID、MAC、IP等)
例如接入外部DSP广告投放系统的DSP广告投放数据,其提供用户关注广告行为数据:汽车、母婴、奢侈品、用户唯一标示(CookieID、IMEI、设备ID、MAC、IP等)。
所述数据采集筛选模块包括:数据采集子模块、数据清洗子模块、基本数据存储子模块和原始行为数据存储子模块;其中
数据清洗子模块对以上各系统数据进行清洗,过滤去除垃圾数据,并把已经明确的用户基本信息数据单独存储以备后用,另外把用户行为数据(用户广告行为数据、用户购物行为数据,上述数据也均包括用户唯一标示)发送给数据挖掘模块进行数据挖掘。
数据挖掘模块的具体用例步骤如下:
所述数据挖掘模块中的数据建模子模块,设计并创建数据模型。
广告投放数据挖掘通道中的数据建模子模块包括:
用户性别判断模型:当用户明确标示为女性、或者设备上安装女性App超过5款时定义该用户为女性、或者长期购买女性产品等等综合评判互补来确定该用户为女性用户;
用户职业及单位地址判断模型:当发现用户在上班时间高频出现在某一位置,就可以定义该用户的公司地址还有该人员为务工者;
用户住址判断模块:当发现用户在休息时间高频出现在某一位置就可以定义该用户的家庭地址;
用户爱好判断模型:当用发现用户特别关注高档红酒、咖啡、手表、包等奢侈品。
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
用户年龄及生育判断模型:根据用户购买尿不湿、奶粉记录,可以标识该用户已婚、育儿、大致年龄段;
用户车辆判断模型:根据用户购买汽车配件,可以标识用户有车。
通过相应特征运算子模块分别对用户关注广告和购物的行为数据结合上述数据模型进行运算挖掘出用户特征标签(即特征数据)。
用户画像存储子模块,对通过不同数据源挖掘出的用户特征数据进行存储以备后用;其中,存储形式包括:
与广告投放数据挖掘相对应的用户A的局部画像一:
性别:女
爱好:红酒、名表、名包、奢侈品
工作地址:杭州西湖区
家庭地址:杭州上城区
用户A唯一标示: CookieID、设备ID、MAC、IMEI、IP
与电商数据挖掘相对应的用户A的局部画像二:
婚否:已婚
子女:育儿
年龄:25~35
座驾:有车
用户A唯一标示:CookieID、设备ID、MAC、IMEI、IP
数据聚合模块适于接收基本数据存储子模块存储的用户基本标签信息,以及用户画像子模块存储的由用户行为分析得出的用户特征数据信息,根据用户各唯一标示数据(例如:cookieID、设备ID、MAC、IMEI、IP等设备标示信息,手机号、邮箱等用户标示信息)进行匹配运算把不同数据来源得出的用户信息串起来,即实现匹配,形成全方位用户画像信息存储以供数据营销使用。
具体用例步骤如下:
数据聚合模块结合之前各步骤分析出来的用户局部的特征标签(即特征数据):
1、用户基本数据:姓名:王二丫 、性别:女 、年龄:31 、电话:139XXXXXXXX 、座驾:路虎;
2、用户注册信息:姓名:王二丫 、性别:女、邮箱:wangerya@126.com、电话:139XXXXXXXX 、用户唯一标示(CookieID、IMEI、设备ID、MAC、IP等);
3、用户A的局部画像一: 性别:女,爱好:红酒、名表、名包、奢侈品,工作地址:杭州西湖区,家庭地址:杭州上城区,用户A唯一标示:CookieID、设备ID、MAC、IMEI、IP;
4、用户A的局部画像二:婚否:已婚,子女:育儿,年龄:25~35,座驾:有车,用户A唯一标示: CookieID、设备ID、MAC、IMEI、IP;
根据用户设备唯一标示CookieID、IMEI、设备ID、MAC、IP等以及用户手机号、邮箱等,以上每个特征信息块不一定每个唯一标示都有,或仅通过IMEI号,或仅设备ID,或仅MAC地址,即只要具备其中一个唯一标示就可以通过匹配运算比对把这些数据串联起来。
最终得到用户A画像信息,即全方位用户画像信息:
姓名:王二丫
性别:女
邮箱:wangerya@126.com
电话:139XXXXXXXX
年龄:25~35
婚否:已婚
子女:育儿
座驾:路虎
爱好:红酒、名表、名包、奢侈品
工作地址:杭州西湖区 家庭地址:杭州上城区
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (10)

1.一种数据分析系统,其特征在于,包括:
数据采集筛选模块,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
数据挖掘模块,对用户行为数据进行挖掘,以获得用户特征数据;以及
数据聚合模块,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
2.根据权利要求1所述的数据分析系统,其特征在于,
所述数据采集筛选模块包括:数据采集子模块、数据清洗子模块、基本数据存储子模块和原始行为数据存储子模块;其中
所述数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储。
3.根据权利要求2所述的数据分析系统,其特征在于,
各个企业和/或商家数据包括:DSP广告投放数据、电商数据和CRM数据;
用户基本数据包括:姓名、电话、邮箱、年龄,以及用户唯一标示;
用户行为数据包括:用户广告行为数据、用户购物行为数据。
4.根据权利要求3所述的数据分析系统,其特征在于,
所述数据挖掘模块包括:广告投放数据挖掘通道和电商数据挖掘通道,且适于根据用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘。
5.根据权利要求4所述的数据分析系统,其特征在于,
所述广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中
数据建模子模块收录不同的数据模型规则以提供给特征运算子模块进行运算,以挖掘出用户特征数据,并由用户画像存储子模块进行存储,即
所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
6.根据权利要求5所述的数据分析系统,其特征在于,
所述数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储。
7.一种数据分析方法,其特征在于,包括如下步骤:
步骤S1,将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储;
步骤S2,对用户行为数据进行挖掘,以获得用户特征数据;以及
步骤S3,将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息。
8.根据权利要求7所述的数据分析方法,其特征在于,
所述步骤S1中将获得的不同来源的用户数据进行筛选划分为用户基本数据、用户行为数据进行存储的方法包括:
通过一数据采集子模块接收来自各个企业和/或商家数据,并传送给数据清洗子模块进行数据清洗处理,在过滤多余数据和垃圾数据后,把用户基本数据传送给基本数据存储子模块进行存储,并把用户行为数据传送给原始行为数据存储子模块进行存储;其中
各个企业和/或商家数据包括:DSP广告投放数据、电商数据和CRM数据;
用户基本数据包括:姓名、电话、邮箱和年龄;
用户行为数据包括:用户广告行为数据、用户购物行为数据。
9.根据权利要求8所述的数据分析方法,其特征在于,
所述步骤S2中对用户行为数据进行挖掘,以获得用户特征数据的方法包括:
通过数据挖掘模块对用户广告行为数据、用户购物行为数据分别进行特征运算,以进行广告投放数据挖掘、电商数据挖掘,即
所述数据挖掘模块中的广告投放数据挖掘通道和电商数据挖掘通道均包括:数据建模子模块、特征运算子模块、用户画像存储子模块;其中
所述广告投放数据挖掘通道中的数据建模子模块包括:用户性别判断模型、用户职业及单位地址判断模型、用户住址判断模块和用户爱好判断模型;
所述电商数据挖掘通道中的数据建模子模块包括:用户年龄及生育判断模型,用户车辆判断模型;
所述广告投放数据挖掘通道和电商数据挖掘通道中的相应特征运算子模块分别通过上述各模型进行运算挖掘以获得广告投放用户特征数据和电商购物用户特征数据,并存入相应用户画像存储子模块中。
10.根据权利要求9所述的数据分析方法,其特征在于,
所述步骤S3中将用户基本数据与用户特征数据进行匹配,以获得全方位用户画像信息的方法包括:
通过数据聚合模块适于接收基本数据存储子模块存储的用户基本数据,以及相应用户画像子模块存储的相应用户特征数据,并与用户各唯一标示数据进行匹配,形成全方位用户画像信息存储,以供数据营销使用。
CN201611264025.8A 2016-12-30 2016-12-30 一种数据分析系统及方法 Pending CN107193855A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611264025.8A CN107193855A (zh) 2016-12-30 2016-12-30 一种数据分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611264025.8A CN107193855A (zh) 2016-12-30 2016-12-30 一种数据分析系统及方法

Publications (1)

Publication Number Publication Date
CN107193855A true CN107193855A (zh) 2017-09-22

Family

ID=59871223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611264025.8A Pending CN107193855A (zh) 2016-12-30 2016-12-30 一种数据分析系统及方法

Country Status (1)

Country Link
CN (1) CN107193855A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304557A (zh) * 2018-02-07 2018-07-20 霍尔果斯智融未来信息科技有限公司 一种多人协作数据挖掘方法
CN108416620A (zh) * 2018-02-08 2018-08-17 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台
CN109241758A (zh) * 2018-08-30 2019-01-18 安阳工学院 一种采用计算机验证码技术的大数据分析系统
CN109345293A (zh) * 2018-09-17 2019-02-15 上海宝尊电子商务有限公司 一种面向品牌电商的大数据信息服务方法和系统
CN109451423A (zh) * 2018-11-14 2019-03-08 重庆雾都科技有限公司 一种精确营销的智能盒子
CN109615432A (zh) * 2018-12-14 2019-04-12 成都德迈安科技有限公司 基于大数据的消费者行为画像工具
CN110109961A (zh) * 2019-05-10 2019-08-09 宜信博诚保险销售服务(北京)股份有限公司 用户画像获取方法及装置、用户需求获取方法及装置
CN110213202A (zh) * 2018-03-01 2019-09-06 腾讯科技(深圳)有限公司 标识加密匹配方法和装置、标识处理方法和装置
CN110223104A (zh) * 2019-05-11 2019-09-10 浙江华坤道威数据科技有限公司 一种基于大数据的客户模型构建系统
CN110533477A (zh) * 2019-09-03 2019-12-03 互动创想(厦门)数字科技有限公司 一种基于大数据的智能分析方法及系统
WO2020015594A1 (zh) * 2018-07-20 2020-01-23 京东数字科技控股有限公司 信息修复方法、装置、电子设备及计算机可读介质
CN110910163A (zh) * 2019-10-25 2020-03-24 北京人和易行科技有限公司 基于客户关系管理系统的汽配客户需求分析方法及系统
CN112364222A (zh) * 2021-01-13 2021-02-12 北京云真信科技有限公司 一种用户年龄的区域画像方法、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039022A2 (en) * 1999-11-22 2001-05-31 Avenue A, Inc. Targeting electronic advertising placement in accordance with an analysis of user inclination and affinity
US20130138507A1 (en) * 2011-11-30 2013-05-30 Amit Kumar Predictive modeling for e-commerce advertising systems and methods
CN103177380A (zh) * 2013-02-26 2013-06-26 北京集奥聚合科技有限公司 结合用户群与预投放的广告投放效果的优化方法和装置
CN105959745A (zh) * 2016-05-25 2016-09-21 北京铭嘉实咨询有限公司 广告投放方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039022A2 (en) * 1999-11-22 2001-05-31 Avenue A, Inc. Targeting electronic advertising placement in accordance with an analysis of user inclination and affinity
US20130138507A1 (en) * 2011-11-30 2013-05-30 Amit Kumar Predictive modeling for e-commerce advertising systems and methods
CN103177380A (zh) * 2013-02-26 2013-06-26 北京集奥聚合科技有限公司 结合用户群与预投放的广告投放效果的优化方法和装置
CN105959745A (zh) * 2016-05-25 2016-09-21 北京铭嘉实咨询有限公司 广告投放方法和系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304557A (zh) * 2018-02-07 2018-07-20 霍尔果斯智融未来信息科技有限公司 一种多人协作数据挖掘方法
CN108416620A (zh) * 2018-02-08 2018-08-17 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台
CN108416620B (zh) * 2018-02-08 2022-02-22 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台
CN110213202B (zh) * 2018-03-01 2021-10-15 腾讯科技(深圳)有限公司 标识加密匹配方法和装置、标识处理方法和装置
CN110213202A (zh) * 2018-03-01 2019-09-06 腾讯科技(深圳)有限公司 标识加密匹配方法和装置、标识处理方法和装置
CN110738558B (zh) * 2018-07-20 2024-03-05 京东科技控股股份有限公司 信息修复方法、装置、电子设备及计算机可读介质
CN110738558A (zh) * 2018-07-20 2020-01-31 京东数字科技控股有限公司 信息修复方法、装置、电子设备及计算机可读介质
WO2020015594A1 (zh) * 2018-07-20 2020-01-23 京东数字科技控股有限公司 信息修复方法、装置、电子设备及计算机可读介质
CN109241758A (zh) * 2018-08-30 2019-01-18 安阳工学院 一种采用计算机验证码技术的大数据分析系统
CN109345293A (zh) * 2018-09-17 2019-02-15 上海宝尊电子商务有限公司 一种面向品牌电商的大数据信息服务方法和系统
CN109451423A (zh) * 2018-11-14 2019-03-08 重庆雾都科技有限公司 一种精确营销的智能盒子
CN109615432A (zh) * 2018-12-14 2019-04-12 成都德迈安科技有限公司 基于大数据的消费者行为画像工具
CN110109961A (zh) * 2019-05-10 2019-08-09 宜信博诚保险销售服务(北京)股份有限公司 用户画像获取方法及装置、用户需求获取方法及装置
CN110223104A (zh) * 2019-05-11 2019-09-10 浙江华坤道威数据科技有限公司 一种基于大数据的客户模型构建系统
CN110533477A (zh) * 2019-09-03 2019-12-03 互动创想(厦门)数字科技有限公司 一种基于大数据的智能分析方法及系统
CN110910163A (zh) * 2019-10-25 2020-03-24 北京人和易行科技有限公司 基于客户关系管理系统的汽配客户需求分析方法及系统
CN112364222B (zh) * 2021-01-13 2021-04-27 北京云真信科技有限公司 一种用户年龄的区域画像方法、计算机设备及存储介质
CN112364222A (zh) * 2021-01-13 2021-02-12 北京云真信科技有限公司 一种用户年龄的区域画像方法、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107193855A (zh) 一种数据分析系统及方法
Zhen et al. Associations between online purchasing and store purchasing for four types of products in Nanjing, China
Walker et al. Do residents of food deserts express different food buying preferences compared to residents of food oases? A mixed-methods analysis
Zhai et al. Mapping the popularity of urban restaurants using social media data
Ferrell Home-based teleshoppers and shopping travel: Do teleshoppers travel less?
Chu et al. Transnational tobacco industry promotion of the cigarette gifting custom in China
Quan et al. Spatial and human crowdedness, time pressure, and Chinese traveler word-of-mouth behaviors for Korean restaurants
CN106844372A (zh) 一种物流信息查询方法和装置
US9684912B2 (en) Proxy shopping registry
Sullivan et al. Clothing retail channel use and digital behavior: Generation and gender differences
CN102236711A (zh) 一种用于确定推广关键词所对应的展现信息的方法与设备
Turoń Social barriers and transportation social exclusion issues in creating sustainable car-sharing systems.
Mahipal et al. E-commerce Growth in India: A study of Segments Contribution
CN108053323A (zh) 服务方案生成的方法、装置、计算机设备及存储介质
Segura et al. Data of collaborative consumption in online food delivery services
Verhetsel et al. Regional retail landscapes emerging from spatial network analysis
Collet Household car use in France: a demographic and economic analysis
CN116523069A (zh) 基于联邦建模的优惠券推送方法及装置
JP2018045288A (ja) 広告配信プログラム、広告配信システム及び広告配信方法
CN106055682A (zh) 一种具有专利分析、交易且可网上交年费的知识产权智能系统
CN108053238A (zh) 面向公交车身广告投放线路定制方法、装置及电子设备
Liao et al. Research on app intelligent promotion decision aiding system based on python data analysis and aarrr model
CN108280727A (zh) 一种微分销一体化平台系统
Kim Implementing a sustainable decision-making environment-cases for GIS, BIM, and big data utilization
Yahya On-Foot hyperlocal delivery-an overview, challenges, and opportunities: case studies in Korea

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170922