CN107038237A - 基于大数据的用户画像系统及画像方法 - Google Patents

基于大数据的用户画像系统及画像方法 Download PDF

Info

Publication number
CN107038237A
CN107038237A CN201710253481.0A CN201710253481A CN107038237A CN 107038237 A CN107038237 A CN 107038237A CN 201710253481 A CN201710253481 A CN 201710253481A CN 107038237 A CN107038237 A CN 107038237A
Authority
CN
China
Prior art keywords
user
data
website
portrait
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710253481.0A
Other languages
English (en)
Inventor
胡国龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunshan Several Thai Data Technology Co Ltd
Original Assignee
Kunshan Several Thai Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunshan Several Thai Data Technology Co Ltd filed Critical Kunshan Several Thai Data Technology Co Ltd
Priority to CN201710253481.0A priority Critical patent/CN107038237A/zh
Publication of CN107038237A publication Critical patent/CN107038237A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于大数据、数据挖掘、人工智能、商业智能领域,公开了一种基于大数据的用户画像系统及画像方法。系统包括“用户关联模块”、“用户画像模块”。用户关联模块由用户数据处理单元,网站数据处理单元,数据匹配单元组成。用户数据处理单元产生的用户数据与网站数据处理单元产生的网站数据,两份数据经过数据匹配单元处理,完成用户唯一上网识别号与网站账号匹配。用户精准画像模块由网站数据爬取单元,文本数据处理单元,用户标签单元组成。网站数据爬取单元爬取网站的具体内容,给文本数据处理单元,提取出用户感兴趣的具体方面。用户标签单元,给用户打标签,完成用户精准画像。

Description

基于大数据的用户画像系统及画像方法
技术领域
本发明涉及一种基于大数据的用户画像系统及画像方法, 属于大数据、数据挖掘、人工智能、商业智能领域。
背景技术
大数据的核心是数据蕴含的价值,如何从海量数据中挖掘从商业价值是大数据、商业智能的关键所在。目前,大数据的应用很广泛。
大数据在医疗行业的应用,主要在下面几个方面,新药品效果的预测建模、提高临床试验设计的统计工具和算法、临床实验数据的分析、个性化治疗。这几个方面应用的前提,是有海量的真实患者数据。患者患病的机理与原因、患者患病的症状、患者对药物的反应、治疗方案对患者的效果、患者的后期康复治疗等患者相关数据,是做医疗大数据必不可少的生产资料。
大数据在金融行业的应用比较成功与广泛,综合起来,主要应用在如下几个方面,客户画像、精准营销、风险管控。客户画像又分为个人客户画像、企业(单位)客户画像,个人客户画像包括人口统计学特征、消费能力数据、兴趣数据、风险偏好等;企业客户画像包括企业的生产、流通、运营、财务、销售和客户数据、相关产业链上下游等数据。在客户画像的基础上银行可以有效的开展精准营销,包括,贷款额度、信用等级、理财产品、流失预警及留客策略等。风险管控,包括个人贷款风险评估、中小企业贷款风险评估和欺诈交易识别等手段。其中客户画像是核心与基础,精准营销与风险管控是在客户画像完成的基础上进行的。
电商为代表的行业已经在利用大数据掘金,主要是因为电商本身就拥有大量的消费者行为记录,能够依据这些数据快速了解消费者的需求。如何快速、准确地帮助顾客找到想要的商品,如何加大商品的有效曝光度如何根据顾客的需求,向其推荐偏好的商品,如何提高顾客的活跃度,降低顾客的弃单率,核心是消费者网上消费行为数据,它已经变得越来越重要,收集并分析这些消费者数据,将帮助商家预测顾客的下一步购物行为。利用顾客留在网站上的行为轨迹数据,分析顾客浏览商品类别,可以帮助商家预测顾客需要哪类商品,并推出相应的相关商品:根据顾客询价情况,商家还可以预测顾客购买力,从而对高级顾客推荐名牌商品,对普通顾客推荐物美价廉的商品,以满足不同的顾客对商品的不同心理价位;跟踪顾客经常购物的网店,对此类数据进行分析,可以预测用户的下一次购物行为将可能发生在哪个网店。
全球大的运营商中约有超过一半的运营商正在实施大数据业务。商业应用集中在两方面,市场与精准营销与数据商业化。市场与精准营销方向包括客户画像、精准营销、实时营销和个性化推荐。其中客户画像是基础,运营商可以基于客户终端信息、位置信息、通话行为、手机上网行为轨迹等丰富的数据,为每个客户打上人口统计学特征、消费行为、上网行为和兴趣爱好标签,并借助数据挖掘技术(如分类、聚类、RFM等)进行客户分群,完善客户的360度画像,帮助运营商深入了解客户行为偏好和需求特征。数据商业化方面对外(各行业的商家)提供营销洞察和精准广告投放。电信运营商分析用户线上(上网)行为大数据,给用户打标签、完成用户画像后。把这些数据提供给各行业的商家,各商家利用这些数据获得客户,比如提供数据给教育行业,教育行业利用这些数据获取学员、学生。提供给汽车商、4S店经销商,有购车需求的用户及联系方式,商家根据信息联系用户,完成售车。
大数据在医疗、金融、电商、电信应用的基础是获得足够多用户与获得用户足够全数据。医疗大数据,需要足够多患者全面的资料。金融大数据需要对用户做精确的画像,特别是资产、信用、消费能力等方面。电商大数据建立在海量消费者网上全面的消费行为数据。各行业大数据应用需要获得足够多用户与获得用户足够全数据(用户全面、及时更新的精确画像)。目前,2016年6月,我国网上用户(包括有线宽带用户与移动互联网用户)达到7.1亿,毫无疑问是海量用户与用户足够全数据(用户全面、及时更新的精确画像)的主要来源。所以,如何获得足够多用户与获得用户足够全数据将成为应用成功的关键。
发明内容
针对现有技术存在的问题,本发明针对网上用户(包括有线宽带用户与移动互联网用户)提供了一种基于大数据的用户唯一上网识别号与网站账号关联的方法,将解决如何获得足够多用户与获得用户足够全数据(用户全面、及时更新的精确画像)的问题。
本发明的上述技术问题主要是通过下述技术方案实现的:
一种基于大数据的用户画像系统,系统主要包括“用户关联模块”、“用户画像模块”。
用户关联模块,由三个独立单元组成,用户数据处理单元,网站数据处理单元以及数据匹配单元。
用户处理单元用于处理用户数据,该数据由数据提供商提供(数据提供商为电信运营商或者第三方数据提供商),该数据主要由用户唯一上网识别号、用户点击的ts(时间戳)、用户点击的url(统一资源定位器)等组成。这些数据量很大,每天有数个TB的数据。从这些数据中目标网站数据,选择url来自一些大型的论坛网站,比如天涯、猫扑、豆瓣等,还可以选择专业网站比如“汽车之家”——汽车类、“我你在一起”——患病患者类等。再对选择出来的用户数据按照url与ts进行排序。再对排序的结果数据进行处理,如果相同url有多条记录,取ts最小的那条。这些被选取出来的记录组成一个新的用户数据集。
网站数据处理单元用来处理网站数据,主要包括网站的帖子、文章、评论等数据,通过爬虫软件爬取。爬虫爬取上面提到网站(天涯、猫扑、豆瓣、我你在一起、汽车之家等)的帖子、文章、评论的url、发布时间,用户的网站账号。发布时间的格式通常是年月日时分秒,需要转换成时间戳(ts)。处理后的数据结构是——帖子、文章、评论等的url,发布的时间戳,网站账号。
数据匹配单元用来完成用户唯一上网识别号与网站账号的算法匹配,电信运营商或者第三方提供的用户数据和网站数据(网站的帖子、文章、评论等数据),找出这两份数据中相同url的记录。再比较两条记录中的ts是否相等,如果相等,则认为该网站账号属于该用户唯一上网识别号。一个用户唯一上网识别号可以拥有多个网站账号。
用户画像模块,用于对用户进行精准画像,由三个独立单元组成,网站数据爬取单元,文本数据处理单元,用户标签单元。
网站数据爬取单元,在用户关联模块完成关联匹配的基础上进行。需要借助爬虫软件获取帖子、文章、评论的内容。爬虫爬取上面提到网站(天涯、猫扑、豆瓣、我你在一起、汽车之家等)的帖子、文章、评论的内容,发布的网站账号,发布时间。
文本数据处理单元处理过程如下,网站数据爬取单元获取的数据后,按照用户唯一上网识别号进行处理,把与同一个用户唯一上网识别号对应的网站账号所发布网站发布帖子、文章、评论的内容筛选出来,作为一个数据集。首先对数据集进行分词处理。再利用分词结果进行分类处理,识别出用户关注哪一领域(即用户的兴趣点),比如:医疗、金融、购物、汽车、房产等。在进行关键词提取,提取出用户感兴趣的具体方面,比如,医疗领域的肠胃、高血压等,汽车领域的宝马、奔驰等。
用户标签单元主要给用户打标签,最终完成精准画像。文本数据处理单元处理后,获得用户的关注点。利用这些关注点,给用户打上标签,比如:医疗、健康方面:身体健康,金融方面:高收入、有多套房产,汽车方面:捷豹一辆、现关注宝马,购物方面:消费品牌的列表等。精准画像后,可以在各行各业的应用了。
本发明的有益效果是:通过用户关联模块将用户数据和网站数据进行关联,再对关联后得到的数据集进行分析,最终得到用户的精准画像。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中用户数据和网站数据的关联图;
图2为本发明中用户画像流程图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
参照图1-图2所示,基于大数据的用户画像系统,包括:
“用户关联模块”、“用户画像模块”。用户关联模块如图1所示,包括用户数据处理单元,网站数据处理单元以及数据匹配单元。
用户数据处理单元处理用户数据主要包括:
101:从电信运营商的大数据平台获取用户数据。大数据平台可以是开源的hadoop大数据平台、CDH大数据平台等。电信运营商的用户每天生产的海量数据,主要包括用户的网上行为等数据,由用户唯一上网识别号、用户点击的时间戳(ts,timestamp)、用户点击的url(Uniform Resoure Locator,统一资源定位器)、用户IP等组成。
102:从电信运营商的海量用户数据中,提取出来自目标网站的数据,因为原数据集太大,每天有数TB的数据量,几十天可能要PB级数据,需要高配置的硬件资源来处理数据,必须要缩减计算的数据量。
103:如果用户没有点击目标网站的url,则不选取该条记录。
104:如果用户点击了目标网站的url,则选取该条记录,作为后面使用的数据集。
105:对数据集104按照url与ts进行排序的结果。
106:对排序的结果进行选择,选择的规则是相同url,取点击ts最小(ts越小,时间约早)的一条。目的是找出,最早点击网站的帖子、文章、评论url的用户唯一上网识别号。107:如果相同url里面,取点击ts不是最小,则不选择该条记录。
108:如果相同url里面,取点击ts最小,则选择该条记录。
网站数据处理单元对网站的帖子、文章、评论等数据处理,目的是获取目标网站的url信息与步骤108中得到的数据匹配,主要包括:
109:通过爬虫软件爬取目标网站的url信息。爬虫可以采用基于Python的scrapy框架,该框架目前比较成熟与主流。主要获取的数据结构如
110:获取目标网站发布数据中的帖子、文章、评论的url、发布时间,网站账号。
111:将发布时间的格式年月日时分秒,转换成时间戳。处理后的数据结构是——帖子、文章、评论等的url,发布的时间戳,网站账号。
数据匹配单元主要用于完成电信运营商或者第三方提供的用户数据处理单元的结果数据与网站的帖子、文章、评论等数据处理单元结果数据的算法匹配,包括:
112:把电信运营商或者第三方提供的用户数据处理单元的结果数据,网站的帖子、文章、评论等数据处理单元的结果数据,找出这两份数据中相同url的记录。合并成新的数据集
113:生成用户唯一上网识别号、url、点击ts时间戳、发布ts时间戳、网站账号这样的数据结构。
114:判断点击ts时间戳与发布ts时间戳是否相等。
115:点击ts时间戳与发布ts时间戳不相等,则丢弃,匹配不成功。
116:点击ts时间戳与发布ts时间戳相等,匹配成功。
用户画像模块如图2所示。由三个独立单元组成,网站数据爬取单元,文本数据处理单元,用户标签单元。
网站数据爬取单元主要用来爬取网站的具体内容,包括:
201:爬虫爬取目标网站帖子、文章、评论等的内容,采用的技术与步骤109一样,爬取的商户与步骤109有区别,步骤109是爬取目标网站帖子、文章、评论等url信息。此处是爬取帖子、文章、评论里面的内容。
202:获取网站数据,数据结构为:目标网站帖子、文章、评论的网站账号、内容、发布时间。
文本数据处理单元是用户画像模块核心,完成网站数据爬取单元获取数据的算法处理。
203:对202得到数据,按照用户唯一上网识别号对应的网站账号,筛选出网站发布帖子、文章、评论的内容,作为一个数据集。
204:对203得到数据集进行分词处理,可采用开源的分词工具如:jieba分词、Scikit-Learning、ansj,这些分析工具都自带有分词词库。分词的结果如204所示。
205:对204的分词结果进行分类处理,识别出用户关注哪一领域。可以采用朴素贝叶斯、kNN最近邻、SVM支持向量机等算法进行分类。
206:进行关键词提取,提取出用户感兴趣的具体方面。可以采用权重策略的TF-IDF算法,提取关键词。
用户标签单元的处理,包括:
207给用户打标签,最终完成精准画像。文本数据处理单元处理后,获得用户的关注点。利用这些关注点,给用户打上标签。文本数据处理单元得到的结果,作为用户标签单元的输入。可以通过分类算法:逻辑回归、决策所、朴素贝叶斯、kNN最近邻、SVM支持向量机、神经网络等给用户打上最终的标签,实现精准画像。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。

Claims (8)

1.基于大数据的用户画像系统,其特征在于,包括:
用户关联模块,用以将用户数据和网站数据进行关联;
用户画像模块,用于对用户进行精准画像;
所述用户关联模块包括用户数据处理单元、网站数据处理单元以及数据匹配单元;
所述用户画像模块包括网站数据爬取单元、文本数据处理单元以及用户标签单元。
2.一种基于大数据的用户画像方法,其特征在于,包括:
用户数据与网站数据关联,具体包括:用户数据处理、网站数据处理,以及用户数据和网站数据的匹配;
用户精准画像,具体包括:网站数据爬取、文本数据处理以及给用户打标签。
3.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述用户数据处理包括:
从数据提供商获取用户行为数据;
从数据提供商提供的用户行为数据中提取目标网站数据;
如何包含有目标网站url的某条记录被用户点击了,则选取该条记录加入数据集,如果包含有目标网站url的记录没有被用户点击则不选取该记录;
对形成的数据集按照url和ts进行排序;
对排序的结果进行选择,当url相同的时候选择ts最小记录得到处理后的用户数据。
4.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述网站数据处理包括:
通过爬虫软件选取目标网站的url信息;
获取目标网站中发布数据的url、发布时间以及账户;
将发布时间转换为时间戳,最终得到处理后的网站数据。
5.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述用户数据和网站数据的匹配包括:
找出处理后的用户数据以及处理后的网站数据之间url相同的记录合并成新的数据集,判断该数据集中的每条记录中的点击ts和发布ts是否相等,若点击ts和发布ts不相等,则丢弃该条记录,匹配不成功;若点击ts和发布ts相等,则保留该条记录,匹配成功。
6.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述网站数据爬取包括:
通过爬虫软件爬取目标网站的文本内容信息,文本内容信息包括帖子、文章以及评论里的内容,还包括发布这些帖子、文章以及评论的账户和发布时间。
7.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述文本数据处理包括:
筛选出网站发布的帖子、文章以及评论的内容,并将其作为一个数据集,对该数据集进行分词处理,再对分词的结果进行分类处理,根据关键字找出用户的关注点。
8.根据权利要求2所述的基于大数据的用户画像方法,其特征在于,所述给用户打标签包括:将文本数据处理后得到的结果通过分类算法计算,给用户打上最终标签,实现精准画像。
CN201710253481.0A 2017-04-18 2017-04-18 基于大数据的用户画像系统及画像方法 Pending CN107038237A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710253481.0A CN107038237A (zh) 2017-04-18 2017-04-18 基于大数据的用户画像系统及画像方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710253481.0A CN107038237A (zh) 2017-04-18 2017-04-18 基于大数据的用户画像系统及画像方法

Publications (1)

Publication Number Publication Date
CN107038237A true CN107038237A (zh) 2017-08-11

Family

ID=59535469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710253481.0A Pending CN107038237A (zh) 2017-04-18 2017-04-18 基于大数据的用户画像系统及画像方法

Country Status (1)

Country Link
CN (1) CN107038237A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992531A (zh) * 2017-11-21 2018-05-04 吉浦斯信息咨询(深圳)有限公司 基于深度学习的新闻个性化智能推荐方法与系统
CN108154395A (zh) * 2017-12-26 2018-06-12 上海新炬网络技术有限公司 一种基于大数据的客户网络行为画像方法
CN108230171A (zh) * 2017-12-26 2018-06-29 爱品克科技(武汉)股份有限公司 一种基于时间节点lda主题算法
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109145307A (zh) * 2018-09-12 2019-01-04 广州视源电子科技股份有限公司 用户画像识别方法、推送方法、装置、设备和存储介质
CN109524066A (zh) * 2018-11-09 2019-03-26 医渡云(北京)技术有限公司 医疗数据处理方法及装置、存储介质和电子设备
CN109615429A (zh) * 2018-12-11 2019-04-12 大象慧云信息技术有限公司 一种基于发票数据的精准广告投放系统及方法
CN109685632A (zh) * 2019-01-22 2019-04-26 重庆建筑工程职业学院 基于互联网的商品自动化共享系统及方法
CN109918508A (zh) * 2019-03-08 2019-06-21 成都场量科技有限公司 基于网络爬虫采集技术的用户画像生成方法
CN110147803A (zh) * 2018-02-08 2019-08-20 北大方正集团有限公司 用户流失预警处理方法与装置
CN110555182A (zh) * 2018-05-31 2019-12-10 中国电信股份有限公司 用户画像的确定方法、装置及计算机可读存储介质
CN111210281A (zh) * 2020-01-21 2020-05-29 重庆知翔科技有限公司 一种房产交易中客户兴趣度统计方法
CN111339402A (zh) * 2020-02-10 2020-06-26 口碑(上海)信息技术有限公司 业务处理方法及装置
CN111597453A (zh) * 2020-03-31 2020-08-28 平安科技(深圳)有限公司 用户画像方法、装置、计算机设备及计算机可读存储介质
CN112001739A (zh) * 2019-05-27 2020-11-27 广东小天才科技有限公司 一种生成用户学习画像的方法和系统
CN112613902A (zh) * 2020-12-15 2021-04-06 航天信息股份有限公司 一种建立用户画像的方法及系统
CN113362162A (zh) * 2021-06-29 2021-09-07 深圳壹账通智能科技有限公司 基于网络行为数据的风控识别方法、装置、电子设备及介质
CN114398560A (zh) * 2022-03-24 2022-04-26 深圳市秦丝科技有限公司 基于web平台的营销界面设置方法、装置、设备及介质
CN116091112A (zh) * 2022-12-29 2023-05-09 江苏玖益贰信息科技有限公司 一种消费者画像生成装置及画像分析方法
CN116805255A (zh) * 2023-06-05 2023-09-26 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199848A (zh) * 2014-08-08 2014-12-10 亿赞普(北京)科技有限公司 一种不同域下用户数据的关联方法和装置
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199848A (zh) * 2014-08-08 2014-12-10 亿赞普(北京)科技有限公司 一种不同域下用户数据的关联方法和装置
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992531A (zh) * 2017-11-21 2018-05-04 吉浦斯信息咨询(深圳)有限公司 基于深度学习的新闻个性化智能推荐方法与系统
CN108154395A (zh) * 2017-12-26 2018-06-12 上海新炬网络技术有限公司 一种基于大数据的客户网络行为画像方法
CN108230171A (zh) * 2017-12-26 2018-06-29 爱品克科技(武汉)股份有限公司 一种基于时间节点lda主题算法
CN108154395B (zh) * 2017-12-26 2021-10-29 上海新炬网络技术有限公司 一种基于大数据的客户网络行为画像方法
CN110147803A (zh) * 2018-02-08 2019-08-20 北大方正集团有限公司 用户流失预警处理方法与装置
CN110147803B (zh) * 2018-02-08 2022-02-18 北大方正集团有限公司 用户流失预警处理方法与装置
CN110555182A (zh) * 2018-05-31 2019-12-10 中国电信股份有限公司 用户画像的确定方法、装置及计算机可读存储介质
CN108897734A (zh) * 2018-06-13 2018-11-27 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN108897734B (zh) * 2018-06-13 2023-08-22 康键信息技术(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109145307B (zh) * 2018-09-12 2022-09-13 广州视源电子科技股份有限公司 用户画像识别方法、推送方法、装置、设备和存储介质
CN109145307A (zh) * 2018-09-12 2019-01-04 广州视源电子科技股份有限公司 用户画像识别方法、推送方法、装置、设备和存储介质
CN109524066A (zh) * 2018-11-09 2019-03-26 医渡云(北京)技术有限公司 医疗数据处理方法及装置、存储介质和电子设备
CN109524066B (zh) * 2018-11-09 2021-01-12 医渡云(北京)技术有限公司 医疗数据处理方法及装置、存储介质和电子设备
CN109615429A (zh) * 2018-12-11 2019-04-12 大象慧云信息技术有限公司 一种基于发票数据的精准广告投放系统及方法
CN109685632A (zh) * 2019-01-22 2019-04-26 重庆建筑工程职业学院 基于互联网的商品自动化共享系统及方法
CN109918508A (zh) * 2019-03-08 2019-06-21 成都场量科技有限公司 基于网络爬虫采集技术的用户画像生成方法
CN112001739A (zh) * 2019-05-27 2020-11-27 广东小天才科技有限公司 一种生成用户学习画像的方法和系统
CN111210281B (zh) * 2020-01-21 2023-07-25 上海克而瑞信息技术有限公司 一种房产交易中客户兴趣度统计方法
CN111210281A (zh) * 2020-01-21 2020-05-29 重庆知翔科技有限公司 一种房产交易中客户兴趣度统计方法
CN111339402A (zh) * 2020-02-10 2020-06-26 口碑(上海)信息技术有限公司 业务处理方法及装置
CN111597453B (zh) * 2020-03-31 2024-05-07 平安科技(深圳)有限公司 用户画像方法、装置、计算机设备及计算机可读存储介质
CN111597453A (zh) * 2020-03-31 2020-08-28 平安科技(深圳)有限公司 用户画像方法、装置、计算机设备及计算机可读存储介质
CN112613902A (zh) * 2020-12-15 2021-04-06 航天信息股份有限公司 一种建立用户画像的方法及系统
CN112613902B (zh) * 2020-12-15 2024-06-07 航天信息股份有限公司 一种建立用户画像的方法及系统
CN113362162A (zh) * 2021-06-29 2021-09-07 深圳壹账通智能科技有限公司 基于网络行为数据的风控识别方法、装置、电子设备及介质
CN114398560A (zh) * 2022-03-24 2022-04-26 深圳市秦丝科技有限公司 基于web平台的营销界面设置方法、装置、设备及介质
CN114398560B (zh) * 2022-03-24 2022-05-27 深圳市秦丝科技有限公司 基于web平台的营销界面设置方法、装置、设备及介质
CN116091112A (zh) * 2022-12-29 2023-05-09 江苏玖益贰信息科技有限公司 一种消费者画像生成装置及画像分析方法
CN116805255B (zh) * 2023-06-05 2024-04-23 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统
CN116805255A (zh) * 2023-06-05 2023-09-26 深圳市瀚力科技有限公司 基于用户画像分析的广告自动优化投放系统

Similar Documents

Publication Publication Date Title
CN107038237A (zh) 基于大数据的用户画像系统及画像方法
Linoff et al. Data mining techniques: for marketing, sales, and customer relationship management
Policarpo et al. Machine learning through the lens of e-commerce initiatives: An up-to-date systematic literature review
US7958012B2 (en) System and method for enabling online research, publication, promotion and management of user goods
Lu et al. BizSeeker: a hybrid semantic recommendation system for personalized government‐to‐business e‐services
Bose et al. Quantitative models for direct marketing: A review from systems perspective
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
CN111784455A (zh) 一种物品推荐方法及推荐设备
US20130204701A1 (en) Apparatus, system and methods for marketing targeted products to users of social media
CN102027500A (zh) 用于目标内容布置的方法与系统
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
CN108614832A (zh) 一种用户个性化商品搜索实现方法及装置
CN112801803B (zh) 一种理财产品推荐方法和装置
CN110992111A (zh) 基于大数据的投保人用户画像挖掘方法
KR101959808B1 (ko) 온라인 통합 관리 시스템
Xuefeng et al. Predicting the final prices of online auction items
Zheng et al. A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy
CN116127184A (zh) 产品的推荐方法及装置、非易失性存储介质、电子设备
Ye et al. Unleashing the Power of Big Data: Designing a Robust Business Intelligence Framework for E-commerce Data Analytics
Kim et al. Predicting online customer purchase: The integration of customer characteristics and browsing patterns
Wei et al. Online shopping behavior analysis for smart business using big data analytics and blockchain security
Cao et al. Big data in marketing & retailing
CN112330426A (zh) 一种产品推荐方法、装置及存储介质
Wasilewski et al. Clustering methods for adaptive e-commerce user interfaces
Behera et al. Machine Learning for Customer Segmentation Through Bibliometric Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170811

RJ01 Rejection of invention patent application after publication