CN108804638A - 构建用户全息画像的方法及装置 - Google Patents
构建用户全息画像的方法及装置 Download PDFInfo
- Publication number
- CN108804638A CN108804638A CN201810565221.1A CN201810565221A CN108804638A CN 108804638 A CN108804638 A CN 108804638A CN 201810565221 A CN201810565221 A CN 201810565221A CN 108804638 A CN108804638 A CN 108804638A
- Authority
- CN
- China
- Prior art keywords
- portrait
- user
- feature
- cold
- various dimensions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种构建用户全息画像的方法及装置包括:对用户的日志数据进行分析,得到多维度特征;根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。本发明使得用户全息画像能够体现用户信息的稳定性和时效性,进而可以为运营商/企业/公司提供足够精准的用户信息以满足快速精准广告投放和个性化推荐需求。
Description
技术领域
本发明实施例涉及大数据领域,尤其涉及一种构建用户全息画像的方法及装置。
背景技术
用户画像,即用户信息标签化,是通过收集与分析用户社会属性、生活习惯、消费行为等主要数据之后,抽象出的用户全貌。用户画像是支撑自动化营销、个性化推荐等大数据应用的基本方式,可为运营商/企业/公司提供了足够的信息基础以实现快速精准广告投放和个性化推荐,因而广泛应用于电子商务、社交网络、广告等自动化营销和个性化推荐系统。
现有的用户画像构建方法中,一般直接基于对用户日志数据分析获得的多维度特征构建用户画像。这种方法构建的用户画像虽然能够从多维度描述用户信息,但不能体现用户信息的稳定性和时效性,从而导致为运营商/企业/公司提供的信息不够精准,难以满足快速精准广告投放和个性化推荐需求。
发明内容
本发明实施例提供一种构建用户全息画像的方法及装置,用以解决现有用户画像构建方法不能体现用户信息的稳定性和时效性,从而导致为运营商/企业/公司提供的信息不够精准,难以满足快速精准广告投放和个性化推荐需求的问题。
本发明实施例提供一种构建用户全息画像的方法,包括:对用户的日志数据进行分析,得到多维度特征;根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
本发明实施例提供一种构建用户全息画像的装置,包括:多维度特征获取模块、分类模块和构建模块;所述多维度特征获取模块,用于对用户的日志数据进行分析,得到多维度特征;所述分类模块,用于根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;所述构建模块,用于基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
本发明实施例提供一种构建用户全息画像的设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于所述管理设备与显示装置的通信设备之间的信息传输;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上所述的方法。
本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上所述的方法。
本发明实施例提供的构建用户全息画像的方法及装置,通过根据稳定性和时效性,将所述多维度特征进行分类,使得得到的用户的冷特征、温特征和热特征能够体现用户信息的稳定性和时效性,并基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像,使得用户全息画像能够体现用户信息的稳定性和时效性,进而可以为运营商/企业/公司提供足够精准的用户信息以满足快速精准广告投放和个性化推荐需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明构建用户全息画像的方法实施例流程图;
图2为本发明构建用户全息画像的装置实施例结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种构建用户全息画像的方法,包括:101、对用户的日志数据进行分析,得到多维度特征;102、根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;103、基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
在本实施例中,用户的日志数据通常会包含许多用户信息,例如,性别、年龄、兴趣爱好、家庭状态、朋友圈、地理位置和时间等。通过对用户的日志数据进行分析,可以得到包含基本特征、偏好特征、社会特征、消费特征和环境特征的多维度特征。其中,基本特征可以包括:性别、年龄、地域、教育水平、出生日期、职业、星座、机型、婚姻状况以及是否有小孩或几个小孩;偏好特征可以包括:兴趣爱好(如:体育、明星和游戏等)、产品偏好、品牌偏好、衣食住行偏好;社会特征可以包括:家庭状态、朋友圈(如同学、同事和朋友等);消费特征可以包括:收入状况、购买力水平、已购商品、购买渠道偏好以及购买频次;环境特征可以包括:地理位置、时间(如:早、中、晚、工作日和节假日等)、天气(如:多云、晴、暴雨、雪和大风等)、网络(如:2G、3G和Wifi等)。
上述特征中,有些特征具有相对稳定性,如:性别、年龄、星座、职业等,将这些基本固定的特征分类为冷特征,用于后续构建用户冷画像;有些特征具有一定时效性,例如用户的近期行为,将这些能够表征用户近期信息的特征分类为温特征,用于后续构建用户温画像;有些特征具有实时性且不稳定,如用户所处的位置、时间和天气等,将这些能够实时表征用户状态的特征分类为热特征,用于后续构建用户热画像。
本发明实施例提供的构建用户全息画像的方法,通过根据稳定性和时效性,将所述多维度特征进行分类,使得得到的用户的冷特征、温特征和热特征能够体现用户信息的稳定性和时效性,并基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像,使得用户全息画像能够体现用户信息的稳定性和时效性,进而可以为运营商/企业/公司提供足够精准的用户信息以满足快速精准广告投放和个性化推荐需求。
作为一种可选实施例,所述对用户的日志数据进行分析,得到多维度特征,具体包括:基于分布式计算框架,对用户的历史日志数据进行离线分析,获取用户的历史多维度特征;基于分布式流式计算,对用户的当前日志数据进行在线分析,获取用户的当前多维度特征;将所述历史多维度特征和所述当前多维度特征作为所述多维度特征。
在本实施例中,历史日志数据为用户历史操作产生的数据,已存放于相应位置。对用户的历史日志数据进行分析,需将历史日志数据加载到分布式数据存储平台(如HadoopHDFS)中,基于分布式计算框架(如Hadoop MapReduce),进行离线分析处理。当前日志数据为用户当前操作产生的数据,需立即获取并进行分析。对用户的当前日志数据进行分析,需将当前日志数据均匀同步到分布式消息队列集群(如Apache Kafka),通过分布式流计算平台(如Apache Storm)实时从分布式消息队列集群中读取数据并进行实时分析处理。
作为一种可选实施例,所述根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征,具体包括:根据稳定性和时效性,将所述多维度特征中基本稳定的特征作为冷特征、近期产生的特征作为温特征以及实时产生且场景变化明显的特征作为热特征。
作为一种可选实施例,所述多维度特征均至少包括:基本特征、偏好特征、社会特征、消费特征和环境特征。
作为一种可选实施例所述基本特征包括:性别、年龄、地域、教育水平、出生日期、职业、星座、机型、婚姻状况、是否有小孩几个;
所述偏好特征包括:兴趣爱好(体育、明星、游戏)、产品偏好、品牌偏好、衣食住行偏好;
所述社会特征包括:家庭状态、朋友圈(同学、同事、朋友);
所述消费特征包括:收入状况、购买力水平、已购商品、购买渠道偏好、购买频次;
所述环境特征包括:地理位置、时间(早、中、晚、工作日、节假日)、天气(多云、晴、暴雨、雪、大风)、网络(2G、3G、Wifi)。
如图2所示,本发明实施例提供一种构建用户全息画像的装置,包括:多维度特征获取模块21、分类模块22和构建模块23;所述多维度特征获取模块21,用于对用户的日志数据进行分析,得到多维度特征;所述分类模块22,用于根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;所述构建模块23,用于基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
本发明实施例提供的构建用户全息画像的装置,通过根据稳定性和时效性,将所述多维度特征进行分类,使得得到的用户的冷特征、温特征和热特征能够体现用户信息的稳定性和时效性,并基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像,使得用户全息画像能够体现用户信息的稳定性和时效性,进而可以为运营商/企业/公司提供足够精准的用户信息以满足快速精准广告投放和个性化推荐需求。
本发明实施例提供一种构建用户全息画像的设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述各方法实施例所提供的方法,例如包括:101、对用户的日志数据进行分析,得到多维度特征;102、根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;103、基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:101、对用户的日志数据进行分析,得到多维度特征;102、根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;103、基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种构建用户全息画像的方法,其特征在于,包括:
对用户的日志数据进行分析,得到多维度特征;
根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;
基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
2.根据权利要求1所述的方法,其特征在于,所述对用户的日志数据进行分析,得到多维度特征,具体包括:
基于分布式计算框架,对用户的历史日志数据进行离线分析,获取用户的历史多维度特征;
基于分布式流式计算,对用户的当前日志数据进行在线分析,获取用户的当前多维度特征;
将所述历史多维度特征和所述当前多维度特征作为所述多维度特征。
3.根据权利要求1所述的方法,其特征在于,所述根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征,具体包括:
根据稳定性和时效性,将所述多维度特征中基本稳定的特征作为冷特征、近期产生的特征作为温特征以及实时产生且场景变化明显的特征作为热特征。
4.根据权利要求2所述的方法,其特征在于,所述多维度特征均至少包括:基本特征、偏好特征、社会特征、消费特征和环境特征。
5.根据权利要求4所述的方法,其特征在于,
所述基本特征包括:性别、年龄、地域、教育水平、出生日期、职业、星座、机型、婚姻状况、是否有小孩几个;
所述偏好特征包括:兴趣爱好(体育、明星、游戏)、产品偏好、品牌偏好、衣食住行偏好;
所述社会特征包括:家庭状态、朋友圈(同学、同事、朋友);
所述消费特征包括:收入状况、购买力水平、已购商品、购买渠道偏好、购买频次;
所述环境特征包括:地理位置、时间(早、中、晚、工作日、节假日)、天气(多云、晴、暴雨、雪、大风)、网络(2G、3G、Wifi)。
6.一种构建用户全息画像的装置,其特征在于,包括:多维度特征获取模块、分类模块和构建模块;
所述多维度特征获取模块,用于对用户的日志数据进行分析,得到多维度特征;
所述分类模块,用于根据稳定性和时效性,将所述多维度特征进行分类,得到用户的冷特征、温特征和热特征;
所述构建模块,用于基于所述冷特征、温特征和热特征,分别构建画像,得到用户的冷画像、温画像和热画像,并将所述冷画像、温画像和热画像作为用户全息画像。
7.一种构建用户全息画像的设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810565221.1A CN108804638A (zh) | 2018-06-04 | 2018-06-04 | 构建用户全息画像的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810565221.1A CN108804638A (zh) | 2018-06-04 | 2018-06-04 | 构建用户全息画像的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108804638A true CN108804638A (zh) | 2018-11-13 |
Family
ID=64087266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810565221.1A Pending CN108804638A (zh) | 2018-06-04 | 2018-06-04 | 构建用户全息画像的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108804638A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109727077A (zh) * | 2019-01-22 | 2019-05-07 | 深圳魔数智擎科技有限公司 | 用户未来画像生成方法、计算机存储介质及计算机设备 |
CN111161104A (zh) * | 2019-12-20 | 2020-05-15 | 青岛聚好联科技有限公司 | 一种社区用户画像的生成方法及装置 |
CN111370118A (zh) * | 2020-05-28 | 2020-07-03 | 杭州睿杰信息技术有限公司 | 跨医疗机构的诊疗安全分析方法、装置和计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054709A4 (en) * | 2007-10-22 | 2009-10-15 | Uab 'geola Digital' | Method for spatial images stream's observation and system implementing thereof |
CN105893407A (zh) * | 2015-11-12 | 2016-08-24 | 乐视云计算有限公司 | 个体用户画像方法和系统 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN107730389A (zh) * | 2017-09-30 | 2018-02-23 | 平安科技(深圳)有限公司 | 电子装置、保险产品推荐方法及计算机可读存储介质 |
CN107908740A (zh) * | 2017-11-15 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
-
2018
- 2018-06-04 CN CN201810565221.1A patent/CN108804638A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054709A4 (en) * | 2007-10-22 | 2009-10-15 | Uab 'geola Digital' | Method for spatial images stream's observation and system implementing thereof |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN105893407A (zh) * | 2015-11-12 | 2016-08-24 | 乐视云计算有限公司 | 个体用户画像方法和系统 |
CN107730389A (zh) * | 2017-09-30 | 2018-02-23 | 平安科技(深圳)有限公司 | 电子装置、保险产品推荐方法及计算机可读存储介质 |
CN107908740A (zh) * | 2017-11-15 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
Non-Patent Citations (1)
Title |
---|
王冬羽: "基于移动互联网行为分析的用户画像系统设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109727077A (zh) * | 2019-01-22 | 2019-05-07 | 深圳魔数智擎科技有限公司 | 用户未来画像生成方法、计算机存储介质及计算机设备 |
CN111161104A (zh) * | 2019-12-20 | 2020-05-15 | 青岛聚好联科技有限公司 | 一种社区用户画像的生成方法及装置 |
CN111370118A (zh) * | 2020-05-28 | 2020-07-03 | 杭州睿杰信息技术有限公司 | 跨医疗机构的诊疗安全分析方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20140143405A1 (en) | System And Method For Analyzing Social Media Trends | |
US20130226856A1 (en) | Performance-efficient system for predicting user activities based on time-related features | |
US10832268B2 (en) | Modeling customer demand and updating pricing using customer behavior data | |
CA2808096C (en) | Digital consumer data model and customer analytic record | |
CN112534826B (zh) | 基于内容中包括的媒体的属性的最优集合优化用户对内容的参与 | |
CN111522978B (zh) | 一种数据推送方法和装置 | |
US20140143013A1 (en) | System and method for analyzing social media trends | |
US11151587B2 (en) | Intelligent marketing using group presence | |
CN108804638A (zh) | 构建用户全息画像的方法及装置 | |
US20180012237A1 (en) | Inferring user demographics through categorization of social media data | |
Carter et al. | Internet-enabled collective intelligence as a precursor and predictor of consumer behaviour | |
US20220286501A1 (en) | Systems and methods for rate-based load balancing | |
JP2023507043A (ja) | データ処理方法、装置、機器、記憶媒体及びコンピュータプログラム | |
Ragunathan et al. | Advertisement posting based on consumer behaviour | |
US11146524B2 (en) | Intelligent contextual timelining of notifications | |
US20220114616A1 (en) | Digital anthropology and ethnography system | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
US20180285793A1 (en) | Patron presence based workforce capacity notification | |
US10621622B1 (en) | Adaptive sequencing of notifications in a client server architecture | |
US20180012130A1 (en) | Systems and methods for forecasting trends | |
CN112449217A (zh) | 一种推送视频的方法和装置 | |
CN113946753B (zh) | 基于位置围栏的服务推荐方法、装置、设备及存储介质 | |
CN110838019A (zh) | 确定试用品发放人群的方法和装置 | |
CN114463085A (zh) | 自动化营销的通用沟通互动方法、装置、电子设备及存储介质 | |
CN116091133A (zh) | 一种目标对象属性的识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181113 |