CN114155067B - 一种用户画像的建立方法及系统 - Google Patents
一种用户画像的建立方法及系统 Download PDFInfo
- Publication number
- CN114155067B CN114155067B CN202210125881.4A CN202210125881A CN114155067B CN 114155067 B CN114155067 B CN 114155067B CN 202210125881 A CN202210125881 A CN 202210125881A CN 114155067 B CN114155067 B CN 114155067B
- Authority
- CN
- China
- Prior art keywords
- social
- target user
- level
- portrait
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004891 communication Methods 0.000 claims description 103
- 238000004458 analytical method Methods 0.000 claims description 15
- 150000001875 compounds Chemical class 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000003012 network analysis Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户画像的建立方法及系统,包括以下步骤:步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象;步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;步骤S3、设定所述目标用户基础画像的记忆权重,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到电商画像。本发明在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。
Description
技术领域
本发明涉及画像建立技术领域,具体涉及一种用户画像的建立方法及系统。
背景技术
用户画像又称为用户角色(Persona),即用户信息标签化,是一种勾画目标用户、联系用户诉求和设计方向的有效方式,其目标是在很多的维度上建立针对用户的描述性标签属性。它是通过收集与分析用户基本属性、社会属性、生活习惯、消费行为等信息的数据,抽象出一个用户全貌来挖掘用户需求和分析用户偏好,支撑个性化推荐、自动化营销等大数据应用的基本方式。举例来说,在产品开发时,可以分析用户画像,对产品进行定位与规划;在产品推广时,可以分析用户画像,挖掘潜在客户群体,进行有针对性的产品推荐。
大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,而用户画像是大数据技术的重要应用。随着信息技术的不断发展,目前用户画像已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,并通过匹配用户画像提供给用户更高效和更有针对性的信息输送以及更贴近个人习惯的用户体验,成为了网络服务背后强大的后台支撑。
目前的电商行业中,构建用户画像的方法一般是根据用户在站内的访问商品类目等行为的日志保存下来,然后在一定的时间窗口内,遍历所有的用户行为日志,按照某些权重衰减函数对其进行计算,得到当前最新用户画像。该方式存在的问题是获取的数据比较片面,仅有该站内的用户数据,对于用户在其他网站上的访问行为则一无所知;另一方面,当用户数据达到足够的密集程度之后,用户的描述性标签属性虽然表现为较高的稳定性,但是以上方法也存在泛化能力差的缺陷,从而降低了用户画像的适应性。
发明内容
本发明的目的在于提供一种用户画像的建立方法及系统,以解决现有技术中存在泛化能力差的缺陷,降低用户画像的适应性的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种用户画像的建立方法,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
步骤S3、设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
作为本发明的一种优选方案,所述基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将所述目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将所述第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将所述第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将所述第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为所述社交网络,i为计量常数,无实质含义。
作为本发明的一种优选方案,所述通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,包括:
将所述社交网络基于模块度进行聚类运算以得到多个网络社团,并将多个网络社
团中目标用户所在的网络社团作为第1层次社团,将剩余网络社团按与第1层次社团的网络
边连接数进行排列依次得到第j层次社团,m表征为网络社团总数目,j为计量常数,无实质
含义,;
作为本发明的一种优选方案,所述通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,所述多层次社交亲密度的计算公式为:
式中,表征为目标用户与第k层次社交对象的第k层次社交亲密度,表征为
目标用户、第k层次社交对象通讯天数跨度,表征为目标用户至第k层次社交对象方向
的单向亲密度,表征为第k层次社交对象至目标用户方向的单向亲密度,、表征为
加权系数;
依次将所述第k层次社交亲密度作为第k层次的泛化权重;
计算所述目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若所述皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性。
作为本发明的一种优选方案,所述基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定所述基础标签的标签权重;
基于表征所述目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
作为本发明的一种优选方案,所述基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定所述基础标签的标签权重;
基于表征所述多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
作为本发明的一种优选方案,所述设定所述目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建所述记忆权重,所述记忆权重的计算公式为:
作为本发明的一种优选方案,所述将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,包括:
将所述泛化权重依据记忆权重进行归一化处理,所述泛化权重的归一化计算公式为:
将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,其中,
式中,表征为加权后的所述目标用户的基础画像,表征为未加权的所述目标
用户的基础画像,表征为加权后第k层次社交对象中第x个社交对象的基础画像,表征为未加权的第k层次社交对象中第x个社交对象的基础画像,表征为第k层次
社交对象总数,x为计量常数,无实质含义,。
作为本发明的一种优选方案,所述对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像,包括:
所述电商画像的计算公式为:
作为本发明的一种优选方案,本发明提供了一种根据所述的用户画像的建立方法的建立系统,包括:
社交分析单元,用于基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元,用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元,用于设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
本发明与现有技术相比较具有如下有益效果:
本发明通过构建和分析目标用户的社交网络得到用于提高用户画像泛化力的泛化权重,并在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的用户画像的建立方法流程图;
图2为本发明实施例提供的建立系统结构框图。
图中的标号分别表示如下:
1-社交分析单元;2-画像构建单元;3-画像融合单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种用户画像的建立方法,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
在构建目标用户的电商画像时,需要对目标用户在电商数据中体现出的兴趣特征进行精准提取,对基于目标用户的已体现出的兴趣特征构建出的电商画像(本实施例中的目标用户的基础画像)进行商品推荐时会具有较高的兴趣特征记忆力,会提高推荐精准度,但却缺乏了对兴趣特征的泛化力,本实施例基于与目标用户的社交网络中的多层次社交对象进行兴趣特征的提取,然后将目标用户的兴趣特征泛化力建立在多层次社交对象的兴趣特征记忆力中,由于目标用户的社交圈通常是具有一定程度相似兴趣特征的人员对象构成,因此将目标用户的兴趣特征泛化力建立在多层次社交对象的兴趣特征记忆力中实现了对目标用户的未体现出的兴趣特征进行提取,使得构建出的电商画像(本实施例中的目标用户的电商画像)进行商品推荐时会具有较高的兴趣特征泛化力,映射到现实场景中是:将目标用户好友的兴趣特征赋予到目标用户中,在进行商品推荐时目标用户好友的兴趣特征对应的商品(即目标用户好友感兴趣的商品)将会被推荐给目标用户,因而可实现在保证记忆力的同时提高泛化力,有助于后续提高商品推荐的泛化力,促进成交量。
基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为社交网络,i为计量常数,无实质含义。
循环阈值n由使用者进行自定义。
通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,包括:
将社交网络基于模块度进行聚类运算以得到多个网络社团,并将多个网络社团中
目标用户所在的网络社团作为第1层次社团,将剩余网络社团按与第1层次社团的网络边连
接数进行排列依次得到第j层次社团,m表征为网络社团总数目,j为计量常数,无实质含义,;
聚类运算可将属于具有相似兴趣特征的通讯对象和目标用户归属于同一个网络社团,网络社团的现实意义为处于同一网络社团中的通讯对象和目标用户具有更高的亲密度,即兴趣特征更相似,处于不同网络社团中的通讯对象和目标用户具有较低的亲密度,即兴趣特征更相异,因此本实施例将与目标用户处于同一网络社团中的通讯对象设定为最高层次的社交对象,并将网络边连接数由高到低进行排列依次得到第j层次社团,社团的网络边连接数的现实意义为与不同网络社团间的亲密度。
通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,多层次社交亲密度的计算公式为:
式中,表征为目标用户与第k层次社交对象的第k层次社交亲密度,表征为
目标用户、第k层次社交对象通讯天数跨度,表征为目标用户至第k层次社交对象方向
的单向亲密度,表征为第k层次社交对象至目标用户方向的单向亲密度,、表征为
加权系数;
依次将第k层次社交亲密度作为第k层次的泛化权重;
优选的,计算目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性。
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定基础标签的标签权重;
电商数据包括但不限于用户基础属性数据:用户性别、年龄、职业等个人信息和移动端不同数据源的不同账号体系;移动设备属性数据:所属运营商、网络类型、归属地、设备品牌型号、操作系统、屏幕分辨率、CPU和上市时间;位置属性数据:线上即时位置和线下常用位置;历史交易行为数据包含:浏览、关注收藏、加入购物车、下单和购买。
基于表征目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定基础标签的标签权重;
基于表征多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
步骤S3、设定目标用户基础画像的记忆权重,将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
设定目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建记忆权重,记忆权重的计算公式为:
记忆权重的值域为(0.5,1),因此将记忆权重用于对目标用户的基础画像进行加权可保证电商画像中目标用户的基础画像的占比范围在(0.5,1),有效的保障了电商画像中对目标用户的基础画像对目标用户兴趣特征的记忆力保留,而且在第1层次社交对象总数大时,即可推测出目标对象所有层次社交对象总数也大,因此记忆权重降低,并将降低的部分转至泛化权重,以覆盖所有层次的社交对象,使得电商画像中包含所有社交对象的记忆力,提高电商对象的泛化力,在第1层次社交对象总数小时,即可推测出目标对象所有层次社交对象总数也小,因此泛化权重增加,并将降低的部分转至记忆权重,提高电商对象的记忆力,实现记忆力和泛化力的动态兼顾。
将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,包括:
将泛化权重依据记忆权重进行归一化处理,泛化权重的归一化计算公式为:
将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,其中,
式中,表征为加权后的目标用户的基础画像,表征为未加权的目标用户的基
础画像,表征为加权后第k层次社交对象中第x个社交对象的基础画像,表征为
未加权的第k层次社交对象中第x个社交对象的基础画像,表征为第k层次社交对象总
数,x为计量常数,无实质含义,。
对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像,包括:
电商画像的计算公式为:
如图2所示,基于上述用户画像的建立方法,本发明提供了一种建立系统,包括:
社交分析单元1,用于基于目标用户的社交软件构建目标用户的社交网络,并通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元2,用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元3,用于设定目标用户基础画像的记忆权重,将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
本发明通过构建和分析目标用户的社交网络得到用于提高用户画像泛化力的泛化权重,并在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。
Claims (8)
1.一种用户画像的建立方法,其特征在于,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
所述通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,所述多层次社交亲密度的计算公式为:
式中,表征为目标用户与第k层次社交对象的第k层次社交亲密度,表征为目标用户、第k层次社交对象通讯天数跨度,表征为目标用户至第k层次社交对象方向的单向亲密度,表征为第k层次社交对象至目标用户方向的单向亲密度,、表征为加权系数;
依次将所述第k层次社交亲密度作为第k层次的泛化权重;
计算所述目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若所述皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性;
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
步骤S3、设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像;
所述设定所述目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建所述记忆权重,所述记忆权重的计算公式为:
2.根据权利要求1所述的一种用户画像的建立方法,其特征在于:所述基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将所述目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将所述第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将所述第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将所述第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为所述社交网络,i为计量常数,无实质含义。
4.根据权利要求3所述的一种用户画像的建立方法,其特征在于:所述基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定所述基础标签的标签权重;
基于表征所述目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
5.根据权利要求4所述的一种用户画像的建立方法,其特征在于:所述基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定所述基础标签的标签权重;
基于表征所述多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
6.根据权利要求5所述的一种用户画像的建立方法,其特征在于,所述将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,包括:
将所述泛化权重依据记忆权重进行归一化处理,所述泛化权重的归一化计算公式为:
将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,其中,
8.一种根据权利要求1-7任一项所述的用户画像的建立方法的建立系统,其特征在于,包括:
社交分析单元(1),用于基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元(2),用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元(3),用于设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210125881.4A CN114155067B (zh) | 2022-02-10 | 2022-02-10 | 一种用户画像的建立方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210125881.4A CN114155067B (zh) | 2022-02-10 | 2022-02-10 | 一种用户画像的建立方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114155067A CN114155067A (zh) | 2022-03-08 |
CN114155067B true CN114155067B (zh) | 2022-04-22 |
Family
ID=80450375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210125881.4A Active CN114155067B (zh) | 2022-02-10 | 2022-02-10 | 一种用户画像的建立方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114155067B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114676243B (zh) * | 2022-05-25 | 2022-08-19 | 成都无糖信息技术有限公司 | 一种针对社交文本的用户画像分析方法及系统 |
CN114996347A (zh) * | 2022-06-24 | 2022-09-02 | 中国电信股份有限公司 | 一种用户画像管理方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767300A (zh) * | 2019-01-14 | 2019-05-17 | 博拉网络股份有限公司 | 基于用户习惯的大数据画像及模型构建方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631749A (zh) * | 2015-12-24 | 2016-06-01 | 成都陌云科技有限公司 | 基于统计数据的用户画像计算方法 |
US10878046B2 (en) * | 2017-01-11 | 2020-12-29 | Facebook, Inc. | Methods and systems for generating content for users of a social networking service |
CN108804701A (zh) * | 2018-06-19 | 2018-11-13 | 苏州大学 | 基于社交网络大数据的人物画像模型构建方法 |
CN113254804B (zh) * | 2021-07-06 | 2021-12-03 | 武汉荟友网络科技有限公司 | 一种基于用户属性和行为特征的社会关系推荐方法及系统 |
CN113806633A (zh) * | 2021-08-27 | 2021-12-17 | 浙江工商大学 | 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法 |
-
2022
- 2022-02-10 CN CN202210125881.4A patent/CN114155067B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767300A (zh) * | 2019-01-14 | 2019-05-17 | 博拉网络股份有限公司 | 基于用户习惯的大数据画像及模型构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114155067A (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114155067B (zh) | 一种用户画像的建立方法及系统 | |
CN104239408B (zh) | 基于由移动设备记录的图像的内容的数据访问 | |
Yu et al. | A survey of point-of-interest recommendation in location-based social networks | |
Costa-Montenegro et al. | Which App? A recommender system of applications in markets: Implementation of the service for monitoring users’ interaction | |
CN111178970B (zh) | 广告投放的方法及装置、电子设备和计算机可读存储介质 | |
CN108154425B (zh) | 一种结合社会网络和位置的线下商户推荐方法 | |
CN108182268B (zh) | 一种基于社会网络的协同过滤推荐方法及系统 | |
CN109697627A (zh) | 用于使用深层神经语言模型自动出价的系统和方法 | |
CN107370780A (zh) | 基于互联网的媒体推送方法、装置和系统 | |
US20140214621A1 (en) | Method and device for pushing information | |
CN110502702A (zh) | 用户行为预测方法以及装置 | |
CN107346333B (zh) | 一种基于链路预测的在线社交网络好友推荐方法与系统 | |
CN113379449A (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN113868537B (zh) | 一种基于多行为会话图融合的推荐方法 | |
CN112241489A (zh) | 信息推送方法、装置、可读存储介质和计算机设备 | |
CN108416645B (zh) | 一种针对用户的推荐方法、装置、存储介质和设备 | |
CN107948312B (zh) | 一种以位置点作为信息出入口的信息归类发布方法及系统 | |
US20160217490A1 (en) | Automatic Computation of Keyword Bids For Pay-Per-Click Advertising Campaigns and Methods and Systems Incorporating The Same | |
CN110096609A (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 | |
Gai | Intelligent advertising design strategy based on internet of things technology | |
CN113032694B (zh) | 基于场景的查询方法及装置、存储介质、计算机设备 | |
CN109858900A (zh) | 一种支付信息推送方法、装置及终端设备 | |
CN115936758A (zh) | 基于大数据的智能拓客方法及相关装置 | |
CN110879863B (zh) | 跨领域搜索方法和跨领域搜索装置 | |
CN113516524A (zh) | 用于推送信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |