CN114155067B - 一种用户画像的建立方法及系统 - Google Patents

一种用户画像的建立方法及系统 Download PDF

Info

Publication number
CN114155067B
CN114155067B CN202210125881.4A CN202210125881A CN114155067B CN 114155067 B CN114155067 B CN 114155067B CN 202210125881 A CN202210125881 A CN 202210125881A CN 114155067 B CN114155067 B CN 114155067B
Authority
CN
China
Prior art keywords
social
target user
level
portrait
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210125881.4A
Other languages
English (en)
Other versions
CN114155067A (zh
Inventor
潘小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Peiruiweihang Interconnection Technology Co ltd
Original Assignee
Beijing Peiruiweihang Interconnection Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Peiruiweihang Interconnection Technology Co ltd filed Critical Beijing Peiruiweihang Interconnection Technology Co ltd
Priority to CN202210125881.4A priority Critical patent/CN114155067B/zh
Publication of CN114155067A publication Critical patent/CN114155067A/zh
Application granted granted Critical
Publication of CN114155067B publication Critical patent/CN114155067B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户画像的建立方法及系统,包括以下步骤:步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象;步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;步骤S3、设定所述目标用户基础画像的记忆权重,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到电商画像。本发明在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。

Description

一种用户画像的建立方法及系统
技术领域
本发明涉及画像建立技术领域,具体涉及一种用户画像的建立方法及系统。
背景技术
用户画像又称为用户角色(Persona),即用户信息标签化,是一种勾画目标用户、联系用户诉求和设计方向的有效方式,其目标是在很多的维度上建立针对用户的描述性标签属性。它是通过收集与分析用户基本属性、社会属性、生活习惯、消费行为等信息的数据,抽象出一个用户全貌来挖掘用户需求和分析用户偏好,支撑个性化推荐、自动化营销等大数据应用的基本方式。举例来说,在产品开发时,可以分析用户画像,对产品进行定位与规划;在产品推广时,可以分析用户画像,挖掘潜在客户群体,进行有针对性的产品推荐。
大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,而用户画像是大数据技术的重要应用。随着信息技术的不断发展,目前用户画像已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面,并通过匹配用户画像提供给用户更高效和更有针对性的信息输送以及更贴近个人习惯的用户体验,成为了网络服务背后强大的后台支撑。
目前的电商行业中,构建用户画像的方法一般是根据用户在站内的访问商品类目等行为的日志保存下来,然后在一定的时间窗口内,遍历所有的用户行为日志,按照某些权重衰减函数对其进行计算,得到当前最新用户画像。该方式存在的问题是获取的数据比较片面,仅有该站内的用户数据,对于用户在其他网站上的访问行为则一无所知;另一方面,当用户数据达到足够的密集程度之后,用户的描述性标签属性虽然表现为较高的稳定性,但是以上方法也存在泛化能力差的缺陷,从而降低了用户画像的适应性。
发明内容
本发明的目的在于提供一种用户画像的建立方法及系统,以解决现有技术中存在泛化能力差的缺陷,降低用户画像的适应性的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种用户画像的建立方法,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
步骤S3、设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
作为本发明的一种优选方案,所述基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将所述目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将所述第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将所述第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将所述第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为所述社交网络,i为计量常数,无实质含义。
作为本发明的一种优选方案,所述通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,包括:
将所述社交网络基于模块度进行聚类运算以得到多个网络社团,并将多个网络社 团中目标用户所在的网络社团作为第1层次社团,将剩余网络社团按与第1层次社团的网络 边连接数进行排列依次得到第j层次社团,m表征为网络社团总数目,j为计量常数,无实质 含义,
Figure 470774DEST_PATH_IMAGE001
依次将位于所述第k层次社团的网络节点作为第k层次节点,并将第k层次节点作 为第k层次社交对象,
Figure 954907DEST_PATH_IMAGE003
作为本发明的一种优选方案,所述通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
单向社交通讯重要性分析的对象是目标用户与多层次社交对象间的单向社交通 讯关系,使用
Figure 728828DEST_PATH_IMAGE004
模型输出目标用户与多层次社交对象间的单向社交通讯关系重要性系数;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,所述多层次社交亲密度的计算公式为:
Figure 656332DEST_PATH_IMAGE005
式中,
Figure 123086DEST_PATH_IMAGE006
表征为目标用户与第k层次社交对象的第k层次社交亲密度,
Figure 535875DEST_PATH_IMAGE008
表征为 目标用户、第k层次社交对象通讯天数跨度,
Figure 113487DEST_PATH_IMAGE009
表征为目标用户至第k层次社交对象方向 的单向亲密度,
Figure 302023DEST_PATH_IMAGE010
表征为第k层次社交对象至目标用户方向的单向亲密度,
Figure DEST_PATH_IMAGE011
Figure 533153DEST_PATH_IMAGE012
表征为 加权系数;
依次将所述第k层次社交亲密度作为第k层次的泛化权重;
计算所述目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若所述皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性。
作为本发明的一种优选方案,所述基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定所述基础标签的标签权重;
基于表征所述目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
作为本发明的一种优选方案,所述基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定所述基础标签的标签权重;
基于表征所述多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
作为本发明的一种优选方案,所述设定所述目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建所述记忆权重,所述记忆权重的计算公式为:
Figure DEST_PATH_IMAGE013
式中,z表征为记忆权重,
Figure 636500DEST_PATH_IMAGE014
表征为目标用户的总数与第1层次社交对象总数的比 值,
Figure 283382DEST_PATH_IMAGE015
表征为第1层次社交对象总数。
作为本发明的一种优选方案,所述将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,包括:
将所述泛化权重依据记忆权重进行归一化处理,所述泛化权重的归一化计算公式为:
Figure 326425DEST_PATH_IMAGE016
式中,
Figure 400560DEST_PATH_IMAGE017
表征为归一化后的第k层次的泛化权重;
将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,其中,
加权后的所述目标用户的基础画像为:
Figure 20897DEST_PATH_IMAGE018
加权后的所述多层次社交对象的基础画像为:
Figure 81257DEST_PATH_IMAGE019
式中,
Figure 604904DEST_PATH_IMAGE020
表征为加权后的所述目标用户的基础画像,
Figure 849941DEST_PATH_IMAGE022
表征为未加权的所述目标 用户的基础画像,
Figure 98520DEST_PATH_IMAGE023
表征为加权后第k层次社交对象中第x个社交对象的基础画像,
Figure 821625DEST_PATH_IMAGE024
表征为未加权的第k层次社交对象中第x个社交对象的基础画像,
Figure 963893DEST_PATH_IMAGE025
表征为第k层次 社交对象总数,x为计量常数,无实质含义,
Figure 255197DEST_PATH_IMAGE026
作为本发明的一种优选方案,所述对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像,包括:
所述电商画像的计算公式为:
Figure DEST_PATH_IMAGE027
式中,
Figure 945067DEST_PATH_IMAGE028
表征为电商画像。
作为本发明的一种优选方案,本发明提供了一种根据所述的用户画像的建立方法的建立系统,包括:
社交分析单元,用于基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元,用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元,用于设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
本发明与现有技术相比较具有如下有益效果:
本发明通过构建和分析目标用户的社交网络得到用于提高用户画像泛化力的泛化权重,并在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的用户画像的建立方法流程图;
图2为本发明实施例提供的建立系统结构框图。
图中的标号分别表示如下:
1-社交分析单元;2-画像构建单元;3-画像融合单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种用户画像的建立方法,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
在构建目标用户的电商画像时,需要对目标用户在电商数据中体现出的兴趣特征进行精准提取,对基于目标用户的已体现出的兴趣特征构建出的电商画像(本实施例中的目标用户的基础画像)进行商品推荐时会具有较高的兴趣特征记忆力,会提高推荐精准度,但却缺乏了对兴趣特征的泛化力,本实施例基于与目标用户的社交网络中的多层次社交对象进行兴趣特征的提取,然后将目标用户的兴趣特征泛化力建立在多层次社交对象的兴趣特征记忆力中,由于目标用户的社交圈通常是具有一定程度相似兴趣特征的人员对象构成,因此将目标用户的兴趣特征泛化力建立在多层次社交对象的兴趣特征记忆力中实现了对目标用户的未体现出的兴趣特征进行提取,使得构建出的电商画像(本实施例中的目标用户的电商画像)进行商品推荐时会具有较高的兴趣特征泛化力,映射到现实场景中是:将目标用户好友的兴趣特征赋予到目标用户中,在进行商品推荐时目标用户好友的兴趣特征对应的商品(即目标用户好友感兴趣的商品)将会被推荐给目标用户,因而可实现在保证记忆力的同时提高泛化力,有助于后续提高商品推荐的泛化力,促进成交量。
基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为社交网络,i为计量常数,无实质含义。
循环阈值n由使用者进行自定义。
通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,包括:
将社交网络基于模块度进行聚类运算以得到多个网络社团,并将多个网络社团中 目标用户所在的网络社团作为第1层次社团,将剩余网络社团按与第1层次社团的网络边连 接数进行排列依次得到第j层次社团,m表征为网络社团总数目,j为计量常数,无实质含义,
Figure 612809DEST_PATH_IMAGE001
依次将位于第k层次社团的网络节点作为第k层次节点,并将第k层次节点作为第k 层次社交对象,
Figure 344004DEST_PATH_IMAGE030
聚类运算可将属于具有相似兴趣特征的通讯对象和目标用户归属于同一个网络社团,网络社团的现实意义为处于同一网络社团中的通讯对象和目标用户具有更高的亲密度,即兴趣特征更相似,处于不同网络社团中的通讯对象和目标用户具有较低的亲密度,即兴趣特征更相异,因此本实施例将与目标用户处于同一网络社团中的通讯对象设定为最高层次的社交对象,并将网络边连接数由高到低进行排列依次得到第j层次社团,社团的网络边连接数的现实意义为与不同网络社团间的亲密度。
通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
单向社交通讯重要性分析的对象是目标用户与多层次社交对象间的单向社交通 讯关系,使用
Figure 930843DEST_PATH_IMAGE031
模型输出目标用户与多层次社交对象间的单向社交通讯关系重要性系 数;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,多层次社交亲密度的计算公式为:
Figure 154014DEST_PATH_IMAGE032
式中,
Figure 720387DEST_PATH_IMAGE033
表征为目标用户与第k层次社交对象的第k层次社交亲密度,
Figure 712614DEST_PATH_IMAGE008
表征为 目标用户、第k层次社交对象通讯天数跨度,
Figure 204775DEST_PATH_IMAGE034
表征为目标用户至第k层次社交对象方向 的单向亲密度,
Figure 508718DEST_PATH_IMAGE010
表征为第k层次社交对象至目标用户方向的单向亲密度,
Figure 111737DEST_PATH_IMAGE011
Figure 318990DEST_PATH_IMAGE012
表征为 加权系数;
依次将第k层次社交亲密度作为第k层次的泛化权重;
优选的,计算目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性。
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定基础标签的标签权重;
电商数据包括但不限于用户基础属性数据:用户性别、年龄、职业等个人信息和移动端不同数据源的不同账号体系;移动设备属性数据:所属运营商、网络类型、归属地、设备品牌型号、操作系统、屏幕分辨率、CPU和上市时间;位置属性数据:线上即时位置和线下常用位置;历史交易行为数据包含:浏览、关注收藏、加入购物车、下单和购买。
基于表征目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定基础标签的标签权重;
基于表征多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
步骤S3、设定目标用户基础画像的记忆权重,将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
设定目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建记忆权重,记忆权重的计算公式为:
Figure 247632DEST_PATH_IMAGE035
式中,z表征为记忆权重,
Figure 179816DEST_PATH_IMAGE014
表征为目标用户的总数与第1层次社交对象总数的比 值,
Figure 586526DEST_PATH_IMAGE015
表征为第1层次社交对象总数。
记忆权重的值域为(0.5,1),因此将记忆权重用于对目标用户的基础画像进行加权可保证电商画像中目标用户的基础画像的占比范围在(0.5,1),有效的保障了电商画像中对目标用户的基础画像对目标用户兴趣特征的记忆力保留,而且在第1层次社交对象总数大时,即可推测出目标对象所有层次社交对象总数也大,因此记忆权重降低,并将降低的部分转至泛化权重,以覆盖所有层次的社交对象,使得电商画像中包含所有社交对象的记忆力,提高电商对象的泛化力,在第1层次社交对象总数小时,即可推测出目标对象所有层次社交对象总数也小,因此泛化权重增加,并将降低的部分转至记忆权重,提高电商对象的记忆力,实现记忆力和泛化力的动态兼顾。
将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,包括:
将泛化权重依据记忆权重进行归一化处理,泛化权重的归一化计算公式为:
Figure 412400DEST_PATH_IMAGE016
式中,
Figure 747828DEST_PATH_IMAGE017
表征为归一化后的第k层次的泛化权重;
将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,其中,
加权后的目标用户的基础画像为:
Figure 167308DEST_PATH_IMAGE018
加权后的多层次社交对象的基础画像为:
Figure 377710DEST_PATH_IMAGE019
式中,
Figure 323669DEST_PATH_IMAGE020
表征为加权后的目标用户的基础画像,
Figure 469480DEST_PATH_IMAGE036
表征为未加权的目标用户的基 础画像,
Figure 500890DEST_PATH_IMAGE023
表征为加权后第k层次社交对象中第x个社交对象的基础画像,
Figure 739149DEST_PATH_IMAGE024
表征为 未加权的第k层次社交对象中第x个社交对象的基础画像,
Figure 414981DEST_PATH_IMAGE025
表征为第k层次社交对象总 数,x为计量常数,无实质含义,
Figure 856326DEST_PATH_IMAGE037
对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像,包括:
电商画像的计算公式为:
Figure 250399DEST_PATH_IMAGE027
式中,
Figure 802603DEST_PATH_IMAGE028
表征为电商画像。
如图2所示,基于上述用户画像的建立方法,本发明提供了一种建立系统,包括:
社交分析单元1,用于基于目标用户的社交软件构建目标用户的社交网络,并通过对社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元2,用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元3,用于设定目标用户基础画像的记忆权重,将记忆权重和泛化权重分别加权至目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
本发明通过构建和分析目标用户的社交网络得到用于提高用户画像泛化力的泛化权重,并在目标用户的基础画像中按照泛化权重融合多层次社交对象的基础画像得到电商画像,以实现在构建用户画像时提高泛化力,增强用户画像的全面性。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (8)

1.一种用户画像的建立方法,其特征在于,包括以下步骤:
步骤S1、基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
所述通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重,包括:
分别获取目标用户和多层次社交对象的社交通讯关系表征数据,社交通讯关系表征数据包括:通讯次数和通讯时长,其中,
若目标用户与多层次社交对象间的社交通讯关系存在较强关联性,则筛选出目标用户与多层次社交对象间单向社交通讯关系后执行目标用户与多层次社交对象间单向社交通讯重要性分析;
若目标用户与多层次社交对象间的社交通讯关系不存在较强关联性,则直接执行目标用户与多层次社交对象间单向社交通讯重要性分析;
单向社交通讯重要性分析的对象是目标用户与多层次社交对象间的单向社交通讯关系,使用
Figure DEST_PATH_IMAGE002
模型输出目标用户与多层次社交对象间的单向社交通讯关系重要性系数;
将单向社交通讯关系重要性系数作为目标用户与多层次社交对象间的单向社交通讯权重,基于单向社交通讯权重进行加权求和计算获得目标用户与多层次社交对象间的单向亲密度;
将目标用户与多层次社交对象间的单向亲密度和多层次社交对象间与目标用户的单向亲密度合并为目标用户与多层次社交对象间的双向亲密度作为多层次社交亲密度,所述多层次社交亲密度的计算公式为:
Figure DEST_PATH_IMAGE004
式中,
Figure DEST_PATH_IMAGE006
表征为目标用户与第k层次社交对象的第k层次社交亲密度,
Figure DEST_PATH_IMAGE008
表征为目标用户、第k层次社交对象通讯天数跨度,
Figure DEST_PATH_IMAGE010
表征为目标用户至第k层次社交对象方向的单向亲密度,
Figure DEST_PATH_IMAGE012
表征为第k层次社交对象至目标用户方向的单向亲密度,
Figure DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE016
表征为加权系数;
依次将所述第k层次社交亲密度作为第k层次的泛化权重;
计算所述目标用户和多层次社交对象的社交通讯关系表征数据的皮尔逊系数,其中,
若所述皮尔逊系数大于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系存在较强关联性;
若表征数据的皮尔逊系数小于或等于第一预设阈值,则判断目标用户与多层次社交对象间的社交通讯关系不存在较强关联性;
步骤S2、基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
步骤S3、设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像;
所述设定所述目标用户基础画像的记忆权重,包括:
基于目标用户的总数与第1层次社交对象总数的比值构建所述记忆权重,所述记忆权重的计算公式为:
Figure DEST_PATH_IMAGE018
式中,z表征为记忆权重,
Figure DEST_PATH_IMAGE020
表征为目标用户的总数与第1层次社交对象总数的比值,
Figure DEST_PATH_IMAGE022
表征为第1层次社交对象总数。
2.根据权利要求1所述的一种用户画像的建立方法,其特征在于:所述基于目标用户的社交软件构建目标用户的社交网络,包括:
步骤一,以目标用户和与目标用户具有社交通讯关系的第1层通讯对象构建为第1层网络节点,将所述目标用户与第1层通讯对象的社交通讯关系构建为第1层网络边,将所述第1层网络边对表征为目标用户和第1层通讯对象的第1层网络节点进行连接构成第1层网络结构,设置循环控制项i=1;
步骤二,以与第i层通讯对象具有社交通讯关系的第i+1层通讯对象构建为第i+1层网络节点,将所述第i层通讯对象与第i+1层通讯对象的社交通讯关系构建为第i+1层网络边,将所述第i+1层网络边对表征为第1层通讯对象和第i+1层通讯对象的第i+1层网络节点进行连接构成第i+1层网络结构,将循环控制项i进行自加1处理;
步骤三,循环执行步骤二,直至循环控制项i=循环阈值n退出循环,将第1层至第n-1层的网络结构共同形成的网络拓扑作为所述社交网络,i为计量常数,无实质含义。
3.根据权利要求2所述的一种用户画像的建立方法,其特征在于:所述通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,包括:
将所述社交网络基于模块度进行聚类运算以得到多个网络社团,并将多个网络社团中目标用户所在的网络社团作为第1层次社团,将剩余网络社团按与第1层次社团的网络边连接数进行排列依次得到第j层次社团,m表征为网络社团总数目,j为计量常数,无实质含义,
Figure DEST_PATH_IMAGE024
依次将位于第k层次社团的网络节点作为第k层次节点,并将第k层次节点作为第k层次社交对象,
Figure DEST_PATH_IMAGE026
4.根据权利要求3所述的一种用户画像的建立方法,其特征在于:所述基于目标用户的电商数据构建目标用户的基础画像,包括:
对目标用户的电商数据进行分析处理和特征提取以构建目标用户的基础标签,并设定所述基础标签的标签权重;
基于表征所述目标用户的基础标签的特征数据和标签权重进行加权以构建出目标用户的基础画像。
5.根据权利要求4所述的一种用户画像的建立方法,其特征在于:所述基于多层次社交对象的电商数据构建多层次社交对象的基础画像,包括:
依次对多层次社交对象的电商数据进行分析处理和特征提取以构建多层次社交对象的基础标签,并设定所述基础标签的标签权重;
基于表征所述多层次社交对象的基础标签的特征数据和标签权重进行加权以构建出多层次社交对象的基础画像。
6.根据权利要求5所述的一种用户画像的建立方法,其特征在于,所述将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,包括:
将所述泛化权重依据记忆权重进行归一化处理,所述泛化权重的归一化计算公式为:
Figure DEST_PATH_IMAGE028
式中,
Figure DEST_PATH_IMAGE030
表征为归一化后的第k层次的泛化权重;
将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,其中,
加权后的所述目标用户的基础画像为:
Figure DEST_PATH_IMAGE032
加权后的所述多层次社交对象的基础画像为:
Figure DEST_PATH_IMAGE034
式中,
Figure DEST_PATH_IMAGE036
表征为加权后的所述目标用户的基础画像,
Figure DEST_PATH_IMAGE038
表征为未加权的所述目标用户的基础画像,
Figure DEST_PATH_IMAGE040
表征为加权后第k层次社交对象中第x个社交对象的基础画像,
Figure DEST_PATH_IMAGE042
表征为未加权的第k层次社交对象中第x个社交对象的基础画像,
Figure DEST_PATH_IMAGE044
表征为第k层次社交对象总数,x为计量常数,无实质含义,
Figure DEST_PATH_IMAGE046
7.根据权利要求6所述的一种用户画像的建立方法,其特征在于,所述对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像,包括:
所述电商画像的计算公式为:
Figure DEST_PATH_IMAGE048
式中,
Figure DEST_PATH_IMAGE050
表征为电商画像。
8.一种根据权利要求1-7任一项所述的用户画像的建立方法的建立系统,其特征在于,包括:
社交分析单元(1),用于基于目标用户的社交软件构建目标用户的社交网络,并通过对所述社交网络进行多层次节点获取位于目标用户社交邻节点处的多层次社交对象,再通过对多层次社交对象的多层次社交亲密度分析得到用于提高用户画像泛化力的泛化权重;
画像构建单元(2),用于基于目标用户的电商数据构建目标用户的基础画像,基于多层次社交对象的电商数据构建多层次社交对象的基础画像;
画像融合单元(3),用于设定所述目标用户基础画像的记忆权重,将所述记忆权重和泛化权重分别加权至所述目标用户的基础画像和多层次社交对象的基础画像,并对加权后的目标用户的基础画像和多层次社交对象的基础画像进行求和得到兼具记忆力和泛化力的目标用户的电商画像。
CN202210125881.4A 2022-02-10 2022-02-10 一种用户画像的建立方法及系统 Active CN114155067B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210125881.4A CN114155067B (zh) 2022-02-10 2022-02-10 一种用户画像的建立方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210125881.4A CN114155067B (zh) 2022-02-10 2022-02-10 一种用户画像的建立方法及系统

Publications (2)

Publication Number Publication Date
CN114155067A CN114155067A (zh) 2022-03-08
CN114155067B true CN114155067B (zh) 2022-04-22

Family

ID=80450375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210125881.4A Active CN114155067B (zh) 2022-02-10 2022-02-10 一种用户画像的建立方法及系统

Country Status (1)

Country Link
CN (1) CN114155067B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114676243B (zh) * 2022-05-25 2022-08-19 成都无糖信息技术有限公司 一种针对社交文本的用户画像分析方法及系统
CN114996347A (zh) * 2022-06-24 2022-09-02 中国电信股份有限公司 一种用户画像管理方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767300A (zh) * 2019-01-14 2019-05-17 博拉网络股份有限公司 基于用户习惯的大数据画像及模型构建方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631749A (zh) * 2015-12-24 2016-06-01 成都陌云科技有限公司 基于统计数据的用户画像计算方法
US10878046B2 (en) * 2017-01-11 2020-12-29 Facebook, Inc. Methods and systems for generating content for users of a social networking service
CN108804701A (zh) * 2018-06-19 2018-11-13 苏州大学 基于社交网络大数据的人物画像模型构建方法
CN113254804B (zh) * 2021-07-06 2021-12-03 武汉荟友网络科技有限公司 一种基于用户属性和行为特征的社会关系推荐方法及系统
CN113806633A (zh) * 2021-08-27 2021-12-17 浙江工商大学 融入用户画像与社交关系相似度的数字商务智能跨域推荐方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109767300A (zh) * 2019-01-14 2019-05-17 博拉网络股份有限公司 基于用户习惯的大数据画像及模型构建方法

Also Published As

Publication number Publication date
CN114155067A (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
CN114155067B (zh) 一种用户画像的建立方法及系统
CN104239408B (zh) 基于由移动设备记录的图像的内容的数据访问
Yu et al. A survey of point-of-interest recommendation in location-based social networks
Costa-Montenegro et al. Which App? A recommender system of applications in markets: Implementation of the service for monitoring users’ interaction
CN111178970B (zh) 广告投放的方法及装置、电子设备和计算机可读存储介质
CN108154425B (zh) 一种结合社会网络和位置的线下商户推荐方法
CN108182268B (zh) 一种基于社会网络的协同过滤推荐方法及系统
CN109697627A (zh) 用于使用深层神经语言模型自动出价的系统和方法
CN107370780A (zh) 基于互联网的媒体推送方法、装置和系统
US20140214621A1 (en) Method and device for pushing information
CN110502702A (zh) 用户行为预测方法以及装置
CN107346333B (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
CN113379449A (zh) 多媒体资源召回方法、装置、电子设备以及存储介质
CN113868537B (zh) 一种基于多行为会话图融合的推荐方法
CN112241489A (zh) 信息推送方法、装置、可读存储介质和计算机设备
CN108416645B (zh) 一种针对用户的推荐方法、装置、存储介质和设备
CN107948312B (zh) 一种以位置点作为信息出入口的信息归类发布方法及系统
US20160217490A1 (en) Automatic Computation of Keyword Bids For Pay-Per-Click Advertising Campaigns and Methods and Systems Incorporating The Same
CN110096609A (zh) 房源搜索方法、装置、设备及计算机可读存储介质
Gai Intelligent advertising design strategy based on internet of things technology
CN113032694B (zh) 基于场景的查询方法及装置、存储介质、计算机设备
CN109858900A (zh) 一种支付信息推送方法、装置及终端设备
CN115936758A (zh) 基于大数据的智能拓客方法及相关装置
CN110879863B (zh) 跨领域搜索方法和跨领域搜索装置
CN113516524A (zh) 用于推送信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant