CN113127751B - 用户画像构建方法、装置、设备及计算机可读存储介质 - Google Patents

用户画像构建方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113127751B
CN113127751B CN201911391725.7A CN201911391725A CN113127751B CN 113127751 B CN113127751 B CN 113127751B CN 201911391725 A CN201911391725 A CN 201911391725A CN 113127751 B CN113127751 B CN 113127751B
Authority
CN
China
Prior art keywords
user
information
communication
communication data
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911391725.7A
Other languages
English (en)
Other versions
CN113127751A (zh
Inventor
詹海鹏
唐睿
刘一珉
卞军伟
廖鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Chengdu ICT Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911391725.7A priority Critical patent/CN113127751B/zh
Publication of CN113127751A publication Critical patent/CN113127751A/zh
Application granted granted Critical
Publication of CN113127751B publication Critical patent/CN113127751B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明提供一种用户画像构建方法、装置、设备及计算机可读存储介质。该方法包括:获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,第一用户通信数据包括第一通信对象、第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、第二频次信息和第二时长信息;根据第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息;根据第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息;根据第一对象信息、第二对象信息、第三对象信息、第四对象信息确定用户标签信息;根据用户标签信息构建用户画像。本发明有效确定用户标签信息,构建用户画像。

Description

用户画像构建方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户画像构建方法、装置、设备及计算机可读存储介质。
背景技术
用户画像是根据用户的属性、偏好、生活习惯、行为等数据,抽象出来的标签化用户模型。
传统的用户画像在构建过程中,通常根据用户的具体数据,依靠常规统计量分析、行业经验与个人判断对用户数据进行分析,对用户进行打标签,生成标签集,利用这些标签将用户形象具体化。
但是当用户数据比较复杂,尤其是在处理运营商数据这种包含海量通信数据的复杂数据时,依靠常规统计量分析、行业经验与个人判断,很难将复杂数据中的信息有效标签化,难以保证最终标签集的质量,同时,在分析用户数据进行打标签时,现有技术中缺少一套有效的理论方法,严重依赖个人经验能力与工作状态,容易产生数据分析结果与用户画像效果“时好时坏”的现象。
发明内容
本发明实施例提供了一种用户画像构建方法、装置、设备及计算机可读存储介质,能够基于强弱联系理论准确分析用户通信数据,有效确定用户标签信息,构建用户画像。
第一方面,本发明提供一种用户画像构建方法,该方法包括:获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,第一用户通信数据包括第一通信对象、与第一通信对象通话的第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、与第二通信对象通话的第二频次信息和第二时长信息;根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息;根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息;根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息;根据用户标签信息构建用户画像。
在第一方面的一些可实现方式中,根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息,包括:获取第一预设周期内符合预设通话频次阈值的第一通信对象以及与符合预设通话频次阈值的第一通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第一通信对象通话的第一用户通信数据确定为第一对象信息;将除第一对象信息之外的第一用户通信数据确定为第二对象信息。
在第一方面的一些可实现方式中,根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息,包括:获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与符合预设通话频次阈值的第二通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第二通信对象通话的第二用户通信数据确定为第三对象信息;将除第三对象信息之外的第二用户通信数据确定为第四对象信息。
在第一方面的一些可实现方式中,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息,包括:根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户稳定值;根据用户稳定值确定用户标签信息。
第二方面,本发明提供一种用户画像构建装置,该装置包括:获取模块,用于获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,第一用户通信数据包括第一通信对象、与第一通信对象通话的第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、与第二通信对象通话的第二频次信息和第二时长信息;
确定模块,用于根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息;根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息;
上述确定模块,还用于根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息;
构建模块,用于根据用户标签信息构建用户画像。
在第二方面的一些可实现方式中,根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息,包括:获取第一预设周期内符合预设通话频次阈值的第一通信对象以及与符合预设通话频次阈值的第一通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第一通信对象通话的第一用户通信数据确定为第一对象信息;将除第一对象信息之外的第一用户通信数据确定为第二对象信息。
在第二方面的一些可实现方式中,根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息,包括:获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与符合预设通话频次阈值的第二通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第二通信对象通话的第二用户通信数据确定为第三对象信息;将除第三对象信息之外的第二用户通信数据确定为第四对象信息。
在第二方面的一些可实现方式中,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息,包括:根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户稳定值;根据用户稳定值确定用户标签信息。
第三方面,本发明提供一种用户画像构建设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现如上所述的用户画像构建方法。
第四方面,本发明提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如上所述的用户画像构建方法。
本发明涉及数据分析技术领域,尤其涉及一种用户画像构建方法、装置、设备及计算机可读存储介质,通过获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,第一用户通信数据包括第一通信对象、与第一通信对象通话的第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、与第二通信对象通话的第二频次信息和第二时长信息,根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息,根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息,根据用户标签信息构建用户画像,能够基于强弱联系理论准确分析用户通信数据,将用户的交往圈变化程度进行量化,有效确定体现用户时效性动态变化趋势的用户标签信息,构建出准确的用户画像。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种用户画像构建方法的流程示意图;
图2是本发明实施例提供的一种用户画像构建装置的结构示意图;
图3是本发明实施例提供的一种用户画像构建设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
图1是本发明实施例提供的一种用户画像构建方法的流程示意图。如图1所示,该用户画像构建方法可以包括S110至S140。
S110:获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据。
第一用户通信数据包括第一通信对象、与第一通信对象通话的第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、与第二通信对象通话的第二频次信息和第二时长信息。
第一预设周期与第二预设周期分别为两个不同时间段,第一用户通信数据与第二用户通信数据分别为两个不同时间段内的用户通信数据。
S120:根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息。
具体地,获取第一预设周期内符合预设通话频次阈值的第一通信对象,以及与符合预设通话频次阈值的第一通信对象通话的通话时长,累计用户与符合预设通话频次阈值的第一通信对象的通话时长,将累计通话时长符合预设通话时长阈值的第一通信对象确定为第一对象,将用户与第一对象通话的第一用户通信数据确定为第一对象信息,将除第一对象之外的通信对象确定为第二对象,将用户与第二对象通信的第一用户通信数据确定为第二对象信息。
提取在第一预设周期内用户与第一通信对象通话频次最多的前m个第一通信对象,用户与第m个第一通信对象的通话频次为预设通话频次阈值,累计用户与m个第一通信对象的通话时长。
可选地,预设通话时长阈值可以为第一用户通信数据中全部通话时长的x%,x大于或等于50,若用户与m个第一通信对象的通话时长符合预设通话时长阈值,将m个第一通信对象确定为第一对象,将用户与m个第一通信对象通话的第一用户通信数据确定为第一对象信息,将除第一对象以外的第一通信对象确定为第二对象,将用户与第二对象通话的第一用户通信数据确定为第二对象信息,其中,第一对象为第一预设周期内的强联系对象,第一对象信息为第一预设周期内的强联系信息,第二对象为第一预设周期内的弱联系对象,第二对象信息为第一预设周期内的弱联系信息。
S130:根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息。
具体地,获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与符合预设通话频次阈值的第二通信对象通话的通话时长,累计用户与符合预设通话频次阈值的第二通信对象的通话时长,将累计通话时长符合预设通话时长阈值的第二通信对象确定为第三对象,将用户与第三对象通话的第二用户通信数据确定为第三对象信息,将除第三对象之外的第二通信对象确定为第四对象,将用户与第四对象通话的第二用户通信数据确定为第四对象信息。
提取第二预设周期内用户与第二通信对象通话频次最多的前m个第二通信对象,用户与第m个第二通信对象的通话频次为预设通话频次阈值,累计用户与m个第二通信对象的通话时长。
可选地,预设通话时长阈值可以为第二用户通信数据中全部通话时长的x%,x大于或等于50,若用户与m个第二通信对象的通话时长符合预设通话时长阈值,将m个第二通信对象确定为第三对象,将用户与m个第二通信对象通话的第二用户通信数据确定为第三对象信息,将除第三对象以外的第二通信对象确定为第四对象,将用户与第四对象通话的第二用户通信数据确定为第四对象信息,其中,第三对象为第二预设周期内的强联系对象,第三对象信息为第二预设周期内的强联系信息,第四对象为第二预设周期内的弱联系对象,第四对象信息为第二预设周期内的弱联系信息。
S140:根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息。
具体地,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户稳定值,然后根据该用户稳定值确定用户标签信息。
其中,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户稳定值,可以包括以下步骤:
步骤1,根据第一对象信息和第二对象信息分别获取第一预设周期内的强弱联系对象数量,根据第三对象信息和第四对象信息分别获取第二预设周期内的强弱联系对象数量。
步骤2,将第一对象信息与第三对象信息进行比对,获取共同存在于两个预设周期内的存留强联系对象,将第二对象信息与第四对象信息进行比对,获取共同存在于两个预设周期内的存留弱联系对象。
步骤3,根据用户数据中与通信对象的通话频次信息,获取存留强联系对象的通话频次序列信息和存留弱联系对象的通话频次序列信息,并分别计算存留强联系对象的通话频次标准差、存留弱联系对象的通话频次标准差。
步骤4,根据以下公式(1)计算用户稳定值:
其中,0.75、0.25为预设系数,T为时间戳,Tend-Tbegin为两个预设周期之间的时间窗口(单位:年),N为强联系对象人数,n为弱联系对象人数,nend为第二预设周期内弱联系对象人数,Nretain为存留强联系对象人数,nretain为存留弱联系对象人数,L′retain为存留强联系对象的通话频次序列,l′retain为存留弱联系对象的通话频次序列,S()代表标准差运算,Valuestability为用户稳定值,稳定值越大,代表用户的稳定性越差。
在公式(1)中,0.75、0.25两个系数分别代表强弱联系圈稳定性在社交圈时效稳定性中的影响因子,从国人熟人社交网络模式的观点出发,在国内的社交活动中,尤其在时效稳定性方面,强联系圈相对弱联系圈具有更强的影响力,可选地,将代表强弱联系圈重要性的两个影响因子设为0.75和0.25。
对于上述步骤1-4,结合一个具体的示例进行说明:
获取用户A在1月份的通信数据,计算得出:第一预设周内的强联系对象人数Nbegin=5,弱联系对象人数nbegin=45。
用户A在5月份因工作原因进入异地分公司办公,这一变动导致用户强联系对象内的工作相关的2名通信对象产生变动,另导致原有的3名强联系对象通话频次序列也产生变动。
获取用户A在5月份的通信数据,计算得出:第二预设周期内的强联系对象人数Nend=5,弱联系对象人数nend=66。将5月份的强弱联系对象信息与1月份的强弱联系对象信息进行比对,分别找到存留的强、弱联系对象,并统计数量,得出存留强联系对象人数Nretain=3,存留弱联系对象人数nretain=22。
根据用户通信数据,以通信对象为主键,执行分组聚合计算,得出用户与通信对象的通话频次序列,分别找到用户与存留强联系对象的通话频次序列L′retain、用户与存留弱联系对象的通话频次序列l′retain,计算对应标准差,结果分别为:S(L′retain)=3.22、S(l′retain)=8.65。
其中,两个周期之间的时间窗口为3个月,Tend-Tbegin=0.25(单位:年)。
将以上条件信息带入公式(1),可得出:用户稳定值Valuestability=5.46。
S150:根据用户标签信息构建用户画像。
本发明实施例中制定了反映用户稳定性的量化计算方法,不仅从用户通话时长上进行考量,还参考了用户与强弱联系对象的通话频次分布的整体情况,对用户通信数据进行全面分析,准确计算出用户稳定值,根据用户稳定值有效确定用户标签信息。
图2是本发明实施例提供的一种用户画像构建装置的结构示意图,如图2所示,该用户画像构建装置可以包括:获取210、确定模块220、构建模块230。
其中,获取模块210,用于获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,第一用户通信数据包括第一通信对象、与第一通信对象通话的第一频次信息和第一时长信息,第二用户通信数据包括第二通信对象、与第二通信对象通话的第二频次信息和第二时长信息。确定模块220,用于根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息;根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息。确定模块220,还用于根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息。构建模块230,用于根据用户标签信息构建用户画像。
在一些实施例中,根据第一用户通信数据中的第一通信对象、第一频次信息和第一时长信息确定第一对象信息和第二对象信息,包括:获取第一预设周期内符合预设通话频次阈值的第一通信对象以及与符合预设通话频次阈值的第一通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第一通信对象通话的第一用户通信数据确定为第一对象信息;将除第一对象信息之外的第一用户通信数据确定为第二对象信息。
在一些实施例中,根据第二用户通信数据中的第二通信对象、第二频次信息和第二时长信息确定第三对象信息和第四对象信息,包括:获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与符合预设通话频次阈值的第二通信对象通话的通话时长;累计通话时长;将与累计通话时长符合预设通话时长阈值的第二通信对象通话的第二用户通信数据确定为第三对象信息;将除第三对象信息之外的第二用户通信数据确定为第四对象信息。
在一些实施例中,根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户标签信息,包括:根据第一对象信息、第二对象信息、第三对象信息及第四对象信息确定用户稳定值;根据用户稳定值确定用户标签信息。
本发明实施例的用户画像构建装置,能够基于强弱联系理论准确分析用户通信数据,有效确定用户标签信息,构建用户画像。可以理解的是,本发明实施例的用户画像构建装置,可以对应于本发明实施例图1中的用户画像构建方法的执行主体,用户画像构建装置的各个模块/单元的操作和/或功能的具体细节可以参见上述本发明实施例图1的用户画像构建方法中的相应部分的描述,为了简洁,在此不再赘述。
图3是本发明实施例提供的一种用户画像构建设备的硬件结构示意图。
如图3所示,本实施例中的用户画像构建设备包括输入设备301、输入接口302、中央处理器303、存储器304、输出接口305、以及输出设备306。其中,输入接口302、中央处理器303、存储器304、以及输出接口305通过总线310相互连接,输入设备301和输出设备306分别通过输入接口302和输出接口305与总线310连接,进而与用户画像构建设备的其他组件连接。
具体地,输入设备301接收来自外部的输入信息,并通过输入接口302将输入信息传送到中央处理器303;中央处理器303基于存储器304中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器304中,然后通过输出接口305将输出信息传送到输出设备306;输出设备306将输出信息输出到用户画像构建设备的外部供用户使用。
也就是说,图3所示的用户画像构建设备也可以被实现为包括:存储有计算机可执行指令的存储器;以及处理器,该处理器在执行计算机可执行指令时可以实现结合图1描述的用户画像构建方法。
在一个实施例中,图3所示的用户画像构建设备包括:存储器304,用于存储程序;处理器303,用于运行存储器中存储的程序,以执行本发明实施例提供的用户画像构建方法。
本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现本发明实施例提供的用户画像构建方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,做出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种用户画像构建方法,其特征在于,所述方法包括:
获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,其中,所述第一用户通信数据包括第一通信对象,以及与所述第一通信对象通话的第一频次信息和第一时长信息,所述第二用户通信数据包括第二通信对象,以及与所述第二通信对象通话的第二频次信息和第二时长信息;
根据所述第一用户通信数据确定第一对象信息,并将除所述第一对象信息之外的第一用户通信数据确定为第二对象信息,其中,所述第一对象信息为用户与第一对象通话的所述第一用户通信数据,所述第一对象为所述第一预设周期内符合预设通话频次阈值,且累计通话时长符合预设通话时长阈值的第一通信对象;
根据所述第二用户通信数据确定第三对象信息,并将除所述第三对象信息之外的第二用户通信数据确定为第四对象信息,其中,所述第三对象信息为用户与第三对象通话的所述第二用户通信数据,所述第三对象为所述第二预设周期内符合所述预设通话频次阈值,且累计通话时长符合预设通话时长阈值的第二通信对象;
将既存在于所述第一对象信息又存在于所述第三对象信息中的联系对象确定为强联系对象,将既存在于所述第二对象信息又存在于第四对象信息中的联系对象确定为弱联系对象;
根据所述强联系对象的数量和所述弱联系对象的数量确定用户标签信息;
根据所述用户标签信息构建用户画像。
2.根据权利要求1所述的方法,其特征在于,所述第一用户通信数据包括第一通信对象、与所述第一通信对象通话的第一频次信息和第一时长信息;
所述根据所述第一用户通信数据确定第一对象信息,并将除所述第一对象信息之外的第一用户通信数据确定为第二对象信息,包括:
获取第一预设周期内符合预设通话频次阈值的第一通信对象以及与所述符合预设通话频次阈值的第一通信对象通话的通话时长;
累计所述通话时长;
将与累计通话时长符合预设通话时长阈值的第一通信对象通话的第一用户通信数据确定为所述第一对象信息;
将除所述第一对象信息之外的第一用户通信数据确定为所述第二对象信息。
3.根据权利要求1所述的方法,其特征在于,所述第二用户通信数据包括第二通信对象、与所述第二通信对象通话的第二频次信息和第二时长信息;
所述根据所述第二用户通信数据确定第三对象信息,并将除所述第三对象信息之外的第二用户通信数据确定为第四对象信息,包括:
获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与所述符合预设通话频次阈值的第二通信对象通话的通话时长;
累计所述通话时长;
将与累计通话时长符合预设通话时长阈值的第二通信对象通话的第二用户通信数据确定为所述第三对象信息;
将除所述第三对象信息之外的第二用户通信数据确定为所述第四对象信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述强联系对象的数量和所述弱联系对象的数量确定用户标签信息,包括:
根据对所述强联系对象以及所述弱联系对象预设的权重系数、所述强联系对象的数量和所述弱联系对象的数量确定用户稳定值,所述用户稳定值用于表征用户在所述第一预设周期内和所述第二预设周期内的联系对象的稳定性;
根据所述用户稳定值确定所述用户标签信息。
5.一种用户画像构建装置,其特征在于,所述装置包括:
获取模块,用于获取第一预设周期内的第一用户通信数据和第二预设周期内的第二用户通信数据,其中,所述第一用户通信数据包括第一通信对象,以及与所述第一通信对象通话的第一频次信息和第一时长信息,所述第二用户通信数据包括第二通信对象,以及与所述第二通信对象通话的第二频次信息和第二时长信息;
确定模块,用于根据所述第一用户通信数据确定第一对象信息,并将除所述第一对象信息之外的第一用户通信数据确定为第二对象信息,其中,所述第一对象信息为用户与第一对象通话的所述第一用户通信数据,所述第一对象为所述第一预设周期内符合预设通话频次阈值,且累计通话时长符合预设通话时长阈值的第一通信对象;
所述确定模块,还用于根据所述第二用户通信数据确定第三对象信息,并将除所述第三对象信息之外的第二用户通信数据确定为第四对象信息,其中,所述第三对象信息为用户与第三对象通话的所述第二用户通信数据,所述第三对象为所述第二预设周期内符合所述预设通话频次阈值,且累计通话时长符合预设通话时长阈值的第二通信对象;
所述确定模块,还用于将既存在于所述第一对象信息又存在于所述第三对象信息中的联系对象确定为强联系对象,将既存在于所述第二对象信息又存在于第四对象信息中的联系对象确定为弱联系对象;
所述确定模块,还用于根据所述强联系对象的数量和所述弱联系对象的数量确定用户标签信息;
构建模块,用于根据所述用户标签信息构建用户画像。
6.根据权利要求5所述的装置,其特征在于,所述第一用户通信数据包括第一通信对象、与所述第一通信对象通话的第一频次信息和第一时长信息;
所述确定模块,具体用于:
获取第一预设周期内符合预设通话频次阈值的第一通信对象以及与所述符合预设通话频次阈值的第一通信对象通话的通话时长;
累计所述通话时长;
将与累计通话时长符合预设通话时长阈值的第一通信对象通话的第一用户通信数据确定为所述第一对象信息;
将除所述第一对象信息之外的第一用户通信数据确定为所述第二对象信息。
7.根据权利要求5所述的装置,其特征在于,所述第二用户通信数据包括第二通信对象、与所述第二通信对象通话的第二频次信息和第二时长信息;
所述确定模块,具体用于:
获取第二预设周期内符合预设通话频次阈值的第二通信对象以及与所述符合预设通话频次阈值的第二通信对象通话的通话时长;
累计所述通话时长;
将与累计通话时长符合预设通话时长阈值的第二通信对象通话的第二用户通信数据确定为所述第三对象信息;
将除所述第三对象信息之外的第二用户通信数据确定为所述第四对象信息。
8.根据权利要求5所述的装置,其特征在于,所述确定模块,还用于:
根据对所述强联系对象以及所述弱联系对象预设的权重系数、所述强联系对象的数量和所述弱联系对象的数量确定用户稳定值,所述用户稳定值用于表征用户在所述第一预设周期内和所述第二预设周期内的联系对象的稳定性;
根据所述用户稳定值确定所述用户标签信息。
9.一种用户画像构建设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行计算机指令时实现如权利要求1-4任意一项所述的用户画像构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-4任意一项所述的用户画像构建方法。
CN201911391725.7A 2019-12-30 2019-12-30 用户画像构建方法、装置、设备及计算机可读存储介质 Active CN113127751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911391725.7A CN113127751B (zh) 2019-12-30 2019-12-30 用户画像构建方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911391725.7A CN113127751B (zh) 2019-12-30 2019-12-30 用户画像构建方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113127751A CN113127751A (zh) 2021-07-16
CN113127751B true CN113127751B (zh) 2023-10-27

Family

ID=76767640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911391725.7A Active CN113127751B (zh) 2019-12-30 2019-12-30 用户画像构建方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113127751B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011221916A (ja) * 2010-04-13 2011-11-04 Ntt Docomo Inc 通信端末、通信システムおよびプログラム
CN106293445A (zh) * 2015-06-29 2017-01-04 腾讯科技(深圳)有限公司 应用程序使用数据的获取方法、装置及终端设备
CN107734200A (zh) * 2017-11-03 2018-02-23 中国人民解放军信息工程大学 一种基于最大似然的通信网用户呼叫行为预测方法及装置
CN107958423A (zh) * 2017-12-20 2018-04-24 广东宜通世纪科技股份有限公司 用户社会关系分析方法及存储介质、服务端
CN108537506A (zh) * 2018-03-30 2018-09-14 努比亚技术有限公司 一种基于用户亲密度的信息提醒方法、装置及存储介质
CN109213771A (zh) * 2018-06-28 2019-01-15 深圳市彬讯科技有限公司 更新画像标签的方法和装置
CN109213802A (zh) * 2018-08-16 2019-01-15 北京百度网讯科技有限公司 用户画像构建方法、装置、终端和计算机可读存储介质
CN109327356A (zh) * 2018-11-20 2019-02-12 中国联合网络通信集团有限公司 一种用户画像的生成方法和装置
CN110110321A (zh) * 2019-03-19 2019-08-09 深圳壹账通智能科技有限公司 基于语音数据的产品推荐方法、装置、设备及存储介质
CN110223166A (zh) * 2019-06-14 2019-09-10 哈尔滨哈银消费金融有限责任公司 基于大数据的消费金融用户贷款逾期的预测方法及设备
CN110276017A (zh) * 2019-06-28 2019-09-24 百度在线网络技术(北京)有限公司 一种数据分析方法及装置
CN110300084A (zh) * 2018-03-22 2019-10-01 北京京东尚科信息技术有限公司 一种基于ip地址的画像方法和装置
CN110515816A (zh) * 2019-08-20 2019-11-29 安徽抖范视频科技有限公司 一种用户行为的分析方法及分析系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140245180A1 (en) * 2013-02-22 2014-08-28 Nokia Corporation Apparatus and method for providing contact-related information items

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011221916A (ja) * 2010-04-13 2011-11-04 Ntt Docomo Inc 通信端末、通信システムおよびプログラム
CN106293445A (zh) * 2015-06-29 2017-01-04 腾讯科技(深圳)有限公司 应用程序使用数据的获取方法、装置及终端设备
CN107734200A (zh) * 2017-11-03 2018-02-23 中国人民解放军信息工程大学 一种基于最大似然的通信网用户呼叫行为预测方法及装置
CN107958423A (zh) * 2017-12-20 2018-04-24 广东宜通世纪科技股份有限公司 用户社会关系分析方法及存储介质、服务端
CN110300084A (zh) * 2018-03-22 2019-10-01 北京京东尚科信息技术有限公司 一种基于ip地址的画像方法和装置
CN108537506A (zh) * 2018-03-30 2018-09-14 努比亚技术有限公司 一种基于用户亲密度的信息提醒方法、装置及存储介质
CN109213771A (zh) * 2018-06-28 2019-01-15 深圳市彬讯科技有限公司 更新画像标签的方法和装置
CN109213802A (zh) * 2018-08-16 2019-01-15 北京百度网讯科技有限公司 用户画像构建方法、装置、终端和计算机可读存储介质
CN109327356A (zh) * 2018-11-20 2019-02-12 中国联合网络通信集团有限公司 一种用户画像的生成方法和装置
CN110110321A (zh) * 2019-03-19 2019-08-09 深圳壹账通智能科技有限公司 基于语音数据的产品推荐方法、装置、设备及存储介质
CN110223166A (zh) * 2019-06-14 2019-09-10 哈尔滨哈银消费金融有限责任公司 基于大数据的消费金融用户贷款逾期的预测方法及设备
CN110276017A (zh) * 2019-06-28 2019-09-24 百度在线网络技术(北京)有限公司 一种数据分析方法及装置
CN110515816A (zh) * 2019-08-20 2019-11-29 安徽抖范视频科技有限公司 一种用户行为的分析方法及分析系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
信息生态理论视角下移动社交媒体使用行为生命周期画像研究;蓝娅萍;《情报探索》;20191215(第12期);第19-25页 *
基于话单数据的移动通信用户画像研究;张海旭等;《计算机系统应用》;20181114(第11期);第273-279页 *

Also Published As

Publication number Publication date
CN113127751A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN107229662B (zh) 数据清洗方法和装置
CN106383766B (zh) 系统监控方法和装置
US11038975B2 (en) Information pushing method and device
CN110659318B (zh) 基于大数据的策略推送方法、系统及计算机设备
US10417274B2 (en) Method and apparatus for pushing information
CN111198988B (zh) 业务推荐方法、训练方法、装置、计算机设备和存储介质
CN111260102A (zh) 一种用户满意度预测方法、装置、电子设备及存储介质
CN112949973A (zh) 一种结合ai的机器人流程自动化rpa流程的生成方法
CN110675179A (zh) 营销信息处理方法、装置、电子设备及可读存储介质
CN113127751B (zh) 用户画像构建方法、装置、设备及计算机可读存储介质
CN113204695B (zh) 网站识别方法和装置
CN114155083A (zh) 基于区块链的交易检测方法、装置、设备及可读存储介质
CN111242713A (zh) 一种信息推送方法和装置
CN107818419B (zh) 一种功能测试范围的确定方法及装置
CN116228301A (zh) 一种目标用户的确定方法、装置、设备及介质
CN112579833B (zh) 基于用户操作数据的业务关联关系获取方法及装置
CN112700270B (zh) 评分数据处理方法、装置、设备及存储介质
CN114938339A (zh) 一种数据处理方法和相关装置
CN110020728B (zh) 业务模型强化学习方法以及装置
CN113689125A (zh) 信息推送方法和装置
CN109669779B (zh) 用于确定数据的清理路径、清理数据的方法和设备
CN114221883A (zh) 消息测试方法、装置、服务器及存储介质
CN113592557A (zh) 广告投放结果的归因方法、装置、存储介质及电子设备
CN108900342B (zh) 电话业务处理方法、电话业务处理装置及服务器
CN109670593A (zh) 一种评估、以及预测深度学习模型中层计算时间的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant