CN113934612A - 用户画像更新方法、装置、存储介质及电子设备 - Google Patents

用户画像更新方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113934612A
CN113934612A CN202111133640.6A CN202111133640A CN113934612A CN 113934612 A CN113934612 A CN 113934612A CN 202111133640 A CN202111133640 A CN 202111133640A CN 113934612 A CN113934612 A CN 113934612A
Authority
CN
China
Prior art keywords
label
portrait
user
current
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111133640.6A
Other languages
English (en)
Inventor
王岩
许胜强
胡加学
屠邦燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202111133640.6A priority Critical patent/CN113934612A/zh
Publication of CN113934612A publication Critical patent/CN113934612A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请实施例公开了一种用户画像更新方法、装置、存储介质及电子设备。该方法包括:处理目标用户在当前更新周期下的当前行为数据得到当前画像标签,获取标签逻辑关系集以及目标用户在历史更新周期中的历史画像标签,并根据标签逻辑关系集中的标签逻辑关系对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签,最后根据有效画像标签对目标用户的用户画像进行更新。本申请实施例中用户画像中的有效画像标签既考虑了历史画像标签,又考虑了当前行为数据对应的当前画像标签,同时还考虑了各画像标签之间的标签逻辑关系,使得有效画像标签的确定更准确,可有效的提高用户画像的准确度。

Description

用户画像更新方法、装置、存储介质及电子设备
技术领域
本申请涉及机器人技术领域,具体涉及一种用户画像更新方法、装置、存储介质及电子设备。
背景技术
用户画像是指服务平台根据每个用户在产品、服务中的用户行为或者观点等数据,所生成的用于描述用户特征/意向的标签集合(即User Profiles)。所谓标签,就是浓缩精炼的、带有特定含义的一系列词语,用于描述真实的用户自身带有的属性特征,方便企业做数据的统计分析。常见的标签分成两大类别:相对静止的标签(静态标签)以及变化中的标签(动态标签)。静态标签是不容易变化的标签,如性别等;动态标签是根据用户的行为等预测出来的。
由于用户行为等会随着时间的推移发生变化,如此,会导致动态标签不准确,从而使得用户画像也不准确。而对于企业来说,较为准确的用户画像是必须的,可帮助企业快速找到精准用户群体以及用户需求,以实现定制用户服务。因此,如何提高用户画像的准确是需要解决的技术问题。
发明内容
本申请实施例提供一种用户画像更新方法、装置、存储介质及电子设备,可以实现对用户画像的更新,提高用户画像的准确性。
本申请实施例提供了一种用户画像更新方法,包括:
基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;
获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;
根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;
根据所述有效画像标签对所述目标用户的用户画像进行更新。
本申请实施例还提供一种用户画像更新装置,包括:
当前标签确定模块,用于基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;
第一获取模块,用于获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;
画像标签确定模块,用于根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;
更新模块,用于根据所述有效画像标签对所述目标用户的用户画像进行更新。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上任一实施例所述的用户画像更新方法中的步骤。
本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,执行如上任一实施例所述的用户画像更新方法中的步骤。
本申请实施例提供的用户画像更新方法、装置、计算机可读存储介质及电子设备,通过处理目标用户在当前更新周期下的当前行为数据,得到当前画像标签,获取标签逻辑关系集、以及目标用户在历史更新周期中的历史画像标签,根据标签逻辑关系集中的标签逻辑关系,对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签,根据有效画像标签对目标用户的用户画像进行更新。本申请实施例中通过引入标签逻辑关系集,根据标签逻辑关系集中的标签逻辑关系,对当前画像标签和历史画像标签进行标签有效性选择处理,来确定目标用户的有效画像标签,使得用户画像中的有效画像标签的确定既考虑了历史画像标签,又考虑了当前行为数据对应的当前画像标签,同时还考虑了各画像标签之间的标签逻辑关系,使得有效画像标签的确定更准确,可有效的提高用户画像的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的用户画像更新方法的一种应用场景示意图。
图2为本申请实施例提供的用户画像更新方法的一种流程示意图。
图3为本申请实施例提供的确定有效画像标签的一种流程示意图。
图4为本申请实施例提供的用户画像更新方法的另一种流程示意图。
图5为本申请实施例提供的推荐等级标签与距离区间对应关系的一种示意图。
图6为本申请实施例提供的用户画像更新装置的一种结构示意图。
图7为本申请实施例提供的用户画像更新装置的另一种结构示意图。
图8本申请实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种用户画像更新方法、装置、计算机可读存储介质及电子设备。具体地,本申请实施例的用户画像更新方法可以由电子设备执行,其中,该电子设备可以为终端或者服务器等设备。该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、机器人、个人计算机(PC,Personal Computer)等终端设备。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群,还可以是提供云服务、云数据库等基础云计算服务的云服务器。
本申请实施例中的用户画像更新方法可适应于对用户画像进行更新的任一场景(即本申请中的目标应用场景)中,例如,目标应用场景可以是活动推广场景、外呼营销场景等;具体的如游戏推广场景、培训课程意向收集场景、金融领域活动推广场景(如新开卡推广场景)、面向运营商领域的电销场景、(5G)流量包外呼营销场景等。在这些场景中,需要对推广或者外呼过的用户进行信息采集和用户画像的构建,用来辅助企业做针对性的推广或者外呼的数据分析。
为了方便理解本申请实施例中的技术方案,下文以(5G)流量包外呼营销场景为例进行说明,其他场景的实现原理与其类似,区别仅为标签和行为数据的具体内容不同。
如图1所示,为本申请实施例提供的用户画像更新方法的一应用场景示意图。在该应用场景中包括电子设备1和电子设备2,电子设备1和电子设备2之间可相互通信。其中,电子设备1是实现外呼操作的设备,如外呼机器人、外呼终端等。该电子设备1可以通过座机号、手机号、其他方式等向用户终端进行外呼操作,电子设备1可收集外呼过程中的呼叫交互语料数据等外呼交互信息。电子设备2可以是电子设备1的服务器设备,该服务器设备用于收集所有电子设备1中收集的数据,如外呼交互信息、用户信息等数据,还可以有其他服务功能。本申请实施例提供的用户画像更新方法可独立运行于电子设备1中,也可以独立运行于电子设备2中,还可以一部分运行于电子设备1中,另一部分运行于电子设备2中。本申请实施例以用户画像更新方法独立运行于电子设备1中为例进行说明。
以下将分别对本申请实施例提供的一种用户画像更新方法、装置、计算机可读存储介质及电子设备进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
图2是本申请实施例提供的用户画像更新方法的一种流程示意图,请参考图2,该用户画像更新方法包括如下步骤:
步骤101,基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签。
其中,目标应用场景以(5G)流量包外呼营销场景为例进行说明。目标应用场景下的行为数据包括外呼营销场景中的外呼交互信息,如外呼交互语料数据等。画像标签集为目标应用场景下当前所有用户的画像标签的集合,例如,在(5G)流量包外呼营销场景下的画像标签包括:不怎么用流量、升级5G流量没用、没有5G手机、想用移动卡、已经有移动卡、用户无原因拒绝、用户同意、无画像标签、流量够用等。在其他应用场景中,行为数据还可以是调查问卷中选择的调查结果等,各不同应用场景中对应的行为数据可能会不同,对应的画像标签集也存在不同。
对于(5G)流量包外呼营销场景来说,当前行为数据可以按照外呼次数来确定,也可以按照时间来确定,可以是本次所对应的外呼交互信息,还可以是半小时内的外呼交互信息/当天的外呼交互信息等。因此,当前更新周期对应的可以次数为单位,还可以时间为单位,或者还可以为其他的单位等。本申请实施例中以次数为单位进行说明。
在目标应用场景中,行为数据与画像标签集中各画像标签存在对应关系,该对应关系可根据行为分析算法计算得到。利用行为分析算法处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签。
在一实施例中,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签的步骤,包括:获取目标应用场景中目标用户在当前更新周期下的当前行为数据;对当前行为数据进行行为分析,以得到至少一个候选画像标签;当候选画像标签为一个时,将候选画像标签直接作为目标用户的当前行为数据对应的当前画像标签;当得到的候选画像标签包括多个、且多个候选画像标签中的标签逻辑关系包括包含关系时,删除包含关系中的被包含画像标签,并将剩余的候选画像标签作为目标用户的当前行为数据对应的当前画像标签。
获取(5G)流量包外呼营销场景中的目标用户在本次的外呼交互语料数据,如外呼交互记录所对应的外呼交互文本等,如图3所示,获取不同目标用户的外呼交互记录;接着对外呼交互语料数据进行语料行为分析,可通过算法模型对交互语料数据进行语料行为分析,以得到至少一个候选画像标签。
经观察和数据分析,画像标签有一个明显的现象,即同一个目标用户,在目标用户的下一次外呼交互中并不会表达上次外呼交互同样的画像标签。如:上次外呼交互后得到的画像标签为“不怎么用流量”的目标用户,可能在下次外呼交互中什么信息也没有透露,即无画像标签,也有可能是出现了新的画像标签(对5G流量包并不感兴趣,周围环境也不支持5G等等),不同画像标签有不同的含义,在画像标签更新时不能是简单的直接删除或者新增,不然会导致画像标签的不准确。
同时,目标用户在一次外呼交互中也可能会出现前后完全不一致的外呼交互语料或者是类似的外呼交互语料或者是重复的外呼交互语料,利用算法模型对交互语料数据进行语料行为分析之后,得到的多个候选画像标签中,可能有重复的画像标签或者是其中一个画像标签包含了另一个画像标签,这些情况下,对画像标签更新也会产生一定的影响。
因此,本申请实施例中定义了画像标签之间的标签逻辑关系,其中,标签逻辑关系包括相同关系、包含关系、被包含关系、并列关系、冲突关系。其中:
相同关系指的是两个画像标签的文本内容/语义内容等实质内容完全相同。
包含关系/被包含关系,两个画像标签(第一画像标签和第二画像标签)之间的包含关系和被包含关系同时存在,第一画像标签被第二画像标签包含,对应的,第二画像标签包含第一画像标签。
并列关系,用于描述相近的画像标签,两个相近的画像标签可以同时出现,直接取并集。
冲突关系,指的是两个决定不可能同时出现在一个目标用户上的画像标签。取最新的不冲突的画像标签。
例如,若本次外呼交互对应的当前画像标签被历史外呼交互对应的历史画像标签(如上次外呼交互对应的上次画像标签)包含,就取历史外呼交互对应的历史画像标签(如上次外呼交互对应的上次画像标签)。本次外呼交互对应的当前画像标签包含历史外呼交互对应的历史画像标签(如上次外呼交互对应的上次画像标签),就取本次外呼交互对应的当前画像标签。其中,默认空画像标签被所有画像标签包含,出现无原因拒绝被有原因拒绝包含。
例如,假设有画像标签A(用户无原因拒绝)和画像标签B(不怎么用流量),则
Figure BDA0003281438320000072
则画像标签A和画像标签B之间存在包含关系和被包含关系,画像标签A被画像标签B包含,画像标签B包含画像标签A,在该标签逻辑关系中,画像标签A为被包含画像标签、画像标签B为包含标签。
例如,若本次外呼交互对应的当前画像标签为A,上次外呼交互对应的上次画像标签为B,则画像标签B需要保留;若本次外呼交互对应的当前画像标签为B,上次外呼交互对应的上次画像标签为A,则画像标签A需要删除。
如表1所示,表1中以第一画像标签和第二画像标签为例进行说明画像标签之间的相同关系、包含关系、并列关系、冲突关系。
表1画像标签之间的标签逻辑关系
Figure BDA0003281438320000071
需要注意的是,当所得到的候选画像标签有多个,且多个候选画像标签中的标签逻辑关系包括包含关系时,删除包含关系中的被包含画像标签,将剩余的候选画像标签作为目标用户的当前行为数据对应的当前画像标签,如此,通过删除包含关系中的被包含画像标签,使得得到的当前画像标签中既可以保留真正有用的画像标签,又避免其中无用的画像标签对用户画像的影响。
另外,所得到的候选画像标签有多个时,只删除包含关系中的被包含画像标签,若所得到的多个候选画像标签中包括其他标签逻辑关系,则将所得到的多个候选画像标签全部保留,作为当前画像标签。
如图3所示,用户标识1111所得到的当前画像标签为:无需求-流量够用;用户标识1112所得到的当前画像标签为:考虑犹豫。
该步骤中,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签。
步骤102,获取标签逻辑关系集、以及目标用户在历史更新周期中的历史画像标签,其中,标签逻辑关系集包括画像标签集中各画像标签之间的标签逻辑关系。
其中,若当前更新周期以次数为单位,如一次,对应地,当前行为数据是本次所对应的外呼交互信息,历史更新周期则包括本次之前的所有次数,或者本次之前在预设时间段内的所有次数,如在本次之前两天内的所有次数,历史更新周期中的历史画像标签,则对应的是目标用户上次更新后的画像标签,或者是目标用户利用在本次之前的预设时间段内的外呼交互信息,更新得到的画像标签。
若当前更新周期以时间为单位,如半天,对应的,当前行为数据是目标用户在半天内的外呼交互信息,历史更新周期则包括半天前的所有时间,或者半天前的预设时间内,如半天前的两天内;历史画像标签对应的是目标用户利用半天前的所有外呼交互信息更新得到的画像标签,或者目标用户利用在半天前的两天内所对应的外呼交互信息更新得到的画像标签。
本申请实施例中,以当前更新周期以本次,当前画像标签为本次外呼交互对应的画像标签,历史更新周期为本次之前的所有次数,历史画像标签为本次之前的所有次外呼交互对应的画像标签为例说明。
需要说明的是,虽然目标用户每次的外呼交互记录和对应的外呼交互信息都会被保存,但一个目标用户对应的画像标签是唯一的,即最终确定的画像标签(后文中提到的有效画像标签)。
标签逻辑关系集中包括画像标签集中各画像标签之间的标签逻辑关系,标签逻辑关系对应有逻辑关系权重。不同的标签逻辑关系所对应的逻辑关系权重不同。
例如,并列关系所对应的逻辑关系权重为1,冲突关系所对应的逻辑关系权重为-1,相同关系所对应的逻辑关系权重也为1;对于包含关系,如画像标签A(用户无原因拒绝)和画像标签B(不怎么用流量),则
Figure BDA0003281438320000091
定义逻辑关系权重T(AB)=1,其中,当前画像标签A,历史画像标签B,历史画像标签B需要保留;定义逻辑关系权重T(BA)=0,其中,当前画像标签B,历史画像标签A,当前画像标签A需要删除。
其中,标签逻辑关系集可以用矩阵表示,也可以用向量表示,或者用其他合适的方式来表示。
在一实施例中,标签逻辑关系集包括标签转移矩阵,所述标签转移矩阵包括矩阵元素,所述矩阵元素用于表征画像标签之间的标签逻辑关系。
在一实施例中,在获取标签逻辑关系集之前,还包括:根据画像标签集中所有画像标签、以及所有画像标签中各画像标签之间的标签逻辑关系,构建标签转移矩阵。
在一实施例中,所述根据画像标签集中所有画像标签、以及所有画像标签中各画像标签之间的标签逻辑关系,构建标签转移矩阵的步骤,包括:获取画像标签集中所有画像标签的标签数量N,所述N为大于零的正整数;构建维度为N*N的初始标签矩阵,其中,所述初始标签矩阵中的每个维度对应一个画像标签;根据所有画像标签中各画像标签之间的标签逻辑关系,填充初始标签矩阵,以得到标签转移矩阵。
例如,画像标签集中所有画像标签的标签数量为3,则构建维度为3*3的初始标签矩阵,即初始标签矩阵的行和列的数量都与标签数量相同,行所在的每个维度对应一个画像标签,列所在的每个维度对应一个画像标签。
得到初始标签矩阵之后,根据所有画像标签中各画像标签之间的标签逻辑关系,填充初始标签矩阵,以得到标签转移矩阵。
在一实施例中,所述根据所有画像标签中各画像标签之间的标签逻辑关系,填充初始标签矩阵,以得到标签转移矩阵的步骤,包括:获取所有画像标签中各画像标签之间的标签逻辑关系所对应的逻辑关系权重;根据逻辑关系权重,填充初始标签矩阵,以得到标签转移矩阵。在该实施例中,以逻辑关系权重来表示对应的标签逻辑关系,将标签逻辑关系进行了量化,以便于计算。
例如,假设画像标签集中所有画像标签的标签数量为3,其中,画像标签D=想用移动卡,画像标签E=不怎么用流量,画像标签F=已经有移动卡。此时画像标签D和画像标签E为并列关系,对应的逻辑关系权重为1,或者也可以理解为用1来表示画像标签D和画像标签E之间的并列关系;画像标签D和画像标签F为冲突关系,对应的逻辑关系权重为-1,或者理解为用-1来表示画像标签D和画像标签F之间的冲突关系;画像标签E和画像标签F为并列关系,对应的逻辑关系权重为1,或者理解为用1来表示画像标签E和画像标签F之间的并列关系。根据逻辑关系权重,填充初始标签矩阵之后,得到的标签转移矩阵如表2所示。需要注意的是,表2中的表头等信息为了方便理解。
表2标签转移矩阵示例一
Figure BDA0003281438320000101
例如,假设画像标签集中所有画像标签的标签数量为3,其中,画像标签A=用户无原因拒绝,画像标签B=不怎么用流量,画像标签C=升级5G流量包没用,没有5G手机。其中,
Figure BDA0003281438320000102
逻辑关系权重T(AB)=1,逻辑关系权重T(BA)=0,逻辑关系权重T(AC)=1,逻辑关系权重T(CA)=0。画像标签B和画像标签C之间属于并列关系,对应的逻辑关系权重为1。根据逻辑关系权重,填充初始标签矩阵之后,得到的标签转移矩阵如表3所示。
表3标签转移矩阵示例二
Figure BDA0003281438320000103
需要注意的是,上述逻辑关系权重只是举例说明而已,在其他实施例中还可以采用其他的逻辑关系权重来表示等。
可以理解的是,当标签逻辑关系集包括标签转移矩阵时,在获取标签转移矩阵之前,就可构建标签转移矩阵,即预先构建标签转移矩阵。如此,获取标签转移矩阵,即为获取预先构建的标签转移矩阵。由于该标签转移矩阵中包括画像标签集中各画像标签之间的逻辑关系权重,因此在确定每个目标用户的有效画像标签时,都可使用该标签转移矩阵,提高了标签转移矩阵的适用性;且预先构建标签转移矩阵,在具体确定每个目标用户的有效画像标签时,无需构建该标签转移矩阵,直接使用该标签转移矩阵,提高有效画像标签的确定速度。
当目标应用场景的画像标签集中新增新的画像标签时,可根据新增的画像标签与其他画像标签之间的标签逻辑关系(所对应的逻辑关系权重)更新该标签转移矩阵。如新增的画像标签为1个时,标签转移矩阵需新增一行和一列的数据。
步骤103,根据标签逻辑关系集中的标签逻辑关系,对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签。
其中,有效画像标签也可理解为目标用户的最终画像标签。根据标签逻辑关系集中的标签逻辑关系,对当前画像标签和历史画像标签进行标签有效性选择处理,以得到目标用户在当前更新周期内的最终画像标签。即根据标签逻辑关系对应的逻辑关系权重来确定目标用户的有效画像标签。如此,使得目标用户有效画像标签的确定不仅考虑了当前画像标签,还考虑了历史画像标签,同时还考虑了当前画像标签和历史画像标签的标签逻辑关系,提高有效画像标签确定的准确性,进一步提高用户画像的准确性。
在一实施例中,步骤103,包括:根据标签逻辑关系集中的标签逻辑关系,查找当前画像标签和历史画像标签之间的目标标签逻辑关系,得到目标标签逻辑关系集;根据目标标签逻辑关系集,对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签。
其中,在标签转移矩阵中查找当前画像标签和历史画像标签所对应的目标标签逻辑关系,将所有的目标标签逻辑关系作为目标标签逻辑关系集。具体地,将标签转移矩阵中当前画像标签和历史画像标签交叠处置处对应的逻辑关系权重,作为目标标签逻辑关系集(对应的逻辑关系权重)。根据目标标签逻辑关系集(对应的逻辑关系权重),对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签。
在一实施例中,上述根据目标标签逻辑关系集,对当前画像标签和历史画像标签进行标签有效性选择处理,得到目标用户在当前更新周期内的有效画像标签的步骤,包括:根据目标标签逻辑关系集,对历史画像标签进行第一有效性选择处理,以确定历史影响画像标签;对历史影响画像标签和当前画像标签进行第二有效性选择处理,得到目标用户在当前更新周期内的有效画像标签。
其中,利用目标标签逻辑关系集(对应的逻辑关系权重),对历史画像标签进行第一有效性选择处理,以确定历史影响画像标签。在一实施例中,将目标标签逻辑关系集与历史画像标签所对应的集合进行相乘处理,以得到历史影响画像标签。在其他实施例中,还可以按照其他方式进行第一有效性选择处理。
得到历史影响画像标签之后,根据历史影响画像标签和当前画像标签进行第二有效性选择处理,以得到有效画像标签。在一实施例中,将历史影响画像标签和当前画像标签进行并集处理,将并集处理之后得到的画像标签作为目标用户在当前更新周期内的有效画像标签,将并集处理之后得到的画像标签的系数作为有效画像标签中对应画像标签的权重系数。该权重系数可用于表示对应的画像标签的重要性程度。在其他实施例中,还可以按照其他方式来进行第二有效性选择处理。
在一实施例中,在得到目标用户在当前更新周期内的有效画像标签的步骤之后,用户画像更新方法,还包括:获取有效画像标签中的各画像标签的权重系数;根据权重系数确定各画像标签的重要性程度,并根据重要性程度从有效画像标签中选择画像标签作为当前更新周期内的主画面标签,例如,从有效画像标签中选择重要性程度最高的画像标签作为目标用户在当前更新周期内的主画像标签。在该实施例中,可根据权重系数来确定有效画像标签中的各画像标签的权重系数,并根据权重系数确定重要性程度,可实现根据重要性程度高低来输出或者显示有效画像标签中的各画像标签,也可根据重要性程度来确定主画像标签等等。
在一实施例中,定义有效画像标签为now’,则now’可按照如下运算方式来计算得到:
now’=gen-eye(now)*nowT+T_n_o*oldT
其中,now表示当前画像标签,nowT表示当前画像标签now的转置,gen-eye(now)表示生成当前画像标签的单位矩阵,old表示历史画像标签,oldT表示历史画像标签的转置,T_n_o表示目标标签逻辑关系集,T_n_o*oldT的结果表示历史影响画像标签,gen-eye(now)*nowT表示对应的当前画像标签。该实施例中利用矩阵方式确定有效画像标签,可大大提高画像输出确定的速度。
需要注意的是,还可以按照其他的运算方式来确定有效输出标签。
以表2所示的标签转移矩阵为例进行说明,假设当前画像标签为now=[D,E]=[想用移动卡,不怎么用流量],历史画像标签为old=[E,F]=[不怎么用流量,已经有移动卡]。在表2中查找当前画像标签(画像标签D所在行和画像标签E所在行)和历史画像标签(画像标签E所在列,画像标签F所在列)交叠位置处对应的逻辑关系权重,将该逻辑关系权重作为目标标签逻辑关系集(对应的逻辑关系权重)。对应地,目标标签逻辑关系集(对应的逻辑关系权重)如表4所示。
表4目标标签逻辑关系集示例一
1 -1
1 1
根据目标标签逻辑关系集对历史画像标签old=[E,F]进行第一有效性选择处理,即将目标标签逻辑关系集和历史画像标签old的转置进行相乘,T_n_o*oldT,得到的历史影响画像标签为2E。
对于当前画像标签now=[D,E],生成gen-eye(now),如表5所示。其中,表5的表头为了便于理解。
表5gen-eye(now)示例
当前画像标签 画像标签D 画像标签E
画像标签D 1 0
画像标签E 0 1
利用gen-eye(now)*nowT得到当前画像标签A+B。
再根据当前画像标签和历史影响画像标签进行并集处理,得到now’=D+E+2E=D+3E。
如此,得到有效画像标签为D(想用移动卡)、E(不怎么用流量),其中,画像标签D的权重系数为1,画像标签E的权重系数为3,意味着画像标签E出现的次数较多,显然对目标用户的影响程度越大,将画像标签E作为目标用户在当前更新周期内的主画像标签,可按照重要性程度的顺序存储或者显示有效画像标签,例如存储为画像标签E(不怎么用流量)、画像标签D(想用移动卡)。
同样以表2所示的标签转移矩阵为例,假设本次标签为now=[D]=[想用移动卡],历史标签为old=[E,F]=[不怎么用流量,已经有移动卡],在表2中查找当前画像标签(画像标签D所在行)和历史画像标签(画像标签E所在列,画像标签F所在列)交叠位置处对应的逻辑关系权重,以得到目标标签逻辑关系集(对应的逻辑关系权重)[1,-1]。根据目标标签逻辑关系集[1,-1]对历史画像标签old=[E,F]进行第一有效性选择处理,得到的历史影响画像标签为E-F。而当前画像标签为D,如此,得到的now’=D+E-F。由于-F表示画像标签D和画像标签F为冲突关系,因此,最终的有效画像标签为画像标签D(想用移动卡)、画像标签E(不怎么用流量)。由于权重相同,对应的重要性程度相同。
以表3所示的标签转移矩阵为例进行说明,假设当前画像标签为now=[A]=[用户无原因拒绝],历史画像标签为old=[B,C]=[不怎么用流量,升级5G流量包没用没有5G手机]。在表3中查找当前画像标签(画像标签A所在行)和历史画像标签(画像标签B所在列,画像标签C所在列)交叠位置处对应的逻辑关系权重,以得到目标逻辑关系集(对应的逻辑关系权重)[1,1]。根据目标标签逻辑关系集[1,1]对历史画像标签old=[B,C]进行第一有效性选择处理,得到的历史影响画像标签为B+C。而当前画像标签为画像标签A,如此,得到now’=A+B+C,即有效画像标签为画像标签A,画像标签B,画像标签C。
需要注意的是,以上画像标签A、画像标签B、画像标签C、画像标签D、画像标签E、画像标签F只是举例说明而已,并不构成限定。
如图3所示,用户标识1111所得到的有效画像标签为:无需求-流量够用;用户标识1112所得到的有效画像标签为:考虑犹豫。
下面以5G流量包外呼营销场景为例进行说明。其中,以当前行为数据为本次外呼交互信息(包括本次外呼交互记录),历史行为数据为上次外呼交互信息(包括上次外呼交互记录),当前画像标签为本次画像标签,历史画像标签为上次画像标签为例,根据当前画像标签和历史画像标签最终确定的有效画像标签可如表6所示。
表6 5G流量包外呼营销场景示例
Figure BDA0003281438320000151
Figure BDA0003281438320000161
步骤104,根据有效画像标签对目标用户的用户画像进行更新。
在得到有效画像标签后,对目标用户的用户画像进行更新。
在一实施例中,当目标用户的有效画像标签与用户画像中的画像标签(历史画像标签)不同时,使用有效画像标签更新用户画像中的画像标签;当目标用户的有效画像标签与用户画像中的画像标签相同时,可使用有效画像标签更新用户画像中的画像标签,也可不对用户画像中的画像标签进行任何处理。
该实施例通过引入标签逻辑关系集,根据标签逻辑关系集中的标签逻辑关系,对当前画像标签和历史画像标签进行标签有效性选择处理,来确定目标用户的有效画像标签,使得用户画像中的有效画像标签的确定既考虑了历史画像标签,又考虑了当前行为数据对应的当前画像标签,同时还考虑了各画像标签之间的标签逻辑关系,使得有效画像标签的确定更准确,可有效的提高用户画像的准确度。
在上述用户画像更新方法的基础上,图4为本申请实施例提供的用户画像更新方法的另一种流程示意图,如图4所示,该流程示意图对应的用户画像更新方法包括如下步骤:
步骤201,获取目标应用场景下多个用户的基本信息、各用户在目标应用场景中的业务信息、以及各用户对所述业务信息的响应信息。
用户基本信息包括用户年龄、性别、所属地域等。
用户在目标应用场景中的业务信息包括外呼营销场景中的推广套餐信息、当前更新周期下的当前行为数据,以及对应用户画像中的有效画像标签等。画像标签可根据上述任一实施例中所述的方法得到的有效画像标签。其中,当前行为数据包括外呼交互信息,例如,交互时长、交互论述、外呼交互文本、用户交互路径、挂机明细等信息。
用户对所述业务信息的响应信息,表示用户对外呼营销场景中的推广套餐信息的订购信息/订阅信息,包括:已订购/已订阅、未订购/未订阅等。
用户基本信息、业务信息和响应信息,可如表6所示。需要注意的是,表6只是一个示例,并不构成限定。
表6用户基本信息、业务信息和响应信息示例
Figure BDA0003281438320000171
Figure BDA0003281438320000181
需要注意的是,根据应用场景的不同,所对应的基本信息、业务信息和响应信息也会有不同。
步骤202,对各用户的基本信息、业务信息和响应信息进行编码,以构建各用户对应的特征数据,并将各用户对应的特征数据作为各样本,以得到样本集。
在一实施例中,所述对各用户的基本信息、业务信息和响应信息进行编码,以构建各用户对应的特征数据的,包括:将各用户的基本信息、业务信息和响应信息中的数字信息和可枚举的文本信息,采用独热编码方式进行编码;将各用户的基本信息、业务信息和响应信息中的非枚举(不可枚举)的文本信息,采用文本向量方式进行编码;将各用户编码之后的信息作为各用户对应的特征数据。
例如,表6中的交互时长、交互轮数、超出收费标准、流量等对应的是数字信息;性别、年龄、地域、推广套餐信息、画像标签、用户路径、挂机明细、订购信息/订阅信息等对应的是可枚举的文本信息;外呼交互文本对应的是不可枚举的文本信息。
对于数字信息和可枚举的文本信息,采用独热编码的方式来进行编码。例如,对于性别,有“男”和“女”,采用独热编码的方式会构建一个1*2的矩阵,用[0,1]来表示性别“男”所对应的特征数据,[1,0]来表示性别“女”所对应的特征数据;对于画像标签,假设画像标签集中的画像标签的标签数量为6,采用独热编码的方式会构建一个1*6的矩阵,用[1,0,0,0,0,0]来表示当然当前用户对应的画像标签的特征数据,该当前用户对应的画像标签为画像标签集中的第一个画像标签,用[1,0,0,1,1,0]来表示当前用户对应的画像标签的特征数据,该当前用户对应的画像标签包括画像标签集中的第一个画像标签、第四个画像标签、第五个画像标签。
对于不可枚举的文本信息,采用文本向量方式进行编码。例如,对于外呼交互文本可采用词频-逆向文件频率(term frequency–inverse document frequency,TF-IDF)来进行编码。假设文本库里面有5000个词,那么对应设置1*5000的矩阵,然后使用TF-IDF的方式计算得到当前外呼交互文本中的每个词的概率,例如0.9等,然后将当前外呼交互文本的每个词在对应矩阵的位置处填充其概率,以得到外呼交互文本对应的特征数据。
对于不可枚举的文本信息,还可以采用词向量等方式来进行编码。
上述编码方式只是得到对应特征数据的一种方式,还可以采用其他任何方式得到对应特征数据。
得到每个用户的特征数据,将每个用户作为一个样本,如此,得到样本集。
步骤203,从样本集中获取响应信息为已订阅的目标样本的特征数据,并根据目标样本的特征数据,确定样本集中响应信息为未订阅的待分类样本对应用户的用户画像的推荐等级标签,该推荐等级标签用于对待分类样本对应的用户进行对应业务的推荐。
例如,从样本集中获取响应信息为已订阅/已订购的目标样本的特征数据,将目标用本的特征数据作为种子,确定未订阅的用户的推荐等级标签。
其中,推荐等级标签用于表示后续向未订阅/未订购的用户推荐对应业务的等级的标签,该推荐等级标签可包括高、中、低、无等四个标签;或者也可以理解为根据对应的特征数据确定未订阅/未订购的用户的订阅意向等级,订阅意向越高,对应的推荐等级越高,订阅意向越低,对应的推荐等级越低,无订阅意向,则对应的推荐等级为无。
在一实施例中,步骤203,包括:初始化第一原型向量,所述第一原型向量中包括目标样本,第一原型向量用于存放推荐等级标签为第一推荐等级标签的多个样本;根据第一原型向量中的目标样本的特征数据和第一推荐等级标签,对样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定待分类样本对应的用户的目标推荐等级标签,并根据目标推荐等级标签待分类样本聚类至与所述目标推荐等级标签匹配的样本簇中。
其中,初始化的第一原型向量为包括目标样本的向量。目标样本为已订阅/已订购的样本,已订阅/已订阅的目标样本对应的第一推荐等级标签为高。若推荐等级标签包括四个推荐等级,则第一原型向量只对应一个推荐等级标签。
在一实施例中,上述根据第一原型向量中的目标样本的特征数据和第一推荐等级标签,对样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定待分类样本对应的用户的目标推荐等级标签的步骤,包括:确定样本集中响应信息为未订阅的待分类样本的特征数据,与第一原型向量中的目标样本的特征数据的距离;根据距离划分距离区间,所述距离区间的数量与预设的多个推荐等级标签的数量相同,每个距离区间根据对应的距离大小和第一推荐等级标签确定一个对应的推荐等级标签;根据所述距离所属的距离区间来确定待分类样本对应用户的用户画像的目标推荐等级标签。
在一实施例中,计算待分类样本对应的用户的特征数据与目标样本对应的用户的特征数据的距离,并根据距离划分距离区间,其中,距离区间的数量与预设的多个推荐等级标签的数量相同,如为四个。其中,划分距离区间并不是按照等分来划分。将所计算出来的距离划分为四个距离区间,将与第一原型向量的距离最近的距离区间确定为推荐等级标签为高的距离区间,将与第一原型向量的距离第二远的距离区间确定为推荐等级标签为中的距离区间,将与第一原型向量的距离第三远的距离区间确定为推荐等级标签为低的距离区间,将与第一原型向量的距离最远的距离区间确定为推荐等级标签为无的距离区间。如此,根据调整数据之间的距离可确定未订阅的待分类样本的用户对应的推荐等级标签。
在一实施例中,在确定推荐等级标签之后,根据推荐等级标签待分类样本聚类至与推荐等级标签匹配的样本簇中。例如,将推荐等级标签为无的待分类样本聚类至一个样本簇中,将推荐等级标签为中的待分类样本聚类至另一个样本簇中等。
如图5所示,计算待分类样本的特征数据与目标样本的特征数据的距离,根据距离划分四个距离区间,如距离区间1、距离区间2、距离区间3、距离区间4,根据待分类样本的特征数据与目标样本的特征数据的距离所述的距离区间,来确定距离区间所对应的四个不同的推荐等级标签,如高、中、低、无等,根据推荐等级标签将对应的待分类样本分别聚类至四个不同的样本簇中,如样本簇1、样本簇2、样本簇3、样本簇4。
该实施例根据无监督聚类的方式来确定待分类样本对应用户的推荐等级标签,可快速地确定对应用户的推荐等级标签。
确定未订阅的待分类样本对应的推荐等级标签后,可更新用户画像,且可根据推荐等级标签对待分类样本对应的用户进行对应业务的推荐,例如,可针对推荐等级标签为高的用户进行优先外呼,对于推荐等级标签为低的用户,可改变后呼策略来尽快转换用户。如此,根据推荐等级标签可有助于相关人员进行针对性分析和优,根据推荐等级标签来指导后续的外呼策略等,指导用户的营销,有助于企业快速找到精准用户群体以及用户需求,以实现定制用户服务。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
为便于更好的实施本申请实施例的用户画像更新方法,本申请实施例还提供一种用户画像更新装置。
请参阅6,图6为本申请实施例提供的用户画像更新装置的结构示意图。该用户画像更新装置可以包括当前标签确定模块301,第一获取模块302,画像标签确定模块303,以及更新模块304。
其中,当前标签确定模块301用于基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签。
在一实施例中,当前标签确定模块301在执行所述处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签的步骤时,具体执行:获取目标应用场景中目标用户在当前更新周期下的当前行为数据;对所述当前行为数据进行行为分析,以得到至少一个候选画像标签;当所述候选画像标签为一个时,将所述候选画像标签作为所述目标用户的所述当前行为数据对应的当前画像标签;当所述候选画像标签包括多个、且多个候选画像标签中的标签逻辑关系包括包含关系时,删除包含关系中的被包含画像标签,并将剩余的候选画像标签作为所述目标用户的所述当前行为数据对应的当前画像标签。
其中,第一获取模块302用于获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系。
在一实施例中,所述标签逻辑关系集包括标签转移矩阵,所述标签转移矩阵包括矩阵元素,所述矩阵元素用于表征所述画像标签之间的标签逻辑关系。
在一实施例中,如图6所示,所述用户画像更新装置还包括构建模块305。其中,构建模块305用于根据所述画像标签集中所有画像标签、以及所有画像标签中各画像标签之间的标签逻辑关系,构建标签转移矩阵。
在一实施例中,构建模块305在执行所述根据所述画像标签集中所有画像标签、以及所有画像标签中各画像标签之间的标签逻辑关系,构建标签转移矩阵的步骤时,具体执行:获取所述画像标签集中所有画像标签的标签数量N,所述N为大于零的正整数;构建维度为N*N的初始标签矩阵,其中,所述初始标签矩阵中的每个维度对应一个画像标签;根据所有画像标签中各画像标签之间的标签逻辑关系,填充所述初始标签矩阵,以得到标签转移矩阵。
在一实施例中,构建模块305在执行所述根据所有画像标签中各画像标签之间的标签逻辑关系,填充所述初始标签矩阵,以得到标签转移矩阵的步骤时,具体执行:获取所有画像标签中各画像标签之间的标签逻辑关系所对应的逻辑关系权重;根据所述逻辑关系权重,填充所述初始标签矩阵,以得到标签转移矩阵。
在一实施例中,所述标签逻辑关系包括包含关系、被包含关系、并列关系、冲突关系。
其中,画像标签确定模块303用于根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签。
在一实施例中,画像标签确定模块303在执行根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤时,具体执行:根据所述标签逻辑关系集中的标签逻辑关系,查找所述当前画像标签和所述历史画像标签之间的目标标签逻辑关系,得到目标标签逻辑关系集;根据所述目标标签逻辑关系集,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签。
在一实施例中,画像标签确定模块303在执行所述根据所述目标标签逻辑关系集,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤时,具体执行:根据所述目标标签逻辑关系集,对所述历史画像标签进行第一有效性选择处理,以确定历史影响画像标签;对所述历史影响画像标签和所述当前画像标签进行第二有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签。
在一实施例中,所述第二有效性选择处理包括并集处理,画像标签确定模块303在执行所述对所述历史影响画像标签和所述当前画像标签进行第二有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤时,具体执行:将所述历史影响画像标签和所述当前画像标签进行并集处理;将并集处理之后得到的画像标签作为所述目标用户在当前更新周期内的有效画像标签,将并集处理之后得到的画像标签的系数作为所述有效画像标签中对应画像标签的权重系数。
在一实施例中,画像标签确定模块303在执行所述得到所述目标用户在当前更新周期内的有效画像标签的步骤之后,还执行:获取所述有效画像标签中的各画像标签的权重系数;根据所述权重系数确定各画像标签的重要性程度,并根据所述重要性程度从所述有效画像标签中选择画像标签作为所述目标用户在当前更新周期内的主画像标签。
其中,更新模块304用于根据所述有效画像标签对所述目标用户的用户画像进行更新。
在一实施例中,如图7所示,用户画像更新装置还可以包括第二模块306,编码模块307、以及推荐标签确定模块308。
其中,第二获取模块306用于获取所述目标应用场景下多个用户的基本信息、各用户在目标应用场景中的业务信息、以及各用户对所述业务信息的响应信息,所述业务信息包括所述当前更新周期下的当前行为数据,以及对应用户画像中的有效画像标签,所述有效画像标签是根据上述任一实施例所述的用户画像更新方法得到的,或者是根据上述任一实施例所述的用户画像更新装置得到的。
其中,编码模块307用于对各用户的所述基本信息、所述业务信息和所述响应信息进行编码,以构建各用户对应的特征数据,并将各用户对应的特征数据作为各样本,以得到样本集。
在一实施例中,编码模块307,具体用于将各用户的所述基本信息、所述业务信息和所述响应信息中的数字信息和可枚举的文本信息,采用独热编码方式进行编码;将各用户的所述基本信息、所述业务信息和所述响应信息中的非枚举的文本信息,采用文本向量方式进行编码;将各用户编码之后的信息作为所述各用户对应的特征数据。
其中,推荐标签确定模块308用于从所述样本集中获取所述响应信息为已订阅的目标样本的特征数据,并根据目标样本的特征数据,确定所述样本集中响应信息为未订阅的待分类样本对应用户的用户画像的推荐等级标签,其中,所述推荐等级标签用于对所述待分类样本对应的用户进行对应业务的推荐。
在一实施例中,推荐标签确定模块308具体用于初始化第一原型向量,所述第一原型向量中包括目标样本,所述第一原型向量用于存放推荐等级标签为第一推荐等级标签的多个样本;根据所述第一原型向量中的所述目标样本的特征数据和所述第一推荐等级标签,对所述样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定所述待分类样本对应用户的用户画像的目标推荐等级标签,并根据所述目标推荐等级标签待分类样本聚类至与所述目标推荐等级标签匹配的样本簇中。
在一实施例中,推荐标签确定模块308在执行所述根据所述第一原型向量中的所述目标样本的特征数据和所述第一推荐等级标签,对所述样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定所述待分类样本对应用户的用户画像的目标推荐等级标签的步骤时,具体执行:确定所述样本集中响应信息为未订阅的待分类样本的特征数据,与所述第一原型向量中的目标样本的特征数据的距离;根据所述距离划分距离区间,所述距离区间的数量与预设的多个推荐等级标签的数量相同,每个距离区间根据对应的距离大小和第一推荐等级标签确定一个对应的推荐等级标签;根据所述距离所属的距离区间来确定所述待分类样本对应用户的用户画像的目标推荐等级标签。
上述所有的技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
相应的,本申请实施例还提供一种电子设备,该电子设备可以为终端或者服务器。如图8所示,图8为本申请实施例提供的电子设备的结构示意图。该电子设备400包括有一个或者一个以上处理核心的处理器401、有一个或一个以上计算机可读存储介质的存储器402及存储在存储器402上并可在处理器上运行的计算机程序。其中,处理器401与存储器402电性连接。本领域技术人员可以理解,图中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器401是电子设备400的控制中心,利用各种接口和线路连接整个电子设备400的各个部分,通过运行或加载存储在存储器402内的软件程序(计算机程序)和/或模块,以及调用存储在存储器402内的数据,执行电子设备400的各种功能和处理数据,从而对电子设备400进行整体监控。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能:
基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;根据所述有效画像标签对所述目标用户的用户画像进行更新。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图8所示,电子设备400还包括:触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407。其中,处理器401分别与触控显示屏403、射频电路404、音频电路405、输入单元406以及电源407电性连接。本领域技术人员可以理解,图8中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏403可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏403可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏403而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏403也可以作为输入单元406的一部分实现输入功能。
在本申请实施例中,该触控显示屏403用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。
射频电路404可用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。音频电路405可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路405接收后转换为音频数据,再将音频数据输出处理器401处理后,经射频电路404以发送给比如另一电子设备,或者将音频数据输出至存储器402以便进一步处理。音频电路405还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
输入单元406可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源407用于给电子设备400的各个部件供电。可选的,电源407可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源407还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图8中未示出,电子设备400还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种用户画像更新方法中的步骤。例如,该计算机程序可以执行如下步骤:
基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;根据所述有效画像标签对所述目标用户的用户画像进行更新。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种用户画像更新方法中的步骤,因此,可以实现本申请实施例所提供的任一种用户画像更新方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种用户画像更新方法、装置、计算机可读存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (21)

1.一种用户画像更新方法,其特征在于,包括:
基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;
获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;
根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;
根据所述有效画像标签对所述目标用户的用户画像进行更新。
2.根据权利要求1所述的用户画像更新方法,其特征在于,所述根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤,包括:
根据所述标签逻辑关系集中的标签逻辑关系,查找所述当前画像标签和所述历史画像标签之间的目标标签逻辑关系,得到目标标签逻辑关系集;
根据所述目标标签逻辑关系集,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签。
3.根据权利要求2所述的用户画像更新方法,其特征在于,所述根据所述目标标签逻辑关系集,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤,包括:
根据所述目标标签逻辑关系集,对所述历史画像标签进行第一有效性选择处理,以确定历史影响画像标签;
对所述历史影响画像标签和所述当前画像标签进行第二有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签。
4.根据权利要求3所述的用户画像更新方法,其特征在于,所述第二有效性选择处理包括并集处理;所述对所述历史影响画像标签和所述当前画像标签进行第二有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签的步骤,包括:
将所述历史影响画像标签和所述当前画像标签进行并集处理;
将并集处理之后得到的画像标签作为所述目标用户在当前更新周期内的有效画像标签,将并集处理之后得到的画像标签的系数作为所述有效画像标签中对应画像标签的权重系数。
5.根据权利要求1所述的用户画像更新方法,其特征在于,在所述得到所述目标用户在当前更新周期内的有效画像标签的步骤之后,还包括:
获取所述有效画像标签中的各画像标签的权重系数;
根据所述权重系数确定各画像标签的重要性程度,并根据所述重要性程度从所述有效画像标签中选择画像标签作为所述目标用户在当前更新周期内的主画像标签。
6.根据权利要求1所述的用户画像更新方法,其特征在于,所述标签逻辑关系集包括标签转移矩阵,所述标签转移矩阵包括矩阵元素,所述矩阵元素用于表征所述画像标签之间的标签逻辑关系;
所述获取标签逻辑关系集的步骤,包括:获取标签转移矩阵。
7.根据权利要求6所述的用户画像更新方法,其特征在于,在获取标签转移矩阵的步骤之前,还包括:
根据所述画像标签集中所有画像标签、以及所有画像标签中各画像标签之间的标签逻辑关系,构建所述标签转移矩阵。
8.根据权利要求7所述的用户画像更新方法,其特征在于,所述根据所述画像标签集中各画像标签以及各画像标签之间的标签逻辑关系,构建标签转移矩阵的步骤,包括:
获取所述画像标签集中所有画像标签的标签数量N,所述N取值为大于零的正整数;
构建维度为N*N的初始标签矩阵,其中,所述初始标签矩阵中的每个维度对应一个画像标签;
根据各画像标签之间的标签逻辑关系,填充所述初始标签矩阵,得到所述标签转移矩阵。
9.根据权利要求8所述的用户画像更新方法,其特征在于,所述根据各画像标签之间的标签逻辑关系,填充所述初始标签矩阵,得到所述标签转移矩阵的步骤,包括:
获取各画像标签之间的标签逻辑关系所对应的逻辑关系权重;
根据所述逻辑关系权重,填充所述初始标签矩阵,以得到所述标签转移矩阵。
10.根据权利要求1所述的用户画像更新方法,其特征在于,所述标签逻辑关系包括包含关系、被包含关系、并列关系、冲突关系。
11.根据权利要求10所述的用户画像更新方法,其特征在于,所述处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签的步骤,包括:
获取目标应用场景中所述目标用户在当前更新周期下的当前行为数据;
对所述当前行为数据进行行为分析,以得到至少一个候选画像标签;
当所述候选画像标签为一个时,将所述候选画像标签作为所述目标用户的所述当前行为数据对应的当前画像标签;
当所述候选画像标签包括多个、且多个候选画像标签中的标签逻辑关系包括包含关系时,删除包含关系中的被包含画像标签,并将剩余的候选画像标签作为所述目标用户的所述当前行为数据对应的当前画像标签。
12.根据权利要求11所述的用户画像更新方法,其特征在于,所述获取目标应用场景中目标用户在当前更新周期下的当前行为数据的步骤,包括:
获取外呼营销场景中目标用户在当前更新周期下的外呼交互语料数据;
所述对所述当前行为数据进行行为分析的步骤,包括:对所述外呼交互语料数据进行语料行为分析。
13.根据权利要求1至12任一项所述的用户画像更新方法,其特征在于,还包括:
获取多个用户的基本信息、各用户在目标应用场景中的业务信息、以及各用户对所述业务信息的响应信息,所述业务信息包括所述当前更新周期下的当前行为数据、以及对应用户画像中的有效画像标签;
对各用户的所述基础信息、所述业务信息和所述响应信息进行编码,以构建各用户对应的特征数据,并将各用户对应的特征数据作为样本,以得到样本集;
从所述样本集中获取所述响应信息为已订阅的目标样本的特征数据,并根据目标样本的特征数据,确定所述样本集中响应信息为未订阅的待分类样本对应用户的用户画像的推荐等级标签;其中,所述推荐等级标签用于对所述待分类样本对应的用户进行对应业务的推荐。
14.根据权利要求13所述的用户画像更新方法,其特征在于,所述从所述样本集中获取所述响应信息为已订阅的目标样本的特征数据,并根据目标样本的特征数据,确定所述样本集中响应信息为未订阅的待分类样本对应用户的用户画像的推荐等级标签的步骤,包括:
初始化第一原型向量,所述第一原型向量中包括目标样本,所述第一原型向量用于存放推荐等级标签为第一推荐等级标签的多个样本;
根据所述第一原型向量中的所述目标样本的特征数据和所述第一推荐等级标签,对所述样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定所述待分类样本对应用户的用户画像的目标推荐等级标签,并根据所述目标推荐等级标签待分类样本聚类至与所述目标推荐等级标签匹配的样本簇中。
15.根据权利要求14所述的用户画像更新方法,其特征在于,所述根据所述第一原型向量中的所述目标样本的特征数据和所述第一推荐等级标签,对所述样本集中响应信息为未订阅的待分类样本进行推荐聚类分析,以确定所述待分类样本对应用户的用户画像的目标推荐等级标签的步骤,包括:
确定所述样本集中响应信息为未订阅的待分类样本的特征数据,与所述第一原型向量中的目标样本的特征数据的距离;
根据所述距离划分距离区间,所述距离区间的数量与预设的多个推荐等级标签的数量相同,每个距离区间根据对应的距离大小和第一推荐等级标签确定一个对应的推荐等级标签;
根据所述距离所属的距离区间来确定所述待分类样本对应用户的用户画像的目标推荐等级标签。
16.根据权利要求13所述的用户画像更新方法,其特征在于,所述对各用户的所述基础信息、所述业务信息和所述响应信息进行编码,以构建各用户对应的特征数据的步骤,包括:
将各用户的所述基本信息、所述业务信息和所述响应信息中的数字信息和可枚举的文本信息,采用独热编码方式进行编码;
将各用户的所述基本信息、所述业务信息和所述响应信息中的非枚举的文本信息,采用文本向量方式进行编码;
将各用户编码之后的信息作为所述各用户对应的特征数据。
17.根据权利要求13所述的用户画像更新方法,其特征在于,所述业务信息还包括所述目标应用场景的推广套餐信息;所述用户对所述业务的响应信息包括所述用户对所述推广套餐信息的订购信息或者订阅信息。
18.一种用户画像更新装置,其特征在于,包括:
当前标签确定模块,用于基于目标应用场景下的行为数据和画像标签集中各画像标签的对应关系,处理目标用户在当前更新周期下的当前行为数据,以得到当前画像标签;
第一获取模块,用于获取标签逻辑关系集、以及所述目标用户在历史更新周期中的历史画像标签,其中,所述标签逻辑关系集包括所述画像标签集中各画像标签之间的标签逻辑关系;
画像标签确定模块,用于根据所述标签逻辑关系集中的标签逻辑关系,对所述当前画像标签和所述历史画像标签进行标签有效性选择处理,得到所述目标用户在当前更新周期内的有效画像标签;
更新模块,用于根据所述有效画像标签对所述目标用户的用户画像进行更新。
19.根据权利要求18所述的用户画像更新装置,其特征在于,还包括:
第二获取模块,用于获取所述目标应用场景下多个用户的基本信息、各用户在目标应用场景中的业务信息、以及各用户对所述业务信息的响应信息,所述业务信息包括所述当前更新周期下的当前行为数据,以及对应用户画像中的有效画像标签,所述有效画像标签是根据权利要求18所述的用户画像更新装置得到的;
编码模块,用于对各用户的所述基本信息、所述业务信息和所述响应信息进行编码,以构建各用户对应的特征数据,并将各用户对应的特征数据作为各样本,以得到样本集;
推荐标签确定模块,用于从所述样本集中获取所述响应信息为已订阅的目标样本的特征数据,并根据目标样本的特征数据,确定所述样本集中响应信息为未订阅的待分类样本对应用户的用户画像的推荐等级标签;其中,所述推荐等级标签用于对所述待分类样本对应的用户进行对应业务的推荐。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如权利要求1-17任一项所述的用户画像更新方法中的步骤。
21.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,执行如权利要求1-17任一项所述的用户画像更新方法中的步骤。
CN202111133640.6A 2021-09-27 2021-09-27 用户画像更新方法、装置、存储介质及电子设备 Pending CN113934612A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111133640.6A CN113934612A (zh) 2021-09-27 2021-09-27 用户画像更新方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111133640.6A CN113934612A (zh) 2021-09-27 2021-09-27 用户画像更新方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN113934612A true CN113934612A (zh) 2022-01-14

Family

ID=79276849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111133640.6A Pending CN113934612A (zh) 2021-09-27 2021-09-27 用户画像更新方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113934612A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579860A (zh) * 2022-03-04 2022-06-03 中国平安人寿保险股份有限公司 用户行为画像生成方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114579860A (zh) * 2022-03-04 2022-06-03 中国平安人寿保险股份有限公司 用户行为画像生成方法、装置、电子设备及存储介质
CN114579860B (zh) * 2022-03-04 2024-04-26 中国平安人寿保险股份有限公司 用户行为画像生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111008332A (zh) 内容项推荐方法、装置、服务器以及存储介质
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN108491540B (zh) 文本信息推送方法、装置及智能终端
CN108989397B (zh) 数据推荐方法、装置及存储介质
CN110119477B (zh) 一种信息推送方法、装置和存储介质
CN108153463A (zh) 应用界面显示控制方法、装置及存储介质和移动终端
CN112241327A (zh) 分享信息处理方法、装置、存储介质与电子设备
CN110866040B (zh) 用户画像生成方法、装置和系统
CN110347781B (zh) 文章倒排方法、文章推荐方法、装置、设备及存储介质
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
EP4113376A1 (en) Image classification model training method and apparatus, computer device, and storage medium
US11763204B2 (en) Method and apparatus for training item coding model
CN111552835A (zh) 文件推荐方法、装置及服务器
CN113934612A (zh) 用户画像更新方法、装置、存储介质及电子设备
CN112395499B (zh) 信息推荐方法及装置、电子设备、存储介质
CN112449217B (zh) 一种推送视频的方法、装置、电子设备和计算机可读介质
CN107807940B (zh) 信息推荐方法和装置
CN113015010A (zh) 推送参数确定方法、装置、设备及计算机可读存储介质
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN112463994A (zh) 一种多媒体资源显示方法、装置、系统及存储介质
CN111242239A (zh) 一种训练样本选取方法、装置、以及计算机存储介质
CN111125544A (zh) 用户推荐方法及装置
CN107256244B (zh) 数据处理方法和系统
CN112734005B (zh) 预测模型的确定方法、装置、电子设备及存储介质
CN114265948A (zh) 图像推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination