一种融合多种测评结果构建用户画像的方法、装置、介质
技术领域
涉及计算机信息处理领域,具体涉及一种基于性格测评结果构建用户画像的方法。
背景技术
用户画像,即将用户信息标签化,便于后续机器分析处理,在各领域应用广泛,但目前较多应用于电商领域,根据用户浏览记录及购买信息等推荐商品。用户画像需要从众多数据中,根据应用背景精准提取出所需标签数据。
现有的用户画像提取方法有以下六种:基于设计与思维,基于本体或概念,基于主题或话题,基于兴趣或偏好,基于行为或日志,基于多维或融合。
但是,现有技术在面向对高考生职业专业规划这一领域,基于测评结果数据上构建用户画像的应用较少。以致于无法更好的合理的应用多方测评数据,白白浪费了测评结果。同时也无法将测评结果,同用户适合的职业专业也没法很好的融合在一起。
发明内容
鉴于现有技术中存在的技术缺陷和技术弊端,本发明实施例提供克服上述问题或者至少部分地解决上述问题的一种用户画像的生成方法。
为实现上述目的,本申请提供的技术方案如下:
第一方面,本发明提供了一种融合多种测评结果构建用户画像的方法,其包括如下步骤:
S1、获取用户画像的标签体系,所述标签体系中包含若干画像类别,每个画像类别中包含若干用于描绘用户在该画像类别中所属类型的画像标签;
S2、获取评测对象参与的若干个自我测评结果数据集,每个自我测评结果数据集中含有评测对象在不同属性维度的属性值;
S3、针对每个自我测评结果数据集,计算每个属性维度的分值在所有属性维度的总分值中的占比值,以该占比值作为每个属性维度的归一化得分;
S4、获取所有自我测评结果数据集中的每个属性维度与所述标签体系中的每个画像标签之间的相关度;
S5、对于所述标签体系中中的任一画像类别,以每个属性维度的归一化得分为基数,以该属性维度与该画像类别中每个画像标签之间的相关度作为权值,计算得到每个属性维度下每个画像标签的加权得分,以所有属性维度下同一画像标签的加权得分总和最大的画像标签作为该画像类别的用户画像标签;获得所有画像类别的用户画像标签后,以所有画像类别的用户画像标签生成评测对象的用户画像。
作为优选,所述的自我测评结果数据集来源于三种测评结果数据,分别为 MBTI测评、多元智能测评和性格色彩测评。
作为优选,所述用户画像的标签体系中,画像类别包括:
专业性格类别,其中画像标签包括研究型、社会型、艺术型、事务型、经营型;
能力类别,其中画像标签包括语言能力、动手能力、运动能力、思维能力、记忆能力、合作能力;
性格类别,其中画像标签包括理智型、情绪型、意志型;
独立类别,其中画像标签包括独立型、顺从型;
行为类别,其中画像标签包括积极、较积极、较消极、消极;
情感类别,其中画像标签包括热情、平易、冷漠、冷淡;以及
精神类别,其中画像标签包括坚韧、坚强、脆弱、懦弱。
作为优选,所述占比值采用如下公式计算:
其中,xab代表自我测评结果数据集a中的属性维度b,V(xab)代表自我测评结果数据集a中的属性维度b的分值,Ca代表自我测评结果数据集a中的所有属性维度集合;P(xab)代表属性维度b的分值在自我测评结果数据集a内所有属性维度的总分值中的占比值。
进一步的,对于所述标签体系中中的任一画像类别,首先计算该画像类别中生成的用户画像标签为画像标签j的概率值,计算公式如下:
其中,P(Tij|X)为预测画像类别i中生成的用户画像标签为画像标签j的概率值,P(xab|Tij)代表自我测评结果数据集a中的属性维度b与画像类别i中的画像标签j之间的相关度;Ti代表画像类别i中的所有画像标签集合;X为所有自我测评结果数据集的集合,N为X中自我测评结果数据集的个数;
然后选取画像类别i中标签中概率值P(Tij|X)最大的画像标签,作为画像类别i的用户画像标签。
进一步的,集合X={C1,C2,C3},C1为MBTI测评结果数据集,C2为多元智能测评结果数据集,C3为性格色彩测评结果数据集,N=3。
第二方面,本发明提供了一种融合多种测评结果构建用户画像的装置,其包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于当执行所述计算机程序时,实现如第一方面中任一项方案所述的融合多种测评结果构建用户画像的方法。
第二方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如第一方面中任一项方案所述的融合多种测评结果构建用户画像的方法。
本发明在充分利用测评数据的基础上,面向职业生涯规划、专业推荐领域上,如何更好的构建用户画像。提供了融合多种测评结果构建用户画像的方法,通过精确计算标签属性分值,按属性分值占比选取占比高的属性值作为标签属性,从而生成用户画像,既确保了准确性,又能更加快速的得到用户画像。本发明从测评结果中获取出代表用户特征的关键信息,弥补了传统人工判断的主观性和效率低、成本高的缺陷,并且能精准有效的获取用户画像。
附图说明
为使本发明的上述目的、特征和优点能够更加通俗易懂,下面结合附图对本发明的具体实施方法做详细的说明。
图1为本发明提供的用户画像标签确定方法的流程图;
图2为本发明提供的用户画像标签体系结构;
图3为本发明提供的用户画像专业性格类别标签结构;
图4为本发明提供的用户画像性格类别标签结构;
图5为本发明提供的用户画像情感类别标签结构;
图6为本发明提供的用户画像能力类别标签结构;
图7为本发明提供的用户画像精神类别标签结构;
图8为本发明提供的用户画像行为类别标签结构;
图9为本发明提供的用户画像独立类别标签结构;
具体实施方式
下面将结合本发明的附图,通过具体实施方式对本发明的技术方案进行清查、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本发明普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所采用的融合多种测评结果构建用户画像的方法,其基本流程如图1 所示,具体过程为:
S1、获取用户画像的标签体系,该标签体系中包含若干画像类别,每个画像类别中包含若干用于描绘用户在该画像类别中所属类型的画像标签。具体的标签体系可以根据实际情况进行确定和优化。
S2、获取评测对象参与的若干个自我测评结果数据集,每个自我测评结果数据集中含有评测对象在不同属性维度的属性值。自我测评结果数据集的类别应当尽量覆盖不同的评测维度,尽可能反映评测对象不同方面的性格、行为特点等信息,以便于更全面的进行用户画像。
S3、针对每个自我测评结果数据集,计算每个属性维度的分值在所有属性维度的总分值中的占比值,以该占比值作为每个属性维度的归一化得分。
S4、获取所有自我测评结果数据集中的每个属性维度与标签体系中的每个画像标签之间的相关度。该相关度可以由专家打分进行,也可以根据大量的数据计算得到。
S5、对于前述标签体系中中的任一画像类别,以每个属性维度的归一化得分为基数,以该属性维度与该画像类别中每个画像标签之间的相关度作为权值,计算得到每个属性维度下每个画像标签的加权得分,以所有属性维度下同一画像标签的加权得分总和最大的画像标签作为该画像类别的用户画像标签。
需注意,此处以所有属性维度下同一画像标签的加权得分总和最大的画像标签,也等价于计算生成该画像类别中不同画像标签的概率值最大。因此,也可以将同一画像类别中不同画像标签的加权得分总和换算为概率值,加权得分总和越大其概率值也越大,根据概率值亦可确定该画像类别的用户画像标签。
当获得所有画像类别的用户画像标签后,即可以所有画像类别的用户画像标签生成评测对象的用户画像。
本发明融合了多种测评结果及考虑了用户画像用于用户推荐职业专业的应用场景。通过运用数据挖掘领域知识,可以深入发掘测评结果与用户画像标签之间的联系。
下面将该流程应用于具体的实施例中,通过数据计算过程展示本发明的实现形式。
实施例1
本实施例中,期望面向职业生涯规划、专业推荐领域上,构建相应的用户画像,以便于为学生的职业生涯规划或专业推荐提供建议。因此,如图2所示,本实施例中设计的用户画像的标签体系中,画像类别包括:
专业性格类别,其中画像标签包括研究型、社会型、艺术型、事务型、经营型;
能力类别,其中画像标签包括语言能力、动手能力、运动能力、思维能力、记忆能力、合作能力;
性格类别,其中画像标签包括理智型、情绪型、意志型;
独立类别,其中画像标签包括独立型、顺从型;
行为类别,其中画像标签包括积极、较积极、较消极、消极;
情感类别,其中画像标签包括热情、平易、冷漠、冷淡;以及
精神类别,其中画像标签包括坚韧、坚强、脆弱、懦弱。
各画像类别的标签结构参见图3~9所示。
首先,收集整理多种测评数据;将用户的MBTI测评、多元智能测评、性格色彩测评结果收集整理,参见下表:
其次,计算用户画像输入数据各自占比P(xab),计算公式如下:
其中,xab代表自我测评结果数据集a中的属性维度b,V(xab)代表自我测评结果数据集a中的属性维度b的分值,Ca代表自我测评结果数据集a中的所有属性维度集合;P(xab)代表属性维度b的分值在自我测评结果数据集a内所有属性维度的总分值中的占比值。a∈X,X为所有自我测评结果数据集的集合,X={C1,C2,…,CN}N为X中自我测评结果数据集的个数。本实施例中, X={C1,C2,C3},C1为MBTI测评结果数据集,C2为多元智能测评结果数据集,C3为性格色彩测评结果数据集,N=3。
本实施例中用户画像输入数据各自占比P(xab)参见下表:
之后,根据测评结果属性值xab和标签属性值Tij之间的关联度,得到P(xab|Tij) 的值,即P(xab|Tij)代表自我测评结果数据集a中的属性维度b与画像类别i中的画像标签j之间的相关度。其中,Tij代表预测画像类别i中的画像标签j。
下面以独立类别为例,进行详细描述计算过程,其关联度见下表(表中数据仅供参考):
然后,依据所得P(xab)以及P(xab|Tij)运用公式计算预测画像类别i中生成的用户画像标签为画像标签j的概率值P(Tij|X):
其中,P(xab|Tij)代表自我测评结果数据集a中的属性维度b与画像类别i中的画像标签j之间的相关度;Ti代表画像类别i中的所有画像标签集合;X为所有自我测评结果数据集的集合,N为X中自我测评结果数据集的个数。
本实施例中概率值P(Tij|X)的计算参见下表:
最后,然后选取画像类别i中标签中概率值P(Tij|X)最大的画像标签,作为画像类别i的用户画像标签。即该实施例1中,独立类型标签组中,画像标签为独立型的概率值计算结果为0.5675,画像标签为顺从型的概率值计算结果为 0.4325,故选择独立型作为独立类型标签组的用户画像标签。
同样的,除了独立类型类别外,对于标签体系中其他的6类画像类别,也可以采用相同方法获得相应的用户画像标签。这7个用户画像标签即构成了该用户对象的个人画像。
另外,在另一实施例中,还可以进一步提供一种融合多种测评结果构建用户画像的装置,其包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于当执行所述计算机程序时,实现前述的融合多种测评结果构建用户画像的方法。
另外,在另一实施例中,还可以进一步提供一种计算机可读存储介质,该存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现前述的融合多种测评结果构建用户画像的方法。
需要注意的是,存储器可以包括随机存取存储器(Random Access Memory, RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array, FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。当然,还装置中还应当具有实现程序运行的必要组件,例如电源、通信总线等等。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。