CN109376784A

CN109376784A - 一种人格预测方法及人格预测装置

Info

Publication number: CN109376784A
Application number: CN201811272387.0A
Authority: CN
Inventors: 林涛; 周晓涵; 吴芝明; 张文龙
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2018-10-29
Filing date: 2018-10-29
Publication date: 2019-02-22

Abstract

本公开提供一种人格预测方法及人格预测装置，涉及人格预测技术领域，该人格预测方法及人格预测装置通过采集多个被测者在编程过程中的行为特征数据并对行为特征数据进行预处理，通过朴素贝叶斯法建立单标签人格预测模型，通过多标签K近邻算法建立多标签人格预测模型，从而通过建立的单标签人格预测模型与多标签人格预测模型对被测者的人格进行预测。通过本公开提供的人格预测方法及人格预测装置建立的单标签人格预测模型以及多标签人格预测模型，可以将多种编程行为结合起来对人格进行预测，提高人格预测可靠性。

Description

一种人格预测方法及人格预测装置

技术领域

本公开涉及人格预测技术领域，具体而言，涉及一种人格预测方法及人格预测装置。

背景技术

人格主要是指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。一个人的行为是其人格的外在表现，通过行为可以预测一个人的人格。

现有技术中，基于编程行为进行人格预测的研究很少，且目前，基于编程行为对人格进行预测的研究大多只能通过一两种编程行为特征对人格进行预测，无法结合多种编程行为特征对人格进行预测，预测可靠性有待提高。

发明内容

有鉴于此，本公开提供一种人格预测方法及人格预测装置。

本公开提供的一种人格预测方法，所述方法包括：

采集多个被测者在编程过程中的行为特征数据。

对所述行为特征数据进行预处理。

通过朴素贝叶斯法建立单标签人格预测模型。

通过多标签K近邻算法建立多标签人格预测模型。

根据所述单标签人格预测模型与多标签人格预测模型对被测者的人格进行预测。

进一步的，对所述行为特征数据进行预处理的步骤包括：

去除所述多个被测者在编程过程中编译正确的记录数据以及去除编译过程中错误提示信息中的标识符，得到在编程过程中使用的命令参数数据。

进一步的，所述命令参数数据包括使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数。

进一步的，通过朴素贝叶斯法建立单标签人格预测模型的步骤包括：

根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率。

分别将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系。

根据所述对应关系搭建单标签人格预测模型。

进一步的，根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率的步骤包括：

分别获取每一个人格标签在所述多个被测者中出现的概率。

分别获取每一个行为特征在所述多个被测者中出现次数的平均值。

针对每一个行为特征，计算该行为特征在所述多个被测者中出现次数超过所述平均值的概率。

分别计算出每一个人格标签下每一个行为特征出现的概率。

根据每一人格标签下每一个行为特征出现的概率分别计算出每一个行为特征下每一个人格标签出现的概率。

进一步的，通过多标签K近邻算法建立多标签人格预测模型的步骤包括：

输入预处理后的行为特征数据及多个人格标签。

根据所述多标签K近邻算法按照预设值计算得到每一个行为特征集对应的K个近邻人格标签索引集合。

根据所述人格标签索引集合建立多标签人格预测模型。

本公开提供的一种人格预测装置，包括采集模块、处理模块以及运行模块。

所述采集模块用于采集多个被测者在编程过程中的行为特征数据。

所述处理模块用于对所述行为特征数据进行预处理。

所述运行模块用于根据朴素贝叶斯法建立单标签人格预测模型以及根据多标签K近邻算法建立多标签人格预测模型，并用于通过所述单标签人格预测模型以及所述多标签人格预测模型对被测者的人格进行预测。

进一步的，对所述行为特征数据进行预处理包括去除所述多个被测者在编程过程中编译正确的记录数据以及去除编译过程中错误提示信息中的标识符，得到在编程过程中使用的命令参数数据。其中，所述命令参数数据包括使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数。

进一步的，所述运行模块包括计算子模块、匹配子模块以及第一执行子模块。

所述计算子模块用于根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率。

所述匹配子模块用于将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系。

所述第一执行子模块用于根据所述对应关系搭建单标签人格预测模型。

进一步的，所述运行模块所述运行模块还包括输入子模块以及第二执行子模块。

所述输入子模块用于输入预处理后的行为特征数据及多个人格标签。

所述第二执行子模块用于根据所述多标签K近邻算法按照预设值计算得到每一个行为特征集对应的K个近邻人格标签索引集合并根据所述人格标签索引集合建立多标签人格预测模型。

本公开提供的人格预测方法及人格预测装置通过采集多个被测者在编程过程中的行为特征数据并对行为特征数据进行预处理，通过朴素贝叶斯法建立单标签人格预测模型，通过多标签K近邻算法建立多标签人格预测模型，并通过的建立的单标签人格预测模型与多标签人格预测模型对被测者的人格进行预测，通过建立单标签人格预测模型以及多标签人格预测模型将多种编程行为结合起来对人格进行预测，使预测效果更加全面、更具有说服力，提高了人格预测的可靠性。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本公开所提供的人格预测方法的一种流程示意图。

图2为本公开所提供的人格预测方法的另一种流程示意图。

图3为本公开所提供的人格预测方法的又一种流程示意图。

图4为本公开所提供的人格预测方法的又一种流程示意图。

图5为本公开所提供的人格预测装置的方框示意图。

图6为本公开所提供的人格预测装置的另一种方框示意图。

图7为本公开所提供的人格预测装置的又一种方框示意图。

图标：100-人格预测装置；10-采集模块；20-处理模块；30-运行模块；31-计算子模块；32-匹配子模块；33-第一执行子模块；34-输入子模块；35-第二执行子模块。

具体实施方式

下面将结合本公开中附图，对本公开中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

人格主要是指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。一个人的行为是其人格的外在表现，通过行为可以预测一个人的人格，鉴于人格对于理解人心理活动的意义，因此可以通过预测人格来帮助“个性化教育”，以达到因材施教的目的。

在现有研究中，基于编程行为对人格预测的研究，主要存在以下缺点：

一、基于编程行为对人格预测的相关研究非常少，且目前，基于编程行为对人格进行预测的研究大多只能通过一两种编程行为特征对人格进行预测，无法结合多种编程行为特征对人格进行预测，无法达到更好的预测效果。

二、现有研究中，没有将人格预测作为“个性教育”的支持的研究。

三、现有研究中，对于预测人格所需要的编程行为特征数据的收集要么不具备被试的针对性，要么收集成本高。

基于上述研究，本公开提供一种人格预测方法及人格预测装置，以改善上述问题。

请结合参阅图1，图1是本公开提供的一种人格预测方法的流程示意图，下面将对图1所示的具体流程进行详细阐述。

步骤S10：采集多个被测者在编程过程中的行为特征数据。

其中，所述多个被测者是具有一定编程基础知识的人，在采集所述行为特征数据之前，首先给参加测试的被测者准备编程任务，以及对编程的时间进行限定，编程任务以及编程的时间可以根据情况设定，可选的，在本公开中，设定编程任务为两道，编程的时间设定为1小时，两道编程任务具体如下：

a)地上有一个m行和n列的方格。一个机器人从坐标0,0的格子开始移动，每一次只能向左，右，上，下四个方向移动一格，但是不能进入行坐标和列坐标的数位之和大于k的格子。例如，当k为18时，机器人能够进入方格(35，37)，因为3+5+3+7＝18。但是，它不能进入方格(35，38)，因为3+5+3+8＝19。请问该机器人能够达到多少个格子？

b)请设计一个函数，用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径。路径可以从矩阵中的任意一个格子开始，每一步可以在矩阵中向左，向右，向上，向下移动一个格子。如果一条路径经过了矩阵中的某一个格子，则之后不能再次进入这个格子。例如a b c e s f c s a d e e这样的3*4矩阵中包含一条字符串"bcced"的路径，但是矩阵中不包含"abcb"路径，因为字符串的第一个字符b占据了矩阵中的第一行第二个格子之后，路径不能再次进入该格子。

针对上述布置的编程任务，所述多个被测者可通过java语言、C语言或者C++等语言完成任务，可选地，本公开的所述多个被测者设定java语言完成编程任务。

所述多个被测者在使用java语言完成编程任务的过程中，所述多个被测者的编程行为特征数据会保存在同一文件下，在编程的时间结束后，通过插件采集数据，例如，在本公开中，所述多个被测者分别使用java语言在限定的时间内完成编程任务，并将编程过程中的行为特征数据保存在Log文件下，然后通过Fluorite插件分别采集多个被测者保存在Log文件中的command命令中的行为特征数据。其中，在行为特征数据的采集过程中，可以视具体实际情况选择采集行为特征数据的插件，并不限于本公开提供的Fluorite插件。本公开所使用的Fluorite插件，可以在被测者不易察觉的情况下收集数据，使得数据更能反映被测者的真实行为，使得预测结果更加准确，并且不需要额外的硬件，不引人注目，适合于个人用户，并且成本非常低，具有很好的可推广性。

步骤S20：对所述行为特征数据进行预处理。

其中，初步采集的行为特征数据中包括了不必要的数据，因此需要对初步采集的行为特征数据进行预处理。

对所述行为特征数据进行预处理的步骤包括去除所述多个被测者在编程过程中编译正确的记录数据以及去除编译过程中错误提示信息中的标识符，得到在编程过程中使用的命令参数数据。

其中，对所述命令参数数据的处理过程如下表所示。

步骤S30：通过朴素贝叶斯法建立单标签人格预测模型。

其中，在所述行为特征数据预处理完成后，通过朴素贝叶斯法建立单标签人格预测模型，其中人格标签包括开放性、尽责性、外倾性、宜人性和神经质五大标签。

步骤S40：通过多标签K近邻算法建立多标签人格预测模型。

其中，在所述行为特征数据预处理完成后，通过多标签K近邻算法建立多标签人格预测模型，其中人格标签同样包括开放性、尽责性、外倾性、宜人性和神经质五大标签。

步骤S50：根据所述单标签人格预测模型与多标签人格预测模型对被测者的人格进行预测。

其中，在所述单标签人格预测模型与多标签人格预测模型建立完成，就可以根据所述单标签人格预测模型与多标签人格预测模型对后续被测者的人格进行预测。

进一步的，请结合参阅图2，通过朴素贝叶斯法建立单标签人格预测模型的步骤包括步骤S31至步骤S33。

步骤S31：根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率。

步骤S32：分别将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系。

其中，通过朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率，例如通过朴素贝叶斯法算出在使用帮助的次数这一行为特征下，开放性人格标签出现的概率为0.4、尽责性人格标签出现的概率为0.2、外倾性人格标签出现的概率为0.1、宜人性人格标签出现的概率为0.2、神经质人格标签出现的概率为0.1，在同一个错误出现的次数的平均值这一行为特征下，开放性人格标签出现的概率为0.1、尽责性人格标签出现的概率为0.5、外倾性人格标签出现的概率为0.2、宜人性人格标签出现的概率为0.2、神经质人格标签出现的概率为0.1；照此方法分别算出在五个行为特征下，每一个人格标签出现的概率，其中，开放性人格标签出现概率最高的是在使用帮助的次数这一特征下，则将使用帮助的次数这一行为特征与概率最高的开放性人格标签对应；同样的，尽责性人格标签出现的概率最高的是在同一个错误出现的次数的平均值这一行为特征下，则将同一个错误出现的次数的平均值这一行为特征与尽责性人格标签对应，进而可以分别得到每一个行为特征与人格标签的对应关系；每一个行为特征与人格标签的对应关系如下表所示。

	行为特征	人格标签
			一	使用帮助(提示)的次数	开放性
二	同一个错误出现的次数的平均值	尽责性
			三	粘贴的次数	外倾性
四	敲击“//”的次数	宜人性
			五	切换文件的次数	神经质

步骤S33：根据所述对应关系搭建单标签人格预测模型。

其中，在得到每一个行为特征与人格标签的对应关系后，根据所述对应关系建立单标签人格预测模型，在所述单标签人格预测模型建立好后，对其他的后续参与者进行预测时，就可以根据参与者使用上述五个行为特征中的数据，得到参与者的人格标签以及人格标签出现的概率。

进一步的，请结合参阅图3，根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率的步骤包括步骤S311至步骤S315。

步骤S311：分别获取每一个人格标签在所述多个被测者中出现的概率。

其中，在所述多个被测者执行编程任务之前，首先对所述多个被测者进行人格测试，分别得到所述多个被测者的人格标签，其测试方式可以通过大五人格量表或者其他问卷形式分别得到所述多个被测者的人格标签，在分别得到所述多个被测者的人格标签后，再计算每一个人格标签在所述多个被测者中出现的概率。例如，参与测试的被测者有1000名，其中是开放性人格标签的被测者有300，则开放性人格标签在所述多个被测者中出现的概率为0.3，同理，也可得出尽责性人格标签、外倾性人格标签、宜人性人格标签以及神经质人格标签在所述多个被测者中出现的概率，其中计算出人格标签在所述多个被测者中出现的概率后，将其计算出的概率记为P(类别)，针对不同的人格标签，可以用类别一、类别二、类别三等区分。

步骤S312：分别获取每一个行为特征在所述多个被测者中出现次数的平均值。

其中，每一个被测者都可以出现每一个行为特征，且每一个行为特征在每一个被测者中出现的次数不同，例如，获取使用帮助的次数这一特征在所述多个被测者中出现次数的平均值，假设参与测试的被测者有m名，第一名出现这一行为特征的次数为n1值，第二名出现这一行为特征的次数为n2值，第三名出现这一行为特征的次数为n3值，依次类推，最后一名出现这一行为特征的次数为nm值，则使用帮助的次数这一特征的平均值为i＝(n1+n2+n3+……+nm)/m。同理，也可得出其余行为特征在所述多个被测者中出现次数的平均值。

步骤S313：针对每一个行为特征，计算该行为特征在所述多个被测者中出现次数超过所述平均值的概率。

其中，针对每一个行为特征，计算该行为特征在所述多个被测者中出现次数超过所述平均值的概率，例如，计算使用帮助的次数这一特征在所述多个被测者中出现次数超过所述平均值的概率，假设在n1，n2，n3……nm这m个数中，使用帮助的次数这一特征出现次数的平均值为i，比i值大的值的个数假设为o，那么使用帮助的次数这一特征在所述多个被测者中出现次数超过所述平均值的概率为o/m，同理，也可以计算出其余特征在所述多个被测者中出现次数超过所述平均值的概率。其中，计算该行为特征在所述多个被测者中出现次数超过所述平均值的概率后，将概率记为P(特征)，针对不同的行为特征，可以用特征一、特征二、特征三等区分。

步骤S314：分别计算出每一个人格标签下每一个行为特征出现的概率。

在步骤S311中，已经分别计算出开放性人格标签、尽责性人格标签、外倾性人格标签、宜人性人格标签以及神经质人格标签的概率，在步骤S313中，已经分别计算出使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数这五大行为特征在所述多个被测者中出现次数超过所述平均值的概率，进而就可得到每一个人格标签下每一个行为特征出现的概率，记为P(特征|类别)。例如在开放性人格标签下，计算使用帮助的次数这一行为特征出现的概率，开放性人格标签的概率为0.3，使用帮助的次数这一行为特征在所述多个被测者中出现次数超过所述平均值的概率为0.4，其中，开放性人格标签记为类别一，使用帮助这一行为特征记为特征一，则在开放性人格标签下，计算使用帮助的次数这一行为特征出现的概率P(特征一|类别一)＝P(特征一*类别一)/P(类别一)＝0.4*0.3/0.3＝0.4，同理，分别计算出在开放性人格标签下，其余行为特征出现的概率。进而，根据同样的方式，分别计算出每一个人格标签下每一个行为特征出现的概率。

步骤S315：根据每一人格标签下每一个行为特征出现的概率分别计算出每一个行为特征下每一个人格标签出现的概率。

其中，在计算出每一个人格标签下每一个行为特征出现的概率后，就根据公式计算出每一个行为特征下，每一个人格标签出现的概率，其公式为P(类别|特征)＝P(特征|类别)*P(类别)/P(特征)。例如，在计算出开放性人格标签下使用帮助的次数这一行为特征出现的概率后，就可以根据公式P(类别|特征)＝P(特征|类别)*P(类别)/P(特征)计算出在使用帮助的次数这一行为特征下开放性人格标签出现的概率。同样的，计算出在使用帮助的次数这一行为特征下，其余人格标签出现的概率。同理，根据同样的方式，分别得到每一个行为特征下每一个人格标签出现的概率，再分别将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系，进而根据所述对应关系建立单标签人格预测模型。

通过上述过程建立的单标签人格预测模型一方面不仅能根据被测者的行为特征数据得到被测者的人格标签，另一方面，也可以计算出每一个行为特征下每一个人格标签出现的概率，进而，通过上述过程建立的单标签人格预测模型可分别得到五大行为特征与大五人格定性与定量的关系。

进一步的，请结合参阅图4，图4为多标签人格预测模型的建立方法的流程示意图，通过多标签K近邻算法建立多标签人格预测模型的步骤包括步骤S41至步骤S43。

步骤S41：输入预处理后的行为特征数据及多个人格标签。

其中，行为特征数据的预处理过程可参照上述步骤S20，人格标签包括开放性、尽责性、外倾性、宜人性和神经质五大标签，行为特征数据及多个人格标签输入顺序是通过预先确定的。

步骤S42：根据所述多标签K近邻算法按照预设值计算得到每一个行为特征集对应的K个近邻人格标签索引集合。

其中，所述多标签K近邻算法为k近邻算法的改进方法，k近邻算法表示如果一个样本在特征空间中的k个最相似(即特征空间中距离最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。进而可根据k近邻算法的思想对其进行改进，得到多标签K近邻算法，所述多标签K近邻算法表示对于每一个新实例(instance)，距离它最近的k个实例(特征空间中与它的距离最小的k个实例)可以首先得到，进而得到这些实例的标签集合。

一个行为特征集对应一个被测者的行为特征数据，一个行为特征集至少包括一个行为特征，例如，其中的一个被测者只具备使用帮助的次数这一行为特征，那该被测者对应的行为特征集只包括了使用帮助的次数这一行为特征，再例如，其中的另一个被测者具备上述提到的使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数这五个特征，则该被测者对应的行为特征集包括了使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数这五个特征。

将每一个被测者预处理后的行为特征数据以及五个人格标签输入所述多标签K近邻算法后，设定预设值，该预设值为多标签K近邻算法中设定的K值，即对行为特征集选取距离最近的K个点，其中，距离值可以通过欧式距离公式设定或者其余计算距离的公式设定，例如，采用欧式距离公式时，其中一个被测者特征集为(a b c d e),另一个被测者特征集为(f g h i j),则预设值为((a-f)^2+(b-g)^2+(c-h)^2+(d-i)^2+(e-j)^2)^1/2。

在设定好预设值后，通过所述多标签K近邻算法就可以按照预设值得到每一个行为特征集对应的K个近邻人格标签索引集合。

步骤S43：根据所述人格标签索引集合建立多标签人格预测模型。

在得到每一个行为特征集对应的K个近邻人格标签索引集合后，就可以根据所述人格标签索引集合建立多标签人格预测模型。

在所述多标签人格预测模型建立好后，对其他的后续参与者进行预测时，只需将参与者的行为特征数据输入所述多标签人格预测模型，经过计算后，得到行为特征数据的最大后验概率，根据行为特征的最大后验概率来确定该参与者是否具有该行为特征数据对应的人格标签集合，例如，一个参与者具有上述提到的五个特征，将该参与者的五个特征数据输入所述多标签人格预测模型，经过计算后，使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数这五个特征的最大后验概率值分别为是(0.3，0.5，0.6，0.1，0.7)，这五个行为特征的最大后验概率值分别对应于(开放性，尽责性，外倾性，宜人性，神经质)。假设判定该参与者是否具有明显的人格标签的标准为人格标签对应的行为特征最大后验概率值大于等于为0.5，则其中最大后验概率值大于等于0.5的值有0.5，0.6，0.7，分别对应于尽责性人格标签、外倾性人格标签以及神经质人格标签，则判定该参与者具有明显的尽责性人格标签、外倾性人格标签以及的神经质人格标签这三种人格标签，其中，神经质人格标签对应的概率值最大，即该参与者的神经质人格标签表现最为明显，而0.3对应的开放性人格标签以及0.1对应的宜人性人格标签则表现不明显。

在得到该参与者所具有的人格标签后，将最大后验概率值大于等于0.5的行为特征与对应的人格标签分别建立索引集合，并输出所述索引集合。例如得到该参与者五大行为特征的最大后验概率值是(0.3，0.5，0.6，0.1，0.7)，分别对应于(开放性，尽责性，外倾性，宜人性，神经质)，最后判定该参与者具有的人为尽责性，外倾性以及神经质，则索引集合为(0.5尽责性)，(0.6外倾性)，(0.7神经质)，在建立完索引集合后，输出该索引集合，输出结果则为最后的结果，即该参与者所表现比较明显的人格标签。

本公开提供的人格预测方法，通过分别建立单标签人格预测模型和多标签人格预测模型，将多种编程行为结合起来对人格进行预测，使预测效果更加全面、更具有说服力；且本公开建立的单标签人格预测模型可以分别得到五大行为特征与大五人格定性与定量的关系。

请结合参阅图5，图5为本公开所提供的人格预测装置100的方框示意图。本公开提供的人格预测装置100，包括采集模块10、处理模块20以及运行模块30。

所述采集模块10用于采集多个被测者在编程过程中的行为特征数据。

所述处理模块20用于对所述行为特征数据进行预处理。

所述运行模块30用于根据朴素贝叶斯法建立单标签人格预测模型以及根据多标签K近邻算法建立多标签人格预测模型，并用于通过所述单标签人格预测模型以及所述多标签人格预测模型对被测者的人格进行预测。

进一步的，对所述行为特征数据进行预处理包括去除所述多个被测者在编程过程中编译正确的记录数据以及去除编译过程中错误提示信息中的标识符，得到在编程过程中使用的命令参数数据。

其中，所述命令参数数据包括使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数。

进一步的，请结合参阅图6，所述运行模块30包括计算子模块31、匹配子模块32以及第一执行子模块33。

所述计算子模块31用于根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率。

所述匹配子模块32用于将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系。

所述第一执行子模块33用于根据所述对应关系搭建单标签人格预测模型。

进一步的，请结合参阅图7，所述运行模块30还包括输入子模块34以及第二执行子模块35。

所述输入子模块34用于输入预处理后的行为特征数据及多个人格标签；

所述第二执行子模块35用于根据所述多标签K近邻算法按照预设值计算得到每一个行为特征集对应的K个近邻人格标签索引集合并根据所述人格标签索引集合建立多标签人格预测模型。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的人格预测装置100的具体工作过程，可以参考前述方法步骤S10至步骤S50中的对应过程，在此不再过多赘述。

综上，本公开提供的人格预测方法及人格预测装置可以应用到软件领域的编程教育行业中，将学生作为被测者，得到学生的人格标签，进而可以对学生进行个性化教育，对个人编程支持有着非常好的指导意义。

本公开提供的人格预测方法及人格预测装置，通过分别建立单标签人格预测模型和多标签人格预测模型，将多种编程行为结合起来对人格进行预测，使预测效果更加全面、更具有说服力，且将本公开提供的人格预测方法及人格预测装置通过使用Fluorite插件，在被测者不易察觉的情况下收集数据，使得数据更能反映被测者的真实行为，使得预测结果更加准确，并且不需要额外的硬件，不引人注目，适合于个人用户，并且成本非常低。

在本公开所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备10，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。此外，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

以上所述仅为本公开的可选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种人格预测方法，其特征在于，所述方法包括：

采集多个被测者在编程过程中的行为特征数据；

对所述行为特征数据进行预处理；

通过朴素贝叶斯法建立单标签人格预测模型；

通过多标签K近邻算法建立多标签人格预测模型；

2.根据权利要求1所述的人格预测方法，其特征在于，对所述行为特征数据进行预处理的步骤包括：

3.根据权利要求2所述的人格预测方法，其特征在于，所述命令参数数据包括使用帮助的次数、同一个错误出现的次数的平均值、粘贴的次数、敲击“//”的次数以及切换文件的次数。

4.根据权利要求1所述的人格预测方法，其特征在于，通过朴素贝叶斯法建立单标签人格预测模型的步骤包括：

根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率；

分别将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系；

根据所述对应关系搭建单标签人格预测模型。

5.根据权利要求4所述的人格预测方法，其特征在于，根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率的步骤包括：

分别获取每一个人格标签在所述多个被测者中出现的概率；

分别获取每一个行为特征在所述多个被测者中出现次数的平均值；

针对每一个行为特征，计算该行为特征在所述多个被测者中出现次数超过所述平均值的概率；

分别计算出每一个人格标签下每一个行为特征出现的概率；

6.根据权利要求1所述的人格预测方法，其特征在于，通过多标签K近邻算法建立多标签人格预测模型的步骤包括：

输入预处理后的行为特征数据及多个人格标签；

根据所述多标签K近邻算法按照预设值计算得到每一个行为特征集对应的K个近邻人格标签索引集合；

根据所述人格标签索引集合建立多标签人格预测模型。

7.一种人格预测装置，其特征在于，包括采集模块、处理模块以及运行模块；

所述采集模块用于采集多个被测者在编程过程中的行为特征数据；

所述处理模块用于对所述行为特征数据进行预处理；

8.根据权利要求7所述的人格预测装置，其特征在于，对所述行为特征数据进行预处理包括去除所述多个被测者在编程过程中编译正确的记录数据以及去除编译过程中错误提示信息中的标识符，得到在编程过程中使用的命令参数数据；

9.根据权利要求7所述的人格预测装置，其特征在于，所述运行模块包括计算子模块、匹配子模块以及第一执行子模块；

所述计算子模块用于根据朴素贝叶斯法分别计算出每一个行为特征下每一个人格标签出现的概率；

所述匹配子模块用于将出现概率最高的人格标签与行为特征进行对应，得到每一个行为特征与人格标签的对应关系；

10.根据权利要求7所述的人格预测装置，其特征在于，所述运行模块还包括输入子模块以及第二执行子模块；

所述输入子模块用于输入预处理后的行为特征数据及多个人格标签；