CN109492859A - 基于神经网络模型的员工分类方法及装置、设备、介质 - Google Patents
基于神经网络模型的员工分类方法及装置、设备、介质 Download PDFInfo
- Publication number
- CN109492859A CN109492859A CN201811120210.9A CN201811120210A CN109492859A CN 109492859 A CN109492859 A CN 109492859A CN 201811120210 A CN201811120210 A CN 201811120210A CN 109492859 A CN109492859 A CN 109492859A
- Authority
- CN
- China
- Prior art keywords
- vector
- classification
- sample
- neural network
- employee
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003062 neural network model Methods 0.000 title claims abstract description 72
- 238000000034 method Methods 0.000 title claims abstract description 56
- 239000013598 vector Substances 0.000 claims abstract description 141
- 238000013145 classification model Methods 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 239000003550 marker Substances 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 13
- 238000004458 analytical method Methods 0.000 abstract description 2
- 210000002569 neuron Anatomy 0.000 description 28
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种基于神经网络模型的员工分类方法及装置、电子设备、计算机可读存储介质,属于大数据技术领域。该方法包括:在员工业务日志中提取多个历史员工的样本数据及各所述样本数据对应的分类标签;将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;将待分类员工的业务数据转换为目标数值向量,并通过所述员工分类模型分析所述目标数值向量,得到所述待分类员工的分类结果。本公开可以对员工实现准确的分类,分类结果具有一定的预测性,且分类过程较为科学、严谨。
Description
技术领域
本公开涉及大数据技术领域,尤其涉及一种基于神经网络模型的员工分类方法及装置、电子设备、计算机可读存储介质。
背景技术
企业的人力资源管理经常需要将员工分类,以对不同的员工进行精准定位,从而进一步实现岗位分配、级别划分、团队组建、人力培养等工作目标。
现有的员工分类方法多数是基于员工在多个业务上的表现,确定员工最适合的业务,并将员工划分到该业务所属的分类。然而该方法存在以下几点不足:在对员工的业务表现进行分类评价时,通常只考虑结果导向较强的业务数据,而忽视结果导向较弱的业务行为,因此员工分类所基于的数据不够全面,影响分类结果的准确性;另外,目前企业对于员工业务方面的考察通常基于负责人员的主观判断,缺乏客观的统一标准,影响分类过程的科学性与严谨性。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于神经网络模型的员工分类方法及装置、电子设备、计算机可读存储介质,进而至少在一定程度上克服现有的员工分类方法不够科学、严谨,以及分类结果不够准确的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种基于神经网络模型的员工分类方法,包括:在员工业务日志中提取多个历史员工的样本数据及各所述样本数据对应的分类标签;将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;将待分类员工的业务数据转换为目标数值向量,并通过所述员工分类模型分析所述目标数值向量,得到所述待分类员工的分类结果。
在本公开的一种示例性实施例中,所述神经网络模型包括:输入层,用于输入m个n维的输入向量;第一中间层,用于将所述m个n维的输入向量转换为2m个第一中间数值;第二中间层,用于将所述2m个第一中间数值转换为2p个第二中间数值;输出层,用于将所述2p个第二中间数值转换为p维的输出向量;其中,m为所述预设属性的数量,n为所述预设周期的数量,p为候选分类的数量。
在本公开的一种示例性实施例中,通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型包括:将所述样本数值向量输入所述神经网络模型,得到样本输出向量;将所述样本数据对应的分类标签转换为p维的标记向量,所述标记向量中所述分类标签对应的维度数值为1,其他维度数值为0;根据所述样本输出向量与所述标记向量的差别调整所述神经网络模型的参数。
在本公开的一种示例性实施例中,所述输入向量Input(i)=(ai1;ai2;…;ain),i∈[1,m];所述第一中间数值j∈[1,2m];所述第二中间数值k∈[1,2p];所述输出向量Output=(d1;d2;…;dp);其中,q∈[1,p];Wij为连接Input(i)与b(j)的权重向量,Wij=(w(ij)1;w(ij)2;…;w(ij)n);vjk为连接b(j)与c(k)的权重系数;skq为连接c(k)与dq的权重系数;F为激活函数。
在本公开的一种示例性实施例中,在训练所述神经网络模型之前,所述神经网络模型满足以下初始条件:如果j≠2i或j≠2i-1,则w(ij)1=w(ij)2=…=w(ij)n=0;如果j与k的奇偶性不相同,则vjk=0;如果k≠2q或k≠2q-1,则skq=0。
在本公开的一种示例性实施例中,所述激活函数包括Sigmoid函数、tanh函数、Sgn函数或ReLu函数。
在本公开的一种示例性实施例中,将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量包括:将所述样本数据以所述预设周期为行,以所述预设属性为列,统计为样本数据表;将所述样本数据表的每一列数据进行归一化处理;将归一化处理后的所述每一列数据转换为一个样本数值向量。
根据本公开的一个方面,提供一种基于神经网络模型的员工分类装置,包括:样本提取模块,在员工业务日志中提取多个历史员工的样本数据及各所述样本数据对应的分类标签;向量转换模块,用于将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;模型训练模块,用于通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;数据分析模块,用于将待分类员工的业务数据转换为目标数值向量,并通过所述员工分类模型分析所述目标数值向量,得到所述待分类员工的分类结果。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一种示例性实施例所述的方法。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种示例性实施例所述的方法。
本公开的示例性实施例具有以下有益效果:
在上述方法及装置中,从员工业务日志提取历史员工的样本数据及对应的分类标签后,将样本数据转换为样本数值向量,并通过样本数值向量及分类标签训练得到员工分类模型,再通过员工分类模型处理待分类员工的业务数据,可以得到待分类员工的分类结果。一方面,本实施例基于员工全方面的业务数据训练员工分类模型,并根据员工分类模型对员工进行分类,从而能够反映员工各方面的业务行为或特征,使分类结果具有较高的准确性。另一方面,基于神经网络模型的分类方法能够对员工的业务数据做出完全客观的分析与处理,形成统一的分类标准,使得分类过程较为科学、严谨。再一方面,本实施例以历史员工的业务数据及分类标签作为参考,能够根据员工表现出的潜力与发展趋势而进行分类,对员工的分类结果带有一定的预测性,可以为企业的人力资源管理形成有效的引导作用。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开示例性实施例中一种员工分类方法的流程图;
图2示出本公开示例性实施例中一种神经网络模型的示意图;
图3示出本公开示例性实施例中一种员工分类方法的子流程图;
图4示出本公开示例性实施例中另一种员工分类方法的子流程图;
图5示出本公开示例性实施例中一种员工分类装置的结构框图;
图6示出本公开示例性实施例中一种用于实现上述方法的电子设备;
图7示出本公开示例性实施例中一种用于实现方法的计算机可读存储介质。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的属性、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
本公开的示例性实施例首先提供了一种基于神经网络模型的员工分类方法。员工分类是指根据员工的个人特点、工作成绩或业务表现,确定其适合的岗位、级别或团队角色等,以实现对员工的精准定位,通常应用于员工定岗、员工评价、团队组建等业务场景中。参考图1所示,所述方法可以包括以下步骤:
步骤S11,在员工业务日志中提取多个历史员工的样本数据及对应的分类标签。
其中,历史员工是指已经经过分类的员工,其数据可作为样本数据使用。例如,在对试用期员工进行岗位分类时,可以参考老员工同时期的数据,即为样本数据,老员工的分类结果即分类标签。需要说明的是,为了保证样本数据及分类标签的准确性,可以尽量选择分类结果较好的历史员工,例如各岗位的绩效较好的员工,说明当初对这部分员工的岗位分类较合适。可见,分类标签可以与样本数据产生于同一时期,也可以晚于样本数据产生。实际应用中,分类标签通常是在样本数据产生的一年或两年后确定的分类结果,使得分类标签相对于样本数据具有一定的预测性。另一方面,为了数据的全面性,可以采集历史员工多方面的样本数据,使样本数据尽可能覆盖历史员工的各种细节行为或特征,具有更好的代表性。
步骤S12,将各历史员工的样本数据按照预设周期与预设属性转换为样本数值向量。
其中,预设周期是指统计样本数据的时间粒度,例如一周、一个月、一季度等。预设属性是指样本数据的指标,例如员工的销售额、团队人数、业务考试成绩等,反映了员工某个或某些方面的特征。表1示出了将一历史员工的样本数据按照预设周期与预设属性分类统计而得到的数据表,其中每行为一个预设周期,每列为一个预设属性。可以将每行转换为一个样本数值向量,例如第一行可以转换为向量(7300,1560,4,1,62,1),也可以将每列转换为一个样本数值向量,例如第一列可以转换为向量(7300;8800;10500;9200;9600;11300),则可以得到多个样本数值向量;此外,还可以将所有数据按顺序排列为一个序列后,转换为样本数值向量,例如可以将表1中的数据转换为一个36维的向量,则可以得到一个样本数值向量。本实施例对于转换样本数值向量的具体方式不做特别限定。
表1
步骤S13,通过样本数值向量及样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型。
在步骤S12中,每个历史员工的样本数据可以转换为一个或一组样本数值向量,而该历史员工的分类标签即对应于转换后的样本数值向量,样本数值向量适合于作为神经网络模型的输入,因此样本数值向量及分类标签可以作为神经网络模型的样本集,对初始的神经网络模型进行训练以确定模型的参数,最终得到的神经网络模型即为员工分类模型。
步骤S14,将待分类员工的业务数据转换为目标数值向量,并通过员工分类模型分析所述目标数值向量,得到待分类员工的分类结果。
在得到员工分类模型后,可将模型应用于待分类员工的分类。其中,待分类员工的业务数据可以与历史员工的样本数据保持同样的维度或形式,以便于转换为适合作为员工分类模型输入的向量,转换方法可以与步骤S12中样本数值向量的转换方法相同,转换得到的向量为目标数值向量,将其输入员工分类模型中,可以得到待分类员工的分类结果。
上述方法中,从员工业务日志中提取历史员工的样本数据及对应的分类标签后,将样本数据转换为样本数值向量,并通过样本数值向量及分类标签训练得到员工分类模型,再通过员工分类模型处理待分类员工的业务数据,可以得到待分类员工的分类结果。一方面,本实施例基于员工全方面的业务数据训练员工分类模型,并根据员工分类模型对员工进行分类,从而能够反映员工各方面的业务行为或特征,使分类结果具有较高的准确性。另一方面,基于神经网络模型的分类方法能够对员工的业务数据做出完全客观的分析与处理,形成统一的分类标准,使得分类过程较为科学、严谨。再一方面,本实施例以历史员工的业务数据及分类标签作为参考,能够根据员工表现出的潜力与发展趋势而进行分类,对员工的分类结果带有一定的预测性,可以为企业的人力资源管理形成有效的引导作用。
在一示例性实施例中,神经网络模型可以包括:输入层,用于输入m个n维的输入向量;第一中间层,用于将m个n维的输入向量转换为2m个第一中间数值;第二中间层,用于将2m个第一中间数值转换为2p个第二中间数值;输出层,用于将2p个第二中间数值转换为p维的输出向量;其中,m为预设属性的数量,n为预设周期的数量,p为候选分类的数量。
图2示出了以表1中的数据作为输入的一神经网络模型示意图,该模型共有4层,从左至右分别为输入层、第一中间层、第二中间层、输出层。表1中销售额、电销通话时间、客户人数等为预设属性,数量为6,第1个月到第6个月为预设周期,数量也为6,因此在神经网络模型的输入层,可以输入6个6维的输入向量,每个预设属性在6个预设周期的数据可以形成一个输入向量,例如属性一的输入向量可以是(7300;8800;10500;9200;9600;11300)。第一中间层可以将输入向量转换为12个第一中间数值;在本实施例中,候选分类有类型一、类型二、类型三共3个,因此第二中间层可以将第一中间数值转换为6个第二中间数值;输出层可以将第二中间数值转换为3维的输出向量,其中数值最大的维度对应于分类结果。
在一示例性实施例中,如图3所示,通过样本数值向量及样本数据对应的分类标签训练一神经网络模型可以通过以下步骤S31~S33实现:
步骤S31,将样本数值向量输入神经网络模型,得到样本输出向量。
步骤S32,将样本数据对应的分类标签转换为p维的标记向量,标记向量中分类标签对应的维度数值为1,其他维度数值为0。
转换是为了便于直接比较分类标签与神经网络模型的输出向量,以图2的模型为例,输出向量为3维的数值向量,当样本数据对应的分类标签是类型一时,可以将其转换为标记向量(1;0;0),当样本数据对应的分类标签是类型二时,可以将其转换为标记向量(0;1;0),当样本数据对应的分类标签是类型三时,可以将其转换为标记向量(0;0;1)。
步骤S33,根据样本输出向量与标记向量的差别调整神经网络模型的参数。
通常神经网络模型可以通过BP算法(Back Propagation,反向传播)调整模型的参数:将输出向量与标记向量的差别由输出层向输入层逐层传播,在此过程中,可以通过梯度下降法计算模型各参数的调整量。可以将样本数据及分类标签划分为训练集与验证集(例如常用的8:2划分),训练集用于迭代调整神经网络模型的参数,验证集用于验证神经网络模型的准确率,当准确率达到一定标准时,可以认为训练完成,此时的神经网络模型即为员工分类模型。
在一示例性实施例中,神经网络模型中的相邻两层之间可以是全连接的关系,即上一层的全部神经元与下一层的全部神经元一一相连(神经元为神经网络模型中的独立单元,图2中的每个方框即为一个神经元)。对于该神经网络模型,可以有如下关系:
输入向量Input(i)=(ai1;ai2;…;ain),i∈[1,m];
第一中间数值j∈[1,2m];
第二中间数值k∈[1,2p];
输出向量Output=(d1;d2;…;dp);
其中,q∈[1,p];
Wij为连接Input(i)与b(j)的权重向量,Wij=(w(ij)1;w(ij)2;…;w(ij)n),Wij T为向量Wij的转置;vjk为连接b(j)与c(k)的权重系数;skq为连接c(k)与dq的权重系数;F为激活函数。
输入层输入的是数值向量,因此输入层与第一中间层之间的连接权Wij为权重向量;输入向量共有m个,第一中间数值共有2m个,则权重向量共有2m2个;举例来说,输入层的第一神经元Input(1)(如图2中的“属性一”)与第一中间层的第一神经元b(1)(如图2中的“属性一水平值”)之间的权重向量为W11,W11=(w(11)1;w(11)2;…;w(11)n)。第一中间层、第二中间层输出的为数值,因此第一中间层与第二中间层之间的连接权vjk、第二中间层与输出层之间的连接权skq都是权重系数;举例来说,第一中间层的第二神经元b(2)(如图2中的“属性一成长值”)与第二中间层的第五神经元c(5)(如图2中的“类型三水平”)之间的权重系数为v25;第二中间层的第四神经元c(4)(如图2中的“类型二潜力”)与输出层第二神经元d(2)(如图2中的“类型二概率值”)之间的权重系数为s42。整个神经网络模型中,可以只在输出层使用激活函数,则中间层可以较多的保留业务数据的特征信息;也可以不使用激活函数,将第二中间层与权重系数的计算结果直接作为输出向量各维度的数值,可以将其中数值最大的维度作为最终的分类结果。
进一步的,在训练神经网络模型之前,参考上述图2所示,可以对神经网络模型中间层的神经元进行实际意义的初始性标注,例如第一中间层的第一神经元代表“属性一水平值”等,则可以根据经验确定神经网络模型中的初始连接关系,并为各权重向量或权重系数赋初值。该神经网络模型可以满足以下初始条件:
(1)、如果j≠2i或j≠2i-1,则w(ij)1=w(ij)2=…=w(ij)n=0;例如图2所示,输入层的“属性一”可以只与第一中间层的“属性一水平值”及“属性一成长值”发生关联,与第一中间层的其他神经元不发生关联,则相应的权重向量可以是零向量,其中各维度的权重数值都为0;即对于i=1,当j≠1或j≠2时,所有的权重数值都为0。对于输入层的其他神经元,可以得到相同的结果。
(2)、如果j与k的奇偶性不相同,则vjk=0;例如图2所示,第二中间层的“类型一水平”、“类型二水平”、“类型三水平”可以只与第一中间层的“属性一水平值”、“属性二水平值”……“属性六水平值”发生关联,而与代表“成长值”的各神经元不发生关联。简而言之,“水平”的神经元与“水平值”的神经元发生关联,“潜力”的神经元与“成长值”的神经元发生关联,则不发生关联的神经元之间的权重系数可以为0,可以通过神经元序数的奇偶性进行判断。
(3)、如果k≠2q或k≠2q-1,则skq=0。例如图2所示,输出层的“类型一概率值”可以只与第二中间层的“类型一水平”及“类型一潜力”发生关联,而与第二中间层的其他神经元不发生关联,即对于q=1,当k≠1或k≠2时,skq=0。对于输出层的其他神经元,可以得到相同的结果。
由以上分析可知,根据经验确定神经网络模型中的初始连接关系,可以将不发生关联的输入层、中间层及输出层的神经元之间的连接权的初值设为0,从而大大降低了神经网络模型的初始复杂度,减少了训练过程中通过迭代确定各权重值的计算量,也可以减少训练该神经网络模型所需的样本数据量,使得本示例性实施例的员工分类模型更易于获得。
需要说明的是,图2中对神经网络模型中间层的各神经元标注其实际意义,仅是为了对模型做初始性的引导,以便于对各权重赋初值。而神经网络模型本质上是一种黑箱模型,中间层的各神经元并非一定具有实际意义。最终训练得到的神经网络模型,其中间层的神经元可能与图2所示的神经元存在较大差别,则后续应当将训练得到的神经网络模型作为员工分类模型。
在上述神经网络模型中,激活函数可以包括Sigmoid函数(一种S型函数)、tanh函数(双曲正切函数)、Sgn函数(一种阶跃函数)或ReLu(Rectified Linear unit,线性修正单元)函数。其中,Sigmoid函数与tanh函数可以将输出向量的各维度数值转换到0~1的范围内,并强化各维度数值之间的差异,使得分类结果的数值更加明显;Sgn函数与ReLu函数可以将输出向量的各维度数值转换为触发性的输出值,当小于阈值时,输出为0,通常阈值可以设为大于0.5的值。
在一示例性实施例中,参考图4所示,步骤S12可以通过步骤S41~S43实现:
步骤S41,将样本数据以预设周期为行,以预设属性为列,统计为样本数据表。
例如表1所示的样式。在统计时,根据预设周期即预设属性的设定情况,可能需要对原始的业务数据进行计算,例如累积计算每个月的销售额、电销通话时间等。
步骤S42,将样本数据表的每一列数据进行归一化处理。
从表1中的数据可以看出,不同预设属性的数据在数值上差别非常大,可能相差多个数量级,为了便于后续神经网络模型的统一处理,可以进行归一化处理;通常可以采用线性归一化法:在一个较大的数据集中,统计各预设属性的最大数值Max及最小数值Min,则预设属性数据T可以按照(T-Min)/(Max-Min)的算法转换到0~1的数值范围内;此外,也可以采用其他归一化的方法,本实施例不限定于此。
步骤S43,将归一化处理后的每一列数据转换为一个样本数值向量。
每一个样本数值向量代表了一个预设属性,例如表2中包括6个预设属性,则可以得到6个样本数值向量。
需要补充的是,步骤S41~S43同样适用于将待分类员工的业务数据进行转换处理。对员工业务数据进行标准化处理,有利于神经网络模型的训练或员工分类模型的处理,提高员工分类任务的执行效率。
本公开的示例性实施例还提供了一种基于神经网络模型的员工分类装置,参考图5所示,该装置50可以包括:样本提取模块51,在员工业务日志中提取多个历史员工的样本数据及各样本数据对应的分类标签;向量转换模块52,用于将各历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;模型训练模块53,用于通过样本数值向量及样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;数据分析模块54,用于将待分类员工的业务数据转换为目标数值向量,并通过员工分类模型分析目标数值向量,得到待分类员工的分类结果。
在一示例性实施例中,神经网络模型可以包括:输入层,用于输入m个n维的输入向量;第一中间层,用于将m个n维的输入向量转换为2m个第一中间数值;第二中间层,用于将2m个第一中间数值转换为2p个第二中间数值;输出层,用于将2p个第二中间数值转换为p维的输出向量;其中,m为预设属性的数量,n为预设周期的数量,p为候选分类的数量。
在一示例性实施例中,模型训练模块还可以用于将样本数值向量输入神经网络模型,得到样本输出向量,并将样本数据对应的分类标签转换为p维的标记向量,以及根据样本输出向量与标记向量的差别调整神经网络模型的参数,其中,标记向量中分类标签对应的维度数值为1,其他维度数值为0。
在一示例性实施例中,输入向量Input(i)=(ai1;ai2;…;ain),i∈[1,m];第一中间数值j∈[1,2m];第二中间数值k∈[1,2p];输出向量Output=(d1;d2;…;dp);其中,q∈[1,p];Wij为连接Input(i)与b(j)的权重向量,Wij=(w(ij)1;w(ij)2;…;w(ij)n);vjk为连接b(j)与c(k)的权重系数;skq为连接c(k)与dq的权重系数;F为激活函数。
在一示例性实施例中,在模型训练模块训练神经网络模型之前,神经网络模型满足以下初始条件:
如果j≠2i或j≠2i-1,则w(ij)1=w(ij)2=…=w(ij)n=0;
如果j与k的奇偶性不相同,则vjk=0;
如果k≠2q或k≠2q-1,则skq=0。
在一示例性实施例中,激活函数可以包括Sigmoid函数、tanh函数、Sgn函数或ReLu函数。
在一示例性实施例中,向量转换模块还可以包括:数据表统计单元,用于将样本数据以预设周期为行,以预设属性为列,统计为样本数据表;归一化处理单元,用于将样本数据表的每一列数据进行归一化处理;列数据转换单元,用于将归一化处理后的每一列数据转换为一个样本数值向量。
以上各模块/单元的具体细节在方法部分的实施例中已经详细说明,因此不再赘述。
本公开的示例性实施例还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图6来描述根据本公开的这种示例性实施例的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:上述至少一个处理单元610、上述至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640。
其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元610可以执行图1中所示的步骤S11~S14,或执行图3中所示的步骤S31~S33等。
存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)621和/或高速缓存存储单元622,还可以进一步包括只读存储单元(ROM)623。
存储单元620还可以包括具有一组(至少一个)程序模块625的程序/实用工具624,这样的程序模块625包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备800(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器660通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施例的方法。
本公开的示例性实施例还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图7所示,描述了根据本公开的示例性实施例的用于实现上述方法的程序产品700,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施例,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (10)
1.一种基于神经网络模型的员工分类方法,其特征在于,包括:
在员工业务日志中提取多个历史员工的样本数据及各所述样本数据对应的分类标签;
将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;
通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;
将待分类员工的业务数据转换为目标数值向量,并通过所述员工分类模型分析所述目标数值向量,得到所述待分类员工的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述神经网络模型包括:
输入层,用于输入m个n维的输入向量;
第一中间层,用于将所述m个n维的输入向量转换为2m个第一中间数值;
第二中间层,用于将所述2m个第一中间数值转换为2p个第二中间数值;
输出层,用于将所述2p个第二中间数值转换为p维的输出向量;
其中,m为所述预设属性的数量,n为所述预设周期的数量,p为候选分类的数量。
3.根据权利要求2所述的方法,其特征在于,通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型包括:
将所述样本数值向量输入所述神经网络模型,得到样本输出向量;
将所述样本数据对应的分类标签转换为p维的标记向量,所述标记向量中所述分类标签对应的维度数值为1,其他维度数值为0;
根据所述样本输出向量与所述标记向量的差别调整所述神经网络模型的参数。
4.根据权利要求2所述的方法,其特征在于,
所述输入向量Input(i)=(ai1;ai2;…;ain),i∈[1,m];
所述第一中间数值
所述第二中间数值
所述输出向量Output=(d1;d2;…;dp);
其中,
Wij为连接Input(i)与b(j)的权重向量,Wij=(w(ij)1;w(ij)2;…;w(ij)n);vjk为连接b(j)与c(k)的权重系数;skq为连接c(k)与dq的权重系数;F为激活函数。
5.根据权利要求4所述的方法,其特征在于,在训练所述神经网络模型之前,所述神经网络模型满足以下初始条件:
如果j≠2i或j≠2i-1,则w(ij)1=w(ij)2=…=w(ij)n=0;
如果j与k的奇偶性不相同,则vjk=0;
如果k≠2q或k≠2q-1,则skq=0。
6.根据权利要求4所述的方法,其特征在于,所述激活函数包括Sigmoid函数、tanh函数、Sgn函数或ReLu函数。
7.根据权利要求1所述的方法,其特征在于,将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量包括:
将所述样本数据以所述预设周期为行,以所述预设属性为列,统计为样本数据表;
将所述样本数据表的每一列数据进行归一化处理;
将归一化处理后的所述每一列数据转换为一个样本数值向量。
8.一种基于神经网络模型的员工分类装置,其特征在于,包括:
样本提取模块,在员工业务日志中提取多个历史员工的样本数据及各所述样本数据对应的分类标签;
向量转换模块,用于将各所述历史员工的样本数据按照预设周期与预设属性转换为样本数值向量;
模型训练模块,用于通过所述样本数值向量及所述样本数据对应的分类标签训练一神经网络模型,以获得员工分类模型;
数据分析模块,用于将待分类员工的业务数据转换为目标数值向量,并通过所述员工分类模型分析所述目标数值向量,得到所述待分类员工的分类结果。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811120210.9A CN109492859B (zh) | 2018-09-25 | 2018-09-25 | 基于神经网络模型的员工分类方法及装置、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811120210.9A CN109492859B (zh) | 2018-09-25 | 2018-09-25 | 基于神经网络模型的员工分类方法及装置、设备、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492859A true CN109492859A (zh) | 2019-03-19 |
CN109492859B CN109492859B (zh) | 2023-04-25 |
Family
ID=65690004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811120210.9A Active CN109492859B (zh) | 2018-09-25 | 2018-09-25 | 基于神经网络模型的员工分类方法及装置、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492859B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110598995A (zh) * | 2019-08-15 | 2019-12-20 | 中国平安人寿保险股份有限公司 | 智能客户评级方法、装置及计算机可读存储介质 |
CN112507866A (zh) * | 2020-12-03 | 2021-03-16 | 润联软件系统(深圳)有限公司 | 一种汉字字向量生成方法、装置、计算机设备及存储介质 |
CN112529324A (zh) * | 2020-12-18 | 2021-03-19 | 平安科技(深圳)有限公司 | 基于深度学习的产能计算方法、装置、设备及存储介质 |
CN113343711A (zh) * | 2021-06-29 | 2021-09-03 | 南方电网数字电网研究院有限公司 | 工单生成方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150161567A1 (en) * | 2013-12-11 | 2015-06-11 | Somen Mondal | System and method for determining candidates for a role in an organization |
-
2018
- 2018-09-25 CN CN201811120210.9A patent/CN109492859B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150161567A1 (en) * | 2013-12-11 | 2015-06-11 | Somen Mondal | System and method for determining candidates for a role in an organization |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110598995A (zh) * | 2019-08-15 | 2019-12-20 | 中国平安人寿保险股份有限公司 | 智能客户评级方法、装置及计算机可读存储介质 |
CN110598995B (zh) * | 2019-08-15 | 2023-08-25 | 中国平安人寿保险股份有限公司 | 智能客户评级方法、装置及计算机可读存储介质 |
CN112507866A (zh) * | 2020-12-03 | 2021-03-16 | 润联软件系统(深圳)有限公司 | 一种汉字字向量生成方法、装置、计算机设备及存储介质 |
CN112507866B (zh) * | 2020-12-03 | 2021-07-13 | 润联软件系统(深圳)有限公司 | 一种汉字字向量生成方法、装置、计算机设备及存储介质 |
CN112529324A (zh) * | 2020-12-18 | 2021-03-19 | 平安科技(深圳)有限公司 | 基于深度学习的产能计算方法、装置、设备及存储介质 |
CN113343711A (zh) * | 2021-06-29 | 2021-09-03 | 南方电网数字电网研究院有限公司 | 工单生成方法、装置、设备及存储介质 |
CN113343711B (zh) * | 2021-06-29 | 2024-05-10 | 南方电网数字电网研究院有限公司 | 工单生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109492859B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI788529B (zh) | 基於lstm模型的信用風險預測方法及裝置 | |
WO2021000678A1 (zh) | 企业信贷审核方法、装置、设备及计算机可读存储介质 | |
CN109492859B (zh) | 基于神经网络模型的员工分类方法及装置、设备、介质 | |
CN109492858B (zh) | 基于机器学习的员工绩效预测方法及装置、设备、介质 | |
US11915123B2 (en) | Fusing multimodal data using recurrent neural networks | |
CN112613501A (zh) | 信息审核分类模型的构建方法和信息审核方法 | |
CN110598620B (zh) | 基于深度神经网络模型的推荐方法和装置 | |
CN107220217A (zh) | 基于逻辑回归的特征系数训练方法和装置 | |
CN111145009A (zh) | 用户贷后风险评估方法、装置及电子设备 | |
CN110490304B (zh) | 一种数据处理方法及设备 | |
CN110688536A (zh) | 一种标签预测方法、装置、设备和存储介质 | |
US20180349476A1 (en) | Evaluating theses using tree structures | |
CN111199469A (zh) | 用户还款模型生成方法、装置及电子设备 | |
CN112613569A (zh) | 图像识别方法、图像分类模型的训练方法及装置 | |
CN115563271A (zh) | 人工智能的会计数据分录方法、系统、设备及存储介质 | |
CN111210332A (zh) | 贷后管理策略生成方法、装置及电子设备 | |
CN112382355A (zh) | 一种智慧医疗数据管理方法、存储介质及系统 | |
CN116863116A (zh) | 基于人工智能的图像识别方法、装置、设备及介质 | |
CN110782128A (zh) | 一种用户职业标签生成方法、装置和电子设备 | |
CN114742645B (zh) | 基于多阶段时序多任务的用户安全等级识别方法及装置 | |
US11501225B2 (en) | Intelligent method to identify complexity of work artifacts | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 | |
CN113850686A (zh) | 投保概率确定方法、装置、存储介质及电子设备 | |
CN116484230B (zh) | 识别异常业务数据的方法及ai数字人的训练方法 | |
US10699229B2 (en) | User segmentation for cost-based deployment of enterprise infrastructure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |