CN118134331A - 培训成效分析方法及装置 - Google Patents
培训成效分析方法及装置 Download PDFInfo
- Publication number
- CN118134331A CN118134331A CN202410284988.2A CN202410284988A CN118134331A CN 118134331 A CN118134331 A CN 118134331A CN 202410284988 A CN202410284988 A CN 202410284988A CN 118134331 A CN118134331 A CN 118134331A
- Authority
- CN
- China
- Prior art keywords
- training
- analysis
- abnormal
- model
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 297
- 238000004458 analytical method Methods 0.000 title claims abstract description 211
- 230000000694 effects Effects 0.000 title abstract description 41
- 230000002159 abnormal effect Effects 0.000 claims abstract description 114
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000003062 neural network model Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims description 29
- 238000007637 random forest analysis Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 15
- 230000035945 sensitivity Effects 0.000 claims description 12
- 238000013450 outlier detection Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000012847 principal component analysis method Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 12
- 238000009826 distribution Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000003066 decision tree Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000005856 abnormality Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000013439 planning Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Bioethics (AREA)
- Tourism & Hospitality (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Educational Technology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Game Theory and Decision Science (AREA)
Abstract
本发明实施例公开了一种培训成效分析方法及装置,涉及人工智能技术领域,可用于金融领域或其他技术领域,该方法包括:根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果;若异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;若异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。本发明有助于提高培训成效分析的效率和准确性。
Description
技术领域
本发明涉及培训成效分析领域,具体而言,涉及一种培训成效分析方法及装置。
背景技术
培训是明确培养对象业务发展方向和提高培养对象自身能力的重要方式。传统的培训成效分析方法往往依赖于人为主观评价或人为结合培训测试成绩来进行评价,目前这种人为进行培训成效评价方案存在准确性低、结果片面、客观性差的问题,无法客观针对性地分析培养对象的培训效果。此外,传统的培训成效分析方式需要结合培养对象全面的数据(例如,培训数据)来进行分析,然而人为数据分析处理难度较大、效率较低,导致目前的培训成效分析方案存在效率低的问题。由此可见,现有技术缺少一种更为高效和准确的培训成效分析方案。
发明内容
本发明为了解决上述背景技术中的至少一个技术问题,提出了一种培训成效分析方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种培训成效分析方法,该方法包括:
根据目标对象的对象数据以及预设的异常对象识别模型,确定所述目标对象的异常识别结果;
若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;
若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;
根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
可选的,所述培训成效分析方法,还包括:
建立异常对象样本集和正常对象样本集;
根据所述异常对象样本集采用随机森林模型训练出所述异常对象分析模型,以及根据所述正常对象样本集采用随机森林模型训练出所述正常对象分析模型。
可选的,所述培训成效分析方法,还包括:
对用于模型训练的对象数据使用主成分分析法进行特征选择和提取,得到对象特征数据;
采用差分隐私对所述对象特征数据进行加密;
基于加密后的所述对象特征数据采用孤立森林算法训练出所述异常对象识别模型。
可选的,所述采用差分隐私对所述对象特征数据进行加密,具体包括:
根据对象的涉密等级确定敏感度;
根据所述敏感度以及预设的隐私预算计算尺度参数;
根据所述尺度参数生成拉普拉斯噪声;
将所述拉普拉斯噪声添加到对应的所述对象特征数据中。
可选的,所述培训成效分析方法,还包括:
使用离群点检测算法对加密后的所述对象特征数据进行清洗和预处理。
可选的,根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果,具体包括:
从所述目标对象的对象数据中提取出所述目标对象的对象特征数据;
采用差分隐私对所述目标对象的对象特征数据进行加密;
将加密后的所述目标对象的对象特征数据输入到所述异常对象识别模型中,得到所述异常对象识别模型输出的所述目标对象的异常识别结果。
可选的,所述培训成效分析方法,还包括:
建立用于对所述神经网络模型进行训练的训练集,其中,所述训练集中的训练样本为标注出培训成果等级的用于模型训练的培训成果分析特征;
基于所述训练集对所述神经网络模型进行训练,在训练时通过反向传播算法和梯度下降方法来更新所述神经网络模型的模型参数,通过不断调整所述模型参数以最小化预测误差。
为了实现上述目的,根据本发明的另一方面,提供了一种培训成效分析装置,该装置包括:
异常对象识别单元,用于根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果;
第一培训成果分析特征确定单元,用于若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;
第二培训成果分析特征确定单元,用于若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;
培训成果等级确定单元,用于根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述培训成效分析方法的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述培训成效分析方法的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述培训成效分析方法的步骤。
本发明的有益效果为:
本发明实施例基于通过大数据和机器学习训练出的异常对象识别模型以及神经网络模型,自动进行培训成效分析,得到培养对象的培训成果等级,实现了准确高效的进行培训成效分析的有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例培训成效分析方法的流程图;
图2是本发明实施例训练对象分析模型的流程图;
图3是本发明实施例训练异常对象识别模型的流程图;
图4是本发明实施例差分隐私处理流程图;
图5是本发明实施例对目标对象进行异常识别的流程图;
图6是本发明实施例训练神经网络模型的流程图;
图7是本发明实施例整体算法流程图;
图8是本发明实施例神经网络模型流程图;
图9是本发明实施例神经网络模型的结构示意图;
图10是本发明实施例培训成效分析装置的结构框图;
图11是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
需要说明的是,本申请技术方案中采集的信息是经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、存储、使用、加工、传输、提供、公开和应用等处理,均遵守相关国家和地区的相关法律法规和标准,采取了必要保密措施,不违背公序良俗,并提供有相应的操作入口,供用户选择授权或者拒绝。
需要说明的是,本申请技术方案中为用户提供相应的操作入口,供用户选择同意或者拒绝自动化决策结果;若用户选择拒绝,则进入专家决策流程。
需要说明的是,本发明培训成效分析方法和装置涉及人工智能技术领域,可用于金融领域,也可用于除金融领域之外的任意领域,本发明培训成效分析方法和装置的应用领域不做限定。
本发明旨在提供一种基于人工智能和隐私保护的智能培训成效分析方法,通过构建培训成效分析模型,能够自动化地对对象的培训效果进行智能分析,有效地解决传统的分析方式存在的局限性,从而提高培训分析的客观性和准确性。同时引入差分隐私机制,保护对象个人数据的隐私,提高数据安全性。
本发明通过离群点检测算法和主成分分析算法等技术手段,有效清洗和预处理对象数据,并且准确地提取关键的成效特征,从而提高了分析模型的准确性和稳定性。同时引入差分隐私保护机制对对象个人数据进行隐私保护,在分析过程中增加了噪音扰动,从而有效地保护了对象的隐私信息,降低了数据泄露和滥用的风险。还利用了随机森林算法和深度学习模型等先进技术,能够更准确地预测对象的培训表现并对其分类,其中还通过分析后的结果来针对性地设置培训分析指标的权重范围,同时还可以结合历史数据分析结果和预测结果动态调整对象的培训分析指标权重,制定下一步的培养计划,提高了培训分析的客观性和准确性,实现个性化分析的目的。有助于为每一个对象制定适合自身发展的培养方向,同时也为企业培养出更多专业的业务专家,提高企业的整体实力。
图1是本发明实施例培训成效分析方法的流程图,如图1所示,在本发明一个实施例中,本发明的培训成效分析方法包括步骤S101至步骤S103。
步骤S101,根据目标对象的对象数据以及预设的异常对象识别模型,确定所述目标对象的异常识别结果。
在本发明一个实施例中,对象数据可以包括:对象的基础信息(例如,年龄、性别、所属业务条线等信息)、培训日志、培训考勤数据、任务完成情况、培训成效数据、培训时长、对象评价、培训心得等。
本发明结合预训练出的异常对象识别模型以及培养对象的对象数据来分析对象的培训表现是否为异常,进而分别针对培训表现异常的对象和培训表现正常的对象采用不同的模型进行进一步分析处理。
步骤S102,若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征。
在本发明一个实施例中,异常对象分析模型输出的培训成果分析特征用于表示对象培训异常的原因,该培训成果分析特征可以为异常原因类型。在本发明一个实施例中,异常对象分析模型输出的培训成果分析特征包括:用于表示对象培训异常的原因的异常原因特征,以及用于表示对象培训异常的培训异常特征。
在本发明一个实施例中,正常对象分析模型输出的培训成果分析特征用于表示经过培训对象在哪些方面的能力比较突出。在本发明一个实施例中,正常对象分析模型输出的培训成果分析特征包括:用于表示经过培训对象在哪些方面的能力比较突出的突出能力特征,以及用于表示对象培训正常的培训正常特征。
在本发明中,本发明预先设计了合适的培训成效分析指标和权重,本发明可以根据不同的业务条线设置不同的培训成效分析指标。例如,银行的各业务条线的培训成效分析指标具体如下:
零售业务条线:产品知识了解度、沟通能力、推销技巧、销售成果、客户满意度。
科技业务条线:项目管理能力、编程技能熟练度、技术知识掌握度、故障排除能力、创新能力。
财务业务条线:财务报表准确性、财务分析能力、内部控制能力(风险管理、审计和合规性等)。
个金业务条线:客户服务质量、个金产品理解程度、理财规划能力、销售能力。
人力业务条线:招聘能力、培训计划能力、绩效管理能力。
在本发明一个实施例中,本发明在通过正常对象分析模型分析对象的培训成果分析特征时,除了对象的培训成效分析指标还可以结合多种数据源的数据,如对象个人档案、培训日志、对象评价等,以便获得更全面和客观的培训分析评价。各个业务条线指标可以相互融合贯通,如某零售条线的培养对象的销售能力突出同时理财规划能力也很优秀,则可以动态调整其分析指标,并在后续的培训中可以个性化的调整其培养计划。实现人才的高质量能动。
步骤S103,根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
在本发明一个实施例中,本发明将培训成果分析特征输入到神经网络模型中,作为初始特征向量。使用TensorFlow深度学习框架通过构建全连接神经网络模型对训练后的特征数据进行集中地学习训练,利用ReLU激活函数和交叉熵损失函数来实现对培训等级的预测。同时利用全连接神经网络模型对分析结果进行分类,将其划分为不同的培训成效等级。
本发明利用人工神经网络模型对培训成果分析特征进行预测与分类。神经网络模型可以进一步学习数据中的高级特征表示,发现隐藏的模式和规律,更好更精准的优化培训成效预测的结果。将培训成果分析特征作为特征输入到人工神经网络模型中,减少冗余数据,对训练后的特征数据进行集中地学习训练,数据隐私性和数据可用性兼顾,保证确保了学习神经网络模型的检测性能。最后对新的培训分析数据进行分类预测,提高组织的培训管理效率和针对性。
图3是本发明实施例训练异常对象识别模型的流程图,如图3所示,在本发明一个实施例中,本发明训练异常对象识别模型的流程包括步骤S301至步骤S303。
步骤S301,对用于模型训练的对象数据使用主成分分析法进行特征选择和提取,得到对象特征数据。
在本发明中,在训练之前,先收集和整理用于模型训练的对象数据,包括:对象的基础信息(例如,年龄、性别、所属业务条线等信息)、培训日志、任务完成情况、培训成效数据、培训时长、对象评价、培训心得等。这些数据可以来自各种系统和数据源,如企业内部系统、邮件记录等。
然后,本发明运用主成分分析(PCA)算法进行特征选择和提取,将原始的高维的用于模型训练的对象数据转化为低维度的数据,减少冗余信息,提取关键特征。以提高模型训练的效率和准确性。对特征重要性分析,可以进一步筛选和优化特征变量的选择。
步骤S302,采用差分隐私对所述对象特征数据进行加密。
本发明引入差分隐私机制对对象的个人数据采取隐私保护措施,使用拉普拉斯机制生成噪声实现差分隐私保护。噪声的大小可以通过隐私预算来控制,以平衡隐私保护和数据准确性之间的权衡。
步骤S303,基于加密后的所述对象特征数据采用孤立森林算法训练出所述异常对象识别模型。
图4是本发明实施例差分隐私处理流程图,如图4所示,在本发明一个实施例中,上述步骤S302的采用差分隐私对所述对象特征数据进行加密,具体包括步骤S401至步骤S404。
步骤S401,根据对象的涉密等级确定敏感度。
在本发明中,敏感性S可以根据对象数据中的特征数据决定,在本发明一个具体实施例中,可以将敏感度S定义为对象的涉密等级。
步骤S402,根据所述敏感度以及预设的隐私预算计算尺度参数。
在本发明中,本步骤可以根据敏感性S和隐私预算ε,可以通过以下公式计算拉普拉斯分布的尺度参数b:b=S/ε。
隐私预算ε该参数控制了噪声的大小和隐私保护程度,ε越小,则加入的噪声越强,隐私保护程度越高。通过控制ε的取值,可以平衡隐私保护和查询准确性之间的关系,本发明选取的隐私预算可以为ε=0.5。
步骤S403,根据所述尺度参数生成拉普拉斯噪声。
在本发明中,使用拉普拉斯分布的概率密度函数(PDF)来生成随机噪声。拉普拉斯分布的PDF如下所示:
f(x)=(1/(2b))*exp(-|x|/b)
其中,x是随机变量,b是尺度参数。可以使用随机数生成器来从拉普拉斯分布中抽取噪声值。
步骤S404,将所述拉普拉斯噪声添加到对应的所述对象特征数据中。
本发明采用差分隐私保护机制保护对象的隐私信息。本发明在分析过程中引入噪音或扰动,使得任何外部攻击者都无法从输出结果中还原出对象的具体信息。这种隐私保护措施增强了对象对个人数据安全的信任感,降低了数据泄露和滥用的风险。
在本发明一个实施例中,在上述步骤S303之前,本发明还使用离群点检测算法对加密后的所述对象特征数据进行清洗和预处理。
在本发明中,对加噪后的数据进行清洗,包括去除异常值、缺失值和重复值。以及选择所有特征中最具代表性的特征,以降低维度和提高聚类效果,确保数据质量和准确性。本发明通过使用离群点检测算法对对象数据进行清洗和预处理,识别和处理异常值,以提高数据质量。
在本发明一个实施例中,参考图7,本发明采用孤立森林算法训练出异常对象识别模型的具体流程包括以下步骤:
1、数据预处理:对加噪后的对象特征数据集进行标准化处理,确保所有特征处于相同的尺度上。
2、构建孤立森林:使用数据集构建孤立森林模型,设置树的数量(n_estimators)和叶子节点的最小样本数(min_samples_leaf),根据核算需求对象数n_estimators在100到1000之间灵活选取。min_samples_leaf取到n_estimators的百分之一。
①随机选择一个特征和一个随机切割点,将数据集分成子集D1...Dn;
②递归地重复步骤①,将每个子集继续划分,直到子集中的样本数量小于min_samples_leaf或子集划分数量大于n_estimators;
③根据特征选择后的各项培训分析指标构建多个独立的孤立森林。
3、计算异常分数:对于每个对象数据点x,从根节点出发,统计样本在树中通过的路径长度h(x),计算其在每棵树上的路径长度的平均值E(h(x))以及通过n个样本构建一个二叉树的平均路径长度C(n)对样本x的路径长度h(x)进行标准化处理。通过孤立森林模型计算其异常分数s。较高的异常分数表示该对象可能是一个异常对象。具体计算公式如下:
4、设置阈值:通过观察正常数据点和点群点的异常分数分布情况,结合以往经验和领域知识,设置一个异常分数的阈值。超过该阈值的对象将被标记为异常对象B,阈值范围内的标记为正常对象A。
图5是本发明实施例对目标对象进行异常识别的流程图,如图5所示,在本发明一个实施例中,上述步骤S101的根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果,具体包括步骤S501至步骤S503。
步骤S501,从所述目标对象的对象数据中提取出所述目标对象的对象特征数据。
步骤S502,采用差分隐私对所述目标对象的对象特征数据进行加密。
步骤S503,将加密后的所述目标对象的对象特征数据输入到所述异常对象识别模型中,得到所述异常对象识别模型输出的所述目标对象的异常识别结果。
图2是本发明实施例训练对象分析模型的流程图,如图2所示,在本发明一个实施例中,本发明训练对象分析模型的流程包括步骤S201和步骤S202。
步骤S201,建立异常对象样本集和正常对象样本集。
步骤S202,根据所述异常对象样本集采用随机森林模型训练出所述异常对象分析模型,以及根据所述正常对象样本集采用随机森林模型训练出所述正常对象分析模型。
本发明利用随机森林算法对注入噪声后的特征标签数据样本集进行模型训练和分析,分别建立正常对象分析模型和异常对象分析模型。正常对象模型基于历史数据和培训成效分析指标来训练,并能够判断对象的培训表现是否达到预期水平以及对象培训后再哪方面能力较为突出。异常对象模型基于培训考勤指标和对象异常情况原因特征来训练,并能够判断对象的培训表现异常原因,及时做出培养计划的调整。
在本发明中,异常对象样本集中的样本包含:用于模型训练的异常对象特征(培训考勤指标和对象异常情况原因)以及培训成果分析特征标签。
在本发明中,正常对象样本集中的样本包含:用于模型训练的正常对象特征(培训成效分析指标)以及培训成果分析特征标签。
在本发明一个实施例中,参考图7,本发明建立正常对象分析模型和异常对象分析模型的具体流程包括以下步骤:
1、数据集划分:将数据集(即异常对象样本集和正常对象样本集)划分为训练集X和测试集Y。训练集X用于模型的训练和参数调优,而测试集Y用于分析模型的性能。
2、随机采样:从原始数据中使用自助采样(bootstrap sampling)方法,随机选择一部分样本形成一个子样本集M1...Mn。
3、决策树的构建:对于每个子样本集,使用CART算法来构建一个独立的决策树模型。决策树根据特征的不同属性值进行分割,将数据划分为不同的类别或进行连续值的预测。
4、构建森林:重复上述步骤2和步骤3,构建多个决策树模型,形成一个森林。直到子集样本数量是否小于min_samples_leaf或决策树的数量是否大于n_estimatos。
5、根据特征选择后的各项培训分析指标构建多个独立的随机森林。
6、分析结果的整合:对于分类问题,随机森林通过投票的方式来确定最终的分析结果。即每个决策树都对样本进行分类,最终结果为得票数最多的类别。对于回归问题,随机森林将每个决策树的预测结果取平均值作为最终的分析结果(即培训成果分析特征)。整合分析结果得到结果集N。
7、模型分析:使用测试集验证随机森林模型的性能。通过计算准确率、精确率、召回率等指标来分析模型的表现,并根据需要进行模型调优。
8、动态调整分析指标权重:根据随机森林的最终分析结果,对各项分析指标权重进行动态调整。异常对象根据分析结果分析异常原因,及时调整培养方案,如调整业务条线的呢过。
本发明通过随机森林技术实现的智能化分析同时解决差分隐私保护性能和数据可用性呈负相关的问题。随机森林算法能够有效地进行特征选择和建模,从而提高分析的准确性。基于随机森林算法模型引入差分隐私保护机制以CART分类树作为随机森林中的单棵决策树,利用Laplace机制添加噪声,可以有效地减少添加噪声对数据可用性的影响,提高隐私保护性和数据准确性。同时根据随机森林模型训练后的分析结果,结合历史数据预测结果,通过不同对象在不同业务条线下的培训结果高低设置分析指标权重范围,针对对象实现个性化的分析指标权重动态调整,提升对象对分析结果的认可度,进而促使对象参与培训的积极性和主动性的提升。
图6是本发明实施例训练神经网络模型的流程图,如图6所示,在本发明一个实施例中,本发明训练神经网络模型的流程包括步骤S601和步骤S602。
步骤S601,建立用于对所述神经网络模型进行训练的训练集,其中,所述训练集中的训练样本为标注出培训成果等级的用于模型训练的培训成果分析特征。
步骤S602,基于所述训练集对所述神经网络模型进行训练,在训练时通过反向传播算法和梯度下降方法来更新所述神经网络模型的模型参数,通过不断调整所述模型参数以最小化预测误差。
在本发明一个实施例中,本发明神经网络模型包含两个隐藏层,具体结构可以如图9所示,
在本发明一个实施例中,参考图8,本发明神经网络模型的具体流程包括以下步骤:
1、数据准备:将随机森林模型对对象数据预测培训成效分析结果作为初始特征向量输入到神经网络模型中,即输入上述结果集N。对于连续变量,进行归一化处理;对于分类变量,进行独热编码处理。
2、构建全连接神经网络模型:输入层接收由随机森林模型预测的对象培训成果分析结果作为特征向量输入。特征数量与随机森林模型输出的培训成果分析结果特征数量相同。选择两个隐藏层,每个隐藏层神经元数量定为最后一层的输出节点数量的一半(n/2)。隐藏层采用全连接(fully connected)方式,将所有输入连接到每个神经元,并使用ReLU激活函数对隐藏层的每个神经元进行激活。最后一层的输出节点数量为n,用于预测培训成果分析值。
3、模型训练:将数据集划分为训练集q和验证集p,用于模型的训练和分析。使用训练集q对神经网络模型进行训练。选择交叉熵(cross entropy)作为本发明使用的损失函数,刻画两个概率分布之间的距离。由于交叉熵刻画的是两个概率分布之间的距离,而神经网络的输出却不一定是一个概率分布。所以为了解决这个问题,本发明使用Softmax激活函数,将神经网络前向传播得到的输出变成一个概率分布。通过反向传播算法(backpropagation)和梯度下降方法(gradient decent)来更新模型参数,不断调整模型参数以最小化预测误差。通过迭代训练数据集来更新模型的权重和偏置,以减小预测值与真实值之间的差异。
4、模型分析:使用验证集p分析模型的性能,计算均方误差分析结果,判断模型是否满足预期要求。均方误差的数值越小,模型的预测结果与实际值越接近。均方误差计算公式如下:
其中,n为特征数量,xi为第i个样本的真实值,yi为模型对第i个样本的预测值。
5、模型调优:根据分析结果和实际需求,进行隐藏层结构和超参数的调整。可以尝试不同的隐藏层数量、每层神经元数量、学习率、正则化方法等。使用交叉验证、网格搜索等技术来寻找最佳的超参数组合。
6、模型预测与分类:使用训练好的模型对新的对象数据进行预测,得到预测的培训成果分析值。将培训成果分析值转换为数值或离散化的标签,并将其作为目标变量进行训练和测试。通过多层神经网络学习数据中的高层次特征表示,将对象划分为优秀、良好、一般、较差等几个不同的培训成果等级。从而实现对培训成果分类的预测。
7、模型部署:将训练好的模型部署到生产环境中,以实现实时预测或批量预测的功能。
8、反馈与改进:使用训练好的模型,对培训对象进行培训成果分析,将对象的实际工作表现输入到模型中进行分析,该模型能够给出客观和准确的分析结果。此外,还可以对新的对象数据进行培训成效进行预测和分析。根据输入的对象数据,模型可以输出相应的培训评分或分类结果,用于智能分析。
由以上实施例可以看出,本发明方法有助于帮助企业更准确地了解对象的能力水平,发现对象潜在的业务条线潜力,并有助于及时制定针对性培养计划,从而指导人力资源管理和对象培训,提升整体对象能力水平。本发明方法具体效果与优点如下:
1、提高分析的客观性和准确性:本发明通过离群点检测算法清洗数据,排除异常值的干扰,提高分析结果的准确性。同时,利用主成分分析算法从大量特征中提取出最具代表性的特征,减少特征维度,提高模型的效率和泛化能力。
2、智能化的分析:本发明采用随机森林算法对有标签的数据样本进行模型训练和分析,该算法具有较高的自适应性,能够处理高维度数据和复杂关系,提高模型的分析准确性和稳定性。同时与传统的主观评价或简单考试成绩相比,本发明自动化地对对象的培训效果进行分析,减少了人为因素的干扰,提高了分析的客观性和准确性。
3、精准预测与分类:利用全连接神经网络模型对培训结果进行预测和分类,该模型能够学习到更复杂的特征和模式,实现对对象培训效果的精准分析,并为对象选出最合适自身发展的业务条线,为企业后续培养提供很好的方向指引。
4、保护培训对象隐私信息:本发明引入差分隐私机制保护了对象个人数据隐私,通过在数据发布过程中添加噪声,有效降低了对象数据泄露和滥用的风险,确保数据安全性和合规性。符合数据隐私保护法规和标准。
5、保证数据可用性:本发明将利用差分隐私加噪后的对象数据引入到随机森林算法模型中,减少噪声对数据可用性的影响,在不影响隐私保护性的同时提高了数据的准确性。保持了数据的可用性和有效性。
6、提高培训效果与效率:通过智能分析方法,及时发现培训中存在的问题和不足,为企业提供改进培训方案的依据,提高培训效果和效率。同时,该方法能够自动化处理大量数据,减少人工干预,提高工作效率,降低管理成本。
7、可解释性:全连接神经网络模型在预测和分类过程中,能够提供对结果的解释和理由。通过分析模型的权重和特征重要性,可以了解到对对象培训效果影响最大的因素,为进一步改进培训方案提供指导。
8、提高对象满意度和积极性:通过实时反馈对象培训成果分析结果,能够定量分析对象的培训表现,这有助于建立公平、客观的培训分析体系。提升对象对分析结果的认可度,进而促使对象参加培训的积极性。同时能够根据对象优势集中方向动态调整分析指标权重,实现个性化分析指,预测对象潜力和发展方向,这有助于为对象制定个性化的职业发展规划,提供针对性的培训和指导,从而促进对象的成长和发展。
因此,本发明通过提高培训成效分析的客观性和准确性,保护对象隐私信息,以及个性化、智能化的分析和预测的能力,带来多方面的优势。同时,隐私保护措施和智能化技术的应用,并提供了更科学、全面、智能、精准的人力资源管理解决方案,推动管理水平和人才发展水平的持续提升。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种培训成效分析装置,可以用于实现上述实施例所描述的培训成效分析方法,如下面的实施例所述。由于培训成效分析装置解决问题的原理与培训成效分析方法相似,因此培训成效分析装置的实施例可以参见培训成效分析方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图10是本发明实施例培训成效分析装置的第一结构框图,如图10所示,在本发明一个实施例中,本发明的培训成效分析装置包括:
异常对象识别单元1,用于根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果;
第一培训成果分析特征确定单元2,用于若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;
第二培训成果分析特征确定单元3,用于若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;
培训成果等级确定单元4,用于根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
在本发明一个实施例中,本发明的培训成效分析装置,还包括:
第一样本集建立单元,用于建立异常对象样本集和正常对象样本集;
第一模型训练单元,用于根据所述异常对象样本集采用随机森林模型训练出所述异常对象分析模型,以及根据所述正常对象样本集采用随机森林模型训练出所述正常对象分析模型。
在本发明一个实施例中,本发明的培训成效分析装置,还包括:
特征提取单元,用于对用于模型训练的对象数据使用主成分分析法进行特征选择和提取,得到对象特征数据;
差分隐私加密单元,用于采用差分隐私对所述对象特征数据进行加密;
异常对象识别模型建立单元,用于基于加密后的所述对象特征数据采用孤立森林算法训练出所述异常对象识别模型。
在本发明一个实施例中,所述差分隐私加密单元,包括:
敏感度确定模块,用于根据对象的涉密等级确定敏感度;
尺度参数计算模块,用于根据所述敏感度以及预设的隐私预算计算尺度参数;
拉普拉斯噪声生成模块,用于根据所述尺度参数生成拉普拉斯噪声;
噪声添加模块,用于将所述拉普拉斯噪声添加到对应的所述对象特征数据中。
在本发明一个实施例中,本发明的培训成效分析装置,还包括:
数据清洗及预处理单元,用于使用离群点检测算法对加密后的所述对象特征数据进行清洗和预处理。
在本发明一个实施例中,异常对象识别单元1,具体包括:
对象特征数据提取模块,用于从所述目标对象的对象数据中提取出所述目标对象的对象特征数据;
加密模块,用于采用差分隐私对所述目标对象的对象特征数据进行加密;
模型预测模块,用于将加密后的所述目标对象的对象特征数据输入到所述异常对象识别模型中,得到所述异常对象识别模型输出的所述目标对象的异常识别结果。
在本发明一个实施例中,本发明的培训成效分析装置,还包括:
第二样本集建立单元,用于建立用于对所述神经网络模型进行训练的训练集,其中,所述训练集中的训练样本为标注出培训成果等级的用于模型训练的培训成果分析特征;
第二模型训练单元,用于基于所述训练集对所述神经网络模型进行训练,在训练时通过反向传播算法和梯度下降方法来更新所述神经网络模型的模型参数,通过不断调整所述模型参数以最小化预测误差。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图11所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述培训成效分析方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述培训成效分析方法的步骤。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种培训成效分析方法,其特征在于,包括:
根据目标对象的对象数据以及预设的异常对象识别模型,确定所述目标对象的异常识别结果;
若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;
若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;
根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
2.根据权利要求1所述的培训成效分析方法,其特征在于,还包括:
建立异常对象样本集和正常对象样本集;
根据所述异常对象样本集采用随机森林模型训练出所述异常对象分析模型,以及根据所述正常对象样本集采用随机森林模型训练出所述正常对象分析模型。
3.根据权利要求1所述的培训成效分析方法,其特征在于,还包括:
对用于模型训练的对象数据使用主成分分析法进行特征选择和提取,得到对象特征数据;
采用差分隐私对所述对象特征数据进行加密;
基于加密后的所述对象特征数据采用孤立森林算法训练出所述异常对象识别模型。
4.根据权利要求3所述的培训成效分析方法,其特征在于,所述采用差分隐私对所述对象特征数据进行加密,具体包括:
根据对象的涉密等级确定敏感度;
根据所述敏感度以及预设的隐私预算计算尺度参数;
根据所述尺度参数生成拉普拉斯噪声;
将所述拉普拉斯噪声添加到对应的所述对象特征数据中。
5.根据权利要求3所述的培训成效分析方法,其特征在于,还包括:
使用离群点检测算法对加密后的所述对象特征数据进行清洗和预处理。
6.根据权利要求3所述的培训成效分析方法,其特征在于,根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果,具体包括:
从所述目标对象的对象数据中提取出所述目标对象的对象特征数据;
采用差分隐私对所述目标对象的对象特征数据进行加密;
将加密后的所述目标对象的对象特征数据输入到所述异常对象识别模型中,得到所述异常对象识别模型输出的所述目标对象的异常识别结果。
7.根据权利要求1所述的培训成效分析方法,其特征在于,还包括:
建立用于对所述神经网络模型进行训练的训练集,其中,所述训练集中的训练样本为标注出培训成果等级的用于模型训练的培训成果分析特征;
基于所述训练集对所述神经网络模型进行训练,在训练时通过反向传播算法和梯度下降方法来更新所述神经网络模型的模型参数,通过不断调整所述模型参数以最小化预测误差。
8.一种培训成效分析装置,其特征在于,包括:
异常对象识别单元,用于根据目标对象的对象数据以及预设的异常对象识别模型,确定目标对象的异常识别结果;
第一培训成果分析特征确定单元,用于若所述异常识别结果为异常对象,则根据所述目标对象的培训考勤指标、所述目标对象的异常情况原因特征以及预设的异常对象分析模型,得到所述目标对象的培训成果分析特征;
第二培训成果分析特征确定单元,用于若所述异常识别结果为正常对象,则根据所述目标对象的培训成效分析指标以及预设的正常对象分析模型,得到所述目标对象的培训成果分析特征;
培训成果等级确定单元,用于根据所述培训成果分析特征以及预设的神经网络模型,得到所述目标对象的培训成果等级。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任意一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项所述方法的步骤。
11.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410284988.2A CN118134331A (zh) | 2024-03-13 | 2024-03-13 | 培训成效分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410284988.2A CN118134331A (zh) | 2024-03-13 | 2024-03-13 | 培训成效分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118134331A true CN118134331A (zh) | 2024-06-04 |
Family
ID=91237126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410284988.2A Pending CN118134331A (zh) | 2024-03-13 | 2024-03-13 | 培训成效分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118134331A (zh) |
-
2024
- 2024-03-13 CN CN202410284988.2A patent/CN118134331A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108512827A (zh) | 异常登录的识别和监督学习模型的建立方法、装置 | |
CN110837963A (zh) | 一种基于数据、模型及策略的风险控制平台建设方法 | |
CN117349782B (zh) | 智能数据预警决策树分析方法及系统 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN115577152B (zh) | 基于数据分析的在线图书借阅管理系统 | |
CN111986027A (zh) | 基于人工智能的异常交易处理方法、装置 | |
CN112183652A (zh) | 一种联邦机器学习环境下的边缘端偏见检测方法 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN114155025A (zh) | 基于随机森林的电动汽车充电站充电流失用户预测方法 | |
CN117787814A (zh) | 一种基于ai的人才素质能力测评方法及系统 | |
CN116976318A (zh) | 基于深度学习和模型推理的电网倒闸操作票智能审核系统 | |
Tiruneh et al. | Feature selection for construction organizational competencies impacting performance | |
Elwakil | Knowledge discovery based simulation system in construction | |
Parkhi et al. | Machine Learning Based Prediction Model for College Admission | |
CN118134331A (zh) | 培训成效分析方法及装置 | |
Thangarasu et al. | Detection of Cyberbullying Tweets in Twitter Media Using Random Forest Classification | |
Raman et al. | Machine learning based university admit eligibility predictor | |
Liu et al. | Prediction of business process outcome based on historical log | |
CN109146549A (zh) | 彩票用户产品参与度预测方法、系统及设备、存储介质 | |
CN118296389B (zh) | 一种数据指标模型的构建及评估方法 | |
AU2021104628A4 (en) | A novel machine learning technique for classification using deviation parameters | |
US20240184812A1 (en) | Distributed active learning in natural language processing for determining resource metrics | |
Xiao et al. | Interpretable Credit Risk Assessment Based on Heuristic Knowledge Extraction Method | |
Fang et al. | Log-Driven Conformance Checking Approximation Method Based on Machine Learning Model. | |
Zhao et al. | The application of optimized fuzzy decision trees in business intelligence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |