CN114153952A - 一种面试考官管理系统及评分质量监测分析方法 - Google Patents
一种面试考官管理系统及评分质量监测分析方法 Download PDFInfo
- Publication number
- CN114153952A CN114153952A CN202111582542.0A CN202111582542A CN114153952A CN 114153952 A CN114153952 A CN 114153952A CN 202111582542 A CN202111582542 A CN 202111582542A CN 114153952 A CN114153952 A CN 114153952A
- Authority
- CN
- China
- Prior art keywords
- interviewer
- text
- management system
- scoring
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012544 monitoring process Methods 0.000 title claims abstract description 29
- 230000008451 emotion Effects 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 230000002996 emotional effect Effects 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 238000002203 pretreatment Methods 0.000 claims 1
- 239000002994 raw material Substances 0.000 claims 1
- 238000011156 evaluation Methods 0.000 abstract description 15
- 238000012360 testing method Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 13
- 238000004590 computer program Methods 0.000 description 5
- 206010063659 Aversion Diseases 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- IJJWOSAXNHWBPR-HUBLWGQQSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]-n-(6-hydrazinyl-6-oxohexyl)pentanamide Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)NCCCCCC(=O)NN)SC[C@@H]21 IJJWOSAXNHWBPR-HUBLWGQQSA-N 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000001134 F-test Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001543 one-way ANOVA Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面试考官管理系统及评分质量监测分析方法,包括,采集面试考官管理系统中的文本评分原始数据进行预处理,形成样本数据集;将所述样本数据集输入改进的学习机中,获得正负情感倾向文本分类的文本语料;利用语义网络主题聚类策略构建关键需求主题模型,从所述文本语料中找到含有所述正负情感倾向文本的关键需求主题;结合情感分析模型提取所述关键需求主题分析面试考官的需求并生成分析报告。本发明通过情感分析模型对面试考官的评分质量做出合理的分析,在基于情感倾向的基础上,增大了分析结果的准确度,也对评分质量有了进一步的可靠监控。
Description
技术领域
本发明涉及面试考官管理系统的评分质量分析的技术领域,尤其涉及一种面试考官管理系统及评分质量监测分析方法。
背景技术
随着信息技术的提高,各行各业得到迅猛发展,但是机关事业单位招聘和公务员招录行业在信息化的进程中比较滞后,大部分依然沿袭过去的纸质面试评分方式,考官依靠个人经验对面试者进行判断和录用决策,未对考官的管理和评分进行分析监测,如同盲人摸象,对于面试质量优劣的评估,也是仅凭面试者考试结果的好坏或对考官职务的高低来进行简单评估,数据收集过程繁琐,这样的评估缺乏系统性和全面性,在求职情形复杂的今天,其结果大多是既不实用,也不准确。
目前,大数据所隐含的价值让其逐渐成为各行各业关注的焦点,大数据的处理技术也日趋成熟,为各行各业迎来了最好的发展机遇,利用大数据全面服务招考行业,采用基于证据的监测分析,让面试者更清楚自己的面试情况,让用人单位可以适时地调整自己的面试方式。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的技术问题是:如何简易的、全面性的监测面试评分质量。
为解决上述技术问题,本发明提供如下技术方案:包括,采集面试考官管理系统中的文本评分原始数据进行预处理,形成样本数据集;将所述样本数据集输入改进的学习机中,获得正负情感倾向文本分类的文本语料;利用语义网络主题聚类策略构建关键需求主题模型,从所述文本语料中找到含有所述正负情感倾向文本的关键需求主题;结合情感分析模型提取所述关键需求主题分析面试考官的需求并生成分析报告。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:所述预处理包括,采集所述文本评分原始数据进行统计分析,汇总整理成待预处理的语料;利用Word2vec训练所述语料,得到词向量。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:形成所述样本数据集包括,对所述词向量进行中文分词、数据清洗和机械压缩去重处理,取其求和的平均值并设置情感极性标签,形成所述样本数据集。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:设计改进的学习机,对输入的所述样本数据集进行样本分类训练,获得正负情感倾向文本分类的文本语料;所述改进的学习机包括,加入0.7V的三角波和锯齿波干扰信号至ELM极限学习机中,得到针对单隐含层+双隐含层前馈神经网络算法。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:获得所述文本语料包括,对所述改进的学习机的输入权值向量和隐含层节点进行随机赋值,完成初始化;计算隐含层输出矩阵;计算输出权值矩阵;输出计算结果,即为所述文本语料。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:构建所述关键需求主题模型包括词、主题和文档,如下,
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:还包括,
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:得到所述关键需求主题包括,所述关键需求主题模型从所述文本语料中的每篇文档的主题分布中抽取出一个主题;对抽取的所述主题中所对应的单词分布中再抽取出一个单词,依次重复循环,直至遍历所述文档中的全部词汇;最终找到所述正负情感倾向文本的所述关键需求主题。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:提取所述关键需求主题还包括,正向情感主题提取和负向情感主题提取。
作为本发明所述的一种面试考官管理系统及评分质量监测分析方法的一种优选方案,其中:所述情感分析模型包括,句子特征提取和深度神经网络分类;所述句子特征提取包括,所述语料的输入、所述词向量的转化和句子向量特征提取;所述深度神经网络分类包括,输入节点、隐藏节点和输出节点。
本发明的有益效果:本发明通过情感分析模型对面试考官的评分质量做出合理的分析,在基于情感倾向的基础上,增大了分析结果的准确度,也对评分质量有了进一步的可靠监控。
附图说明
图1为本发明一个实施例所述的一种面试考官管理系统及评分质量监测分析方法的流程示意图;
图2为本发明一个实施例所述的一种面试考官管理系统及评分质量监测分析方法的改进的学习机的拓扑示意图;
图3为本发明一个实施例所述的一种面试考官管理系统及评分质量监测分析方法的情感分析模型波形走势示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
实施例1
参照图1、图2和图3,为本发明的第一个实施例,提供了一种面试考官管理系统及评分质量监测分析方法的一种实施方式,具体包括:
S1:采集面试考官管理系统中的文本评分原始数据进行预处理,形成样本数据集。其中需要说明的是,预处理包括:
采集文本评分原始数据进行统计分析,汇总整理成待预处理的语料;
利用Word2vec训练语料,得到词向量。
具体的,形成样本数据集包括:
对词向量进行中文分词、数据清洗和机械压缩去重处理,取其求和的平均值并设置情感极性标签,形成样本数据集。
S2:将样本数据集输入改进的学习机中,获得正负情感倾向文本分类的文本语料。参照图2,本步骤需要说明的是:
设计改进的学习机,对输入的样本数据集进行样本分类训练,获得正负情感倾向文本分类的文本语料;
改进的学习机包括,加入0.7V的三角波和锯齿波干扰信号至ELM极限学习机中,得到针对单隐含层+双隐含层前馈神经网络算法。
进一步的,获得文本语料包括:
对改进的学习机的输入权值向量和隐含层节点进行随机赋值,完成初始化;
计算隐含层输出矩阵;
计算输出权值矩阵;
输出计算结果,即为文本语料。
S3:利用语义网络主题聚类策略构建关键需求主题模型,从文本语料中找到含有正负情感倾向文本的关键需求主题。其中还需要说明的是,构建关键需求主题模型包括词、主题和文档,如下,
进一步的,得到关键需求主题包括:
关键需求主题模型从文本语料中的每篇文档的主题分布中抽取出一个主题;
对抽取的主题中所对应的单词分布中再抽取出一个单词,依次重复循环,直至遍历文档中的全部词汇;
最终找到正负情感倾向文本的关键需求主题。
提取关键需求主题还包括正向情感主题提取和负向情感主题提取。
S4:结合情感分析模型提取关键需求主题分析面试考官的需求并生成分析报告。本步骤还需要说明的是,情感分析模型包括:
句子特征提取和深度神经网络分类;
句子特征提取包括,语料的输入、词向量的转化和句子向量特征提取;
深度神经网络分类包括,输入节点、隐藏节点和输出节点。
较佳的,情感分析模型需进行训练,包括:
(1)确定情感分析模型待训练的训练集是已标定好的、大量的、与测试集相关的语料集;
(2)提前进行预实验以确定训练集与测试集在样本数据中的占比,根据预实验结果定义训练集与测试集的比例为5:5;
(3)利用句子向量化和单词向量化将训练集中的语料转换成计算机能够识别的计算机语言并输入情感分析模型中进行训练;
部分运行代码示意如下:
(4)不断调整训练的情感分析模型,直至输出的调试结果在正负情感倾向判定的阈值内时结束训练;
(5)将测试集输入到训练好的情感分析模型中进行测试,得到测试集语料的正负情感倾向。
再进一步的,本实施例还需要说明的是,步骤(4)的判定包括:
若输出结果位于阈值区间的左侧,则判断输入的语料的情感倾向为负向;
若输出结果位于阈值区间的右侧,则判断输入的语料的情感倾向为正向。
优选地,本实施例还需要再次详细说明的是,本实施例中提出的情感分析模型还包括基于数据分析的目标函数,其通过将分析得出的评分数据上传系统后自动形成数据报表(即分析报告),展示每位面试官评分的贡献度、评分松紧指和差异系数。
具体的,计算贡献度指数包括:
根据测评的概化理论(generalizability theory),估计基于全体面试官数据的概化系数(测评总信度);通过去除单个面试官给分数据,逐个估计缺失某个面试官情况下的概化系数;利用总信度估计值减去缺失某个面试官情况下的信度估计值,从而找出在控制测评误差方面贡献最小的考官;为了便于解读,概化系数之差被放大了1000倍,用GXI表示。
较佳的,在所有面试官对全部面试者都给了分数(面试的交叉设计),而且分数为100分制的情况下,可以把每个面试官给分看作是题目得分,通过计算克隆巴赫alpha系数,估计全体面试官以及逐个去除各位面试官情况下的测评信度,如下:
通俗的说,上述公式由克隆巴赫(Cronbach)提出,其不要求测验题目仅是(0,1)计分,可以处理任何测验的内部一致性系数的计算问题。
一般来说,该系数愈高,即工具的信度愈高,在基础研究中,信度至少应达到 0.80才可接受,在探索性研究中,信度只要达到 0.70 就可接受,介于 0.70-0.98 均属高信度,而低于 0.35 则为低信度,必须予以拒绝。
本实施例中提出的α系数是所有可能的分半信度的平均数,其只是测验信度下界的一个估计值,即α值大,必有较高的信度,但α值小,却不能判定信度不高。
进一步的,得到评分松紧度包括:
计算公式如下,
SJI=60+13*Z
其中,Z为面试官给分离均差(某面试官所给分数与所有面试官所给分数均值之差)的均值,除以离均差均值的标准差所得到的标准分数,评分松紧指数SJI介于21-99之间(z介于-3到3之间)。
评分松紧指数的判断准则包括:
(1)若面试官的松紧指数SJI大于73分,则说明该面试官使用的评分标准比较松,而且给出的分数彼此差异比较大;
(2)若SJI大于86分,则说明该面试官给分非常松,而且给出的分数彼此差异非常大;
(3)若SJI小于47分,则说明该面试官给分比较紧,而且给出的分数彼此差异比较大;
(4)若SJI小于34分,则说明该面试官给分非常紧,而且给出的分数彼此差异非常大。
对分数离均差做单向方差分析时,面试官给分之间F检验时的差异显著(p<0.05)。
异常指数包括人情指数和厌恶指数,具体包括:
人情指数:离均差极端高,等于离均差最大值的考生(绿色);
厌恶指数:离均差极端低,等于离均差最小值的考生(黄色)。
再进一步需要说明的是,得到差异系数包括:
差异系数(Coefficient of variation, CV)是描述一个面试官给所有考生给分的内部差异程度的指标,这个指标是用来鉴别给分偏激面试官的。
计算公式如下:
CV=100* (S/M)
其中,M和S分别为单个面试官给所有考生打分的平均值和标准差。
判断准则包括:
(1)若个别面试官的CV值远远小于多数面试官的相应值,则建议该面试官适当加大考生之间的分数差异,确保面试的区分效度;
(2)若个别面试官的CV值远远大于多数面试官的相应值,则建议该面试官适当压缩考生之间的得分差异,确保所有面试官给出比较接近的分数差异。
优选的是,本实施例提供的一种面试考官管理系统及评分质量监测分析方法不仅能高精度的监控面试考官的评分质量,还能根据以往历史数据的运算(即通过样本数据集对情感分析模型的训练),得到一套基于大数据分析的面试官水平评价准则(即参数指标,由此得到优秀、良好、一般的评价),包括如下内容:
(1)若整体面试的评分者信度估计值(肯德尔和谐系数w值或克隆巴赫α值)高于0.70,则表明本次面试信度均为优秀,不需要进一步分析面试官其它指标;
(2)若整体面试的评分者信度估计值介于0.50-0.69之间,则需要进一步考察面试官松紧指数;
(3)若整体面试的评分者信度估计值小于0.50,则需要进一步考察以下所有指标;
(4)若松紧指数SJI介于(47,73)之间,而且贡献度指数GXI>50,则说明面试官水平为优秀;
(5)若松紧指数SJI>86或者SJI<34,而且贡献度指数GXI<30,则说明该面试官水平一般;
(6)若面试官水平较差,则建议差异系数CV最小的面试官适当增加考生之间的分数差异;
(7)若评分者信度估计值小于0.50,则贡献度最小的面试官属于乱打分者;
(8)若评分者信度估计值小于0.50,则人情指数最高值所对应的面试官和考生属于“该面试官给这个考生打了人情分”;
(9)其它情况说明面试官处于合格水平。
进一步需要说明的是,本实施例中提出的贡献度、评分松紧指和差异系数所要解决的问题不同,把三个指标综合成一个单一总分就好比把个体的身高、体重和心跳速率相加求总分一样,没有意义,因此不赞成使用单一总分指标;同时,本实施例中基于单项方差分析的合理区间是方差分析之F检验的结果P<0.05;且贡献度指数最低的面试官都需要提醒,没有决定临界值。
再进一步需要详细说明的是,人情指数和厌恶指数,可以通过比较每个面试官离均差的最大值和最小值,搜寻到具体考生编号;在同一个岗位中,若人情指数或厌恶指数很高,而且其贡献度指数GXI>50,则可认为是合格面试官,否则需要被提醒或接受更多培训;另一方面,若个别面试官的差异系数CV远远小于其他面试官的相应值,则提醒面试官少给中等分数,提高区分度。
不难理解的是,本实施例中提出的改进的学习机(即改进的ELM算法)在学习过程不需要调整隐含层节点参数,输入层至隐含层的特征映射可以是随机的或人为给定的;由于仅需求解输出权重,ELM在本质上是一个线性参数模式(linear-in-the-parametermodel),其学习过程易于在全局极小值收敛 。
进一步的,与现有技术相比,本实施例提出的改进的学习机一方面通过输入层和隐含层的连接权值、隐含层的阈值可以随机设定,且设定完后不用再调整,这和现有的BP神经网络不一样,BP需要不断反向去调整权值和阈值,因此采用本实施例提出的改进的学习机就能减少一半的运算量;同时,在另一方面,本实施例提供的改进的学习机的隐含层和输出层之间的连接权值β不需要迭代调整,而是通过解方程组方式一次性确定。
参照图3,为采用本发明方法在仿真平台进行模拟分析的波形走势图,能够直观的看出,本发明方法在通过改进的学习机的支持下,有效的过滤了无用数据,结合情感分析模型准确的得到分析结果,整体都是属于平缓、平滑的走势曲线。
优选地,本发明通过情感分析模型对面试考官的评分质量做出合理的分析,在基于情感倾向的基础上,增大了分析结果的准确度,也对评分质量有了进一步的可靠监控。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种面试考官管理系统及评分质量监测分析方法,其特征在于:包括,
采集面试考官管理系统中的文本评分原始数据进行预处理,形成样本数据集;
将所述样本数据集输入改进的学习机中,获得正负情感倾向文本分类的文本语料;
利用语义网络主题聚类策略构建关键需求主题模型,从所述文本语料中找到含有所述正负情感倾向文本的关键需求主题;
结合情感分析模型提取所述关键需求主题分析面试考官的需求并生成分析报告。
2.根据权利要求1所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:所述预处理包括,
采集所述文本评分原始数据进行统计分析,汇总整理成待预处理的语料;
利用Word2vec训练所述语料,得到词向量。
3.根据权利要求1或2所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:形成所述样本数据集包括,
对所述词向量进行中文分词、数据清洗和机械压缩去重处理,取其求和的平均值并设置情感极性标签,形成所述样本数据集。
4.根据权利要求3所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:设计改进的学习机,对输入的所述样本数据集进行样本分类训练,获得正负情感倾向文本分类的文本语料;
所述改进的学习机包括,加入0.7V的三角波和锯齿波干扰信号至ELM极限学习机中,得到针对单隐含层+双隐含层前馈神经网络算法。
5.根据权利要求4所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:获得所述文本语料包括,
对所述改进的学习机的输入权值向量和隐含层节点进行随机赋值,完成初始化;
计算隐含层输出矩阵;
计算输出权值矩阵;
输出计算结果,即为所述文本语料。
8.根据权利要求7所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:得到所述关键需求主题包括,
所述关键需求主题模型从所述文本语料中的每篇文档的主题分布中抽取出一个主题;
对抽取的所述主题中所对应的单词分布中再抽取出一个单词,依次重复循环,直至遍历所述文档中的全部词汇;
最终找到所述正负情感倾向文本的所述关键需求主题。
9.根据权利要求8所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:提取所述关键需求主题还包括,正向情感主题提取和负向情感主题提取。
10.根据权利要求9所述的一种面试考官管理系统及评分质量监测分析方法,其特征在于:所述情感分析模型包括,
句子特征提取和深度神经网络分类;
所述句子特征提取包括,所述语料的输入、所述词向量的转化和句子向量特征提取;
所述深度神经网络分类包括,输入节点、隐藏节点和输出节点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582542.0A CN114153952A (zh) | 2021-12-22 | 2021-12-22 | 一种面试考官管理系统及评分质量监测分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582542.0A CN114153952A (zh) | 2021-12-22 | 2021-12-22 | 一种面试考官管理系统及评分质量监测分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114153952A true CN114153952A (zh) | 2022-03-08 |
Family
ID=80452055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111582542.0A Pending CN114153952A (zh) | 2021-12-22 | 2021-12-22 | 一种面试考官管理系统及评分质量监测分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114153952A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908782A (zh) * | 2017-12-06 | 2018-04-13 | 陕西识代运筹信息科技股份有限公司 | 一种基于情感分析的数据处理方法和装置 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN109977413A (zh) * | 2019-03-29 | 2019-07-05 | 南京邮电大学 | 一种基于改进cnn-lda的情感分析方法 |
CN111914086A (zh) * | 2020-07-07 | 2020-11-10 | 广西科技大学 | 一种基于lstm神经网络的手机评论分析方法及系统 |
CN112836051A (zh) * | 2021-02-19 | 2021-05-25 | 太极计算机股份有限公司 | 一种在线自学习的法院电子卷宗文本分类方法 |
-
2021
- 2021-12-22 CN CN202111582542.0A patent/CN114153952A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107908782A (zh) * | 2017-12-06 | 2018-04-13 | 陕西识代运筹信息科技股份有限公司 | 一种基于情感分析的数据处理方法和装置 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN109977413A (zh) * | 2019-03-29 | 2019-07-05 | 南京邮电大学 | 一种基于改进cnn-lda的情感分析方法 |
CN111914086A (zh) * | 2020-07-07 | 2020-11-10 | 广西科技大学 | 一种基于lstm神经网络的手机评论分析方法及系统 |
CN112836051A (zh) * | 2021-02-19 | 2021-05-25 | 太极计算机股份有限公司 | 一种在线自学习的法院电子卷宗文本分类方法 |
Non-Patent Citations (3)
Title |
---|
吕书龙等: "关于评委评分的评价模型", 《福州大学学报(自然科学版)》 * |
孙尚迪,顾晓东: "基于线性核极限学习机的情感分类", 《微型电脑应用》 * |
杨志明等: "《面试中的评分者贡献度指数及其应用》", 《教育测量与评价》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150269529A1 (en) | Systems and Methods for Assessing Structured Interview Responses | |
CN106874643A (zh) | 基于词向量自动构建知识库实现辅助诊疗的方法和系统 | |
CN106557462A (zh) | 命名实体识别方法和系统 | |
CN105808970A (zh) | 一种在线认知评估系统及评估方法 | |
CN110570941B (zh) | 一种基于文本语义向量模型评估心理状态的系统和装置 | |
Valanarasu | Comparative analysis for personality prediction by digital footprints in social media | |
CN109409433B (zh) | 一种社交网络用户的人格识别系统和方法 | |
KR102062586B1 (ko) | 화장품 관련 리뷰 데이터 기반 화장품 추천 시스템 및 화장품 추천 방법 | |
CN110391013A (zh) | 一种基于语义向量构建神经网络预测心理健康的系统和装置 | |
CN111477328B (zh) | 一种非接触式的心理状态预测方法 | |
CN112667776A (zh) | 一种智能教学评估与分析方法 | |
CN108681749A (zh) | 基于网络社交平台的隐私信息甄别方法 | |
US10803318B1 (en) | Automated scoring of video clips using extracted physiological features | |
CN109272262B (zh) | 一种自然语言特征的分析方法 | |
Amini et al. | Word associations contribute to machine learning in automatic scoring of degree of emotional tones in dream reports | |
CN114153952A (zh) | 一种面试考官管理系统及评分质量监测分析方法 | |
CN115762721A (zh) | 一种基于计算机视觉技术的医疗影像质控方法和系统 | |
Arsirii et al. | Models and methods of intellectual analysis for medical-sociological monitoring’s data based on the neural network with a competitive layer | |
Lestari et al. | Decision support system for service quality using smart and fuzzy servqual methods | |
CN108022057A (zh) | 学习行为分析方法及系统 | |
CN114664415A (zh) | 基于深度学习模型的智能科室导诊推荐系统 | |
CN114490925A (zh) | 公共事件下的情绪挖掘方法及设备 | |
CN113361653A (zh) | 基于数据样本增强的深度学习模型去偏方法和装置 | |
Dalvean | Changes in the style and content of Australian election campaign speeches from 1901 to 2016: A computational linguistic analysis | |
Ramesh et al. | A frame work for classification of multi class medical data based on deep learning and Naive Bayes classification model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220308 |
|
RJ01 | Rejection of invention patent application after publication |