CN114974586B - 一种人工智能量表的自动监测方法及系统 - Google Patents
一种人工智能量表的自动监测方法及系统 Download PDFInfo
- Publication number
- CN114974586B CN114974586B CN202210609478.9A CN202210609478A CN114974586B CN 114974586 B CN114974586 B CN 114974586B CN 202210609478 A CN202210609478 A CN 202210609478A CN 114974586 B CN114974586 B CN 114974586B
- Authority
- CN
- China
- Prior art keywords
- data
- scale
- psychological
- working state
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明提供的一种人工智能量表的自动监测方法及系统,方法包括:获取量表数据;对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;根据所述分析结果预测公司职工的工作状态,获得测评结果。依靠人工智能的量表自动分析方法,一方面设计规则算法实现大规模量表作答数据的清洗和筛选,解析学习各种心理因素的相关性规律,并为相关心理学研究提供数据挖掘解读;另一方面经过机器学习训练,应对大量的新增数据,也能够进行快速地清洗和分析,高效地实现对公司职工群体的心理健康状态评级,及时做出预警和建议。
Description
技术领域
本发明涉及心理健康量表测评领域,尤其涉及一种人工智能量表的自动监测方法及系统。
背景技术
近些年来,受社会环境、生活节奏、工作压力多方面影响,多行业职工心理健康水平呈下降趋势。职工心理健康问题的日益凸显,严重影响了企业组织效率和生产安全,引起了社会的广泛关注。因此,加强职工心理健康服务是维护其身心健康、提高其工作效率、提升工作幸福度的基础和重要组成部分,也是促进企业和谐、增强企业凝聚力的迫切任务。
心理测评是心理健康服务的工作基础,科学、客观的心理健康测评是准确评估职工现阶段的真实心理健康水平、明确存在于职工群体中的主要心理问题、筛查心理健康风险人群的有效手段。同时,基于对心理健康测评结果的准确分析,能够判断出不同问题群体存在的心理健康问题、对工作状态的影响程度,是对职工开展有针对性的心理健康服务,和真正改善职工心理健康水平的前置条件。
传统的心理健康测评的分析结果主要依赖心理专业人员对职工进行人工研判,通过对职工所填量表进行计分、统计后,再结合对职工的行为模式、认知功能等多方面进行观察,分析其工作状态;或依据职工的主观表述对其工作状态进行判断。以上方法或需要投入大量的人力和时间成本,无法高效、迅捷地监测大规模群体的心理健康状态,也难以快速评价职工现阶段的心理健康水平对工作状态的影响。
人工智能与机器学习的发展为自动化分析大规模数据、监测和预警公司全体职工的心理状态提供了可能。与心理学手段不同,现有技术中,机器学习的流程是先拿到一部分数据进行分析建模,也就是将数据拆分为训练集与测试集,通过训练和验证测试得到一个较优的模型,用以对更多的数据直接进行结果预测。近年来,机器学习领域提出了很多有效的方法,例如回归、支持向量机、人工神经网络、决策树、随机森林,而这些方法也被陆续尝试与心理学应用相结合。
传统的心理测评方法需要大量人力和时间成本,对公司职工这类大规模群体的心理健康状态监测效率很低。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种人工智能量表的自动监测方法及系统。
根据本发明的一个方面,提供了一种人工智能量表的自动监测方法包括:
获取量表数据;
对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;
根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;
根据所述分析结果预测公司职工的工作状态,获得测评结果。
可选的,所述获取量表数据具体包括:获取公司职工的心理健康量表作答数据。
可选的,所述对所述量表数据进行异常数据的检测与清洗具体包括:
将所述量表数据中的噪声样本筛除,获得筛除量表数据;
将所述筛除量表数据补全并规范数据格式。
可选的,所述根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果具体包括:
统计公司职工的心理健康量表作答数据;
计算出十六项心理因子的评分,并根据评分数据对因子两两求得Pearson相关性系数:
其中X和Y分别表示比较的两个心理因子向量,ρ(X,Y)表示它们的Pearson相关性系数,Cov(X,Y)表示它们的协方差,σX和σY分别表示X和Y的标准差,μX和μY分别表示X和Y的均值;
根据所述相关性系数绘制散点图和相关性矩阵,反应各个心理因子之间的相关关系。
可选的,所述根据所述分析结果预测公司职工的工作状态,获得测评结果具体包括:
对所述分析结果采用机器学习模型进行学习,所述分析结果为心理因子评分数据;
将因子评分嵌入为特征编码,根据TabNet与XGBoost回归预测工作状态得分,取平均值后接一层全连接层预测该分数对应的工作状态级别;
同时由所述TabNet与所述XGBoost分类模型分别预测工作状态级别;
将得到的三种评级进行“投票”,获取多数结果作为最终结果。
本发明还公开了一种人工智能量表的自动监测系统,包括:
量表数据的异常检测与清洗模块,用于对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;
心理因子计算与相关性分析模块,用于根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;
公司职工工作状态预测模块,用于根据所述分析结果预测公司职工的工作状态,获得测评结果。
本发明提供的一种人工智能量表的自动监测方法及系统,方法包括:获取量表数据;对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;根据所述分析结果预测公司职工的工作状态,获得测评结果。依靠人工智能的量表自动分析方法,一方面设计规则算法实现大规模量表作答数据的清洗和筛选,解析学习各种心理因素的相关性规律,并为相关心理学研究提供数据挖掘解读;另一方面经过机器学习训练,应对大量的新增数据,也能够进行快速地清洗和分析,高效地实现对公司职工群体的心理健康状态评级,及时做出预警和建议。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明公开的一种人工智能量表的自动监测方法的流程框图;
图2为本发明公开的一期数据示例图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
如图1所示,本实施提供的本发明提出的适用于职工心理健康测评的人工智能量表自动监测系统包括:量表数据的异常检测与清洗模块、心理因子计算与相关性分析模块和公司职工工作状态预测模块。
附图1为本发明的流程框架图,输入一批公司职工的心理健康量表作答数据,将首先由异常检测与清洗模块筛除噪声样本、补全和规范数据格式,然后计算心理因子评分并分析数据相关性,最后导入工作状态预测模块获取评测结果。提供心理学研究的数据挖掘支持和职工心理健康状态的快速评级。
在量表数据异常检测与清洗模块中,根据公司职工的总体特点,设定了五项异常检查约束条件,主要检查样本的性别、年龄、答题态度等是否符合要求。其中性别应只有1或2两种选择(男性和女性),年龄应在19岁至70岁之间,分心度应小于12,问卷作答选择不应该过于单一(在75题中同一选项出现超过60次或者有两个选项均出现超过30次视为选择单一)。对于输入的大量心理健康量表作答数据,若触发上述任意约束条件,样本将被标记问题,并在后续的数据分析中剔除。数据中还有可能出现键值空缺的情况,也将对数据进行格式化补全,缺损值填入0作为默认值。经过清洗,能够保证后续用来分析的数据格式规范易读,并避免错误样本信息引起的数据偏差。
心理因子计算与相关性分析模块是用来探究各个心理因子之间的共现关系的,比如情绪抑郁的人是否更容易出现工作倦怠的状态。模块经过量表作答统计,计算出十六项心理因子的评分,并根据评分数据对因子两两求得Pearson相关性系数:
如图2所示,同时绘制散点图(图示初判)和相关性矩阵,以清晰简洁地反应各个心理因子之间的相关关系。能够为心理学研究提供有力的数据挖掘支持。
公司职工工作状态预测模块用来预测每个职工目前的工作状态评级,心理健康量表的测评结果。
公司职工工作状态预测模块首先接收上一模块计算出的心理因子评分数据进行学习。针对于表格类型的数据特征,主要引用了两种效果很好机器学习模型TabNet和Xgboost进行学习。
为了充分利用训练数据中的“工作状态得分”和“工作状态级别”两种参考标签,并得到尽可能准确的结果,我们进一步结合多种方法建立模型:首先将因子评分嵌入Embedding为特征编码,由TabNet与XGBoost回归预测工作状态得分,取平均值后接一层全连接层预测该分数对应的工作状态级别;同时由TabNet与XGBoost分类模型分别预测工作状态级别;最后将得到的三种评级进行“投票”,取多数结果作为最终结果,若三种评级均不相同说明模型在该样本上误差较大,应不予采信并对样本特别标记。
有益效果:综上,将利用一期带标签的数据对该模型进行训练和测试,并在后期输入大量新增数据时快速计算职工工作状态的评级结果。能够为高效地心理分析师提供预判建议,也能够支持海量、快速的公司职工心理健康数据监测和预警。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种人工智能量表的自动监测方法,其特征在于,所述监测方法包括:
获取量表数据;
对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;
根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;
根据所述分析结果预测公司职工的工作状态,获得测评结果;
对所述分析结果采用机器学习模型进行学习,所述分析结果为心理因子评分数据;
将因子评分嵌入为特征编码,根据TabNet与XGBoost回归预测工作状态得分,取平均值后接一层全连接层预测该分数对应的工作状态级别;
同时由所述TabNet与所述XGBoost分类模型分别预测工作状态级别;
将得到的三种评级进行“投票”,获取多数结果作为最终结果。
2.根据权利要求1所述的一种人工智能量表的自动监测方法,其特征在于,所述获取量表数据具体包括:获取公司职工的心理健康量表作答数据。
3.根据权利要求1所述的一种人工智能量表的自动监测方法,其特征在于,所述对所述量表数据进行异常数据的检测与清洗具体包括:
将所述量表数据中的噪声样本筛除,获得筛除量表数据;
将所述筛除量表数据补全并规范数据格式。
5.一种人工智能量表的自动监测系统,其特征在于,包括:
量表数据的异常检测与清洗模块,用于对所述量表数据进行异常数据的检测与清洗,获得处理后量表数据;
心理因子计算与相关性分析模块,用于根据所述处理后量表数据计算心理因子并进行相关性分析,获得分析结果;
公司职工工作状态预测模块,用于根据所述分析结果预测公司职工的工作状态,获得测评结果,对所述分析结果采用机器学习模型进行学习,所述分析结果为心理因子评分数据;
将因子评分嵌入为特征编码,根据TabNet与XGBoost回归预测工作状态得分,取平均值后接一层全连接层预测该分数对应的工作状态级别;
同时由所述TabNet与所述XGBoost分类模型分别预测工作状态级别;
将得到的三种评级进行“投票”,获取多数结果作为最终结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210609478.9A CN114974586B (zh) | 2022-05-31 | 2022-05-31 | 一种人工智能量表的自动监测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210609478.9A CN114974586B (zh) | 2022-05-31 | 2022-05-31 | 一种人工智能量表的自动监测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114974586A CN114974586A (zh) | 2022-08-30 |
CN114974586B true CN114974586B (zh) | 2023-04-07 |
Family
ID=82956882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210609478.9A Active CN114974586B (zh) | 2022-05-31 | 2022-05-31 | 一种人工智能量表的自动监测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114974586B (zh) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109192310A (zh) * | 2018-07-25 | 2019-01-11 | 同济大学 | 一种基于大数据的大学生心理行为异动系统方案设计方法 |
-
2022
- 2022-05-31 CN CN202210609478.9A patent/CN114974586B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114974586A (zh) | 2022-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111583012B (zh) | 融合文本信息的信用债发债主体违约风险评估方法 | |
CN110033284A (zh) | 房源验真方法、装置、设备及存储介质 | |
JP2019028834A (ja) | 異常値診断装置、異常値診断方法、およびプログラム | |
CN116596305A (zh) | 用于食品安全管理的风险分级方法 | |
CN114936801A (zh) | 基于大数据的配网调度运行管理方法 | |
CN118297444A (zh) | 一种面向人工智能的数据集质量通用评估方法 | |
CN116777596A (zh) | 一种劳务人员信用评估方法和系统 | |
CN114974586B (zh) | 一种人工智能量表的自动监测方法及系统 | |
Radiman et al. | The Influence of Financial Literacy and Personal Financial Attitude on Financial Behavior with Lifestyle as an Intervening Variable on Productive Generation Y in Medan City | |
CN116720118A (zh) | 标签质量智能分析方法、装置、电子设备及存储介质 | |
CN113538021A (zh) | 一种商场门店存续预测机器学习算法 | |
CN114625627B (zh) | 一种基于大数据多维分析的用户智能感知方法 | |
CN113889274B (zh) | 一种孤独症谱系障碍的风险预测模型构建方法及装置 | |
CN115511454A (zh) | 一种生成审核规则的方法、装置及相关产品 | |
CN115035974A (zh) | 一种心理测评数据管理系统及方法 | |
CN113537759A (zh) | 一种基于权重自适应的用户体验度量模型 | |
Arora et al. | Prediction of Dynamic Price of Ride-On-Demand Services Using Linear Regression | |
CN117688503B (zh) | 一种基于移动端的用电安全检查系统 | |
Zanellati et al. | Balancing Performance and Explainability in Academic Dropout Prediction | |
Pakdil et al. | Control Charts | |
CN117744108A (zh) | 基于ai模型分析的安全保密风险管理系统 | |
Nimkoff et al. | NRBA App User’s Guide | |
Twati et al. | Identifying Leadership Styles towards Optimizing External Affairs of Libya | |
CN117349728A (zh) | 一种智能化模型的质量评测方法及装置 | |
Paterson et al. | Predictive Analytics in Education: Considerations in Predicting versus Explaining College Student Retention. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |