CN117409964A - 一种基于学生在校行为分析的综合心理评测方法 - Google Patents

一种基于学生在校行为分析的综合心理评测方法 Download PDF

Info

Publication number
CN117409964A
CN117409964A CN202310434732.0A CN202310434732A CN117409964A CN 117409964 A CN117409964 A CN 117409964A CN 202310434732 A CN202310434732 A CN 202310434732A CN 117409964 A CN117409964 A CN 117409964A
Authority
CN
China
Prior art keywords
student
data
characteristic
obtaining
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310434732.0A
Other languages
English (en)
Inventor
李舵文
严鹤
王俊
杨权
向涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunqi Intelligent Technology Co ltd
Original Assignee
Yunqi Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunqi Intelligent Technology Co ltd filed Critical Yunqi Intelligent Technology Co ltd
Priority to CN202310434732.0A priority Critical patent/CN117409964A/zh
Publication of CN117409964A publication Critical patent/CN117409964A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Educational Technology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Psychiatry (AREA)
  • Developmental Disabilities (AREA)
  • Child & Adolescent Psychology (AREA)
  • Psychology (AREA)
  • Hospice & Palliative Care (AREA)
  • Social Psychology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)

Abstract

本发明涉及教育技术领域,具体涉及一种基于学生在校行为分析的综合心理评测方法。该方法包括获取学生行为数据,其中,所述行为数据包括学生的网络行为数据、消费行为数据、学习状态数据和行为轨迹数据;基于所述学生行为数据,获得学生特征数据集;判断所述特征数据集中特征值是否超过预设阈值,若超过预设阈值则对对应学生进行干预管理,获得干预管理数据;其中,所述干预管理数据为干预管理过程中的沟通语音数据;通过语言模型对干预管理数据进行文本分类,获得分类结果;且根据分类结果获得学生的心理画像。

Description

一种基于学生在校行为分析的综合心理评测方法
技术领域
本发明涉及教育技术领域,尤其涉及一种基于学生在校行为分析的综合心理评测方法。
背景技术
目前,我国高校学生心理教育工作已经步入全面发展时期,成立心理健康教育机构、设立心理健康教育课程、开展心理健康宣传活动等都是目前主要措施,而以问卷调查方式的心理健康测试和多人主观评分是当前主要的心理健康评测方式。
目前并没有一个统一的学生心理健康异常预警、干预体系,传统的学校心理咨询和心理健康测试的环境、条件等因素的局限性,很难做到准确且全面的对学生进行心理分析,具体缺陷如下:
对于开设大学心理咨询机构方式,虽然一对一的心理咨询心理检测结果更准确,心理辅导效果更好,但需要消耗大量人力,且很多心理健康出现异常的学生不会主动进行心理咨询。
对于问卷调查方式的心理健康测试,虽然可以同时搜集许多人的同类问题资料且省人力省物力,但被测试者主观能动性强,会选择“正确”的答案,导致测试不准确,且心理健康测试问题适用范围也很小。
对于多人主观评分方式,虽然能够避免被测试者主观影响,但评分者和被评者之间的关系往往会影响测试结果,依然缺少足够的客观性,且往往评分缺少足够的专业性。
发明内容
为了解决上述现有技术中存在的技术问题,本发明提供了一种基于学生在校行为分析的综合心理评测方法。
为实现上述目的,本发明实施例提供了如下的技术方案:
在本发明提供的一个实施例中,提供了一种基于学生在校行为分析的综合心理评测方法,该方法包括以下步骤:
获取学生行为数据,其中,所述行为数据包括学生的网络行为数据、消费行为数据、学习状态数据和行为轨迹数据;
基于所述学生行为数据,获得学生特征数据集;
判断所述特征数据集中特征值是否超过预设阈值,若超过预设阈值则对对应学生进行干预管理,获得干预管理数据;其中,所述干预管理数据为干预管理过程中的沟通语音数据;
通过语言模型对干预管理数据进行文本分类,获得分类结果;且根据分类结果获得学生的心理画像。
作为本发明的进一步方案,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生网络行为数据,获取第一特征数据,其中第一特征数据包括上网特征值和消极情绪特征值。
作为本发明的进一步方案,所述根据学生网络行为数据,获取第一特征数据,包括:
以定量时间为单位,结合学生上网流量、上网时长以及请求次数统计学生的上网情况,获得上网特征值。
作为本发明的进一步方案,所述消极情绪特征值包括学生有效消极主题搜索频率;所述学生有效消极主题搜索频率通过如下公式计算获得:
其中,vp为群体单位时长请求次数,为vp的估计量,vg为个人单位时长请求次数,为vg的估计量,N为消极类词汇统计次数,K为学生有效消极主题搜索频率。
作为本发明的进一步方案,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生消费行为数据,获得第二特征数据,所述第二特征数据包括消费额度特征值和饮食规律特征值。
作为本发明的进一步方案,所述学生特征数据集包括第三特征数据,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生学习状态数据,获得第三特征数据,所述第三特征数据包括学习习惯特征值和学习成绩特征值。
作为本发明的进一步方案,所述学生特征数据集包括第四特征数据,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据行为轨迹数据,获得第四特征数据,其中,第四特征数据包括外出作息特征值、外出熬夜作息特征值和社交关系特征值。
作为本发明的进一步方案,所述通过语言模型对干预管理数据进行文本分类,获得分类结果,包括:
将干预管理数据转换为文本数据;
将文本数据进行逐句按性格类型进行标注,获得分段文本集合,其中分段文本集合中的每个分段文本不少于一个标签;
通过语言模型通过对分段文本集合进行分类获得分类结果。
作为本发明的进一步方案,所述语言模型为使用bert语言模型架构进行模型训练获得。
作为本发明的进一步方案,所述根据分类结果,获得学生的心理画像,包括:
将分类结果输入至预训练的心理画像模型,获得学生的心理画像。
本发明提供的技术方案,具有如下有益效果:
本发明通过学生行为分析体现用数据挖掘心理活动,对比调查问卷方式更加客观和准确。人工智能筛选疑似心理健康异常的学生、提供学生心理画像辅助评测,人工干预从心理学专业角度出发完成评测并反馈优化模型,这种结合人工智能和专业心理咨询的综合方法,在减少校园心理教育工作量的同时,保证了心理健康评测的可靠性。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明一个实施例的基于学生在校行为分析的综合心理评测方法的流程图。
图2为本发明一个实施例的基于学生在校行为分析的综合心理评测方法中的热力分布图。
图3为本发明一个实施例的基于学生在校行为分析的综合心理评测方法中的关系配置图。
图4为本发明步骤S40的具体流程图。
图5为本发明步骤S403的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
具体地,下面结合附图,对本发明实施例作进一步阐述。
请参阅图1,图1是本发明实施例提供的一种基于学生在校行为分析的综合心理评测方法的流程图,如图1所示,该综合心理评测方法包括如下步骤:
S10、获取学生行为数据,其中,所述行为数据包括学生的网络行为数据、消费行为数据、学习状态数据和行为轨迹数据;
在本发明的实施例中,所述网络行为数据可以通过从学校网络中心采集学生上网数据,主要包括上网记录以及浏览地址。
在本发明的实施例中,所述消费行为数据可以通过一卡通系统采集学生食堂和超市消费记录。
在本发明的实施例中,所述学习状态数据可以通过采集学生图书馆访问记录、书籍借阅记录、学生考试成绩以及上课情况。
在本发明的实施例中,所述行为轨迹数据可以通过从门禁系统采集学生出入寝室、校园记录。
S20、基于所述学生行为数据,获得学生特征数据集;
在本发明的实施例中,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生网络行为数据,获取第一特征数据,其中,第一特征数据包括上网特征值和消极情绪特征值。
在本发明的实施例中,根据学生网络行为数据,获取第一特征数据,包括:
以定量时间为单位,结合学生上网流量、上网时长以及请求次数统计学生的上网情况,获得上网特征值;
以定量时间为单位,结合学生上网流量、上网时长以及请求次数统计学生的上网情况,获得上网特征值,包括获取周期内每次学生的有效上网时长,根据有效上网时长获取其周期性的变化率,所述周期性变化率为上网频次特征值W。
其中,通过如下公式计算得到有效上网时长w:
其中,tg为群体单位时长平均流量,为tg的估计量,tp为个人单位时长平均流量,为tp的估计量,vp为群体单位时长请求次数,/>为vp的估计量,vg为个人单位时长请求次数,/>为vg的估计量,L为单次上网记录时长,w为此次上网记录对应的有效上网时长,该值周期性的变化率为上网频次特征值W。
所述定量时间可以为月或者季度。
获取学生搜索请求地址,截取搜索关键词,对于特殊类型关键词进行统计。例如求助类词汇、焦虑类词汇、危险物品词汇等。获得消极情绪特征值,所述消极情绪特征值为学生有效消极主题搜索频率。
其中,所述学生有效消极主题搜索频率通过如下公式计算获得:
其中,vp为群体单位时长请求次数,为vp的估计量,vg为个人单位时长请求次数,为vg的估计量,N为消极类词汇统计次数,K为学生有效消极主题搜索频率。
在本发明的实施例中,根据学生网络行为数据,获取第一特征数据,主要从学生上网时长以及网站浏览记录2个影响因素来做数据分析,其中对于上网时长出现明显增长的学生可能出现“逃避现实”的心理情绪,有效的上网时长作为心理分析的特征值W。而网站浏览记录中的敏感词汇可以直接反馈学生的当前状态,消极词频作为心理分析的特征值K。
所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生消费行为数据,获得第二特征数据,所述第二特征数据包括消费额度特征值和饮食规律特征值。
所述消费额度特征值周期性学生消费金额变化率。所述消费额度特征值为M。
具体的,学生消费行为数据可以通过调查问卷获得。周期性学生消费金额变化率可以监测学生是否出现消费额度明显变化。
所述饮食规律特征值为饮食规律值的周期性的变化率。所述饮食规律特征值为D。
具体的,心理健康出现问题的学生,往往会影响到饮食,饮食规律会出现明显的变化,因此需要分析饮食健康情况。
由于学校普遍存在点外卖、帮带饭的情况,无法直接有效的统计学生是否正常吃早餐,选择统计学生在校吃早餐的频率以及非正常时间范围的就餐频率。通过分析食堂就餐人数获取正常情况下学生的就餐时间,以月为单位统计每个学生正常早餐以及异常午、晚餐的次数。
按照比例将正常早餐以及异常午、晚餐的次数换算成学生的饮食规律值,
在本发明的实施例中,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生学习状态数据,获得第三特征数据,所述第三特征数据包括学习习惯特征值和学习成绩特征值。
按照周期统计学生访问图书馆以及逃课次数的频次变化,按照设定比例,获得学习习惯值,并计算周期性的变化率作为学习习惯特征值H;其比例根据实际数据分布而定。
所述学习成绩特征值为一定周期内学生专业排名变化率。可以为一个学期或者一个学年作为统计周期。
所述基于所述学生行为数据,获得学生特征数据集,包括:
在本发明的实施例中,根据行为轨迹数据获得第四特征数据,其中,第四特征数据包括外出作息特征值、外出熬夜作息特征值和社交关系特征值;所述外出作息特征值为A;外出熬夜作息特征值为O;社交关系特征值为F。
所述外出作息特征值为学生周期内的进出寝室、学校的频率的变化率。具体的,周期统计学生进出寝室、学校的频率,并计算周期性的变化率作为外出作息特征值A。
所述外出熬夜作息特征值是根据校园网络账号登录情况,统计学生熬夜睡觉刷手机的时间和次数,计算周期性的变化率获得。
具体的,根据校园网络账号登录情况,统计学生熬夜睡觉刷手机的时间和次数,通过以下公式计算熬夜情况,计算周期性的变化率作为外出熬夜作息特征值O。
其中,外出熬夜作息特征值O通过如下公式计算获得:
其中,t为前一天23:00至当天5:00时段内(该时间段内睡觉被认定为熬夜)的睡觉时间点赋值,该赋值的取值范围为[23,29](如23:00、24:00、1:00、2:00、3:00、4:00、5:00分别赋值为23、24、25、26、27、28、29),m为统计周期(单位为天,且默认为30天),standard为熬夜参考标准时间点(默认为23,即晚上23:00),外出熬夜作息特征值O即为统计周期m(如30天)内在晚上23:00至凌晨5:00之间睡觉的时间总和,单位为小时。
请参阅图2和3,在本发明实施例中,所述社交关系特征值的获取,包括:
根据校园卡的刷卡记录以获取学生群体的共现次数;
使用最小化和的聚类算法将共现次数和共现比例进行分类;
根据共现次数和共现比例获取热力分布图,统计朋友、密友以及知己关系的关系数作为社交关系值,并计算周期性变化率作为社交关系特征值F。
具体的,根据校园卡的刷卡记录以获取学生群体的共现次数,例甲、乙学生先后在食堂的某窗口刷卡,若刷卡间隔时间小于30s则视为共现。随着共现次数的增加,对应的学生关系越好。由于共现本身带有一定的偶然性,本发明还要考虑单个关系的共现次数占个人所有共现的比例。使用最小化和的聚类算法将共现次数和共现比例进行分类,最小化和的计算公式如下:
其中,k是簇个数,C是第i个簇的中心点,x是簇中的一个点,dist是x到C的距离。
然后根据共现次数和共现比例获取热力分布图,统计朋友、密友以及知己关系的关系数作为社交关系值,并计算周期性变化率作为社交关系特征值F。
S30、判断所述特征数据集中特征值是否超过预设阈值,若超过预设阈值则对对应学生进行干预管理,获得干预管理数据和学生标签;其中,所述干预管理数据为干预管理过程中的沟通语音数据。
在本发明的实施例中,判断所述特征数据是否超过预设阈值,包括,汇总以上特征值(包含网络主题特征值K、上网频次特征值W、消费额度特征值M、饮食规律特征值D、学习习惯特征值H、学习成绩特征值S、外出熬夜作息特征值O、外出作息特征值A以及社交关系特征值F),根据数据分布情况(确保一定比例的学生接受心理咨询)设置观测阈值,对于以上特征值变化率超过观测阈值的学生,进行干预管理。
在本发明的实施例中,所述干预管理可以由心理咨询老师或辅导员通过沟通完成,以通过对象的说话方式了解其理活动和个性特征,同时将干预管理数据和学生标签进行保存以备后期的算法分析。
S40、通过语言模型对干预管理数据进行文本分类,获得分类结果,且根据分类结果获得学生的心理画像。
请参阅图4,所述通过语言模型对干预管理数据进行文本分类,获得分类结果,包括:
S401、将干预管理数据转换为文本数据;
S402、将文本数据进行逐句按性格类型进行标注,获得分段文本集合,其中分段文本集合中的每个分段文本不少于一个标签;
S403、通过语言模型通过对分段文本集合进行分类,以获得分类结果。
请参阅图5,在本发明的实施例中,所述通过语言模型对分段文本集合进行分类,以获得分类结果,包括:
S4031、将分段文本进行分字处理,获得字符数据;
在本发明的实施例中,所述将分段文本进行分字处理,获得字符数据,包括:
S40311、将所述分段文本转换为token,其中token最前端有CLS字符,用于代表模型进行文本分类;
S40312、将token转换为算法能够识别的数字,其中词表有21128个字符,包含常用文字、孤僻字、标点符号以及特殊字符等,获得字符数据;
示例句子转换结果如下:
token=['A','B','C','D','E','F','G'];
token_ids=[101,1920,2110,6440,4923,1922,7410]。
S4032、对字符数据按照短填长切的方式进行预处理,获得等长字符数据,具体的,可以将字符数据的长度设置为pad_size为32,不足长度用0不足,超出长度直接舍弃,同时生成对应的mask,有文本的部份的数据为1,让补0的部份设定为0,避免模型训练时将过多文本补0的值考虑进去计算,示例句子转换结果如下:
token_ids=[101,1920,2110,6440,4923,1922,7410,749,2130,1059,6656,679,677,5688,1941,8024,2769,2110,4638,1962,5168]
mask=[1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0]。
S4033、通过语言模型对等长字符数据进行分类,获得分类结果;其中,所述语言模型通过使用bert语言模型架构进行模型训练获得。
Bert(Bidirectional Encoder Representations from Transformers)算法,是基于Transformer算法的双向编码表征算法,Transformer算法基于多头注意力(Multi-Head attention)机制,而Bert又堆叠了多个Transfromer模型,并通过调节所有层中的双向Transformer来预先训练双向深度表示,而且预训练的Bert模型可以通过额外的输出层来进行微调,适用性更广,并且不需要做更多重复性的模型训练工作。
进一步的,对经bert模型训练完成后获得的语言模型进行模型优化。
bert模型中需要调整的参数少,调整幅度小,所述参数包括:mini-batch(模型训练批量大小)、hidden-size(隐藏层神经元个数)、num-epoch(迭代次数)和learning-rate(学习率)。
其中,mini-batch:在适当范围内越大训练速度越快,但消耗GPU性能也越多,本发明中优选16。
hidden-size:该值较为固定,本发明中优选768。
num-epoch:迭代次数,本发明中优选2或3。
learning-rate:越大训练速度越快,但容易使训练结果发散。
在本发明的实施例中,所述文本分类的分类类型包含:中性、乐观、自信、友善、焦虑等中的若干项。所述类型标注过程中可以通过数字进行表示,例如:(0,中性)(1,乐观)(2,自信)(3,友善)(5,焦虑)等。
在本发明的实施例中,所述根据分类结果获得学生的心理画像,包括:将分类结果输入至心理画像模型,通过所述心理画像模型对分类结果进行分析,以获得学生的心理画像。
在本发明的实施例中,所述心理画像模型的获得包括如下步骤:
获取心理画像模型的特征值,其中,心理画像模型的特征值获得包括:将分类结果进行统计,获得对应类型的数量,所述对应类型的数量为心理画像模型的特征值;
获取心理画像模型的标签;其中,心理画像模型的标签为干预管理过程获得的学生标签;
基于所述心理画像模型的特征值和心理画像模型的标签,利用机器学习中的多分类算法进行训练,获得心理画像模型。
本发明还能够通过获得心理画像,为干预管理过程中的心理健康评测提供参考辅助,大大降低工作量。同时经过干预管理过程的心理咨询记录可以作为训练集反馈迭代模型,提高模型准确率。
本发明基于学生行为分析数据挖掘学生心理活动,对比调查问卷方式更加客观和准确。专业心理健康老师的干预管理以及文本标注,让人工智能的分析变得专业化。同时,聊天沟通的干预方式也能让学生放下防备,更准确、更全面地表现出学生的心理健康状态。人工智能筛选疑似心理健康异常的学生、提供学生心理画像辅助评测,人工干预从心理学专业角度出发完成评测并反馈优化模型,这种结合人工智能和专业心理咨询的综合方法,在减少校园心理教育工作量的同时,保证了心理健康评测的可靠性。
应该理解的是,上述虽然是按照某一顺序描述的,但是这些步骤并不是必然按照上述顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,本实施例的一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种基于学生在校行为分析的综合心理评测方法,其特征在于,该方法包括:
获取学生行为数据,其中,所述行为数据包括学生的网络行为数据、消费行为数据、学习状态数据和行为轨迹数据;
基于所述学生行为数据,获得学生特征数据集;
判断所述特征数据集中特征值是否超过预设阈值,若超过预设阈值则对对应学生进行干预管理,获得干预管理数据;其中,所述干预管理数据为干预管理过程中的沟通语音数据;
通过语言模型对干预管理数据进行文本分类,获得分类结果;且根据分类结果获得学生的心理画像。
2.如权利要求1所述的综合心理评测方法,其特征在于,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生网络行为数据,获取第一特征数据,其中,第一特征数据包括上网特征值和消极情绪特征值。
3.如权利要求2所述的综合心理评测方法,其特征在于,所述根据学生网络行为数据,获取第一特征数据,包括:
以定量时间为单位,结合学生上网流量、上网时长以及请求次数统计学生的上网情况,获得上网特征值。
4.如权利要求2所述的综合心理评测方法,其特征在于,所述消极情绪特征值包括学生有效消极主题搜索频率;所述学生有效消极主题搜索频率通过如下公式计算获得:
其中,vp为群体单位时长请求次数,为vp的估计量,vg为个人单位时长请求次数,/>为vg的估计量,N为消极类词汇统计次数,K为学生有效消极主题搜索频率。
5.如权利要求1所述的综合心理评测方法,其特征在于,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生消费行为数据,获得第二特征数据,所述第二特征数据包括消费额度特征值和饮食规律特征值。
6.如权利要求1所述的综合心理评测方法,其特征在于,所述学生特征数据集包括第三特征数据,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据学生学习状态数据,获得第三特征数据,所述第三特征数据包括学习习惯特征值和学习成绩特征值。
7.如权利要求1所述的综合心理评测方法,其特征在于,所述学生特征数据集包括第四特征数据,所述基于所述学生行为数据,获得学生特征数据集,包括:
根据行为轨迹数据,获得第四特征数据,其中,第四特征数据包括外出作息特征值、外出熬夜作息特征值和社交关系特征值。
8.如权利要求1-7任一所述的综合心理评测方法,其特征在于,所述通过语言模型对干预管理数据进行文本分类,获得分类结果,包括:
将干预管理数据转换为文本数据;
将文本数据进行逐句按性格类型进行标注,获得分段文本集合,其中分段文本集合中的每个分段文本不少于一个标签;
通过语言模型通过对分段文本集合进行分类获得分类结果。
9.如权利要求8所述的综合心理评测方法,其特征在于,所述语言模型为使用bert语言模型架构进行模型训练获得。
10.如权利要求1所述的综合心理评测方法,其特征在于,所述根据分类结果,获得学生的心理画像,包括:
将分类结果输入至预训练的心理画像模型,获得学生的心理画像。
CN202310434732.0A 2023-04-21 2023-04-21 一种基于学生在校行为分析的综合心理评测方法 Pending CN117409964A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310434732.0A CN117409964A (zh) 2023-04-21 2023-04-21 一种基于学生在校行为分析的综合心理评测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310434732.0A CN117409964A (zh) 2023-04-21 2023-04-21 一种基于学生在校行为分析的综合心理评测方法

Publications (1)

Publication Number Publication Date
CN117409964A true CN117409964A (zh) 2024-01-16

Family

ID=89489640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310434732.0A Pending CN117409964A (zh) 2023-04-21 2023-04-21 一种基于学生在校行为分析的综合心理评测方法

Country Status (1)

Country Link
CN (1) CN117409964A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109712718A (zh) * 2018-12-29 2019-05-03 深圳阿塔基科技有限公司 基于人工智能分析学生心理的方法、装置及存储介质
CN110111894A (zh) * 2019-05-15 2019-08-09 杭州华网信息技术有限公司 基于深度学习学生序列化行为的心理健康预警方法
CN110957039A (zh) * 2019-12-16 2020-04-03 河南科技学院 一种基于深度学习的校园心理辅导的方法及装置
US20210110894A1 (en) * 2018-06-19 2021-04-15 Ellipsis Health, Inc. Systems and methods for mental health assessment
CN113035232A (zh) * 2021-03-23 2021-06-25 北京智能工场科技有限公司 一种基于语音识别的心理状态预测系统、方法及装置
CN113626499A (zh) * 2021-08-09 2021-11-09 青软创新科技集团股份有限公司 一种基于大数据数仓技术的学生画像挖掘实现方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210110894A1 (en) * 2018-06-19 2021-04-15 Ellipsis Health, Inc. Systems and methods for mental health assessment
CN109712718A (zh) * 2018-12-29 2019-05-03 深圳阿塔基科技有限公司 基于人工智能分析学生心理的方法、装置及存储介质
CN110111894A (zh) * 2019-05-15 2019-08-09 杭州华网信息技术有限公司 基于深度学习学生序列化行为的心理健康预警方法
CN110957039A (zh) * 2019-12-16 2020-04-03 河南科技学院 一种基于深度学习的校园心理辅导的方法及装置
CN113035232A (zh) * 2021-03-23 2021-06-25 北京智能工场科技有限公司 一种基于语音识别的心理状态预测系统、方法及装置
CN113626499A (zh) * 2021-08-09 2021-11-09 青软创新科技集团股份有限公司 一种基于大数据数仓技术的学生画像挖掘实现方法

Similar Documents

Publication Publication Date Title
Huang et al. Predicting students’ academic performance by using educational big data and learning analytics: evaluation of classification methods and learning logs
Srinivasan et al. Biases in AI systems
Meyers et al. Applied multivariate research: Design and interpretation
Albers Introduction to quantitative data analysis in the behavioral and social sciences
Amigud et al. Using learning analytics for preserving academic integrity
Darbor et al. Experiencing versus contemplating: Language use during descriptions of awe and wonder
Chen et al. Automatic personality identification using writing behaviours: an exploratory study
Evans Using basic statistics in the behavioral and social sciences
Jayes et al. Initial evaluation of the Consent Support Tool: a structured procedure to facilitate the inclusion and engagement of people with aphasia in the informed consent process
TW201706884A (zh) 資料分析系統、資料分析方法、資料分析程式及記錄媒體
Frey There's a stat for that!: What to do & when to do it
Rolison et al. Characteristics of offenders: The HEXACO model of personality as a framework for studying offenders’ personality
JP2017522676A (ja) 才能のデータ駆動型識別システム及び方法
Tromp et al. Senticorr: Multilingual sentiment analysis of personal correspondence
Vrij et al. How researchers can make verbal lie detection more attractive for practitioners
Le et al. Measuring goodness of story narratives: Implications for traumatic brain injury
Williams et al. A psychometric study of six self-report measures for use with sexual offenders with cognitive and social functioning deficits
Habibi et al. Optimization of the ANFIS using a genetic algorithm for physical work rate classification
Bhatti et al. Personality analysis of the USA public using Twitter profile pictures
McKenzie et al. Assessing the accuracy of the WISC-IV seven-subtest short form and the child and adolescent intellectual disability screening questionnaire in identifying intellectual disability in children
Miceli et al. Do personality traits and self‐regulatory processes affect decision‐making tendencies?
Tu et al. A polytomous model of cognitive diagnostic assessment for graded data
Hahs‐Vaughn Analysis of data from complex samples
Qinghua Data mining and management system design and application for college student mental health
Ugurlu et al. An expert system for determining the emotional change on a critical event using handwriting features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination