CN115910345A - 一种心理健康测评智能预警方法及存储介质 - Google Patents

一种心理健康测评智能预警方法及存储介质 Download PDF

Info

Publication number
CN115910345A
CN115910345A CN202211655242.5A CN202211655242A CN115910345A CN 115910345 A CN115910345 A CN 115910345A CN 202211655242 A CN202211655242 A CN 202211655242A CN 115910345 A CN115910345 A CN 115910345A
Authority
CN
China
Prior art keywords
user
sequence
vector
psychological
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211655242.5A
Other languages
English (en)
Other versions
CN115910345B (zh
Inventor
唐天驰
张汝民
刘昌松
张超意
黄明贵
黄倩影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shuye Intelligent Technology Co ltd
Original Assignee
Guangdong Shuye Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Shuye Intelligent Technology Co ltd filed Critical Guangdong Shuye Intelligent Technology Co ltd
Priority to CN202211655242.5A priority Critical patent/CN115910345B/zh
Publication of CN115910345A publication Critical patent/CN115910345A/zh
Application granted granted Critical
Publication of CN115910345B publication Critical patent/CN115910345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明属于心理健康与自然语言处理技术领域,具体是涉及一种心理健康测评智能预警方法及存储介质。目的在于解决单一的量表测评选项没有完整语义信息导致无法直接用于建模的问题以及单一量表测评结果无法全面刻画用户心理状态的问题。主要方案包括获取心理测评量表中每一个题的作答选项,通过量表模板,生成对应作答选项的陈述句,得到用户心理状态映射序列,将用户心理状态映射序列和用户表现序列后随机打乱得到特征序列,对特征序列进行平均池化得到特征向量
Figure 617156DEST_PATH_IMAGE002
Figure 236357DEST_PATH_IMAGE004
,将向量
Figure 34548DEST_PATH_IMAGE002
Figure 764607DEST_PATH_IMAGE004
对应的权重向量
Figure 512114DEST_PATH_IMAGE006
Figure 567795DEST_PATH_IMAGE008
与心理预警事件掩码结合得到权重向量
Figure 604015DEST_PATH_IMAGE010
Figure 137765DEST_PATH_IMAGE012
Figure 192308DEST_PATH_IMAGE010
Figure 635535DEST_PATH_IMAGE012
与特征序列加权平均得到向量
Figure 673898DEST_PATH_IMAGE014
Figure 745759DEST_PATH_IMAGE016
Figure 654809DEST_PATH_IMAGE014
Figure 537446DEST_PATH_IMAGE016
拼接得到心理状态向量
Figure 531946DEST_PATH_IMAGE018
,然后向量
Figure 407499DEST_PATH_IMAGE018
送入分类模块进行预测。

Description

一种心理健康测评智能预警方法及存储介质
技术领域
本发明属于心理健康与自然语言处理技术领域,具体是涉及一种心理健康测评智能预警方法及存储介质。
背景技术
青少年的健康问题已经关乎国家发展,尤其是心理健康问题,如何在校园开展心理健康风管理,快速及时地筛查青少年的心理健康问题,避免心理危机及极端事件的发生。目前的心理健康校园管理主要通过量表测评的形式进行,但由于学生对量表理解的不到位、学生量表作答的隐瞒性以及量表自身阈值的准确性等导致量表测评结果的诸准确性和有效性受到质疑。
随着信息化技术与人工智能技术的发展与推广,出现了多个在线心理评测系统及AI心理等级预警的应用,具体如下:
专利CN 105956095 A《一种基于细粒度情感词典的心理预警模型构建方法》需要先构建中文情感词典,在此基础上剔除影响情感分析的词语、符号后再进行情感值归一化。接着,按照同义词林扩充情感词典,最后进行基于规则的情感向性分析。该方法是一种无监督方法,利用文本的统计特征进行建模,适用于大型无标记的语料数据。此外,并未引入专业的心理学测评量表,无法利用准确反映用户心理状态的信息,因此该方法仅适用于常规文本情感分析。
专利CN 113990522 A《基于多模态数据学生心理危机预警系统》通过采集学生日常表达烦恼的文本数据、教师与家长登记的信息结合学生人脸图像数据进行心理健康等级判定。该系统的预测模型会对应激事件列表、心理危机词库、心理测评因子得分极值进行判定,汇总数据然后生成预警报表来判断学生的心理状态,该利用得分极值进行判定的方式泛化能力不强,没有针对学生测评的内容进行具体分析,因此该方法无法精确预测学生的心理预警等级。
专利CN 113571158 A《一种智慧智能AI智能心理健康检测与分析测评系统》通过特定人群在线填写基本情况量表生产用户画像,然后从心理健康检查的知识题库中查询出与用户画像匹配的专用测试问题以及通用测试问题给用户填写,接着统计答题分数并将其作为神经网络的输入进行建模。该方法虽然快捷方便,但是忽略了用户对量表不理解从而填写不准确导致量表信息不能完全反映用户心理健康的情况。如果能引入用户的外部信息辅助量表联合建模进行心理等级预警则会更具针对性。
专利CN 114388103 A《一种针对青少年心理预警分析的算法》主要通过利用用户的心理测试调查问卷的得分进行建模,并未利用到其他方面的信息。
目前在解决青少年心理健康预测准确问题上多数采用填写测评问卷、测试题的方式预测学生的心理状态,或者是借助辅助设备如摄像头等采集面部信息作为辅助数据提高预测的准确率,但并未发现在针对量表测评结果和用户信息来对测评结果做智能分析的方法。
现有量表测试的答案选项内容均为短语,由于单一的选项缺乏上下文因此不能明确地表明完整语义信息,无法直接用于建模。而量表的问题和选项结合在一起蕴含了用户的心理信息。此外,量表测评结果存在对用户心理状态的反映不全面的缺陷,需要引入外部用户信息作为辅助才能更为全面地刻画用户心理状态。因此,如何根据量表问答生成一段有完整语义的陈述句和如用于是亟需解决的问题。
发明内容
本发明的目的在于解决单一的量表测评选项没有完整语义信息导致无法直接用于建模的问题以及单一量表测评结果无法全面刻画用户心理状态的问题。
为了实现上述目的本发明采用以下技术手段:
本发明提供了一种心理健康测评智能预警方法,包括以下步骤:
步骤1、收集心理测评量表数据,对心理测评量表中每一个问题的每一个作答选项定义量表模板;
步骤2、获取被测试者的心理测评量表数据,获取心理测评量表中每一个题的作答选项,通过步骤1中的量表模板,生成对应作答选项的陈述句,最终得到的所有作答选项对应的陈述句保存到列表中,得到用户心理状态映射序列;
步骤3、用户表现描述,将收集到的用户描述按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列;
步骤4、将步骤2得到的用户心理状态映射序列随机打乱后进行编码得到用户心理特征序列,将步骤3得到的用户表现序列随机打乱后进行编码得到用户表现特征序列,其中 m是用户心理特征序列的长度, n是户表现特征序列的长度, d是向量维度, R是实数,表示实数向量空间;
步骤5、根据对于用户心理特征序列和用户表现特征序列创建心理预警事件掩码,得到心理预警事件掩码MASK1和MASK2;
步骤6、将用户心理特征序列和用户表现特征序列分别进行平均池化得到用户整体心理特征向量和用户整体表现特征向量
步骤7、计算用户整体表现特征向量和用户心理特征序列中各个位置特征对应的注意力权重,计算用户整体心理特征向量和用户表现特征序列中各个位置特征对应的注意力权重,每一个位置的注意力权重按顺序排列得到注意力权重向量 a=( a 1 , …, a m ),同理将按顺序排列得到注意力权重向量 β=( β 1 , …, β m );
步骤8、将注意力权重向量 aβ分别与心理预警事件掩码MASK1和MASK2结合,即对应位置元素相加得到新的注意力权重向量
步骤9、将用户心理特征序列按照新的注意力权重加权平均得到向量
将用户表现特征序列按照新的注意力权重加权平均得到向量,将向量拼接得到心理状态向量
步骤10、将心理状态向量送入分类模块进行心理健康预警等级预测,得到心理健康预警等级。
在上述技术方案的基础上,还包括规则判断模块,定义用户表现中存在K个对用户心理影响较大的极端事件,当大于等于K/2个极端事件出现时,心理健康预警等级判断为最高级,并输出结果,若极端事件出现的个数小于K/2个,由步骤10得到的心理健康预警等级作为输出结果。
在上述技术方案的基础上,步骤1中定义量表模板,每个定义量表模板包括句子模板和短语模板构成,句子模板为包含若干个含有变量的句子,短语模板为句子模板中对应的变量的所有可能的值,通过句子模板和短语模板组合得到每一个作答选项对应的若干陈述句,所述陈述句表达的语义与问题与作答选项组合在一起的语义相近。
在上述技术方案的基础上,步骤4具体包括以下步骤:
步骤4.1、将步骤2获得的用户心理状态映射序列,首先将其中的陈述句的顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码,给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作,BERT对打乱后的用户心理状态映射序列里每一个陈述句依次编码便得户心理特征序列向量
步骤4.2、用户表现序列随机打乱以后再经过Bert编码得到用户表现特征序列向量
在上述技术方案的基础上,步骤5包括以下步骤:
步骤5.1、对于用户心理特征序列,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如(0,…,1,…,1,…,0)的掩码MASK1;
步骤5.2、对于用户表现特征序列,找出K2个与家庭关系、学习状态、同学矛盾最相关的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
在上述技术方案的基础上,步骤6中用户的整体心理特征向量和用户整体的表现特征向量
其中是m量表特征序列的长度,n是用户特征序列的长度, i代表的是位置。
在上述技术方案的基础上,步骤7中:
注意力权重
注意力权重
exp()代表指数函数,即 exp(x)=e x ,tanh()是双曲正切函数;
tanh( x) =(  e x – e -x ) /(  e x  + e -x ) ,表示序列中第 i个位置的用户表现特征向量的转置,表示序列中第i个位置的用户心理特征向量的转置,Wa和Wb是预定义的参数矩阵, b a 是偏置。
在上述技术方案的基础上,步骤8中:
在上述技术方案的基础上,步骤9中:
将向量拼接得到向量,具体如下:
本发明还提供了一种存储介质,处理器执行存储介质中的程序时,实现一种心理健康测评智能预警方法。
因为本发明采用上述技术手段,因此具备以下有益效果:
1、为解决无法直接利用量表选项信息用于建模的技术问题。本发明采用基于模板的自然语言生成技术,为保证生成语料的连贯性和准确性,由心理学专家和语言学专家共同设计出专业的模板提供使用,为量表测评结果生成大量的能直接反映用户性格特定、抑郁倾向、自我伤害倾向的陈述句。
2、采用了交互注意力机制让模型自动捕捉到序列中哪些位置的特征更能反映用户的心理状态。设计掩码机制增强序列中关键位置的特征权重让其信息占据主导地位,让模型预测的结果更可靠。
3、序列顺序打乱策略这里的打乱并不指的是样本顺序的打乱,而是一个样本里面包含多个小的元素(陈述句),打乱是指把样本内部的排列的元素(陈述句)进行了打乱。打乱就是意旨让模型训练时更容易关注到序列不同位置的关键信息,增强模型的泛化能力,让模型预测效果更好。普通打乱样本顺序只是模型训练的一个常规手段,避免训练数据跟测试数据完全不一样导致预测效果不好。
4、基于极端事件会对用户心理状态产生较大影响并能一定程度反映心理状态的共识。本发明设计了规则判断机制,判断极端事件出现的个数,若当前用户触发的极端事件个数过多则表明当前用户的心理状态一定值得关注,会被判定为最高的等级。通过规则判断联合模型预测使得最终结果更准确。
附图说明
图1为方法系统框图;
图2为数据处理模块框图;
图3为特征提取模块框图;
图4为编码模块框图;
图5为特征融合模块框图;
图6为分类模块框图。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。
本发明采用了基于模板的自然语言生成技术,依据量表问题和选项生成相映的陈述语句。为保证生成语料的连贯性和准确性,由心理学专家和语言学专家共同设计出专业的量表模板,量表测评选项根据模板能生成内容丰富的候选陈述句,这些陈述句不仅能精准反应用户性格特点、抑郁倾向并具备完整的语义。
引入能够反应用户日常精神状况,日常上课表现、人际关系的用户信息联合量表测评结果建模。采用了交互注意力机制和预警事件掩码增强机制让模型自动聚焦到与对心理状态相关度最高的特征。
为了让模型训练时更容易捕捉到序列不同位置的重要特征,采用了序列顺序打乱策略增强模型泛化能力。
鉴于极端事件的发生会对用户心理状态产生较大影响的特点,设计了基于规则的判断机制,当极端事件发生个数较多时规则判断机制将用户心理预警等级判定为最高级别。
本发明整体框架如图1所示,分别包括数据处理模块、规则判断模块、特征提取模块,分类模块。接下来按照模块进行详细介绍:
1、数据处理模块:
在此模块中,心理测评量表与用户状态表现数据作为模块输入,通过量表模板库与关键内容转化,获得用户心理状态映射序列和用户表现序列。
心理测评量表就是指如抑郁筛查量表PHQ-9,中学生心理健康诊断测评MHT等心理健康测评量表。心理测评量表由定期开展心理测评活动的方式收集,在该阶段对不同群体的学生进行针对性的量表测评,学生通过填写特定的量表得到当前的性格特点、自我伤害倾向、抑郁倾向等相关信息。而用户表现描述,指学生的日常精神状况,日常上课表现以及日常和同学关系、家庭关系等。
量表模板是为了将量表问答自然地转化为能够反映用户性格特点、心理状态的陈述句而设计的。由句子模板和短语模板构成,句子模板包含若干个含有变量的句子,短语模板则是句子模板中变量对应的所有可能的值,模板的设计需要考虑到语句的连贯性、丰富性与准确性,因此由专业的语言学家和心理学家讨论后设计出相关的模板,针对不同的测评量表定义了不同的句子和模板与之对应。以抑郁筛查量表PHQ-9为例:
问题为:“做什么事情都没有兴趣,没意思”对应的答案选项为“没有或者很少时间”,原来选项和问题在一起是“没有或者很少时间做什么事情都没有兴趣,没意思”。则这个问答对生成对应的陈述句为如“做事时【很有动力】,对所作的事情【感兴趣】”,“对所作的事情一直【很有兴趣,觉得很有意思】”,“【不会】感到做什么事情都【没兴趣,没意思】”等等。其中“【】”代表的是句子模板中的变量槽,将短语模板填入便生成了一个完整的句子。若当前用户填写了D个量表,每一个量表有 M d 个问答,每一个问题包含 N d 个选项,每一个选项提供 K d 个句子模板,每个句子模板含有一个 Z K 个短语变量槽,每一个短语变量槽有 L Z 个候选的短语模板,则该模板会为用户生成
个可能的候选陈述句。假设用户填写了三个量表,每一个量表有十五个问题,每一个问题有四个选项,每个选项有四个句子模板,每个句子模板有两个变量槽,每个变量槽有十个对应的短语模板,则量表模板总共会为该用户生成七万两千个可能的候选陈述句,这种方式可以丰富文本内容的多样性。
量表的问答蕴含了用户的心理信息,由于是选项的形式无法直接利用,因此在关键内容转化模块采用上述基于量表模板的自然语言生成技术将这些问答生成为描述用户心理的陈述句用于建模(建模在这里是指对要输入模型的数据做前期处理)。对每一个量表d而言,先从当前问答选项对应的 K d 个句子模板中随机选取一个,然后再从当前句子模板的 Z K 个变量槽中为每一个变量槽从 L Z 个候选变量随机选取一个填入生成了一个完整的陈述句,最后将每一个问答的生成结果用列表保存,便得到用户心理状态映射序列。对于用户表现描述,将一段收集到的用户日常表现及行为的文本按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列。例如,“在日常生活中和家人相处愉悦,享受在一起的时光。经常受到老师的夸赞,在班级中也受欢迎。做事情专注,热爱学习。”按照句号分割并依次保存便得到如下列表:[“在日常生活中和家人相处愉悦,享受在一起的时光。”,“经常受到老师的夸赞,在班级中也受欢迎。”,“做事情专注,热爱学习。”]。
2、规则判断模块
在此模块中需要对用户元数据分析用户的学习情况和判断极端情况的出现,因为对于学生群体而言学习成绩和作业完成情况直接表明学生学习能力,如果成绩或者作业完成质量严重不达标说明该学生十分可能厌学,心理状态是急需关注的。
用户元数据指一个学年内收集的用户的考试成绩与作业评分数据。对于学生成绩和作业数据的具体分析过程如下。
首先利用已收集的学生群体一个学年内的数据计算总体参数,具体地,假设某学生 j以往的考试总分为 (M是考试次数),则其考试成绩总均分为:
如果有N个学生,那么所有学生考试成绩总均分的均值 u为:
所有学生的考试成绩总均分的方差为:
根据此均值方差建立一元高斯分布,此分布概率密度函数为:
在进行判断时,给定当前用户的考试成绩总均分 x,如果 x小于即小于均值减去三倍的标准差则认为当前用户的分数远低于平均水平,是异常值。同理,根据作业评分也能建立一组参数不同的一元高斯分布用于判断用户长期的作业完成质量是否达标。
除了成绩和作业完成质量,用户表现如家庭关系如果出现破裂、与同学经常发生肢体冲突等事件的发生也会表面该用户的心理状态是需要重视的,这类极端情况出现得越多越能表面该用户的心理状态越值得关注。对此,具体判断规则是,假设用户表现中存在K个对用户心理影响较大的极端事件,当大于等于K/2个极端情况出现时,该用户的心理预警等级会被判断为最高级,若极端情况出现的个数小于K/2个,则由模型决定最终的心理预警等级。
3.特征提取模块:
整体如图2所示,编码模块会利用在数据处理阶段得到的序列化文本信息(用户心理状态映射序列、用户表现序列),将文本映射到深层的分布式特征空间,得到序列化的文本语义特征(用户心理特征序列、用户表现特征序列),这些序列化的文本特征是用户心理状态以及用户表现信息的抽象表征。特征融合模块设计了额外的心理预警事件掩码来增强关键信息的占比,并利用注意力机制捕捉有助于判断用户心理预警等级的特征,融合用户心理特征与表现特征得到最终的心理状态表示向量。接下来按照子模块进行详细介绍。
3.1、编码模块
在此模块中将数据处理模块得到的用户心理状态映射序列和用户表现序列将被依次送入相同的文本编码器同时进行编码得到序列化的文本语义表征,即用户心理特征序列、用户表现特征序列。
具体的,本发明中用BERT编码器同时对序列化的文本信息进行编码。给定一组量表的用户心理状态映射序列,首先将其顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码。给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作。BERT对量表的用户心理状态映射序列里每一个陈述句依次编码便得到了一组序列化的用户心理特征序列向量。同理,用户表现序列随机打乱以后再经过Bert编码得到一组用户表现特征序列向量。其中 m是用户心理状态映射序列长度, n是用户序描述序列长度, d是向量维度。
值得注意的是因为对于这些序列化的描述内容来说,不同位置之间的描述内容是没有承接关系的,每一条内容都是关于心理状态的描述,所以打乱以后整体描述的内容仍然是不变的,这样的操作可以让模型在训练的时候增强泛化能力。
现有技术中,普通的模型训练的有相关披露将样本顺序的打乱,其操作方式如样本1,2,3,4,5随便打乱成样本3,2,5,4,1。但值得注意的是本申请这里的打乱并不指的是样本顺序的打乱,而是一个样本里面包含多个小的元素(陈述句),本申请这里的打乱是指把样本内部的排列的元素(陈述句)进行了打乱。本申请提出的打乱就是意旨让模型更容易关注到不同序列时刻的关键信息,增强模型的泛化能力,让模型预测效果更好。普通打乱样本顺序只是模型训练的一个常规手段,避免训练数据跟测试数据完全不一样导致预测效果不好。
特征融合模块
在此模块中,针对特殊事件更能反应用户心理状态的特点,设计了预警事件掩码强化关键信息,将经过编码模块得到的用户心理特征序列和用户表现特征序列通过交互注意力机制进行特征融合,最终得到用户的心理状态向量,该向量蕴含了反映用户性格特点、近期压力、抑郁倾向、日常表现的信息。
首先创建心理预警事件掩码,其构造过程如下所述:对于用户心理特征序列,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如(0,…,1,…,1,1,…,0)的掩码MASK1。对于用户表现特征序列,找出K2个与家庭关系、学习状态、同学矛盾最相关的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
其次,将编码模块得到的用户心理特征序列和用户表现特征序列分别进行平均池化得到用户的整体心理特征向量和用户整体的表现特征向量,通过加权平均的方式将序列各时刻的特征浅层融合用于表示该序列整体的信息,具体由公式(1)和公式(2)计算得到:
其中是 m量表特征序列的长度, n是用户特征序列的长度。而心理特征序列中的中涉及到情绪症状、品行问题、抑郁倾向等和心理状态有关的信息更能更好地反映用户当前的心里预警等级情况,因此通过注意力机制选择有助于判断心里预警等级的信息。首先将用户整体表现特征向量和用户心理特征序列各位置通过公式(3)计算得到对应的注意力权重。该权重表示用户整体表现特征和量表序列中各特征之间的关联程度。
同理,计算用户整体心理特征和用户表现特征序列中各个位置特征的注意力权重,如下所示:
将上述计算所得的注意力权重向量分别与心理预警事件掩码MASK1和MASK2结合(对应位置元素相加)得到新的注意力权重向量,融入预警事件掩码能够强化关键信息比重,具体公式如下:
     (5)
     (6)
将新的注意力权重和序列化特征加权平均便得到融合序列所有位置的上下文信息的语义表征。
将向量拼接得到向量,具体如下:
 (9)
上述公式表明,量表特征序列和用户特征序列会产生交互,融合各自的上下文信息,最终得到的向量对更好地表示用户的心里状态的信息有着重要作用。
分类模块
在该模块中,将特征融合模块输出的心理状态向量送入两层全连接层映射到固定的维度得到向量 x,再经过激活函数softmax得到概率分布 d
(10)
 (12)
上述公式中, xC维列向量。 W是参数矩阵,用于将向量 V映射成 C维列向量 x。符号 e x 代表取自然指数。 x i 的表示向量 x的第 i个位置, x j 表示向量 x的第 j个位置。 C代表预测的心理健康等级的类别数。表示C维向量空间。
在模型训练阶段,该参数矩阵 W按照标准正态分布初始化,使用Focal Loss 损失函数来训练心理健康等级预警模型,具体如下:
其中, w t 是每一个心理预警等级类别的权重,可以自行设置。
是概率分布第t个位置对应的心理健康等级预测概率,代表调节因子,调节因子越大,则模型学习时更专注于困难样本的分类。为指示函数,代表当且仅当类别与真实类别相同时取值为1,否则为0。采用ADAMW作为优化器,根据误差逆向传播策略更新参数,训练D轮便得到了完整的心理健康等级预警模型。
在模型预测阶段,将特征融合模块输出的心理状态向量送入训练好的参数矩阵 W映射到低维特征空间,经过softmax激活函数得到心理健康等级概率分布,选择概率最大的位置作为预测结果便得到心理健康预警等级。
最终,根据规则判断和模型预测联合判断心理健康预警等级,如果用户满足规则判断模块的条件则由规则判断决定最终的结果,反之则由模型预测的作为最终的输出结果。

Claims (10)

1.一种心理健康测评智能预警方法,其特征在于,包括以下步骤:
步骤1、收集心理测评量表数据,对心理测评量表中每一个问题的每一个作答选项定义量表模板;
步骤2、获取被测试者的心理测评量表数据,获取心理测评量表中每一个题的被测试者选出的作答选项,通过步骤1中的量表模板,生成对应作答选项的陈述句,最终得到的所有作答选项对应的陈述句并保存到列表中,得到用户心理状态映射序列;
步骤3、用户表现描述,将收集到的用户描述按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列;
步骤4、将步骤2得到的用户心理状态映射序列随机打乱后进行编码得到用户心理特征序列,将步骤3得到的用户表现序列随机打乱后进行编码得到用户表现特征序列,其中m是用户心理特征序列的长度,n是户表现特征序列的长度,d是向量维度,R是实数,表示实数向量空间;
步骤5、根据对于用户心理特征序列和用户表现特征序列创建心理预警事件掩码,得到心理预警事件掩码MASK1和MASK2;
步骤6、将用户心理特征序列和用户表现特征序列分别进行平均池化得到用户整体心理特征向量和用户整体表现特征向量
步骤7、计算用户整体表现特征向量和用户心理特征序列中各个位置特征对应的注意力权重,计算用户整体心理特征向量和用户表现特征序列中各个位置特征对应的注意力权重,每一个位置的注意力权重按顺序排列得到注意力权重向量a=(a 1,  …,  a m ),同理将按顺序排列得到注意力权重向量β=(β 1,  …, β m );
步骤8、将注意力权重向量aβ分别与心理预警事件掩码MASK1和MASK2结合,即对应位置元素相加得到新的注意力权重向量
步骤9、将用户心理特征序列按照新的注意力权重加权平均得到向量
将用户表现特征序列按照新的注意力权重加权平均得到向量,将向量拼接得到心理状态向量
步骤10、将心理状态向量送入分类模块进行心理健康预警等级预测,得到心理健康预警等级。
2.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,还包括规则判断模块,定义用户表现中存在K个对用户心理影响较大的极端事件,当大于等于K/2个极端事件出现时,心理健康预警等级判断为最高级,并输出结果,若极端事件出现的个数小于K/2个,由步骤10得到的心理健康预警等级作为输出结果。
3.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤1中定义量表模板,每个定义量表模板包括句子模板和短语模板构成,句子模板为包含若干个含有变量的句子,短语模板为句子模板中对应的变量的所有可能的值,通过句子模板和短语模板组合得到每一个作答选项对应的若干陈述句。
4.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤4具体包括以下步骤:
步骤4.1、将步骤2获得的用户心理状态映射序列,首先将其中的陈述句的顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码,给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作,BERT对打乱后的用户心理状态映射序列里每一个陈述句依次编码便得户心理特征序列向量
步骤4.2、用户表现序列随机打乱以后再经过Bert编码得到用户表现特征序列向量
5.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤5包括以下步骤:
步骤5.1、对于用户心理特征序列,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如(0,…,1,…,1,…,0)的掩码MASK1;
步骤5.2、对于用户表现特征序列,找出K2个与家庭关系、学习状态、同学矛盾最相关的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
6.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤6中用户的整体心理特征向量和用户整体的表现特征向量
其中是m量表特征序列的长度,n是用户特征序列的长度,i代表的是位置。
7.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤7中:
注意力权重
注意力权重
exp()代表指数函数,即exp(x)=e x ,tanh()是双曲正切函数;
tanh(x)=( e x  – e -x )/( e x  + e -x ) ,表示序列中第i个位置的用户表现特征向量的转置,表示序列中第i个位置的用户心理特征向量的转置,Wa和Wb是预定义的参数矩阵,b a 是偏置。
8.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤8中:
9.根据权利要求8所述的一种心理健康测评智能预警方法,其特征在于,步骤9中:
将向量拼接得到向量,具体如下:
10.一种存储介质,其特征在于,处理器执行存储介质中的程序时,实现如权利要求1-9任一所述的一种心理健康测评智能预警方法。
CN202211655242.5A 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质 Active CN115910345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211655242.5A CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211655242.5A CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Publications (2)

Publication Number Publication Date
CN115910345A true CN115910345A (zh) 2023-04-04
CN115910345B CN115910345B (zh) 2023-06-27

Family

ID=86472673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211655242.5A Active CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Country Status (1)

Country Link
CN (1) CN115910345B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117116489A (zh) * 2023-10-25 2023-11-24 光大宏远(天津)技术有限公司 一种心理测评数据管理方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
CN110391013A (zh) * 2019-07-17 2019-10-29 北京智能工场科技有限公司 一种基于语义向量构建神经网络预测心理健康的系统和装置
CN110570941A (zh) * 2019-07-17 2019-12-13 北京智能工场科技有限公司 一种基于文本语义向量模型评估心理状态的系统和装置
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN112687374A (zh) * 2021-01-12 2021-04-20 湖南师范大学 一种基于文本和图像信息联合计算的心理危机预警方法
WO2021082953A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 机器阅读理解方法、设备、存储介质及装置
CN112818106A (zh) * 2021-02-10 2021-05-18 北京工业大学 一种生成式问答的评价方法
WO2021164199A1 (zh) * 2020-02-20 2021-08-26 齐鲁工业大学 基于多粒度融合模型的中文句子语义智能匹配方法及装置
CN113571158A (zh) * 2021-07-29 2021-10-29 江苏智慧智能软件科技有限公司 一种智慧智能ai智能心理健康检测与分析测评系统
CN113672698A (zh) * 2021-08-01 2021-11-19 北京网聘咨询有限公司 一种基于表达分析的智能面试方法、系统、设备和存储介质
CN114121287A (zh) * 2022-01-24 2022-03-01 广东数业智能科技有限公司 一种学生心理健康检测方法、系统和可读存储介质
CN114190941A (zh) * 2021-12-14 2022-03-18 应急管理部上海消防研究所 消防救援人员心理健康测评系统
CN114283941A (zh) * 2021-12-23 2022-04-05 中国科学院心理研究所 一种基于自适应算法的多维度心理测试评估方法及系统
WO2022165617A1 (zh) * 2021-02-02 2022-08-11 同济大学 一种基于行为信息的大学生心理状态评估方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
CN110391013A (zh) * 2019-07-17 2019-10-29 北京智能工场科技有限公司 一种基于语义向量构建神经网络预测心理健康的系统和装置
CN110570941A (zh) * 2019-07-17 2019-12-13 北京智能工场科技有限公司 一种基于文本语义向量模型评估心理状态的系统和装置
WO2021082953A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 机器阅读理解方法、设备、存储介质及装置
WO2021164199A1 (zh) * 2020-02-20 2021-08-26 齐鲁工业大学 基于多粒度融合模型的中文句子语义智能匹配方法及装置
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN112687374A (zh) * 2021-01-12 2021-04-20 湖南师范大学 一种基于文本和图像信息联合计算的心理危机预警方法
WO2022165617A1 (zh) * 2021-02-02 2022-08-11 同济大学 一种基于行为信息的大学生心理状态评估方法
CN112818106A (zh) * 2021-02-10 2021-05-18 北京工业大学 一种生成式问答的评价方法
CN113571158A (zh) * 2021-07-29 2021-10-29 江苏智慧智能软件科技有限公司 一种智慧智能ai智能心理健康检测与分析测评系统
CN113672698A (zh) * 2021-08-01 2021-11-19 北京网聘咨询有限公司 一种基于表达分析的智能面试方法、系统、设备和存储介质
CN114190941A (zh) * 2021-12-14 2022-03-18 应急管理部上海消防研究所 消防救援人员心理健康测评系统
CN114283941A (zh) * 2021-12-23 2022-04-05 中国科学院心理研究所 一种基于自适应算法的多维度心理测试评估方法及系统
CN114121287A (zh) * 2022-01-24 2022-03-01 广东数业智能科技有限公司 一种学生心理健康检测方法、系统和可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
徐端倪: "基于多模态融合的心理测试仪自动评估系统检测研究", 自动化与仪器仪表 *
朱宗奎: "基于神经网络的中文知识图谱问答研究", 中国优秀硕士学位论文全文数据库信息科技辑 *
高喆: "铁路工程建设员工心理健康动态监测系统", 中国优秀硕士学位论文全文数据库信息科技辑 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117116489A (zh) * 2023-10-25 2023-11-24 光大宏远(天津)技术有限公司 一种心理测评数据管理方法及系统

Also Published As

Publication number Publication date
CN115910345B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
Kumar et al. Get it scored using autosas—an automated system for scoring short answers
CN111221939A (zh) 评分方法、装置和电子设备
CN113314100B (zh) 口语测试的评估、结果显示方法、装置、设备及存储介质
CN111368082A (zh) 一种基于层次网络的领域自适应词嵌入的情感分析方法
CN116029306A (zh) 一种限定域文科简答题自动评分方法
CN115910345B (zh) 一种心理健康测评智能预警方法及存储介质
Yordanova et al. Automatic detection of everyday social behaviours and environments from verbatim transcripts of daily conversations
Yiran Evaluation of students’ IELTS writing ability based on machine learning and neural network algorithm
CN110852071A (zh) 知识点检测方法、装置、设备及可读存储介质
Yang et al. Automated evaluation of the quality of ideas in compositions based on concept maps
CN117252259A (zh) 基于深度学习的自然语言理解方法及ai助教系统
Benedetto An assessment of recent techniques for question difficulty estimation from text
Firoozi Using Automated Procedures to Score Written Essays in Persian: An Application of the Multilingual BERT System
Marfani et al. Analysis of Learners’ Sentiments on MOOC Forums using Natural Language Processing Techniques
Kusumaningrum et al. Long Short-Term Memory for Non-Factoid Answer Selection in Indonesian Question Answering System for Health Information
Xia Text readability and summarisation for non-native reading comprehension
Fan et al. A cross-attention and Siamese network based model for off-topic detection
Ko Specific response generation and elaborative discourse structure
Mayahi et al. Assessing English Language Writing and Readability Skills using Long Short-Term Memory Model
Brooks Novice Language Adaption in Social Media Forums
Wojatzki Computer-assisted understanding of stance in social media: formalizations, data creation, and prediction models
Kim Let's Make an Artificial Learner to Analyze Learners' Language!
Chang et al. SmartWriting-Mandarin: An Automated Essay Scoring System for Chinese Foreign Language Learners
Li Supporting Stylized Language Models Using Multi-Modality Features
Patil et al. Literature Survey of Lexicon based method and Machine Learning methods of Sentiment Analysis of Student’s Feedback

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant