CN115910345B - 一种心理健康测评智能预警方法及存储介质 - Google Patents

一种心理健康测评智能预警方法及存储介质 Download PDF

Info

Publication number
CN115910345B
CN115910345B CN202211655242.5A CN202211655242A CN115910345B CN 115910345 B CN115910345 B CN 115910345B CN 202211655242 A CN202211655242 A CN 202211655242A CN 115910345 B CN115910345 B CN 115910345B
Authority
CN
China
Prior art keywords
user
psychological
sequence
vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211655242.5A
Other languages
English (en)
Other versions
CN115910345A (zh
Inventor
唐天驰
张汝民
刘昌松
张超意
黄明贵
黄倩影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Shuye Intelligent Technology Co ltd
Original Assignee
Guangdong Shuye Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Shuye Intelligent Technology Co ltd filed Critical Guangdong Shuye Intelligent Technology Co ltd
Priority to CN202211655242.5A priority Critical patent/CN115910345B/zh
Publication of CN115910345A publication Critical patent/CN115910345A/zh
Application granted granted Critical
Publication of CN115910345B publication Critical patent/CN115910345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明属于心理健康与自然语言处理技术领域,具体是涉及一种心理健康测评智能预警方法及存储介质。目的在于解决单一的量表测评选项没有完整语义信息导致无法直接用于建模的问题以及单一量表测评结果无法全面刻画用户心理状态的问题。主要方案包括获取心理测评量表中每一个题的作答选项,通过量表模板,生成对应作答选项的陈述句,得到用户心理状态映射序列,将用户心理状态映射序列和用户表现序列后随机打乱得到特征序列,对特征序列进行平均池化得到特征向量
Figure 617156DEST_PATH_IMAGE002
Figure 236357DEST_PATH_IMAGE004
,将向量
Figure 34548DEST_PATH_IMAGE002
Figure 764607DEST_PATH_IMAGE004
对应的权重向量
Figure 512114DEST_PATH_IMAGE006
Figure 567795DEST_PATH_IMAGE008
与心理预警事件掩码结合得到权重向量
Figure 604015DEST_PATH_IMAGE010
Figure 137765DEST_PATH_IMAGE012
Figure 192308DEST_PATH_IMAGE010
Figure 635535DEST_PATH_IMAGE012
与特征序列加权平均得到向量
Figure 673898DEST_PATH_IMAGE014
Figure 745759DEST_PATH_IMAGE016
Figure 654809DEST_PATH_IMAGE014
Figure 537446DEST_PATH_IMAGE016
拼接得到心理状态向量
Figure 531946DEST_PATH_IMAGE018
,然后向量
Figure 407499DEST_PATH_IMAGE018
送入分类模块进行预测。

Description

一种心理健康测评智能预警方法及存储介质
技术领域
本发明属于心理健康与自然语言处理技术领域,具体是涉及一种心理健康测评智能预警方法及存储介质。
背景技术
青少年的健康问题已经关乎国家发展,尤其是心理健康问题,如何在校园开展心理健康风管理,快速及时地筛查青少年的心理健康问题,避免心理危机及极端事件的发生。目前的心理健康校园管理主要通过量表测评的形式进行,但由于学生对量表理解的不到位、学生量表作答的隐瞒性以及量表自身阈值的准确性等导致量表测评结果的诸准确性和有效性受到质疑。
随着信息化技术与人工智能技术的发展与推广,出现了多个在线心理评测系统及AI心理等级预警的应用,具体如下:
专利CN 105956095 A《一种基于细粒度情感词典的心理预警模型构建方法》需要先构建中文情感词典,在此基础上剔除影响情感分析的词语、符号后再进行情感值归一化。接着,按照同义词林扩充情感词典,最后进行基于规则的情感向性分析。该方法是一种无监督方法,利用文本的统计特征进行建模,适用于大型无标记的语料数据。此外,并未引入专业的心理学测评量表,无法利用准确反映用户心理状态的信息,因此该方法仅适用于常规文本情感分析。
专利CN 113990522 A《基于多模态数据学生心理危机预警系统》通过采集学生日常表达烦恼的文本数据、教师与家长登记的信息结合学生人脸图像数据进行心理健康等级判定。该系统的预测模型会对应激事件列表、心理危机词库、心理测评因子得分极值进行判定,汇总数据然后生成预警报表来判断学生的心理状态,该利用得分极值进行判定的方式泛化能力不强,没有针对学生测评的内容进行具体分析,因此该方法无法精确预测学生的心理预警等级。
专利CN 113571158 A《一种智慧智能AI智能心理健康检测与分析测评系统》通过特定人群在线填写基本情况量表生产用户画像,然后从心理健康检查的知识题库中查询出与用户画像匹配的专用测试问题以及通用测试问题给用户填写,接着统计答题分数并将其作为神经网络的输入进行建模。该方法虽然快捷方便,但是忽略了用户对量表不理解从而填写不准确导致量表信息不能完全反映用户心理健康的情况。如果能引入用户的外部信息辅助量表联合建模进行心理等级预警则会更具针对性。
专利CN 114388103 A《一种针对青少年心理预警分析的算法》主要通过利用用户的心理测试调查问卷的得分进行建模,并未利用到其他方面的信息。
目前在解决青少年心理健康预测准确问题上多数采用填写测评问卷、测试题的方式预测学生的心理状态,或者是借助辅助设备如摄像头等采集面部信息作为辅助数据提高预测的准确率,但并未发现在针对量表测评结果和用户信息来对测评结果做智能分析的方法。
现有量表测试的答案选项内容均为短语,由于单一的选项缺乏上下文因此不能明确地表明完整语义信息,无法直接用于建模。而量表的问题和选项结合在一起蕴含了用户的心理信息。此外,量表测评结果存在对用户心理状态的反映不全面的缺陷,需要引入外部用户信息作为辅助才能更为全面地刻画用户心理状态。因此,如何根据量表问答生成一段有完整语义的陈述句和如用于是亟需解决的问题。
发明内容
本发明的目的在于解决单一的量表测评选项没有完整语义信息导致无法直接用于建模的问题以及单一量表测评结果无法全面刻画用户心理状态的问题。
为了实现上述目的本发明采用以下技术手段:
本发明提供了一种心理健康测评智能预警方法,包括以下步骤:
步骤1、收集心理测评量表数据,对心理测评量表中每一个问题的每一个作答选项定义量表模板;
步骤2、获取被测试者的心理测评量表数据,获取心理测评量表中每一个题的作答选项,通过步骤1中的量表模板,生成对应作答选项的陈述句,最终得到的所有作答选项对应的陈述句保存到列表中,得到用户心理状态映射序列;
步骤3、用户表现描述,将收集到的用户描述按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列;
步骤4、将步骤2得到的用户心理状态映射序列随机打乱后进行编码得到用户心理特征序列
Figure 967186DEST_PATH_IMAGE001
,将步骤3得到的用户表现序列随机打乱后进行编码得到用户表现特征序列/>
Figure 500935DEST_PATH_IMAGE002
,其中m是用户心理特征序列的长度,n是户表现特征序列的长度,d是向量维度,R是实数,/>
Figure 368528DEST_PATH_IMAGE003
表示实数向量空间;
步骤5、根据对于用户心理特征序列和用户表现特征序列创建心理预警事件掩码,得到心理预警事件掩码MASK1和MASK2;
步骤6、将用户心理特征序列
Figure 267214DEST_PATH_IMAGE001
和用户表现特征序列
Figure 836736DEST_PATH_IMAGE002
分别进行平均池化得到用户整体心理特征向量/>
Figure 846280DEST_PATH_IMAGE004
和用户整体表现特征向量/>
Figure 833959DEST_PATH_IMAGE005
步骤7、计算用户整体表现特征向量
Figure 637967DEST_PATH_IMAGE005
和用户心理特征序列中各个位置特征对应的注意力权重/>
Figure 960364DEST_PATH_IMAGE006
,计算用户整体心理特征向量/>
Figure 508020DEST_PATH_IMAGE004
和用户表现特征序列中各个位置特征对应的注意力权重/>
Figure 350205DEST_PATH_IMAGE007
,每一个位置的注意力权重/>
Figure 325114DEST_PATH_IMAGE006
按顺序排列得到注意力权重向量a=(a 1, …, a m ),同理将/>
Figure 134807DEST_PATH_IMAGE007
按顺序排列得到注意力权重向量β=(β 1, …, β m );
步骤8、将注意力权重向量aβ分别与心理预警事件掩码MASK1和MASK2结合,即对应位置元素相加得到新的注意力权重向量
Figure 486154DEST_PATH_IMAGE008
和/>
Figure 179916DEST_PATH_IMAGE009
步骤9、将用户心理特征序列
Figure 591306DEST_PATH_IMAGE001
按照新的注意力权重/>
Figure 622716DEST_PATH_IMAGE008
加权平均得到向量/>
Figure 512174DEST_PATH_IMAGE010
将用户表现特征序列
Figure 250323DEST_PATH_IMAGE002
按照新的注意力权重/>
Figure 442401DEST_PATH_IMAGE009
加权平均得到向量/>
Figure 774157DEST_PATH_IMAGE011
,将向量/>
Figure 342672DEST_PATH_IMAGE010
和/>
Figure 873011DEST_PATH_IMAGE011
拼接得到心理状态向量/>
Figure 750837DEST_PATH_IMAGE012
步骤10、将心理状态向量
Figure 632205DEST_PATH_IMAGE012
送入分类模块进行心理健康预警等级预测,得到心理健康预警等级。
在上述技术方案的基础上,还包括规则判断模块,定义用户表现中存在K个对用户心理影响较大的极端事件,当大于等于K/2个极端事件出现时,心理健康预警等级判断为最高级,并输出结果,若极端事件出现的个数小于K/2个,由步骤10得到的心理健康预警等级作为输出结果。
在上述技术方案的基础上,步骤1中定义量表模板,每个定义量表模板包括句子模板和短语模板构成,句子模板为包含若干个含有变量的句子,短语模板为句子模板中对应的变量的所有可能的值,通过句子模板和短语模板组合得到每一个作答选项对应的若干陈述句,所述陈述句表达的语义与问题与作答选项组合在一起的语义相近。
在上述技术方案的基础上,步骤4具体包括以下步骤:
步骤4.1、将步骤2获得的用户心理状态映射序列,首先将其中的陈述句的顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码,给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作
Figure 13201DEST_PATH_IMAGE013
,BERT对打乱后的用户心理状态映射序列里每一个陈述句依次编码便得户心理特征序列向量/>
Figure 663625DEST_PATH_IMAGE014
步骤4.2、用户表现序列随机打乱以后再经过Bert编码得到用户表现特征序列向量
Figure 712353DEST_PATH_IMAGE002
在上述技术方案的基础上,步骤5包括以下步骤:
步骤5.1、对于用户心理特征序列
Figure 81017DEST_PATH_IMAGE014
,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如(0,…,1,…,1,…,0)的掩码MASK1;
步骤5.2、对于用户表现特征序列
Figure 991335DEST_PATH_IMAGE015
,找出K2个与家庭关系、学习状态、同学矛盾最相关的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
在上述技术方案的基础上,步骤6中用户的整体心理特征向量
Figure 496266DEST_PATH_IMAGE016
和用户整体的表现特征向量/>
Figure 715895DEST_PATH_IMAGE017
Figure 571855DEST_PATH_IMAGE019
Figure 20285DEST_PATH_IMAGE021
其中是m量表特征序列的长度,n是用户特征序列的长度,i代表的是位置。
在上述技术方案的基础上,步骤7中:
注意力权重
Figure 238777DEST_PATH_IMAGE006
Figure 848881DEST_PATH_IMAGE023
注意力权重
Figure 254455DEST_PATH_IMAGE007
Figure 896789DEST_PATH_IMAGE025
exp()代表指数函数,即exp(x)=e x ,tanh()是双曲正切函数;
tanh(x)=( e x – e -x )/( e x + e -x ) ,
Figure 248748DEST_PATH_IMAGE026
表示序列中第i个位置的用户表现特征向量的转置,/>
Figure 685546DEST_PATH_IMAGE027
表示序列中第i个位置的用户心理特征向量的转置,Wa和Wb是预定义的参数矩阵,b a 是偏置。
在上述技术方案的基础上,步骤8中:
Figure DEST_PATH_IMAGE029AA
Figure 109574DEST_PATH_IMAGE030
在上述技术方案的基础上,步骤9中:
Figure 899806DEST_PATH_IMAGE032
Figure 499415DEST_PATH_IMAGE034
将向量
Figure 966168DEST_PATH_IMAGE035
和/>
Figure 18438DEST_PATH_IMAGE036
拼接得到向量/>
Figure 612361DEST_PATH_IMAGE037
,具体如下:
Figure 66477DEST_PATH_IMAGE039
本发明还提供了一种存储介质,处理器执行存储介质中的程序时,实现一种心理健康测评智能预警方法。
因为本发明采用上述技术手段,因此具备以下有益效果:
1、为解决无法直接利用量表选项信息用于建模的技术问题。本发明采用基于模板的自然语言生成技术,为保证生成语料的连贯性和准确性,由心理学专家和语言学专家共同设计出专业的模板提供使用,为量表测评结果生成大量的能直接反映用户性格特定、抑郁倾向、自我伤害倾向的陈述句。
2、采用了交互注意力机制让模型自动捕捉到序列中哪些位置的特征更能反映用户的心理状态。设计掩码机制增强序列中关键位置的特征权重让其信息占据主导地位,让模型预测的结果更可靠。
3、序列顺序打乱策略这里的打乱并不指的是样本顺序的打乱,而是一个样本里面包含多个小的元素(陈述句),打乱是指把样本内部的排列的元素(陈述句)进行了打乱。打乱就是意旨让模型训练时更容易关注到序列不同位置的关键信息,增强模型的泛化能力,让模型预测效果更好。普通打乱样本顺序只是模型训练的一个常规手段,避免训练数据跟测试数据完全不一样导致预测效果不好。
4、基于极端事件会对用户心理状态产生较大影响并能一定程度反映心理状态的共识。本发明设计了规则判断机制,判断极端事件出现的个数,若当前用户触发的极端事件个数过多则表明当前用户的心理状态一定值得关注,会被判定为最高的等级。通过规则判断联合模型预测使得最终结果更准确。
附图说明
图1为方法系统框图;
图2为数据处理模块框图;
图3为特征提取模块框图;
图4为编码模块框图;
图5为特征融合模块框图;
图6为分类模块框图。
具体实施方式
以下将对本发明的实施例给出详细的说明。尽管本发明将结合一些具体实施方式进行阐述和说明,但需要注意的是本发明并不仅仅只局限于这些实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员将理解,没有这些具体细节,本发明同样可以实施。
本发明采用了基于模板的自然语言生成技术,依据量表问题和选项生成相映的陈述语句。为保证生成语料的连贯性和准确性,由心理学专家和语言学专家共同设计出专业的量表模板,量表测评选项根据模板能生成内容丰富的候选陈述句,这些陈述句不仅能精准反应用户性格特点、抑郁倾向并具备完整的语义。
引入能够反应用户日常精神状况,日常上课表现、人际关系的用户信息联合量表测评结果建模。采用了交互注意力机制和预警事件掩码增强机制让模型自动聚焦到与对心理状态相关度最高的特征。
为了让模型训练时更容易捕捉到序列不同位置的重要特征,采用了序列顺序打乱策略增强模型泛化能力。
鉴于极端事件的发生会对用户心理状态产生较大影响的特点,设计了基于规则的判断机制,当极端事件发生个数较多时规则判断机制将用户心理预警等级判定为最高级别。
本发明整体框架如图1所示,分别包括数据处理模块、规则判断模块、特征提取模块,分类模块。接下来按照模块进行详细介绍:
1、数据处理模块:
在此模块中,心理测评量表与用户状态表现数据作为模块输入,通过量表模板库与关键内容转化,获得用户心理状态映射序列和用户表现序列。
心理测评量表就是指如抑郁筛查量表PHQ-9,中学生心理健康诊断测评MHT等心理健康测评量表。心理测评量表由定期开展心理测评活动的方式收集,在该阶段对不同群体的学生进行针对性的量表测评,学生通过填写特定的量表得到当前的性格特点、自我伤害倾向、抑郁倾向等相关信息。而用户表现描述,指学生的日常精神状况,日常上课表现以及日常和同学关系、家庭关系等。
量表模板是为了将量表问答自然地转化为能够反映用户性格特点、心理状态的陈述句而设计的。由句子模板和短语模板构成,句子模板包含若干个含有变量的句子,短语模板则是句子模板中变量对应的所有可能的值,模板的设计需要考虑到语句的连贯性、丰富性与准确性,因此由专业的语言学家和心理学家讨论后设计出相关的模板,针对不同的测评量表定义了不同的句子和模板与之对应。以抑郁筛查量表PHQ-9为例:
问题为:“做什么事情都没有兴趣,没意思”对应的答案选项为“没有或者很少时间”,原来选项和问题在一起是“没有或者很少时间做什么事情都没有兴趣,没意思”。则这个问答对生成对应的陈述句为如“做事时【很有动力】,对所作的事情【感兴趣】”,“对所作的事情一直【很有兴趣,觉得很有意思】”,“【不会】感到做什么事情都【没兴趣,没意思】”等等。其中“【】”代表的是句子模板中的变量槽,将短语模板填入便生成了一个完整的句子。若当前用户填写了D个量表,每一个量表有M d 个问答,每一个问题包含N d 个选项,每一个选项提供K d 个句子模板,每个句子模板含有一个Z K 个短语变量槽,每一个短语变量槽有L Z 个候选的短语模板,则该模板会为用户生成
Figure 641814DEST_PATH_IMAGE041
个可能的候选陈述句。假设用户填写了三个量表,每一个量表有十五个问题,每一个问题有四个选项,每个选项有四个句子模板,每个句子模板有两个变量槽,每个变量槽有十个对应的短语模板,则量表模板总共会为该用户生成七万两千个可能的候选陈述句,这种方式可以丰富文本内容的多样性。
量表的问答蕴含了用户的心理信息,由于是选项的形式无法直接利用,因此在关键内容转化模块采用上述基于量表模板的自然语言生成技术将这些问答生成为描述用户心理的陈述句用于建模(建模在这里是指对要输入模型的数据做前期处理)。对每一个量表d而言,先从当前问答选项对应的K d 个句子模板中随机选取一个,然后再从当前句子模板的Z K 个变量槽中为每一个变量槽从L Z 个候选变量随机选取一个填入生成了一个完整的陈述句,最后将每一个问答的生成结果用列表保存,便得到用户心理状态映射序列。对于用户表现描述,将一段收集到的用户日常表现及行为的文本按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列。例如,“在日常生活中和家人相处愉悦,享受在一起的时光。经常受到老师的夸赞,在班级中也受欢迎。做事情专注,热爱学习。”按照句号分割并依次保存便得到如下列表:[“在日常生活中和家人相处愉悦,享受在一起的时光。”,“经常受到老师的夸赞,在班级中也受欢迎。”,“做事情专注,热爱学习。”]。
2、规则判断模块
在此模块中需要对用户元数据分析用户的学习情况和判断极端情况的出现,因为对于学生群体而言学习成绩和作业完成情况直接表明学生学习能力,如果成绩或者作业完成质量严重不达标说明该学生十分可能厌学,心理状态是急需关注的。
用户元数据指一个学年内收集的用户的考试成绩与作业评分数据。对于学生成绩和作业数据的具体分析过程如下。
首先利用已收集的学生群体一个学年内的数据计算总体参数,具体地,假设某学生j以往的考试总分为
Figure 306014DEST_PATH_IMAGE042
(M是考试次数),则其考试成绩总均分为:
Figure 562683DEST_PATH_IMAGE044
如果有N个学生,那么所有学生考试成绩总均分的均值u为:
Figure 746671DEST_PATH_IMAGE046
所有学生的考试成绩总均分的方差
Figure 492910DEST_PATH_IMAGE047
为:
Figure 254192DEST_PATH_IMAGE049
根据此均值方差建立一元高斯分布,此分布概率密度函数为:
Figure 704765DEST_PATH_IMAGE050
在进行判断时,给定当前用户的考试成绩总均分x,如果x小于
Figure 602314DEST_PATH_IMAGE051
即小于均值减去三倍的标准差则认为当前用户的分数远低于平均水平,是异常值。同理,根据作业评分也能建立一组参数不同的一元高斯分布用于判断用户长期的作业完成质量是否达标。
除了成绩和作业完成质量,用户表现如家庭关系如果出现破裂、与同学经常发生肢体冲突等事件的发生也会表面该用户的心理状态是需要重视的,这类极端情况出现得越多越能表面该用户的心理状态越值得关注。对此,具体判断规则是,假设用户表现中存在K个对用户心理影响较大的极端事件,当大于等于K/2个极端情况出现时,该用户的心理预警等级会被判断为最高级,若极端情况出现的个数小于K/2个,则由模型决定最终的心理预警等级。
3.特征提取模块:
整体如图2所示,编码模块会利用在数据处理阶段得到的序列化文本信息(用户心理状态映射序列、用户表现序列),将文本映射到深层的分布式特征空间,得到序列化的文本语义特征(用户心理特征序列、用户表现特征序列),这些序列化的文本特征是用户心理状态以及用户表现信息的抽象表征。特征融合模块设计了额外的心理预警事件掩码来增强关键信息的占比,并利用注意力机制捕捉有助于判断用户心理预警等级的特征,融合用户心理特征与表现特征得到最终的心理状态表示向量。接下来按照子模块进行详细介绍。
3.1、编码模块
在此模块中将数据处理模块得到的用户心理状态映射序列和用户表现序列将被依次送入相同的文本编码器同时进行编码得到序列化的文本语义表征,即用户心理特征序列、用户表现特征序列。
具体的,本发明中用BERT编码器同时对序列化的文本信息进行编码。给定一组量表的用户心理状态映射序列,首先将其顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码。给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作
Figure 519455DEST_PATH_IMAGE052
。BERT对量表的用户心理状态映射序列里每一个陈述句依次编码便得到了一组序列化的用户心理特征序列向量/>
Figure 906049DEST_PATH_IMAGE053
。同理,用户表现序列随机打乱以后再经过Bert编码得到一组用户表现特征序列向量/>
Figure 770100DEST_PATH_IMAGE054
。其中m是用户心理状态映射序列长度,n是用户序描述序列长度,d是向量维度。
值得注意的是因为对于这些序列化的描述内容来说,不同位置之间的描述内容是没有承接关系的,每一条内容都是关于心理状态的描述,所以打乱以后整体描述的内容仍然是不变的,这样的操作可以让模型在训练的时候增强泛化能力。
现有技术中,普通的模型训练的有相关披露将样本顺序的打乱,其操作方式如样本1,2,3,4,5随便打乱成样本3,2,5,4,1。但值得注意的是本申请这里的打乱并不指的是样本顺序的打乱,而是一个样本里面包含多个小的元素(陈述句),本申请这里的打乱是指把样本内部的排列的元素(陈述句)进行了打乱。本申请提出的打乱就是意旨让模型更容易关注到不同序列时刻的关键信息,增强模型的泛化能力,让模型预测效果更好。普通打乱样本顺序只是模型训练的一个常规手段,避免训练数据跟测试数据完全不一样导致预测效果不好。
特征融合模块
在此模块中,针对特殊事件更能反应用户心理状态的特点,设计了预警事件掩码强化关键信息,将经过编码模块得到的用户心理特征序列和用户表现特征序列通过交互注意力机制进行特征融合,最终得到用户的心理状态向量,该向量蕴含了反映用户性格特点、近期压力、抑郁倾向、日常表现的信息。
首先创建心理预警事件掩码,其构造过程如下所述:对于用户心理特征序列,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如(0,…,1,…,1,1,…,0)的掩码MASK1。对于用户表现特征序列,找出K2个与家庭关系、学习状态、同学矛盾最相关的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
其次,将编码模块得到的用户心理特征序列和用户表现特征序列分别进行平均池化得到用户的整体心理特征向量
Figure 115631DEST_PATH_IMAGE055
和用户整体的表现特征向量/>
Figure 547880DEST_PATH_IMAGE056
,通过加权平均的方式将序列各时刻的特征浅层融合用于表示该序列整体的信息,具体由公式(1)和公式(2)计算得到:
Figure 283755DEST_PATH_IMAGE058
Figure 482655DEST_PATH_IMAGE060
其中是m量表特征序列的长度,n是用户特征序列的长度。而心理特征序列中的中涉及到情绪症状、品行问题、抑郁倾向等和心理状态有关的信息更能更好地反映用户当前的心里预警等级情况,因此通过注意力机制选择有助于判断心里预警等级的信息。首先将用户整体表现特征向量
Figure 745009DEST_PATH_IMAGE061
和用户心理特征序列各位置通过公式(3)计算得到对应的注意力权重。该权重表示用户整体表现特征和量表序列中各特征之间的关联程度。
Figure 472794DEST_PATH_IMAGE063
同理,计算用户整体心理特征
Figure 40172DEST_PATH_IMAGE055
和用户表现特征序列中各个位置特征的注意力权重/>
Figure 511605DEST_PATH_IMAGE007
,如下所示:
Figure 628466DEST_PATH_IMAGE065
将上述计算所得的
Figure 261572DEST_PATH_IMAGE066
和/>
Figure 768777DEST_PATH_IMAGE067
注意力权重向量分别与心理预警事件掩码MASK1和MASK2结合(对应位置元素相加)得到新的注意力权重向量/>
Figure 653687DEST_PATH_IMAGE068
和/>
Figure 234842DEST_PATH_IMAGE069
,融入预警事件掩码能够强化关键信息比重,具体公式如下:
Figure 429062DEST_PATH_IMAGE070
(5)
Figure 361246DEST_PATH_IMAGE071
(6)
将新的注意力权重和序列化特征加权平均便得到融合序列所有位置的上下文信息的语义表征。
Figure 971219DEST_PATH_IMAGE073
Figure 810475DEST_PATH_IMAGE075
将向量
Figure 519805DEST_PATH_IMAGE076
和/>
Figure 329498DEST_PATH_IMAGE077
拼接得到向量/>
Figure 477582DEST_PATH_IMAGE078
,具体如下:
Figure 298908DEST_PATH_IMAGE079
(9)
上述公式表明,量表特征序列和用户特征序列会产生交互,融合各自的上下文信息,最终得到的向量对更好地表示用户的心里状态的信息有着重要作用。
分类模块
在该模块中,将特征融合模块输出的心理状态向量
Figure 54505DEST_PATH_IMAGE078
送入两层全连接层
Figure 961282DEST_PATH_IMAGE080
映射到固定的维度得到向量x,再经过激活函数softmax得到概率分布d
Figure 913057DEST_PATH_IMAGE081
(10)
Figure 713523DEST_PATH_IMAGE083
Figure 30235DEST_PATH_IMAGE084
(12)
上述公式中,xC维列向量。W是参数矩阵,用于将向量V映射成C维列向量x。符号e x 代表取自然指数。x i 的表示向量x的第i个位置,x j 表示向量x的第j个位置。C代表预测的心理健康等级的类别数。
Figure 221045DEST_PATH_IMAGE085
表示C维向量空间。
在模型训练阶段,该参数矩阵W按照标准正态分布初始化,使用Focal Loss 损失函数来训练心理健康等级预警模型,具体如下:
Figure 789560DEST_PATH_IMAGE087
其中,w t 是每一个心理预警等级类别的权重,可以自行设置。
Figure 319899DEST_PATH_IMAGE088
是概率分布/>
Figure 197725DEST_PATH_IMAGE084
第t个位置对应的心理健康等级预测概率,/>
Figure 610252DEST_PATH_IMAGE089
代表调节因子,调节因子越大,则模型学习时更专注于困难样本的分类。/>
Figure 841513DEST_PATH_IMAGE090
为指示函数,代表当且仅当类别与真实类别相同时取值为1,否则为0。采用ADAMW作为优化器,根据误差逆向传播策略更新参数,训练D轮便得到了完整的心理健康等级预警模型。
在模型预测阶段,将特征融合模块输出的心理状态向量送入训练好的参数矩阵W映射到低维特征空间,经过softmax激活函数得到心理健康等级概率分布,选择概率最大的位置作为预测结果便得到心理健康预警等级。
最终,根据规则判断和模型预测联合判断心理健康预警等级,如果用户满足规则判断模块的条件则由规则判断决定最终的结果,反之则由模型预测的作为最终的输出结果。

Claims (7)

1.一种心理健康测评智能预警方法,其特征在于,包括以下步骤:
步骤1、收集心理测评量表数据,对心理测评量表中每一个问题的每一个作答选项定义量表模板,评量表数据包括性格特点,定义量表模板,每个定义量表模板包括句子模板和短语模板构成,句子模板为包含若干个含有变量的句子,短语模板为句子模板中对应的变量的所有可能的值,通过句子模板和短语模板组合得到每一个作答选项对应的若干陈述句;
步骤2、获取被测试者的心理测评量表数据,获取心理测评量表中每一个题的被测试者选出的作答选项,通过步骤1中的量表模板,生成对应作答选项的陈述句,最终得到的所有作答选项对应的陈述句并保存到列表中,得到用户心理状态映射序列;
步骤3、用户表现描述,将收集到的用户表现描述按照句号分割后按顺序排列并保存到一个列表中得到用户表现序列,用户表现描述包括日常精神状况、家庭关系;
步骤4、将步骤2得到的用户心理状态映射序列随机打乱后进行编码得到用户心理特征序列
Figure QLYQS_3
,将步骤3得到的用户表现序列随机打乱后进行编码得到用户表现特征序列/>
Figure QLYQS_5
,其中/>
Figure QLYQS_7
是用户心理特征序列的长度,/>
Figure QLYQS_2
是户表现特征序列的长度,/>
Figure QLYQS_4
是向量维度,R是实数,/>
Figure QLYQS_6
池化得到用户整体心理特征向量/>
Figure QLYQS_8
和用户整体表现特征向量/>
Figure QLYQS_1
步骤7、计算用户整体表现特征向量
Figure QLYQS_10
和用户心理特征序列中各个位置特征对应的注意力权重/>
Figure QLYQS_12
,计算用户整体心理特征向量/>
Figure QLYQS_14
和用户表现特征序列中各个位置特征对应的注意力权重/>
Figure QLYQS_11
,每一个位置的注意力权重/>
Figure QLYQS_13
按顺序排列得到注意力权重向量
Figure QLYQS_15
,同理将/>
Figure QLYQS_16
按顺序排列得到注意力权重向量/>
Figure QLYQS_9
步骤8、将上述计算所得的注意力权重向量
Figure QLYQS_17
和/>
Figure QLYQS_18
分别与心理预警事件掩码MASK1和MASK2结合,即对应位置元素相加得到新的注意力权重向量/>
Figure QLYQS_19
和/>
Figure QLYQS_20
步骤9、将用户心理特征序列
Figure QLYQS_21
按照新的注意力权重/>
Figure QLYQS_22
加权平均得到向量/>
Figure QLYQS_23
将用户表现特征序列
Figure QLYQS_24
按照新的注意力权重/>
Figure QLYQS_25
加权平均得到向量
Figure QLYQS_26
,将向量/>
Figure QLYQS_27
和/>
Figure QLYQS_28
拼接得到心理状态向量/>
Figure QLYQS_29
步骤10、将心理状态向量
Figure QLYQS_30
送入分类模块进行心理健康预警等级预测,得到心理健康预警等级;
步骤4具体包括以下步骤:
步骤4.1、将步骤2获得的用户心理状态映射序列,首先将其中的陈述句的顺序随机打乱,再把打乱顺序后的序列中每一个位置的陈述句按现有顺序送入Bert编码,给定一个陈述句S由L个字符构成,BERT会在陈述句S的首端与末尾分别添加特殊字符“CLS”与“SEP”再进行编码然后输出一组长度为L+2的序列化向量,只取“CLS”位置对应的向量即序列化向量的首位置作为整句话的语义表征,并将其记作
Figure QLYQS_31
,BERT对打乱后的用户心理状态映射序列里每一个陈述句依次编码便得户心理特征序列向量/>
Figure QLYQS_32
步骤4.2、用户表现序列随机打乱以后再经过Bert编码得到用户表现特征序列向量
Figure QLYQS_33
;步骤7中:
注意力权重
Figure QLYQS_34
Figure QLYQS_35
注意力权重
Figure QLYQS_36
Figure QLYQS_37
上述公式中,exp()代表指数函数,即exp(x)=
Figure QLYQS_38
,tanh()是双曲正切函数,tanh(x)=
Figure QLYQS_39
,/>
Figure QLYQS_40
表示序列中第i个位置的用户表现特征向量的转置,/>
Figure QLYQS_41
表示序列中第i个位置的用户心理特征向量的转置,/>
Figure QLYQS_42
和/>
Figure QLYQS_43
是预定义的参数矩阵,/>
Figure QLYQS_44
是偏置;
步骤9中:
Figure QLYQS_45
Figure QLYQS_46
将向量
Figure QLYQS_47
和/>
Figure QLYQS_48
拼接得到向量/>
Figure QLYQS_49
,具体如下:
Figure QLYQS_50
2.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,还包括规则判断模块,定义用户表现中存在K个对用户心理影响的极端事件,当大于等于K/2个极端事件出现时,心理健康预警等级判断为最高级,并输出结果,若极端事件出现的个数小于K/2个,由步骤10得到的心理健康预警等级作为输出结果。
3.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤1中定义量表模板,每个定义量表模板包括句子模板和短语模板构成,句子模板为包含若干个含有变量的句子,短语模板为句子模板中对应的变量的所有可能的值,通过句子模板和短语模板组合得到每一个作答选项对应的若干陈述句。
4.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤5包括以下步骤:
步骤5.1、对于用户心理特征序列
Figure QLYQS_51
,找出其中K1个与心理抑郁倾向、焦虑倾向、冲动最相关的问题对应的位置,创建一个全为0的一维数组并将对应的位置数字置为1,得到一组形如/>
Figure QLYQS_52
的掩码MASK1;
步骤5.2、对于用户表现特征序列
Figure QLYQS_53
,找出K2个与家庭关系、学习状态、同学矛盾最相关的的描述对应的位置,创建一个全为0的一维数组并将对应位置数字置为1,得到另一组掩码MASK2。
5.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤6中用户的整体心理特征向量
Figure QLYQS_54
和用户整体的表现特征向量/>
Figure QLYQS_55
Figure QLYQS_56
Figure QLYQS_57
其中是
Figure QLYQS_58
量表特征序列的长度,/>
Figure QLYQS_59
是用户特征序列的长度,i代表的是位置。
6.根据权利要求1所述的一种心理健康测评智能预警方法,其特征在于,步骤8中:
Figure QLYQS_60
Figure QLYQS_61
7.一种存储介质,其特征在于,处理器执行存储介质中的程序时,实现如权利要求1-6任一所述的一种心理健康测评智能预警方法。
CN202211655242.5A 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质 Active CN115910345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211655242.5A CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211655242.5A CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Publications (2)

Publication Number Publication Date
CN115910345A CN115910345A (zh) 2023-04-04
CN115910345B true CN115910345B (zh) 2023-06-27

Family

ID=86472673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211655242.5A Active CN115910345B (zh) 2022-12-22 2022-12-22 一种心理健康测评智能预警方法及存储介质

Country Status (1)

Country Link
CN (1) CN115910345B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117116489A (zh) * 2023-10-25 2023-11-24 光大宏远(天津)技术有限公司 一种心理测评数据管理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
CN112818106A (zh) * 2021-02-10 2021-05-18 北京工业大学 一种生成式问答的评价方法
CN113571158A (zh) * 2021-07-29 2021-10-29 江苏智慧智能软件科技有限公司 一种智慧智能ai智能心理健康检测与分析测评系统
CN114190941A (zh) * 2021-12-14 2022-03-18 应急管理部上海消防研究所 消防救援人员心理健康测评系统
CN114283941A (zh) * 2021-12-23 2022-04-05 中国科学院心理研究所 一种基于自适应算法的多维度心理测试评估方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570941B (zh) * 2019-07-17 2020-08-14 北京智能工场科技有限公司 一种基于文本语义向量模型评估心理状态的系统和装置
CN110391013B (zh) * 2019-07-17 2020-08-14 北京智能工场科技有限公司 一种基于语义向量构建神经网络预测心理健康的系统和装置
CN111027327B (zh) * 2019-10-29 2022-09-06 平安科技(深圳)有限公司 机器阅读理解方法、设备、存储介质及装置
CN111310438B (zh) * 2020-02-20 2021-06-08 齐鲁工业大学 基于多粒度融合模型的中文句子语义智能匹配方法及装置
CN111488734B (zh) * 2020-04-14 2022-02-22 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN112687374B (zh) * 2021-01-12 2023-09-15 湖南师范大学 一种基于文本和图像信息联合计算的心理危机预警方法
WO2022165617A1 (zh) * 2021-02-02 2022-08-11 同济大学 一种基于行为信息的大学生心理状态评估方法
CN113672698B (zh) * 2021-08-01 2024-05-24 北京网聘信息技术有限公司 一种基于表达分析的智能面试方法、系统、设备和存储介质
CN114121287B (zh) * 2022-01-24 2023-01-24 广东数业智能科技有限公司 一种学生心理健康检测方法、系统和可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
CN112818106A (zh) * 2021-02-10 2021-05-18 北京工业大学 一种生成式问答的评价方法
CN113571158A (zh) * 2021-07-29 2021-10-29 江苏智慧智能软件科技有限公司 一种智慧智能ai智能心理健康检测与分析测评系统
CN114190941A (zh) * 2021-12-14 2022-03-18 应急管理部上海消防研究所 消防救援人员心理健康测评系统
CN114283941A (zh) * 2021-12-23 2022-04-05 中国科学院心理研究所 一种基于自适应算法的多维度心理测试评估方法及系统

Also Published As

Publication number Publication date
CN115910345A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
Kumar et al. Get it scored using autosas—an automated system for scoring short answers
CN110148318B (zh) 一种数字助教系统、信息交互方法和信息处理方法
Schmitt et al. An introduction to applied linguistics
CN106503055A (zh) 一种从结构化文本到图像描述的生成方法
Vecchi et al. Spicy adjectives and nominal donkeys: Capturing semantic deviance using compositionality in distributional spaces
CN115910345B (zh) 一种心理健康测评智能预警方法及存储介质
Barron-Estrada et al. Emotion Recognition for Education using Sentiment Analysis.
Yordanova et al. Automatic detection of everyday social behaviours and environments from verbatim transcripts of daily conversations
Juven et al. Cross-situational learning with reservoir computing for language acquisition modelling
Dehbozorgi et al. Affective Computing: A Topic-Based SER Approach on Collaborative Discussions in Academic Setting
Yang et al. Automated evaluation of the quality of ideas in compositions based on concept maps
Contreras et al. Automated essay scoring using ontology generator and natural language processing with question generator based on blooms taxonomy’s cognitive level
He et al. Automatically predict question difficulty for reading comprehension exercises
Aini Do Male and Female Students Represent Their Experiences Differently?: A Transitivity Analysis of Students’ Texts
YIN A compression-based BiLSTM for treating teenagers’ depression chatbot
Zhao et al. Investigating the Validity and Reliability of a Comprehensive Essay Evaluation Model of Integrating Manual Feedback and Intelligent Assistance.
Gromang et al. The development of video analysis instrument to determine teacher's character
Marfani et al. Analysis of Learners’ Sentiments on MOOC Forums using Natural Language Processing Techniques
Tayal et al. Knowledge Enhancement using Question Generation for Images and Chart Data Input
Mayahi et al. Assessing English Language Writing and Readability Skills using Long Short-Term Memory Model
Dewanty et al. Discourse representation on Indonesian socio-political situation in the Instagram posts of an English-speaking Indonesian community
Patil et al. Literature Survey of Lexicon based method and Machine Learning methods of Sentiment Analysis of Student’s Feedback
Mahandule et al. Personality Prediction Using ML and NLP
Jain et al. Evaluating Emotional Detection & Classification Capabilities of GPT-2 & GPT-Neo Using Textual Data
Santhanam Towards Adapting Cognitive Architectures for Knowledgeable & Personalized Dialogue Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant