CN117497140A

CN117497140A - 一种基于细粒度提示学习的多层次抑郁状态检测方法

Info

Publication number: CN117497140A
Application number: CN202311299157.4A
Authority: CN
Inventors: 郭艳蓉; 张俊; 郝世杰; 洪日昌
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2023-10-09
Filing date: 2023-10-09
Publication date: 2024-02-02
Anticipated expiration: 2043-10-09
Also published as: CN117497140B

Abstract

本发明公开了一种基于细粒度提示学习的多层次抑郁状态检测方法，应用于抑郁状态检测领域，包括：获取访谈样本，通过T5预训练模型提取访谈样本的常规语义特征；对访谈样本进行细粒度提示添加，并通过BERT的NSP预训练模型提取访谈样本与细粒度提示间的情绪一致性概率特征；通过多头注意力机制分别提取常规语义特征和情绪一致性概率特征的关键信息，映射得到各自分类结果，并进行软投票融合，得到最终的多层次抑郁状态检测结果。本发明既可以应用到抑郁状态的三分类、五分类以及更加细粒度的分类任务上，取得显著的成果，也可以通过简化提示信息，退化到抑郁状态的二元分类任务，提升抑郁检测效果。

Description

一种基于细粒度提示学习的多层次抑郁状态检测方法

技术领域

本发明涉及抑郁状态检测领域，特别涉及一种基于细粒度提示学习的多层次抑郁状态检测方法。

背景技术

随着现代生活的快节奏和日益复杂化，抑郁症作为一种心理健康障碍正逐渐影响全球范围内的人类。抑郁症是一种复杂的情感障碍，其症状不仅限于持久的悲伤情绪。患者可能经历失眠、食欲改变、疲劳、自卑感、注意力不集中以及对生活失去兴趣等。然而，这些症状也可能与其他身体问题相混淆，使得抑郁症的确诊变得复杂和困难。近年来，随着人工智能和机器学习技术的快速发展，一些研究开始探索通过分析患者的言语、行为、生理指标等多维信息，并利用大数据分析和生物标志物等信息来辅助抑郁症的诊断。

利用深度学习技术辅助抑郁诊断方法可以基于音频、视觉、脑电、步态等信息，其中基于文本的抑郁检测相对于其他模态具有较好的检测准确度。基于文本的抑郁检测工作按访谈文本处理方法主要分为仅采用回答文本和仅采用部分问答两种，前者对于完整的访谈文本剔除问题内容而关注受试者回答内容，这种方法会丢失大量语义信息；后者尽管使用了以问答为单位的文本，但主观选择了少量认为是关键的问题和对应的回答作为输入，这种做法耗时且效果不理想，二者均存在缺陷。随着深度学习向更复杂的网络结构更庞大的训练数据发展，针对特定任务先构造特征提取网络再从原始数据上提取特征会更加耗时耗力且效果不佳。因此基于预训练模型微调的方法最近受到了广泛的欢迎，但是基于文本的抑郁检测工作往往基于单个预训练模型。这带来的问题有两个，一是预训练模型的选择问题，哪个模型对抑郁检测工作的泛化性更强，二是从模型提取的语义表征不足的问题，没有足够的特征去检测抑郁的存在，甚至存在过拟合的风险。目前的深度学习辅助抑郁诊断的方法主要集中在对受试者抑郁或健康的二元分类以及对抑郁严重程度的回归任务上，缺少对受试者抑郁状态更加细粒度的分类。从健康到严重抑郁，中间会经过轻度、中度以及重度等多个阶段，每个阶段的严重程度都是不一样的，通过对当前抑郁程度的把握可以根据情况采取不同的心理干预措施。由于抑郁的心理复杂性以及数据的稀缺性，细粒度的抑郁检测存在较大的难度，难以准确划分。

为此，如何解决上述问题，提供一种基于细粒度提示学习的多层次抑郁状态检测方法是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提出了一种基于细粒度提示学习的多层次抑郁状态检测方法。基于提示学习的启发，针对不同层次的抑郁检测任务构建多组细粒度的情绪提示信息，利用预训练模型提取与提示具有强相关的情绪特征，实现了在有限的抑郁文本中提取有效的特征。

为了实现上述目的，本发明采用如下技术方案：

一种基于细粒度提示学习的多层次抑郁状态检测方法，包括：

获取访谈样本，通过T5预训练模型提取访谈样本的常规语义特征；

对访谈样本进行细粒度提示添加，并通过BERT的NSP预训练模型提取访谈样本与所述细粒度提示间的情绪一致性概率特征；

通过多头注意力机制分别提取常规语义特征和情绪一致性概率特征的关键信息，映射得到各自分类结果，并采用软投票融合，得到最终的多层次抑郁状态检测结果。

可选的，获取访谈样本,具体为：

按数据记录的时间戳分割访谈文本，并在同一主题内汇总问题及回答，得到X_i＝{Q_i,1，A_i,1，Q_i,2，A_i,2，...，Q_i，n，A_i，n}；其中，Q_i，n和A_i，n分别为第n个系列问题及回答；i为受试者样本编号；n为问答个数；

将问题Q和回答A使用</s>特殊标记符号连接，得到访谈样本S_i＝{S_i，1，S_i,2，...，S_i，n}；其中，S_i，n＝Q_i，n+</s>+A_i，n。

可选的，通过T5预训练模型提取访谈样本的常规语义特征，具体为：

输入访谈样本至T5Tokenizer，得到T_i＝{T_i，1，T_i,2，...，T_i，n}；其中，n为访谈样本中的问答个数；i为受试者样本编号；

输入T_i至T5-Encoder预训练模型，得到编码结果E_i＝{E_i，1，E_i,2，...，E_i，n}；

池化最后一个编码层的输出，得到P_i＝{P_i，1，P_i,2，...，P_i，n}。

可选的，对访谈样本进行细粒度提示添加，具体为：

为访谈样本中的每一个问答附加上相同的提示句组Prompt＝Prompt₁～Prompt_c，得到PS_i＝{S_{prompt i，1}，S_{prompt i，2}，...，S_{prompt i，n}}；其中，c为提示语句个数，等于分类个数；n为访谈样本中的问答个数；i为受试者样本编号。

可选的，通过BERT的NSP预训练模型提取访谈样本与细粒度提示间的情绪一致性概率特征，具体为：

将PS_i经BertTokenizer后，输入至BERT-NSP预训练模型，获取PS_i中的情绪一致性概率Pro_i＝{Pro_i,1，Pro_i,2，...，Pro_i,n}，并经过一个线性变换映射，得到F_i。

可选的，情绪一致性概率Pro_i经过一个线性变换映射，得到F_i，如下：

F_i＝ReLU(W*Pro_i)+b；

其中，ReLU为非线性激活函数；W为权重参数；b为偏置。

可选的，基于常规语义特征和情绪一致性概率特征的关键信息，映射得到各自分类结果，具体为：

分别输入常规语义特征和情绪一致性概率特征的关键信息至由两个线性层组成的分类器中，映射得到各自分类结果。

可选的，软投票融合为采用计算类别平均概率的软投票融合。

可选的，还包括：使用AdamW优化器和交叉熵损失函数进行多层次的抑郁检测训练并测试。

经由上述的技术方案可知，与现有技术相比，本发明提出了一种基于细粒度提示学习的多层次抑郁状态检测方法。通过构建两条基于不同预训练语言模型的抑郁检测分支，即T5预训练模型、BERT的NSP预训练模型，分别提取访谈样本中的常规语义特征和访谈样本添加细粒度提示后文本与细粒度提示间的情绪一致性概率特征，实现了在有限的抑郁文本中提取有效的特征。本发明既可以应用到抑郁状态的三分类、五分类以及更加细粒度的分类任务上，取得显著的成果，也可以通过简化提示信息，退化到抑郁状态的二元分类任务，提升抑郁检测效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明的方法流程示意图。

图2为本发明的MDSD-FGPL模型框架示意图。

图3为本发明对访谈样本进行细粒度提示添加的AddPrompts示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

本发明实施例1公开了一种基于细粒度提示学习的多层次抑郁状态检测方法，如图1所示，包括：

由对话性质的访谈可知，受试者的访谈样本S_i由一连串的问答对构成，即S_i＝{S_i，1，S_i,2，...，S_i，n}，经过如图2所示的MDSD-FGPL模型的映射函数f，输出为Y_i，如下：

Y_i＝f(S_i)∈{0，1，...，c-1}；

其中，c为提示语句个数，等于分类个数；{0，1，...，c-1}为细粒度分类级别；i为受试者样本编号。

获取访谈样本S_i，通过T5预训练模型提取访谈样本S_i的常规语义特征。

T5(Text-to-Text Transfer Transformer)为一种基于Transformer架构的通用文本预训练模型，旨在通过将多个自然语言处理任务转化为文本到文本的转换问题来进行学习。T5的编码器部分负责将输入文本编码为语义表示，其中利用了多层的自注意力机制以及前馈神经网络层来捕捉上下文信息和语义特征，它可以为多层次的细粒度抑郁症检测提取广泛的语义特征。

获取访谈样本S_i，具体为：

按数据记录的时间戳分割访谈文本，并在同一主题内汇总问题及回答，得到样本X_i＝{Q_i，1，A_i,1，Q_i,2，A_i,2，...，Q_i，n，A_i，n}；其中，Q_i，n和A_i，n分别为第n个系列问题及回答；n为问答个数，对于不同的样本，n的大小不完全一致；i为受试者样本编号。

将问题Q和回答A使用</s>特殊标记符号连接，得到一个完整句子，即访谈样本S_i＝{S_i，1，S_i,2，...，S_i，n}；其中，S_i，n＝Q_i，n+</s>+A_i，n。

通过聚合同一话题下的系列问题及回答文本，能够保留最完整的结构化文本信息。

通过T5预训练模型提取访谈样本S_i的常规语义特征，具体为：

输入访谈样本S_i至T5Tokenizer，得到T_i＝{T_i，1，T_i,2，...，T_i，n}；其中，n为访谈样本中的问答个数；i为受试者样本编号。

输入T_i至由12个Transformer块构成的T5-Encoder预训练模型，冻结参数得到编码结果E_i＝{E_i，1，E_i,2，...，E_i，n}，如下：

E_i＝T5-Encoder(T5Tokenizer(S_i))；

其中，E_i中每一个token表示维度由T5的大小决定，为了从编码序列中提取出关键信息并降低模型计算复杂度避免过拟合，采用最大池化操作，池化最后一个编码层的输出，得到P_i＝{P_i，1，P_i,2，...，P_i，n}。

对访谈样本S_i进行细粒度提示添加，并通过BERT的NSP预训练模型提取访谈样本S_i与所述细粒度提示间的情绪一致性概率特征。

NSP(Next Sentence Prediction)任务是BERT(Bidirectional EncoderRepresentations from Transformers)模型中的一种任务，旨在帮助BERT模型学习句子之间的关系和上下文，并提供更好的句子级别表示。

随着大模型参数量的增加，微调模型去适应下游数据和任务变得越来越困难；因此，使用预训练模型的参数进行特征提取和基于提示的学习成为一种流行的方法；在MDSD-T5中，本发明使用了第一种方法，而在MDSD-BERT中，试图使用NSP任务来创建提示，以捕捉抑郁症的特定语义特征，即文本中的情感倾向，帮助识别抑郁症。

对访谈样本S_i进行细粒度提示添加，具体为：

从粗粒度到细粒度，选择的提示如表1所示，通过如图3所示的Add Prompts，为访谈样本S_i中的每一个问答附加上相同的提示句组Prompt＝Prompt₁～Prompt_c，得到PS_i＝{S_{prompt i，1}，S_{prompt i，2}，...，S_{prompti i，n}}；其中，c为提示语句个数，等于分类个数；n为访谈样本中的问答个数；i为受试者样本编号。

表1不同分类粒度的提示信息

通过BERT的NSP预训练模型提取访谈样本S_i与细粒度提示间的情绪一致性概率特征，具体为：

将PS_i经BertTokenizer后，输入至BERT-NSP预训练模型，获取PS_i中的情绪一致性概率Pro_i＝{Pro_i,1，Pro_i,2，...，Pro_i,n}，并经过一个线性层变换映射，得到F_i，如下：

F_i＝ReLU(W*Pro_i)+b；

其中，ReLU为非线性激活函数；W为权重参数；b为偏置。

以细粒度三分类为例，设计了三种类型的提示：正面、中性和负面，即Prompt₁＝P_pos，Prompt₂＝P_neu，Prompt₃＝P_neg，他们分别作为访谈样本S_i中每对问答S_i,t(t∈[1，n])中的下一句，得到PS_i，如下：

PS_i＝{(S_{pos i，1}，S_{neu i，1}，S_{neg i，1})，...，(S_{pos i，n}，S_{neu i，n}，S_{neg i，n})}；

其中，S_{pos/neu/neg i，1}＝[CLS]+Q_i,1+A_i,1+[SEP]+P_pos/neu/neg；[CLS]和[SEP]分别为置于句首和用于分割不同句子的特殊标记符号。

接着将PS_i经过BertTokenizer后，使用预训练模型BERT-NSP从PS_i中获取情绪一致性概率Pro_i，如下：

Pro_i＝Bert-NSP(BertTokenizer(PS_i))＝{Pro_i，1，Pro_i，2，...，Pro_i，n}；

其中，Pro_i，1＝(ProS_{pos i，1}，ProS_{neu i，1}，ProS_{neg i，1})；ProS_{pos i，1}，ProS_{neu i，1}和ProS_{neg i，1}分别代表S_{pos i，1}，S_{neu i，1}和S_{neg i，1}的情绪一致性概率，因此，ProS_{pos/neu/neg i，1}∈[0,1]。

根据许多情绪识别工作对语音或文本的序列学习，单个问答对的情绪状态是不充分且缺少连续信息的；故将情绪一致性概率Pro_i经过一个线性变换映射到一个更高维度的特征空间，增加其空间分辨率得到F_i。

通过多头注意力机制分别提取常规语义特征和情绪一致性概率特征的关键信息，分别输入至由两个线性层组成的分类器中，映射得到各自分类结果，并采用计算类别平均概率的软投票融合，得到最终的多层次抑郁状态检测结果，使用AdamW优化器和交叉熵损失函数进行多层次的抑郁检测训练并测试。

通过多头注意力机制提取常规语义特征的关键信息，并输入至由两个线性层组成的分类器中，映射得到分类结果，具体为：

在许多的抑郁检测工作中普遍使用循环神经网络，因为抑郁的表示隐藏在一个相对长期的过程中，P_i的各个编码结果彼此之间是独立的，因此使用一个具有序列学习的模块去捕捉P_i中不同问答对之间的关系是非常有必要的。注意力机制依靠其强大的序列建模和语义关联的能力，在各种NLP任务中广泛使用，本发明选择将编码结果P_i通过多头注意力层以捕捉不同问答对之间的依赖关系，得到一个全面的上下文表征M_i，如下：

M_i＝Mutil-Head Attention(Max-pooling(E_i))；

最后将M_i序列展平再输入到由两个线性层组成的分类器中，最终得到分类输出

通过多头注意力机制提取情绪一致性概率特征的关键信息，并输入至由两个线性层组成的分类器中，映射得到分类结果，具体为：

F_i经过一个与MDSD-T5中结构类似的多头注意力模块，以学习文本的情绪变化信息，最后同样使用双线性层的分类器完成映射，如下：

本发明结合MDSD-T5和MDSD-BERT构造了一个后期投票的融合模型MDSD-FGPL，如图2所示。针对多层次的抑郁检测任务，MDSD-T5基于强大编码能力的T5偏向于提取常规语义特征。MDSD-BERT基于细粒度提示，考虑粒度大小并偏向于提取特殊语义特征。本发明在提出的文本组织方法的基础上，从有限的抑郁文本中提取出多样的可学习特征，有效提升抑郁检测能力。使用软投票融合的目的是避免两个分支间的影响，同时采用均值投票得到综合利用各模型优势的分类结果。总之，本发明基于访谈形式的文本模态，先后对文本做结构化预处理和特征提取，然后使用AdamW优化器和交叉熵损失函数进行多层次的抑郁检测训练并测试。

本发明实施例公开了一种基于细粒度提示学习的多层次抑郁状态检测方法。通过构建两条基于不同预训练语言模型的抑郁检测分支，即T5预训练模型、BERT的NSP预训练模型，分别提取访谈样本中的常规语义特征和访谈样本添加细粒度提示后文本与细粒度提示间的情绪一致性概率特征，实现了在有限的抑郁文本中提取有效的特征。本发明既可以应用到抑郁状态的三分类、五分类以及更加细粒度的分类任务上，取得显著的成果，也可以通过简化提示信息，退化到抑郁状态的二元分类任务，提升抑郁检测效果。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，包括：

获取访谈样本，通过T5预训练模型提取所述访谈样本的常规语义特征；

对所述访谈样本进行细粒度提示添加，并通过BERT的NSP预训练模型提取所述访谈样本与所述细粒度提示间的情绪一致性概率特征；

通过多头注意力机制分别提取所述常规语义特征和所述情绪一致性概率特征的关键信息，映射得到各自分类结果，并采用软投票融合，得到最终的多层次抑郁状态检测结果。

2.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，获取所述访谈样本，具体为：

将问题Q和回答A使用</s>特殊标记符号连接，得到所述访谈样本S_i＝{S_i，1，S_i,2，...，S_i，n}；其中，S_i，n＝Q_i，n+</s>+A_i，n。

3.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，通过T5预训练模型提取所述访谈样本的常规语义特征，具体为：

输入所述访谈样本至T5Tokenizer，得到T_i＝{T_i，1，T_i,2，...，T_i，n}；其中，n为所述访谈样本中的问答个数；i为受试者样本编号；

4.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，对所述访谈样本进行细粒度提示添加，具体为：

为所述访谈样本中的每一个问答附加上相同的提示句组Prompt＝Prompt₁～Prompt_c，得到PS_i＝{S_{prompt i，1}，S_{prompt i，2}，...，S_{prompt i，n}}；其中，c为提示语句个数，等于分类个数；n为所述访谈样本中的问答个数；i为受试者样本编号。

5.根据权利要求4所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，通过BERT的NSP预训练模型提取所述访谈样本与所述细粒度提示间的情绪一致性概率特征，具体为：

6.根据权利要求5所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，所述情绪一致性概率Pro_i经过一个线性变换映射，得到F_i，如下：

F_i＝ReLU(W*Pro_i)+b；

其中，ReLU为非线性激活函数；W为权重参数；b为偏置。

7.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，基于所述常规语义特征和所述情绪一致性概率特征的关键信息，映射得到各自分类结果，具体为：

分别输入所述常规语义特征和所述情绪一致性概率特征的关键信息至由两个线性层组成的分类器中，映射得到各自分类结果。

8.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，所述软投票融合为采用计算类别平均概率的软投票融合。

9.根据权利要求1所述的一种基于细粒度提示学习的多层次抑郁状态检测方法，其特征在于，还包括：使用AdamW优化器和交叉熵损失函数进行多层次的抑郁检测训练并测试。