CN115714002B

CN115714002B - 抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备

Info

Publication number: CN115714002B
Application number: CN202211084745.1A
Authority: CN
Inventors: 陈妍; 张小威; 卞亦文; 邓媛英; 罗雪琴; 杨莹
Original assignee: Hunan University of Technology
Current assignee: Hunan University of Technology
Priority date: 2022-09-06
Filing date: 2022-09-06
Publication date: 2023-08-11
Anticipated expiration: 2042-09-06
Also published as: CN115714002A

Abstract

本发明公开了一种抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备，包括：获取训练数据集，并进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征，将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；采用共同注意力机制，对始文本嵌入矩阵和情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，采用本发明提高抑郁症状预测的准确率和效率。

Description

抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备

技术领域

本发明涉及文本数据处理领域，尤其涉及一种抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备。

背景技术

目前抑郁症的诊断，主要靠医生通过参考临床抑郁症指标来面对面患者实现。但人们因某种方式感到羞耻或不了解抑郁症,在抑郁症的早期阶段，有 70％的人不会咨询心理医生，这也导致他们的病情将进一步恶化，而随着网络技术的发展，越来越多的人们习惯使用社交网络平台进行表达心声，人们往往愿意在社交媒体中表达情感袒露心声。用户在社交媒体上发布的内容可以很好的反映用户的心理状态。因此，社交媒体已成功被利用于帮助检测身体精神疾病的工具。

在现有的一些实现方式中，有一些通过机器学习和深度学习技术，从文本中提取与抑郁症状相关的名词特征，通过逻辑回归和LDA建模、SVM、 MDL、TextCNN等算法模型进行预测。例如，专利公开号为CN112927781A 的专利文献中，记载了一种基于自然语言处理和时序卷积网络的抑郁症检测方法，针对特征单一识别效率低。专利公开号为CN11072899的专利文献中，记载了一种基于情景感知的多模态抑郁症检测系统，与其他抑郁症检测专利设计一样，都只在文本和言语信息进行设计分析。

发明人在实现本发明的过程中，发现现有方式至少存在如下问题：现有方式局限于对关键词进行提取，而缺乏对文本情感信息和用户情绪变化特征挖掘，造成模型情感特征缺失问题，导致检测准确不高。

发明内容

本发明实施例提供一种抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备，以提高抑郁症状检测的准确率。

为了解决上述技术问题，本申请实施例提供一种抑郁风险检测模型训练方法，所述抑郁风险检测模型训练方法包括：

获取训练数据集，所述训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息；

对所述训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对所述携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征；

将训练数据集的原始文本和所述抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；

采用共同注意力机制，对所述始文本嵌入矩阵和所述情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；

将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，所述初始抑郁风险检测模型为双向深度网络。

可选地，所述将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果包括：

将所述融合特征矩阵输入到初始抑郁风险检测模型的分类器中，经过卷积操作后得到一元、二元、三元向量对应的三个特征图，其中，所述分类器基于Text-CNN构建；

通过激活函数对每个所述特征图进行运算后输入池化层进行池化处理；

将池化层输出的的三个池化结果进行拼接，得到基于情感交互的抑郁症文档向量表示；

将所述基于情感交互的抑郁症文档向量输入softmax函数，得到不同类别的概率，基于所述不同类别的概率确定识别结果。

可选地，将池化层输出的的三个池化结果进行拼接，得到基于情感交互的抑郁症文档向量表示包括：

采用如下公式确定基于情感交互的抑郁症文档向量表示：

其中，v_i为所述基于情感交互的抑郁症文档最终表示，为三个池化结果。

可选地，所述根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型包括：

将正态分布初始化学习率、bachsize、卷积通道数量、权重衰减超参数、词向量维度作为待优选参数；

将所述识别结果与真实类别相比，计算模型损失值并进行待优选参数更新，得到更新后的抑郁风险检测模型；

采用半监督学习的方式欠采样处理和迭代训练，并采用采用droupout正则化方法进行拟合，在达到预设训练条件时，得到所述训练好的抑郁风险检测模型。

为了解决上述技术问题，本申请实施例还提供一种抑郁症状预警方法，包括：

从社交平台爬取用户发文信息；

对所述发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果；

若所述抑郁症状检测结果为符合抑郁症临床评价标准，则对所述用户发文信息执行预设的预警措施。

为了解决上述技术问题，本申请实施例还提供一种抑郁风险检测模型训练装置，包括：

训练集获取模块，用于获取训练数据集，所述训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息；

特征提取模块，用于对所述训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对所述携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征；

向量转化模块，用于将训练数据集的原始文本和所述抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；

矩阵融合模块，用于采用共同注意力机制，对所述始文本嵌入矩阵和所述情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；

模型训练模块，用于将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，所述初始抑郁风险检测模型为双向深度网络。

可选地，所述模型训练模块包括：

卷积处理单元，用于将所述融合特征矩阵输入到初始抑郁风险检测模型的分类器中，经过卷积操作后得到一元、二元、三元向量对应的三个特征图，其中，所述分类器基于Text-CNN构建；

池化单元，用于通过激活函数对每个所述特征图进行运算后输入池化层进行池化处理；

拼接单元，用于将池化层输出的的三个池化结果进行拼接，得到基于情感交互的抑郁症文档向量表示；

分类单元，用于将所述基于情感交互的抑郁症文档向量输入softmax函数，得到不同类别的概率，基于所述不同类别的概率确定识别结果。

进一步地，拼接单元包括：

计算子单元，用于采用如下公式确定基于情感交互的抑郁症文档向量表示：

其中，v_i为基于情感交互的抑郁症文档最终表示，为三个池化结果。

可选地，模型训练模块35还包括：

参数确定单元，用于将正态分布初始化学习率、bachsize、卷积通道数量、权重衰减超参数、词向量维度作为待优选参数；

模型更新单元，用于将识别结果与真实类别相比，计算模型损失值并进行待优选参数更新，得到更新后的抑郁风险检测模型；

模型迭代单元，用于采用半监督学习的方式欠采样处理和迭代训练，并采用droupout正则化方法进行拟合，在达到预设训练条件时，得到训练好的抑郁风险检测模型。

为了解决上述技术问题，本申请实施例还提供一种抑郁症状预警装置，包括：

数据采集模块，用于从社交平台爬取用户发文信息；

症状预测模块，用于对所述发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果；

预警模块，用于若所述抑郁症状检测结果为符合抑郁症临床评价标准，则对所述用户发文信息执行预设的预警措施。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述抑郁风险检测模型训练方法，或者，所述处理器执行所述计算机程序时实现上述抑郁症状预警方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述抑郁风险检测模型训练方法，或者，所述实现计算机程序被处理器执行时实现上述抑郁症状预警方法的步骤。

本发明实施例提供的抑郁风险检测模型训练方法、抑郁症状预警方法及相关设备，通过获取训练数据集，训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息，对训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征，将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；采用共同注意力机制，对始文本嵌入矩阵和情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，实现基于情感感知的双向深度网络相互指导下指导情感词汇和原始文本学习，通过双向深度网络学习，不仅融合特征学习和模型训练，而且融合情感特征和原始文本更好的表征用户的情感变化，实现快速、准确的抑郁风险检测，提高模型对抑郁症状预测的准确率和效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是本申请的抑郁风险检测模型训练方法的一个实施例的流程图；

图3是本申请的抑郁症状预警方法的一个实施例的流程图；

图4是根据本申请的抑郁风险检测模型训练装置的一个实施例的结构示意图；

图5是根据本申请的抑郁症状预警装置的一个实施例的结构示意图；

图6是根据本申请的计算机设备的一个实施例的结构示意图；

图7是本申请的抑郁风险检测模型训练方法的一个实施例中的模型示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，如图1所示，系统架构100可以包括终端设备101、102、 103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、 103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的抑郁风险检测模型训练方法和抑郁症状预警方法由服务器执行，相应地，抑郁风险检测模型训练装置和抑郁症状预警装置设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器，本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。

请参阅图2，图2示出本发明实施例提供的一种抑郁风险检测模型训练方法，以该方法应用在图1中的服务端为例进行说明，详述如下：

S201：获取训练数据集，训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息。

具体地，获取基于社交平台构建的抑郁症用户和非抑郁症用户的数据信息，采用爬虫技术获取社交平台不同类别用户在一段时间内发布的所有发文信息，并进行文本预处理，得到训练数据集。

在一具体实施方式中，基于社交平台构建的抑郁症用户和非抑郁症用户的数据信息包括：构建Depressed代表抑郁症数据集，Non-Depressed代表非抑郁症数据集，该数据集标签满足严格的标记规则，即用户相关帖子中有“(I’m/I was/I am/…)diagnoseddepression”类似的文本，并且在一定时间内，用户的状态符合抑郁症临床评价标准，基于这两种情况，则将用户标记为抑郁症用户，否则，标记为非抑郁症用户。

进一步地，文本预处理包括如下步骤：

删除数据信息中异常和重复数据；

按发文信息的发表时间将每个用户数据依据时间先后排序；

提取数据集json文件中关键字符，如create_at、id(博文)、use_id(用户)、text等；

通过re.compile()、re.findall及sub()等函数对字符进行正则匹配，除去原始语料中的停用词、特殊字符、表情、html标签、@、链接等，得到可处理的文本数据，作为训练数据集的数据。

在一可选实施方式中，训练数据集包含字段如表1所示。

表1

user_id(用户id)	字符型
		id(博文id)	字符型
created_at(博文发表时间)	日期型
		text(用户发表博文)	字符型
name(用户真实名)	字符型
		screen_name(用户网络名)	字符型
followers_count(用户的粉丝数)	数值型
		friends_count(用户的朋友数)	数值型
url(博文所在地址)	字符型
		location(用户定位)	字符型
country(用户所在城市)	字符型
		flag(用户抑郁标签)	数值型

S202：对训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征。

具体地，利用WordNet和来自VADER的情感词汇字典，从博文中匹配提取出带有情感状态信息的词汇。其次，通过抑郁症高频词库LIWC等工具，提取出与抑郁症相关词汇特征。然后，将筛选获得的词汇合并到一个词汇集，得到用户原始文本集和情绪状态词汇集。

S203：将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵。

具体地，将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵具体过程如下：

S2031：模型建立和特征向量表示。

文档分类是分配标签的任务，给定一篇文档d_i,其中D是文档集，Y是类别集。S为一个情感语义集，D代表一个抑郁症文档集，每个抑郁症用户于抑郁症文档集有唯一的关联。对于给定文档d_i∈D，本发明提取出了情感语义集s_i∈S，问题的主要目标是学习一个映射函数：

其中通过映射函数预测用户是否具有抑郁症风险，当Y＝0时，表示该用户没有抑郁风险；当Y＝1时，表示该用户有抑郁风险。将/>表示为用户i对应博文集文档，将/>表示为从抑郁症语言文档中提取的情感词，其中/>是文档中单词的数量，/>是文档中情感词的数量。

S2032：将博文d_i字向量转化为嵌入矩阵其中/>是用户的第i条博文的单词个数，w为博文信息标识符(文本库规则中的)，l^w是单词嵌入向量维度(这里我们选择512)；

S2033：从用户对应博文d_i中通过VADER工具提取对应的情感词，通过向量矩阵转化为情感特征嵌入矩阵

其中，步骤S203具体包括如下：

基于情感感知的双向深度网络包括两个主要的输入部分：将文本转换成文本向量表示和把从文本中提取的与情感相关词汇转化成向量表示。与之前使用静态预先训练的单词嵌入矩阵的工作不同，本发明在进行预测的同时进行情感词训练和单词嵌入。通常来说，单词的嵌入矩阵表示为其中n^w表示为抑郁症文档集中唯一单词的个数，l^w是单词嵌入向量维度。本发明将/>表示为情感嵌入矩阵,其中n^s是从抑郁症用户文档中提取的词汇的个数。

与传统的嵌入过程类似，将文档d_i的字向量转换为其嵌入矩阵对于文档中所有的单词来说，首先获取它们的独热表示/>每行中只有1，表示在当前位置出现的字。然后单词嵌入矩阵W_i可以通过以下公式生成:

同理，情感独热编码表示为通过/>得到抑郁症文档中提取的情感特征嵌入矩阵S_i。

S204：采用共同注意力机制，对始文本嵌入矩阵和情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵。

本实施例中，通过一种基于共同注意力的交互方法，结合一个单词嵌入矩阵和情感嵌入矩阵/>使用每个单词嵌入W_ij作为query,并使用情感嵌入矩阵S_i作为value生成一个基于情感的交互矩阵/>然后，可以通过以下方法生成基于单词的与情感矩阵/>的交互：

具体而言：使用每个单词作为query来生成基于情感交互的交互矩阵可以包含与单词相关的信息，该矩阵的每一行都可以看作是与单词相关的情感嵌入的加权和。因此，最终交互矩阵的每一行表示与情感的组合信息。

在本实施例的一个具体实施方式中，如图7所示，图7为本申请实施例一个具体模型结构示意图，该模型结构中，对原始文本信息进行语义分析，提取携带情感状态的短语信息，写入到情感字典，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征，进而分别对原始文本和抑郁症相关词汇特征进行特征提取，得到文本概要和关键字特征，再基于共同的注意力机制进行交互融合处理，得到融合特征矩阵，也即交互特征。

S205：将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，初始抑郁风险检测模型为双向深度网络。

进一步地，将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果：

将融合特征矩阵输入到初始抑郁风险检测模型的分类器中，经过卷积操作后得到一元、二元、三元向量对应的三个特征图，其中，分类器基于Text-CNN 构建；

通过激活函数对每个特征图进行运算后输入池化层进行池化处理；

将基于情感交互的抑郁症文档向量输入softmax函数，得到不同类别的概率，基于不同类别的概率确定识别结果。

本实施例所使用的卷积网络模块包含八个网络层：一个输入层，三个卷积层，三个池化层，和一个隐藏的层。

(1)输入层:本实施例将基于情感特征与原始文档的交互向量i_i作为模型的输入部分。

(2)卷积层:卷积层的功能是从文档的嵌入矩阵中提取更高级层次的单词特征。本实施例设置了三个滤波器通过卷积层获得交互嵌入矩阵i_i的一元、二元和三元信息。卷积操作后的三个特征图表示为/>

其中g是一个激活函数,b是一个偏置向量。在这里本发明使用RELU函数作为激活函数,定义如下：

RELU(X)＝max(0,x)

(3)最大池化层：池化层用于选择从卷积层中获得的重要隐藏特征。在本发明的网络中，从卷积层生成的每个特征图应用最大池化操作来选择每列中的最高分数，每个特征图生成一个固定长度的向量。最大池层的的输出可计算为：

其中代表第j列的特征图f^k。

(4)隐藏层：隐藏层的函数是通过将最大池层表示的一元、二元、三元的向量组合，得到文本的字级表示。在实施例的网络模型中，连接三个向量，并得到最终的表示。基于情感交互的抑郁症文档表示可通过以下方法计算：

基于情感交互的抑郁症文档最终表示为v_i之后，使用一个全连接层，通过一个softmax函数得到模型的最终输出：

output_i＝softmax(Θ·v_i+b)

其中b是全连接层的偏置量。通过output_i获得预测标签。

本实施例中，模型参数表示为θ，将从文档中提取的情感词表示为S，并将其相应的上下文单词表示为W。这里将训练数据表示为X＝{S，W}，集合的类标签为Y。对于给定的输入x∈X，模型为每个类y∈Y输出一个分数s(y；x,θ)。为了计算输出层中y的条件概率，本发明在模型的输出上应用了一个softmax 函数。标签在输入x上的条件分布和模型参数θ被定义为：

训练方法的目标是最大化训练集上的对数似然:

使用交叉熵损失作为模型的损失函数，其定义为：

其中t_il是训练实例X_i真实标签的一个独热表示，p_il是给定一个标签l的训练实例X_i的条件概率。参数的更新方式为：

其中α是学习率,∈是平滑参数，g_t和θ_t是训练步骤t中的梯度矩阵和参数。

在一具体可选实施方式中，半监督学习模型具体包括如下步骤：

在半监督学习模型中，训练数据包括一组正(抑郁)用户博文样本(P)和一组未标记的用户博文样本(U)，其真实性应该是未知的。正样本数量应该远小于未标记样本数量，即|P|＜＜|U|。在未标记的样本中，正的未标记(抑郁) 用户博文样本(PU)的大小被假定小于负的未标记(非抑郁)用户博文样本(NU) 的大小，即|PU|<|NU|，且|PU|+|NU|＝|U|。

为了创建用于训练二元分类器的平衡数据集，我们首先对未标记的样本进行欠采样，从未标记的用户博文样本(U)中随机选择一组伪抑郁用户博文样本 (U′)，其大小与正(抑郁)用户博文样本的大小相同，即|U′|＝|P|。然后，在伪抑郁用户博文样本和正样本(U′∪P)的组合上训练提出的情感感知分类器的一个实例。在模型训练过程中，我们将伪抑郁用户博文样本视为真抑郁样本，模型训练过程的结果是一个弱分类器。重复这个欠采样和模型训练过程K次，就产生了K个弱分类器。进而通过平均它们的输出来集成这K个弱分类器以生成一个强分类器。然后，我们使用这个强分类器对未标记的用户博文样本(U) 进行分类。被分类为抑郁用户样本的前n个未标记的博文样本由一组机器标记的抑郁用户样本(P′)组成，将机器标记的抑郁用户博文样本附加到正面标记的抑郁用户样本中，以更新正面标记的样本的集合，即P＝P+P′。之后，再次重复欠采样、弱分类器训练、集成分类和正样本更新的过程。

在模型框架训练时，也存在一些不正确的标签将包含在正(抑郁)用户博文样本(P)中的风险，这可能会给分类问题带来噪声。为了在训练数据集的大小和它包含的噪声量之间进行权衡，本实施例采用了一种提前停止机制来在迭代训练过程停止改进时停止扩展正样本集。当验证数据集上的强分类器的准确性在五次迭代后没有提高时，就会提前触发停止。然后，选择在最近五次迭代中表现最好的强分类器作为最终的强分类器。

本实施例中，获取训练数据集，训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息，对训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征，将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；采用共同注意力机制，对始文本嵌入矩阵和情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，实现基于情感感知的双向深度网络相互指导下指导情感词汇和原始文本学习，通过双向深度网络学习，不仅融合特征学习和模型训练，而且融合情感特征和原始文本更好的表征用户的情感变化，实现快速、准确的抑郁风险检测，提高模型对抑郁症状预测的准确率和效率。

请参阅图3，图3示出本发明实施例提供的一种抑郁症状预警方法，以该方法应用在图1中的服务端为例进行说明，详述如下：

S206：从社交平台爬取用户发文信息。

S207：对发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果；

S208：若抑郁症状检测结果为符合抑郁症临床评价标准，则对用户发文信息执行预设的预警措施。

进一步地，从社交平台爬取用户发文信息包括：

获取预设的统一资源定位符；

通过网络爬虫的方式，对所述预设的统一资源定位符对应的页面文件进行爬取分析，得到所述预设的统一资源定位符对应的页面文件中包含的内容；

通过模糊匹配的方式，从所述预设的统一资源定位符对应的页面文件中包含的内容提取预设词汇的文本内容，作为基础内容。

其中，预设的统一资源定位符为社交平台对应的资源页面的链接符，具体可根据实际应用需要进行设定或者生成。

其中，预设词汇具体为与抑郁症状临床评价标准有关联的词汇。

由于网络爬虫的爬行范围和数量巨大，对于爬行速度和存储空间要求较高，对于爬行页面的顺序要求相对较低，同时由于待刷新的页面太多，通常采用并行工作方式，网络爬虫的结构大致可以分为页面爬行模块、页面分析模块、链接过滤模块、页面数据库、URL队列、初始URL集合几个部分。为提高工作效率，通用网络爬虫会采取一定的爬行策略。常用的爬行策略有：深度优先策略、广度优先策略。

其中，深度优先策略的基本方法是按照深度由低到高的顺序，依次访问下一级网页链接，直到不能再深入为止。爬虫在完成一个爬行分支后返回到上一链接节点进一步搜索其它链接。当所有链接遍历完后，爬行任务结束。

其中，广度优先策略是按照网页内容目录层次深浅来爬行页面，处于较浅目录层次的页面首先被爬行。当同一层次中的页面爬行完毕后，爬虫再深入下一层继续爬行。这种策略能够有效控制页面的爬行深度，避免遇到一个无穷深层分支时无法结束爬行的问题，实现方便，无需存储大量中间节点。

优选地，本发明实施例采用的爬行策略为广度优先策略，先爬取预设的统一资源定位符，获取预设的统一资源定位符对应的多个页面文件，再在后续对每个页面文件进行爬取，获取每个页面文件中包含的带有情感词汇的语句，避免了爬取过多的无用信息而导致的额外时间开销，提高了爬取效率。

其中，预设的预警措施，包括但不限于邮件通知、弹框提醒、电话提醒、管理医疗账户等。

本实施例中，从社交平台爬取用户发文信息，对发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果，在抑郁症状检测结果为符合抑郁症临床评价标准时，对用户发文信息执行预设的预警措施，有利于提前对感知抑郁症状并对相应的用户进行预警，提高抑郁症状预警干预的及时性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

图4示出与上述实施例抑郁风险检测模型训练方法一一对应的抑郁风险检测模型训练装置的原理框图。如图4所示，该抑郁风险检测模型训练装置包括训练集获取模块31、特征提取模块32、向量转化模块33、矩阵融合模块 34和模型训练模块35。各功能模块详细说明如下：

训练集获取模块31，用于获取训练数据集，训练数据集包括从社交平台收集的抑郁症用户发文信息和非抑郁症用户发文信息；

特征提取模块32，用于对训练数据集进行语义分析，提取携带情感状态的短语信息，并采用抑郁症高频词库，对携带情感状态的短语信息进行关键信息提取，得到抑郁症相关词汇特征；

向量转化模块33，用于将训练数据集的原始文本和抑郁症相关词汇特征进行向量表示，得到原始文本嵌入矩阵和情感感知特征嵌入矩阵；

矩阵融合模块34，用于采用共同注意力机制，对始文本嵌入矩阵和情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；

模型训练模块35，用于将融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，初始抑郁风险检测模型为双向深度网络。

可选地，模型训练模块35包括：

卷积处理单元，用于将融合特征矩阵输入到初始抑郁风险检测模型的分类器中，经过卷积操作后得到一元、二元、三元向量对应的三个特征图，其中，分类器基于Text-CNN构建；

池化单元，用于通过激活函数对每个特征图进行运算后输入池化层进行池化处理；

分类单元，用于将基于情感交互的抑郁症文档向量输入softmax函数，得到不同类别的概率，基于不同类别的概率确定识别结果。

进一步地，拼接单元包括：

可选地，模型训练模块35还包括：

图5示出与上述实施例抑郁症状预警方法一一对应的抑郁症状预警装置的原理框图。如图5所示，该抑郁症状预警装置包括数据采集模块36、症状预测模块37和预警模块38。各功能模块详细说明如下：

数据采集模块36，用于从社交平台爬取用户发文信息；

症状预测模块37，用于对发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果；

预警模块38，用于若抑郁症状检测结果为符合抑郁症临床评价标准，则对用户发文信息执行预设的预警措施。

关于抑郁风险检测模型训练装置、抑郁症状预警装置的具体限定可以参见上文中对于抑郁风险检测模型训练方法、抑郁症状预警方法的限定，在此不再赘述。上述抑郁风险检测模型训练装置、抑郁症状预警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图6，图6为本实施例计算机设备基本结构框图。

所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是，图中仅示出了具有组件连接存储器41、处理器 42、网络接口43的计算机设备4，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器41至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器41可以是所述计算机设备4的内部存储单元，例如该计算机设备4的硬盘或内存。在另一些实施例中，所述存储器41也可以是所述计算机设备4的外部存储设备，例如该计算机设备4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器 41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中，所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件，例如电子文件的控制的程序代码等。此外，所述存储器 41还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42 通常用于控制所述计算机设备4的总体操作。本实施例中，所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据，例如运行电子文件的控制的程序代码。

所述网络接口43可包括无线网络接口或有线网络接口，该网络接口43 通常用于在所述计算机设备4与其他电子设备之间建立通信连接。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有界面显示程序，所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的抑郁风险检测模型训练方法的步骤，或者，的所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述抑郁症状预警方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

1.一种抑郁风险检测模型训练方法，其特征在于，所述抑郁风险检测模型训练方法包括：

采用共同注意力机制，对所述原始文本嵌入矩阵和所述情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵；

将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，所述初始抑郁风险检测模型为双向深度网络；

其中，所述采用共同注意力机制，对所述始文本嵌入矩阵和所述情感感知特征嵌入矩阵进行交互融合处理，得到融合特征矩阵包括：

对于所述原始文本嵌入矩阵和所述情感感知特征嵌入矩阵/>使用所述原始文本嵌入矩阵中的每个单词嵌入W_ij作为query,并使用所述情感感知特征嵌入矩阵作为value，基于如下公式进行交互融合处理，得到融合特征矩阵/>

其中，W_ij为所述原始文本嵌入矩阵中的第j个单词嵌入。

2.如权利要求1所述的抑郁风险检测模型训练方法，其特征在于，所述将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果包括：

3.如权利要求2所述的抑郁风险检测模型训练方法，其特征在于，将池化层输出的的三个池化结果进行拼接，得到基于情感交互的抑郁症文档向量表示包括：

采用如下公式确定基于情感交互的抑郁症文档向量表示：

4.如权利要求1至3任一项所述的抑郁风险检测模型训练方法，其特征在于，所述根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型包括：

采用半监督学习的方式欠采样处理和迭代训练，并采用droupout正则化方法进行拟合，在达到预设训练条件时，得到所述训练好的抑郁风险检测模型。

5.一种抑郁症状预警方法，其特征在于，所述抑郁症状预警方法包括：

从社交平台爬取用户发文信息；

对所述发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果，其中，所述训练好的抑郁风险检测模型根据权利要求1至4任一项所述的抑郁风险检测模型训练方法得到；

6.一种抑郁风险检测模型训练装置，其特征在于，所述抑郁风险检测模型训练装置包括：

模型训练模块，用于将所述融合特征矩阵输入到初始抑郁风险检测模型进行识别训练，得到识别结果，并根据所述识别结果，对模型参数进行迭代优化，得到训练好的抑郁风险检测模型，其中，所述初始抑郁风险检测模型为双向深度网络；

其中，所述矩阵融合模块包括：

其中，W_ij为所述原始文本嵌入矩阵中的第j个单词嵌入。

7.如权利要求6所述的抑郁风险检测模型训练装置，其特征在于，所述模型训练模块包括：

8.一种抑郁症状预警装置，其特征在于，包括：

数据采集模块，用于从社交平台爬取用户发文信息；

症状预测模块，用于对所述发文信息进行数据预处理，并将预处理后的数据输入到训练好的抑郁风险检测模型，得到抑郁症状检测结果，其中，所述训练好的抑郁风险检测模型根据权利要求1至4任一项所述的抑郁风险检测模型训练方法得到；

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的抑郁风险检测模型训练方法，或者，所述处理器执行所述计算机程序时实现如权利要求5所述的抑郁症状预警方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的抑郁风险检测模型训练方法，或者，所述计算机程序被处理器执行时实现实现如权利要求5所述的抑郁症状预警方法。