CN116153496A

CN116153496A - 神经网络模型训练方法和抑郁情绪检测方法

Info

Publication number: CN116153496A
Application number: CN202211536540.2A
Authority: CN
Inventors: 胡斌; 李泽鹏; 安正一; 周嘉炜; 程文川
Original assignee: Lanzhou University
Current assignee: Lanzhou University
Priority date: 2022-12-01
Filing date: 2022-12-01
Publication date: 2023-05-23

Abstract

本申请实施例提供了一种神经网络模型训练方法和抑郁情绪检测方法，该方法包括：获取目标用户的目标社交媒体数据和用户标签；目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户；从目标社交媒体数据中提取目标用户的社交特征信息；将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果；基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。本申请基于真实的目标社交媒体数据，通过预先提取社交特征信息的方式，使得模型可以充分且有效地学习社交媒体数据中所隐藏的真实情绪信息，从而提高抑郁情绪的检测检测效率。

Description

神经网络模型训练方法和抑郁情绪检测方法

技术领域

本申请涉及机器学习技术领域，尤其涉及一种神经网络模型训练方法和抑郁情绪检测方法。

背景技术

抑郁症(Depression)是躁狂抑郁症的一种发作形式，以情感低落、思维迟缓和言语动作减少/迟缓为典型症状。抑郁症的临床诊断主要依靠问卷调查或量表，但有些抑郁症患者在填写过程中会隐瞒自己的真实情绪和想法，导致诊断结果可靠性较低。

随着互联网的发展，社交媒体的规模不断扩大。微博、推特、脸书等社交媒体平台上，每天都有数以亿计的用户分享自己的思想观点和生活状态，其中往往蕴含较为丰富的情感信息。相较于临床诊断中依靠问卷和量表的方式，抑郁症患者更倾向于在社交媒体平台上表达自己内心的真实情绪，这些公开且真实的数据可以用于分析发帖者的情感状态，以辅助进行抑郁症倾向检测。

然而，中文的表达方式是丰富多元的，根据发帖者在社交媒体平台上发布的文本分析用户的情感状态，可能无法获取用户隐藏的真实情绪，进而影响抑郁情绪检测结果的准确度。

发明内容

本申请提供了一种神经网络模型训练方法和抑郁情绪检测方法，能够采用目标用户的发帖文本和/或发帖图片，以及预先提取得到社交特征信息，训练初始神经网络模型，使得模型可以充分学习抑郁情绪的表现特征，从而提高抑郁情绪检测效率和精度。

第一方面，本申请提供一种神经网络模型训练方法，该方法包括：

获取目标用户的目标社交媒体数据和用户标签；目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户，目标社交媒体数据包括目标用户的社交人群信息和目标用户在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片，用户标签用于指示目标用户是否存在抑郁情绪；

从目标社交媒体数据中提取目标用户的社交特征信息；

将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果；情绪检测结果用于指示目标用户是否存在抑郁情绪；

基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。

在一种可能的实现方式中，社交特征信息包括发帖词向量、发帖时间向量和社交向量；

则从目标社交媒体数据中提取目标用户的社交特征信息，包括：

基于预设的抑郁情感词典，从目标用户的发帖文本中提取发帖词向量；

根据多条发帖数据的发帖时间，获取目标用户的发帖时间向量；

根据目标用户的社交人群信息和多条发帖数据的传播信息，获取目标用户的社交向量。

在一种可能的实现方式中，初始神经网络模型包括图片识别网络、文本识别网络和辅助信息识别网络；

将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果，包括：

将目标社交媒体数据中的发帖图片输入至图片识别网络中，获取目标用户的图片特征向量；

将目标社交媒体数据中的发帖文本输入至文本识别网络中，获取目标用户的文本特征向量；

将社交特征信息输入至辅助信息识别网络中，获取目标用户的辅助特征向量；

根据图片特征向量、文本特征向量和辅助特征向量，获取情绪检测结果。

在一种可能的实现方式中，若目标社交媒体数据中包括多张发帖图片，则将目标社交媒体数据中的发帖图片输入至图片识别网络中，获取目标用户的图片特征向量，包括：

将多张发帖图片依次输入至图片识别网络中，获取各发帖图片的初始特征向量；

基于预设的注意力机制，获取各初始特征向量分别对应的第一注意力权重；

根据各初始特征向量和各第一注意力权重，获取目标用户的图片特征向量。

在一种可能的实现方式中，将社交特征信息输入至辅助信息识别网络中，获取目标用户的辅助特征向量，包括：

将发帖词向量、发帖时间向量和社交向量分别映射到目标特征空间，得到目标发帖词向量、目标发帖时间向量和目标社交向量；

基于预设的注意力机制，获取目标发帖词向量对应的第二注意力权重、目标发帖时间向量对应的第三注意力权重，以及目标社交向量对应的第四注意力权重；

根据目标发帖词向量和第二注意力权重、目标发帖时间向量和第三注意力权重，以及目标社交向量和第四注意力权重，获取目标用户的辅助特征向量。

在一种可能的实现方式中，根据图片特征向量、文本特征向量和辅助特征向量，获取情绪检测结果，包括：

基于预设的注意力机制，获取图片特征向量对应的第五注意力权重、文本特征向量对应的第六注意力权重，以及辅助特征向量对应的第七注意力权重；

根据图片特征向量和第五注意力权重、文本特征向量和第六注意力权重，以及辅助特征向量和第七注意力权重，获取目标用户的用户特征向量；

根据用户特征向量，评估目标用户是否存在抑郁情绪，得到情绪检测结果。

在一种可能的实现方式中，在从目标社交媒体数据中提取目标用户的社交特征信息之前，该方法包括：

根据发帖图片的数量对目标用户进行排序，得到多个第一用户对应的抑郁用户序列和多个第二用户对应的非抑郁用户序列；

基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取多个数据调整对；每个数据调整对包括抑郁用户序列中一个第一用户和非抑郁用户序列中一个第二用户；

针对任一个数据调整对，基于第三用户的发帖图片的数量，删除第四用户的发帖图片，直至第三用户和第四用户的发帖图片的数量相同；在一个数据调整对中，第三用户的发帖图片的数量少于第四用户的发帖图片的数量。

在一种可能的实现方式中，若目标用户中第一用户和第二用户的数目不同，则该方法还包括：

基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取至少一个第五用户；第五用户包括抑郁用户序列和非抑郁用户序列中未组成数据调整对的至少一个用户；

若第五用户的发帖图片数量大于第一图片阈值，则对第五用户的发帖图片进行删除操作，直至第五用户的发帖图片数量等于第二图片阈值。

在一种可能的实现方式中，获取目标用户的社交媒体数据，包括：

获取目标用户的原始社交媒体数据；

对原始社交媒体数据进行数据预处理，得到目标社交媒体数据；数据预处理包括文本内容删减操作和图片标准化处理。

第二方面，本申请提供了一种抑郁情绪检测方法，该方法包括：

获取待检者的社交媒体数据；社交媒体数据包括待检者的社交人群信息和待检者在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片；

从社交媒体数据中提取待检者的社交特征信息；

将社交媒体数据和社交特征信息输入至上述第一方面中任一项所示的神经网络模型中，通过神经网络模型获取待检者的情绪检测结果；情绪检测结果用于指示待检者是否存在抑郁情绪。

第三方面，本申请提供了一种神经网络模型训练装置，该装置包括：

训练数据获取模块，用于获取目标用户的目标社交媒体数据和用户标签；目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户，目标社交媒体数据包括目标用户的社交人群信息和目标用户在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片，用户标签用于指示目标用户是否存在抑郁情绪；

特征提取模块，用于从目标社交媒体数据中提取目标用户的社交特征信息；

情绪检测模块，用于将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果，情绪检测结果用于指示目标用户是否存在抑郁情绪；

模型训练模块，用于基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。

第四方面，本申请提供了一种抑郁情绪检测装置，该装置包括：

数据获取模块，用于获取待检者的社交媒体数据，社交媒体数据包括待检者的社交人群信息和待检者在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片；

特征提取模块，用于从社交媒体数据中提取待检者的社交特征信息；

情绪检测模块，用于将社交媒体数据和社交特征信息输入至上述第一方面中任一项所示的神经网络模型中，通过神经网络模型获取待检者的情绪检测结果；情绪检测结果用于指示目标用户是否存在抑郁情绪。

第五方面，本申请提供了一种计算机设备，该设备包括存储器和处理器，存储器存储有计算机程序，处理器执行该计算机程序时实现上述第一方面所示的神经网络模型训练方法的步骤，或者，上述第二方面所示的抑郁情绪检测方法的步骤。

第六方面，本申请提供了一种计算机存储介质，该计算机存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述第一方面所示的神经网络模型训练方法的步骤，或者，上述第二方面所示的抑郁情绪检测方法的步骤。

第七方面，本申请提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序被处理器执行时实现上述第一方面所示的神经网络模型训练方法的步骤，或者，上述第二方面所示的抑郁情绪检测方法的步骤。

本申请实施例提供的技术方案至少可以达到以下有益效果：

本申请提供了一种神经网络模型训练方法和抑郁情绪检测方法，通过获取目标用户的目标社交媒体数据和用户标签；并从目标社交媒体数据中提取目标用户的社交特征信息。然后，将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果。进而基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。也即是，本申请采用深度学习的方式，通过训练神经网络模型来实现抑郁情绪检测，以提高抑郁情绪检测效率。在训练神经网络模型时，针对目标用户真实且原始的目标社交媒体数据，通过预先提取社交特征信息的方式，提取出可以辅助进行抑郁情绪学习的特征。如此，通过目标社交媒体数据和社交特征信息对初始神经网络模型进行训练，可以提高模型的训练效率，使得模型可以充分且有效地学习用户在社交媒体数据中所隐藏的情绪信息，从而提高抑郁情绪的检测检测效率和检测结果的准确度。

附图说明

图1是本申请一示例性实施例示出的一种抑郁情绪检测系统的架构图；

图2是本申请一示例性实施例示出的一种计算机设备的结构示意图；

图3是本申请一示例性实施例示出的一种神经网络模型训练方法的流程示意图；

图4是本申请一示例性实施例示出的一种获取目标社交媒体数据的流程示意图；

图5是本申请一示例性实施例示出的一种用户发帖图片数量分布示意图；

图6是本申请一示例性实施例示出的一种数据分布归一化处理流程示意图；

图7是本申请一示例性实施例示出的另一种用户发帖图片数量分布示意图；

图8是本申请一示例性实施例示出的一种情绪检测的流程示意图；

图9是本申请一示例性实施例示出的一种基于初始神经网络模型的情绪检测流程示意图；

图10是本申请一示例性实施例示出的一种抑郁情绪检测方法的流程示意图；

图11是本申请一示例性实施例示出的一种神经网络模型训练装置的结构示意图；

图12是本申请一示例性实施例示出的一种抑郁情绪检测装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案及优点更加清楚明白，下面将结合附图及实施例，对本申请的技术方案做进一步详细说明。

在对本申请实施例提供的神经网络模型训练方法和抑郁情绪检测方法进行解释说明之前，先对本申请实施例的应用场景和实施环境进行介绍。

根据世界卫生组织(World Health Organization，WHO)的统计，截至2017年，全球有超过3亿人患有抑郁症，相当于世界人口的4.4％，抑郁症患者人数在10年间增加了18.04％，且抑郁症的发病出现低龄化趋势。相较于正常人，抑郁症患者更容易出现暴力伤害他人或自残、自杀等恶劣情况，给个人、家庭和社会经济发展带来严重影响。

关于抑郁症的临床诊断，主要依靠问卷调查或量表来实现情绪检测，从而由专业医师根据情绪检测结果，评估被测者患有抑郁症的可能性。然而，在填表过程中，患者可能会隐藏自己的深层想法和真实情绪，导致情绪检测结果存在偏差，从而影响最终的抑郁症诊断结果。

随着互联网的发展，社交媒体平台的种类和规模也在不断扩大。在微博、推特(Twitter)、脸书(Facebook)等社交媒体平台上，每天都有数以亿计的用户通过发帖来分享自身的观点和生活状态。这些发帖数据中包括文本、图片、视频、音频等，往往蕴含较为丰富的情感信息。

而且，相较于问卷和量表，抑郁症患者更倾向于在社交媒体平台中表达自己内心的真实感受。因此，这些公开且真实的社交媒体数据为抑郁情绪检测提供了新的角度，以及抑郁情绪检测所需的测试数据。

然而，相关技术中通过分析用户的社交媒体数据进行抑郁情绪检测，可能会存在一下至少一种问题：

(1)抑郁情绪检测以用户在社交媒体平台上发布的文本作为基础，从中分析用户的情感状态。但中文的表达方式更加丰富多元，单纯分析用户的发帖文本，可能无法获取用户通过言语表达所隐藏的真实情感，从而不能准确地识别出用户的抑郁情绪。

(2)抑郁用户可能仅会在一小部分发帖数据中表达自己的抑郁情绪，如果认为用户所有数据的重要性相同，就有可能忽略影响模型分类的重要信息，进而导致神经网络模型给出错误的预测结果。

而且，在训练数据为多模态数据时，若无法衡量某种模态数据对于整体分类效果的贡献程度，就无法根据信息贡献比重的大小自适应地调整模型，导致模型训练结果不佳。

(3)在用户分类任务中，不同类别用户的发帖数据量可能存在较大的差异，导致正负样本不均衡。比如，使用社交媒体数据进行抑郁情绪检测时，抑郁用户的发帖数量普遍少于非抑郁用户(也可以称为正常用户)。

基于此，本申请提供了一种神经网络模型训练方法和抑郁情绪检测方法，以基于有限的社交媒体数据，通过预先提取社交特征信息，并基于用户标签训练初始神经网络模型，使得训练好的神经网络模型可以同时处理多模态的社交媒体数据和提取的社交特征信息，对用户的抑郁情绪进行快速且精准地识别；同时，在同一模态数据内部和不同模态数据之间使用注意力机制，以根据不同模态数据的信息贡献比重大小自适应地调整模型；此外，还可以在训练前，对存在抑郁情绪的第一用户的社交媒体数据和不存在抑郁情绪的第二用户的社交媒体数据进行分布归一化处理，通过改变数据分布，减少正负样本数据分布差异，使模型学习到更多数据的特征，以进一步提升模型性能。

在一个示例性实施例中，如图1所示，本申请提供的一种抑郁情绪检测系统的架构图。该系统包括至少一个社交平台110和抑郁情绪检测设备120，该抑郁情绪检测设备120可以为从各社交平台110获取用户的社交媒体数据，从而分析用户存在抑郁情绪的可能性，为抑郁症筛查/诊断提供了数据依据。

其中，社交平台可以包括存储数据的后台服务器或对应的云服务，抑郁情绪检测设备可以通过指定接口从各社交平台的后台服务器或云服务中读取用户的社交媒体数据，以进行抑郁情绪检测。

作为一个示例，社交平台包括微博、推特、脸书等任一供用户发表自身看法、记录日常、抒发情绪的公开平台，本申请实施例对此不做限制。

上述抑郁情绪检测设备120可以为任一具备数据计算、存储的计算机设备，该计算机设备可以为终端或服务器。其中，终端可以但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、便携式可穿戴设备等；服务器可以但不限于为至少一个独立服务器、分布式服务器、云服务器、服务器集群等。

应该理解的是，图1仅仅采用3个社交平台来对抑郁情绪检测系统进行举例说明。而且，当存在多个社交平时，涉及的社交媒体数据较多时，也可以增加抑郁情绪检测设备的数量，以提高多社交平台用户的抑郁情绪检测。本申请实施例对社交平台和抑郁情绪检测设备的数量不做限制。

此外，本申请实施例提供的抑郁情绪检测方法除了可以使用于社交媒体数据的分析检测以外，也可以应用于其他类型的用户数据的分析检测。

在一个示例性实施例中，如图2所示，本申请提供了一种计算机设备的结构示意图，该计算机设备200可以是图1中所示的抑郁情绪检测设备120。该计算机设备包括至少一个处理器210、通信总线220、存储器230以及至少一个通信接口240。

处理器210可以是一个通用中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)、微处理器、或者可以是一个或多个用于实现本申请方案的集成电路，例如，专用集成电路(Application-Specific Integrated Circuit，ASIC)，可编程逻辑器件(Programmable Logic Device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(Complex Programmable Logic Device，CPLD)，现场可编程逻辑门阵列(Field-Programmable Gate Array，FPGA)，通用阵列逻辑(Generic Array Logic，GAL)或其任意组合。

通信总线220用于在上述组件之间传送信息。通信总线220可以分为地址总线、数据总线、控制总线等。为便于表示，图2中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器230可以是只读存储器(Read-Only Memory，ROM)或可存储静态信息和指令的其它类型的静态存储设备，也可以是随机存取存储器(Random Access Memory，RAM)或者可存储信息和指令的其它类型的动态存储设备，还可以是电可擦可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。

可选地，存储器230可以是独立存在，并通过通信总线220与处理器210相连接；存储器230也可以和处理器210集成在一起。

通信接口240用于与其它设备或通信网络通信。通信接口240包括有线通信接口，还可以包括无线通信接口。其中，有线通信接口例如可以为以太网接口。以太网接口可以是光接口，电接口或其组合。无线通信接口可以为无线局域网(Wireless Local AreaNetworks，WLAN)接口、蜂窝网络通信接口或其组合等。

可选地，处理器210可以包括一个或多个CPU。计算机设备200可以包括多个处理器。这些处理器中的每一个可以是一个单核处理器(single-CPU)，也可以是一个多核处理器(multi-CPU)。

需要说明的是，这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。

在一些实施例中，计算机设备200还可以包括输出设备260和输入设备270(图中未示出)。输出设备260和处理器210通信，可以以多种方式来显示信息。例如，输出设备260可以是液晶显示器(Liquid Crystal Display，LCD)、发光二级管(Light Emitting Diode，LED)显示设备、阴极射线管(Cathode Ray Tube，CRT)显示设备或投影仪(projector)等。输入设备270和处理器210通信，可以以多种方式接收用户的输入。例如，输入设备270可以是鼠标、键盘、触摸屏设备或传感设备等。

在一些实施例中，存储器230用于存储执行本申请方案的计算机程序，处理器210可以执行存储器230中存储的计算机程序。例如，该计算机设备200可以通过处理器210以及存储器230中的计算机程序，来实现下文实施例提供的神经网络模型训练方法和抑郁情绪检测方法。

在一个示例性实施例中，如图3所示，本申请提供了一种神经网络模型训练方法，以该方法应用于上述图2所示的计算机设备200进行举例说明，该方法可以包括以下步骤：

步骤310：获取目标用户的目标社交媒体数据和用户标签。

其中，目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户，目标社交媒体数据包括目标用户的社交人群信息和目标用户在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片，用户标签用于指示目标用户是否存在抑郁情绪。

也即是，预先从至少一个社交平台中获取多个存在抑郁情绪的第一用户的社交人群信息和发帖数据，以及多个不存在抑郁情绪的第二用户的社交人群信息和发帖数据。

需要说明的是，每个用户均对应有自己的社交人群信息和发帖数据。

在一些实施例中，社交人群信息包括该用户的用户注册信息、关注用户、粉丝等，发帖数据包括发帖文本、发帖图片、发帖视频、发帖音频等中的一种或多种，本申请实施例对此不做限制。

在一种可能的实现方式中，如图4所示，步骤310的实现过程可以包括以下子步骤：

步骤301：获取目标用户的原始社交媒体数据。

需要说明的是，基于社交媒体数据的抑郁情绪检测任务往往面临缺少可用的公开数据集的问题，一个重要原因是担心泄露用户的隐私信息。而与抑郁情绪相关联的抑郁症话题的敏感性也进一步加剧了数据集的稀缺问题。

基于此，本申请以一种目标社交平台(比如新浪微博)为数据来源，构造了一个用于抑郁情绪检测研究的中文社交媒体数据集，并对所有可能泄漏个人隐私的内容进行了脱敏处理。

其中，新浪微博是新浪旗下的社交媒体平台，自2009年8月上线以来，新浪微博用户数量就一直保持着爆发式增长。2021年第四季度微博月活跃用户数达到5.73亿，同比增长10％，日活跃用户达到2.49亿，同比增长11％。

作为一个示例，在新浪微博中，具有称为“Super Topic”的子论坛功能，用户可以在某个特定子论坛中发表自己的看法。为了筛选具有潜在抑郁情绪倾向的用户，可以从“抑郁话题(即Depression SuperTopic)”的子论坛中获取2020年12月21日到2021年12月20日的所有文本数据，并采取人工标注的方式确定了2426名存在抑郁情绪的第一用户。

进一步地，从第一用户的个人主页中获取2020年12月21日到2021年12月20日的所有发帖文本和发帖图片，得到了167586条没有经过预处理的原始发帖文本和119812张发帖图片。

为了与存在抑郁情绪的第一用户进行对比，需要从新浪微博中随机选取了一部分用户，经过人工标注后得到2400名不存在抑郁情绪的第二用户作为对照组。同理，获取了相同时间范围内所有第二用户个人主页中共计366663条发帖文本和320458张发帖图片。

值得强调的是，上述目标社交平台的类型、第一用户和第二用户的数量，以及第一用户和第二用户的发帖文本数和发帖图片数可以根据实际需求设置，本申请实施例仅以上述具体数据进行举例，并不构成对本申请训练数据集中采样数值范围的限制。

在获取到第一用户和第二用户的原始社交媒体数据后，为构建初始神经网络模型的训练数据集，还需要进行数据标注，以确定各用户是否存在抑郁情绪，以此作为后续模型训练效果的判断依据。

具体地，对于第一用户和第二用户，可以采用人工标注的方式，由具有丰富经验的心理学专家来完成标注工作，以确定各用户的用户标签。其中，用户标签用户指示用户是否患有抑郁情绪。

也即是，对于某一用户，专家需要以所获取到的该用户的所有原始社交媒体数据作为依据，判断该用户是否存在抑郁情绪。

作为一个示例，在标注过程中，可以根据以下标准进行用户标注：

(1)存在抑郁情绪；

A1：用户在“Depression SuperTopic”话题中的某一条或几条发帖数据包含了明确的抑郁症确诊证明；

比如：“今天我被确诊为重度抑郁症”、“距离我确诊抑郁症已经一周了”等。

B1：用户的发帖数据中明确表达自己正在服用抗抑郁药物，或者接受抗抑郁治疗；

比如：“这次复诊医生给我开的是阿戈美拉汀”、“下个月我就要接受第一次无抽搐电休克治疗/改良电休克治疗(Modified Electroconvulsive Therapy，MECT)治疗了”等。

(2)不存在抑郁情绪；

A2：用户的所有发帖数据均没有任何与抑郁症相关的词语；

B2：发帖数据中出现抑郁症相关的词语，但没有足够证据表明用户存在抑郁情绪；

比如，用户对抑郁症相关的社会新闻进行客观的评价，或在分享的歌词或电影台词中出现了与抑郁情绪/抑郁症相关的关键词。

经过标注后，即可建立用户的原始社交媒体数据和用户标签之间的对应关系。下表1给出了部分标注后的用户标签和社交媒体数据的对应关系。

表1

此外，对于标注用户标签后的原始社交媒体数据，可以通过下述步骤303，对原始社交媒体数据进行数据预处理，以提高数据有效性。

步骤303：对原始社交媒体数据进行数据预处理，得到目标社交媒体数据。

其中，数据预处理包括文本内容删减操作和图片标准化操作。

作为一个示例，文本内容删减操作包括以下至少一种：

(1)删除原始社交媒体数据中携带的其他用户标识和资源访问链接；

以原始社交媒体数据为新浪微博中的发帖数据为例，由于新浪微博自身的特性，用户在使用新浪微博分享特定内容时；会出现自动生成微博帖子的情况，这些帖子应当被识别并删除。

具体地，可以预先筛选出这些自动生成微博帖子中所包含的关键词，进而利用这些关键词删除对应的发帖数据。若删除的发帖数据中存在对应的发帖图片，也一并删除。

同时，考虑到资源访问链接指向的内容可能与该用户的抑郁情绪检测过程影响较小，为减少无关信息对抑郁情绪检测结果的影响，可以删除发帖数据中出现的统一资源定位符(Uniform Resource Locator，URL)链接；同时，删除发帖数据中通过@符号提及的可能造成隐私泄露的内容。

可选地，还可以预先构建了行政区划列表，以此来匹配某些发帖数据中出现的用户当前地理位置信息，并对地理位置信息进行删除。

(2)删除原始社交媒体数据中的表情符号；

(3)删除原始社交媒体数据中的引用话题；

针对上述举例的原始社交媒体数据，删除发帖数据中出现“SuperTopic”或“话题”等标题词。

(4)删除原始社交媒体数据中字符数小于预设的发帖字符阈值的发帖文本；

应该理解的是，针对单条发帖数据，其内容越少，越不利于分析用户的真实情绪。因此，可以基于预设的发帖字符阈值，对各用户的原始社交媒体数据中的发帖文本进行精简处理。

其中，发帖字符阈值可以为预先设置的任意字符数，比如，4字符、10字符等。

可选地，对于一些用户，若其发帖数据很少，则根据其发帖数据分析用户情绪的准确度越低。因此，可以基于预设的数据样本阈值，对选择出来的用户进行筛选，以从中剔除发帖数据量过少的用户。

因此，上述数据预处理还包括：删除发帖数据量小于预设的数据样本阈值的原始社交媒体数据。

其中，数据样本阈值可以为预先设置的任意字符数，比如，5条发帖数据、10条发帖数据、20条发帖数据等。

进一步地，由于本申请是采用神经网络模型来分析和处理用户的社交媒体数据，对于社交媒体数据中的发帖图片，其尺寸大小必须满足图片识别网络的输入尺寸要求，该图片识别网络才可以对输入的发帖图片进行特征学习。

因此，对于社交媒体数据中的发帖图片，需要根据图片识别网络的输入参数要求，对发帖图片进行图片标准化操作。

具体地，对发帖图片的大小进行尺寸标准化处理，以使得裁剪调整后的图片尺寸可以满足图片识别网络的输入要求。

作为一个示例，本申请采用ResNet-18作为图片识别网络，为了符合ResNet-18网络的输入结构，需要将所有发帖图片的大小处理为224×224像素。

接上一个示例，对于从新浪微博中选择的2426名存在抑郁情绪的第一用户和2400名不存在抑郁情绪的第二用户，经过上述数据清洗处理后，最终得到了2299名存在抑郁情绪的第一用户对应的140863条发帖文本和对应的114078张发帖图片，以及2307名不存在抑郁情绪的正常的第二用户对应的311645条发帖文本和对应的303109张发帖图片。下表2展示了两组用户的发帖数据的统计信息。

表2

如此，对从社交平台中直接获取的目标用户(包括第一用户和第二用户)的原始社交媒体数据进行数据预处理过程中，通过文本内容删除操作，可以消除目标用户的发帖数据中的冗余特征和噪声；通过图片标准化操作对发帖图片的尺寸进行调整，可以提高模型输入数据的有效性。如此，预处理后的目标社交媒体数据，可以用于训练初始神经网络模型，提高模型的抑郁特征学习性能。

然而，由上表2可知，对于处理得到的目标社交媒体数据，虽然第一用户和第二用户的发帖数据准确度和有效性得到了提高，但第一用户和第二用户直接的数据并不均衡。若采用该目标社交媒体数据进行模型训练，可能导致模型学习抑郁情绪的表现信息量，与非抑郁情绪的表现信息量不同，使得模型学习了大量了反映非抑郁情绪的数据，可以对非抑郁情绪进行有效识别，但由于学习的反映抑郁情绪的数据较少，导致对部分抑郁情绪的表现信息无法进行精准识别。

进一步地，由于社交媒体数据中，第一用户和第二用户的发帖图片的数量差异过大，若使用目标用户的所有发帖图片进行分类，神经网络模型可能会通过图片数量这一特征直接得到分类结果。换言之，神经网络模型并没有真正学习到图片本身的特征，导致模型仅通过图片数量的差异进行分类。

通常，在调整数据分布时，会预先为目标用户的发帖图片数量设置一个目标图片阈值，进而，基于该目标图片阈值，对第一用户和第二用户的发帖图片进行适应性删除操作，以使得第一用户和第二用户的发帖图片数量均小于该目标图片阈值。

其中，目标图片阈值是预先设置的任意数值，比如，100张、130张等。

作为一个示例，参见图5，第一用户的发帖图片数量分布为实线a1，第二用户的发帖图片数量分布为虚线b1所示。在设置目标图片阈值后，基于目标图片阈值对第一用户和第二用户的发帖图片的数量进行适应性删除。

由于不存在抑郁情绪的第二用户的发帖图片数量普遍多于第一用户的发帖图片数量，因此，基于目标图片阈值调整数据分布后，第一用户的发帖图片数量分布变为直线a2，第二用户的发帖图片数量分布为虚线b2。

由图5可知，在目标图片阈值之前，第二用户的发帖图片数量均等于该目标图片阈值，而第一用户的发帖图片数量均小于该目标图片阈值。因此，在目标图片阈值之前，第一用户和第二用户的图片分布仍存在较大差异，会影响神经网络模型对图片注意力权重的计算。

基于此，本申请还提供了一种数据分布归一化处理方式，以调整第一用户和第二用户的发帖图片数量，使存在抑郁情绪的第一用户的发帖图片数量和不存在抑郁情绪的第二用户的发帖图片数量分布保持一致。

在一些实施例中，如图6所示，数据分布归一化处理包括以下步骤：

步骤305：根据发帖图片的数量对目标用户进行排序，得到多个第一用户对应的抑郁用户序列和多个第二用户对应的非抑郁用户序列。

在一种可能的实现方式中，可以基于发帖图片的数量从大到小的顺序，按照各第一用户的发帖图片数量，对多个第一用户进行排序，得到抑郁用户序列。同理，基于发帖图片的数量从大到小的顺序，按照各第二用户的发帖图片数量，对多个第二用户进行排序，得到非抑郁用户序列。

作为一个示例，第一用户包括用户A、用户B、用户C和用户D，且用户A的发帖图片数量为100，用户B的发帖图片数量为287，用户C的发帖图片数量为65，用户D的发帖图片数量为88，则得到抑郁用户序列为：用户B、用户A、用户D和用户C。

同理，第二用户包括包括用户E、用户F、用户G和用户H，且用户E的发帖图片数量为25，用户F的发帖图片数量为43，用户G的发帖图片数量为10，用户H的发帖图片数量为69，则得到非抑郁用户序列为：用户H、用户F、用户E和用户G。

另外，也可以基于发帖图片的数量从小到大的顺序，对多个第一用户和多个第二用户进行排序，得到抑郁用户序列和非抑郁用户序列。在此不再赘述。

需要说明的是，在该步骤305中，对于第一用户和第二用户，其采用的用户排序方式必须保持一致。即第一用户和第二用户的排序均采用发帖图片的数量从大到小的顺序，或者，第一用户和第二用户的排序均采用发帖图片的数量从小到大的顺序。如此，可以保证后续数据调整时，各数据调整对中的第一用户和第二用户位于同一调整层级。

步骤307：基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取多个数据调整对；每个数据调整对包括抑郁用户序列中一个第一用户和非抑郁用户序列中一个第二用户。

在一种可能的实现方式中，根据发帖图片数量递增的顺序，从抑郁用户序列中选择发帖图片数量最小的第一用户，从非抑郁用户序列中选择发帖图片数量最小的第二用户，组成第一个数据调整对；同理，从抑郁用户序列中选择发帖图片数量次小的第一用户，从非抑郁用户序列中选择发帖图片数量次小的第二用户，组成第二个数据调整对；以此类推，基于抑郁用户序列和非抑郁用户序列，组成多个数据调整对。其中，多个数据对中所包括的发帖图片数量依次增大。

在另一种可能的实现方式中，根据发帖图片数量递减的顺序，从抑郁用户序列中选择发帖图片数量最大的第一用户，从非抑郁用户序列中选择发帖图片数量最大的第二用户，组成第一个数据调整对；同理，从抑郁用户序列中选择发帖图片数量次大的第一用户，从非抑郁用户序列中选择发帖图片数量次大的第二用户，组成第二个数据调整对；以此类推，基于抑郁用户序列和非抑郁用户序列，组成多个数据调整对。其中，多个数据对中所包括的发帖图片数量依次减小。

应该理解的是，在第一用户和第二用户数目相同的情况下，抑郁用户序列和非抑郁用户序列中的用户可以完美组对，形成多个数据调整对。

对于通过上述步骤307组成的数据调整对，可以通过下述步骤309，对用户的发帖图片数量进行调整。

然而，在第一用户和第二用户的数目不同的情况下，在组成数据调整对时，必然存在落单的，无法组成数据调整对的第一用户或第二用户。基于此，上述步骤307后还可以包括以下处理步骤：基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取至少一个第五用户，该第五用户包括抑郁用户序列和非抑郁用户序列中未组成数据调整对的至少一个用户；若第五用户的发帖图片数量大于第一图片阈值，则对第五用户的发帖图片进行删除操作，直至第五用户的发帖图片数量等于第二图片阈值。

需要说明的是，这里的第五用户可能是抑郁用户序列中的落单的第一用户，也可以是非抑郁用户序列中落单的第二用户。

其中，第一图片阈值可以为发帖图片数量较少的某一类别用户所有发帖图片数量分布的中位数、平均数，或者中位数与平均数之间的中间值。

作为一个示例，若目标用户中多个存在抑郁情绪的第一用户的总体发帖图片数量，小于目标用户中多个不存在抑郁情绪的第二用户的总体发帖图片数量，则将多个第一用户的总体发帖图片数量的中位数、平均数，或者中位数与平均数之间的中间值，确定为第一图片阈值。

可选地，考虑到存在抑郁情绪的用户的发帖图片数量通常小于不存在抑郁情绪的用户的发帖图片数量，因此，可以直接根据多个第一用户的总体发帖图片数量，设置第一图片阈值。

其中，第二图片阈值可以为第五用户所属类别用户的整体发帖图片数量的中位数。

作为一个示例，若第五用户为抑郁用户序列中落单的第一用户，则将抑郁用户序列中多个第一用户的总体发帖图片数量的中位数，确定为第二图片阈值；若第五用户为非抑郁用户序列中落单的第二用户，则将非抑郁用户序列中多个第二用户的总体发帖图片数量的中位数，确定为第二图片阈值。

应该理解的是，若第五用户的发帖图片数量小于或等于第一图片阈值，则无需对第五用户的发帖图片进行删除操作。

需要说明的是，上述第一图片阈值和第二图片阈值可以相同，也可以不同，本申请实施例对此不做限制。

步骤309：针对任一个数据调整对，基于第三用户的发帖图片的数量，删除第四用户的发帖图片，直至第三用户和第四用户的发帖图片的数量相同；在一个数据调整对中，第三用户的发帖图片的数量少于第四用户的发帖图片的数量。

需要说明的是，针对一个数据调整对，其中包括一个抑郁用户序列中的第一用户和非抑郁用户序列中。此处的第三用户可以为一个数据调整对中所包括的第一用户(或第二用户)，第四用户为一个数据调整对中所包括的第二用户(或第一用户)，第三用户和第四用户是根据发帖图片的数量确定的。

具体地，在一个数据调整对中，第三用户为发帖图片数量相对较少的用户，第四用户为发帖数量相对较多的用户。

此外，若数据调整对中所包括的第一用户和第二用户的发帖图片数量相同，则无需确定第三用户和第四用户，也无需进行数据删除操作。也即是，该数据调整对中用户数据分布一致，无需调整。

如此，经过上述步骤309的操作，可以保证各数据调整对中第一用户和第二用户的发帖图片的数量分布一致。

对于上一个示例中表2所示的发帖图片情况，以及图5所示的发帖图片分布情况，通过本申请提供的数据分布归一化处理方式(参见上文中的步骤305-步骤309)，可以使得第一用户和第二用户的发帖图片数量分布保持一致。

作为一个示例，经过数据分布归一化处理后，如图7所示，第一用户的发帖图片数量和第二用户的发帖图片数量保持一致。

此外，在第一用户和第二用户按照发帖图片数量进行排序后，在选取数据调整对时，每次选出的第二用户的发帖图片数量普遍大于对应的第一用户的发帖图片数量。因此，在进行数据分布归一化处理时，还可以针对每个数据调整对，只对其中所包括的第二用户的发帖图片进行分布归一化处理，使得第一用户的发帖图片数量和第二用户的发帖图片数量保持一致。

作为一个示例，基于上述表2所示的第二用户的发帖数据，只对每个数据调整对中的第二用户进行数据分布归一化处理，表3给出使用分布归一化处理前后，第二用户的发帖图片的数量统计信息。

表3

发帖图片数据	数据分布归一化处理前	数据分布归一化处理后
			人均发帖图片量	131.39	49.50
中位数	61	14
			总发帖图片	303109	114078

由表3可知，数据分布归一化处理后，第二用户的人均发帖图片量(49.50)与表2中所示的第一用户的人均发帖图片量(49.62)近似相同，第一用户和第二用户的发帖图片数量分布趋于一致。

步骤320：从目标社交媒体数据中提取目标用户的社交特征信息。

相较于传统机器学习方法，深度学习方法最大的优势在于处理大规模数据时可以得到更高的精度，且不再需要手工提取特征，因此已经在多个领域得到了广泛应用。但也有研究表明，将手工特征融合到深度学习方法中有助于进一步提高分类性能。因此，本申请通过预先提取了多种社交特征信息，帮助进一步提升神经网络模型的抑郁情绪检测性能。

其中，社交特征信息包括发帖词向量、发帖时间向量和社交向量。发帖词向量用于描述目标用户的发帖数据中与抑郁情绪有关的关键词信息，发帖时间向量用于描述目标用户的发帖时间特征，社交向量用于描述目标用户在社交平台中的社交活动情况。

为便于后续说明，在此对目标用户的目标社交媒体数据和社交特征信息的表示方式进行说明。

对于目标用户U_i∈U，i＝1、2……N，在该用户的发帖数据中，发帖文本序列为

j＝1、2……M_i，发帖图片序列为/>

/>

其中，N表示目标用户的数量，M_i表示目标用户U_i发帖文本的数量，L_i表示目标用户U_i发帖图片的数量。目标用户的发帖词向量、发帖时间向量和社交向量分别表示为d_i、t_i和s_i。

在一种可能的实现方式中，步骤320的实现过程可以为：基于预设的抑郁情感词典，从目标用户的发帖文本中提取发帖词向量；根据多条发帖数据的发帖时间，获取目标用户的发帖时间向量；根据目标用户的社交人群信息和多条发帖数据的传播信息，获取目标用户的社交向量。

首先，目前已有一些工作结合情感词典进行抑郁症分类。其中，中文自杀词典共有2168个词语，分为13个类别。基于此中文自杀词典，本申请还人工筛选了21种抗抑郁药和153个与抑郁症状相关的词语，并将其加入该中文自杀词典，得到本申请所使用的抑郁情感词典。

进一步地，根据抑郁情感词典，从目标用户的所有发帖文本中提取一个13维的特征向量，得到目标用户的发帖词向量d_i。

其次，根据数据观察和分析，第一用户和第二用户的发帖时间也有一定的区别。存在抑郁情绪时，用户更倾向于在凌晨或深夜发帖，以表达自己的抑郁情绪。因此，可以将发帖时间作为一种抑郁情绪的判别特征。

具体地，将发帖时间分为6个时间段，为目标用户统计一个6维的发帖时间特征，得到目标用户的发帖时间向量t_i。

此外，目标用户的社交信息也可能有助于检测抑郁情绪。因此，可以将目标用户的社交信息作为社交特征信息的一部分，辅助进行模型训练。

其中，社交信息包括社交人群信息和传播信息。社交人群信息包括目标用户的关注用户量和粉丝量；传播信息包括发帖数据量、转发量、评论量、点赞量等。基于上述列举的六种信息，提取了一个6维的特征向量，得到目标用户的社交向量s_i。

作为一个示例，基于表2所示的发帖数据，下表4展示了存在抑郁情绪的第一用户和不存在抑郁情绪的第二用户之间的社交信息差异。

表4

目标社交媒体数据	第一用户	第二用户	差异率
				平均转发数	33.52	36.23	-7.48％
平均评论数	263.23	220.98	19.12％
				平均点赞数	386.19	239.09	61.52％
平均关注数	358.11	285.37	25.49％
				平均粉丝数	406.74	224.30	81.34％
人均发帖数	135.09	61.27	120.48％

其中，差异率＝(第二用户/第一用户-1)×100％。

如此，通过步骤320，对于每个目标用户，均提取该用户的发帖词向量、发帖时间向量和社交向量，以此作为社交特征信息，辅助进行模型训练。

需要说明的是，不论是第一用户还是第二用户，每个用户均对应一个发帖词向量、一个发帖时间向量和一个社交向量。换言之，对于任一用户，其社交特征信息均包括三个词向量，即发帖词向量、发帖时间向量和社交向量。

步骤330：将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果。

其中，情绪检测结果用于指示目标用户是否存在抑郁情绪。

在一些实施例中，可以将情绪检测视作一个二分类任务，即根据目标用户的社交媒体数据，预测目标用户是否存在抑郁情绪。比如，若目标用户的目标社交媒体数据中未反映出抑郁情绪，则初始神经网络模型输出的情绪检测结果应该为不存在抑郁情绪；若目标用户的目标社交媒体数据种反映出抑郁情绪，则初始神经网络模型输出的情绪检测结果应该为存在抑郁情绪。

为便于整体说明多模态数据的分析处理过程，假设目标社交媒体数据中包括发帖文本和发帖图片，则本申请使用了发帖文本、发帖图片、社交特征信息三种模态的数据进行模型训练。

应该理解的是，在实际应用中，目标用户的目标社交媒体数据中可能只包括发帖文本，或发帖图片，其处理过程与此相同，在此一并进行解释说明。

在一些实施例中，初始神经网络模型包括图片识别网络、文本识别网络和辅助信息识别网络，则如图8所示，上述步骤330的实现过程可以包括以下子步骤：

步骤331：将目标社交媒体数据中的发帖图片输入至图片识别网络中，获取目标用户的图片特征向量。

需要说明的是，基于上述三种模态的数据，具有抑郁情绪的用户可能不会在一种模态的数据种持续表现出自己的抑郁情绪，因此，找到明确表达了抑郁情绪的模态数据。更有助于神经网络模型进行分类预测。

基于此，本申请将注意力机制分别应用于发帖图片和社交特征信息中，通过注意力机制，使得神经网络模型能够更加关注对识别抑郁情绪有积极作用的信息。

若目标社交媒体数据中包括多张发帖图片，则不同的发帖图片中携带的信息量是不同的，因此，可以在多张发帖图片之间引入注意力机制，以提高图片特征向量的准确度。

在一种可能的实现方式中，则步骤331的实现过程可以为：将多张发帖图片依次输入至图片识别网络中，获取各发帖图片的初始特征向量；基于预设的注意力机制，获取各初始特征向量分别对应的第一注意力权重；根据各初始特征向量和各第一注意力权重，获取目标用户的图片特征向量。

作为一个示例，图片识别网络为ResNet-18，可以通过下述公式(1)提取各发帖图片的初始特征向量

然后，通过下述公式(2)将注意力机制应用在各初始特征向量之间，以获取目标用户的图片特征向量

其中，

表示目标用户U_i最终的图片特征向量，/>

表示每个发帖图片的的初始特征向量/>

的第一注意力权重。/>

该第一注意力权重可以通过下述公式(3)计算得到。

其中，W₁∈R^512×512，b₁∈R^1×512，表示图片识别网络中可训练的全连接层参数；k表示当前正在计算的一个发帖图片，k≤L。

步骤333：将目标社交媒体数据中的发帖文本输入至文本识别网络中，获取目标用户的文本特征向量。

在一种可能的实现方式中，将目标用户的所有发帖文本进行文本拼接，得到一条长文本；进一步地，通过文本识别网络从该长文本中提取文本特征向量。

作为一个示例，文本识别网络可以为基于文本的卷积神经网络(ConvolutionalNeural Networks，CNN)，简称为TextCNN。

其中，可以基于下述公式(4)，采用TextCNN提取文本特征向量

其中，

表示目标用户U_i最终的文本特征向量。

步骤335：将社交特征信息输入至辅助信息识别网络中，获取目标用户的辅助特征向量。

同理，由于社交特征信息包括发帖词向量、发帖时间向量和社交向量，因此，也可以在这多种向量之间使用注意力机制。

在一种可能的实现方式中，步骤335的实现过程可以为：将发帖词向量、发帖时间向量和社交向量分别映射到目标特征空间，得到目标发帖词向量、目标发帖时间向量和目标社交向量；基于预设的注意力机制，获取目标发帖词向量对应的第二注意力权重、目标发帖时间向量对应的第三注意力权重，以及目标社交向量对应的第四注意力权重；根据目标发帖词向量和第二注意力权重、目标发帖时间向量和第三注意力权重，以及目标社交向量和第四注意力权重，获取目标用户的辅助特征向量。

具体地，对于目标用户的发帖词向量d_i、发帖时间向量t_i和社交向量s_i，通过下述公式(5)-(7)分别使用全连接层将其映射到目标特征空间，得到目标发帖时间向量

目标发帖词向量/>

和目标社交向量/>

其中，W₂、W₃、W₄和b₂、b₃、b₄表示可训练的全连接层参数。

然后，通过下述公式(8)将注意力机制应用在目标发帖时间向量

目标发帖词向量/>

和目标社交向量/>

之间，以获取目标用户的辅助特征向量/>

/>

其中，

表示目标用户U_i的辅助特征向量，/>

表示三种辅助向量(即目标发帖时间向量/>

目标发帖词向量/>

和目标社交向量/>

)对应的注意力权重。

其中，各辅助向量对应的注意力权重可以通过下述公式(9)计算得到。

其中，W₅和b₅表示辅助信息识别网络中可训练的全连接层参数；a_k表示当前正在计算的一个辅助向量，a_m表示目标发帖时间向量

目标发帖词向量/>

和目标社交向量/>

中的任一个。

需要说明的是，初始神经网络模型中各网络对应不同的输入通道，因此，上述步骤331、步骤333和步骤335可以并行执行，将数据输入得到对应的输入通道中，通过对应的网络进行特征学习和提取。

步骤337：根据图片特征向量、文本特征向量和辅助特征向量，获取情绪检测结果。

由于不同模态数据的重要性可能不同，因此，本申请也可以将注意力机制应用于不同模态的数据之间。也即是，在图片特征向量、文本特征向量和辅助特征向量这三种特征向量之间使用注意力机制。

在一种可能的实现方式中，步骤337的实现过程可以为：基于预设的注意力机制，获取图片特征向量对应的第五注意力权重、文本特征向量对应的第六注意力权重，以及辅助特征向量对应的第七注意力权重；根据图片特征向量和第五注意力权重、文本特征向量和第六注意力权重，以及辅助特征向量和第七注意力权重，获取目标用户的用户特征向量；根据用户特征向量，评估目标用户是否存在抑郁情绪，得到情绪检测结果。

具体地，得到三种模态数据的特征向量，即图片特征向量

文本特征向量/>

和辅助特征向量/>

后，通过下述公式(10)再次使用注意力机制，以获取最终的用户特征向量。

其中，

表示目标用户U_i的用户特征向量，/>

表示三种特征向量(即图片特征向量

文本特征向量/>

和辅助特征向量/>

)对应的注意力权重。

其中，各特征向量对应的注意力权重可以通过下述公式(11)计算得到。

其中，W₆和b₆表示可训练的全连接层参数；e_k表示当前正在计算的一个特征向量，e_m表示图片特征向量

文本特征向量/>

和辅助特征向量/>

中的任一个。

最后，通过一个全连接层对

进行分类，通过下述公式(12)输出目标用户U_i的情绪检测结果。

其中，W₇和b₇表示为全连接层参数。

基于上述步骤330中所示的初始神经网络模型，作为一个示例，如图9所示，通过该初始神经网络模型输出用户的情绪检测结果的过程可以概述为：将用户的目标社交媒体数据和提取得到的社交特征信息，按照数据模态对应的输入通道，输入至对应的网络中。对于该用户的发帖图片，通过图片识别网络提取图片特征向量；对于该用户的发帖文本，通过文本识别网络提取文本特征向量；对于该用户的社交特征信息，通过辅助信息识别网络提取辅助特征向量。

其中，由于发帖图片中不同图片携带的情绪信息量是不同的，社交特征信息中各辅助向量对结果的影响也是不同的，因此，在发帖图片和社交特征信息中引入注意力机制，以提高模型的学习性能。

进一步地，在图片特征向量、文本特征向量和辅助特征向量三种不同的模态之间也引入注意力机制，最终输出该用户的情绪检测结果。

可选地，待初始神经网络模型训练好以后，神经网络模型输出的情绪检测结果还可以作为辅助信息，用于进行抑郁症筛查和诊断。

需要说明的是，在始神经网络模型训练阶段，图9中的用户可以为目标用户中的第一用户或第二用户；在神经网络模型训练好以后，图9中的用户可以为任一个需要进行抑郁情绪检测的待检者。换言之，不论是模型训练阶段，还是模型应用阶段，该神经网络模型的网络结构和数据处理流程是相同的。

步骤340：基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。

在一种可能的实现方式中，步骤340的实现过程可以为：在训练过程中，计算初始神经网络模型的训练损失；若训练损失在预设的训练轮次内不再降低，则确定初始神经网络模型训练完成，得到训练好的神经网络模型。

其中，训练损失是根据初始神经网络模型输出的情绪检测结果与用户标签之间的差值确定的，差值减小，则说明训练结果趋近于标注结果，即可结束训练。

作为一个示例，预设的训练轮次可以为任意数值，比如，10轮、20轮等。

具体地，初始神经网络模型的训练过程可以为：将目标社交媒体数据分为训练集和验证集，采用训练集中的目标社交媒体数据，分批输入到初始神经网络模型中，使得初始神经网络模型可以充分学习目标社交媒体数据中反映的情绪特征。在采用训练集训练一段时间/预设轮次后，采用验证集中的目标社交媒体数据检验初始神经网络模型的学习效果，计算训练损失。如此，采用训练集和验证集反复训练初始神经网络模型，直至验证集的损失连续多轮不再降低，则确定初始神经网络模型训练完成，得到训练好的神经网络模型。

其中，训练集和测试集中均包括多个存在抑郁情绪的第一用户的社交媒体数据和多个不存在抑郁情绪的第二用户的社交媒体数据，两个集合中第一用户和第二用户的数量可以相同，也可以不同，本申请实施例对此不做限制。

可选地，还可以从至少一个社交平台中另取一些用户的社交媒体数据，作为测试集，对神经网络模型输出的情绪检测结果的精确度进行测试，在测试结果满足要求的情况下，训练好的神经网络模型可以在实际场景中辅助进行抑郁症诊断/筛查。

综上，在本申请实施例中，针对抑郁情绪检测，由于缺乏特定领域的训练数据集，本申请基于社交平台中已有的用户数据，构造了一个用于抑郁情绪检测研究的训练神经网络模型的中文社交媒体数据集。其次，不同类别用户的发帖数据量可能存在较大差异，本申请在构建模型的训练数据集时，对存在抑郁情绪的第一用户的社交媒体数据和不存在抑郁情绪的第二用户的社交媒体数据进行分布归一化处理，通过改变数据分布，减少正负样本数据分布差异，使模型学习到更多数据的特征，以进一步提升模型性能。此外，通过预先提取社交特征信息，并基于用户标签训练初始神经网络模型，使得训练好的神经网络模型可以同时处理多模态的社交媒体数据和提取的社交特征信息，对用户的抑郁情绪进行快速且精准地识别；同时，在同一模态数据内部和不同模态数据之间使用注意力机制，以根据不同模态数据的信息贡献比重大小自适应地调整模型，筛选模态内和模态间对抑郁情绪识别有重要作用的信息，从而提高抑郁情绪检测结果的准确度。

基于上述训练得到的神经网络模型，在一个示例性实施例中，如图10所示，本申请还提供了一种抑郁情绪检测方法，同样以应用于上述图2所示的计算机设备200进行举例说明，该方法可以包括以下步骤：

步骤1010：获取待检者的社交媒体数据。

其中，社交媒体数据包括待检者的社交人群信息和待检者在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片。

步骤1020：从社交媒体数据中提取待检者的社交特征信息。

其中，步骤1020的实现过程和有益效果与上文实施例中步骤320类似，可以参见上述步骤320的具体解释说明，在此不再赘述。

步骤1030：将社交媒体数据和社交特征信息输入至训练好的神经网络模型中，通过神经网络模型获取待检者的情绪检测结果。

其中，神经网络模型是通过本申请提供的目标社交媒体数据，以及神经网络模型训练方法得到的，可以通过分析待检者的社交媒体数据和社交特征信息，预测待检者是否存在抑郁情绪。

需要说明的是，关于神经网络模型的训练过程，可以参见上文示出的神经网络模型训练方法的具体解释说明，在此不再赘述。

在该步骤1030中，神经网络模型输出的情绪检测检测结果用于指示待检者是否存在抑郁情绪。

可选地，在确定待检者是否存在抑郁情绪后，还可以据此进一步评估待检者患有抑郁症的可能性，以完成抑郁症的筛查。

在本申请实施例中，采用深度学习的方式，通过训练好的神经网络模型来实现抑郁情绪检测，以提高抑郁情绪检测效率。而且，针对待检者真实的社交媒体数据，通过预先提取社交特征信息的方式，提取出可以辅助模型进行抑郁情绪识别的特征。如此，训练好的神经网络模型可以通过社交媒体数据和社交特征信息，分析待检者在社交媒体数据中所隐藏的情绪信息，从而对待检者的抑郁情绪进行准确识别和有效检测，提高了抑郁情绪检测结果的准确度。

基于上述神经网络模型训练方法，采用相同的技术构思，如图11所示，本申请实施例还提供了一种用于实现上述神经网络模型训练方法所对应的神经网络模型训练装置；同理，基于上述抑郁情绪检测方法，采用相同的技术构思，如图12所示，本申请实施例还提供了一种用于实现上述抑郁情绪检测方法所对应的抑郁情绪识别装置。

在一示例性实施例中，如图11所示，本申请实施例还提供了一种神经网络模型训练装置，该装置1100包括：

训练数据获取模块1110，用于获取目标用户的目标社交媒体数据和用户标签；目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户，目标社交媒体数据包括目标用户的社交人群信息和目标用户在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片，用户标签用于指示目标用户是否存在抑郁情绪；

特征提取模块1120，用于从目标社交媒体数据中提取目标用户的社交特征信息；

情绪检测模块1130，用于将目标社交媒体数据和社交特征信息输入至待训练的初始神经网络模型中，获取初始神经网络模型输出的情绪检测结果，情绪检测结果用于指示目标用户是否存在抑郁情绪；

模型训练模块1140，用于基于情绪检测结果与用户标签，对初始神经网络模型进行训练，得到训练后的神经网络模型。

则特征提取模块1120，包括：

第一向量提取单元，用于基于预设的抑郁情感词典，从目标用户的发帖文本中提取发帖词向量；

第二向量提取单元，用于根据多条发帖数据的发帖时间，获取目标用户的发帖时间向量；

第三向量提取单元，用于根据目标用户的社交人群信息和多条发帖数据的传播信息，获取目标用户的社交向量。

情绪检测模块1130，包括：

第一特征提取单元，用于将目标社交媒体数据中的发帖图片输入至图片识别网络中，获取目标用户的图片特征向量；

第二特征提取单元，用于将目标社交媒体数据中的发帖文本输入至文本识别网络中，获取目标用户的文本特征向量；

第三特征提取单元，用于将社交特征信息输入至辅助信息识别网络中，获取目标用户的辅助特征向量；

情绪检测单元，用于根据图片特征向量、文本特征向量和辅助特征向量，获取情绪检测结果。

在一种可能的实现方式中，若目标社交媒体数据中包括多张发帖图片，则第一特征提取单元，具体用于：

在一种可能的实现方式中，第三特征提取单元，具体用于：

在一种可能的实现方式中，情绪检测单元，具体用于：

在一种可能的实现方式中，在从目标社交媒体数据中提取目标用户的社交特征信息之前，该装置1100包括：

数据排序模块，用于根据发帖图片的数量对目标用户进行排序，得到多个第一用户对应的抑郁用户序列和多个第二用户对应的非抑郁用户序列；

数据对获取模块，用于基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取多个数据调整对；每个数据调整对包括抑郁用户序列中一个第一用户和非抑郁用户序列中一个第二用户；

第一数据调整模块，用于针对任一个数据调整对，基于第三用户的发帖图片的数量，删除第四用户的发帖图片，直至第三用户和第四用户的发帖图片的数量相同；在一个数据调整对中，第三用户的发帖图片的数量少于第四用户的发帖图片的数量。

在一种可能的实现方式中，若目标用户中第一用户和第二用户的数目不同，则该装置1100还包括：

用户筛选模块，用于基于发帖图片数量递增或递减的顺序，从抑郁用户序列和非抑郁用户序列中获取至少一个第五用户；第五用户包括抑郁用户序列和非抑郁用户序列中未组成数据调整对的至少一个用户；

第二数据调整模块，用于若第五用户的发帖图片数量大于第一图片阈值，则对第五用户的发帖图片进行删除操作，直至第五用户的发帖图片数量等于第二图片阈值。

在一种可能的实现方式中，数据获取模块1100，包括：

数据获取单元，用于获取目标用户的原始社交媒体数据；

数据清洗单元，用于对原始社交媒体数据进行数据预处理，得到目标社交媒体数据；数据预处理包括文本内容删减操作和图片标准化操作。

应该理解的是，上述实施例提供的神经网络模型训练装置在训练初始神经网络模型时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

而且，上述实施例提供的神经网络模型训练装置与神经网络模型训练方法属于同一构思，其具体实现过程详见上文的方法实施例，这里不再赘述。

在一示例性实施例中，如图12所示，本申请实施例还提供了一种抑郁情绪检测装置，该装置1200包括：

数据获取模块1210，用于获取待检者的社交媒体数据，社交媒体数据包括待检者的社交人群信息和待检者在至少一个社交平台发布的多条发帖数据，各发帖数据包括发帖文本和/或发帖图片；

特征提取模块1220，用于从社交媒体数据中提取待检者的社交特征信息；

情绪检测模块1230，用于将社交媒体数据和社交特征信息输入至训练好的神经网络模型中，通过神经网络模型获取待检者的情绪检测结果；情绪检测结果用于指示目标用户是否存在抑郁情绪。

需要说明的是，神经网络模型是通过本申请提供的目标社交媒体数据，以及神经网络模型训练方法得到的，可以通过分析待检者的社交媒体数据和社交特征信息，预测待检者是否存在抑郁情绪。关于神经网络模型的训练过程，可以参见上文示出的神经网络模型训练方法的具体解释说明，在此不再赘述。

应该理解的是，上述实施例提供的抑郁情绪检测装置在进行抑郁情绪检测时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

而且，上述实施例提供的抑郁情绪检测装置与抑郁情绪检测方法属于同一构思，其具体实现过程详见上文的方法实施例，这里不再赘述。

应该理解的是，本申请实施例可以全部或部分地通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括计算机程序。在计算机设备上加载和运行该计算机程序时，全部或部分地产生按照本申请实施例所示的流程或功能。

其中，计算机程序可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机程序可以从一个网站站点、终端、服务器或数据中心通过有线或无线方式向另一个网站站点、终端、服务器或数据中心进行传输。

该计算机可读存储介质可以是计算机设备能够存取的任何可用介质，或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。

应该理解的是，以上仅为本申请实施例的具体实施方式而已，并不用于限定本申请实施例的保护范围。凡在本申请实施例的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本申请实施例的保护范围之内。

Claims

1.一种神经网络模型训练方法，其特征在于，包括：

获取目标用户的目标社交媒体数据和用户标签；所述目标用户包括多个存在抑郁情绪的第一用户和多个不存在抑郁情绪的第二用户，所述目标社交媒体数据包括目标用户的社交人群信息和所述目标用户在至少一个社交平台发布的多条发帖数据，各所述发帖数据包括发帖文本和/或发帖图片，所述用户标签用于指示所述目标用户是否存在抑郁情绪；

从所述目标社交媒体数据中提取所述目标用户的社交特征信息；

将所述目标社交媒体数据和所述社交特征信息输入至待训练的初始神经网络模型中，获取所述初始神经网络模型输出的情绪检测结果；所述情绪检测结果用于指示所述目标用户是否存在抑郁情绪；

基于所述情绪检测结果与所述用户标签，对所述初始神经网络模型进行训练，得到训练后的神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述社交特征信息包括发帖词向量、发帖时间向量和社交向量；

则所述从所述目标社交媒体数据中提取所述目标用户的社交特征信息，包括：

基于预设的抑郁情感词典，从所述目标用户的发帖文本中提取发帖词向量；

根据所述多条发帖数据的发帖时间，获取所述目标用户的发帖时间向量；

根据所述目标用户的社交人群信息和所述多条发帖数据的传播信息，获取所述目标用户的社交向量。

3.根据权利要求1或2所述的方法，其特征在于，所述初始神经网络模型包括图片识别网络、文本识别网络和辅助信息识别网络；

所述将所述目标社交媒体数据和所述社交特征信息输入至待训练的初始神经网络模型中，获取所述初始神经网络模型输出的情绪检测结果，包括：

将所述目标社交媒体数据中的发帖图片输入至所述图片识别网络中，获取所述目标用户的图片特征向量；

将所述目标社交媒体数据中的发帖文本输入至所述文本识别网络中，获取所述目标用户的文本特征向量；

将所述社交特征信息输入至所述辅助信息识别网络中，获取所述目标用户的辅助特征向量；

根据所述图片特征向量、所述文本特征向量和所述辅助特征向量，获取所述情绪检测结果。

4.根据权利要求3所述的方法，其特征在于，若所述目标社交媒体数据中包括多张发帖图片，则所述将所述目标社交媒体数据中的发帖图片输入至所述图片识别网络中，获取所述目标用户的图片特征向量，包括：

将所述多张发帖图片依次输入至所述图片识别网络中，获取各所述发帖图片的初始特征向量；

基于预设的注意力机制，获取各所述初始特征向量分别对应的第一注意力权重；

根据各所述初始特征向量和各所述第一注意力权重，获取所述目标用户的图片特征向量。

5.根据权利要求3所述的方法，其特征在于，所述将所述社交特征信息输入至所述辅助信息识别网络中，获取所述目标用户的辅助特征向量，包括：

将所述发帖词向量、所述发帖时间向量和所述社交向量分别映射到目标特征空间，得到目标发帖词向量、目标发帖时间向量和目标社交向量；

基于预设的注意力机制，获取所述目标发帖词向量对应的第二注意力权重、所述目标发帖时间向量对应的第三注意力权重，以及所述目标社交向量对应的第四注意力权重；

根据所述目标发帖词向量和所述第二注意力权重、所述目标发帖时间向量和所述第三注意力权重，以及所述目标社交向量和所述第四注意力权重，获取所述目标用户的辅助特征向量。

6.根据权利要求3所述的方法，其特征在于，所述根据所述图片特征向量、所述文本特征向量和所述辅助特征向量，获取所述情绪检测结果，包括：

基于预设的注意力机制，获取所述图片特征向量对应的第五注意力权重、所述文本特征向量对应的第六注意力权重，以及所述辅助特征向量对应的第七注意力权重；

根据所述图片特征向量和第五注意力权重、所述文本特征向量和所述第六注意力权重，以及所述辅助特征向量和第七注意力权重，获取所述目标用户的用户特征向量；

根据所述用户特征向量，评估所述目标用户是否存在抑郁情绪，得到所述情绪检测结果。

7.根据权利要求1或2所述的方法，其特征在于，在所述从所述目标社交媒体数据中提取所述目标用户的社交特征信息之前，所述方法包括：

根据发帖图片的数量对所述目标用户进行排序，得到所述多个第一用户对应的抑郁用户序列和所述多个第二用户对应的非抑郁用户序列；

基于发帖图片数量递增或递减的顺序，从所述抑郁用户序列和所述非抑郁用户序列中获取多个数据调整对；每个所述数据调整对包括所述抑郁用户序列中一个第一用户和所述非抑郁用户序列中一个第二用户；

针对任一个所述数据调整对，基于第三用户的发帖图片的数量，删除第四用户的发帖图片，直至所述第三用户和所述第四用户的发帖图片的数量相同；在一个所述数据调整对中，所述第三用户的发帖图片的数量少于所述第四用户的发帖图片的数量。

8.根据权利要求7所述的方法，其特征在于，若所述目标用户中所述第一用户和所述第二用户的数目不同，则所述方法还包括：

基于发帖图片数量递增或递减的顺序，从所述抑郁用户序列和所述非抑郁用户序列中获取至少一个第五用户；所述第五用户包括所述抑郁用户序列和所述非抑郁用户序列中未组成所述数据调整对的至少一个用户；

若所述第五用户的发帖图片数量大于第一图片阈值，则对所述第五用户的发帖图片进行删除操作，直至所述第五用户的发帖图片数量等于第二图片阈值。

9.根据权利要求1或2所述的方法，其特征在于，所述获取目标用户的社交媒体数据，包括：

获取所述目标用户的原始社交媒体数据；

对所述原始社交媒体数据进行数据预处理，得到所述目标社交媒体数据；所述数据预处理包括文本内容删减操作和图片标准化操作。

10.一种抑郁情绪检测方法，其特征在于，包括：

获取待检者的社交媒体数据；所述社交媒体数据包括所述待检者的社交人群信息和所述待检者在至少一个社交平台发布的多条发帖数据，各所述发帖数据包括发帖文本和/或发帖图片；

从所述社交媒体数据中提取所述待检者的社交特征信息；

将所述社交媒体数据和所述社交特征信息输入至上述权利要求1至9中任一项所述的神经网络模型中，通过所述神经网络模型获取所述待检者的情绪检测结果；所述情绪检测结果用于指示所述待检者是否存在抑郁情绪。