CN113221560B - 人格特质和情绪的预测方法、装置、计算机设备及介质 - Google Patents
人格特质和情绪的预测方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN113221560B CN113221560B CN202110606779.1A CN202110606779A CN113221560B CN 113221560 B CN113221560 B CN 113221560B CN 202110606779 A CN202110606779 A CN 202110606779A CN 113221560 B CN113221560 B CN 113221560B
- Authority
- CN
- China
- Prior art keywords
- text data
- feature information
- training text
- sub
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 258
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 452
- 238000009826 distribution Methods 0.000 claims abstract description 246
- 238000003062 neural network model Methods 0.000 claims abstract description 113
- 238000012545 processing Methods 0.000 claims description 68
- 230000006870 function Effects 0.000 claims description 66
- 230000015654 memory Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 12
- 230000036651 mood Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000011176 pooling Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010028813 Nausea Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例公开了一种人格特质和情绪的预测方法、装置、计算机设备及介质,应用于人工智能技术领域。其中方法包括:对第一训练文本数据添加人格特质标签,对第二训练文本数据添加情绪标签,将添加人格特质标签的第一训练文本数据和添加情绪标签的第二训练文本数据输入神经网络模型得到分类结果,根据分类结果训练模型得到目标预测模型;将待预测文本数据输入目标预测模型,得到人格特质对应的第三目标概率分布和情绪对应的第四目标概率分布,根据第三目标概率分布确定目标人格特质,根据第四目标概率分布确定目标情绪。采用本申请实施例,可以提高预测准确性。本发明涉及区块链技术,如可将文本数据写入区块链中,以用于数据取证等场景。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种人格特质和情绪的预测方法、装置、计算机设备及介质。
背景技术
随着计算机技术的不断发展,深度学习相关技术越发成熟。目前,人们可以通过深度学习相关技术来对模型进行训练,以使训练得到的模型可以对个体的心理特征(例如人格特质或情绪)进行预测。现有的人格特质和情绪预测方法通常是通过先预测人格特质再推断情绪。然而,现有的预测方法没有很好的学习到多个预测任务之间的关联信息,进而导致模型对于人格特质或情绪的预测准确性不高。因此,如何在进行人格特质和情绪的预测过程中提高预测准确性成为了一个亟待解决的问题。
发明内容
本申请实施例提供了一种人格特质和情绪的预测方法、装置、计算机设备及介质,可以同时预测人格特质和情绪,并提高人格特质和情绪的预测准确性。
第一方面,本申请实施例提供了一种人格特质和情绪的预测方法,该方法包括:
获取第一训练样本集和第二训练样本集,所述第一训练样本集包括多个第一训练文本数据,所述第二训练集包括多个第二训练文本数据;
对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型,其中,所述分类结果包括所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及所述第二训练文本数据的情绪特质标签对应的第二目标概率分布;
获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
在一种可能的实施方式中,所述将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,包括:
将所述添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;以及,
将所述添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息;
根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一种可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述将添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息,包括:
利用所述第一嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第一向量表示;以及,
利用所述第二嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第二向量表示;
通过所述第一卷积层对所述第一向量表示进行卷积处理,得到第一子特征信息,以及通过所述第二卷积层对所述第二向量表示进行卷积处理,得到第二子特征信息;
根据所述第一子特征信息和所述第二子特征信息确定所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
在一种可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述将添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息,包括:
利用所述第一嵌入层对所述添加情绪标签后的每个第一训练文本数据进行量化处理,得到所述第二训练文本数据对应的第三向量表示;以及,
利用所述第二嵌入层对所述添加情绪标签后的每个第二训练文本数据进行量化处理,得到所述第二训练文本数据对应的第四向量表示;
通过所述第一卷积层对所述第三向量表示进行卷积处理,得到第三子特征信息,以及通过所述第二卷积层对所述第四向量表示进行卷积处理,得到第四子特征信息;
根据所述第三子特征信息和所述第四子特征信息确定所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息。
在一种可能的实施方式中,所述神经网络模型包括第一稠密层和第二稠密层;所述根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布,包括:
利用所述第一稠密层和所述第二稠密层对所述第一特征信息进行特征处理,得到所述第一训练文本数据的人格特质标签对应的第一目标概率分布;以及,
利用所述第一稠密层和所述第二稠密层对所述第二特征信息进行特征处理,得到所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一种可能的实施方式中,所述根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型,包括:
根据所述第一训练文本数据的人格特质标签对应的第一目标概率分布和所述第一训练文本数据的人格特质标签,确定第一损失函数;
根据所述第二训练文本数据的情绪特质标签对应的第二目标概率分布和所述第二训练文本数据的情绪特质标签,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述神经网络模型的模型参数进行调整,得到所述目标预测模型。
在一种可能的实施方式中,所述根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪,包括:
获取所述第三目标概率分布中的最大概率值,并确定所述第三目标概率分布中的最大概率值对应的人格特质为所述待预测文本数据对应的目标人格特质;
获取所述第四目标概率分布中的最大概率值,并确定所述第四目标概率分布中的最大概率值对应的情绪为所述待预测文本数据对应的目标情绪。
第二方面,本申请实施例提供了一种人格特质和情绪的预测装置,该装置包括:
获取模块,用于获取第一训练样本集和第二训练样本集,所述第一训练样本集包括多个第一训练文本数据,所述第二训练集包括多个第二训练文本数据;
添加模块,用于对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
训练模块,用于将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型,其中,所述分类结果包括所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及所述第二训练文本数据的情绪特质标签对应的第二目标概率分布;
预测模块,用于获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
第三方面,本申请实施例提供了一种计算机设备,该计算机设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,执行如下步骤:获取第一训练样本集和第二训练样本集,所述第一训练样本集包括多个第一训练文本数据,所述第二训练集包括多个第二训练文本数据;对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型,其中,所述分类结果包括所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及所述第二训练文本数据的情绪特质标签对应的第二目标概率分布;获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
本申请实施例中,计算机设备获取第一训练样本集和第二训练样本集,对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签,将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据分类结果对神经网络模型进行训练,得到目标预测模型,获取待预测文本数据并输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和情绪对应的第四目标概率分布,根据第三目标概率分布确定对应的目标人格特质,根据第四目标概率分布确定对应的目标情绪。通过实施本申请实施例所提出的方法,可以在模型中针对人格特质预测任务和情绪任务同时进行训练,以使模型获得更多的特征,以及可以实现同时预测人格特质和情绪,并提高人格特质和情绪的预测准确性。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本申请实施例提供的一种应用架构示意图;
图1b为本申请实施例提供的一种应用架构示意图;
图2为本申请实施例提供的一种人格特质和情绪的预测方法的流程示意图;
图3为本申请实施例提供的一种人格特质和情绪的预测方法的流程示意图;
图4为本申请实施例提供的一种获得共享信息的场景示意图;
图5为本申请实施例提供的一种目标预测模型的结构示意图;
图6为本申请实施例提供的一种人格特质和情绪的预测方法的流程示意图;
图7为本申请实施例提供的一种人格特质和情绪的预测装置的示意框图;
图8为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本申请实施例提出的人格特质和情绪的预测方法实现于计算机设备,该计算机设备可以为终端设备或服务器。其中,终端设备可以为智能手机、平板电脑、笔记本电脑、台式计算机等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是云服务器等,但并不局限于此。本申请涉及区块链技术,计算机设备可将涉及的数据或信息如目标预测模型、待预测文本数据对应的目标人格特质或目标情绪等写入区块链中,以便于计算机设备可以在区块链上获取所需信息,如待预测文本数据对应的目标人格特质,或者可将文本数据写入区块链中,以用于数据取证等场景。
请参见图1a,图1a为本申请实施例提供的一种应用架构示意图,可以通过该应用架构执行本申请所提出的人格特质和情绪的预测方法。具体的,图1a可以包括计算机设备,以及计算机设备中部署有预设的神经网络模型,和存储了用于模型训练的第一训练样本集和第二训练样本集。该神经网络模型可以包括第一嵌入层和第二嵌入层、第一卷积层和第二卷积层、以及第一稠密层和第二稠密层。其中,计算机设备可以通过执行本申请的技术方案,将添加了标签的第一训练样本集和第二训练样本集输入该神经网络模型中,利用神经网络模型包括的第一嵌入层和第二嵌入层、第一卷积层和第二卷积层得到第一训练样本集中每个第一训练文本数据的第一特征信息,以及第二训练样本集中每个第二训练文本数据的第二特征信息,并基于该第一特征信息和第二特征信息对待训练的神经网络模型进行训练,得到目标预测模型,进而可以在基于目标预测模型对人格特质和情绪进行预测时,提高预测准确性。
在一个实施例中,请参见图1b,图1b为本申请实施例提供的一种应用架构的示意图,在图1a的基础上,该神经网络模型还可以包括第一池化层和第二池化层,计算机设备可以利用神经网络模型包括的第一嵌入层和第二嵌入层、第一卷积层和第二卷积层、第一池化层和第二池化层得到第一训练样本集中每个第一训练文本数据的第一特征信息和第二训练样本集中每个第二训练文本数据的第二特征信息,进而实现对神经网络模型的训练。
可以理解的是,图1a和图1b只是示例性地表征本申请实施例所提出的应用架构,并不对本申请技术方案的具体架构进行限定,即本申请技术方案还可以提供其他形式的应用架构。为了便于阐述,除非特别指明,后续所提及的人格特质和情绪的预测方法均以应用在图1b所示的应用架构为例进行说明。
在一些实施例中,计算机设备可根据实际的业务需求,执行该人格特质和情绪的预测方法,以提高预测准确性。例如,本申请技术方案可以应用于社会网络分析的场景中,即计算机设备可以通过本申请技术方案对神经网络模型进行训练得到目标预测模型,进而可以基于该目标预测模型实现根据个体的社会网络相关文本数据(如社交媒体内容数据)预测得到该个体的人格特质和情绪。
可以理解的是,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
基于上述的描述,本申请实施例提出了一种人格特质和情绪的预测方法,该方法可以由上述提及的计算机设备来执行。如图2所示,本申请实施例的人格特质和情绪的预测方法的流程可以包括如下:
S201、获取第一训练样本集和第二训练样本集;其中,第一训练样本集包括多个第一训练文本数据,第二训练集包括多个第二训练文本数据。
其中,第一训练样本集是针对人格特质预测任务构建的,以及第二训练样本集是针对情绪预测任务构建的。以及,第一训练样本集包括的多个第一训练文本数据和第二训练样本集包括的多个第二训练文本数据均可以是文本句的形式。其中,第一训练样本集包括的第一训练文本数据和第二训练样本集包括的第二训练文本数据可以从自建数据源和互联网开源数据源获取,自建数据源可以为技术人员预先构建的数据库,数据库中具体存储了各种文本句,互联网开源数据源具体存储了可以从互联网中查询到的文本句。以及该文本句可以是由文字记录(如自述、社交媒体内容等)构成,或者还可以是由构成个体信息(如性别、年龄、生活习惯等)。
在一些实施例中,计算机设备可以通过第一训练集包括的多个第一训练文本数据和第二训练样本集包括的多个第二训练文本数据进行若干次迭代训练。相应的,利用第一训练集中的每个第一训练文本数据对预设的神经网络模型进行训练的过程和原理相同,以及利用第二训练集中的每个第二训练文本数据对预设的神经网络模型进行训练的过程和原理相同。
S202、对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签。
在一个可能的实施方式中,由于第一训练样本集是针对人格特质预测任务构建的,因此可以对第一训练样本集中的每个第一训练文本数据添加至少一个人格特质标签,以及由于第二训练样本集是针对情绪预测任务构建的,因此可以对第二训练样本集中每个第二训练文本数据添加至少一个情绪标签。
在一些实施例中,人格特质标签可以为以下至少一种:生气、恶心、害怕、开心、伤心、害羞和内疚。
在一些实施例中,情绪标签可以为以下至少一种:开放、尽责、随和、外向和神经质。
S203、将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据分类结果对神经网络模型进行训练,得到目标预测模型;其中,该分类结果包括第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,计算机设备将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果的具体实施方式:将添加人格特质标签后的每个第一训练文本数据输入神经网络模型,得到添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;以及,将添加情绪标签后的每个第二训练文本数据输入神经网络模型,得到添加情绪标签后的每个第二训练文本数据对应的第二特征信息,并根据第一特征信息和第二特征信息,确定第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布。
其中,第一目标概率分布表示从第一训练文本数据连接到所有人格特质标签的概率,以及第二目标概率分布表示从第二训练文本数据连接到所有情绪标签的概率。例如,假设人格特质标签包括标签1、标签2、和标签3,以及根据第一特征信息和第二特征信息得到第一训练文本数据连接到标签1的概率为0.3,连接到标签2的概率为0.3,连接到标签3的概率为0.4,因为可以将前述概率确定为第一训练文本数据的人格特质标签对应的第一目标概率分布。
在一个可能的实施方式中,该神经网络模型可以包括第一嵌入层和第二嵌入层、第一卷积层和第二卷积层;计算机设备将添加人格特质标签后的每个第一训练文本数据输入神经网络模型,得到添加人格特质标签后的每个第一训练文本数据对应的第一特征信息具体实施方式可以为:利用第一嵌入层对添加人格特质标签后的每个第一训练文本数据进行量化处理,得到第一训练文本数据对应的第一向量表示;以及,利用第二嵌入层对添加人格特质标签后的每个第一训练文本数据进行量化处理,得到第一训练文本数据对应的第二向量表示;通过第一卷积层对第一向量表示进行卷积处理,得到第一子特征信息,以及通过第二卷积层对第二向量表示进行卷积处理,得到第二子特征信息;根据第一子特征信息和第二子特征信息确定添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
在一些实施例中,以一个第一训练文本数据为例,利用第一嵌入层对添加人格特质标签后的每个第一训练文本数据进行量化处理,得到第一训练文本数据对应的第一向量表示具体方式为:利用第一嵌入层对该第一训练文本数据做分词处理,得到至少一个分词,并对该至少一个分词作量化处理,得到至少一个分词的向量化表示,根据该至少一个分词的向量化表示得到第一训练文本数据对应的第一向量表示。即:
通过第一嵌入层对第一训练文本数据做分词处理得到至少一个分词为:X1=[x1,x2,...,xn],并将每个分词用向量表示,其中d1表示嵌入维数,由此得到该第一训练文本数据的第一向量表示X1=[x1,x2,...,xn],其中,n为分词数量。
此外,利用第二嵌入层对添加人格特质标签后的每个第一训练文本数据进行量化处理,得到第一训练文本数据对应的第二向量表示的具体实施方式同理,此处不再赘述。以及,由第一嵌入层得到的嵌入维数d1和由第二嵌入层得到嵌入维数d2可以相同也可以不相同。相应的,第一训练文本数据对应的第二向量表示可以为X2=[x1,x2,...,xn],其中每个分词可以用向量
相应的,通过第二卷积层对第二向量表示进行卷积处理,得到第二子特征信息具体方式可以为:利用滤波器Wk2∈Rh2×d2对第二向量表示做卷积处理,得到第二子特征信息,即c2=[c1,c2,...,cn-h2+1],其对第二向量表示进行卷积处理具体可以表示为:
在一些实施例中,上述第一卷积层包括的滤波器中的参数与第二卷积层包括的滤波器中的参数可以相同也可以不同。
在一个可能的实施方式中,该神经网络模型还可以包括第一池化层和第二池化层,计算机设备根据第一子特征信息和第二子特征信息确定添加人格特质标签后的每个第一训练文本数据对应的第一特征信息具体可以是:通过第一池化层对第一子特征信息做池化处理,得到第一子特征信息中的最大子特征,并通过第二池化层对第二子特征做池化处理,得到第二子特征信息中的最大子特征,并将该第一子特征信息中的最大子特征和第二子特征信息中的最大子特征确定为添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
其中,上述第一子特征信息中的最大子特征可以表示为即可以从第一子特征信息中获取最大的ci1作为第一子特征信息中的最大子特征,也称第一子特征信息中的最重要特征;相应的,上述第二子特征信息中的最大子特征可以表示为即可以从第二子特征信息中获取最大的ci2作为第二子特征信息中的最大子特征,也称第二子特征信息中的最重要特征,因此第一特征信息可以表示为
在一个可能的实施方式中,该神经网络模型可以包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;计算机设备将添加情绪标签后的每个第二训练文本数据输入神经网络模型,得到添加情绪标签后的每个第二训练文本数据对应的第二特征信息具体实施方式为:利用第一嵌入层对添加情绪标签后的每个第一训练文本数据进行量化处理,得到第二训练文本数据对应的第三向量表示;以及,利用第二嵌入层对添加情绪标签后的每个第二训练文本数据进行量化处理,得到第二训练文本数据对应的第四向量表示;通过第一卷积层对第三向量表示进行卷积处理,得到第三子特征信息,以及通过第二卷积层对第四向量表示进行卷积处理,得到第四子特征信息;根据第三子特征信息和第四子特征信息确定添加情绪标签后的每个第二训练文本数据对应的第二特征信息。
在一些实施例中,得到第三向量表示的具体方式可以同得到第一向量表示的具体方式;得到第四向量表示的具体方式可以同得到第二向量表示的具体方式;以及,得到第三子特征信息的具体方式可以同得到第一子特征信息的具体方式;得到第四子特征信息的具体方式可以同得到第二子特征信息的具体方式;以及得到第二特征信息的具体方式可以同得到第一特征信息的具体方式,此处不再赘述。
在一个可能的实施方式中,该神经网络模型还可以包括第一稠密层和第二稠密层,计算机设备根据第一特征信息和第二特征信息,确定第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布具体实施方式可以是:利用第一稠密层和第二稠密层对第一特征信息进行特征处理,得到第一训练文本数据的人格特质标签对应的第一目标概率分布;以及,利用第一稠密层和第二稠密层对第二特征信息进行特征处理,得到第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一些实施例中,利用第一稠密层和第二稠密层对第一特征信息进行特征处理,得到第一训练文本数据的人格特质标签对应的第一目标概率分布具体可以是,利用第一稠密层对第一特征信息中包括的第一子特征信息中的最大子特征进行特征处理,得到第一训练文本数据的人格特征标签对应的第一概率分布,并利用第二稠密层对第二特征信息中包括的第二子特征信息中的最大子特征进行特征处理,得到第二训练文本数据的人格特征标签对应的第二概率分布,并根据第一概率分布和第二概率分布确定第一目标概率分布。
其中,对第一子特征信息中的最大子特征进行特征处理具体可以是建立第一子特征信息中的最大子特征到该第一训练文本数据的人格特质标签的连接,并生成第一子特征信息中最大子特征连接到的各个人格特质标签的概率,以及,对第二子特征信息中的最大子特征进行特征处理具体可以是建立第二子特征信息中的最大子特征到该第一训练文本数据的人格特质标签的连接,并生成第二子特征中最大子特征连接到各个人格特质标签的概率。
在一些实施例中,根据第一概率分布和第二概率分布确定第一目标概率分布具体可以是:将第一概率分布和第二概率分布的平均概率分布作为第一目标概率分布;或者,还可以是,确定第一概率分布和第二概率分布的权重,并将加权后的第一概率分布和加权后的第二概率分布之和作为第一目标概率分布,该加权系数可以由技术人员根据经验值设定,例如第一概率分布的权重为0.7,第二概率分布的权重为0.3等。
在一些实施例中,利用第一稠密层和第二稠密层对第二特征信息进行特征处理,得到第二训练文本数据的情绪标签对应的第二目标概率分布具体可以是,利用第一稠密层对第二特征信息中包括的第三子特征信息中的最大子特征进行特征处理,得到第二训练文本数据的情绪标签对应的第三概率分布,并利用第二稠密层对第二特征信息中包括的第四子特征信息中的最大子特征进行特征处理,得到第二训练文本数据的情绪标签对应的第四概率分布,并根据第三概率分布和第四概率分布确定第二目标概率分布。
其中,对第三子特征信息中的最大子特征进行特征处理具体可以是建立第三子特征信息中最大子特征到该第二训练文本数据的情绪标签的连接,并生成第一子特征信息中最大子特征连接到各个情绪标签的概率,以及,对第四子特征信息中的最大子特征进行特征处理具体可以是建立第四子特征信息中最大子特征到该第二训练文本数据的情绪标签的连接,并生成第二子特征信息中最大子特征连接到各个情绪标签的概率。
在一些实施例中,根据第三概率分布和第四概念分布确定第二目标概率分布具体方式可以同确定第一目标概率分布的具体方式,此处不再赘述。
在一个可能的实施方式中,计算机设备根据分类结果对神经网络模型进行训练,得到目标预测模型的具体方式可以为:基于分类结果确定针对人格特质预测的第一损失函数,以及针对情绪预测的第二损失函数,并利用第一损失函数和第二损失函数对神经网络模型进行训练,以调整该神经网络模型的模型参数,以至模型收敛,进而得到目标预测模型。
S204、获取待预测文本数据,并将待预测文本数据输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和待预测文本数据的情绪对应的第四目标概率分布,以及根据第三目标概率分布确定待预测文本数据对应的目标人格特质,以及根据第四目标概率分布确定待预测文本数据对应的目标情绪。
其中,该待预测文本数据可以为N句话,N为正整数。
在一个可能的实施方式中,当N为1时,计算机设备将该句话输入目标预测模型,可以基于得到的第三目标概率分布确定目标人格特质,并基于得到的第四目标概率分布确定目标情绪。
在一些实施例中,当N大于1时,计算机设备可以将N句话分别输入目标预测模型,进而得到该N句话分别的人格特质对应的第三目标概率分布,以及得到该N句话中每个句话的情绪对应第四目标概率分布,因此,确定该待预测文本数据对应的目标人格特质的具体方式可以为,根据N个第三目标概率分布确定最终的第三目标概率分布,并根据最终的第三目标概率分布确定目标人格特质。其中,确定最终的第三目标概率分布具体是N个第三目标概率分布进行均值计算,也可以是N个第三目标概率分布加权求和(权重可以根据经验值设定,例如N句话中涉及社交媒体内容的话权重设置的较大,涉及年龄或性别的话权重设置的较小等)。或者,确定该待预测文本数据对应的目标人格特质的具体方式还可以为,根据N个第三目标概率分布确定N个人格特质,并将该N个人格特质中重现次数最多的人格特质作为目标人格特质。例如,N个人格特质为3个开心、1个伤心、1个害羞,因此可以将开心作为目标人格特质。
相应的,确定目标情绪的具体方式可以同确定目标人格特质的具体方式,此处不再赘述。
本申请实施例中,计算机设备获取第一训练样本集和第二训练样本集,对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签,将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据分类结果对神经网络模型进行训练,得到目标预测模型,该分类结果包括第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布,以及获取待预测文本数据,并将待预测文本数据输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和待预测文本数据的情绪对应的第四目标概率分布,以及根据第三目标概率分布确定待预测文本数据对应的目标人格特质,以及根据第四目标概率分布确定待预测文本数据对应的目标情绪。通过实施本申请实施例所提出的方法,可以在模型中针对人格特质预测任务和情绪任务同时进行训练,以使模型获得更多的特征,以及可以实现同时预测人格特质和情绪,并提高人格特质和情绪的预测准确性。
请参见图3,图3为本申请实施例提供的一种人格特质和情绪的预测方法的流程示意图,该方法可以由上述提及的计算机设备来执行。如图3所示,本申请实施例中人格特质和情绪的预测方法可以包括如下:
S301、获取第一训练样本集和第二训练样本集;其中,第一训练样本集包括多个第一训练文本数据,第二训练集包括多个第二训练文本数据。
S302、对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签。其中,步骤S301-S302的具体实施步骤可以参见步骤S201-S202的相关描述,此处不再赘述。
S303、将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果;其中,该分类结果包括第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,预设的神经网络模型除了可以包括第一嵌入层和第二嵌入层、第一卷积层和第二卷积层、第一池化层和第二池化层,以及第一稠密层和第二稠密层,还可以包括第一共享层和第二共享层。其中,第一共享层和第二共享层用于传递共享信息,以使得在模型训练过程可以学习更多的训练集特征,进而实现提高预测效率和准确性,该共享信息可以是根据第一特征信息和第二特征信息得到的。计算机设备可以将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入该神经网络模型,并经由前述的多层结构分别得到对应的第一目标概率分布和对应的第二目标概率分布。
在一个可能的实施方式中,计算机设备将添加人格特质标签后的每个第一训练文本数据输入预设的神经网络模型,得到分类结果包括的第一训练文本数据的人格特质标签对应的第一目标概率分布具体可以是:利用神经网络模型包括的第一嵌入层和第一卷积层得到第一训练文本数据对应的第一子特征信息,并利用神经网络模型包括的第二嵌入层和第二卷积层得到第二训练文本数据对应的第二子特征信息,并将第二子特征信息输入第一共享层得到第一共享信息,并基于第一共享信息对第一子特征信息进行调整得到调整后的第一子特征信息,以及将第一子特征信息输入第一共享层得到第二共享信息,并基于第二共享信息对第二子特征信息进行调整得到调整后的第二子特征信息,以及根据调整后的第一子特征信息和调整后的第二子特征信息确定添加人格特质标签后的每个第一训练文本数据对应的第一特征信息,并利用第一稠密层和第二稠密层对第一特征信息进行特征处理,得到第一训练文本数据的人格特质标签对应的第一目标概率分布。其中,对第一特征信息进行特征处理得到对应的第一目标概率分布的具体实施方式可以参加步骤S203相关描述,此处不再赘述。
其中,将第二子特征信息输入第一共享层得到第一共享信息的具体方式是可以为:在第一共享层使用softmax函数对第二子特征信息做归一化处理,得到第二子特征信息中每个子特征的的加权系数,并使用对应的加权系数对每个子特征进行加权得到加权后的第二子特征信息,将该加权后的第二子特征信息确定为第一共享信息。即:
mi 2=softmax(ci 2)*ci 2
其中,ci 2表示第二子特征信息,softmax(ci 2)表示加权系数,mi 2表示加权后的第二子特征信息,因此,基于第一共享信息对第一子特征信息进行调整得到调整后的第一子特征信息具体可以为:
hi 1=ci 1+mi 2
其中,ci 1表示第一子特征信息,hi 1表示调整后的第一子特征信息。
需要说明的是,将第一子特征信息输入第一共享层得到第二共享信息的具体方式可以同将第二子特征信息输入第一共享层得到第一共享信息的具体方式,此处不再赘述。
例如,请参见图4,图4为本申请实施例提供的一种获得共享信息的场景示意图,将第二子特征信息输入第一共享层,并在第一共享层中利用softmax函数对第二子特征信息做归一化处理得到第二子特征信息中每个子特征的的加权系数,并在第二共享层中根据加权系数进行加权处理,得到第一共享信息,以及由第一共享层输出第一共享信息并传递至第一池化层。
在一个可能的实施方式中,根据调整后的第一子特征信息和调整后的第二子特征信息确定添加人格特质标签后的每个第一训练文本数据对应的第一特征信息具体可以是:利用神经网络模型包括的第一池化层根据调整后的第一子特征信息得到调整后的第一子特征信息中的最大子特征(假设为第一子特征),并利用神经网络模型包括的第二池化层根据调整后的第二子特征信息得到调整后的第二子特征信息中的最大子特征(假设为第二子特征),将第二子特征输入第二共享层,得到第三共享信息,并基于第三共享信息对第一子特征进行调整得到调整后的第一子特征,将第一子特征输入第二共享层,得到第四共享信息,并基于第四共享信息对第二子特征进行调整,得到调整后的第二子特征,并将该调整后的第一子特征和调整后的第二子特征确定为对应的第一特征信息。
其中,将第一子特征输入第二共享层,得到第三共享信息的具体方式可以为:将调整后的第一子特征信息输入第二共享层,并使用softmax函数对调整后的第二子特征信息做归一化处理,得到第二子特征对应的加权系数,并根据加权系数对第二子特征进行加权得到加权后的第二子特征,并将该加权后的第二子特征信息确定为第三共享信息。即:
在一个可能的实施方式中,计算机设备将添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果包括的第二训练文本数据的情绪标签对应的第二目标概率分布具体可以是:利用神经网络模型包括的第一嵌入层和第一卷积层得到第二训练文本数据对应的第三子特征信息,并利用神经网络模型包括的第二嵌入层和第二卷积层得到第二训练文本数据对应的第四子特征信息,并将第四子特征信息输入第一共享层得到第五共享信息,并基于第五共享信息对第三子特征信息进行调整得到调整后的第三子特征信息,以及将第三子特征信息输入第一共享层得到第六共享信息,并基于第六共享信息对第四子特征信息进行调整得到调整后的第四子特征信息,以及根据调整后的第三子特征信息和调整后的第四子特征信息确定添加情绪标签后的每个第二训练文本数据对应的第二特征信息,并利用第一稠密层和第二稠密层对第二特征信息进行特征处理,得到第二训练文本数据的人格特质标签对应的第二目标概率分布。其中,前述具体实施过程可以同上述得到分类结果包括的第一训练文本数据的人格特质标签对应的第一目标概率分布的具体描述,此处不再赘述。
S304、根据第一训练文本数据的人格特质标签对应的第一目标概率分布和第一训练文本数据的人格特质标签,确定第一损失函数;根据第二训练文本数据的情绪特质标签对应的第二目标概率分布和第二训练文本数据的情绪特质标签,确定第二损失函数。
其中,第一损失函数是基于针对人格特质预测任务构建的,以及第二损失函数是基于针对情绪预测任务构建的。因此可以通过针对人格特质预测任务构建的第一训练样本集的相关信息(第一训练文本数据的人格特质标签对应的第一目标概率分布和第一训练文本数据的人格特质标签)确定第一损失函数以及第一损失函数,并得到第一损失函数值,以及可以通过针对情绪预测任务构建的第二训练样本集的相关信息确定第二损失函数,并得到第二损失函数值。进而可以通过第一损失函数、第一损失函数值、第二损失函数和第二损失函数值对神经网络模型进行训练,得到目标预测模型。
在一个可能的实施方式中,第一损失函数可以为:
以及,第二损失函数可以为:
在一些实施例中,可以根据第一损失函数和第二损失函数确定目标损失函数,并利用该目标损失函数对神经网络模型进行训练。其中,目标损失函数可以为:
LMulti=LPersonality+LEmotion
或者,目标损失函数也可以为:
LMulti=αLPersonality+βLEmotion
其中,α、β为对应的损失函数的权重系数。
S305、根据第一损失函数和第二损失函数对神经网络模型的模型参数进行调整,得到目标预测模型。
在一个可能的实施方式中,计算机设备根据第一损失函数和第二损失函数(或者根据目标损失函数)对神经网络模型的模型参数进行调整,得到最终的目标预测模型。其中,具体可以是根据第一损失函数(也即目标损失函数包括的第一损失函数)对神经网络模型中的第一嵌入层,和/或第一卷积层,或/或第一池化层,和/或第一稠密层中的参数进行调整,并根据第二损失函数(也即目标损失函数包括的第二损失函数)对神经网络模型中的第二嵌入层,和/或第二卷积层,或/或第二池化层,和/或第二稠密层中的参数进行调整,从而优化第一损失函数和第二损失函数(或目标损失函数)对应的损失函数值,直至前述损失函数值最小。通过模型参数调整后的神经网络模型得到目标预测模型。
可以理解的是,该目标预测模型可以同时进行人格特质和情绪的预测,即其可以包括第一输出和第二输出,第一输出为预测的目标人格特质,第二输出为预测的目标情绪。
例如,请参见图5,图5为本申请实施例提供的一种目标预测模型的结构示意图,其中,(1)将文本数据输出目标预测模型中,经由第一嵌入层和第一卷积层得到该文本数据的第一子特征信息,以及经由第二嵌入层和第二卷积层得到该信息的第二子特征信息;(2)然后可以通过第一共享层得到第一共享信息和第二共享信息并相互传递,进而可以基于第一共享信息得到调整后的第一子特征信息,和可以基于第二共享信息得到调整后的第二子特征信息,以及经由第一池化层根据该调整后的第一子特征信息得到第一子特征,和经由第二池化层根据该调整后的第二子特征信息得到第二子特征,然后可以通过第二池化层得到第三共享信息和第四共享信息并相互传递,进而可以基于第三共享信息得到调整后的第一子特征,以及可以基于第四共享信息得到调整后的第二子特征,并根据调整后的第一子特征和调整后的第二子特征确定该文本数据的第一特征信息;相应的,可以参照上述过程得到该文本数据的第二特征信息;(3)以及可以利用第一稠密层并根据第一特征信息中的第一子特征得到第一概率分布,以及可以利用第二稠密层并根据第一特征信息中的第二子特征得到第二概率分布,并根据第一概率分布和第二概率分布确定该文本数据对应的第一目标概率分布;相应的,可以参照上述过程得到该文本数据对应的第二目标概率分布;(4)可以根据第一目标概率分布确定出该文本数据对应的目标人格特质并将该目标人格特质作为第一输出,以及可以根据第二目标概率分布确定出该文本数据对应的目标情绪并将该目标情绪作为第二输出。
本申请实施例中,计算机设备获取第一训练样本集和第二训练样本集,对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签,将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据分类结果对神经网络模型进行训练,得到目标预测模型,该分类结果包括第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布,根据第一训练文本数据的人格特质标签对应的第一目标概率分布和第一训练文本数据的人格特质标签,确定第一损失函数;根据第二训练文本数据的情绪特质标签对应的第二目标概率分布和第二训练文本数据的情绪特质标签,确定第二损失函数,并根据第一损失函数和第二损失函数对神经网络模型的模型参数进行调整,得到目标预测模型。通过实施本申请实施例所提出的方法,可以在模型中针对人格特质预测任务和情绪任务同时进行训练,以使模型获得更多的特征,以及可以实现同时预测人格特质和情绪,并提高人格特质和情绪的预测准确性。
请参见图6,图6为本申请实施例提供的一种人格特质和情绪的预测方法的流程示意图,该方法可以由上述提及的计算机设备来执行。如图6所示,本申请实施例中人格特质和情绪的预测方法可以包括如下:
S601、获取待预测文本数据,并将待预测文本数据输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和待预测文本数据的情绪对应的第四目标概率分布。
其中,将该待预测文本数据输入目标预测模型得到对应的第三目标概率分布具体实施方式可以参见上述步骤S303中得到第一训练文本数据的人格特质标签对应的第一目标概率分布的具体方式的相关描述。以及,将该待预测文本数据输入目标预测模型得到对应的第四目标概率分布具体实施方式可以参见上述步骤S303中得到第二训练文本数据的情绪标签对应的第二目标概率分布的具体方式的相关描述,此处不再赘述。
S602、获取第三目标概率分布中的最大概率值,并确定第三目标概率分布中的最大概率值对应的人格特质为待预测文本数据对应的目标人格特质。
在一个可能的实施方式中,计算机设备可以将第三目标概率分布中的最大概率值对应的人格特质作为该预测文本数据对应的目标人格特质,并将该目标人格特质作为第一输出。例如,第三目标概率分布为:人格特质1的概率为0.2、人格特质2的概率为0.05、人格特质3的概率为0.6、人格特质4的概率为0.15,因此得到的目标人格特质可以是人格特质3。
在一些实施例中,当待预测文本数据为N句话时,N大于1,会得到N个第三目标概率分布,因此可以根据N个第三目标概率分布确定最终的第三目标概率分布,并将最终的第三目标概率分布中的最大概率值所对应的人格特质作为该预测文本数据对应的目标人格特质。其中,确定最终的第三目标概率分布的具体方式可以参见上述步骤S204的相关数据,此处不再赘述。
在一些实施例中,还可以是根据N个第三目标概率分布中每个第三目标概率分布中的最大概率值对应的人格特质,得到N个人格特质,并基于该N个人格特质中重现次数最多的人格特质作为目标人格特质。
S603、获取第四目标概率分布中的最大概率值,并确定第四目标概率分布中的最大概率值对应的情绪为待预测文本数据对应的目标情绪。
在一个可能的实施方式中,计算机设备可以将第四目标概率分布中的最大概率值对应的情绪特质作为该预测文本数据对应的目标情绪,并将该目标情绪作为第二输出。例如,第四目标概率分布为:情绪1的概率为0.2、情绪2的概率为0.05、情绪3的概率为0.6、情绪4的概率为0.15,因此得到的目标情绪可以是情绪3。
在一些实施例中,当待预测文本数据为N句话时,N大于1,会得到N个第四目标概率分布,因此可以根据N个第四目标概率分布确定最终的第四目标概率分布,并将最终的第四目标概率分布中的最大概率值所对应的情绪作为该预测文本数据对应的目标情绪。其中,确定最终的第四目标概率分布的具体方式可以参见上述确定最终的第三目标概率分布的相关描述,此处不再赘述。
在一些实施例中,还可以是根据N个第四目标概率分布中每个第四目标概率分布中的最大概率值对应的情绪,得到N个情绪,并基于该N个情绪中重现次数最多的情绪作为目标情绪。
本申请实施例中,计算机设备获取待预测文本数据,并将待预测文本数据输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和待预测文本数据的情绪对应的第四目标概率分布,并获取第三目标概率分布中的最大概率值,并确定第三目标概率分布中的最大概率值对应的人格特质为待预测文本数据对应的目标人格特质,以及获取第四目标概率分布中的最大概率值,并确定第四目标概率分布中的最大概率值对应的情绪为待预测文本数据对应的目标情绪。通过实施本申请实施例所提出的方法,可以在基于目标预测模型对待预测文本数据进行预测的过程中,通过传递共享信息以使模型获得更多更准确的该待预测文本数据的特征,以及可以实现基于该待预测文本数据的特征同时预测人格特质和情绪,并提高了人格特质和情绪的预测准确性。
本申请实施例还提供了一种人格特质和情绪的预测装置,该人格特质和情绪的预测装置用于执行前述任一项所述的方法的单元。具体地,参见图7,图7是本申请实施例提供的一种人格特质和情绪的预测装置的示意框图。本申请实施例的人格特质和情绪的预测装置包括:获取模块701、添加模块702、训练模块703、预测模块704。其中:
获取模块701,用于获取第一训练样本集和第二训练样本集;其中,所述第一训练样本集包括多个第一训练文本数据,所述第二训练集包括多个第二训练文本数据;
添加模块702,用于对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
训练模块703,用于将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型,其中,所述分类结果包括所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及所述第二训练文本数据的情绪特质标签对应的第二目标概率分布;
预测模块704,用于获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
在一个可能的实施方式中,所述训练模块703在用于将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果时,具体用于:
将所述添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;以及,
将所述添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息;
根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述训练模块703在用于将添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息时,具体用于:
利用所述第一嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第一向量表示;以及,
利用所述第二嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第二向量表示;
通过所述第一卷积层对所述第一向量表示进行卷积处理,得到第一子特征信息,以及通过所述第二卷积层对所述第二向量表示进行卷积处理,得到第二子特征信息;
根据所述第一子特征信息和所述第二子特征信息确定所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
在一个可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述训练模块703在用于将添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息时,具体用于:
利用所述第一嵌入层对所述添加情绪标签后的每个第一训练文本数据进行量化处理,得到所述第二训练文本数据对应的第三向量表示;以及,
利用所述第二嵌入层对所述添加情绪标签后的每个第二训练文本数据进行量化处理,得到所述第二训练文本数据对应的第四向量表示;
通过所述第一卷积层对所述第三向量表示进行卷积处理,得到第三子特征信息,以及通过所述第二卷积层对所述第四向量表示进行卷积处理,得到第四子特征信息;
根据所述第三子特征信息和所述第四子特征信息确定所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息。
在一个可能的实施方式中,所述神经网络模型包括第一稠密层和第二稠密层;所述训练模块703在用于根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布时,具体用于:
利用所述第一稠密层和所述第二稠密层对所述第一特征信息进行特征处理,得到所述第一训练文本数据的人格特质标签对应的第一目标概率分布;以及,
利用所述第一稠密层和所述第二稠密层对所述第二特征信息进行特征处理,得到所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,所述训练模块703在用于根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型时,具体用于:
根据所述第一训练文本数据的人格特质标签对应的第一目标概率分布和所述第一训练文本数据的人格特质标签,确定第一损失函数;
根据所述第二训练文本数据的情绪特质标签对应的第二目标概率分布和所述第二训练文本数据的情绪特质标签,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述神经网络模型的模型参数进行调整,得到所述目标预测模型。
在一个可能的实施方式中,所述预测模块704在用于根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪时,具体用于:
获取所述第三目标概率分布中的最大概率值,并确定所述第三目标概率分布中的最大概率值对应的人格特质为所述待预测文本数据对应的目标人格特质;
获取所述第四目标概率分布中的最大概率值,并确定所述第四目标概率分布中的最大概率值对应的情绪为所述待预测文本数据对应的目标情绪。
本申请实施例中,获取模块获取第一训练样本集和第二训练样本集,添加模块对第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对第二训练样本集中的每个第二训练文本数据添加情绪标签,训练模块将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据分类结果对神经网络模型进行训练,得到目标预测模型,其中,分类结果包括第一训练文本数据的人格特质标签对应的第一目标概率分布,以及第二训练文本数据的情绪特质标签对应的第二目标概率分布,预测模块获取待预测文本数据,并将待预测文本数据输入目标预测模型,得到待预测文本数据的人格特质对应的第三目标概率分布,和待预测文本数据的情绪对应的第四目标概率分布,以及根据第三目标概率分布确定待预测文本数据对应的目标人格特质,以及根据第四目标概率分布确定所述待预测文本数据对应的目标情绪。通过上述所提出的装置,可以在模型中针对人格特质预测任务和情绪任务同时进行训练,以使模型获得更多的特征,以及可以实现同时预测人格特质和情绪,并提高人格特质和情绪的预测准确性。
在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现,本申请不做限定。
请参见图8,图8是本申请实施例提供的一种计算机设备的结构示意图。如图所示的本申请实施例中的计算机设备可以包括:至少一个处理器801、存储器802。可选的,该计算机设备还可以包括网络接口803。其中,所述处理器801、存储器802以及网络接口803之间可以交互数据,网络接口803受所述处理器801的控制用于收发消息,存储器802用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行存储器802存储的程序指令。其中,处理器801被配置用于调用所述程序指令执行上述方法。
所述存储器802可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器802也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;所述存储器802还可以包括上述种类的存储器的组合。
所述处理器801可以是中央处理器(central processing unit,CPU)。在一个实施例中,所述处理器801还可以是图形处理器(Graphics Processing Unit,GPU)。所述处理器801也可以是由CPU和GPU的组合。
在一个可能的实施方式中,所述存储器802用于存储程序指令。所述处理器801可以调用所述程序指令,执行以下步骤:
获取第一训练样本集和第二训练样本集;其中,所述第一训练样本集包括多个第一训练文本数据,所述第二训练集包括多个第二训练文本数据;
对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果,并根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型;其中,所述分类结果包括所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及所述第二训练文本数据的情绪特质标签对应的第二目标概率分布;
获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
在一个可能的实施方式中,所述处理器801在用于将添加人格特质标签后的每个第一训练文本数据和添加情绪标签后的每个第二训练文本数据输入预设的神经网络模型,得到分类结果时,具体用于:
将所述添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;以及,
将所述添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息;
根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述处理器801在用于将添加人格特质标签后的每个第一训练文本数据输入所述神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息时,具体用于:
利用所述第一嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第一向量表示;以及,
利用所述第二嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第二向量表示;
通过所述第一卷积层对所述第一向量表示进行卷积处理,得到第一子特征信息,以及通过所述第二卷积层对所述第二向量表示进行卷积处理,得到第二子特征信息;
根据所述第一子特征信息和所述第二子特征信息确定所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
在一个可能的实施方式中,所述神经网络模型包括第一嵌入层、第二嵌入层、第一卷积层和第二卷积层;所述处理器801在用于将添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息时,具体用于:
利用所述第一嵌入层对所述添加情绪标签后的每个第一训练文本数据进行量化处理,得到所述第二训练文本数据对应的第三向量表示;以及,
利用所述第二嵌入层对所述添加情绪标签后的每个第二训练文本数据进行量化处理,得到所述第二训练文本数据对应的第四向量表示;
通过所述第一卷积层对所述第三向量表示进行卷积处理,得到第三子特征信息,以及通过所述第二卷积层对所述第四向量表示进行卷积处理,得到第四子特征信息;
根据所述第三子特征信息和所述第四子特征信息确定所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息。
在一个可能的实施方式中,所述神经网络模型包括第一稠密层和第二稠密层;所述处理器801在用于根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布时,具体用于:
利用所述第一稠密层和所述第二稠密层对所述第一特征信息进行特征处理,得到所述第一训练文本数据的人格特质标签对应的第一目标概率分布;以及,
利用所述第一稠密层和所述第二稠密层对所述第二特征信息进行特征处理,得到所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
在一个可能的实施方式中,所述处理器801在用于根据所述分类结果对所述神经网络模型进行训练,得到目标预测模型时,具体用于:
根据所述第一训练文本数据的人格特质标签对应的第一目标概率分布和所述第一训练文本数据的人格特质标签,确定第一损失函数;
根据所述第二训练文本数据的情绪特质标签对应的第二目标概率分布和所述第二训练文本数据的情绪特质标签,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述神经网络模型的模型参数进行调整,得到所述目标预测模型。
在一个可能的实施方式中,所述处理器801在用于根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪时,具体用于:
获取所述第三目标概率分布中的最大概率值,并确定所述第三目标概率分布中的最大概率值对应的人格特质为所述待预测文本数据对应的目标人格特质;
获取所述第四目标概率分布中的最大概率值,并确定所述第四目标概率分布中的最大概率值对应的情绪为所述待预测文本数据对应的目标情绪。
具体实现中,本申请实施例中所描述的装置、处理器801、存储器802等可执行上述方法实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现图2、图3和图6所对应实施例中描述的人格特质和情绪的预测方法,也可实现本申请中图7所对应实施例的人格特质和情绪的预测装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的人格特质和情绪的预测装置的内部存储单元,例如人格特质和情绪的预测装置的硬盘或内存。所述计算机可读存储介质也可以是所述人格特质和情绪的预测装置的外部存储装置,例如所述人格特质和情绪的预测装置上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述人格特质和情绪的预测装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述人格特质和情绪的预测装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种人格特质和情绪的预测方法,其特征在于,包括:
获取第一训练样本集和第二训练样本集;其中,所述第一训练样本集包括多个第一训练文本数据,所述第二训练样本集包括多个第二训练文本数据;
对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
将所述添加人格特质标签后的每个第一训练文本数据输入神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;所述第一特征信息基于第一子特征信息和第二子特征信息得到,所述第一子特征信息基于所述神经网络模型中的第一嵌入层和第一卷积层对所述第一训练文本数据进行处理得到,所述第二子特征信息基于所述神经网络模型中的第二嵌入层和第二卷积层对所述第一训练文本数据进行处理得到;
将所述添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息;所述第二特征信息基于第三子特征信息和第四子特征信息得到,所述第三子特征信息基于所述神经网络模型中的所述第一嵌入层和所述第一卷积层对所述第二训练文本数据进行处理得到,所述第四子特征信息基于所述神经网络模型中的所述第二嵌入层和所述第二卷积层对所述第二训练文本数据进行处理得到;
根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布,并根据所述第一目标概率分布和所述第二目标概率分布对所述神经网络模型进行训练,得到目标预测模型;
获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
2.根据权利要求1所述的方法,其特征在于,所述将添加人格特质标签后的每个第一训练文本数据输入神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息,包括:
利用所述第一嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第一向量表示;以及,
利用所述第二嵌入层对所述添加人格特质标签后的每个第一训练文本数据进行量化处理,得到所述第一训练文本数据对应的第二向量表示;
通过所述第一卷积层对所述第一向量表示进行卷积处理,得到第一子特征信息,以及通过所述第二卷积层对所述第二向量表示进行卷积处理,得到第二子特征信息;
根据所述第一子特征信息和所述第二子特征信息确定所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
3.根据权利要求2所述的方法,其特征在于,所述神经网络模型包括第一共享层;所述根据所述第一子特征信息和所述第二子特征信息确定所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息,包括:
将所述第二子特征信息输入所述第一共享层得到第一共享信息,并基于所述第一共享信息对所述第一子特征信息进行调整得到调整后的第一子特征信息;以及,
将所述第一子特征信息输入所述第一共享层得到第二共享信息,并基于所述第二共享信息对所述第二子特征信息进行调整得到调整后的第二子特征信息;
根据所述调整后的第一子特征信息和所述调整后的第二子特征信息确定添加人格特质标签后的每个第一训练文本数据对应的第一特征信息。
4.根据权利要求2所述的方法,其特征在于,所述将添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息,包括:
利用所述第一嵌入层对所述添加情绪标签后的每个第一训练文本数据进行量化处理,得到所述第二训练文本数据对应的第三向量表示;以及,
利用所述第二嵌入层对所述添加情绪标签后的每个第二训练文本数据进行量化处理,得到所述第二训练文本数据对应的第四向量表示;
通过所述第一卷积层对所述第三向量表示进行卷积处理,得到第三子特征信息,以及通过所述第二卷积层对所述第四向量表示进行卷积处理,得到第四子特征信息;
根据所述第三子特征信息和所述第四子特征信息确定所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息。
5.根据权利要求4所述的方法,其特征在于,所述神经网络模型包括第一稠密层和第二稠密层;所述根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布,包括:
利用所述第一稠密层和所述第二稠密层对所述第一特征信息进行特征处理,得到所述第一训练文本数据的人格特质标签对应的第一目标概率分布;以及,
利用所述第一稠密层和所述第二稠密层对所述第二特征信息进行特征处理,得到所述第二训练文本数据的情绪特质标签对应的第二目标概率分布。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一目标概率分布和所述第二目标概率分布对所述神经网络模型进行训练,得到目标预测模型,包括:
根据所述第一训练文本数据的人格特质标签对应的第一目标概率分布和所述第一训练文本数据的人格特质标签,确定第一损失函数;
根据所述第二训练文本数据的情绪特质标签对应的第二目标概率分布和所述第二训练文本数据的情绪特质标签,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数对所述神经网络模型的模型参数进行调整,得到所述目标预测模型。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪,包括:
获取所述第三目标概率分布中的最大概率值,并确定所述第三目标概率分布中的最大概率值对应的人格特质为所述待预测文本数据对应的目标人格特质;
获取所述第四目标概率分布中的最大概率值,并确定所述第四目标概率分布中的最大概率值对应的情绪为所述待预测文本数据对应的目标情绪。
8.一种人格特质和情绪的预测装置,其特征在于,包括:
获取模块,用于获取第一训练样本集和第二训练样本集;其中,所述第一训练样本集包括多个第一训练文本数据,所述第二训练样本集包括多个第二训练文本数据;
添加模块,用于对所述第一训练样本集中的每个第一训练文本数据添加人格特质标签,并对所述第二训练样本集中的每个第二训练文本数据添加情绪标签;
训练模块,用于将所述添加人格特质标签后的每个第一训练文本数据输入神经网络模型,得到所述添加人格特质标签后的每个第一训练文本数据对应的第一特征信息;所述第一特征信息基于第一子特征信息和第二子特征信息得到,所述第一子特征信息基于所述神经网络模型中的第一嵌入层和第一卷积层对所述第一训练文本数据进行处理得到,所述第二子特征信息基于所述神经网络模型中的第二嵌入层和第二卷积层对所述第一训练文本数据进行处理得到;
所述训练模块,还用于将所述添加情绪标签后的每个第二训练文本数据输入所述神经网络模型,得到所述添加情绪标签后的每个第二训练文本数据对应的第二特征信息;所述第二特征信息基于第三子特征信息和第四子特征信息得到,所述第三子特征信息基于所述神经网络模型中的所述第一嵌入层和所述第一卷积层对所述第二训练文本数据进行处理得到,所述第四子特征信息基于所述神经网络模型中的所述第二嵌入层和所述第二卷积层对所述第二训练文本数据进行处理得到;
所述训练模块,还用于根据所述第一特征信息和所述第二特征信息,确定所述第一训练文本数据的人格特质标签对应的第一目标概率分布,以及与所述第二训练文本数据的情绪特质标签对应的第二目标概率分布,并根据所述第一目标概率分布和所述第二目标概率分布对所述神经网络模型进行训练,得到目标预测模型;
预测模块,用于获取待预测文本数据,并将所述待预测文本数据输入所述目标预测模型,得到所述待预测文本数据的人格特质对应的第三目标概率分布,和所述待预测文本数据的情绪对应的第四目标概率分布,以及根据所述第三目标概率分布确定所述待预测文本数据对应的目标人格特质,以及根据所述第四目标概率分布确定所述待预测文本数据对应的目标情绪。
9.一种计算机设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110606779.1A CN113221560B (zh) | 2021-05-31 | 2021-05-31 | 人格特质和情绪的预测方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110606779.1A CN113221560B (zh) | 2021-05-31 | 2021-05-31 | 人格特质和情绪的预测方法、装置、计算机设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113221560A CN113221560A (zh) | 2021-08-06 |
CN113221560B true CN113221560B (zh) | 2023-04-18 |
Family
ID=77082007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110606779.1A Active CN113221560B (zh) | 2021-05-31 | 2021-05-31 | 人格特质和情绪的预测方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113221560B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018060993A1 (en) * | 2016-09-27 | 2018-04-05 | Faception Ltd. | Method and system for personality-weighted emotion analysis |
WO2020119563A1 (zh) * | 2018-12-14 | 2020-06-18 | 深圳壹账通智能科技有限公司 | 一种基于神经网络模型的应聘者评估方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9812151B1 (en) * | 2016-11-18 | 2017-11-07 | IPsoft Incorporated | Generating communicative behaviors for anthropomorphic virtual agents based on user's affect |
CN110968689A (zh) * | 2018-09-30 | 2020-04-07 | 北京国双科技有限公司 | 罪名及法条预测模型的训练方法以及罪名及法条预测方法 |
CN110275953B (zh) * | 2019-06-21 | 2021-11-30 | 四川大学 | 人格分类方法及装置 |
CN110929030B (zh) * | 2019-11-07 | 2022-05-03 | 电子科技大学 | 一种文本摘要和情感分类联合训练方法 |
CN111897933B (zh) * | 2020-07-27 | 2024-02-06 | 腾讯科技(深圳)有限公司 | 情感对话生成方法、装置及情感对话模型训练方法、装置 |
CN112182229A (zh) * | 2020-11-05 | 2021-01-05 | 江西高创保安服务技术有限公司 | 一种文本分类模型构建方法、文本分类方法及装置 |
-
2021
- 2021-05-31 CN CN202110606779.1A patent/CN113221560B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018060993A1 (en) * | 2016-09-27 | 2018-04-05 | Faception Ltd. | Method and system for personality-weighted emotion analysis |
WO2020119563A1 (zh) * | 2018-12-14 | 2020-06-18 | 深圳壹账通智能科技有限公司 | 一种基于神经网络模型的应聘者评估方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113221560A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110929164A (zh) | 一种基于用户动态偏好与注意力机制的兴趣点推荐方法 | |
CN111368996A (zh) | 可传递自然语言表示的重新训练投影网络 | |
KR20180125905A (ko) | 딥 뉴럴 네트워크(Deep Neural Network)를 이용하여 문장이 속하는 클래스(class)를 분류하는 방법 및 장치 | |
US9672467B2 (en) | Systems and methods for creating and implementing an artificially intelligent agent or system | |
CN109344893B (zh) | 一种基于移动终端的图像分类方法 | |
US11423307B2 (en) | Taxonomy construction via graph-based cross-domain knowledge transfer | |
CN111914562B (zh) | 电子信息分析方法、装置、设备及可读存储介质 | |
CN113822315A (zh) | 属性图的处理方法、装置、电子设备及可读存储介质 | |
CN112418059A (zh) | 一种情绪识别的方法、装置、计算机设备及存储介质 | |
CN111950295A (zh) | 一种训练自然语言处理模型的方法和系统 | |
EP4198906A1 (en) | Image generation based on ethical viewpoints | |
CN114048729A (zh) | 医学文献评价方法、电子设备、存储介质和程序产品 | |
CN110929532B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112995414A (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN113362852A (zh) | 一种用户属性识别方法和装置 | |
CN112307738B (zh) | 用于处理文本的方法和装置 | |
CN116913278B (zh) | 语音处理方法、装置、设备和存储介质 | |
CN114444476A (zh) | 信息处理方法、装置和计算机可读存储介质 | |
CN113762503A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN117556036A (zh) | 摘要生成模型的训练方法、摘要生成方法、装置及设备 | |
CN113221560B (zh) | 人格特质和情绪的预测方法、装置、计算机设备及介质 | |
CN113821498A (zh) | 数据的筛选方法、装置、设备及介质 | |
CN107609645B (zh) | 用于训练卷积神经网络的方法和装置 | |
CN114996435A (zh) | 基于人工智能的信息推荐方法、装置、设备及存储介质 | |
CN116778264B (zh) | 基于类增学习的对象分类方法、图像分类方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |