CN112035634A

CN112035634A - 文本情绪检测方法、装置、设备及存储介质

Info

Publication number: CN112035634A
Application number: CN202010884325.6A
Authority: CN
Inventors: 刘兵; 李帅
Original assignee: Kangjian Information Technology Shenzhen Co Ltd
Current assignee: Kangjian Information Technology Shenzhen Co Ltd
Priority date: 2020-08-28
Filing date: 2020-08-28
Publication date: 2020-12-04

Abstract

本发明涉及数据分析领域，公开了一种文本情绪检测方法、装置、设备及存储介质。本方法包括：获取医患双方的问诊数据，通过预置情绪探测算法对问诊数据进行情绪识别确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；同时，将通过对问诊数据进行语义分析，并基于预置规则得到问诊数据的第二情绪识别结果进行拟合，确定问诊数据(也即医患双方)对应的实时情绪状态，当检测到实时情绪状态为负性情绪且负性情绪的情绪强度超过触发预警阈值，则控制预警中心发出情绪波动提示。本发明可以实时探测到问诊系统参与双方的情绪倾向，从而提供实时干预机制的技术问题。其中，医患双方的问诊数据可存储于区块链节点中。

Description

文本情绪检测方法、装置、设备及存储介质

技术领域

本发明涉及数据分析领域，尤其涉及一种文本情绪检测方法、装置、设备及存储介质。

背景技术

众所周知，人类利用自然语言进行交流的时候，除了信息量的交换以外，还有情绪因素的相互传递。比如，对于同一个事物的描述，对于同一个需求的提出，在不同的情绪支配下，人们会选择不同的自然语言加以表达，而表达的接受者基于其社会经验和主观判断，一般也会具有较大可能性获知自然语言携带的情绪因素，并给予必要的响应。随着社会的发展，越来越多企业单位乃至政府机关的客户服务、问题解答、投诉反馈也都采用文本交互。但是，相比面谈、电话、视频连线等在线交流方式，由于不能获得对方的表情和语调，容易对情绪因素给予忽视或者误判。

对于在线问诊系统，情绪探测是不可或缺的组成部分。通过情绪探测算法，一方面可以捕捉到患者在问诊过程中的情绪变化及心理动向，为进一步妥善引导问诊提供有益支撑；另一方面，可以监控医务人员回答问题的专业程度，对于出现急躁、讥讽等负面情绪的情况及时发现并干预，从而改善服务质量，提高客户满意度。目前在市面上虽然有电话客服等语音客服系统，但是客户需要经过较长的导航选项才能体验到人工服务，此时用户的情绪倾向是未知的。新兴的人工智能客服系统则一定程度上考虑了用户的情绪倾向，但往往缺少对客服人员的情绪监控，无法提供实时干预机制，从而可能造成服务质量问题。

发明内容

本发明的主要目的在于解决现有的在线问诊业务中，无法实现医患双方的情绪监控，而导致问诊的诊断结果存在误差的技术问题。

本发明第一方面提供了一种文本情绪检测方法，包括：

获取问诊数据，其中，所述问诊数据为目标用户的问诊记录；

通过预置情绪探测算法，确定所述问诊数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果；

对所述问诊数据进行特征提取，获得所述问诊数据中携带的情绪标签，并将所述情绪标签与预置规则进行匹配，得到所述问诊数据的第二情绪识别结果；

将所述第一情绪识别结果和所述第二情绪识别结果进行拟合，确定所述问诊数据对应的实时情绪状态；

判断所述实时情绪状态是否为负性情绪且所述负性情绪的情绪状态强度触发预警阈值；

若所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

可选地，在本发明第一方面的第一种实现方式中，在所述获取问诊数据之后，还包括：

判断所述问诊数据是否为文本数据；

若所述问诊数据为语音数据，则对所述问诊数据进行音转文处理，得到所述问诊数据对应的文本数据。

可选地，在本发明第一方面的第二种实现方式中，所述通过预置情绪探测算法，确定所述问诊数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果包括：

通过预设正则表达式从所述文本数据中确定目标文本数据，其中，所述正则表达式用于表示目标情绪类别的表达规则；

对所述目标文本数据进行向量化处理，得到所述目标文本数据的第一特征向量；

基于预置情绪探测算法和所述目标文本数据的第一特征向量，得到所述目标文本数据的类别置信度向量，其中，所述类别置信度向量中的每个元素的值用于表示所述目标文本数据属于该元素对应的预设情绪类别的概率；

将所述类别置信度向量中值最大的元素对应的预设情绪类别确定为所述目标文本数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果。

可选地，在本发明第一方面的第三种实现方式中，所述对所述问诊数据进行特征提取，获得所述问诊数据中携带的情绪标签，并将所述情绪标签与预置规则进行匹配，得到所述问诊数据的第二情绪识别结果包括：

对所述问诊数据进行语义解析，得到所述问诊数据的关键词；

利用预置特征提取算法，对所述问诊数据的关键词进行特征提取，生成所述问诊数据的特征词；

基于预制规则，将所述特征词与预置情绪特征库中的特征样本进行匹配，得到与每个所述特征词匹配的特征样本相应的情绪标签；

基于所述特征词匹配的情绪标签，确定所述问诊数据的情绪倾向；

基于所述问诊数据的情绪倾向，确定所述问诊数据所述情绪类别的置信度，得到所述问诊数据的第二情绪识别结果。

可选地，在本发明第一方面的第四种实现方式中，所述基于所述特征词匹配的情绪标签，确定所述问诊数据的情绪倾向包括：

基于所述特征词匹配的情绪标签，确定所述问诊数据对应的多个情绪标签；

所述问诊数据对应的多个情绪标签，输出所述情绪标签的概率分布图；

基于所述概率分布图，将每一个所述情绪标签的概率值进行排序，选取大于预设情绪阈值的概率值对应的情绪标签，确定所述问诊数据的情绪倾向。

可选地，在本发明第一方面的第五种实现方式中，所述判断所述实时情绪状态是否为负性情绪且所述负性情绪的情绪状态强度触发预警阈值包括：

判断所述问诊数据的实时情绪状态是否为负性情绪；

若所述问诊数据的实时情绪状态为负性情绪，则判断所述负性情绪的情绪状态强度是否触发预警阈值。

本发明第二方面提供了一种文本情绪检测装置，包括：

获取模块，用于获取问诊数据，其中，所述问诊数据为目标用户的问诊记录；

确定模块，用于通过预置情绪探测算法，确定所述问诊数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果；

匹配模块，用于对所述问诊数据进行特征提取，获得所述问诊数据中携带的情绪标签，并将所述情绪标签与预置规则进行匹配，得到所述问诊数据的第二情绪识别结果；

拟合模块，用于将所述第一情绪识别结果和所述第二情绪识别结果进行拟合，确定所述问诊数据对应的实时情绪状态；

判断模块，用于判断所述实时情绪状态是否为负性情绪且所述负性情绪的情绪状态强度触发预警阈值；

警示模块，用于当所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

可选地，在本发明第二方面的第一种实现方式中，所述文本情绪检测装置还包括：

判断模块，用于判断所述问诊数据是否为文本数据；若所述问诊数据为语音数据，则对所述问诊数据进行音转文处理，得到所述问诊数据对应的文本数据。

可选地，在本发明第二方面的第二种实现方式中，所述确定模块具体用于：

可选地，在本发明第二方面的第三种实现方式中，所述匹配模块包括：

语义解析单元，用于对所述问诊数据进行语义解析，得到所述问诊数据的关键词；

特征提取单元，用于利用预置特征提取算法，对所述问诊数据的关键词进行特征提取，生成所述问诊数据的特征词；

匹配单元，用于基于预制规则，将所述特征词与预置情绪特征库中的特征样本进行匹配，得到与每个所述特征词匹配的特征样本相应的情绪标签；

确定单元，用于基于所述特征词匹配的情绪标签，确定所述问诊数据的情绪倾向；基于所述问诊数据的情绪倾向，确定所述问诊数据所述情绪类别的置信度，得到所述问诊数据的第二情绪识别结果。

可选地，在本发明第二方面的第四种实现方式中，所述确定单元具体用于：

可选地，在本发明第二方面的第五种实现方式中，所述判断模块具体用于：

判断所述问诊数据的实时情绪状态是否为负性情绪；

本发明第三方面提供了一种文本情绪检测设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述文本情绪检测设备执行上述的文本情绪检测方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的文本情绪检测方法。

本发明提供的技术方案中，通过获取医患双方的问诊数据，通过预置情绪探测算法对问诊数据进行情绪识别确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；同时，将通过对问诊数据进行语义分析，并基于预置规则得到问诊数据的第二情绪识别结果进行拟合，确定问诊数据(也即医患双方)对应的实时情绪状态，当检测到实时情绪状态为负性情绪且负性情绪的情绪强度超过触发预警阈值，则控制预警中心发出情绪波动提示。可以实时探测到问诊系统参与双方的情绪倾向，从而提供实时干预机制的技术问题。

附图说明

图1为本发明文本情绪检测方法的第一个实施例示意图；

图2为本发明文本情绪检测方法的第二个实施例示意图；

图3为本发明文本情绪检测方法的第三个实施例示意图；

图4为本发明文本情绪检测方法的第四个实施例示意图；

图5为本发明文本情绪检测方法的第五个实施例示意图；

图6为本发明文本情绪检测装置的第一个实施例示意图；

图7为本发明文本情绪检测装置的第二个实施例示意图；

图8为本发明文本情绪检测设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种文本情绪检测方法、装置、设备及存储介质，本发明的技术方案中，先获取医患双方的问诊数据，通过预置情绪探测算法对问诊数据进行情绪识别确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；同时，将通过对问诊数据进行语义分析，并基于预置规则得到问诊数据的第二情绪识别结果进行拟合，确定问诊数据(也即医患双方)对应的实时情绪状态，当检测到实时情绪状态为负性情绪且负性情绪的情绪强度超过触发预警阈值，则控制预警中心发出情绪波动提示。可以实时探测到问诊系统参与双方的情绪倾向，从而提供实时干预机制的技术问题。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中文本情绪检测方法的第一个实施例包括：

101、获取问诊数据，其中，问诊数据为目标用户的问诊记录；

本实施例中，问诊数据是指在指定APP中用户与APP中医疗人员的实时交流过程中获得的问诊数据，包括但不限于用户的个人信息，病情病症以及医务人员对用户的诊断结果等医疗数据，其中，所涉及的问诊记录为与医疗业务相关的咨询诊断数据。具体的，可以包括但不限于：用户之前所购买过的医药药品数据，用户咨询过的医疗信息数据，医务人员根据用户的个人(病情，病症)的诊断数据等。

情绪探测(emotion detection)是自然语言处理领域的典型任务，旨在判断文本的情绪倾向性，如高兴、愤怒、悲伤等，是基于心理学模型的细粒度的情感识别。对于在线问诊系统，情绪探测是不可或缺的组成部分。通过情绪探测算法，一方面可以捕捉到患者在问诊过程中的情绪变化及心理动向，为进一步妥善引导问诊提供有益支撑；另一方面，可以监控医务人员回答问题的专业程度，对于出现急躁、讥讽等负面情绪的情况及时发现并干预，从而改善服务质量，提高客户满意度。

本实施例中的文本情绪识别方法，可以应用于QQ、微信、电子邮件等网络和即时通信工具中，对交互过程中产生的自然语言文本中包含的用户的情绪进行识别和监测，并做出实际的干预。比如，在线问诊系统中，医患双方：用户(患者)A和用户(医务人员)B在聊天过程中，可以分别通过用户(患者)A和用户(医务人员)B的自然语言文本来识别用户(患者)A和用户(医务人员)B的情绪，并在用户(医务人员)B的交互界面给予必要的提示，一方面可以捕捉到患者在问诊过程中的情绪变化及心理动向，为进一步妥善引导问诊提供有益支撑；另一方面，可以监控医务人员回答问题的专业程度，对于出现急躁、讥讽等负面情绪的情况及时发现并干预，从而改善服务质量。再比如，在线问诊系统中，对于用户(医务人员)B来说，如果文本交互过程中识别出客户的情绪精确分类出现了急躁发怒的情绪，则可以及时发送安抚性语句、声音。当对自然语言文本中的情绪进行识别时，首先需要获取需要进行情绪识别的自然语言文本，即目标文本数据，所述目标文本数据为在线问诊系统中医患人员的文本交互信息。

102、通过预置情绪探测算法，确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；

本实施例中，情绪探测算法是一种基于神经网络算法来对自然语言文本数据进行情绪和情境识别的一种算法。

本实施例中，当获取到目标文本数据后，由于目标文本数据中的有些词能体现用户的情绪(这些词为情绪词)，有些词则不能体现用户的情绪(这些词为非情绪词)。因此，需要对目标文本数据中进行语义解析，将目标文本数据中的词分为情绪词和非情绪词，再根据情绪探测算法，对目标文本数据进行计算，确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果。具体地，比如，可以预先建立与每一种常见情绪类别对应的情绪词库，例如，情绪类别可以分为中性情绪，负面情绪，正面情绪；包括但不限于高兴、悲伤、感谢、惊讶、恐惧、痛苦、厌恶、轻视、趋近、逃避、忌妒、羡慕、依赖、激怒、焦虑等等；对应的情绪词库收录该情绪类别的支配下人们惯常采用的词语及网络用语，例如正面情绪类别对应的情绪词库可以收录“哈哈”、“爽”、“幸福”等词语作为情绪词；负面情绪类别对应的情绪词库可以收集“来气”、“气死了”、“太气人”乃至某些不文明用语作为情绪词；对于悲伤类别的情绪词库可以收集“郁闷”、“大哭”、“不活了”等情绪词等。然后通过将目标文本数据中的词逐一与预先建立的每一种常见情绪类别对应的情绪词库中的情绪词进行匹配，以此来对目标文本数据中的情绪词进行区分，将情绪词划分为多个类别，将剩余的词则确定为非情绪词，对于每一个非情绪词，将距离该非情绪词最近的情绪词所属的类别作为该非情绪词的类别。

103、对问诊数据进行特征提取，获得问诊数据中携带的情绪标签，并将情绪标签与预置规则进行匹配，得到问诊数据的第二情绪识别结果；

本实施例中，对问诊数据进行情绪识别，提取目标文本数据的特征词或语义特征等，得到问诊数据中携带的多个情绪标签，并根据预先编写好的规则对问诊数据进行情绪识别，得到对应的情绪识别结果，确定用户情绪信息。

本实施例中，用户情绪信息是指在在线问诊系统中，医患双方在沟通过程中的情绪信息，一方面可以捕捉到患者在问诊过程中的情绪变化及心理动向，为进一步妥善引导问诊提供有益支撑；另一方面，可以监控医务人员回答问题的专业程度，对于出现急躁、讥讽等负面情绪的情况及时发现并干预，从而改善服务质量。比如，对话过程中，患者说“妊娠期糖尿病的发病机制是什么呢，如何预防，真的好担心”，则判定用户的情绪信息是焦虑的，属于负面情绪；若医务人员回答的是“这只是个小病，只要你在孕期控制糖分摄入，适量摄入水果，正常吃饭就行ˉ不用杞人忧天”或者“妊娠性糖尿病是可以预防的，不是大问题，没必要担心，你也太胆小了，别生孩子算了”，此时医务人员的态度是不耐烦的或者在讥讽患者，在出现这种急躁、讥讽等负面情绪的情况及时发现并干预，规范医务人员的言行，从而改善服务质量。

104、将第一情绪识别结果和第二情绪识别结果进行拟合，确定问诊数据对应的实时情绪状态；

本实施例中，综合考虑情绪探测算法和规则中心传入的结果，原则上人工规则优先级高于算法。

本实施例中的“拟合”就是简单地根据一定规则和优先级，对多个结果进行合并。

105、判断实时情绪状态是否为负性情绪且负性情绪的情绪状态强度触发预警阈值；

本实施例中，实时情绪状态是指在线问诊系统中，医患双方在沟通过程中的实时情绪。例如，对话过程中，患者说“股骨头坏死的发病机制是什么呢，如何预防，真的好担心”，则判定用户的情绪信息是焦虑的，属于负面情绪；若医务人员回答的是“股骨头坏死目前是可控制的，只要养成良好的生活习惯和饮食习惯，注意运动，控制血脂，避免脂肪阻塞血管及影响骨和软骨的血供就可以有效预防ˉ不用杞人忧天”；用户接着说“真的假的，就这么简单，你不会是忽悠我的吧”；医务人员说“你不信我的，还来咨询我干嘛，真是不可理喻”，此时医务人员的情绪为负性情绪，此时我们需要根据“干嘛”、“不可理喻”等关键情绪标签判断医务人员的这种负性情绪的情绪状态强度。

106、当所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值，则向控制预警中心发出情绪波动提示。

本实施例中，实时情绪状态是指在线问诊系统中，医患双方在沟通过程中的实时情绪。例如，对话过程中，患者说“股骨头坏死的发病机制是什么呢，如何预防，真的好担心”，则判定用户的情绪信息是焦虑的，属于负面情绪；若医务人员回答的是“股骨头坏死目前是可控制的，只要养成良好的生活习惯和饮食习惯，注意运动，控制血脂，避免脂肪阻塞血管及影响骨和软骨的血供就可以有效预防ˉ不用杞人忧天”；用户接着说“真的假的，就这么简单，你不会是忽悠我的吧”；医务人员说“你不信我的，还来咨询我干嘛，真是不可理喻”，此时医务人员的情绪为负性情绪，此时我们需要根据“干嘛”、“不可理喻”等关键情绪标签判断医务人员的这种负性情绪的情绪状态强度是否超过了预设的一个预警阈值；比如，某段文本数据中的悲伤类别的强度因数得分总和为85、愤怒类别的强度得分总和为71、高兴得分为0、焦急得分为55、感谢得分为6，根据每一个情绪标签的得分，确定情绪的状态强度。再比如系统设置：当医务人员在出现急躁、讥讽等负面情绪的情况时，系统会即使发送预警请求给医务人员，及时干预，提醒规范医务人员的言行，从而改善服务质量。

本发明实施例中，通过获取医患双方的问诊数据，通过预置情绪探测算法对问诊数据进行情绪识别确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；同时，将通过对问诊数据进行语义分析，并基于预置规则得到问诊数据的第二情绪识别结果进行拟合，确定问诊数据(也即医患双方)对应的实时情绪状态，当检测到实时情绪状态为负性情绪且负性情绪的情绪强度超过触发预警阈值，则控制预警中心发出情绪波动提示。可以实时探测到问诊系统参与双方的情绪倾向，从而提供实时干预机制的技术问题。

请参阅图2，本发明实施例中文本情绪检测方法的第二个实施例包括：

201、获取问诊数据；

202、判断问诊数据是否为文本数据；

本实施例中，本发明是针对文本数据进行的一种情绪识别和干预方法，所以，在对收集到的问诊数据进行情绪识别之前，首先要确定问诊数据的数据类型。数据类型有可能是文本数据，也有可能是语音数据。

203、若问诊数据为语音数据，则对问诊数据进行音转文处理，得到问诊数据对应的文本数据；

本实施例中，可以采用语音识别算法对各条原始音频数据进行音转文处理，进而得到各条问诊数据对应的文本数据。

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

204、通过预置情绪探测算法，确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；

205、对问诊数据进行特征提取，获得问诊数据中携带的情绪标签，并将情绪标签与预置规则进行匹配，得到问诊数据的第二情绪识别结果；

206、将第一情绪识别结果和第二情绪识别结果进行拟合，确定问诊数据对应的实时情绪状态；

207、判断实时情绪状态是否为负性情绪且负性情绪的情绪状态强度触发预警阈值；

208、当实时情绪状态为负性情绪且负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

本实施例中步骤204-208与第一实施例中的步骤102-106类似，此处不再赘述。

请参阅图3，本发明实施例中文本情绪检测方法的第三个实施例包括：

301、获取问诊数据；

302、通过预置情绪探测算法，确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；

303、对问诊数据进行语义解析，得到问诊数据的关键词；

本实施例中，接收对问诊数据的语义解析请求，并获取所述自然语言信息对应的语义场景；在对应的语义场景下，利用预设的语义解析方式对问诊数据进行解析，根据预设的关键字和筛选值之间的对应关系，得到符合问诊数据的语义解析结果。

不同的语义场景对应不同的语义解析方式，服务器可获取预先设置的语义场景和语义解析方式之间的对应关系，并根据所获取的预先设置的语义场景和语义解析方式之间的对应关系，获取与语义场景对应的语义解析方式。服务器在对应的语义场景下，利用与语义场景对应的语义解析方式，对用户输入的自然语言信息进行语义解析。

具体地，服务器根据最大关联度值对应的语义场景和语义解析方式之间的对应关系，来获取与最大关联度值对应的语义场景对应的语义解析方式。根据语义解析方式对自然语言信息进行解析，获得原始语义解析结果。利用预设的检验规则对原始语义解析结果进行初始检验，获取符合预设的检验规则的原始语义解析结果，并根据符合预设的检验规则的原始语义解析结果，得到语义解析结果，进一步地，根据语义解析结果，得到问诊数据中的关键字。

304、利用预置特征提取算法，对问诊数据的关键词进行特征提取，生成问诊数据的特征词；

本实施例中，所涉及的特征提取算法可以包括但不限于：N-Gram算法。在网站或者应用APP中，用户在问诊界面可以输入其想要搜索的内容。具体的方式，可以根据问诊数据的易于分解结果，得到问诊数据对应的关键词。基于N-Gram算法可以对其进行特征提取，得到相应的Unigram特征、Bigram特征、Trigram特征等；其中，每个Unigram特征包含一个字，每个Bigram特征包含两个字，每个Trigram特征包含三个字。

305、基于预制规则，将特征词与预置情绪特征库中的特征样本进行匹配，得到与每个特征词匹配的特征样本相应的情绪标签；

本实施例中，情绪特征库中保存了各个类别的特征词的特征样本，每个特征样本关联于一个类别的情绪标签。将特征词与情绪特征库中的特征样本进行匹配，可以通过欧氏距离或者汉明距离等计算特征词与特征样本的相似度，进而得到与每个特征词匹配的多个特征样本(如相似度大于50％的特征样本)相应的情绪标签，这样可以获取到每个特征向量所表现的多个具有嫌疑的情绪，进而可以指导后续步骤中识别到医患双方潜在的各种隐藏的情绪。

本实施例中，分别将特征词与情绪特征库中的特征样本进行匹配，得到与每个特征词匹配的特征样本相应的情绪标签，包括：分别将特征词与情绪特征库中的特征样本进行对比，得到与每个特征词相似度超过预定阈值的多个特征样本，预定阈值与特征词的个数对应；从情绪特征库中获取每个特征样本对应的情绪标签。

预定阈值可以根据精确度需求进行设定，预定阈值与特征词的个数对应，即预定阈值的取值通过特征词的个数决定，可以是特征词的个数越多，预定阈值的取值越小。这样通过分别将特征词与情绪特征库中的特征样本进行对比，得到与每个特征词相似度超过预定阈值的多个特征样本，然后，从情绪特征库中获取每个特征样本对应的情绪标签，可以保证每个特征词的情绪识别可靠性。

306、基于特征词匹配的情绪标签，确定问诊数据对应的多个情绪标签；

本实施例中，特征词匹配的情绪标签是指每一个特征词所对应的情绪。比如，某段文本数据中可能包含生气(anger)、无聊(boredom)、厌恶(disgust)、害怕(fear)、开心(joy)、中性(neutral)和伤心(sadness)共七种情绪，那么，该段文本数据的特征词对应的情绪标签有7个，分别为生气(anger)、无聊(boredom)、厌恶(disgust)、害怕(fear)、开心(joy)、中性(neutral)和伤心(sadness)。

307、基于问诊数据对应的多个情绪标签，输出情绪标签的概率分布图；

本实施例中，根据问诊数据对应的情绪标签，输出该段问诊数据对应的情绪标签的概率分布图。例如：可以得到本段问诊数据包含的情绪标签分别为，“开心”情绪标签的概率为0.522，“惊喜”情绪标签的概率为0.12，“平静”情绪标签的概率为0.32，“愤怒”情绪标签的概率为0.018，“厌烦”情绪标签的概率为0.01，“伤心”情绪标签的概率为0.01，此时，根据每一种标签的概率值输出对应的概率分布图。

308、基于概率分布图，将每一个情绪标签的概率值进行排序，选取大于预设情绪阈值的概率值对应的情绪标签，确定问诊数据的情绪倾向；

本实施例中，通过对每一种情绪进行计算，得到每个不同情绪的概率值，选取大于预设情绪阈值的概率值作为本段文本数据对应的情绪。预设情绪阈值的概率值为本领域技术人员可根据实际需要和经验设定的(预制规则)。比如，可以设定所述概率值为70％，则将大于70％的情绪确定为最终的情绪识别信息。若存在多个大于预设情绪阈值的概率值；则选取多个概率值的平均概率值所对应的情绪作为本段文本数据的情绪识别结果。需要说明的是，若存在多个情绪大于预设的概率值，例如，生气概率值80％，厌恶概率值为75％，其均大于70％的阈值，则选择概率值最大的作为最终的情绪，确定问诊数据的情绪倾向。

309、基于问诊数据的情绪倾向，确定问诊数据情绪类别的置信度，得到问诊数据的第二情绪识别结果；

本实施例中，“置信度”是统计学概念，在本发明中可以简单认为是预测结果的可信赖程度，比如0.95就是95％的概率支持预测结果；“生效范围”就是字面意思，是指预警信息通知的范围，即可影响到的人群；人工编写干预规则后，决策算法对每个请求都会判断其是否触发人工规则，如果是，就以此为准，实现实时干预。

310、将第一情绪识别结果和第二情绪识别结果进行拟合，确定问诊数据对应的实时情绪状态；

311、判断实时情绪状态是否为负性情绪且负性情绪的情绪状态强度触发预警阈值；

312、当实时情绪状态为负性情绪且负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

本实施例中步骤301-302和310-312与第一实施例中的步骤101-102和步骤104-106类似，此处不再赘述。

请参阅图4，本发明实施例中文本情绪检测方法的第四个实施例包括：

401、获取问诊数据；

402、通过预设正则表达式从文本数据中确定目标文本数据，其中，正则表达式用于表示目标情绪类别的表达规则；

本实施例中，为了提高情绪识别模型对目标情绪类别的文本数据的情绪识别的准确率，本发明实施例在采用情绪识别模型对文本数据所表达的情绪所属的情绪类别进行预测之前，先通过预设正则表达式对音转文处理得到的文本数据进行粗过滤，进而从音转文得到的所有文本数据中确定出目标文本数据。其中，目标情绪类别为预设情绪类别中的其中一种情绪类别。预设情绪类别可以根据实际需求设置，此次不做限制，例如，预设情绪类别可以包括正面情绪及负面情绪，而目标情绪类别可以是正面情绪，也可以是负面情绪。

本发明实施例中，预设正则表达式用于表征目标情绪类别的表达规则。在实际应用中，预设正则表达式可以由能够表达目标情绪类别的一个或多个情绪关键词构成。例如，当需要从待识别的文本数据中过滤出负面情绪文本，即目标情绪类别为负面情绪时，预设正则表达式可以由能够表达负面情绪的一个或多个负面情绪关键词构成，也就是说，预设正则表达式用于从待识别的文本数据中筛选出符合目标情绪类别的表达规则的目标文本数据。

需要说明的是，目标情绪类别及预设正则表达式可以根据实际业务场景确定，例如，有些业务场景对负面情绪识别的准确率或召回率要求较高，则在该业务场景下，可以将目标情绪类别设置为负面情绪，预设正则表达式由能够表达负面情绪的一个或多个负面情绪关键词构成；有些业务场景对正面情绪识别的准确率或召回率要求较高，则在该业务场景下，可以将目标情绪类别设置为正面情绪，预设正则表达式由能够表达正面情绪的一个或多个负面情绪关键词构成。不同业务场景对应的预设正则表达式通常不同。

本发明实施例中，终端设备得到各条问诊数据对应的文本数据后，基于预设正则表达式，从所有问诊数据对应的文本数据中筛选出符合预设正则表达式的目标文本数据。由于预设正则表达式由能够表达目标情绪类别的一个或多个情绪关键词构成，因此，通过预设正则表达式从所有问诊数据对应的文本数据中筛选目标文本数据的步骤具体可以包括：将构成预设正则表达式的所有情绪关键词与每条原始音频数据对应的文本数据进行对比，判断每条原始音频数据对应的文本数据中是否包含构成预设正则表达式的所有情绪关键词。

403、对目标文本数据进行向量化处理，得到目标文本数据的第一特征向量；

本实施例中，目标文本数据的第一特征向量是目标文本数据所表达的含义的数字化向量表示。本发明实施例中，由于通过音频输入设备采集到的原始音频数据一般较为口语化，因此，对原始音频数据进行音转文处理得到的文本数据的语法结构通常不规范，基于此，本发明实施例可以基于目标文本数据中单个字的字向量确定目标文本数据的第一特征向量。具体的，终端设备可以基于预先训练好的字向量模型确定目标文本数据所包含的各个字的字向量，再将目标文本数据所包含的所有字的字向量按照目标文本数据中各个字的排列顺序进行组合，进而得到目标文本数据的第一特征向量，即目标文本数据的第一特征向量由目标文本数据中包含的所有字的字向量构成。在实际应用中，字向量模型可以是基于word2vec训练的字向量模型。

404、基于预置情绪探测算法和目标文本数据的第一特征向量，得到目标文本数据的类别置信度向量；

本实施例中，将各目标文本数据的第一特征向量导入预先训练的情绪识别模型，得到各条所述目标文本数据的类别置信度向量。情绪识别模型是基于目标样本集，采用深度学习算法对预先构建的卷积神经网络模型进行训练得到的。其中，目标样本集中的每条样本数据均由一条文本数据及该文本数据的类别置信度向量构成，类别置信度向量中的每个元素的值用于表示文本数据属于该元素对应的预设情绪类别的概率。本发明实施例中，目标样本集中的每条文本数据的情绪类别均为目标情绪类别。

在对卷积神经网络模型进行训练时，将每条样本数据中的文本数据作为卷积神经网络模型的输入，将每条样本数据中的文本数据的置信度向量作为卷积神经网络模型的输出，对卷积神经网络模型进行训练，将训练完成的卷积神经网络模型确定为情绪识别模型。需要说明的是，终端设备在对卷积神经网络模型的训练过程中可以学习到各个预设卷积核的卷积核参数及绝大多数文本数据的深度特征向量对应的类别置信度向量，即学习到绝大多数文本数据的深度特征向量与类别置信度向量之间的对应关系。其中，文本数据的深度特征向量是通过对文本数据的第一特征向量进行深度卷积处理得到的。

本发明实施例中，终端设备确定了各条目标文本数据的第一特征向量后，将各条目标文本数据的第一特征向量分别导入情绪识别模型，在情绪识别模型中对每条文本数据的第一特征向量进行深度卷积处理，进而得到每条文本数据的深度特征向量，并基于预先学习到的各条文本数据的深度特征向量与各个类别置信度向量之间的对应关系，确定每条目标文本数据的类别置信度向量。

405、将类别置信度向量中值最大的元素对应的预设情绪类别确定为目标文本数据所属的情绪类别，得到问诊数据的第一情绪识别结果；

本实施例中，由于目标文本数据的类别置信度向量中的每个元素的值用于表示目标文本数据属于该元素对应的预设情绪类别的概率，因此，类别置信度向量中某一元素的值越大，表明目标文本数据属于该元素对应的预设情绪类别的可能性就越大。本发明实施例中，终端设备得到目标文本数据的类别置信度向量后，可以将类别置信度向量中值最大的元素对应的预设情绪类别确定为目标文本数据所属的情绪类别。

406、对问诊数据进行特征提取，获得问诊数据中携带的情绪标签，并将情绪标签与预置规则进行匹配，得到问诊数据的第二情绪识别结果；

407、将第一情绪识别结果和第二情绪识别结果进行拟合，确定问诊数据对应的实时情绪状态；

408、判断实时情绪状态是否为负性情绪且负性情绪的情绪状态强度触发预警阈值；

409、当实时情绪状态为负性情绪且负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

本实施例中步骤406-409与第一实施例中的步骤103-106类似，此处不再赘述。

请参阅图5，本发明实施例中文本情绪检测方法的第五个实施例包括：

501、获取问诊数据；

502、通过预置情绪探测算法，确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；

503、对问诊数据进行特征提取，获得问诊数据中携带的情绪标签，并将情绪标签与预置规则进行匹配，得到问诊数据的第二情绪识别结果；

504、将第一情绪识别结果和第二情绪识别结果进行拟合，确定问诊数据对应的实时情绪状态；

505、判断问诊数据的实时情绪状态是否为负性情绪；

本实施例中，根据情绪识别结果，判断问诊数据的实时情绪状态是否为负性情绪。心理学上将“生气(anger)、无聊(boredom)、厌恶(disgust)、害怕(fear)、伤心(sadness)”等情绪统称为负性情绪。

506、若问诊数据的实时情绪状态为负性情绪，则判断负性情绪的情绪状态强度是否触发预警阈值；

本实施例中，如果问诊数据的实时情绪状态为负性情绪，则对该负性情绪的情绪状态强度进行计算，判断该负性情绪的情绪状态强度是否触发预设的预警阈值，以决定是否控制预警中心发出情绪波动提示。若触发预设的预警阈值，则控制预警中心发出情绪波动提示。进一步地，预警中心监听决策算法的预警请求，根据其传递的请求参数触发预警机制，预警形式包括但不限于短信、微信、邮件通知、报警电话等。比如，在线问诊系统中，医患交流过程中，可以及时和有效的跟踪和监测问诊过程中医务人员和患者的情绪状态，无需聘请专门的质检人员对问诊交流过程进行抽样监测。不再给企业带来额外的成本，在问诊进行当中去实时的监测医患双方的情绪状态，当通话中医务人员或患者出现非常负面的情绪时，及时有效的对医务人员进行提醒。

507、若负性情绪的情绪状态强度触发预警阈值，则控制预警中心发出情绪波动提示。

本实施例中，如果问诊数据的实时情绪状态为负性情绪，且该负性情绪的情绪状态强度触发预设的预警阈值，则控制预警中心发出情绪波动提示。预警中心监听决策算法的预警请求，根据其传递的请求参数触发预警机制，预警形式包括但不限于短信、微信、邮件通知、报警电话等。比如，在线问诊系统上，医患交流过程中，可以及时和有效的跟踪和监测问诊过程中医务人员和患者的情绪状态，无需聘请专门的质检人员对问诊交流过程进行抽样监测。不再给企业带来额外的成本，在问诊进行当中去实时的监测医患双方的情绪状态，当通话中医务人员或患者出现非常负面的情绪时，及时有效的对医务人员人员进行提醒。一方面可以捕捉到患者在问诊过程中的情绪变化及心理动向，为进一步妥善引导问诊提供有益支撑；另一方面，可以监控医务人员回答问题的专业程度，对于出现急躁、讥讽等负面情绪的情况及时发现并干预，从而改善服务质量，提高客户满意度。

本实施例中步骤501-504第一实施例中的101-104类似，此处不再赘述。

在本发明实施例中，通过获取医患双方的问诊数据，通过预置情绪探测算法对问诊数据进行情绪识别确定问诊数据所属的情绪类别，得到问诊数据的第一情绪识别结果；同时，将通过对问诊数据进行语义分析，并基于预置规则得到问诊数据的第二情绪识别结果进行拟合，确定问诊数据(也即医患双方)对应的实时情绪状态，当检测到实时情绪状态为负性情绪且负性情绪的情绪强度超过触发预警阈值，则控制预警中心发出情绪波动提示。可以实时探测到问诊系统参与双方的情绪倾向，从而提供实时干预机制的技术问题。

上面对本发明实施例中文本情绪检测方法进行了描述，下面对本发明实施例中文本情绪检测装置进行描述，请参阅图6，本发明实施例中文本情绪检测装置的第一个实施例包括：

获取模块601，用于获取问诊数据，其中，所述问诊数据为目标用户的问诊记录；

确定模块602，用于通过预置情绪探测算法，确定所述问诊数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果；

匹配模块603，用于对所述问诊数据进行特征提取，获得所述问诊数据中携带的情绪标签，并将所述情绪标签与预置规则进行匹配，得到所述问诊数据的第二情绪识别结果；

拟合模块604，用于将所述第一情绪识别结果和所述第二情绪识别结果进行拟合，确定所述问诊数据对应的实时情绪状态；

判断模块605，用于判断所述实时情绪状态是否为负性情绪且所述负性情绪的情绪状态强度触发预警阈值；

警示模块606当所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值时，控制预警中心发出情绪波动提示。

请参阅图7，本发明实施例中文本情绪检测装置的第二个实施例，该文本情绪检测装置具体包括：

警示模块606，用于当所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值时，控制预警中心发出情绪波动提示。

本实施例中，所述文本情绪检测装置还包括：

判断模块607，用于判断所述问诊数据是否为文本数据；若所述问诊数据为语音数据，则对所述问诊数据进行音转文处理，得到所述问诊数据对应的文本数据。

本实施例中，所述确定模块602具体用于：

本实施例中，所述匹配模块603包括：

语义解析单元6031，用于对所述问诊数据进行语义解析，得到所述问诊数据的关键词；

特征提取单元6032，用于利用预置特征提取算法，对所述问诊数据的关键词进行特征提取，生成所述问诊数据的特征词；

匹配单元6033，用于基于预制规则，将所述特征词与预置情绪特征库中的特征样本进行匹配，得到与每个所述特征词匹配的特征样本相应的情绪标签；

确定单元6034，用于基于所述特征词匹配的情绪标签，确定所述问诊数据的情绪倾向；基于所述问诊数据的情绪倾向，确定所述问诊数据所述情绪类别的置信度，得到所述问诊数据的第二情绪识别结果。

本实施例中，所述确定单元6034具体用于：

本实施例中，所述判断模块605具体用于：

判断所述问诊数据的实时情绪状态是否为负性情绪；

上面图6和图7从模块化功能实体的角度对本发明实施例中的文本情绪检测装置进行详细描述，下面从硬件处理的角度对本发明实施例中文本情绪检测设备进行详细描述。

图8是本发明实施例提供的一种文本情绪检测设备的结构示意图，该文本情绪检测设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)810(例如，一个或一个以上处理器)和存储器820，一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中，存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对文本情绪检测设备800中的一系列指令操作。更进一步地，处理器810可以设置为与存储介质830通信，在文本情绪检测设备800上执行存储介质830中的一系列指令操作，以实现上述各方法实施例提供的文本情绪检测方法的步骤。

文本情绪检测设备800还可以包括一个或一个以上电源840，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口860，和/或，一个或一个以上操作系统831，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图8示出的文本情绪检测设备结构并不构成对本申请提供的文本情绪检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行上述文本情绪检测方法的步骤。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所述领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种文本情绪检测方法，其特征在于，所述文本情绪检测方法包括：

2.根据权利要求1所述的文本情绪检测方法，其特征在于，在所述获取问诊数据之后，还包括：

判断所述问诊数据是否为文本数据；

3.根据权利要求1所述的文本情绪检测方法，其特征在于，所述通过预置情绪探测算法，确定所述问诊数据所属的情绪类别，得到所述问诊数据的第一情绪识别结果包括：

4.根据权利要求1所述的文本情绪检测方法，其特征在于，所述对所述问诊数据进行特征提取，获得所述问诊数据中携带的情绪标签，并将所述情绪标签与预置规则进行匹配，得到所述问诊数据的第二情绪识别结果包括：

5.根据权利要求4所述的文本情绪检测方法，其特征在于，所述基于所述特征词匹配的情绪标签，确定所述问诊数据的情绪倾向包括：

6.根据权利要求1所述的文本情绪检测方法，其特征在于，所述判断所述实时情绪状态是否为负性情绪且所述负性情绪的情绪状态强度触发预警阈值包括：

判断所述问诊数据的实时情绪状态是否为负性情绪；

7.一种文本情绪检测装置，其特征在于，所述文本情绪检测装置包括：

警示模块，用于当所述实时情绪状态为负性情绪且所述负性情绪的情绪状态强度触发预警阈值时，则控制预警中心发出情绪波动提示。

8.根据权利要求7所述的文本情绪检测装置，其特征在于，所述匹配模块包括：

9.一种文本情绪检测设备，其特征在于，所述文本情绪检测设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述文本情绪检测设备执行如权利要求1-6中任一项所述的文本情绪检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的文本情绪检测方法。