CN115936016A - 基于对话的情绪主题识别方法、装置、设备以及介质 - Google Patents

基于对话的情绪主题识别方法、装置、设备以及介质 Download PDF

Info

Publication number
CN115936016A
CN115936016A CN202310032936.1A CN202310032936A CN115936016A CN 115936016 A CN115936016 A CN 115936016A CN 202310032936 A CN202310032936 A CN 202310032936A CN 115936016 A CN115936016 A CN 115936016A
Authority
CN
China
Prior art keywords
emotional
words
topic
word
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310032936.1A
Other languages
English (en)
Inventor
张鹏
陈婷
吴三平
庄伟亮
陈庆麟
左媛
谭蕴琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202310032936.1A priority Critical patent/CN115936016A/zh
Publication of CN115936016A publication Critical patent/CN115936016A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种基于对话的情绪主题识别方法、装置、设备以及介质,该基于对话的情绪主题识别方法包括:接收对话信息并提取所述对话信息中的文本内容;基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。采用本发明技术方案能够提高业务人员对客户情绪主题的识别效率。

Description

基于对话的情绪主题识别方法、装置、设备以及介质
技术领域
本发明涉及人工智能领域,尤其涉及一种基于对话的情绪主题识别方法、装置、设备以及介质。
背景技术
在现今金融行业的客户服务中,差异化服务成为了客户服务中心服务优化的发展趋势。差异化服务的核心是掌握用户的真实需求,而客户面对服务的即时反馈最能真实反映差异化服务的成效,客户情绪正是这种即时反馈的最直接体现。
现如今业务人员要从对话信息中识别客户情绪,主要依赖业务人员的人工经验,对于预先设定好的情绪主题(如激动、不满等)构造一些关键词,然后根据整个对话的文本中是否命中关键词来判断是否包含对应情绪主题,如此,识别客户的情绪主题需要大量依赖业务人员的经验和手工操作,成本较高,且无法保证找到对应的情绪主题,同时仅输出是否包含对应情绪主题也无法体现客户在该情绪主题上的情绪强度。
综上,现有业务人员针对客户情绪主题进行识别的效率低下。
发明内容
本发明的主要目的在于提供一种基于对话的情绪主题识别方法、装置、设备以及介质,旨在提高业务人员对客户情绪主题的识别效率。
为实现上述目的,本发明提供一种基于对话的情绪主题识别方法,应用于编辑软件,所述基于对话的情绪主题识别方法包括:
接收对话信息并提取所述对话信息中的文本内容;
基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
可选地,所述接收对话信息并提取所述对话信息中的文本内容的步骤之后,所述方法还包括:
基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;
将赋权后的新情绪主题词加入所述情绪主题词库;
所述基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重的步骤,包括:
基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重。
可选地,所述情绪主题词库存储有预设的多个情绪主题和多个情绪主题各自对应的多个种子词;所述基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权的步骤,包括:
基于预设的情绪主题词库,针对所述文本内容进行词向量训练以挖掘得到和所述种子词相似的新情绪主题词;
对所述新情绪主题词赋权。
可选地,所述基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权的步骤,还包括:
区分所述文本内容的所属角色和对话时间;
基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权。
可选地,所述情绪主题词库存储有预设的多个情绪主题;所述基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘的步骤,包括:
基于预设的情绪主题词库,运用迭代算法逐一获取不同角色对于同一个情绪主题的目标文本内容;
运用频繁项集算法找到所述目标文本内容中的频繁模式;
对所述频繁模式进行词频-逆文档频率计算得到不同角色对于同一个情绪主题的多个情绪主题词。
可选地,所述对挖掘到的新情绪主题词赋权的步骤,包括:
获取挖掘到的新情绪主题词在所述文本内容中的出现次数N;
获取所述新情绪主题词与所述新情绪主题词所表征的情绪主题相匹配的次数S;
将所述新情绪主题词赋权为S/N。
可选地,在所述接收对话信息并提取所述对话信息中的文本内容的步骤之后,所述方法还包括:
将预设的情绪主题词库中存储的情绪主题词加入至预设的分词词库中;
基于所述分词词库对所述文本内容进行分词处理,以得到所述文本内容的词语序列;
基于预设的情绪主题词库,识别所述词语序列中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
此外,为实现上述目的,本发明还提供一种基于对话的情绪主题识别装置,所述基于对话的情绪主题识别装置包括:
接收模块,用于接收对话信息并提取所述对话信息中的文本内容;
识别模块,用于基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
计算模块,用于根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
此外,为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于对话的情绪主题识别程序,所述基于对话的情绪主题识别程序被所述处理器执行时实现如上所述的基于对话的情绪主题识别方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于对话的情绪主题识别程序,所述基于对话的情绪主题识别程序被处理器执行时实现如上所述的基于对话的情绪主题识别方法的步骤。
本发明提出的一种基于对话的情绪主题识别方法、装置、终端设备及计算机可读存储介质,该基于对话的情绪主题识别方法包括:接收对话信息并提取所述对话信息中的文本内容;基于预设的情绪主题词库,识别所述文本
内容中的情绪主题词并获取所述情绪主题词的权重;根据所述情绪主题词的5权重计算所述情绪主题词所表征的情绪主题的分数。
相比于传统的基于对话的情绪主题识别方法,本发明通过终端设备先接收业务人员和客户之间的对话信息并将该对话信息中的文本内容提取出来;
然后,终端设备基于预设的情绪主题词库,识别该文本内容中的多个情绪主
题词并且获取各个情绪主题词的权重;最后,终端设备根据获取到的各个情0绪主题词的权重计算该情绪主题词所表征的情绪主题的分数。
如此,本发明实现了通过机器识别对话信息中表征情绪主题的情绪主题词,得到对话中所包含的至少一个情绪主题的权重分数,减少了手动操作,提高了识别客户情绪主题的准确性并且体现了客户在该情绪主题上的情绪强度,从而提高了业务人员对客户情绪主题的识别效率。
附图说明
图1为本发明实施例方案涉及的终端设备硬件运行环境的设备结构示意图;
图2为本发明基于对话的情绪主题识别方法第一实施例的流程示意图;
图3为本发明基于对话的情绪主题识别方法一实施例涉及的模式挖掘示意图;
图4为本发明基于对话的情绪主题识别方法一实施例涉及的主题识别示意图;
图5为本发明基于对话的情绪主题识别装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
0应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明实施例提供一种终端设备。
如图1所示,图1是本发明实施例方案涉及的终端设备硬件运行环境的设备结构示意图。
如图1所示,在终端设备的硬件运行环境中,该终端设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于对话的情绪主题识别程序。
在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
接收对话信息并提取所述对话信息中的文本内容;
基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
可选地,处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,在执行接收对话信息并提取所述对话信息中的文本内容的步骤之后,还执行以下操作:
基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;
将赋权后的新情绪主题词加入所述情绪主题词库;
处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重。
可选地,所述情绪主题词库存储有预设的多个情绪主题和多个情绪主题各自对应的多个种子词;处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
基于预设的情绪主题词库,针对所述文本内容进行词向量训练以挖掘得到和所述种子词相似的新情绪主题词;
对所述新情绪主题词赋权。
可选地,处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
区分所述文本内容的所属角色和对话时间;
基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权。
可选地,处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
基于预设的情绪主题词库,运用迭代算法逐一获取不同角色对于同一个情绪主题的目标文本内容;
运用频繁项集算法找到所述目标文本内容中的频繁模式;
对所述频繁模式进行词频-逆文档频率计算得到不同角色对于同一个情绪主题的多个情绪主题词。
可选地,处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,并执行以下操作:
获取挖掘到的新情绪主题词在所述文本内容中的出现次数N;
获取所述新情绪主题词与所述新情绪主题词所表征的情绪主题相匹配的次数S;
将所述新情绪主题词赋权为S/N。
可选地,处理器1001还可以用于调用存储器1005中存储的基于对话的情绪主题识别程序,在执行接收对话信息并提取所述对话信息中的文本内容的步骤之后,还执行以下操作:
将预设的情绪主题词库中存储的情绪主题词加入至预设的分词词库中;
基于所述分词词库对所述文本内容进行分词处理,以得到所述文本内容的词语序列;
基于预设的情绪主题词库,识别所述词语序列中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
基于上述的硬件结构,提出本发明基于对话的情绪主题识别方法的各个实施例的整体构思。
在本发明实施例中,在现今金融行业的客户服务中,差异化服务成为了客户服务中心服务优化的发展趋势。差异化服务的核心是掌握用户的真实需求,而客户面对服务的即时反馈最能真实反映差异化服务的成效,客户情绪正是这种即时反馈的最直接体现。
现如今业务人员要从对话信息中识别客户情绪,主要依赖业务人员的人工经验,对于预先设定好的情绪主题(如激动、不满等)构造一些关键词,然后根据整个对话的文本中是否命中关键词来判断是否包含对应情绪主题,如此,识别客户的情绪主题需要大量依赖业务人员的经验和手工操作,成本较高,且无法保证找到对应的情绪主题,同时仅输出是否包含对应情绪主题也无法体现客户在该情绪主题上的情绪强度。
综上,现有业务人员针对客户情绪主题进行识别的效率低下。
针对上述问题,本发明实施例提出一种基于对话的情绪主题识别方法,该方法包括:接收对话信息并提取所述对话信息中的文本内容;基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
相比于传统的基于对话的情绪主题识别方法,本发明通过终端设备先接收业务人员和客户之间的对话信息并将该对话信息中的文本内容提取出来;然后,终端设备基于预设的情绪主题词库,识别该文本内容中的多个情绪主题词并且获取各个情绪主题词的权重;最后,终端设备根据获取到的各个情绪主题词的权重计算该情绪主题词所表征的情绪主题的分数。
如此,本发明实现了通过机器识别对话信息中表征情绪主题的情绪主题词,得到对话中所包含的至少一个情绪主题的权重分数,减少了手动操作,提高了识别客户情绪主题的准确性并且体现了客户在该情绪主题上的情绪强度,从而提高了业务人员对客户情绪主题的识别效率。
基于上述本发明基于对话的情绪主题识别方法的总体构思,提出本发明基于对话的情绪主题识别方法的各个实施例。
请参照图2,图2为本发明基于对话的情绪主题识别方法第一实施例的流程示意图。需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中,为便于理解和阐述,在本实施例中均以终端设备作为直接的执行主体以针对本发明基于对话的情绪主题识别方法进行阐述。
如图2所示,在本实施例中,本发明基于对话的情绪主题识别方法可以包括:
步骤S10:接收对话信息并提取所述对话信息中的文本内容;
在本实施例中,终端设备在接收到客户、客户两个角色或者任意多个角色之间的对话信息时,将接收到的对话信息中的文本内容提取出来。
需要说明的是,在本实施例中,终端设备开始接收对话信息可以是在接收到情绪主题识别指令时开始接收,也可以设置为周期性实时导出系统中的对话信息,而终端设备所接收到的对话信息可以理解为多条按时间顺序组成的包含对话角色、对话时间、文本内容的数据,其中文本内容可以是文字对话信息中的表达文本、语音或者电话转化对话信息中的表达内容转文字形式等。
步骤S20:基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
在本实施例中,终端设备对照自身系统中预设的情绪主题词库来识别提取到的文本内容中的情绪主题词,并且获取该情绪主题词在词库中所占的权重。
步骤S30:根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
在本实施例中,终端设备在获取到一文本内容中所有的情绪主题词及其所对应的权重后,由于一个情绪主题对应有多个情绪主题词,情绪主题词可以为词语、短句、正则表达式等,终端设备将同一情绪主题下的多个情绪主题词的权重进行求和,得到的求和结果即为该情绪主题的分数。
示例性地,在一种可行的实施例中,当终端设备计算出的结果显示一客户的情绪识别结果中“愤怒”主题的分数最高,则业务人员在后续与该客户沟通时会更加谨慎、温和,或者,若结果显示该客户人身攻击、投诉类的分数高,后续业务人员也会减少对该客户的主动联系。
相比于传统的基于对话的情绪主题识别方法,本发明通过预先设定好多个包含种子词的情绪主题,然后利用对话信息的结构特点,从中挖掘情绪主题模式,也就是情绪主题词,并对每个模式进行赋权,并将表征同一情绪主题的多个模式的权重最终融合成一个情绪主题分数进行输出,该分数即可表征对话信息在该情绪主题上的强度。
如此,本发明实施例减少了业务人员进行情绪主题识别的手动操作,并且其输出的结果体现了客户在该情绪主题上的情绪强度,有利于业务人员后续根据该识别结果进行利用。
进一步地,基于上述本发明基于对话的情绪主题识别方法的第一实施例,提出本发明基于对话的情绪主题识别方法的第二实施例。
在本实施例中,终端设备在上述第一实施例的步骤S10:接收对话信息并提取所述对话信息中的文本内容的步骤之后,本发明基于对话的情绪主题识别方法还可以包括:
步骤S40:基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;
在本实施例中,终端设备基于自身存储的情绪主题词库来对获取到的文本内容进行情绪主题词挖掘,并对在该文本中挖掘到的新情绪主题词进行赋权。
可选地,在一种可行的实施例中,上述情绪主题词库存储有预设的多个情绪主题和多个情绪主题各自对应的多个种子词,基于此,上述步骤S40,包括:
步骤S401:基于预设的情绪主题词库,针对所述文本内容进行词向量训练以挖掘得到和所述种子词相似的新情绪主题词;
在本实施例中,终端设备基于自身存储的情绪主题词库,针对文本内容进行词向量训练,终端设备通过训练得到文本内容中和词库中的种子词相似的新情绪主题词。
需要说明的是,在本实施例中,情绪主题词库中预设有多个情绪主题,如激动、不满等,其情绪主题的类型可以由用户预先设定,也可以在词库后续的应用过程中基于对话信息实时添加新的情绪主题,对于情绪主题词库中的每一个情绪主题都预设有种子词,即该情绪主题的关键词或者正则表达式,其种子词也可以由用户预先设定或在后续的应用过程中基于对话信息实时添加,本发明对情绪主题词库中的情绪主题及种子词不作具体限定。
终端设备执行词向量训练,需要先借助分词工具对文本内容进行分词,并将分词后的词列表映射到词向量空间,然后,终端设备将种子词作为启动词,依次遍历每个启动词,以启动词在词向量空间中的位置和指定长度半径寻找相似的新词语,如此,终端设备通过词向量训练得到文本内容中和词库中的种子词相似的多个新情绪主题词。
步骤S402:对所述新情绪主题词赋权。
在本实施例中,终端设备在通过词向量训练得到文本内容中和词库中的种子词相似的多个新情绪主题词后,对多个新情绪主题词逐一进行赋权操作,并且将其加入到情绪主题词库中。
在另一实施例中,上述步骤S40:基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权,还可以包括:
步骤S403:区分所述文本内容的所属角色和对话时间;
在本实施例中,终端设备在获取到对话信息中的文本内容后,区分每条文本内容所属的角色和其对话的时间,利用对话信息前后对话的情绪具有主题一致性和表达多样性的特点,通过多角色协同学习进行情绪主题词的挖掘。
步骤S404:基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权。
在本实施例中,终端设备基于预设的情绪主题词库,根据对话发生的时间针对不同角色的文本内容进行情绪主题词挖掘,并对挖掘到的新情绪主题词赋权。
此外,在一种可行的实施例中,若终端设备识别到对话信息中只有一个角色,也可以进行该角色情绪主题词的挖掘,本发明对对话信息中所涉及的角色数量不作具体限定。
可选地,在一种可行的实施例中,上述步骤S404,可以包括:
步骤S4041:基于预设的情绪主题词库,运用迭代算法逐一获取不同角色对于同一个情绪主题的目标文本内容;
在本实施例中,终端设备基于预设的情绪主题词库,运用迭代算法根据对话发生时间逐一获取不同角色对于同一个情绪主题的目标文本内容。
示例性地,在一种可行的实施例中,如图3所示,终端设备接收到的对话信息为角色1和角色2进行相互对话,终端设备已命中角色1关于情绪主题A模式的对话记录K,即,对话记录K中包含有情绪主题A模式对应的情绪主题词,然后,终端设备根据文本内容的对话时间找到对话记录K的前后对话记录(对应角色2),以对话记录K的前后记录来挖掘角色2关于情绪主题A模式的情绪关键词,再通过以上相同流程,通过已命中角色2关于情绪主题A模式的对话记录前后文挖掘角色1在情绪主题A模式的情绪主题词,知道整个流程收敛或者达到终端设备预设的轮次。
步骤S4042:运用频繁项集算法找到所述目标文本内容中的频繁模式;
在本实施例中,终端设备运用频繁项集散发找到任一角色对于同一个情绪主题的目标文本内容中的频繁模式,即,找到其目标文本内容中频繁出现的主题模式,主题模式可以为关键词、短语或者正则表达式等。
步骤S4043:对所述频繁模式进行词频-逆文档频率计算得到不同角色对于同一个情绪主题的多个情绪主题词。
在本实施例中,终端设备对不同角色对于同一情绪主题的频繁模式进行词频-逆文档频率(tf-idf)计算,得到不同角色对于同一个情绪主题的多个情绪主题词。
需要说明的是,在本实施例中,终端设备通过词频-逆文档频率计算对获取到的频繁模式进行修正,即先获取所有关键词的出现频次,然后将其中虽然出现的频次高但无实际意义或者在本次文本内容中不重要的词删掉,终端设备也可结合人工标注的方式,筛选出频繁模式中符合语义的情绪主题词。
步骤S50:将赋权后的新情绪主题词加入所述情绪主题词库;
在本实施例中,终端设备将在自身在文本内容中挖掘到的新情绪主题词进行赋权后,将新情绪主题词及其权重结合起来加入至自身存储的情绪主题词库中。
需要说明的是,相较于现有的方案所构建的关键词,通过上述步骤加入到情绪主题词库中的情绪主题词在语义上更符合业务人员需要处理的业务本身的特点,得到的情绪关键词能更加准确且完整的覆盖要处理的业务。
基于此,在本实施例中,上述的步骤S20:基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重,可以包括:
步骤S201:基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重。
在本实施例中,终端设备基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,对照该词库来识别提取到的文本内容中的情绪主题词,并且获取该情绪主题词在词库中所占的权重。
示例性地,在一种可行的实施例中,终端设备挖掘到的新情绪主题词为“我真的很生气”,表征愤怒情绪主题,并且其所占权重为80%,终端设备将其加入至情绪主题词库中,同时,在词库中表征愤怒情绪主题的词还包括“请您冷静”、“我很愤怒”等,然后,终端设备重新根据该情绪主题词库对对话信息进行情绪主题词的匹配与赋权,当终端设备在对话信息中匹配到“我真的很生气”时,获取其权重并进行记录,当终端设备在对话信息中匹配到“请您冷静”时,同样获取其权重并进行记录,最后,终端设备将在不能此对话信息中匹配到的关于愤怒情绪主题的所有情绪主题词的权重相加,得到的结果即为本次对话信息中愤怒情绪主题的分数。
在本实施例中,终端设备主要通过两种方式从对话信息中挖掘情绪主题关键词,方法一是通过词向量计算相似度的方法,对情绪主题词库中的种子词进行语义扩展,从而得到更多情绪主题相关的文本模式;方案二为利用对话数据的结构特点,基于对话前后的主题一致性和表达多样性的假设,通过多角色协同挖掘的方式,利用迭代算法不断挖掘不同角色对于同一情绪主题的不同主题模式。
如此,终端设备结合语义扩展了情绪主题词库中的情绪主题词,使得情绪主题词库在其中的主题模式语义保持不变的情况下,不断扩展模式规模,达到高效挖掘的目的,从而提高了业务人员对客户情绪主题的识别效率。
进一步地,基于上述本发明基于对话的情绪主题识别方法的第一实施例和/或者第二实施例,提出本发明基于对话的情绪主题识别方法的第三实施例。
在本实施例中,本发明基于对话的情绪主题识别方法中的“对挖掘到的新情绪主题词赋权”的步骤,包括:
步骤A10:获取挖掘到的新情绪主题词在所述文本内容中的出现次数N;
在本实施例中,终端设备从接收到的对话信息中提取出文本内容,然后根据情绪主题词库挖掘文本内容中的情绪主题词,同时获取该挖掘到的新情绪主题词在文本内容中出现的次数N。
步骤A20:获取所述新情绪主题词与所述新情绪主题词所表征的情绪主题相匹配的次数S;
在本实施例中,终端设备通过接收用户输入的匹配信号,以获取自身在文本内容中所挖掘到的新情绪主题词与其所表征的情绪主题相匹配的次数S。
步骤A30:将所述新情绪主题词赋权为S/N。
在本实施例中,终端设备将挖掘到的新情绪主题词逐一赋权为S/N,即,将该情绪主题词和情绪主题相匹配的次数除以该情绪主题词在文本内容中出现的次数,所得的结果即为该情绪主题词的权重。
示例性地,在一种可行的实施例中,对于情绪主题A的模式K,模式k为一种情绪主题词,终端设备从若干对话信息中,抽取n条命中模式k的对话信息,人工进行标注,得到其中与主题A相关的有s条,则模式k的权重定义为s/n。
可选地,在一种可行的实施例中,在上述步骤S10:接收对话信息并提取所述对话信息中的文本内容的步骤之后,可以包括:
步骤B10:将预设的情绪主题词库中存储的情绪主题词加入至预设的分词词库中;
在本实施例中,终端设备存储有分词词库,终端设备将情绪主题词库中存储的情绪主题词加入至分词词库中,以完善分词词库,使后续对文本内容进行分词处理的结果更符合业务特点,更具针对性。
步骤B20:基于所述分词词库对所述文本内容进行分词处理,以得到所述文本内容的词语序列;
在本实施例中,终端设备基于添加了情绪主题词的分词词库,对自身获取到的文本内容进行分词处理,以得到文本内容的词语序列,终端设备通过运用添加了情绪主题词的分词词库,不易在对文本内容进行分词处理的过程中丢失原本的语义,能够更完整的覆盖文本内容中所包含的情绪主题。
步骤B30:基于预设的情绪主题词库,识别所述词语序列中的情绪主题词并获取所述情绪主题词的权重;
在本实施例中,终端设备基于自身存储的情绪主题词库来识别词语序列中的情绪主题词,并获取识别到的情绪主题词的权重。
步骤B40:根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
在本实施例中,终端设备在获取到词语序列中所有的情绪主题词及其所对应的权重后,终端设备将同一情绪主题下的多个情绪主题词的权重进行求和,得到的求和结果即为该情绪主题的分数。
示例性地,如图4所示,终端设备在接收到对话信息后,一方面基于该对话信息进行主题词挖掘并赋权,然后将挖掘到的情绪主题词及其权重一起添加至情绪主题词库中,另一方面,终端设备对接收到的对话信息进行中文分词处理,以得到该对话信息对应的词语序列,然后基于情绪主题词库在该词语序列中匹配主题词并赋权,计算对话主题分数,即对于命中情绪主题的情绪主题词进行权重求和,得到的权重求和结果机为该情绪主题的分数,由于同一段对话信息中可包含多种情绪主题,因此终端设备基于该对话信息所输出的主题分数也有多个,用户可根据同一客户在多个情绪主题上的分数判断该客户在任一情绪主题上的强度。
在本实施例中,终端设备通过输出一段对话信息中得到的情绪主题的最终分数,能够更加直观的表征本段对话细腻些在该情绪主题上的强度,有利于业务人员后续使用该输出结果,并且终端设备在对文本内容进行分词处理时,在分词词库中加入情绪主题词,能够减少文本内容中的语义丢失,即使在对话中不同角色对于相同情绪主题的表达模式有所不同,终端设备也能通过该分词词库获取到更多适应于本业务的词语序列,从而有利于业务人员更准确、完整的识别到客户的情绪主题,提高业务人员对客户情绪主题的识别效率。
此外,本发明实施例还提出一种基于对话的情绪主题识别装置。
请参照图5,本发明基于对话的情绪主题识别装置包括:
接收模块10,用于接收对话信息并提取所述对话信息中的文本内容;
识别模块20,用于基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
计算模块30,用于根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
可选地,本发明基于对话的情绪主题识别装置,还包括:
挖掘模块,用于基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;和,用于将赋权后的新情绪主题词加入所述情绪主题词库。
可选地,挖掘模块,还包括:
第一挖掘单元,用于基于预设的情绪主题词库,针对所述文本内容进行词向量训练以挖掘得到和所述种子词相似的新情绪主题词;和,用于对所述新情绪主题词赋权。
第二挖掘单元,用于区分所述文本内容的所属角色和对话时间;和,用于基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;和,用于基于预设的情绪主题词库,运用迭代算法逐一获取不同角色对于同一个情绪主题的目标文本内容;和,用于运用频繁项集算法找到所述目标文本内容中的频繁模式;和,用于对所述频繁模式进行词频-逆文档频率计算得到不同角色对于同一个情绪主题的多个情绪主题词。
可选地,识别模块20,还用于基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;和,用于基于预设的情绪主题词库,识别所述词语序列中的情绪主题词并获取所述情绪主题词的权重。
可选地,本发明基于对话的情绪主题识别装置,还包括:
赋权模块,用于获取挖掘到的新情绪主题词在所述文本内容中的出现次数N;和,用于获取所述新情绪主题词与所述新情绪主题词所表征的情绪主题相匹配的次数S;和,用于将所述新情绪主题词赋权为S/N。
可选地,本发明基于对话的情绪主题识别装置,还包括:
分词模块,用于将预设的情绪主题词库中存储的情绪主题词加入至预设的分词词库中;和,基于所述分词词库对所述文本内容进行分词处理,以得到所述文本内容的词语序列。
其中,上述基于对话的情绪主题识别装置中各个模块的功能实现与上述基于对话的情绪主题识别方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
此外,本发明还提出一种存储介质,该存储介质上存储有基于对话的情绪主题识别的程序,该基于对话的情绪主题识别程序被处理器执行时实现如上所述本发明基于对话的情绪主题识别方法的步骤。
本发明存储介质的具体实施例与上述基于对话的情绪主题识别方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于对话的情绪主题识别方法,其特征在于,所述基于对话的情绪主题识别方法包括:
接收对话信息并提取所述对话信息中的文本内容;
基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
2.如权利要求1所述的基于对话的情绪主题识别方法,其特征在于,在所述接收对话信息并提取所述对话信息中的文本内容的步骤之后,所述方法还包括:
基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权;
将赋权后的新情绪主题词加入所述情绪主题词库;
所述基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重的步骤,包括:
基于所述情绪主题词库存储的历史情绪主题词和新情绪主题词,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重。
3.如权利要求2所述的基于对话的情绪主题识别方法,其特征在于,所述情绪主题词库存储有预设的多个情绪主题和多个情绪主题各自对应的多个种子词;
所述基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权的步骤,包括:
基于预设的情绪主题词库,针对所述文本内容进行词向量训练以挖掘得到和所述种子词相似的新情绪主题词;
对所述新情绪主题词赋权。
4.如权利要求2所述的基于对话的情绪主题识别方法,其特征在于,所述基于预设的情绪主题词库,对所述文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权的步骤,还包括:
区分所述文本内容的所属角色和对话时间;
基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘并对挖掘到的新情绪主题词赋权。
5.如权利要求4所述的基于对话的情绪主题识别方法,其特征在于,所述情绪主题词库存储有预设的多个情绪主题;所述基于预设的情绪主题词库,根据所述对话时间针对不同角色各自的文本内容进行情绪主题词挖掘的步骤,包括:
基于预设的情绪主题词库,运用迭代算法逐一获取不同角色对于同一个情绪主题的目标文本内容;
运用频繁项集算法找到所述目标文本内容中的频繁模式;
对所述频繁模式进行词频-逆文档频率计算得到不同角色对于同一个情绪主题的多个情绪主题词。
6.如权利要求2至5中任一项所述的基于对话的情绪主题识别方法,其特征在于,所述对挖掘到的新情绪主题词赋权的步骤,包括:
获取挖掘到的新情绪主题词在所述文本内容中的出现次数N;
获取所述新情绪主题词与所述新情绪主题词所表征的情绪主题相匹配的次数S;
将所述新情绪主题词赋权为S/N。
7.如权利要求1所述的基于对话的情绪主题识别方法,其特征在于,在所述接收对话信息并提取所述对话信息中的文本内容的步骤之后,所述方法还包括:
将预设的情绪主题词库中存储的情绪主题词加入至预设的分词词库中;
基于所述分词词库对所述文本内容进行分词处理,以得到所述文本内容的词语序列;
基于预设的情绪主题词库,识别所述词语序列中的情绪主题词并获取所述情绪主题词的权重;
根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
8.一种基于对话的情绪主题识别装置,其特征在于,所述基于对话的情绪主题识别装置包括:
接收模块,用于接收对话信息并提取所述对话信息中的文本内容;
识别模块,用于基于预设的情绪主题词库,识别所述文本内容中的情绪主题词并获取所述情绪主题词的权重;
计算模块,用于根据所述情绪主题词的权重计算所述情绪主题词所表征的情绪主题的分数。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于对话的情绪主题识别程序,所述基于对话的情绪主题识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于对话的情绪主题识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于对话的情绪主题识别程序,所述基于对话的情绪主题识别程序被处理器执行时实现如权利要求1至7中任一项所述的基于对话的情绪主题识别方法的步骤。
CN202310032936.1A 2023-01-10 2023-01-10 基于对话的情绪主题识别方法、装置、设备以及介质 Pending CN115936016A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310032936.1A CN115936016A (zh) 2023-01-10 2023-01-10 基于对话的情绪主题识别方法、装置、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310032936.1A CN115936016A (zh) 2023-01-10 2023-01-10 基于对话的情绪主题识别方法、装置、设备以及介质

Publications (1)

Publication Number Publication Date
CN115936016A true CN115936016A (zh) 2023-04-07

Family

ID=86552636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310032936.1A Pending CN115936016A (zh) 2023-01-10 2023-01-10 基于对话的情绪主题识别方法、装置、设备以及介质

Country Status (1)

Country Link
CN (1) CN115936016A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137011A (zh) * 2023-04-20 2023-05-19 广州闪畅信息科技有限公司 一种档案生成系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116137011A (zh) * 2023-04-20 2023-05-19 广州闪畅信息科技有限公司 一种档案生成系统、设备及存储介质
CN116137011B (zh) * 2023-04-20 2023-07-25 广州闪畅信息科技有限公司 一种档案生成系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109635273B (zh) 文本关键词提取方法、装置、设备及存储介质
CN108287858B (zh) 自然语言的语义提取方法及装置
US9792279B2 (en) Methods and systems for analyzing communication situation based on emotion information
US9626152B2 (en) Methods and systems for recommending responsive sticker
JP2021518019A (ja) 質問応答インタラクション方法、装置、コンピュータデバイス及びコンピュータ読取可能な記憶媒体
CN111177359A (zh) 多轮对话方法和装置
CN113360622B (zh) 用户对话信息的处理方法、装置及计算机设备
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN112699645B (zh) 语料标注方法、装置及设备
CN109684497B (zh) 一种图文匹配的信息发送方法、装置及电子设备
US20200311350A1 (en) Generating method, learning method, generating apparatus, and non-transitory computer-readable storage medium for storing generating program
CN114706945A (zh) 意图识别方法、装置、电子设备及存储介质
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN115936016A (zh) 基于对话的情绪主题识别方法、装置、设备以及介质
CN110727764A (zh) 一种话术生成方法、装置及话术生成设备
CN112487159B (zh) 检索方法、检索装置及计算机可读存储介质
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质
CN113051384A (zh) 基于对话的用户画像抽取方法及相关装置
CN109388695B (zh) 用户意图识别方法、设备及计算机可读存储介质
CN107908792B (zh) 信息推送方法和装置
CN113505293B (zh) 信息推送方法、装置、电子设备及存储介质
CN112579944A (zh) 一种页面跳转处理方法、装置以及电子设备
CN111046161A (zh) 用于商品营销场景的智能对话方法和装置
CN111985248A (zh) 一种信息交互方法以及装置
CN115618968B (zh) 新意图发现方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination