CN112445898A - 对话情感分析方法及装置、存储介质及处理器 - Google Patents
对话情感分析方法及装置、存储介质及处理器 Download PDFInfo
- Publication number
- CN112445898A CN112445898A CN201910760635.4A CN201910760635A CN112445898A CN 112445898 A CN112445898 A CN 112445898A CN 201910760635 A CN201910760635 A CN 201910760635A CN 112445898 A CN112445898 A CN 112445898A
- Authority
- CN
- China
- Prior art keywords
- dialogue
- sentence
- topic
- vector
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 121
- 238000004458 analytical method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims abstract description 299
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000005516 engineering process Methods 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims description 32
- 230000007246 mechanism Effects 0.000 claims description 31
- 230000014509 gene expression Effects 0.000 claims description 21
- 230000001419 dependent effect Effects 0.000 claims description 19
- 230000000306 recurrent effect Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 230000007935 neutral effect Effects 0.000 claims description 8
- 230000015654 memory Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种对话情感分析方法及装置、存储介质及处理器。该方法包括:通过文本的词嵌入技术得到待分析的对话的向量表示和每个对话语句的向量表示;将待分析的对话的向量表示输入主题模型确定整个对话的主题信息的分布;将每个对话语句的向量表示分别输入主题模型确定每个对话语句的主题信息的分布;基于每个词的词向量和整个对话的主题信息的分布得到融入主题信息的词向量;通过融入主题信息的词向量得到上下文相关的句子主题向量,得到每个对话语句的情感分布。本发明解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
Description
技术领域
本发明涉及信息分析处理技术领域,具体而言,涉及一种对话情感分析方法及装置、存储介质及处理器。
背景技术
在电商领域,由于每个电商商家都有大量的客服人员在服务客户,而客服的服务质量对于客户最终是否购买商品起到很大的影响。通过检测客服在和客户聊天对话过程中客服与客户的情感变化,能够有效地监测客服的服务质量,从而提升客户对于商家的整体满意度,从而促进客户购买商品,提升转化率。
相关技术中,对于电商客服与客户沟通的一段对话中的每句话可以单独进行情感分类,可以采用传统的机器学习方法,例如,支持向量机、逻辑回归,以及深度学习模型,例如卷积神经网络(Convolutional Neural Networks)、循环神经网络(Recurrent NeuralNetwork),但是此方案缺失了对话中上下文的联系。目前,还有一些对对话文本进行分析的深度学习模型,它们首先使用卷积(循环)神经网络处理词向量(word embedding)得到每个句子的表示,然后基于这些句子表示,采用另外的循环神经网络来捕捉句子之间的关系,或采用注意力机制(Attention Mechanism)来计算句子之间的相关性。但是这些方案没有考虑到对话作为整体所呈现的特点,也没有建立句子所表达意图之间的联系,而仅仅是基于字面意思的匹配上下文。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种对话情感分析方法及装置、存储介质及处理器,以至少解决由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
根据本发明实施例的一个方面,提供了一种对话情感分析方法,包括:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
进一步地,通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
进一步地,至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
进一步地,将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
进一步地,所述主题模型中包括基于神经网络的模型。
进一步地,所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
进一步地,所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
进一步地,所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
进一步地,所述对话情感分析方法应用于电商领域。
根据本发明实施例的一个方面,提供了一种对话情感分析装置,包括:第一获取单元,用于获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;第二获取单元,用于通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;第一确定单元,用于将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;第二确定单元,用于将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;第三获取单元,用于基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;第四获取单元,用于通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;第五获取单元,用于至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
根据本发明实施例的一个方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的对话情感分析方法。
根据本发明实施例的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的对话情感分析方法。
在本发明实施例中,通过获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布,达到了提升对对话语句的情感分析的准确度的目的,通过将对话的主题信息结合进词表示和句子表示,从而实现了基于对话主题信息分析各个对话语句的情感的技术效果,进而解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的计算机终端的硬件结构框图;
图2是根据本发明实施例的提供的对话情感分析方法的流程图;
图3是根据本发明实施例的提供的可选的对话情感分析方法中主题模型的示意图;
图4是根据本发明实施例的提供的可选的对话情感分析方法中基于神经网络的模型的示意图;
图5是根据本发明实施例的提供的可选的对话情感分析方法中模型中的门机制的示意图;
图6是根据本发明实施例的提供的对话情感分析装置的示意图;以及
图7是根据本发明实施例的可选的计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
文本情感分析:指用自然语言处理、文本挖掘等方法来识别和提取文本中的主观信息,判断出一段文本表述的观点是积极的、消极的、还是中性的情绪。
主题模型:在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。
实施例1
根据本发明实施例,提供了一种对话情感分析的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现对话情感分析方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106(图1中未示出)。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的对话情感分析方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的对话情感分析方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
在上述运行环境下,本申请提供了如图2所示的对话情感分析方法。图2是根据本发明实施例一的对话情感分析方法的流程图。
步骤S201,获取待分析的对话,其中,待分析的对话中包括多个对话语句。
例如,待分析的对话包括3个对话语句,其中,语句1:为什么还没发货;语句2,:今天都几号了;语句3:不好意思,尽快发货。
步骤S202,通过文本的词嵌入技术,得到待分析的对话的向量表示和待分析的对话中每个对话语句的向量表示。
步骤S203,将待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布。
例如,确定待分析的对话包括的3个对话语句的向量表示,将3个对话语句的向量表示作为一个整体输入至主题模型,得到针对整个对话的主题信息的分布。
步骤S204,将待分析的对话中每个对话语句的向量表示分别输入主题模型,确定每个对话语句的主题信息的分布。
例如,获取待分析的对话包括的3个对话语句中各个对话语句的向量表示,并将各个对话语句的向量表示分别输入至主题模型,得到每个对话语句对应的主题信息的分布。
步骤S205,基于每个对话语句中的每个词的词向量和整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
在上述步骤中,可以首先获取每个对话语句中每个词的词向量,然后基于每个对话语句中的每个词的词向量和整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
例如,语句1:为什么还没发货,获取“为什么”的词向量,“还”的词向量,“没”的词向量,“发货”的词向量,将各个词的词向量和整个对话的主题信息的分布得到语句1中融入主题信息的词向量。
步骤S206,通过融入主题信息的词向量得到每个对话语句的上下文相关的句子主题向量。
可选地,在本发明实施例的提供的对话情感分析方法中,通过融入主题信息的词向量得到每个对话语句的上下文相关的句子主题向量包括:将融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和整个对话的主题信息的分布通过门机制得到每个对话语句的上下文相关的句子主题向量。
在上述方案中,利用门机制(gating mechanism)从整个对话的主题信息的分布中得到每个对话语句的上下文相关的句子主题向量。
步骤S207,至少基于每个对话语句的上下文相关的句子主题向量、每个对话语句的主题信息的分布和整个对话的主题信息的分布,得到每个对话语句的情感分布。
可选地,在本发明实施例的提供的对话情感分析方法中,至少基于每个对话语句的上下文相关的句子主题向量、每个对话语句的主题信息的分布和整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将每个对话语句的上下文相关的句子主题向量、每个对话语句的主题向量和整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
在本申请实施例中提及的情感分布可以为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
通过上述的技术方案,考虑了整个对话的主题对于当前句子的情感分类的影响。例如,语句1:为什么还没发货;语句2:今天都几号了,在咨询发货话题下这一类对话语句背后想表达的其实是对发货速度的不满。通过上述的方案首先由主题模型分析一段对话的主题信息的分布,然后将主题信息结合进词表示和句子表示,挖掘出时间相关的词和句子在特定主题下的含义,以分析出每个对话语句的情感分布,提升了对对话语句的情感分析的准确度。
本申请提供的对话情感分析方法可以应用于电商领域。本方案可以用于对电商客服的服务中一段对话的每个句子进行文本情感分类,可以清楚得刻画出对话中客服以及客户的情感变化。通过准确的检测到客服在和客户聊天对话过程中客服与客户的情感变化,能够有效地监测客服的服务质量,从而提升客户对于商家的整体满意度,从而促进客户购买商品,提升转化率。
综上,在本发明实施例的提供的对话情感分析方法中,通过获取待分析的对话,其中,待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到待分析的对话的向量表示和待分析的对话中每个对话语句的向量表示;将待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将待分析的对话中每个对话语句的向量表示分别输入主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过融入主题信息的词向量得到每个对话语句的上下文相关的句子主题向量;至少基于每个对话语句的上下文相关的句子主题向量、每个对话语句的主题信息的分布和整个对话的主题信息的分布,得到每个对话语句的情感分布,达到了提升对对话语句的情感分析的准确度的目的,通过将对话的主题信息结合进词表示和句子表示,从而实现了基于对话主题信息分析各个对话语句的情感的技术效果,进而解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
在本发明实施例一提供的可选的对话情感分析方法中,如图3所示,通过将主题信息结合进多层级的句子表示过程中,采用了多任务框架同时训练主题模型和情感分类模型。在本发明实施例一提供的对话情感分析方法对应的系统中主要包括以下N个组件:(1)、主题模型(如图3),即情感分类模型,采用了一个多层次的框架,包括词表示层,句子表示层和输出层。在词表示层中,基于每个对话语句中每个词的词向量和整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在句子表示层中,将融入主题信息的词向量通过循环神经网络到每个对话语句的向量表示;基于每个对话语句的向量表示和整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在输出层中,基于每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。(2)基于神经网络的模型(如图4),包括一个编码层和解码层,其中,在编码层中输入是待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在解码层中,基于每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合整个对话的主题信息的分布得到待分析的对话的似然函数。通过最大化该似然函数优化主题模型的参数。此模型基于变分推理,是一个无监督模型,可以用于预训练或者多任务学习。每段对话可以得到一个主题分布。(3)、门机制(如图5),每个词、句子和各个主题的相关性不同,在本申请中采用门机制(gating mechanism)从对话的主题信息的分布中挖掘出相应的主题信息,结合进词表示和句子表示。在本申请中分别利用这三种表示计算上下文之间的关系,得到三种注意力值,然后加权平均它们得到新的注意力值,基于新的注意力值确定各个语句对应的情感分布。
因此,本技术方案的核心在于将主题信息帮助对话情感分析各个层次的建模,下面分三个层次(单词、句子、上下文建模)进行介绍:1、主题信息增强的词表示在主题模型的训练中得到了词向量(word embedding)以及主题向量(topic embedding)。将整个对话的向量表示传入主题模型后会得到整个对话的主题信息的分布。对于对话语句中的某一个单词,将其词向量和所有主题向量点乘,可以得到这个单词和每个主题的相关性,用这个相关性和对话主题信息的分布相乘可以得到这个单词在这段对话下的主题表示。这样表示的优势之处在于:每段对话下不同单词有其对应的主题表示,同一个单词在不同对话下有不同的主题表示。这个单词主题表示会和其词向量拼接起来作为一个新的词表示。2、主题信息增强的句子表示每个句子中的(主题信息增强的)词表示输入门循环单元GRU(GatedRecurrent Units)得到一个句子表示。另外,将每个句子的向量表示送入主题模型中可以得到每个句子的主题信息的分布。这个主题信息的分布是上下文无关的,本方案利用门机制(gating mechanism)从整个对话的主题信息的分布中得到另一个基于主题的句子表示。3、基于主题信息的上下文建模对于每个句子有三种表示:从GRU中得到的句子表示,从主题模型直接获得主题信息的分布,利用门机制从整个对话主题信息的分布得到的上下文相关的主题表示。进一步地,本申请提供的技术方案在上下文建模中不考虑句子表达动机之间的关系。例如,“为什么还没发货”,“快递信息到现在都没更新”两句话基本没有相似的词,一般基于字面意思的匹配很容易做出误判。而这两句话中的词经常出现在快递话题下的对话中,在主题信息的分布更加接近,本文方案通过主题信息以及字面意思的匹配更精准的捕捉上下文之间的联系。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述对话情感分析方法的装置,如图6所示,该装置包括:第一获取单元601、第二获取单元602、第一确定单元603、第二确定单元604、第三获取单元605、第四获取单元606和第五获取单元607。
具体地,第一获取单元601,用于获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;
第二获取单元602,用于通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;
第一确定单元603,用于将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;
第二确定单元604,用于将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;
第三获取单元605,用于基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;
第四获取单元606,用于通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;
第五获取单元607,用于至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
综上,在本发明实施例的提供的对话情感分析方法中,通过第一获取单元601获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;第二获取单元602通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;第一确定单元603将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;第二确定单元604将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;第三获取单元605基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;第四获取单元606通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;第五获取单元607至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布,达到了提升对对话语句的情感分析的准确度的目的,通过将对话的主题信息结合进词表示和句子表示,从而实现了基于对话主题信息分析各个对话语句的情感的技术效果,进而解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
可选地,在本发明实施例的提供的对话情感分析装置中,所述第四获取单元606包括:第一获取模块,用于将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;第二获取模块,用于将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
可选地,在本发明实施例的提供的对话情感分析装置中,所述第五获取单元607包括:第三获取模块,用于将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;第四获取模块,用于将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
可选地,在本发明实施例的提供的对话情感分析装置中,所述第二确定单元604包括:第五获取模块,用于获取每个对话语句中的每个词的词向量;第六获取模块,用于基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
可选地,在本发明实施例的提供的对话情感分析装置中,所述主题模型中包括基于神经网络的模型。
可选地,在本发明实施例的提供的对话情感分析装置中,所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
可选地,在本发明实施例的提供的对话情感分析装置中,所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
可选地,在本发明实施例的提供的对话情感分析装置中,所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
可选地,在本发明实施例的提供的对话情感分析装置中,所述对话情感分析装置应用于电商领域。
此处需要说明的是,上述的第一获取单元601、第二获取单元602、第一确定单元603、第二确定单元604、第三获取单元605、第四获取单元606和第五获取单元607对应于实施例1中的步骤S201至步骤S207,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
实施例3
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:所述主题模型中包括基于神经网络的模型。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
上述计算机终端可以执行应用程序的对话情感分析方法中以下步骤的程序代码:所述对话情感分析方法应用于电商领域。
可选地,图7是根据本发明实施例的一种计算机终端的结构框图。如图7所示,该计算机终端A可以包括:一个或多个(图7中仅示出一个)处理器、存储器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的对话情感分析方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的对话情感分析方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
可选的,上述处理器还可以执行如下步骤的程序代码:通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
可选的,上述处理器还可以执行如下步骤的程序代码:至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
可选的,上述处理器还可以执行如下步骤的程序代码:将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
可选的,上述处理器还可以执行如下步骤的程序代码:所述主题模型中包括基于神经网络的模型。
可选的,上述处理器还可以执行如下步骤的程序代码:所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
可选的,上述处理器还可以执行如下步骤的程序代码:所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
可选的,上述处理器还可以执行如下步骤的程序代码:所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
可选的,上述处理器还可以执行如下步骤的程序代码:所述对话情感分析方法应用于电商领域。
采用本发明实施例,提供了一种对话情感分析方法的方案。通过获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布,达到了提升对对话语句的情感分析的准确度的目的,通过将对话的主题信息结合进词表示和句子表示,从而实现了基于对话主题信息分析各个对话语句的情感的技术效果,进而解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
本领域普通技术人员可以理解,图7所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图7其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的对话情感分析方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:所述主题模型中包括基于神经网络的模型。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
可选地,在本实施例中,存储介质被设置为存储还用于执行以下步骤的程序代码:所述对话情感分析方法应用于电商领域。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种对话情感分析方法,其特征在于,包括:
获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;
通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;
将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;
将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;
基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;
通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;
至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
2.根据权利要求1所述的方法,其特征在于,通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:
将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;
将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
3.根据权利要求1所述的方法,其特征在于,至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:
将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;
将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
4.根据权利要求1所述的方法,其特征在于,将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:
获取每个对话语句中的每个词的词向量;
基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
5.根据权利要求1所述的方法,其特征在于,所述主题模型中包括基于神经网络的模型。
6.根据权利要求5所述的方法,其特征在于,所述神经网络的模型至少包括:
编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
7.根据权利要求1所述的方法,其特征在于,所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
8.根据权利要求1所述的方法,其特征在于,所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
9.根据权利要求1所述的方法,其特征在于,所述对话情感分析方法应用于电商领域。
10.一种对话情感分析装置,其特征在于,包括:
第一获取单元,用于获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;
第二获取单元,用于通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;
第一确定单元,用于将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;
第二确定单元,用于将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;
第三获取单元,用于基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;
第四获取单元,用于通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;
第五获取单元,用于至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
11.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至9中任意一项所述的对话情感分析方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至9中任意一项所述的对话情感分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760635.4A CN112445898A (zh) | 2019-08-16 | 2019-08-16 | 对话情感分析方法及装置、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760635.4A CN112445898A (zh) | 2019-08-16 | 2019-08-16 | 对话情感分析方法及装置、存储介质及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112445898A true CN112445898A (zh) | 2021-03-05 |
Family
ID=74742277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910760635.4A Pending CN112445898A (zh) | 2019-08-16 | 2019-08-16 | 对话情感分析方法及装置、存储介质及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112445898A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116258134A (zh) * | 2023-04-24 | 2023-06-13 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101639824A (zh) * | 2009-08-27 | 2010-02-03 | 北京理工大学 | 一种针对不良信息的基于情感倾向性分析的文本过滤方法 |
CN106815192A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 模型训练方法及装置和语句情感识别方法及装置 |
CN107808008A (zh) * | 2017-11-17 | 2018-03-16 | 合肥工业大学 | 一种考虑用户特征信息的主题‑情感联合建模方法 |
US20180174020A1 (en) * | 2016-12-21 | 2018-06-21 | Microsoft Technology Licensing, Llc | Systems and methods for an emotionally intelligent chat bot |
CN108197109A (zh) * | 2017-12-29 | 2018-06-22 | 北京百分点信息科技有限公司 | 一种基于自然语言处理的多语言分析方法和装置 |
CN108255805A (zh) * | 2017-12-13 | 2018-07-06 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN108536870A (zh) * | 2018-04-26 | 2018-09-14 | 南京大学 | 一种融合情感特征和语义特征的文本情感分类方法 |
CN108733644A (zh) * | 2018-04-09 | 2018-11-02 | 平安科技(深圳)有限公司 | 一种文本情感分析方法、计算机可读存储介质及终端设备 |
CN108874972A (zh) * | 2018-06-08 | 2018-11-23 | 青岛里奥机器人技术有限公司 | 一种基于深度学习的多轮情感对话方法 |
KR20190002073A (ko) * | 2017-06-29 | 2019-01-08 | 네이버 주식회사 | 기계의 자동 활성을 위한 방법 및 시스템 |
CN109271526A (zh) * | 2018-08-14 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 文本检测方法、装置、电子设备及计算机可读存储介质 |
CN109408621A (zh) * | 2018-10-29 | 2019-03-01 | 苏州派维斯信息科技有限公司 | 对话情感分析方法和系统 |
CN109977207A (zh) * | 2019-03-21 | 2019-07-05 | 网易(杭州)网络有限公司 | 对话生成方法、对话生成装置、电子设备及存储介质 |
-
2019
- 2019-08-16 CN CN201910760635.4A patent/CN112445898A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101639824A (zh) * | 2009-08-27 | 2010-02-03 | 北京理工大学 | 一种针对不良信息的基于情感倾向性分析的文本过滤方法 |
CN106815192A (zh) * | 2015-11-27 | 2017-06-09 | 北京国双科技有限公司 | 模型训练方法及装置和语句情感识别方法及装置 |
US20180174020A1 (en) * | 2016-12-21 | 2018-06-21 | Microsoft Technology Licensing, Llc | Systems and methods for an emotionally intelligent chat bot |
KR20190002073A (ko) * | 2017-06-29 | 2019-01-08 | 네이버 주식회사 | 기계의 자동 활성을 위한 방법 및 시스템 |
CN107808008A (zh) * | 2017-11-17 | 2018-03-16 | 合肥工业大学 | 一种考虑用户特征信息的主题‑情感联合建模方法 |
CN108255805A (zh) * | 2017-12-13 | 2018-07-06 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN108197109A (zh) * | 2017-12-29 | 2018-06-22 | 北京百分点信息科技有限公司 | 一种基于自然语言处理的多语言分析方法和装置 |
CN108733644A (zh) * | 2018-04-09 | 2018-11-02 | 平安科技(深圳)有限公司 | 一种文本情感分析方法、计算机可读存储介质及终端设备 |
CN108536870A (zh) * | 2018-04-26 | 2018-09-14 | 南京大学 | 一种融合情感特征和语义特征的文本情感分类方法 |
CN108874972A (zh) * | 2018-06-08 | 2018-11-23 | 青岛里奥机器人技术有限公司 | 一种基于深度学习的多轮情感对话方法 |
CN109271526A (zh) * | 2018-08-14 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 文本检测方法、装置、电子设备及计算机可读存储介质 |
CN109408621A (zh) * | 2018-10-29 | 2019-03-01 | 苏州派维斯信息科技有限公司 | 对话情感分析方法和系统 |
CN109977207A (zh) * | 2019-03-21 | 2019-07-05 | 网易(杭州)网络有限公司 | 对话生成方法、对话生成装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
范创: "人机对话中的情感文本生成方法研究", 硕士学位论文, 15 January 2019 (2019-01-15), pages 1 - 47 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116258134A (zh) * | 2023-04-24 | 2023-06-13 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
CN116258134B (zh) * | 2023-04-24 | 2023-08-29 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10210865B2 (en) | Method and apparatus for inputting information | |
US20190333118A1 (en) | Cognitive product and service rating generation via passive collection of user feedback | |
CN112346567B (zh) | 基于ai的虚拟交互模型生成方法、装置及计算机设备 | |
CN110717325B (zh) | 文本的情感分析方法、装置、电子设备及存储介质 | |
CN111241842B (zh) | 文本的分析方法、装置和系统 | |
US20180218432A1 (en) | Recommendation integrated online digital sales service chat system | |
Pousttchi et al. | Determinants of customer acceptance for mobile data services: an empirical analysis with formative constructs | |
CN111310440A (zh) | 文本的纠错方法、装置和系统 | |
CN108319888B (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN110895568B (zh) | 处理庭审记录的方法和系统 | |
CN114969352B (zh) | 文本处理方法、系统、存储介质及电子设备 | |
CN111104590A (zh) | 信息推荐方法、装置、介质及电子设备 | |
CN113407677A (zh) | 评估咨询对话质量的方法、装置、设备和存储介质 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN112445898A (zh) | 对话情感分析方法及装置、存储介质及处理器 | |
CN113128534A (zh) | 情绪识别的方法、装置以及存储介质 | |
CN112151034A (zh) | 设备的语音控制方法、装置、电子设备及存储介质 | |
CN111651989A (zh) | 命名实体识别方法和装置、存储介质及电子装置 | |
CN113868415A (zh) | 知识库的生成方法、装置、存储介质及电子设备 | |
CN109145284A (zh) | 信息处理方法和装置 | |
CN112446202A (zh) | 文本的分析方法和装置 | |
CN114141236A (zh) | 语言模型更新方法、装置、电子设备及存储介质 | |
US10825070B2 (en) | Problem identification using biometric and social data | |
CN112200602A (zh) | 用于广告推荐的神经网络模型训练方法及装置 | |
US20200142963A1 (en) | Apparatus and method for predicting response to an article |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |