CN112836515A - 文本分析方法、推荐方法、装置、电子设备及存储介质 - Google Patents
文本分析方法、推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112836515A CN112836515A CN201911068390.5A CN201911068390A CN112836515A CN 112836515 A CN112836515 A CN 112836515A CN 201911068390 A CN201911068390 A CN 201911068390A CN 112836515 A CN112836515 A CN 112836515A
- Authority
- CN
- China
- Prior art keywords
- emotion
- text
- word
- analyzed
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 556
- 230000008451 emotion Effects 0.000 claims abstract description 680
- 238000012545 processing Methods 0.000 claims abstract description 203
- 239000013598 vector Substances 0.000 claims description 330
- 238000000034 method Methods 0.000 claims description 130
- 230000006870 function Effects 0.000 claims description 78
- 238000010606 normalization Methods 0.000 claims description 58
- 230000002996 emotional effect Effects 0.000 claims description 56
- 238000000605 extraction Methods 0.000 claims description 50
- 230000015654 memory Effects 0.000 claims description 41
- 238000012549 training Methods 0.000 claims description 31
- 238000012937 correction Methods 0.000 claims description 27
- 238000010586 diagram Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 42
- 230000002457 bidirectional effect Effects 0.000 description 24
- 241001627955 Tetraodon lineatus Species 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 241000251468 Actinopterygii Species 0.000 description 4
- 230000007787 long-term memory Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明实施例提供了一种文本分析方法、推荐方法、装置、电子设备及存储介质。其中,所述文本分析方法包括:将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。通过本发明实施例,情感分析更加全面清晰。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种文本分析方法、推荐方法、装置、电子设备及存储介质。
背景技术
现有技术中,情感分析是对带有情感色彩的主观性文本进行分析、处理、归纳和推理,比如判断情感极性。属性级(细粒度)情感分析是指aspect-level的情感分析,又称细粒度的情感分析,是指抽取句子中主体对象的属性,并对其进行情感,类别,原因等的分析。
现有技术中的电商网站上累计了大量带有情感倾向的评论信息。这些信息往往反映消费者对于产品或服务的总体或者某些方面的喜好,通过属性级情感分析的方法能从这些海量非结构化数据中挖掘提炼出核心主体和具体受欢迎与否及程度。
现有的属性级情感分析方法局限于至多两方面内容的抽取,既抽取主体和情感分类,或者抽取主体和情感词,导致现有的分析方法分析效率和准确性均不足。
发明内容
有鉴于此,本发明实施例提供一种文本分析方案,以解决上述部分或全部问题。
根据本发明实施例的第一方面,提供了一种文本分析方法,包括:将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
根据本发明实施例的第二方面,提供了一种文本分析模型训练方法,包括:从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
根据本发明实施例的第三方面,提供了一种推荐方法,包括:根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
根据本发明实施例的第四方面,提供了一种推荐方法,包括:获取待推荐用户的评论数据;调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
根据本发明实施例的第五方面,提供了一种分析方法,包括:获取目标用户针对目标事件的评论数据;使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
根据本发明实施例的第六方面,提供了一种文本分析装置,包括第一处理单元、配对层和第二处理单元;所述第一处理单元用于获取待分析文本对应的主体情感数据对和情感词;所述配对层用于对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合;所述第二处理单元用于根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定并输出主体词与情感词的相关度满足预设标准的目标候选组合。
根据本发明实施例的第七方面,提供了一种文本分析装置,包括:分析模块,用于将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;获取模块,用于获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
根据本发明实施例的第八方面,提供了一种文本分析模型训练装置,包括:处理模块,用于从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;主体辅助损失函数确定模块,用于根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;调整模块,用于根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
根据本发明实施例的第九方面,提供了一种推荐装置,包括:第一用户信息获取模块,用于根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;第一分析模块,用于使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;第一推荐模块,用于根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
根据本发明实施例的第十方面,提供了一种推荐装置,包括:第三用户信息获取模块,用于获取待推荐用户的评论数据;调用模块,用于调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;第三推荐模块,用于根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
根据本发明实施例的第十一方面,提供了一种分析装置,包括:第四用户信息获取模块,用于获取目标用户针对目标事件的评论数据;第三分析模块,用于使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;观点确定模块,用于根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
根据本发明实施例的第十二方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面~第五方面所述的方法对应的操作对应的操作。
根据本发明实施例的第十三方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面~第五方面所述的方法。
根据本发明实施例提供的文本分析方案,使用文本分析模型对待分析文本进行情感分析处理,并获取文本分析模型输出的包含三元组合的情感分析结果,实现了一次性解决情感分析中的三个核心问题,提升情感分析处理效率的效果,相较于现有技术中仅能够输出两个元素的方法,提升了效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例一的一种文本分析方法的步骤流程图;
图2a为根据本发明实施例二的一种文本分析方法的步骤流程图;
图2b为根据本发明实施例二的一种终端与服务器交互的示意图;
图2c为根据本发明实施例二的一种文本分析模型的示意图;
图3为根据本发明实施例三的一种文本分析方法的步骤流程图;
图4a为根据本发明实施例四的一种文本分析模型训练方法的步骤流程图;
图4b为根据本发明实施例四的一种文本分析模型的结构示意图;
图5为根据本发明实施例五的一种文本分析装置的结构示意图;
图6a为根据本发明实施例六的一种推荐方法的步骤流程图;
图6b为根据本发明实施例六的一种推荐方法的使用场景图;
图7a为根据本发明实施例七的一种推荐方法的步骤流程图;
图7b为根据本发明实施例七的一种推荐方法的使用场景图;
图8a为根据本发明实施例八的一种分析方法的步骤流程图;
图8b为根据本发明实施例八的一种分析方法的使用场景图;
图9为根据本发明实施例九的一种文本分析装置的结构框图;
图10为根据本发明实施例十的一种文本分析模型训练装置的结构框图;
图11为根据本发明实施例十一的一种推荐装置的结构框图;
图12为根据本发明实施例十二的一种推荐装置的结构框图;
图13为根据本发明实施例十三的一种分析装置的结构框图;
图14为根据本发明实施例十四的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1,示出了根据本发明实施例一的一种文本分析方法的步骤流程图。
本实施例的文本分析方法包括以下步骤:
步骤S102:将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理。
待分析文本可以是任何包含情感倾向的文本,例如,用户评论或者包含情感倾向的标签等。本实施例中以待分析文本是用户评论为例进行说明。
在本实施例中,文本分析模型用于对待分析文本进行情感分析处理,并一次性输出包含三元组合的情感分析结果。以待分析文本为“服务员很热情,但意面的表现平平”为例,输出的情感分析结果包括“服务员,正向,热情”和“意面,负向,平平”。
针对不同结构的文本分析模型,可以对待分析文本进行不同的情感分析处理,本实施例对此不作限制。
步骤S104:获取所述文本分析模型输出的情感分析结果。
由于文本分析模型可以一次性输出包含三元组合的情感分析结果,且所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
其中,主体词用于指示待分析文本中的主体对象,如前述的“服务员”和“意面”等。情感极性用于指示对应主体词的主观情感是“正向”或“负向”。情感词用于指示待分析文本中与主体词对应的描述,如前述的“热情”和“平平”。
这样就实现了开创性地在属性级情感分析过程中,使用文本分析模型,能够将三个情感分析子任务融于一个整体任务中,并一次性准确输出包含三元组合的情感分析结果。一方面提升了情感分析效率,另一方面,可以实现三元组合的准确输出。
通过本实施例,使用文本分析模型对待分析文本进行情感分析处理,并获取文本分析模型输出的包含三元组合的情感分析结果,实现了一次性解决情感分析中的三个核心问题,提升情感分析处理效率的效果,相较于现有技术中仅能够输出两个元素的方法,提升了效率和准确性。
本实施例的文本分析方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如平板电脑、手机等)和PC机等。
实施例二
参照图2a,示出了根据本发明实施例二的一种文本分析方法的步骤流程图。
在本实施例中,结合文本分析模型的结构,对文本分析方法进行说明。其中,如图2b所示,终端将待分析文本发送至服务端,服务端可以包括服务器或云端,在本实施例中以服务器为例,在服务器中配置有文本分析模型,通过文本分析模型对待分析文本进行处理,并输出三元组合。
文本分析模型的结构如图2c所示,文本分析模型包括第一处理单元、配对层和第二处理单元。所述第一处理单元包括:输入层和第一隐含层,所述第一隐含层包括第一分支和第二分支。
在本实施例中,文本分析方法包括前述的步骤S102和步骤S104。其中,步骤S102包括以下子步骤:
子步骤S1021:将所述待分析文本输入所述文本分析模型中。
待分析文本可以直接输入到文本分析模型的输入层中,由输入层进行处理。
输入层可以使用现有的词向量算法确定待分析文本的词向量,使用现有的句法依赖关系确定待分析文本的句法依赖关系图,并将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据,输入到第一分支中。将所述待分析文本的词向量作为第二输入数据,输入到第二分支中。
子步骤S1022:通过所述文本分析模型获取待分析文本对应的主体情感数据对和情感词。
在本实施例中,第一分支用于从待分析文本中获取情感词,如“热情”、“平平”等。
第二分支用于从待分析文本中获取主体情感数据对。其中,所述主体情感数据对用于表征所述待分析文本中的主体词和所述主体词对应的情感极性。例如,“服务员,正向”或者“意面,负向”等。对于本领域技术人员而言,其可以采取任何适当的方式获取情感词和主体情感数据对,本实施例对此不作限制。
子步骤S1023:通过所述文本分析模型对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合。
在文本分析模型的配对层中,将主体情感数据对和情感词进行两两配对,从而获得多个候选组合。其中,每个所述候选组合包括所述情感词、所述主体词、以及所述主体词对应的所述情感极性。
例如,“服务员,正向”与“热情”配对形成候选组合A,即“服务员,正向,热情”。“服务员,正向”与“平平”配对形成候选组合B,即“服务员,正向,平平”。“意面,负向”与“热情”配对形成候选组合C,即“意面,负向,热情”。“意面,负向”与“平平”配对形成候选组合D,即“意面,负向,平平”。
子步骤S1204:通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合作为情感分析结果。
其中,空间距离是指候选组合中主体词与情感词之间的距离。例如,“服务员很热情”,主体词“服务员”在候选组合中的位置是“1、2、3”的位置,情感词(热情)在候选组合中的位置是“5、6”,则空间距离是主体词的平均位置(即2)和情感词的平均位置(即5.5)的差的绝对值。
待分析文本的语义信息包含于待分析文本中,即待分析文本的含义。
前述的主体词和情感词的相关度指候选组合中的主体词和情感词是否符合待分析文本中的含义,也就是候选组合的合理程度。例如,“服务员很热情,但意面就平平了”中,候选组合中的“服务员”和“平平”的组合的相关度较低。
预设标准可以是预设的概率值。
在文本分析模型的第二处理单元中,对每个候选组合进行处理,根据候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息确定该候选组合是否合理,即主体词与所述情感词的相关度是否满足预设标准。
如果候选组合是合理的,则将其作为情感分析结果输出。例如,前述的候选组合A~D中,候选组合A与D为合理的组合,输出的情感结果中包括候选组合A与D。
通过本实施例,创新性地使用了包含配对层的文本分析模型,在配对层将第一处理单元输出的主体情感数据对和情感词之间进行配对,获得一个或多个候选组合,并在第二处理单元中根据待分析文本的语义信息确定出满足要求的目标候选组合作为情感分析结果。这样既保证了一次性输出包含三元组合的情感分析结果,又保证了情感词和主体词提取的准确性。
本实施例的文本分析方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如平板电脑、手机等)和PC机等。
实施例三
参照图3,在本实施例中,对文本分析过程进行详细说明。其中,文本分析方法包括前述的步骤S102和步骤S104。其中,步骤S102包括前述的子步骤S1021~子步骤S1024。
下面对各子步骤的实现过程进行详细说明:
关于子步骤S1021:将所述待分析文本输入所述文本分析模型中。
待分析文本可以直接输入到文本分析模型的输入层中,由输入层进行处理。
输入层可以使用现有的词向量算法确定待分析文本的词向量,使用现有的句法依赖关系确定待分析文本的句法依赖关系图,并将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据,输入到第一分支中。将所述待分析文本的词向量作为第二输入数据,输入到第二分支中。
关于子步骤S1022:通过所述文本分析模型获取待分析文本对应的主体情感数据对和情感词。
在一具体实现中,子步骤S1022可以通过以下步骤实现:
步骤10221:将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据,通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词。
具体地,进行情感词提取处理可以实现为:通过所述文本分析模型的第一分支对所述第一输入数据中的主体词与情感词对应关系进行提取处理,以得到包括有所述待分析文本中的主体词与情感词对应关系指示信息的第一输出向量。对所述第一输出向量进行情感词分析处理,获取包括有所述待分析文本中的情感词指示信息的第二输出向量。根据所述第二输出向量,获取所述待分析文本对应的情感词。
例如,使用GCN网络(图卷积神经网络)对待分析文本的词向量和句法依赖关系图进行主体词与情感词对应关系提取处理,获得GCN网络输出的第一输出向量。其中GCN网络的结构可以根据句法依赖关系图生成。
该第一输出向量中至少包括有所述待分析文本中的主体词与情感词对应关系。当然,其中还可能包括有待分析文本的语义信息等。
将第一输出向量输入到第一双向长短时记忆网络中,由第一双向长短时记忆网络对其进行情感词分析处理,获取第二输出向量。第二输出向量包括有所述待分析文本中的情感词的信息。
之后,通过对第二输出向量进行归一化处理(softmax),就可以获得待分析文本中的情感词。
步骤10222:将所述待分析文本的词向量作为第二输入数据,通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对。
具体地,主体情感数据对提取处理实现为:通过所述文本分析模型的第二分支对所述第二输入数据进行第一主体边界提取处理,以获得包括有所述待分析文本中的主体词边界的边界指示信息的第三输出向量。
对所述第三输出向量进行情感极性分析处理,以获得包括有所述待分析文本中各所述主体词对应的情感极性的情感极性指示信息的第四输出向量;对所述第二输出向量、第三输出向量、所述第四输出向量进行第二主体边界提取处理,获取所述待分析文本对应的所述主体情感数据对。
例如,将待分析文本的词向量(即第二输入数据)输入到第二长短时记忆网络中,由其进行第一主体边界提取处理,输出第三输出向量。第三输出向量中至少包括有所述待分析文本中的主体词边界的信息。
将第三输出向量输入到第三长短时记忆网络中,由其进行情感极性处理,确定主体词边界的信息中指示的主体词对应的情感极性。并将第三长短时记忆网络输出的数据输入到情感一致性网络中,获取情感一致性网络输出的所述第四输出向量。
利用情感一致性网络防止主体词的情感极性突变。例如,一个主体词包括多个词语时,使一个主体词中的各个词语的情感极性一致。例如,例如,“河豚生鱼片”是一个主体词,但由两个词语构成“河豚”和“生鱼片”。在处理过程中,如果出现将主体词“河豚生鱼片”识别为两个主体词即“河豚”和“生鱼片”的情况时,通过情感一致性网络,使得可以使这两个主体词的情感极性一致,同为“正向”或同为“负向”,从而使对主体词的情感极性判断更加准确。
将第四输出向量、第三输出向量和第一分支输出的第二输出向量输入到边界辅助模块中,由其进行第二主体边界提取处理,从而实现综合主体词和情感词的信息,获取所述待分析文本对应的所述主体情感数据对,使主体词提取的准确性更好。
在一具体实现中,对所述第二输出向量、所述第三输出向量、所述第四输出向量进行第二主体边界提取处理,获得所述待分析文本对应的所述主体情感数据对,包括以下过程:
过程A1:对所述第三输出向量进行第一归一化处理,获得第一归一化结果。
过程B1:对所述第一归一化结果进行向量平方和计算,获得中间变量,并根据第一预设权重,对所述中间变量进行相乘,获得计算权重。
其中,第一预设权重可以是本领域技术人员根据需要设定的,也可以是采用训练样本通过对文本分析模型进行训练学习出的。
第一归一化处理可以根据需要适当选择,本实施例对此不作限制。例如,为softmax,即归一化指数函数。
过程C1:对所述第四输出向量和所述第二输出向量进行合并操作,获得第五输出向量,并对所述第五输出向量进行第二归一化处理,获得第二归一化结果。
过程D1:根据所述第一归一化结果、所述第二归一化结果和所述计算权重,确定所述主体情感数据对。
具体地,确定过程可以采用下述公式:
通过上述步骤A就可以获得待分析文本中的情感词,通过上述的步骤B就可以获得待分析文本中的包括主体词和情感极性的主体情感数据对。
子步骤S1023:通过所述文本分析模型对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合。
在文本分析模型的配对层中,将主体情感数据对和情感词进行两两配对,从而获得多个候选组合。其中,每个所述候选组合包括所述情感词、所述主体词、以及所述主体词对应的所述情感极性。
关于子步骤S1204:通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合作为情感分析结果。
在一具体实现中,通过所述文本分析模型从所述至少一个候选组合中确定当前候选组合,通过对当前候选组合的处理过程说明,来对子步骤S1204的实现过程进行说明。
在子步骤S1024中,针对当前候选组合执行下述过程:
过程A2:根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离、以及所述待分析文本的词向量,生成第三输入数据。
本领域技术人员可以采用任何适当的方式计算主体词与情感词的空间距离。
在本实施例中,过程A2包括:根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的位置,确定所述主体词与所述情感词之间的空间距离;根据所述空间距离生成包含所述主体词和所述情感词的位置信息的位置向量;根据所述待分析文本的词向量和所述当前候选组合的位置向量,生成所述第三输入数据。
例如,待分析文本为“服务员很热情”,其中的主体词为“服务员”,其在待分析文本中的位置为1、2和3。情感词为“热情”,其在待分析文本中的位置为5和6。
那么两者的空间距离为主体词的平均值与情感词平均值的绝对值,即,1、2和3的平均值M=2,5和6的平均值N=5.5,|N-M|=3.5。根据该空间距离生成的距离向量可以表示为[3.5,3.5,3.5,0,3.5,3.5]。
将所述距离向量乘以一个转换矩阵,所述转换矩阵的维度是“句长,位置向量维度”,位置向量维度指需要的位置向量的维度,句长即待分析文本的长度,然后句子内每个词都会得到一个对应的位置向量,其维度即为前述的“位置向量维度”。
其中,转换矩阵可以是本领域技术人员根据需要预设定(或随机设定)的,然后采用训练样本通过对文本分析模型进行训练学习出的。
之后,通过拼接待分析文本的词向量和位置向量生成第三输入数据。
过程B2:对所述第三输入数据进行语义分析处理,以获取语义分析输出数据。
在本实施例中,使用第四双向长短时记忆网络对第三输入数据进行语义分析处理,并输出语义分析输出数据。
过程C2:根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准;
在本实施例中,过程C2可以实现为:从所述语义分析输出数据中抽取出与所述主体词对应的第一向量、与所述情感词对应的第二向量;对所述第一向量和所述第二向量进行拼接获得拼接结果以对所述拼接结果进行分类处理;根据分类处理的结果确定所述当前候选组合的相关度是否满足预设标准。
通过将拼接结果输入到分类器中对其进行分类处理,进而可以确定当前候选组合中的主体词与情感词的相关度,进而判断其是否满足预设标准。
若满足,则将所述当前候选组合作为所述目标候选组合,并返回从所述至少一个候选组合中确定当前候选组合的步骤继续执行,直至完成对所有候选组合的相关度是否满足预设标准的确定。
或者,若不满足,则返回从所述至少一个候选组合中确定当前候选组合的步骤继续执行,直至完成对所有候选组合的相关度是否满足预设标准的确定。
通过上述过程,在对文本的情感分析任务上,首次将三个情感分析子任务融于一个整体任务中,并提出了一个有效输出三元组合的文本分析模型。该文本分析模型的第一处理单元首先抽取所有可能的主体词及对应的情感极性的数据对和情感词。第二处理单元对每种候选组合进行筛选,并最终给出合理的组合。也既给出了一个三元组,(主体词,情感词,情感极性)。效果上优于现有的所有情感分析模型。
此外,在第一处理单元中,借助句子句法依赖性分析,并利用Graphconvolutionalnetowrk(GCN网络)来学习待分析文本内的语法关系,从而将主体词和情感词的表达相互嵌入,使得可以更准确的抓取主体词和情感词。
在第二处理单元中,使用位置向量(即Position embedding)用来表示主体词和情感词的空间距离,以捕捉相似度,使得对候选组合的合理性的判断更加准确。
实施例四
参照图4a,出了根据本发明实施例四的一种文本分析模型训练方法的步骤流程图。
在本实施例中,对文本分析模型的训练过程进行详细说明。其中,文本分析模型的结果如前述的图4b所示,文本分析模型包括第一处理单元(图中所示stage one对应的部分)、配对层(图中所述candidate pair pool对应的部分)和第二处理单元(图中stage two对应的部分)。
其中,第一处理单元包括第一分支、第二分支和主体辅助模块(图中所示TG)。
第一分支用于主体识别(即提取主体词)和情感分类(即确定主体词的情感极性),其输出主体情感数据对,第一分支包括GCN网络(图卷积神经网络)、第一双向长短时记忆网络(图中所示BLSTMOPT)。
第二分支用于情感词提取,其输出情感词,第二分支包括第二双向长短时记忆网络(图中所示BLSTMT)、第三双向长短时记忆网络(图中所示BLSTMS)、情感一致性模块(图中所示SC)和边界辅助模块(图中所示BG)。
主体辅助模块TG用于使用第二分支输出的主体词的边界信息帮助第一分支抽取情感词,并同时利用反向传播信息回传帮助第二分支的主体识别和情感分类。
下面结合前述结构的文本分析模型,对文本分析模型训练方法进行说明如下:
所述文本分析模型训练方法包括以下步骤:
步骤S402:从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量。
其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量。第一样本输入数据的获取方式可以与第一输入数据相同,第二样本输入数据的获取方式可以与第二输入数据相同,故不再赘述。
不同的文本分析模型对第一样本输入数据和第二样本输入数据的处理过程可能不同,本实施例中对此不作限制。
在一具体实现中,在步骤S402中获取第一样本输出向量时,通过所述第一分支对所述第一样本输入数据进行处理,获取包括有指示所述待分析文本中的主体词及情感词对应关系的第一样本输出向量。
具体地,通过第一分支中的GCN网络对第一样本输入数据进行处理,获取GCN网络输出的第一样本输出向量(图中所示hO)。在本实施例中,由于GCN网络用于学习出待分析文本中的主体词及情感词对应关系,故而其输出的第一样本输出向量hO中包含主体词及情感词对应关系。
在步骤S402中获取第三样本输出向量时,通过所述第二分支对所述第二样本输入向量进行处理,获取包括有用于指示所述待分析文本中的主体词边界的边界信息的第三样本输出向量。
具体地,通过第二分支中的第二双向长短时记忆网络BLSTMT对第二样本输入数据进行处理,获取其输出的第三样本输出向量。在本实施例中,由于第二双向长短时记忆网络BLSTMT用于学习出待分析文本中的主体词边界,故而其输出的第三样本输出向量中包含边界信息。
步骤S404:根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数。
在本实施例中,第一样本输出向量和第三样本输出向量输入主体辅助模块TG中,主体辅助模块TG通过对其进行处理输出,主体辅助的情感词损失函数。
在一具体实现中,在主体辅助模块TG中,步骤S404可以实现为:将所述第一样本输出向量和所述第三样本输出向量进行拼接,获得拼接样本向量;对所述拼接样本向量进行第三归一化处理,获取第三归一化结果,并根据所述第三归一化结果计算所述主体辅助的情感词损失函数(图中所示LTG)。
在本实施例中,第三归一化处理可以是任何适当的softmax函数,即归一化指数函数。
步骤S406:根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
在一种可行方式中,根据获得的主体辅助的情感词损失函数LTG,可以对第二双向长短时记忆网络BLSTMT中的参数进行调整,从而使其对主体的边界确定更加准确。
当然,在其他实施例中,可以采用更多的损失函数调整第一分支和第二分支的所有参数或者部分参数,本实施例对此不作限定。
由于在训练阶段文本分析模型包括主体辅助模块。在主体辅助模块中,通过借用第三样本输出数据中的主体词边界信息帮助第一分支抽取情感词,并同时利用反向传播信息回传帮助第二分支进行主体识别和情感分类,创新性地将两个情感分析子任务耦合,实现了同时提高两个分支的效果的目的。
可选地,在本实施例中,为了进一步提升训练效果,使得第一分支和第二分支的输更加准确,除了使用主体辅助的情感词损失函数对文本分析模型中的至少部分参数进行调整外,还使用了其他损失函数,以便通过增加损失函数的方式提升训练效果。
此种情况下,文本模型训练方法在步骤S406之前还执行以下过程:
过程A3:获取所述第一分支输出的包括有所述待分析文本中的情感词指示信息的第二样本输出向量,根据所述第二样本输出向量计算情感词损失函数。
其中,在过程A3中,将第一样本输出向量hO输入到第一分支的第一双向长短时记忆网络BLSTMOPT中,获取其输出的第二样本输出向量(图中所示hOPT)。
第二样本输出向量hOPT一方面进行第四归一化处理,另一方面输入到第二分支的边界辅助模块BG中。
通过对第二样本输出向量进行进行第四归一化处理,获得第四归一化结果,根据第四归一化结果确定情感词损失函数(图中所示LOPT)。
其中,第四归一化处理可以是softmax函数,第四归一化处理中的权重值可以是预设的,也可以是学习出的。
过程B3:根据所述第三样本输出向量计算主体边界损失函数。
本领域技术人员可以采用任何适当的方式根据第三样本输出向量计算主体边界损失函数(图中所示LT),本实施例对此不作限制。例如,直接根据预设的权重计算主体边界损失函数LT。
过程C3:获取所述第二分支输出的包含主体情感数据对信息的样本输出向量,根据包含主体情感数据对信息的样本输出向量计算数据对损失函数。
在一种具体实现中,在获取第三样本输出向量后,将第三样本输出向量输入到第二分支的边界辅助模块BG中。
此外,还将第三样本输出向量输入到第三双向长短时记忆网络BLSTMS中,通过第三双向长短时记忆网络BLSTMS的处理,获得其输出的用于指示主体词情感极性的输出向量(图中所示hS),之后将用于输出向量hS输入到情感一致性模块SC中,获取其输出的第四输出向量(图中所示),
在情感一致性模块SC中,当前时刻的输出(即第四输出向量)根据当前时刻的输入即输出向量hS和前一时刻的输出(即前一时刻的第四输出向量)确定。这样可以强制输出的情感极性表达稳定。
之后可以根据包含主体情感数据对信息的样本输出向量计算数据对损失函数(图中所示LTS)。本领域技术人员可以根据需要采用任何适当的方式计算,本实施例对此不作限制。
在此种情况下,步骤S406可以根据所述主体辅助的情感词损失函数、所述情感词损失函数、所述数据对损失函数和主体边界损失函数,调整所述文本分析模型中的至少部分参数。
通过这种在训练过程中综合多个损失函数调整文本分析模型的参数的方式,实现了在情感分析任务的解决思路上,将主体词抽取、主体词的情感极性分类和情感词抽取三个任务的特征进行相互学习和辅助,使得文本分析模型可以一次性输出包括三元组合的情感分析结果,而且可以保证准确性。
可选地,在一种情况中,第二处理单元可以与第一处理单元一同训练,即在获得第一处理单元输出的主体情感数据对和情感词之后,在配对层对其进行两两配对,获得多个候选组合,并将候选组合输入到第二处理单元中,在第二处理单元根据候选组合中情感词和主体词的空间距离生成的位置向量和待分析文本的词向量生成第三输入数据,第二处理单元中的第四双向长短时记忆网络对其进行处理,并获取第四双向长短时记忆网络的隐层输出,根据隐层输出使用分类器确定候选组合中主体词和情感词的相关度,之后计算相关度的损失函数、主体辅助的情感词损失函数、所述情感词损失函数、所述数据对损失函数和主体边界损失函数,根据相关度的损失函数对第一处理单元和/或第二处理单元中的至少部分参数进行调整。
当然,在其他实施例中,也可以对第二处理单元进行单独训练,本实施例对此不作限制。
实施例五
参照图5,示出了根据本发明实施例五的一种具体的文本分析装置的结构。下面结合此种结构的文本分析装置,对文本分析装置实现前述的文本分析模型的功能的工作过程进行详细说明。
在本实施例中,文本分析装置包括第一处理单元、配对层和第二处理单元。
其中,所述第一处理单元用于获取待分析文本对应的主体情感数据对和情感词。
所述配对层用于对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合。
所述第二处理单元用于根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定并输出主体词与情感词的相关度满足预设标准的目标候选组合。
具体地,如图5所示,在本实施例中,所述第一处理单元包括:输入层和第一隐含层,所述第一隐含层包括第一分支和第二分支。
其中,所述输入层用于获取待分析文本,并将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据,输入所述第一分支,将所述待分析文本的词向量作为第二输入数据,输入到用于主体情感数据对提取的第二分支。
在输入层中,可以使用现有的词向量算法确定待分析文本的词向量,使用现有的句法依赖关系确定待分析文本的句法依赖关系图。
所述第一分支用于对所述第一输入数据至少进行主体词与情感词对应关系提取处理和情感词提取处理,并至少输出包括有用于指示所述待分析文本中的情感词的第二信息的第二输出向量和情感词。
第一分支在进行主体词和情感词对应关系提取处理时,基于第一分支中使用的神经网络层不同可以进行不同的处理。例如,若第一分支中包括GCN网络层(即图卷积神经网络),则可以通过GCN网络层对输入的待分析文本(sentence)的词向量和句法依赖关系图进行主体词和情感词对应关系提取处理,获得GCN网络层输出的包括有所述待分析文本中的主体词与情感词对应关系指示信息的第一输出向量(图中h0)。
在进行情感词提取处理时,基于第一分支中使用的神经网络层不同可以进行不同的处理。例如,若第一分支中包括第一双向长短时记忆网络(图所示BLSTMOPT),则通过第一双向长短时记忆网络BLSTMOPT对GCN网络层输出的第一输出向量h0进行情感词提取处理,获得第一双向长短时记忆网络BLSTMOPT输出的包括有用于指示所述待分析文本中的情感词的第二信息的第二输出向量(图中hOPT)。
根据第二输出向量hOPT可以确定输出的情感词。例如,通过对第二输出向量hOPT进行归一化处理,获得对应的情感词。
通过上述过程,在使用阶段,第一分支通过GCN网络结合句子依赖关系,确定出主体词和情感词的句法关系。
在训练阶段,GCN网络借助句子的句法依赖性分析,利用Graph convolutionalnetowrk来学习句子内的语法关系,从而将主体词和情感词的表达相互嵌入,以便更准确的抓取主体和情感词。GCN网络的输出的第一输出向量h0(训练阶段为第一样本输出向量)会被送到两个方向。一是主体辅助模块TG,目的是利用主体辅助模块TG融合第二分支输出的主体词信息和第一分支输出的主体词与情感词的对应关系来使第二分支学习情感词的抽取。二是输出到第一双向长短时记忆网络BLSTMOPT,目的是用来学习句子内语义然后来抽取情感词。
在第二分支中,所述第二分支用于对所述第二输入数据至少进行第一主体边界提取处理、情感极性分析处理和第二主体边界提取处理,并至少输出主体情感数据对。
第二输入数据输入到第二分支的第二双向长短时记忆网络(图中所示BLSTMT)中,由其进行第一主体边界提取处理,并输出第三输出向量(图中所述hT)。
使用阶段,第三输出向量hT分别输入到第二分支的第三双向长短时记忆网络(图中所示BLSTMS)和边界辅助模块(图中所示BG)中。在训练阶段,第三输出向量hT还用于计算损失函数LT和输入到主体辅助模块TG中。
在第三双向长短时记忆网络BLSTMS中,其对第三输出向量hT进行处理,并输出用于指示主体词情感极性的输出向量hS,用于指示主体词情感极性的输出向量hS被输入到情感一致性模块(图中所示SC)中,在情感一致性模块SC中,当前时刻的输出(即第四输出向量)根据当前时刻的输入即输出向量hS和前一时刻的输出(即前一时刻的第四输出向量)确定。这样可以强制输出的情感极性表达稳定。
具体地,在边界辅助模块BG中,在图示的eq.2,4中,对第三输出向量hT进行第一归一化处理,获得第一归一化结果。
对所述第一归一化结果进行向量平方和计算,获得中间变量,并根据第一预设权重,对所述中间变量进行相乘,获得计算权重。所述计算权重与第一归一化结果相乘,获得第一归一化结果(图中所示ZS’)。
其中,第一预设权重可以是本领域技术人员根据需要设定的,也可以是采用训练样本通过对文本分析装置进行训练学习出的。
在eq.5中,根据所述第一归一化结果ZS’、所述第二归一化结果ZS和所述计算权重,确定所述主体情感数据对(图中所示ZTS)。
通过上述过程,第一处理单元输出了主体情感数据对和情感词。
在配对层,将主体情感数据对和情感词两两配对,形成多个候选组合(即图中所述candidate pair pool)。之后将各个候选组合输入到第二处理单元中,确定各个候选组合的合理性。
本实施例中,所述第二处理单元包括第二隐含层和输出层。
所述第二隐含层用于根据当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离,生成第三输入数据,并对所述第三输入数据进行语义分析处理,输出语言分析输出数据。
第二隐含层中生成第三输入数据的过程如实施例三中所述,故不再赘述。第二隐含层中通过第四双向长短时记忆网络(图中所示BLSTMH)对第三输入数据进行处理。
由于在生成第三输入数据时,使用position embedding来学习主体词和情感词的位置关系,即用来学习主体词和情感词的空间距离,以捕捉相似度。通过预训练的词向量来表达每个词,使得第三输入数据中既包括位置信息又包含语义信息。通过第四双向长短时记忆网络来学习主体词和情感词在句内的上下文信息,使得语义分析输出数据可以准确表示语义信息,且融合了位置信息。
所述输出层用于根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准,并根据确定结果从所述至少一个候选组合中确定并输出主体词与情感词的相关度满足预设标准的组合。
在输出层中,可以采用实施例三中的方式,根据第四双向长短时记忆网络BLSTMH输出的语义分析输出数据,从中获取主体词中各字对应的向量,进行平均处理,得到与主体词对应的第一向量,同时,获取情感词对应的各字的向量,进行平均处理,得到情感词对应的第二向量,再将第一向量和第二向量进行拼接处理,获得拼接向量,对拼接向量进行而分类处理,确定包含该主体词和情感词的候选组合是否合理,即主体词与情感词的相关度是否满足预设标准。
通过上述过程就实现了对待分析文本的情感分析处理,可以一次性获得包括三元组合的情感分析结果。
需要说明的是,上述实现过程仅为举例说明,前述的双向长短时记忆网络均可以替换为transformer等网络模型。GCN网络可以采用recursive neural nets或tree-LSTM来替代。第二处理单元可以使用基于经验的规则替代。
本实施例的文本分析装置可以应用至任何适当的场景中进行评论分析,包括但不限于电子商务,旅游餐饮,社会热点事件,舆情监控等。
实施例六
参照图6a和6b,其中,图6a示出了本发明实施例六的一种推荐方法的步骤流程图。图6b示出了本发明实施例六的一种推荐方法的使用场景图。
在本实施例中,以文本分析模型部署在服务端(服务端可以是服务器或云端)为例进行说明。服务端还配置有推荐模块,推荐模块包括情感极性分析单元和情感词分析单元。
在本实施例中,所述推荐方法包括:
步骤S602:根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本。
用户信息可以是用户的用户名、标识ID等。客户端可以主动将用户信息发送给服务端,或者,服务端主动请求某一客户端上的用户信息。
根据用户信息可以获取对应的历史评论数据。例如,服务端从本地获取,或者请求客户端发送等。
步骤S604:使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果。
其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词。
以待分析文本为“不要买这个牌子的电脑,续航极差”为例。通过文本分析模型,输出的情感分析结果为“电脑,负向,续航极差”。
在获取情感分析结果时,可以将历史评论数据作为待分析文本输入到前述的文本分析模型中,获取文本分析模型的情感分析结果作为情感分析结果。
例如,文本分析模型对历史评论数据进行处理的过程为,将历史评论数据的词向量和句法依赖关系图输入第一分支中,获取第一分支输出的情感词,将历史评论数据的词向量输入第二分支中,获取第二分支输出的主体情感数据对。在配对层将主体情感数据对和情感词两两配对,获得候选组合。在第二处理单元中获得输出的合理的组合即为情感分析结果。
可选地,为了提升情感分析结果的准确性,步骤S604还可以实现为:使用文本分析模型对所述待分析文本进行情感分析处理,并获取初始情感分析结果;将所述初始情感分析结果发送至所述待推荐用户;获取基于所述待推荐用户对所述初始情感分析结果的修正操作生成的修正信息;根据所述修正信息生成与所述待分析文本对应的情感分析结果。
这样可以将初始情感分析结果发送给待推荐用户,使待推荐用户能够根据自己的需求修正情感分析结果,从而后续可以提升根据其确定的推荐信息的准确性,保证推荐信息更加满足待推荐用户的需求。
以所述修正信息中包括指示将所述情感分析结果中的至少两个主体词合并的信息为例。根据所述修正信息生成与所述待分析文本对应的情感分析结果,包括:根据所述修正信息,将所述情感分析结果中所述修正信息指示的主体词合并为一个主体词;根据合并的主体词,生成与所述待分析文本对应的情感分析结果。
例如,文本分析模型输出的初始情感分析结果为“河豚,负向,不新鲜”、“生鱼片,负向,不新鲜”,将该初始情感分析结果发送给客户端,由客户端显示给待推荐用户。待推荐用户发现主体词两个主体词“河豚”和“生鱼片”应为一个主体词“河豚生鱼片”,此时待推荐用户可以通过操作客户端指示将两个主体词合并为一个,客户端根据此操作生成修正信息,并将其发送给服务端,服务端将修正信息指示的主体词合并为一个主体词;根据合并的主体词,生成与所述待分析文本对应的情感分析结果,即最终的情感分析结果为“河豚生鱼片,负向,不新鲜”。
这样提升了待推荐用户的交互性,且有助于提高情感分析结果的质量。
步骤S606:根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
在一种具体实现方式中,步骤S606包括以下子步骤:
子步骤S6061:根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体。
从所有情感分析结果中,提取出情感极性为“负向”的情感分析结果,并确定这些情感分析结果对应的主体词,例如,前面的例子中,对应的主体词为“电脑”。将该电脑可以作为候选主体。
子步骤S6062:根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
前述例子中,候选主体为“电脑”,对应的情感词为“续航极差”。针对该候选主体,从候选推荐信息中筛选出与电脑相关的推荐信息,并从这些与电脑相关的推荐信息中确定优势是续航能力的推荐信息,作为与待推荐用户对应的推荐信息。后续可以将这些推荐信息推荐给用户。从而实现了对用户的精准推荐。
需要说明的是,前述的候选主体包括下列至少之一:候选商品、候选店铺和候选景点。也就是说,前述的候选主体不仅可以是例子中的电脑等商品,也可以是旅游的景点、或者饭店、酒店等店铺。
实施例七
参照图7a和7b,其中,图7a示出了本发明实施例七的一种推荐方法的步骤流程图。图7b示出了本发明实施例七的一种推荐方法的使用场景图。
在本实施例中,以文本分析模型配置在客户端为例,进行说明。其中,推荐模块可以配置在客户端,也可以配置在服务端。推荐模块包括情感极性分析单元和情感词分析单元。
在本实施例中,推荐方法包括以下步骤:
步骤S702:获取待推荐用户的评论数据。
用户的评论数据可以是用户通过安装有客户端的移动终端输入的评论数据。该评论数据可以是针对某一新闻事件的评论,或者针对某一商品的评论等。
步骤S704:调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果。
其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词。
使用客户端本地的文本分析模型进行情感分析处理的过程与在服务端类似,故不再赘述。
步骤S706:根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
在一种可行方式中,步骤S706可以实现为:将所述情感分析结果发送至服务端,并获取所述服务端返回的与所述用户对应的推荐信息。
服务端可以采用前述实施例六的方式确定推荐信息,并返回给客户端。或者,采用其他方式确定推荐信息,本实施例对此不作限制。
或者,在另一种可行方式中,步骤S706可以实现为;根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
例如,情感分析结果中包括“河豚生鱼片,负向,不新鲜”,则根据情感分析结果,确定情感极性为负向的主体词为“河豚生鱼片”,其对应的候选主体即为“河豚生鱼片”。根据情感词“不新鲜”从包含“河豚生鱼片”的候选推荐信息中,确定优势是新鲜的信息作为推荐信息,后续可以将这些推荐信息显示给待推荐用户。
通过上述方式实现了在客户端本地对评论数据进行处理获取情感分析结果,并根据情感分析结果获得推荐信息,实现了针对用户的准确推荐。
实施例八
参照图8a和8b,其中,图8a示出了本发明实施例八的一种分析方法的步骤流程图。图8b示出了本发明实施例八的一种分析方法的使用场景图。
该分析方法可以由客户端执行,也可以有服务端执行,在本实施例中,以服务端执行为例进行说明。服务端部署有文本分析模型、观点确定模块和推荐模块,观点确定模块包括情感极性分析单元和情感词分析单元。
在本实施例中,分析方法包括以下步骤:
步骤S802:获取目标用户针对目标事件的评论数据。
目标事件可以是新闻事件、或者用户发布的帖子中的事件等等。例如,针对“某某峰会”的事件,或者,针对“某某农产品价格上涨”的事件等。
针对目标事件的评论数据可以是用户针对该事件发布的评论。例如,针对“某某农产品价格上涨”的视角,评论数据为“某某农产品的价格上涨说明通货膨胀加剧”。
步骤S804:使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果。
其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词。以评论数据为“某某农产品的价格上涨说明通货膨胀加剧,应该进行抑制”为例,其中的主体词可以为“某某农产品的价格”和/或“通货膨胀”,情感分析结果为“某某农产品的价格,负向,上涨”,“通货膨胀,负向,加剧”,“通货膨胀,负向,抑制”。
使用文本分析模型对评论数据进行情感分析处理的过程可以如实施例六中所述,故在此不再赘述。
步骤S806:根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
在一种具体实现方式中,步骤S806可以实现为:将所述情感分析结果中的主体词与预设的热点主题匹配,获得匹配的热点主题作为所述目标用户的评论热点;根据所述情感极性和所述情感词确定所述目标用户针对所述评论热点的观点倾向。
预设的热点主题可以是根据多个用户的评论数据的情感分析结果确定的热点主题。例如,针对某一目标事件,有1万条评论数据,根据这1万条评论数据的情感分析结果确定了5千个情感分析结果的主体词包括“通货膨胀”,则将其确定作为预设的热点主题。
当然,预设的热点主题也可以由人工预先根据经验确定,本实施例对此不作限制。
根据获取的情感分析结果,将其中的主体词与预设的热点主题进行匹配,可以是进行语义匹配,若匹配结果指示主体词与热点主题匹配,则将匹配的热点主题作为所述目标用户的评论热点,根据情感极性和所述情感词,确定用户的观点倾向为“上涨、抑制”。
可选地,针对用户的观点倾向,在后续过程中可以优先向用户展示与观点倾向对应的新闻内容,或者将与用户的观点倾向相匹配的评论数据优先显示。
与前述实施例不同的是,本实施例中,情感极性分析单元和情感词分析单元设置在观点确定模块中,而非推荐模块中。本实施例中的推荐模块基于观点确定模块的输出做进一步的推荐操作,具体如图8b中所示。
通过上述过程,可以实现对热点事件的用户意见追踪,或者用户的舆情控制。
需要说明的是,前述实施例中的向量可以是一维,也可以是多维。
实施例九
参照图9,示出了根据本发明实施例七的一种文本分析装置的结构框图。
本实施例的文本分析装置包括:分析模块902,用于将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;获取模块904,用于获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
可选地,分析模块902包括:输入模块9021,用于将所述待分析文本输入所述文本分析模型中;第一提取模块9022,用于通过所述文本分析模型获取待分析文本对应的主体情感数据对和情感词,其中,所述主体情感数据对用于表征所述待分析文本中的主体词和所述主体词对应的情感极性;配对模块9023,用于通过所述文本分析模型对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合,其中,每个所述候选组合包括所述情感词、所述主体词、以及所述主体词对应的所述情感极性;第二提取模块9024,用于通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合作为情感分析结果。
可选地,第一提取模块9022用于将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据;通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词;以及,将所述待分析文本的词向量作为第二输入数据;通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对。
可选地,第一提取模块9022在所述通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词时,通过所述文本分析模型的第一分支对所述第一输入数据中的主体词与情感词对应关系进行提取处理,以得到包括有所述待分析文本中的主体词与情感词对应关系指示信息的第一输出向量;对所述第一输出向量进行情感词分析处理,获取包括有所述待分析文本中的情感词指示信息的第二输出向量;根据所述第二输出向量,获取所述待分析文本对应的情感词。
可选地,第一提取模块9022在通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对时,用于通过所述文本分析模型的第二分支对所述第二输入数据进行第一主体边界提取处理,以获得包括有所述待分析文本中的主体词边界的边界指示信息的第三输出向量;对所述第三输出向量进行情感极性分析处理,以获得包括有所述待分析文本中各所述主体词对应的情感极性的情感极性指示信息的第四输出向量;对所述第二输出向量、第三输出向量、所述第四输出向量进行第二主体边界提取处理,获取所述待分析文本对应的所述主体情感数据对。
可选地,第一提取模块9022在所述对所述第二输出向量、所述第三输出向量、所述第四输出向量进行第二主体边界提取处理,获得所述待分析文本对应的所述主体情感数据对时,对所述第三输出向量进行第一归一化处理,获得第一归一化结果;对所述第一归一化结果进行向量平方和计算,获得中间变量,并根据第一预设权重,对所述中间变量进行相乘,获得计算权重。
对所述第四输出向量和所述第二输出向量进行合并操作,获得第五输出向量,并对所述第五输出向量进行第二归一化处理,获得第二归一化结果;根据所述第一归一化结果、所述第二归一化结果和所述计算权重,确定所述主体情感数据对。
可选地,第二提取模块9024在所述通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合时,通过所述文本分析模型从所述至少一个候选组合中确定当前候选组合;根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离、以及所述待分析文本的词向量,生成第三输入数据;对所述第三输入数据进行语义分析处理,以获取语义分析输出数据;根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准;若满足,则将所述当前候选组合作为所述目标候选组合,并返回从所述至少一个候选组合中确定当前候选组合的步骤继续执行,直至完成对所有候选组合的相关度是否满足预设标准的确定。
可选地,第二提取模块9024在根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离,生成第三输入数据时,用于根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的位置,确定所述主体词与所述情感词之间的空间距离;根据所述空间距离生成包含所述主体词和所述情感词的位置信息的位置向量;根据所述待分析文本的词向量和所述当前候选组合的位置向量,生成所述第三输入数据。
可选地,第二提取模块9024在所述根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准时,用于从所述语义分析输出数据中抽取出与所述主体词对应的第一向量、与所述情感词对应的第二向量;对所述第一向量和所述第二向量进行拼接获得拼接结果以对所述拼接结果进行分类处理;根据分类处理的结果确定所述当前候选组合的相关度是否满足预设标准。
本实施例的文本分析装置用于实现前述多个方法实施例中相应的文本分析方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的文本分析装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例十
参照图10,示出了本发明实施例十的一种文本分析模型训练装置的结构框图。
文本分析模型训练装置包括:处理模块1002,用于从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;主体辅助损失函数确定模块1004a,用于根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;调整模块1006,用于根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
可选地,所述文本分析模型包括用于对第一样本输入数据和第二样本输入数据进行处理的第一处理单元,所述第一处理单元包括第一分支和第二分支;处理模块1002用于通过所述第一分支对所述第一样本输入数据进行处理,获取包括有指示所述待分析文本中的主体词及情感词对应关系的第一样本输出向量;通过所述第二分支对所述第二样本输入向量进行处理,获取包括有用于指示所述待分析文本中的主体词边界的边界信息的第三样本输出向量。
可选地,主体辅助损失函数确定模块1004a用于将所述第一样本输出向量和所述第三样本输出向量进行拼接,获得拼接样本向量;对所述拼接样本向量进行第三归一化处理,获取第三归一化结果,并根据所述第三归一化结果计算所述主体辅助的情感词损失函数。
可选地,所述装置还包括:情感词损失函数计算模块1004b,用于获取所述第一分支输出的包括有所述待分析文本中的情感词指示信息的第二样本输出向量,根据所述第二样本输出向量计算情感词损失函数;主体边界损失函数计算模块1004c,用于根据所述第三样本输出向量计算主体边界损失函数;向量计算数据对损失函数计算模块1004d,用于获取所述第二分支输出的包含主体情感数据对信息的样本输出向量,根据包含主体情感数据对信息的样本输出向量计算数据对损失函数;调整模块1006用于根据所述主体辅助的情感词损失函数、所述情感词损失函数、所述数据对损失函数和主体边界损失函数,调整所述文本分析模型中的至少部分参数。
本实施例的文本分析模型训练装置用于实现前述多个方法实施例中相应的文本分析模型训练方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的文本分析模型训练装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例十一
参照图11,示出了本发明实施例十一的一种推荐装置的结构框图。
在本实施例中,推荐装置包括:
第一用户信息获取模块1102,用于根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;
第一分析模块1104,用于使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;
第一推荐模块1106,用于根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
可选地,所述第一推荐模块1106用于根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
可选地,第一分析模块1104用于使用文本分析模型对所述待分析文本进行情感分析处理,并获取初始情感分析结果;将所述初始情感分析结果发送至所述待推荐用户;获取基于所述待推荐用户对所述初始情感分析结果的修正操作生成的修正信息;根据所述修正信息生成与所述待分析文本对应的情感分析结果。
可选地,所述修正信息中包括指示将所述情感分析结果中的至少两个主体词合并的信息;第一分析模块1104在根据所述修正信息生成与所述待分析文本对应的情感分析结果时,根据所述修正信息,将所述情感分析结果中所述修正信息指示的主体词合并为一个主体词;根据合并的主体词,生成与所述待分析文本对应的情感分析结果。
可选地,所述候选主体包括下列至少之一:候选商品、候选店铺和候选景点。
本实施例的推荐装置用于实现前述多个方法实施例中相应的推荐方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的推荐装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例十二
参照图12,示出了本发明实施例十二的一种推荐装置的结构框图。
在本实施例中,推荐装置包括:第三用户信息获取模块1202,用于获取待推荐用户的评论数据;调用模块1204,用于调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;第三推荐模块1206,用于根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
可选地,第三推荐模块1206用于将所述情感分析结果发送至服务端,并获取所述服务端返回的与所述用户对应的推荐信息;或者,第三推荐模块1206用于根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。本实施例的推荐装置用于实现前述多个方法实施例中相应的推荐方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的推荐装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例十三
参照图13,示出了本发明实施例十三的一种分析装置的结构框图。
在本实施例中,分析装置包括:第四用户信息获取模块1302,用于获取目标用户针对目标事件的评论数据;第三分析模块1304,用于使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;观点确定模块1306,用于根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
可选地,观点确定模块1306用于将所述情感分析结果中的主体词与预设的热点主题匹配,获得匹配的热点主题作为所述目标用户的评论热点;根据所述情感极性和所述情感词确定所述目标用户针对所述评论热点的观点倾向。
本实施例的分析装置用于实现前述多个方法实施例中相应的分析方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的分析装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例十四
参照图14,示出了根据本发明实施例十四的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图14所示,该电子设备可以包括:处理器(processor)1402、通信接口(Communications Interface)1404、存储器(memory)1406、以及通信总线1408。
其中:
处理器1402、通信接口1404、以及存储器1406通过通信总线1408完成相互间的通信。
通信接口1404,用于与其它电子设备如终端设备或服务器进行通信。
处理器1402,用于执行程序1410,具体可以执行上述文本分析方法实施例中的相关步骤。
具体地,程序1410可以包括程序代码,该程序代码包括计算机操作指令。
处理器1402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器1406,用于存放程序1410。存储器1406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序1410具体可以用于使得处理器1402执行以下操作:将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
在一种可选的实施方式中,程序1410还用于使得处理器1402在将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理时,将所述待分析文本输入所述文本分析模型中;通过所述文本分析模型获取待分析文本对应的主体情感数据对和情感词,其中,所述主体情感数据对用于表征所述待分析文本中的主体词和所述主体词对应的情感极性;通过所述文本分析模型对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合,其中,每个所述候选组合包括所述情感词、所述主体词、以及所述主体词对应的所述情感极性;通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合作为情感分析结果。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述通过文本分析模型获取待分析文本对应的主体情感数据对和情感词时,将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据;通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词;以及,将所述待分析文本的词向量作为第二输入数据;通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词时,通过所述文本分析模型的第一分支对所述第一输入数据中的主体词与情感词对应关系进行提取处理,以得到包括有所述待分析文本中的主体词与情感词对应关系指示信息的第一输出向量;对所述第一输出向量进行情感词分析处理,获取包括有所述待分析文本中的情感词指示信息的第二输出向量;根据所述第二输出向量,获取所述待分析文本对应的情感词。
在一种可选的实施方式中,程序1410还用于使得处理器1402在通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对时,通过所述文本分析模型的第二分支对所述第二输入数据进行第一主体边界提取处理,以获得包括有所述待分析文本中的主体词边界的边界指示信息的第三输出向量;对所述第三输出向量进行情感极性分析处理,以获得包括有所述待分析文本中各所述主体词对应的情感极性的情感极性指示信息的第四输出向量;对所述第二输出向量、第三输出向量、所述第四输出向量进行第二主体边界提取处理,获取所述待分析文本对应的所述主体情感数据对。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述对所述第二输出向量、所述第三输出向量、所述第四输出向量进行第二主体边界提取处理,获得所述待分析文本对应的所述主体情感数据对时,对所述第三输出向量进行第一归一化处理,获得第一归一化结果;对所述第一归一化结果进行向量平方和计算,获得中间变量,并根据第一预设权重,对所述中间变量进行相乘,获得计算权重;;对所述第四输出向量和所述第二输出向量进行合并操作,获得第五输出向量,并对所述第五输出向量进行第二归一化处理,获得第二归一化结果;根据所述第一归一化结果、所述第二归一化结果和所述计算权重,确定所述主体情感数据对。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合时,通过所述文本分析模型从所述至少一个候选组合中确定当前候选组合;根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离、以及所述待分析文本的词向量,生成第三输入数据;对所述第三输入数据进行语义分析处理,以获取语义分析输出数据;根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准;若满足,则将所述当前候选组合作为所述目标候选组合,并返回从所述至少一个候选组合中确定当前候选组合的步骤继续执行,直至完成对所有候选组合的相关度是否满足预设标准的确定。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离,生成第三输入数据时,根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的位置,确定所述主体词与所述情感词之间的空间距离;根据所述空间距离生成包含所述主体词和所述情感词的位置信息的位置向量;根据所述待分析文本的词向量和所述当前候选组合的位置向量,生成所述第三输入数据。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准时,从所述语义分析输出数据中抽取出与所述主体词对应的第一向量、与所述情感词对应的第二向量;对所述第一向量和所述第二向量进行拼接获得拼接结果以对所述拼接结果进行分类处理;根据分类处理的结果确定所述当前候选组合的相关度是否满足预设标准。
在另一实施例中,程序1410还用于使得处理器1402从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
在一种可选的实施方式中,所述文本分析模型包括用于对第一样本输入数据和第二样本输入数据进行处理的第一处理单元,所述第一处理单元包括第一分支和第二分支;程序1410还用于使得处理器1402在从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量时,通过所述第一分支对所述第一样本输入数据进行处理,获取包括有指示所述待分析文本中的主体词及情感词对应关系的第一样本输出向量;通过所述第二分支对所述第二样本输入向量进行处理,获取包括有用于指示所述待分析文本中的主体词边界的边界信息的第三样本输出向量。
在一种可选的实施方式中,程序1410还用于使得处理器1402在根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数时,将所述第一样本输出向量和所述第三样本输出向量进行拼接,获得拼接样本向量;对所述拼接样本向量进行第三归一化处理,获取第三归一化结果,并根据所述第三归一化结果计算所述主体辅助的情感词损失函数。
在一种可选的实施方式中,程序1410还用于使得处理器1402获取所述第一分支输出的包括有所述待分析文本中的情感词指示信息的第二样本输出向量,根据所述第二样本输出向量计算情感词损失函数;根据所述第三样本输出向量计算主体边界损失函数;获取所述第二分支输出的包含主体情感数据对信息的样本输出向量,根据包含主体情感数据对信息的样本输出向量计算数据对损失函数;程序1410还用于使得处理器1402在所述根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数时,根据所述主体辅助的情感词损失函数、所述情感词损失函数、所述数据对损失函数和主体边界损失函数,调整所述文本分析模型中的至少部分参数。
在另一实施例中,程序1410还用于使得处理器1402根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述根据所述情感分析结果,从预设的商品对象候选推荐信息中,确定与所述待推荐用户对应的推荐信息时,根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果时,使用文本分析模型对所述待分析文本进行情感分析处理,并获取初始情感分析结果;将所述初始情感分析结果发送至所述待推荐用户;获取基于所述待推荐用户对所述初始情感分析结果的修正操作生成的修正信息;根据所述修正信息生成与所述待分析文本对应的情感分析结果。
在一种可选的实施方式中,所述修正信息中包括指示将所述情感分析结果中的至少两个主体词合并的信息;程序1410还用于使得处理器1402在根据所述修正信息生成与所述待分析文本对应的情感分析结果时,根据所述修正信息,将所述情感分析结果中所述修正信息指示的主体词合并为一个主体词;根据合并的主体词,生成与所述待分析文本对应的情感分析结果。
在一种可选的实施方式中,所述候选主体包括下列至少之一:候选商品、候选店铺和候选景点。
在另一实施例中,程序1410还用于使得处理器1402获取待推荐用户的评论数据;调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
在一种可选的实施方式中,程序1410还用于使得处理器1402在所述根据所述情感分析结果,确定与所述用户对应的推荐信息时,将所述情感分析结果发送至服务端,并获取所述服务端返回的与所述用户对应的推荐信息;或者,程序1410还用于使得处理器1402在所述根据所述情感分析结果,确定与所述用户对应的推荐信息时,根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
在另一实施例中,程序1410还用于使得处理器1402在获取目标用户针对目标事件的评论数据;使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
在一种可选的实施方式中,程序1410还用于使得处理器1402在根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向时,将所述情感分析结果中的主体词与预设的热点主题匹配,获得匹配的热点主题作为所述目标用户的评论热点;根据所述情感极性和所述情感词确定所述目标用户针对所述评论热点的观点倾向。
程序1410中各步骤的具体实现可以参见上述方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的电子设备,使用文本分析模型对待分析文本进行情感分析处理,并获取文本分析模型输出的包含三元组合的情感分析结果,实现了一次性解决情感分析中的三个核心问题,提升情感分析处理效率的效果。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的文本分析方法。此外,当通用计算机访问用于实现在此示出的文本分析方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的文本分析方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。
Claims (32)
1.一种文本分析方法,其特征在于,包括:
将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;
获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
2.根据权利要求1所述的方法,其特征在于,将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理,包括:
将所述待分析文本输入所述文本分析模型中;
通过所述文本分析模型获取待分析文本对应的主体情感数据对和情感词,其中,所述主体情感数据对用于表征所述待分析文本中的主体词和所述主体词对应的情感极性;
通过所述文本分析模型对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合,其中,每个所述候选组合包括所述情感词、所述主体词、以及所述主体词对应的所述情感极性;
通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合作为情感分析结果。
3.根据权利要求2所述的方法,其特征在于,所述通过文本分析模型获取待分析文本对应的主体情感数据对和情感词,包括:
将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据;
通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词;以及,
将所述待分析文本的词向量作为第二输入数据;
通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对。
4.根据权利要求3所述的方法,其特征在于,所述通过所述文本分析模型的第一分支对所述第一输入数据进行情感词提取处理,以获取所述待分析文本对应的情感词,包括:
通过所述文本分析模型的第一分支对所述第一输入数据中的主体词与情感词对应关系进行提取处理,以得到包括有所述待分析文本中的主体词与情感词对应关系指示信息的第一输出向量;
对所述第一输出向量进行情感词分析处理,获取包括有所述待分析文本中的情感词指示信息的第二输出向量;
根据所述第二输出向量,获取所述待分析文本对应的情感词。
5.根据权利要求3所述的方法,其特征在于,通过所述文本分析模型的第二分支对所述第二输入数据进行主体情感数据对提取处理,以获取所述待分析文本对应的所述主体情感数据对,包括:
通过所述文本分析模型的第二分支对所述第二输入数据进行第一主体边界提取处理,以获得包括有所述待分析文本中的主体词边界的边界指示信息的第三输出向量;
对所述第三输出向量进行情感极性分析处理,以获得包括有所述待分析文本中各所述主体词对应的情感极性的情感极性指示信息的第四输出向量;
对所述第二输出向量、第三输出向量、所述第四输出向量进行第二主体边界提取处理,获取所述待分析文本对应的所述主体情感数据对。
6.根据权利要求5所述的方法,其特征在于,所述对所述第二输出向量、所述第三输出向量、所述第四输出向量进行第二主体边界提取处理,获得所述待分析文本对应的所述主体情感数据对,包括:
对所述第三输出向量进行第一归一化处理,获得第一归一化结果;
对所述第一归一化结果进行向量平方和计算,获得中间变量,并根据第一预设权重,对所述中间变量进行相乘,获得计算权重;
对所述第四输出向量和所述第二输出向量进行合并操作,获得第五输出向量,并对所述第五输出向量进行第二归一化处理,获得第二归一化结果;
根据所述第一归一化结果、所述第二归一化结果和所述计算权重,确定所述主体情感数据对。
7.根据权利要求3所述的方法,其特征在于,所述通过所述文本分析模型根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定出包括的所述主体词与所述情感词的相关度满足预设标准的目标候选组合,包括:
通过所述文本分析模型从所述至少一个候选组合中确定当前候选组合;
根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离、以及所述待分析文本的词向量,生成第三输入数据;
对所述第三输入数据进行语义分析处理,以获取语义分析输出数据;
根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准;
若满足,则将所述当前候选组合作为所述目标候选组合,并返回从所述至少一个候选组合中确定当前候选组合的步骤继续执行,直至完成对所有候选组合的相关度是否满足预设标准的确定。
8.根据权利要求7所述的方法,其特征在于,所述根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离,生成第三输入数据,包括:
根据所述当前候选组合中的所述主体词和所述情感词在所述待分析文本中的位置,确定所述主体词与所述情感词之间的空间距离;
根据所述空间距离生成包含所述主体词和所述情感词的位置信息的位置向量;
根据所述待分析文本的词向量和所述当前候选组合的位置向量,生成所述第三输入数据。
9.根据权利要求7所述的方法,其特征在于,所述根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准,包括:
从所述语义分析输出数据中抽取出与所述主体词对应的第一向量、与所述情感词对应的第二向量;
对所述第一向量和所述第二向量进行拼接获得拼接结果以对所述拼接结果进行分类处理;
根据分类处理的结果确定所述当前候选组合的相关度是否满足预设标准。
10.一种文本分析模型训练方法,其特征在于,包括:
从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;
根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;
根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
11.根据权利要求10所述的方法,其特征在于,所述文本分析模型包括用于对第一样本输入数据和第二样本输入数据进行处理的第一处理单元,所述第一处理单元包括第一分支和第二分支;
从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,包括:
通过所述第一分支对所述第一样本输入数据进行处理,获取包括有指示所述待分析文本中的主体词及情感词对应关系的第一样本输出向量;
通过所述第二分支对所述第二样本输入向量进行处理,获取包括有用于指示所述待分析文本中的主体词边界的边界信息的第三样本输出向量。
12.根据权利要求10或11所述的方法,其特征在于,根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数,包括:
将所述第一样本输出向量和所述第三样本输出向量进行拼接,获得拼接样本向量;
对所述拼接样本向量进行第三归一化处理,获取第三归一化结果,并根据所述第三归一化结果计算所述主体辅助的情感词损失函数。
13.根据权利要求11所述的方法,其特征在于,所述方法还包括:
获取所述第一分支输出的包括有所述待分析文本中的情感词指示信息的第二样本输出向量,根据所述第二样本输出向量计算情感词损失函数;
根据所述第三样本输出向量计算主体边界损失函数;
获取所述第二分支输出的包含主体情感数据对信息的样本输出向量,根据包含主体情感数据对信息的样本输出向量计算数据对损失函数;
所述根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数,包括:
根据所述主体辅助的情感词损失函数、所述情感词损失函数、所述数据对损失函数和主体边界损失函数,调整所述文本分析模型中的至少部分参数。
14.一种推荐方法,其特征在于,包括:
根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;
使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;
根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
15.根据权利要求14所述的方法,其特征在于,所述根据所述情感分析结果,从预设的商品对象候选推荐信息中,确定与所述待推荐用户对应的推荐信息,包括:
根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;
根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
16.根据权利要求14所述的方法,其特征在于,所述使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,包括:
使用文本分析模型对所述待分析文本进行情感分析处理,并获取初始情感分析结果;
将所述初始情感分析结果发送至所述待推荐用户;
获取基于所述待推荐用户对所述初始情感分析结果的修正操作生成的修正信息;
根据所述修正信息生成与所述待分析文本对应的情感分析结果。
17.根据权利要求16所述的方法,其特征在于,所述修正信息中包括指示将所述情感分析结果中的至少两个主体词合并的信息;
根据所述修正信息生成与所述待分析文本对应的情感分析结果,包括:
根据所述修正信息,将所述情感分析结果中所述修正信息指示的主体词合并为一个主体词;
根据合并的主体词,生成与所述待分析文本对应的情感分析结果。
18.根据权利要求15-17中任一项所述的方法,其特征在于,所述候选主体包括下列至少之一:候选商品、候选店铺和候选景点。
19.一种推荐方法,其特征在于,包括:
获取待推荐用户的评论数据;
调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;
根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
20.根据权利要求19所述的方法,其特征在于,
所述根据所述情感分析结果,确定与所述用户对应的推荐信息,包括:
将所述情感分析结果发送至服务端,并获取所述服务端返回的与所述用户对应的推荐信息;
或者,
所述根据所述情感分析结果,确定与所述用户对应的推荐信息,包括:
根据所述情感分析结果中的情感极性,确定情感极性为负向的主体词对应的至少一个候选主体;
根据所述候选主体对应的情感词,从包含所述候选主体的候选推荐信息中,确定与所述待推荐用户对应的推荐信息。
21.一种分析方法,其特征在于,包括:
获取目标用户针对目标事件的评论数据;
使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;
根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
22.根据权利要求21所述的方法,其特征在于,根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向,包括:
将所述情感分析结果中的主体词与预设的热点主题匹配,获得匹配的热点主题作为所述目标用户的评论热点;
根据所述情感极性和所述情感词确定所述目标用户针对所述评论热点的观点倾向。
23.一种文本分析装置,其特征在于,包括第一处理单元、配对层和第二处理单元;
所述第一处理单元用于获取待分析文本对应的主体情感数据对和情感词;
所述配对层用于对所述主体情感数据对和所述情感词进行配对,获得至少一个候选组合;
所述第二处理单元用于根据各个所述候选组合中的所述主体词与所述情感词之间的空间距离,以及所述待分析文本的语义信息,从所述至少一个候选组合中确定并输出主体词与情感词的相关度满足预设标准的目标候选组合。
24.根据权利要求22所述的文本分析装置,其特征在于,所述第一处理单元包括:输入层和第一隐含层,所述第一隐含层包括第一分支和第二分支;
所述输入层用于获取待分析文本,并将所述待分析文本的词向量和所述待分析文本的句法依赖关系图作为第一输入数据,输入所述第一分支,将所述待分析文本的词向量作为第二输入数据,输入到用于主体情感数据对提取的第二分支;
所述第一分支用于对所述第一输入数据至少进行主体词与情感词对应关系提取处理和情感词分析处理,并至少输出包括有用于指示所述待分析文本中的情感词的第二信息的第二输出向量和情感词;
所述第二分支用于对所述第二输入数据至少进行第一主体边界提取处理、情感极性分析处理和第二主体边界提取处理,并至少输出主体情感数据对。
25.根据权利要求22或23所述的文本分析装置,其特征在于,所述第二处理单元包括第二隐含层和输出层;
所述第二隐含层用于根据当前候选组合中的所述主体词和所述情感词在所述待分析文本中的空间距离和所述待分析文本的词向量,生成第三输入数据,并对所述第三输入数据进行语义分析处理,输出语言分析输出数据;
所述输出层用于根据所述语义分析输出数据确定所述当前候选组合的相关度是否满足预设标准,并根据确定结果从所述至少一个候选组合中确定并输出主体词与情感词的相关度满足预设标准的组合。
26.一种文本分析装置,包括:
分析模块,用于将待分析文本输入文本分析模型中,并通过所述文本分析模型对所述待分析文本进行情感分析处理;
获取模块,用于获取所述文本分析模型输出的情感分析结果,其中,所述情感分析结果包括至少一个三元组合,所述三元组合包括所述待分析文本中的主体词、与所述主体词对应的情感极性、以及情感词。
27.一种文本分析模型训练装置,其特征在于,包括:
处理模块,用于从文本分析模型分别对输入的第一样本输入数据和第二样本输入数据进行处理的处理结果中,获得第一样本输出向量和第三样本输出向量,其中,所述第一样本输入数据包括文本样本的词向量和句法依赖关系图,所述第二样本输入数据包括所述文本样本的词向量;
主体辅助损失函数确定模块,用于根据所述第一样本输出向量和所述第三样本输出向量,确定主体辅助的情感词损失函数;
调整模块,用于根据所述主体辅助的情感词损失函数调整所述文本分析模型中的至少部分参数。
28.一种推荐装置,其特征在于,包括:
第一用户信息获取模块,用于根据客户端发送的待推荐用户的用户信息,获取所述待推荐用户的历史评论数据作为待分析文本;
第一分析模块,用于使用文本分析模型对所述待分析文本进行情感分析处理,获取与所述待分析文本对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;
第一推荐模块,用于根据所述情感分析结果,从预设的候选推荐信息中,确定与所述待推荐用户对应的推荐信息,将所述推荐信息反馈给所述客户端。
29.一种推荐装置,其特征在于,包括:
第三用户信息获取模块,用于获取待推荐用户的评论数据;
调用模块,用于调用客户端本地存储的文本分析模型对所述评论数据进行情感分析处理,并获取与所述评论数据对应的情感分析结果,其中,所述情感分析结果中包括所述历史评论数据中的主体词、情感极性和情感词;
第三推荐模块,用于根据所述情感分析结果,确定与所述待推荐用户对应的推荐信息。
30.一种分析装置,其特征在于,包括:
第四用户信息获取模块,用于获取目标用户针对目标事件的评论数据;
第三分析模块,用于使用文本分析模型对所述评论数据进行情感分析处理,并获取对应的情感分析结果,其中,所述情感分析结果中包括所述评论数据中的主体词、情感极性和情感词;
观点确定模块,用于根据所述情感分析结果中的主体词确定所述目标用户针对所述目标事件的评论热点,并根据所述情感极性和所述情感词确定所述目标用户的观点倾向。
31.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-9中任一项所述的文本分析方法对应的操作,或者,执行如权利要求10-13中任一项所述的文本分析模型训练方法对应的操作,或者执行如权利要求14-18中任一项所述的推荐方法对应的操作,或者,执行如权利要求19或20所述的推荐方法对应的操作,或者,执行如权利要求21或22所述的评论分析方法对应的操作。
32.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-9中任一项所述的文本分析方法,或者,如权利要求10-13中任一项所述的文本分析模型训练方法,或者执行如权利要求14-18中任一项所述的推荐方法,或者,执行如权利要求19或20所述的推荐方法,或者,执行如权利要求21或22所述的评论分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911068390.5A CN112836515B (zh) | 2019-11-05 | 2019-11-05 | 文本分析方法、推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911068390.5A CN112836515B (zh) | 2019-11-05 | 2019-11-05 | 文本分析方法、推荐方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112836515A true CN112836515A (zh) | 2021-05-25 |
CN112836515B CN112836515B (zh) | 2024-07-02 |
Family
ID=75921352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911068390.5A Active CN112836515B (zh) | 2019-11-05 | 2019-11-05 | 文本分析方法、推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836515B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113408269A (zh) * | 2021-07-20 | 2021-09-17 | 北京百度网讯科技有限公司 | 文本情感分析方法和装置 |
CN113420566A (zh) * | 2021-07-16 | 2021-09-21 | 山东浪潮科学研究院有限公司 | 一种长文语义合理性判断方法、设备及介质 |
CN113486657A (zh) * | 2021-07-26 | 2021-10-08 | 刘德喜 | 一种基于知识辅助的情感-原因对抽取系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150302304A1 (en) * | 2014-04-17 | 2015-10-22 | XOcur, Inc. | Cloud computing scoring systems and methods |
RU2635257C1 (ru) * | 2016-07-28 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Продакшн" | Сентиментный анализ на уровне аспектов и создание отчетов с использованием методов машинного обучения |
CN107862087A (zh) * | 2017-12-01 | 2018-03-30 | 广州简亦迅信息科技有限公司 | 基于大数据和深度学习的情感分析方法、装置和存储介质 |
CN108319588A (zh) * | 2018-02-13 | 2018-07-24 | 北京易真学思教育科技有限公司 | 文本情感分析系统及方法、存储介质 |
CN109171773A (zh) * | 2018-09-30 | 2019-01-11 | 合肥工业大学 | 基于多通道数据的情感分析方法和系统 |
-
2019
- 2019-11-05 CN CN201911068390.5A patent/CN112836515B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150302304A1 (en) * | 2014-04-17 | 2015-10-22 | XOcur, Inc. | Cloud computing scoring systems and methods |
RU2635257C1 (ru) * | 2016-07-28 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Продакшн" | Сентиментный анализ на уровне аспектов и создание отчетов с использованием методов машинного обучения |
CN107862087A (zh) * | 2017-12-01 | 2018-03-30 | 广州简亦迅信息科技有限公司 | 基于大数据和深度学习的情感分析方法、装置和存储介质 |
CN108319588A (zh) * | 2018-02-13 | 2018-07-24 | 北京易真学思教育科技有限公司 | 文本情感分析系统及方法、存储介质 |
CN109171773A (zh) * | 2018-09-30 | 2019-01-11 | 合肥工业大学 | 基于多通道数据的情感分析方法和系统 |
Non-Patent Citations (2)
Title |
---|
PENG HAIYUN: "A Review of Sentiment Analysis Research in Chinese Language", 《COGNITIVE COMPUTATION》, 8 May 2017 (2017-05-08) * |
肖璐;陈果;刘继云;: "基于情感分析的企业产品级竞争对手识别研究――以用户评论为数据源", 图书情报工作, no. 01, 5 January 2016 (2016-01-05) * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113420566A (zh) * | 2021-07-16 | 2021-09-21 | 山东浪潮科学研究院有限公司 | 一种长文语义合理性判断方法、设备及介质 |
CN113420566B (zh) * | 2021-07-16 | 2022-11-08 | 山东浪潮科学研究院有限公司 | 一种长文语义合理性判断方法、设备及介质 |
CN113408269A (zh) * | 2021-07-20 | 2021-09-17 | 北京百度网讯科技有限公司 | 文本情感分析方法和装置 |
CN113486657A (zh) * | 2021-07-26 | 2021-10-08 | 刘德喜 | 一种基于知识辅助的情感-原因对抽取系统 |
CN113486657B (zh) * | 2021-07-26 | 2023-01-17 | 刘德喜 | 一种基于知识辅助的情感-原因对抽取系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112836515B (zh) | 2024-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN116194912A (zh) | 使用图扩散变换器进行方面级情感分类的方法和系统 | |
CN110717325B (zh) | 文本的情感分析方法、装置、电子设备及存储介质 | |
US20200042597A1 (en) | Generating question-answer pairs for automated chatting | |
US11868738B2 (en) | Method and apparatus for generating natural language description information | |
CN112182166A (zh) | 一种文本匹配方法、装置、电子设备及存储介质 | |
CN108228576B (zh) | 文本翻译方法及装置 | |
CN112000819A (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN112836515A (zh) | 文本分析方法、推荐方法、装置、电子设备及存储介质 | |
CN111581966A (zh) | 一种融合上下文特征方面级情感分类方法和装置 | |
CN113469298B (zh) | 模型训练方法及资源推荐方法 | |
CN107291845A (zh) | 一种基于预告片的电影推荐方法及系统 | |
WO2018068648A1 (zh) | 一种信息匹配方法及相关装置 | |
CN111625715B (zh) | 信息提取方法、装置、电子设备及存储介质 | |
CN116226785A (zh) | 目标对象识别方法、多模态识别模型的训练方法和装置 | |
CN112201249A (zh) | 一种语音处理方法、装置、电子设备及存储介质 | |
CN113704509B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
CN116541517A (zh) | 文本信息处理方法、装置、设备、软件程序以及存储介质 | |
CN112364236A (zh) | 目标对象推荐系统、方法、装置、数据处理方法及装置 | |
CN112989177B (zh) | 信息处理方法、装置、电子设备及计算机存储介质 | |
CN112765330A (zh) | 文本数据处理方法、装置、电子设备和存储介质 | |
CN115376668B (zh) | 一种应用于智慧医疗的大数据业务分析方法及系统 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN110851629A (zh) | 一种图像检索的方法 | |
CN116431912A (zh) | 用户画像推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |