CN113705692A - 基于人工智能的情感分类方法、装置、电子设备及介质 - Google Patents
基于人工智能的情感分类方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113705692A CN113705692A CN202111008241.7A CN202111008241A CN113705692A CN 113705692 A CN113705692 A CN 113705692A CN 202111008241 A CN202111008241 A CN 202111008241A CN 113705692 A CN113705692 A CN 113705692A
- Authority
- CN
- China
- Prior art keywords
- entity
- text
- target
- character
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 124
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 40
- 239000013598 vector Substances 0.000 claims abstract description 132
- 238000012545 processing Methods 0.000 claims abstract description 87
- 238000000605 extraction Methods 0.000 claims abstract description 22
- 238000013145 classification model Methods 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 239000003550 marker Substances 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及人工智能领域,揭露一种基于人工智能的情感分类方法,包括:对待处理文本执行实体识别处理,得到目标实体集;对待处理文本执行拼接及标记处理,得到每个实体对应的字符序列,将字符序列输入情感分类模型的特征提取网络,得到每个字符对应的第一特征向量;对待处理文本执行句法关系分析处理,基于句法关系类别计算每个实体对应的第二特征向量;基于第一特征向量及第二特征向量计算每个实体对应的第三特征向量,将第三特征向量输入情感分类模型的分类网络,得到每个实体对应的情感类别。本发明还提供一种基于人工智能的情感分类装置、电子设备及介质。本发明提高了情感分类准确度。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于人工智能的情感分类方法、装置、电子设备及介质。
背景技术
随着科技的发展,情感分类在人们生活中的应用越来越广泛,例如,对美食、电影或景点的评论信息进行情感分类,以根据情感分类结果针对性地改进服务质量,然而,通常情况下,一个评论信息中可能既有正面情绪,又有负面情绪,例如,这家店的环境挺好,就是菜量有点少。采用通用情感分类方法对其进行情感分类时,通常情况下得到的情感类别是中性的,而无法对多种情感分别分类。
为了对含有多种情感的文本进行情感分类,当前可以基于图结构进行情感分类,通过句法分析,构建中心词与句子中其它词之间的节点图进行情感分类,然而这种方式只关注了词语之间是否有句法关系,而没有考虑句法关系类别对情感分类的影响,从而情感分类准确度不高。因此,亟需一种基于人工智能的情感分类方法,以提高情感分类准确度。
发明内容
鉴于以上内容,有必要提供一种基于人工智能的情感分类方法,旨在提高情感分类准确度。
本发明提供的基于人工智能的情感分类方法,包括:
解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集;
对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量;
对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量;
基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
可选的,所述对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集,包括:
对所述待处理文本中的每个字符执行向量转换处理,得到所述待处理文本中每个字符的字向量;
将所述字向量输入实体识别模型执行实体识别处理,得到所述待处理文本对应的初始实体集;
对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集。
可选的,所述对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集,包括:
确定所述待处理文本对应的领域类别,获取所述领域类别对应的指标项集合;
对所述初始实体集与所述指标项集合执行匹配处理,将所述初始实体集中匹配成功的实体的集合作为所述待处理文本对应的目标实体集。
可选的,所述基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量,包括:
从所述目标实体集中选择一个实体,将选择的实体对应的关联词集合作为目标关联词集合,基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量;
确定所述目标关联词集合中每个字符对应的目标权重;
基于所述第四特征向量及所述目标权重计算所述选择的实体对应的第二特征向量。
可选的,所述基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量,包括:
从所述目标关联词集合中选择一个词语的一个字符,拼接选择的字符和所述选择的实体与所述选择的词语之间的句法关系类别,得到所述选择的字符对应的拼接词;
对所述拼接词执行向量转换处理,得到所述选择的字符对应的第四特征向量。
可选的,所述确定所述目标关联词集合中每个字符对应的目标权重,包括:
基于所述选择的实体中每个字符的第一特征向量计算所述选择的实体对应的初始权重;
基于所述初始权重及所述目标关联词集合中每个字符的字向量计算所述目标关联词集合中每个字符对应的目标权重。
可选的,所述对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,包括:
从所述目标实体集中选择一个实体,拼接选择的实体与所述待处理文本,得到所述选择的实体对应的拼接后的文本;
采用标记符对所述拼接后的文本执行标记处理,得到所述选择的实体对应的标记后的文本;
对所述标记后的文本执行字符拆分处理,得到所述选择的实体对应的字符序列。
为了解决上述问题,本发明还提供一种基于人工智能的情感分类装置,所述装置包括:
识别模块,用于解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集;
提取模块,用于对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量;
计算模块,用于对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量;
分类模块,用于基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的情感分类程序,所述情感分类程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述基于人工智能的情感分类方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有情感分类程序,所述情感分类程序可被一个或者多个处理器执行,以实现上述基于人工智能的情感分类方法。
相较现有技术,本发明首先对待处理文本执行拼接及标记处理,得到目标实体集中每个实体对应的字符序列,将字符序列输入情感分类模型的特征提取网络,得到每个字符对应的第一特征向量;然后,对待处理文本执行句法关系分析处理,基于句法关系类别计算目标实体集中每个实体对应的第二特征向量;最后,基于第一特征向量及第二特征向量计算目标实体集中每个实体对应的第三特征向量,将第三特征向量输入情感分类模型的分类网络,得到目标实体集中每个实体对应的情感类别。本发明通过代表语义特征的第一特征向量和代表句法关系类别特征的第二特征向量,计算得到第三特征向量,从而第三特征向量更加丰富,分类准确度更高。因此,本发明提高了情感分类准确度。
附图说明
图1为本发明一实施例提供的基于人工智能的情感分类方法的流程示意图;
图2为本发明一实施例提供的基于人工智能的情感分类装置的模块示意图;
图3为本发明一实施例提供的实现基于人工智能的情感分类方法的电子设备的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种基于人工智能的情感分类方法。参照图1所示,为本发明一实施例提供的基于人工智能的情感分类方法的流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。
本实施例中,基于人工智能的情感分类方法包括:
S1、解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集。
本实施例中,所述待处理文本可以是用户对美食、电影、物品或景点的评论信息,其可以是一句话,也可以是多句话。
获取到待处理文本后,需要对待处理文本执行实体识别处理,得到待处理文本对应的目标实体集,目标实体集中的实体为情感分类的对象,即识别用户对实体集中每个实体的情感类别。
所述对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集,包括:
A11、对所述待处理文本中的每个字符执行向量转换处理,得到所述待处理文本中每个字符的字向量;
本实施例中,可以将待处理文本中的每个字符输入BERT模型的嵌入层进行向量转换处理,得到每个字符的字向量。
A12、将所述字向量输入实体识别模型执行实体识别处理,得到所述待处理文本对应的初始实体集;
本实施例中,所述实体识别模型为CRF(conditional random field,条件随机场)模型,CRF模型结合了最大熵模型和隐马尔可夫模型的特点,输出实体的最大链路,考虑到了前后文信息,使得实体识别结果更加准确。
A13、对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集。
本实施例中,并非对待处理文本中的所有实体进行情感分类,而是仅对其中的预设指标项进行情感分类,因此,需要对初始实体集执行实体过滤处理,剔除与指标项无关的实体,得到目标实体集,下述步骤B11-B12描述了实体过滤处理的具体过程。
所述对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集,包括:
B11、确定所述待处理文本对应的领域类别,获取所述领域类别对应的指标项集合;
本实施例中,可通过待处理文本对应的主体确定领域类别,例如,若待处理文本是用户对某餐厅的评论信息,主体为餐厅,则待处理文本对应的领域类别为餐饮领域。
本实施例预先为每个领域类别配置了对应的指标项集合,例如,对于餐饮领域,其指标项集合可以包括环境、卫生、交通、上餐速度、菜量、菜品等指标项。
B12、对所述初始实体集与所述指标项集合执行匹配处理,将所述初始实体集中匹配成功的实体的集合作为所述待处理文本对应的目标实体集。
例如,若待处理文本为“这家餐厅环境不错,菜量太少”,对其执行实体识别处理后,得到的初始实体集为{餐厅,环境,菜量},将初始实体集与餐饮类别对应的指标项集合进行匹配处理,匹配成功的实体包括环境和菜量,则目标实体集为{环境,菜量},本方案需要基于待处理文本分析用户对环境和菜量两个指标的情感类别。
S2、对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量。
本实施例中,需要分别将待处理文本与目标实体集中每个实体进行拼接,并添加标记符,得到目标实体集中每个实体对应的字符序列,后续基于字符序列确定每个实体对应的情感类别。
本实施例中,所述情感分类模型可以是BERT模型,其包括特征提取网络及分类网络,特征提取网络包括嵌入层及串联连接的多个编码层(Transformer Encoder层),其中,嵌入层用于将输入的字符转换为字向量,编码层用于提取字向量的特征;分类网络包括全连接层及激活层,其中,全连接层用于整合输入的特征,激活层用于分类预测。
第一特征向量为特征提取网络的最后一个编码层的输出。
所述对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,包括:
C11、从所述目标实体集中选择一个实体,拼接选择的实体与所述待处理文本,得到所述选择的实体对应的拼接后的文本;
例如,若选择的实体是环境,则“环境”对应的拼接后的文本为“这家餐厅环境不错,菜量太少环境”。
C12、采用标记符对所述拼接后的文本执行标记处理,得到所述选择的实体对应的标记后的文本;
本实施例中,所述标记符包括句首符及句尾符,其中,句首符可以用[CLS]表示,句尾符可以用[SEP]表示,在对拼接后的文本执行标记处理时,需要在待处理文本的句首和句尾分别添加句首符和句尾符,并在选择的实体后添加句尾符,即选择的实体的前后各有一个句尾符。
C13、对所述标记后的文本执行字符拆分处理,得到所述选择的实体对应的字符序列。
字符拆分处理是指将标记后的文本拆分为单个字符组成的序列,例如,“环境”对应的字符序列为“[CLS]这家餐厅环境不错,菜量太少[SEP]环境[SEP]”。
S3、对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量。
本实施例中,可通过LTP模型对待处理文本执行句法关系分析处理,对待处理文本执行句法关系分析处理是:分析目标实体集中的实体与待处理文本中各个词语之间的句法关系类别,所述句法关系类别包括主谓关系、动宾关系、并列关系等,并从待处理文本中抽取与实体有句法关系的词语,得到实体对应的关联词集合。
例如,对于实体“环境”,待处理文本“这家餐厅环境不错,菜量太少”中与“环境”有句法关系的词语包括“这家”、“餐厅”、“不错”,则“环境”对应的关联词集合为{这家,餐厅,不错}。
得到目标实体集中每个实体对应的关联词集合后,可根据关联词集合中的词语与实体之间的句法关系类别确定每个实体对应的第二特征向量。
所述基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量,包括:
D11、从所述目标实体集中选择一个实体,将选择的实体对应的关联词集合作为目标关联词集合,基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量;
例如,若选择的实体为“环境”,则目标关联词集合为{这家,餐厅,不错},句法关系分析结果中,“这家”是“环境”的相对从句修饰语,用compound表示;“餐厅”也是“环境”的相对从句修饰语;“不错”是“环境”的状语从句修饰语,用nsubj表示。
将目标关联词集合中每个词语的各个字符与其和选择的实体之间的句法关系类别融合起来,得到每个字符对应的第四特征向量,下述步骤E11-E12具体描述了第四特征向量的确定过程。
D12、确定所述目标关联词集合中每个字符对应的目标权重;
本实施例中,基于选择的实体对应的初始权重计算目标关联词集合中每个字符对应的目标权重,下述步骤F11-F12具体描述了目标权重的确定过程。
D13、基于所述第四特征向量及所述目标权重计算所述选择的实体对应的第二特征向量。
所述第二特征向量的计算公式为:y=a1*x1+a2*x2+…+an*xn,其中,y表示选择的实体对应的第二特征向量,x1、x2、xn分别表示目标关联词集合中第一个、第二个及第n个字符对应的第四特征向量,a1、a2、an分别表示目标关联词集合中第一个、第二个及第n个字符对应的目标权重。
所述基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量,包括:
E11、从所述目标关联词集合中选择一个词语的一个字符,拼接选择的字符和所述选择的实体与所述选择的词语之间的句法关系类别,得到所述选择的字符对应的拼接词;
例如,若选择的字符为“这”,则“这”对应的拼接词是“这_compound”,同样的,“家”、“餐”、“厅”、“不”、“错”对应的拼接词分别为“家_compound”、“餐_compound”、“厅_compound”、“不_nsubj”及“错_nsubj”。
E12、对所述拼接词执行向量转换处理,得到所述选择的字符对应的第四特征向量。
对拼接词执行向量转换处理后,得到目标关联词集合中每个字符对应的第四特征向量。
所述确定所述目标关联词集合中每个字符对应的目标权重,包括:
F11、基于所述选择的实体中每个字符的第一特征向量计算所述选择的实体对应的初始权重;
本实施例中,对选择的实体中每个字符对应的第一特征向量取平均值,得到选择的实体对应的初始权重。例如,对于实体“环境”,将“环”的第一特征向量与“境”的第一特征向量的平均值作为“环境”的初始权重。
F12、基于所述初始权重及所述目标关联词集合中每个字符的字向量计算所述目标关联词集合中每个字符对应的目标权重。
所述目标权重的计算公式为:
其中,pi为目标关联词集合中第i个字符对应的目标权重,h为选择的实体对应的初始权重,Tj为目标关联词集合中第i个字符的字向量,Tj为目标关联词集合中第j个字符的字向量,n为目标关联词集合中字符的总数量。
S4、基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
本实施例中,将从目标实体集中选择的实体的第二特征向量与选择的实体对应的字符序列中预设字符的第一特征向量合并,得到选择的实体对应的第三特征向量。
所述预设字符为句首符[CLS],[CLS]聚合了整个字符序列的特征。
例如,若选择的实体为“环境”,“环境”对应的字符序列中句首符对应的第一特征向量为v,实体“环境”对应的第二特征向量为u,则“环境”对应的第三特征向量r=v+u。
将目标实体集中每个实体对应的第三特征向量输入情感分类模型的分类网络,得到每个实体对应的情感类别。例如,对于待处理文本“这家餐厅环境不错,菜量太少”,模型输出“环境”对应的情感类别为正面情绪,“菜量”对应的情感类别为负面情绪。
由上述实施例可知,本发明提出的基于人工智能的情感分类方法,首先,对待处理文本执行拼接及标记处理,得到目标实体集中每个实体对应的字符序列,将字符序列输入情感分类模型的特征提取网络,得到每个字符对应的第一特征向量;然后,对待处理文本执行句法关系分析处理,基于句法关系类别计算目标实体集中每个实体对应的第二特征向量;最后,基于第一特征向量及第二特征向量计算目标实体集中每个实体对应的第三特征向量,将第三特征向量输入情感分类模型的分类网络,得到目标实体集中每个实体对应的情感类别。本发明通过代表语义特征的第一特征向量和代表句法关系类别特征的第二特征向量,计算得到第三特征向量,从而第三特征向量更加丰富,分类准确度更高。因此,本发明提高了情感分类准确度。
如图2所示,为本发明一实施例提供的基于人工智能的情感分类装置的模块示意图。
本发明所述基于人工智能的情感分类装置100可以安装于电子设备中。根据实现的功能,所述基于人工智能的情感分类装置100可以包括识别模块110、提取模块120、计算模块130及分类模块140。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
识别模块110,用于解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集。
所述对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集,包括:
A21、对所述待处理文本中的每个字符执行向量转换处理,得到所述待处理文本中每个字符的字向量;
A22、将所述字向量输入实体识别模型执行实体识别处理,得到所述待处理文本对应的初始实体集;
A23、对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集。
所述对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集,包括:
B21、确定所述待处理文本对应的领域类别,获取所述领域类别对应的指标项集合;
B22、对所述初始实体集与所述指标项集合执行匹配处理,将所述初始实体集中匹配成功的实体的集合作为所述待处理文本对应的目标实体集。
提取模块120,用于对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量。
所述对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,包括:
C21、从所述目标实体集中选择一个实体,拼接选择的实体与所述待处理文本,得到所述选择的实体对应的拼接后的文本;
C22、采用标记符对所述拼接后的文本执行标记处理,得到所述选择的实体对应的标记后的文本;
C23、对所述标记后的文本执行字符拆分处理,得到所述选择的实体对应的字符序列。
计算模块130,用于对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量。
所述基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量,包括:
D21、从所述目标实体集中选择一个实体,将选择的实体对应的关联词集合作为目标关联词集合,基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量;
D22、确定所述目标关联词集合中每个字符对应的目标权重;
D23、基于所述第四特征向量及所述目标权重计算所述选择的实体对应的第二特征向量。
所述基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量,包括:
E21、从所述目标关联词集合中选择一个词语的一个字符,拼接选择的字符和所述选择的实体与所述选择的词语之间的句法关系类别,得到所述选择的字符对应的拼接词;
E22、对所述拼接词执行向量转换处理,得到所述选择的字符对应的第四特征向量。
所述确定所述目标关联词集合中每个字符对应的目标权重,包括:
F21、基于所述选择的实体中每个字符的第一特征向量计算所述选择的实体对应的初始权重;
F22、基于所述初始权重及所述目标关联词集合中每个字符的字向量计算所述目标关联词集合中每个字符对应的目标权重。
分类模块140,用于基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
如图3所示,为本发明一实施例提供的实现基于人工智能的情感分类方法的电子设备的结构示意图。
所述电子设备1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在本实施例中,电子设备1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有情感分类程序10,所述情感分类程序10可被所述处理器12执行。图3仅示出了具有组件11-13以及情感分类程序10的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子设备1的内部存储单元,例如该电子设备1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件,例如存储本发明一实施例中的情感分类程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行情感分类程序10等。
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。
可选的,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的情感分类程序10是多个指令的组合,在所述处理器12中运行时,可以实现上述基于人工智能的情感分类方法。
具体地,所述处理器12对上述情感分类程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是非易失性的,也可以是非易失性的。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
所述计算机可读存储介质上存储有情感分类程序10,所述情感分类程序10可被一个或者多个处理器执行,以实现上述基于人工智能的情感分类方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的情感分类方法,其特征在于,所述方法包括:
解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集;
对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量;
对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量;
基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
2.如权利要求1所述的基于人工智能的情感分类方法,其特征在于,所述对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集,包括:
对所述待处理文本中的每个字符执行向量转换处理,得到所述待处理文本中每个字符的字向量;
将所述字向量输入实体识别模型执行实体识别处理,得到所述待处理文本对应的初始实体集;
对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集。
3.如权利要求2所述的基于人工智能的情感分类方法,其特征在于,所述对所述初始实体集执行实体过滤处理,得到所述待处理文本对应的目标实体集,包括:
确定所述待处理文本对应的领域类别,获取所述领域类别对应的指标项集合;
对所述初始实体集与所述指标项集合执行匹配处理,将所述初始实体集中匹配成功的实体的集合作为所述待处理文本对应的目标实体集。
4.如权利要求1所述的基于人工智能的情感分类方法,其特征在于,所述基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量,包括:
从所述目标实体集中选择一个实体,将选择的实体对应的关联词集合作为目标关联词集合,基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量;
确定所述目标关联词集合中每个字符对应的目标权重;
基于所述第四特征向量及所述目标权重计算所述选择的实体对应的第二特征向量。
5.如权利要求4所述的基于人工智能的情感分类方法,其特征在于,所述基于所述目标关联词集合中每个词语与所述选择的实体之间的句法关系类别确定所述目标关联词集合中每个字符对应的第四特征向量,包括:
从所述目标关联词集合中选择一个词语的一个字符,拼接选择的字符和所述选择的实体与所述选择的词语之间的句法关系类别,得到所述选择的字符对应的拼接词;
对所述拼接词执行向量转换处理,得到所述选择的字符对应的第四特征向量。
6.如权利要求4所述的基于人工智能的情感分类方法,其特征在于,所述确定所述目标关联词集合中每个字符对应的目标权重,包括:
基于所述选择的实体中每个字符的第一特征向量计算所述选择的实体对应的初始权重;
基于所述初始权重及所述目标关联词集合中每个字符的字向量计算所述目标关联词集合中每个字符对应的目标权重。
7.如权利要求1所述的基于人工智能的情感分类方法,其特征在于,所述对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,包括:
从所述目标实体集中选择一个实体,拼接选择的实体与所述待处理文本,得到所述选择的实体对应的拼接后的文本;
采用标记符对所述拼接后的文本执行标记处理,得到所述选择的实体对应的标记后的文本;
对所述标记后的文本执行字符拆分处理,得到所述选择的实体对应的字符序列。
8.一种基于人工智能的情感分类装置,其特征在于,所述装置包括:
识别模块,用于解析用户基于客户端发出的情感分类请求,获取所述情感分类请求携带的待处理文本,对所述待处理文本执行实体识别处理,得到所述待处理文本对应的目标实体集;
提取模块,用于对所述待处理文本执行拼接及标记处理,得到所述目标实体集中每个实体对应的字符序列,将所述字符序列输入情感分类模型的特征提取网络执行特征提取处理,得到所述字符序列中每个字符对应的第一特征向量;
计算模块,用于对所述待处理文本执行句法关系分析处理,得到所述目标实体集中每个实体对应的关联词集合,基于所述关联词集合中的词语与实体之间的句法关系类别计算所述目标实体集中每个实体对应的第二特征向量;
分类模块,用于基于所述第一特征向量及所述第二特征向量计算所述目标实体集中每个实体对应的第三特征向量,将所述第三特征向量输入所述情感分类模型的分类网络执行情感分类处理,得到所述目标实体集中每个实体对应的情感类别。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的情感分类程序,所述情感分类程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于人工智能的情感分类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有情感分类程序,所述情感分类程序可被一个或者多个处理器执行,以实现如权利要求1至7任一项所述的基于人工智能的情感分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111008241.7A CN113705692B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的情感分类方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111008241.7A CN113705692B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的情感分类方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113705692A true CN113705692A (zh) | 2021-11-26 |
CN113705692B CN113705692B (zh) | 2023-11-21 |
Family
ID=78657323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111008241.7A Active CN113705692B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的情感分类方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705692B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266255A (zh) * | 2022-03-01 | 2022-04-01 | 深圳壹账通科技服务有限公司 | 基于聚类模型的语料分类方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
US20180329886A1 (en) * | 2017-05-15 | 2018-11-15 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Artificial intelligence based method and apparatus for generating information |
US20190050875A1 (en) * | 2017-06-22 | 2019-02-14 | NewVoiceMedia Ltd. | Customer interaction and experience system using emotional-semantic computing |
CN109726391A (zh) * | 2018-12-11 | 2019-05-07 | 中科恒运股份有限公司 | 对文本进行情感分类的方法、装置及终端 |
CN110427610A (zh) * | 2019-06-25 | 2019-11-08 | 平安科技(深圳)有限公司 | 文本分析方法、装置、计算机装置及计算机存储介质 |
CN112307200A (zh) * | 2019-07-25 | 2021-02-02 | 顺丰科技有限公司 | 情感属性获取方法、装置、设备、及存储介质 |
CN112686023A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 文本数据处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-08-30 CN CN202111008241.7A patent/CN113705692B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
US20180329886A1 (en) * | 2017-05-15 | 2018-11-15 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Artificial intelligence based method and apparatus for generating information |
US20190050875A1 (en) * | 2017-06-22 | 2019-02-14 | NewVoiceMedia Ltd. | Customer interaction and experience system using emotional-semantic computing |
CN109726391A (zh) * | 2018-12-11 | 2019-05-07 | 中科恒运股份有限公司 | 对文本进行情感分类的方法、装置及终端 |
CN110427610A (zh) * | 2019-06-25 | 2019-11-08 | 平安科技(深圳)有限公司 | 文本分析方法、装置、计算机装置及计算机存储介质 |
CN112307200A (zh) * | 2019-07-25 | 2021-02-02 | 顺丰科技有限公司 | 情感属性获取方法、装置、设备、及存储介质 |
CN112686023A (zh) * | 2020-12-29 | 2021-04-20 | 平安普惠企业管理有限公司 | 文本数据处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
杨奎河;刘智鹏;: "基于BERT-BiLSTM的短文本情感分析", 信息通信, no. 06 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266255A (zh) * | 2022-03-01 | 2022-04-01 | 深圳壹账通科技服务有限公司 | 基于聚类模型的语料分类方法、装置、设备及存储介质 |
CN114266255B (zh) * | 2022-03-01 | 2022-05-17 | 深圳壹账通科技服务有限公司 | 基于聚类模型的语料分类方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113705692B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
WO2022105115A1 (zh) | 问答对匹配方法、装置、电子设备及存储介质 | |
CN113312461A (zh) | 基于自然语言处理的智能问答方法、装置、设备及介质 | |
CN112860848B (zh) | 信息检索方法、装置、设备及介质 | |
CN111666415A (zh) | 话题聚类方法、装置、电子设备及存储介质 | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
CN112597135A (zh) | 用户分类方法、装置、电子设备及可读存储介质 | |
CN113378970A (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
CN114706985A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN114416939A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN113706253A (zh) | 实时产品推荐方法、装置、电子设备及可读存储介质 | |
CN113705692B (zh) | 基于人工智能的情感分类方法、装置、电子设备及介质 | |
CN116628162A (zh) | 语义问答方法、装置、设备及存储介质 | |
CN113591881B (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN114818685B (zh) | 关键词提取方法、装置、电子设备及存储介质 | |
CN116450829A (zh) | 医疗文本分类方法、装置、设备及介质 | |
CN114139530A (zh) | 同义词提取方法、装置、电子设备及存储介质 | |
CN115346095A (zh) | 视觉问答方法、装置、设备及存储介质 | |
CN115510188A (zh) | 文本关键词关联方法、装置、设备及存储介质 | |
CN115309865A (zh) | 基于双塔模型的交互式检索方法、装置、设备及存储介质 | |
CN114398877A (zh) | 基于人工智能的主题提取方法、装置、电子设备及介质 | |
CN114610854A (zh) | 智能问答方法、装置、设备及存储介质 | |
CN114138243A (zh) | 基于开发平台的功能调用方法、装置、设备及存储介质 | |
CN114742060B (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN113792539B (zh) | 基于人工智能的实体关系分类方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |