CN113051910A - 一种用于预测人物角色情绪的方法和装置 - Google Patents

一种用于预测人物角色情绪的方法和装置 Download PDF

Info

Publication number
CN113051910A
CN113051910A CN202110297403.7A CN202110297403A CN113051910A CN 113051910 A CN113051910 A CN 113051910A CN 202110297403 A CN202110297403 A CN 202110297403A CN 113051910 A CN113051910 A CN 113051910A
Authority
CN
China
Prior art keywords
emotion
prediction model
emotion prediction
word
participle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110297403.7A
Other languages
English (en)
Other versions
CN113051910B (zh
Inventor
李鹏
唐柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yusen Culture Media Co ltd
Original Assignee
Shanghai Yusen Culture Media Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yusen Culture Media Co ltd filed Critical Shanghai Yusen Culture Media Co ltd
Priority to CN202110297403.7A priority Critical patent/CN113051910B/zh
Publication of CN113051910A publication Critical patent/CN113051910A/zh
Application granted granted Critical
Publication of CN113051910B publication Critical patent/CN113051910B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种用于预测人物角色情绪的方法,所述方法包括:通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示;使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。

Description

一种用于预测人物角色情绪的方法和装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种用于预测人物角色情绪的技术方案。
背景技术
随着时代的发展,基于文本的情感分析所应用的领域也越来越广泛,现有的文本情感分析主要可分为以下几类:1)在社交媒体领域,通过基于文本的情感分析从用户在社交媒体上发布的文本内容中识别用户情绪观点,但其仅能得到一个句子里表达的情感极性是正向还是负向,而并不关心情感的主体;2)在电商领域,通过基于文本的情感分析从用户针对某个电商产品的评论中分析用户的好恶,其仅关注用户评价的观点;3)在文字作品领域,通过基于文本的情感分析从文字作品中对其中的角色进行情绪的提取和识别,目前通常是基于情感词典来定位情感词,得到情感词之后再确定其对应的角色,而基于定位方式的不同可采用不同的方案,例如,基于滑动窗口处理,在一个固定的窗口内来查找某个情绪词所属的人物,又例如,在词法分析后通过句子结构的主谓关系、动宾关系来确定某人物的情绪词。然而,现有针对文字作品的上述方案无法处理长句或者是句法表示复杂的句子中情绪的主体。
发明内容
本申请的目的是提供一种用于预测人物角色情绪的技术方案,该方案能够从高层语义的目标文字作品中,对其所涉及的各个人物角色进行情感提取,从而保证针对目标文字作品中后续的人物角色的情感量化分析的准确性。
根据本申请的一个实施例,提供一种用于预测人物角色情绪的方法,其中,所述方法包括:
通过LTP(Language Technology Platform,语言技术平台)对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示;
使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;
将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
根据本申请的另一个实施例,还提供了一种用于预测人物角色情绪的装置,其中,所述装置包括:
用于通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示的装置;
用于使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示的装置;
用于将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果的装置,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
根据本申请的另一个实施例,还提供了一种计算机设备,其中,所述计算机设备包括:存储器,用于存储一个或多个程序;一个或多个处理器,与所述存储器相连,当所述一个或多个程序被所述一个或者多个处理器执行时,使得所述一个或多个处理器执行如下操作:
通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示;
使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;
将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
根据本申请的另一个实施例,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行如下操作:
通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示;
使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;
将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
与现有技术相比,本申请具有以下优点:通过将分词的词向量特征表示、分词的句法标签属性的类别嵌入表示以及分词的语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,能够准确预测人物角色情绪,也即预测人物角色与情绪分类结果之间的关联关系;通过有监督学习中的深度学习可以有效解决长难句中情绪和主体匹配的问题,使得能够将情绪准确地关联至相应地人物角色。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了本申请一个实施例的用于预测人物角色情绪的方法的流程示意图;
图2示出了本申请一个实施例的用于预测人物角色情绪的装置的结构示意图;
图3示出了可被用于实施本申请中所述的各个实施例的示例性系统。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“设备”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的程序指令来执行预定处理过程,或是由专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)等硬件执行预定处理过程,或是由上述二者组合来实现。
本申请的技术方案主要由计算机设备来实现。其中,所述计算机设备包括网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。所述用户设备包括但不限于PC机、平板电脑、智能手机、IPTV、PDA、可穿戴设备等。其中,所述计算机设备可单独运行来实现本申请,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本申请。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
需要说明的是,上述计算机设备仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本申请,也应包含在本申请保护范围以内,并以引用方式包含于此。
本文后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本申请的示例性实施例的目的。但是本申请可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本申请作进一步详细描述。
图1示出了本申请一个实施例的用于预测人物角色情绪的方法的流程示意图。根据本实施例的方法包括步骤S11、步骤S12和步骤S13。在步骤S11中,计算机设备通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入(word embeddings)技术获取每个分词的词向量特征表示;在步骤S12中,计算机设备使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;在步骤S13中,计算机设备将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
在步骤S11中,计算机设备通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示。在一些实施例中,所述目标文字作品包括任何以文字为主要表达外观的作品,如在网络平台上发布的小说、故事或影视作品剧情大纲等。在一些实施例中,使用了哈工大社会计算与信息检索研究中心研制的LTP)对句子进行分词,对于所得到的多个分词(一个分词也视为一个token),利用词嵌入技术获取该分词的词向量特征表示,也即将该token映射为一个词向量(如一个K维的实数向量)。在一些实施例中,一个分词的词向量特征表示代表的是该分析其他分词在高维空间(特征向量维度)中的相对关系。需要说明的是,本申请对词嵌入技术所使用的具体算法并不作限制。作为步骤S11的一个示例,针对目标文字作品中的一句话“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”,使用LTP对句话进行分词处理,得到以下分词:“黄蓉”、“被”、“郭靖”、“打了”、“一巴掌”、“伤心”、“地”、“捂着”、“脸”、“跑开了”;之后,利用词嵌入技术获取各个分词的词向量特征表示。
在步骤S12中,计算机设备使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示。在一些实施例中,所述句法及语义分析包括使用LTP进行的任何与句法和/或语义相关的分析,如句子句法分析、语义依存分析、语义角色标识等,其中,句子句法分析用于通过分析语言单位内成分之间的依存关系揭示其句法结构,如识别句子中的“主谓宾”、“定状补”等语法成分,并分析各成分之间的关系,语义依存分析用于分析句子各个语言单位之间的语义关联并将语义关联以依存结构呈现,语义角色标识用于标注句子中某些短语为给定谓词的论元(语义角色),如施事、受事、时间和地点等。例如,接上例,通过使用LTP对句子句法分析、语义依存分析、语义角色标识,从而获取每个token上的句法标签属性及语义标签属性。在一些实施例中,对于每个token上的句法标签属性及语义标签属性,使用类别嵌入技术来确定其对应的类别嵌入表示,其中,类别嵌入是为每个类别创建单个向量表示的过程;在一些实施例中,通过为每个token上的句法标签属性及语义标签属性添加类别编码,来生成其所对应的类别嵌入表示。
在步骤S13中,计算机设备将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。在一些实施例中,所述情绪预测结果用于指示目标文字作品中的至少一个人物角色中的每个人物角色与情绪分类结果之间的关联关系,例如,所述情绪预测结果指示目标文字作品的人物甲对应的情绪分类结果为A、人物乙对应的情绪分类结果为B。在一些实施例中,所述情绪分类结果用于指示特定的情绪类别,如“快乐”、“愤怒”、“悲哀”、“恐惧”四种基本情绪;在另一些实施例中,所述情绪分类结果包括正向情绪和反向情绪,例如,所述情绪预测结果指示目标文字作品的人物甲为正向情绪、人物乙为反向情绪。在一些实施例中,将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示进行联合(也即Sum)后作为联合输入,并将该联合输入作为已训练的情绪预测模型的输入,所述已训练的情绪预测模型的输出即为所述目标文字作品对应的情绪预测结果。在一些实施例中,计算机设备可从其他设备获取已训练的情绪预测模型,或者通过训练得到所述情绪预测模型,其中,训练情绪预测模型的过程将在后续实施例中予以详述,在此不再赘述。
在一些实施例中,所述方法还包括在步骤S11之前执行的步骤S14、步骤S15和步骤S16。
在步骤S14中,计算机设备对于收集到的情绪训练数据集中的每个情绪训练数据,通过LTP对该情绪训练数据进行分词,得到多个分词,获取该情绪训练数据对应的人工标注标签,并使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性,其中,所述人工标注标签用于标注所述多个分词中的至少一个情绪词及所述多个分词中的至少一个人物角色词相对于所述至少一个情绪词的情绪分类结果。其中,所述通过LTP对该情绪训练数据进行分词,得到多个分词的操作与前述对目标文字作品进行分词处理,得到多个分词的操作相似,在此不再赘述。其中,所述使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性的操作,与前述使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性的操作相同或者相似,在此不再赘述。
在一些实施例中,所述情绪训练数据集可包括现有的情绪训练数据,以增加数据集内容,对于现有的情绪训练数据,需要对其现有标注进行重新调整或者添加新的标注以使其符合本申请的方案对情绪训练数据的要求。
在一些实施例中,在得到多个分词后,基于该多个分词的序列进行人工标注,计算机设备获取人工标注的与该情绪训练数据对应的人工标注标签;在一些实施例中,仅对多个分词中的部分分词进行标注,优选地,仅对多个分词中与人物角色以及情绪相关的分词进行标注。在一些实施例中,所述人工标注标签包括用于标注情绪词的标签以及用于标注人物角色相对情绪词的情绪分类结果,该情绪分类结果用于指示人物角色是所对应的情绪词的正例分类结果还是反例分类结果,作为一个示例,对句子“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”使用LTP进行分词处理,得到以下分词:“黄蓉”、“被”、“郭靖”、“打了”、“一巴掌”、“伤心”、“地”、“捂着”、“脸”、“跑开了”,基于分词的序列进行人工标注,标注结果示例地表示为“黄蓉/P被郭靖/N打了一巴掌,伤心/F地捂着脸跑开了”,其中空格符可视为分词之间的间隔,该标注结果中,分词“黄蓉”被添加了人工标注标签“P”,分词“郭靖”被添加了人工标注标签“N”,分词“伤心”被添加了人工标注标签“F”,在这里,“F”用于标注情绪词,而“P”用于指示所标注的人物角色(本示例中为“黄蓉”)为相关情绪词(本示例中为“伤心”)的正例,“N”用于指示所标注的人物角色(本示例中为“郭靖”)为相关情绪词(本示例中为“伤心”)的反例,由该示例可见,针对人物角色的标注与相应情绪词是具有关联关系的,而并非是独立的,且上述人工标注方案中针对人物角色即标注了情绪词的正例,也标注了情绪词的反例,由此可以增加数据集的容量。
在步骤S15中,计算机设备构建情绪预测模型,使用XLnet的预训练模型参数对所述情绪预测模型进行初始化,其中,所述情绪预测模型为标准的XLnet网络模型。其中,XLnet是Bert的优化版本,其是一种通用的自回归预训练方法,可以通过最大化所有可能的因式分解顺序的对数似然,学习双向语境信息,也即可以在处理自然语言时,充分利用前后双向的上下文信息。本申请中不再对构建标准的XLnet网络模型以及对情绪预测模型进行初始化的具体实现方式作详细描述,现有的或以后可能出现的用于构建标准的XLnet网络模型以及对情绪预测模型进行初始化的方式均应包含在本申请所述的保护范围内。
在步骤S16中,计算机设备通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型。
在一些实施例中,通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,获得符合所述情绪预测模型的输入信息,并利用该输入信息对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型。
在一些实施例中,所述步骤S16进一步包括:对于每个情绪训练数据,获取该情绪训练数据对应的人工标注标签的位置嵌入表示;对于每个情绪训练数据对应的多个分词中的每个分词,使用词嵌入技术获取该分词的词向量特征表示、该分词的句法标签属性的类别嵌入表示以及该分词的语义标签属性的类别嵌入表示;通过所述每个情绪训练数据对应的人工标注标签的位置嵌入表示、每个分词的词向量特征表示、每个分词的句法标签属性的类别嵌入表示以及每个分词的语义标签属性的类别嵌入表示,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型。在一些实施例中,针对分词处理后得到的各个分词,使用词嵌入技术获取每个分词对应的词向量特征表示,针对每个分词对应的句法标签属性和语义标签属性,使用类别嵌入技术获得对应的类别嵌入表示,针对所获得的人工标注标签进行位置嵌入表示,并将上述各项嵌入进行Sum得到联合输入x,其中,将人工标注标签的正例分类结果定为1,对反例分类结果定为0,从而将情绪词与人物角色的关联识别,转换为二分类问题。本申请通过在训练情绪预测模型的过程中学习人工标注的大数据集,使用数据训练人工神经网络,利用神经网络提取或识别自然语言表述的规律,能够很好地解决情绪与主体的匹配问题,即便一种情绪与多个主体相关(或者一句话中涉及一种情绪和多个主体,或者一句话中涉及多种情绪和多个主体),也能准确的将每种情绪匹配到相应主体,例如,在句子“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”中,情绪词“伤心”与人物角色“黄蓉”和“郭靖”均相关,基于本申请的方案,能够准确地预测到“黄蓉”相对情绪词“伤心”的情绪分类是正面的,而“郭靖”相对情绪词“伤心”的情绪分类是反面的(也即,真正伤心的是黄蓉而不是郭靖,从而可确定“黄蓉”与“伤心”是关联匹配的)。
在一些实施例中,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型,包括:对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,可从多个待定情绪预测模型中随机选择一个目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,可从多个待定情绪预测模型中选择符合预定条件(如满足预定准确率要求)的目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,对所构建的情绪预测模型进行预定数量次的微调训练,得到所述预定数量个的待定情绪预测模型,之后从所述预定数量个的待定情绪预测模型中选择一个目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,对所述情绪预测模型进行多次微调训练,直至获得准确率大于或等于预定准确率的情绪预测模型,并将该准确率大于或等于预定准确率的情绪预测模型作为所述已训练的情绪预测模型,用于后续预测。
在一些实施例中,所述对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型,包括:通过1e-5的学习率对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择对应的准确率及F1参数满足预定条件的目标情绪预测模型并将其作为所述已训练的情绪预测模型。在一些实施例中,将学习率设置为1e-5,并基于该学习率对所构建的情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,之后从该多个待定情绪预测模型中选择准确率/F1参数最高的待定情绪预测模型作为所述已训练的情绪预测模型。需要说明的是,在一些实施例中,也可基于其他的学习率来对所构建的情绪预测模型进行多次微调训练,在实际应用中,可基于不同的学习率进行实验或者基于经验得到一个合理的学习率,例如,先设置一个非常低的学习率(,然后,在每次数据训练中改变学习率(比如乘以某个因子),直到学习率达到一个非常高的值或者loss开始变大,停止训练,之后基于loss随学习率的变化情况,选择一个合理的学习率(如选择最小loss对应的前一个学习率)。
在一些实施例中,所述方法还包括:计算机设备获得针对所述目标文字作品对应的情绪预测结果的反馈信息,根据所述反馈信息优化所述已训练的情绪预测模型。在一些实施例中,所述反馈信息用于指示预测错误的人物角色,例如,情绪预测结果指示人物角色甲相对情绪词的情绪分类结果为正向情绪,针对该情绪预测结果的反馈信息指示预测错误的人物角色为甲,则表示甲相对情绪词实际应为反向情绪。在一些实施例中,若基于反馈信息确定预测准确率低于预定阈值,则对所述已训练的情绪预测模型进行微调训练,得到优化后的情绪预测模型。
根据本申请的方案,通过将分词的词向量特征表示、分词的句法标签属性的类别嵌入表示以及分词的语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,能够准确预测人物角色情绪,也即预测人物角色与情绪分类结果之间的关联关系;通过有监督学习中的深度学习可以有效解决长难句中情绪和主体匹配的问题,使得能够将情绪准确地关联至相应地人物角色。
图2示出了本申请一个实施例的用于预测人物角色情绪的装置的结构示意图。该用于预测人物角色情绪的装置(以下简称为“情绪预测装置”)包括装置11、装置12和装置13。
装置11用于通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示。在一些实施例中,所述目标文字作品包括任何以文字为主要表达外观的作品,如在网络平台上发布的小说、故事或影视作品剧情大纲等。在一些实施例中,使用了哈工大社会计算与信息检索研究中心研制的LTP)对句子进行分词,对于所得到的多个分词(一个分词也视为一个token),利用词嵌入技术获取该分词的词向量特征表示,也即将该token映射为一个词向量(如一个K维的实数向量)。在一些实施例中,一个分词的词向量特征表示代表的是该分析其他分词在高维空间(特征向量维度)中的相对关系。需要说明的是,本申请对词嵌入技术所使用的具体算法并不作限制。作为一个示例,针对目标文字作品中的一句话“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”,使用LTP对句话进行分词处理,得到以下分词:“黄蓉”、“被”、“郭靖”、“打了”、“一巴掌”、“伤心”、“地”、“捂着”、“脸”、“跑开了”;之后,利用词嵌入技术获取各个分词的词向量特征表示。
装置12用于使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示。在一些实施例中,所述句法及语义分析包括使用LTP进行的任何与句法和/或语义相关的分析,如句子句法分析、语义依存分析、语义角色标识等,其中,句子句法分析用于通过分析语言单位内成分之间的依存关系揭示其句法结构,如识别句子中的“主谓宾”、“定状补”等语法成分,并分析各成分之间的关系,语义依存分析用于分析句子各个语言单位之间的语义关联并将语义关联以依存结构呈现,语义角色标识用于标注句子中某些短语为给定谓词的论元(语义角色),如施事、受事、时间和地点等。例如,接上例,通过使用LTP对句子句法分析、语义依存分析、语义角色标识,从而获取每个token上的句法标签属性及语义标签属性。在一些实施例中,对于每个token上的句法标签属性及语义标签属性,使用类别嵌入技术来确定其对应的类别嵌入表示,其中,类别嵌入是为每个类别创建单个向量表示的过程;在一些实施例中,通过为每个token上的句法标签属性及语义标签属性添加类别编码,来生成其所对应的类别嵌入表示。
装置13用于将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。在一些实施例中,所述情绪预测结果用于指示目标文字作品中的至少一个人物角色中的每个人物角色与情绪分类结果之间的关联关系,例如,所述情绪预测结果指示目标文字作品的人物甲对应的情绪分类结果为A、人物乙对应的情绪分类结果为B。在一些实施例中,所述情绪分类结果用于指示特定的情绪类别,如“快乐”、“愤怒”、“悲哀”、“恐惧”四种基本情绪;在另一些实施例中,所述情绪分类结果包括正向情绪和反向情绪,例如,所述情绪预测结果指示目标文字作品的人物甲为正向情绪、人物乙为反向情绪。在一些实施例中,将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示进行联合(也即Sum)后作为联合输入,并将该联合输入作为已训练的情绪预测模型的输入,所述已训练的情绪预测模型的输出即为所述目标文字作品对应的情绪预测结果。在一些实施例中,可从其他设备获取已训练的情绪预测模型,或者通过训练得到所述情绪预测模型,其中,训练情绪预测模型的过程将在后续实施例中予以详述,在此不再赘述。
在一些实施例中,所述情绪预测装置还包括装置14(图未示)、装置15(图未示)和装置16(图未示)。
装置14用于对于收集到的情绪训练数据集中的每个情绪训练数据,通过LTP对该情绪训练数据进行分词,得到多个分词,获取该情绪训练数据对应的人工标注标签,并使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性,其中,所述人工标注标签用于标注所述多个分词中的至少一个情绪词及所述多个分词中的至少一个人物角色词相对于所述至少一个情绪词的情绪分类结果。其中,所述通过LTP对该情绪训练数据进行分词,得到多个分词的操作与前述对目标文字作品进行分词处理,得到多个分词的操作相似,在此不再赘述。其中,所述使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性的操作,与前述使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性的操作相同或者相似,在此不再赘述。
在一些实施例中,所述情绪训练数据集可包括现有的情绪训练数据,以增加数据集内容,对于现有的情绪训练数据,需要对其现有标注进行重新调整或者添加新的标注以使其符合本申请的方案对情绪训练数据的要求。
在一些实施例中,在得到多个分词后,基于该多个分词的序列进行人工标注,装置14获取人工标注的与该情绪训练数据对应的人工标注标签;在一些实施例中,仅对多个分词中的部分分词进行标注,优选地,仅对多个分词中与人物角色以及情绪相关的分词进行标注。在一些实施例中,所述人工标注标签包括用于标注情绪词的标签以及用于标注人物角色相对情绪词的情绪分类结果,该情绪分类结果用于指示人物角色是所对应的情绪词的正例分类结果还是反例分类结果,作为一个示例,对句子“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”使用LTP进行分词处理,得到以下分词:“黄蓉”、“被”、“郭靖”、“打了”、“一巴掌”、“伤心”、“地”、“捂着”、“脸”、“跑开了”,基于分词的序列进行人工标注,标注结果示例地表示为“黄蓉/P被郭靖/N打了一巴掌,伤心/F地捂着脸跑开了”,其中空格符可视为分词之间的间隔,该标注结果中,分词“黄蓉”被添加了人工标注标签“P”,分词“郭靖”被添加了人工标注标签“N”,分词“伤心”被添加了人工标注标签“F”,在这里,“F”用于标注情绪词,而“P”用于指示所标注的人物角色(本示例中为“黄蓉”)为相关情绪词(本示例中为“伤心”)的正例,“N”用于指示所标注的人物角色(本示例中为“郭靖”)为相关情绪词(本示例中为“伤心”)的反例,由该示例可见,针对人物角色的标注与相应情绪词是具有关联关系的,而并非是独立的,且上述人工标注方案中针对人物角色即标注了情绪词的正例,也标注了情绪词的反例,由此可以增加数据集的容量。
装置15用于构建情绪预测模型,使用XLnet的预训练模型参数对所述情绪预测模型进行初始化,其中,所述情绪预测模型为标准的XLnet网络模型。其中,XLnet是Bert的优化版本,其是一种通用的自回归预训练方法,可以通过最大化所有可能的因式分解顺序的对数似然,学习双向语境信息,也即可以在处理自然语言时,充分利用前后双向的上下文信息。本申请中不再对构建标准的XLnet网络模型以及对情绪预测模型进行初始化的具体实现方式作详细描述,现有的或以后可能出现的用于构建标准的XLnet网络模型以及对情绪预测模型进行初始化的方式均应包含在本申请所述的保护范围内。
装置16用于通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型。
在一些实施例中,通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,获得符合所述情绪预测模型的输入信息,并利用该输入信息对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型。
在一些实施例中,装置16进一步用于:对于每个情绪训练数据,获取该情绪训练数据对应的人工标注标签的位置嵌入表示;对于每个情绪训练数据对应的多个分词中的每个分词,使用词嵌入技术获取该分词的词向量特征表示、该分词的句法标签属性的类别嵌入表示以及该分词的语义标签属性的类别嵌入表示;通过所述每个情绪训练数据对应的人工标注标签的位置嵌入表示、每个分词的词向量特征表示、每个分词的句法标签属性的类别嵌入表示以及每个分词的语义标签属性的类别嵌入表示,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型。在一些实施例中,针对分词处理后得到的各个分词,使用词嵌入技术获取每个分词对应的词向量特征表示,针对每个分词对应的句法标签属性和语义标签属性,使用类别嵌入技术获得对应的类别嵌入表示,针对所获得的人工标注标签进行位置嵌入表示,并将上述各项嵌入进行Sum得到联合输入x,其中,将人工标注标签的正例分类结果定为1,对反例分类结果定为0,从而将情绪词与人物角色的关联识别,转换为二分类问题。本申请通过在训练情绪预测模型的过程中学习人工标注的大数据集,使用数据训练人工神经网络,利用神经网络提取或识别自然语言表述的规律,能够很好地解决情绪与主体的匹配问题,即便一种情绪与多个主体相关(或者一句话中涉及一种情绪和多个主体,或者一句话中涉及多种情绪和多个主体),也能准确的将每种情绪匹配到相应主体,例如,在句子“黄蓉被郭靖打了一巴掌,伤心地捂着脸跑开了”中,情绪词“伤心”与人物角色“黄蓉”和“郭靖”均相关,基于本申请的方案,能够准确地预测到“黄蓉”相对情绪词“伤心”的情绪分类是正面的,而“郭靖”相对情绪词“伤心”的情绪分类是反面的(也即,真正伤心的是黄蓉而不是郭靖,从而可确定“黄蓉”与“伤心”是关联匹配的)。
在一些实施例中,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型,包括:对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,可从多个待定情绪预测模型中随机选择一个目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,可从多个待定情绪预测模型中选择符合预定条件(如满足预定准确率要求)的目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,对所构建的情绪预测模型进行预定数量次的微调训练,得到所述预定数量个的待定情绪预测模型,之后从所述预定数量个的待定情绪预测模型中选择一个目标情绪预测模型作为所述已训练的情绪预测模型。在一些实施例中,对所述情绪预测模型进行多次微调训练,直至获得准确率大于或等于预定准确率的情绪预测模型,并将该准确率大于或等于预定准确率的情绪预测模型作为所述已训练的情绪预测模型,用于后续预测。
在一些实施例中,所述对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型,包括:通过1e-5的学习率对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择对应的准确率及F1参数满足预定条件的目标情绪预测模型并将其作为所述已训练的情绪预测模型。在一些实施例中,将学习率设置为1e-5,并基于该学习率对所构建的情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,之后从该多个待定情绪预测模型中选择准确率/F1参数最高的待定情绪预测模型作为所述已训练的情绪预测模型。需要说明的是,在一些实施例中,也可基于其他的学习率来对所构建的情绪预测模型进行多次微调训练,在实际应用中,可基于不同的学习率进行实验或者基于经验得到一个合理的学习率,例如,先设置一个非常低的学习率(,然后,在每次数据训练中改变学习率(比如乘以某个因子),直到学习率达到一个非常高的值或者loss开始变大,停止训练,之后基于loss随学习率的变化情况,选择一个合理的学习率(如选择最小loss对应的前一个学习率)。
在一些实施例中,所述情绪预测装置还包括装置17(图未示),装置17用于获得针对所述目标文字作品对应的情绪预测结果的反馈信息,根据所述反馈信息优化所述已训练的情绪预测模型。在一些实施例中,所述反馈信息用于指示预测错误的人物角色,例如,情绪预测结果指示人物角色甲相对情绪词的情绪分类结果为正向情绪,针对该情绪预测结果的反馈信息指示预测错误的人物角色为甲,则表示甲相对情绪词实际应为反向情绪。在一些实施例中,若基于反馈信息确定预测准确率低于预定阈值,则对所述已训练的情绪预测模型进行微调训练,得到优化后的情绪预测模型。
根据本申请的方案,通过将分词的词向量特征表示、分词的句法标签属性的类别嵌入表示以及分词的语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,能够准确预测人物角色情绪,也即预测人物角色与情绪分类结果之间的关联关系;通过有监督学习中的深度学习可以有效解决长难句中情绪和主体匹配的问题,使得能够将情绪准确地关联至相应地人物角色。
本申请还提供了一种计算机设备,其中,所述计算机设备包括:存储器,用于存储一个或多个程序;一个或多个处理器,与所述存储器相连,当所述一个或多个程序被所述一个或者多个处理器执行时,使得所述一个或多个处理器执行本申请所述的用于预测人物角色情绪的方法。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行本申请所述的用于预测人物角色情绪的方法。
本申请还提供了一种计算机程序产品,当所述计算机程序产品被设备执行时,使得所述设备执行本申请所述的用于预测人物角色情绪的方法。
图3示出了可被用于实施本申请中所述的各个实施例的示例性系统。
在一些实施例中,系统1000能够作为本申请实施例中的任意一个处理设备。在一些实施例中,系统1000可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备1020)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如,(一个或多个)处理器1005)。
对于一个实施例,系统控制模块1010可包括任意适当的接口控制器,以向(一个或多个)处理器1005中的至少一个和/或与系统控制模块1010通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块1010可包括存储器控制器模块1030,以向系统存储器1015提供接口。存储器控制器模块1030可以是硬件模块、软件模块和/或固件模块。
系统存储器1015可被用于例如为系统1000加载和存储数据和/或指令。对于一个实施例,系统存储器1015可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器1015可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块1010可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备1020及(一个或多个)通信接口1025提供接口。
例如,NVM/存储设备1020可被用于存储数据和/或指令。NVM/存储设备1020可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1020可包括在物理上作为系统1000被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备1020可通过网络经由(一个或多个)通信接口1025进行访问。
(一个或多个)通信接口1025可为系统1000提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统1000可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器(例如,存储器控制器模块1030)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统1000可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统1000可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统1000包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (12)

1.一种用于预测人物角色情绪的方法,其中,所述方法包括:
通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每个分词的词向量特征表示;
使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示;
将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
2.根据权利要求1所述的方法,其中,所述方法还包括:
对于收集到的情绪训练数据集中的每个情绪训练数据,通过LTP对该情绪训练数据进行分词,得到多个分词,获取该情绪训练数据对应的人工标注标签,并使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性,其中,所述人工标注标签用于标注所述多个分词中的至少一个情绪词及所述多个分词中的至少一个人物角色词相对于所述至少一个情绪词的情绪分类结果;
构建情绪预测模型,使用XLnet的预训练模型参数对所述情绪预测模型进行初始化,其中,所述情绪预测模型为标准的XLnet网络模型;
通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型。
3.根据权利要求2所述的方法,其中,所述通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型,包括:
对于每个情绪训练数据,获取该情绪训练数据对应的人工标注标签的位置嵌入表示;
对于每个情绪训练数据对应的多个分词中的每个分词,使用词嵌入技术获取该分词的词向量特征表示、该分词的句法标签属性的类别嵌入表示以及该分词的语义标签属性的类别嵌入表示;
通过所述每个情绪训练数据对应的人工标注标签的位置嵌入表示、每个分词的词向量特征表示、每个分词的句法标签属性的类别嵌入表示以及每个分词的语义标签属性的类别嵌入表示,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型。
4.根据权利要求2或3所述的方法,其中,所述对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型,包括:
对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型。
5.根据权利要求4所述的方法,其中,所述对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型,包括:
通过1e-5的学习率对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择对应的准确率及F1参数满足预定条件的目标情绪预测模型并将其作为所述已训练的情绪预测模型。
6.一种用于预测人物角色情绪的装置,其中,所述装置包括:
用于通过LTP对目标文字作品进行分词处理,得到多个分词,使用词嵌入技术获取每分词的词向量特征表示的装置;
用于使用LTP对所述目标文字作品进行句法及语义分析,获取所述每个分词对应的句法标签属性及语义标签属性,并获取所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示的装置;
用于将所述词向量特征表示、所述句法标签属性的类别嵌入表示以及所述语义标签属性的类别嵌入表示联合输入至已训练的情绪预测模型,输出所述目标文字作品对应的情绪预测结果的装置,其中,所述情绪预测结果包括一个或多个人物角色及每个人物角色的情绪分类结果。
7.根据权利要求6所述的装置,其中,所述装置还包括:
用于对于收集到的情绪训练数据集中的每个情绪训练数据,通过LTP对该情绪训练数据进行分词,得到多个分词,获取该情绪训练数据对应的人工标注标签,并使用LTP对该情绪训练数据进行句法及语义分析,获取每个分词对应的句法标签属性及语义标签属性的装置,其中,所述人工标注标签用于标注所述多个分词中的至少一个情绪词及所述多个分词中的至少一个人物角色词相对于所述至少一个情绪词的情绪分类结果;
用于构建情绪预测模型,使用XLnet的预训练模型参数对所述情绪预测模型进行初始化的装置,其中,所述情绪预测模型为标准的XLnet网络模型;
用于通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型的装置。
8.根据权利要求7所述的装置,其中,所述用于通过所述每个情绪训练数据对应的人工标注标签、多个分词及每个分词对应的句法标签属性及语义标签属性,对所述情绪预测模型进行微调训练,得到所述已训练的情绪预测模型的装置,用于:
对于每个情绪训练数据,获取该情绪训练数据对应的人工标注标签的位置嵌入表示;
对于每个情绪训练数据对应的多个分词中的每个分词,使用词嵌入技术获取该分词的词向量特征表示、该分词的句法标签属性的类别嵌入表示以及该分词的语义标签属性的类别嵌入表示;
通过所述每个情绪训练数据对应的人工标注标签的位置嵌入表示、每个分词的词向量特征表示、每个分词的句法标签属性的类别嵌入表示以及每个分词的语义标签属性的类别嵌入表示,对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型。
9.根据权利要求7或8所述的装置,其中,所述对所述情绪预测模型进行微调训练,得到已训练的所述情绪预测模型,包括:
对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型。
10.根据权利要求9所述的装置,其中,所述对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择目标情绪预测模型作为所述已训练的情绪预测模型,包括:
通过1e-5的学习率对所述情绪预测模型进行多次微调训练,得到多个待定情绪预测模型,从所述多个待定情绪预测模型中选择对应的准确率及F1参数满足预定条件的目标情绪预测模型并将其作为所述已训练的情绪预测模型。
11.一种计算机设备,其中,所述计算机设备包括:
存储器,用于存储一个或多个程序;
一个或多个处理器,与所述存储器相连,
当所述一个或多个程序被所述一个或者多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行如权利要求1至5中任一项所述的方法。
CN202110297403.7A 2021-03-19 2021-03-19 一种用于预测人物角色情绪的方法和装置 Active CN113051910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110297403.7A CN113051910B (zh) 2021-03-19 2021-03-19 一种用于预测人物角色情绪的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110297403.7A CN113051910B (zh) 2021-03-19 2021-03-19 一种用于预测人物角色情绪的方法和装置

Publications (2)

Publication Number Publication Date
CN113051910A true CN113051910A (zh) 2021-06-29
CN113051910B CN113051910B (zh) 2023-05-26

Family

ID=76514037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110297403.7A Active CN113051910B (zh) 2021-03-19 2021-03-19 一种用于预测人物角色情绪的方法和装置

Country Status (1)

Country Link
CN (1) CN113051910B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571096A (zh) * 2021-07-23 2021-10-29 平安科技(深圳)有限公司 语音情绪分类模型训练方法、装置、计算机设备及介质
CN113988456A (zh) * 2021-11-10 2022-01-28 中国工商银行股份有限公司 情绪分类模型训练方法、情绪预测方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294845A (zh) * 2016-08-19 2017-01-04 清华大学 基于权重学习和多特征抽取的多情绪分类方法及装置
CN109766540A (zh) * 2018-12-10 2019-05-17 平安科技(深圳)有限公司 通用文本信息提取方法、装置、计算机设备和存储介质
CN110297913A (zh) * 2019-06-12 2019-10-01 中电科大数据研究院有限公司 一种电子公文实体抽取方法
CN110427627A (zh) * 2019-08-02 2019-11-08 北京百度网讯科技有限公司 基于语义表示模型的任务处理方法和装置
CN111061861A (zh) * 2019-12-12 2020-04-24 西安艾尔洛曼数字科技有限公司 一种基于XLNet的文本摘要自动生成方法
CN111666764A (zh) * 2020-06-02 2020-09-15 南京优慧信安科技有限公司 一种基于XLNet的自动摘要方法与装置
CN111694960A (zh) * 2020-06-03 2020-09-22 哈尔滨商业大学 基于词性特征和观点特征结合卷积神经网络的电商评论情感分析模型
CN111914085A (zh) * 2020-06-18 2020-11-10 华南理工大学 文本细粒度情感分类方法、系统、装置及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294845A (zh) * 2016-08-19 2017-01-04 清华大学 基于权重学习和多特征抽取的多情绪分类方法及装置
CN109766540A (zh) * 2018-12-10 2019-05-17 平安科技(深圳)有限公司 通用文本信息提取方法、装置、计算机设备和存储介质
CN110297913A (zh) * 2019-06-12 2019-10-01 中电科大数据研究院有限公司 一种电子公文实体抽取方法
CN110427627A (zh) * 2019-08-02 2019-11-08 北京百度网讯科技有限公司 基于语义表示模型的任务处理方法和装置
CN111061861A (zh) * 2019-12-12 2020-04-24 西安艾尔洛曼数字科技有限公司 一种基于XLNet的文本摘要自动生成方法
CN111666764A (zh) * 2020-06-02 2020-09-15 南京优慧信安科技有限公司 一种基于XLNet的自动摘要方法与装置
CN111694960A (zh) * 2020-06-03 2020-09-22 哈尔滨商业大学 基于词性特征和观点特征结合卷积神经网络的电商评论情感分析模型
CN111914085A (zh) * 2020-06-18 2020-11-10 华南理工大学 文本细粒度情感分类方法、系统、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113571096A (zh) * 2021-07-23 2021-10-29 平安科技(深圳)有限公司 语音情绪分类模型训练方法、装置、计算机设备及介质
CN113988456A (zh) * 2021-11-10 2022-01-28 中国工商银行股份有限公司 情绪分类模型训练方法、情绪预测方法和装置

Also Published As

Publication number Publication date
CN113051910B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
Torfi et al. Natural language processing advancements by deep learning: A survey
US11182562B2 (en) Deep embedding for natural language content based on semantic dependencies
US11574122B2 (en) Method and system for joint named entity recognition and relation extraction using convolutional neural network
CN107679039B (zh) 用于确定语句意图的方法和装置
US11748232B2 (en) System for discovering semantic relationships in computer programs
US11436487B2 (en) Joint embedding of corpus pairs for domain mapping
US9792549B2 (en) Extraction of semantic relations using distributional relation detection
US20170308790A1 (en) Text classification by ranking with convolutional neural networks
US10713438B2 (en) Determining off-topic questions in a question answering system using probabilistic language models
US10657189B2 (en) Joint embedding of corpus pairs for domain mapping
JP7303195B2 (ja) 対象領域およびクライアント固有のアプリケーション・プログラム・インタフェース推奨の促進
US20210004602A1 (en) Method and apparatus for determining (raw) video materials for news
US10642919B2 (en) Joint embedding of corpus pairs for domain mapping
CN112805715A (zh) 识别实体属性关系
CN116561592B (zh) 文本情感识别模型的训练方法和文本情感识别方法及装置
Kumar et al. BERT based semi-supervised hybrid approach for aspect and sentiment classification
CN113051910A (zh) 一种用于预测人物角色情绪的方法和装置
Xiao et al. User preference mining based on fine-grained sentiment analysis
US20230042683A1 (en) Identifying and transforming text difficult to understand by user
Dobreva et al. Improving NER performance by applying text summarization on pharmaceutical articles
KR20220082146A (ko) 인공지능 및 자연어 처리 기반의 의료 콘텐츠 저작 및 관리 시스템
CN117874261B (zh) 基于课程学习的问答式事件抽取方法以及相关设备
Yashaswini et al. Story telling: learning to visualize sentences through generated scenes
US20230325776A1 (en) Generating user-based training data for machine learning
US20240143941A1 (en) Generating subject lines from keywords utilizing a machine-learning model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant