CN113420566B - 一种长文语义合理性判断方法、设备及介质 - Google Patents
一种长文语义合理性判断方法、设备及介质 Download PDFInfo
- Publication number
- CN113420566B CN113420566B CN202110808056.XA CN202110808056A CN113420566B CN 113420566 B CN113420566 B CN 113420566B CN 202110808056 A CN202110808056 A CN 202110808056A CN 113420566 B CN113420566 B CN 113420566B
- Authority
- CN
- China
- Prior art keywords
- plot
- information
- module
- character
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000007774 longterm Effects 0.000 title claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 116
- 239000013598 vector Substances 0.000 claims abstract description 88
- 238000010276 construction Methods 0.000 claims abstract description 50
- 230000008451 emotion Effects 0.000 claims description 59
- 238000010586 diagram Methods 0.000 claims description 42
- 230000009471 action Effects 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000002996 emotional effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001667 episodic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种长文语义合理性判断方法、设备及介质,方法包括:获取待分析的长文信息,并将长文信息划分若干情节单元;通过预设情节提取构建模块对情节单元中的情节信息进行提取,确定情节单元对应的情节特征向量、情节图结构;通过预设情节推动图卷积模块对情节图结构进行卷积运算,确定情节单元对应的人物特征向量;将情节特征向量以及人物特征向量输入至预设情节合理性判断模块,对情节信息的合理性进行判断。本申请实施例通过从人物关系出发,以事件情节为单元构建关系,通过图卷积操作综合考虑内在联系,能够增加外部知识以及内在关联的因素,更好的适应和满足真实的业务场景,对长文语义做出更加准确的合理性判断。
Description
技术领域
本申请涉及深度学习技术领域,尤其涉及一种长文语义合理性判断方法、设备及介质。
背景技术
语义理解是自然语言处理任务中的一个重要的研究方向,通过分析文字内容,从而理解内在含义,并且随着业务场景的不断变化,长文语义理解成为研究的热点之一。
但是,由于需要读取大量文字并理解其内容,对文字语义的合理性进行分析判断,辅助决策者进行决策,对长文进行更深入的语义分析,导致分析判断长文文字内容的合理性的准确率低。
发明内容
本申请实施例提供一种长文语义合理性判断方法、设备及介质,用于解决长文语义合理性判断准确率低的问题。
本申请实施例采用下述技术方案:
一方面,本申请实施例提供了一种长文语义合理性判断方法,该方法包括:获取待分析的长文信息,并将所述长文信息划分若干情节单元;通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断。
一个示例中,所述通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量,具体包括:通过所述预设情节推动图卷积模块,根据历史情节单元的情节信息,对所述情节图结构进行更新,确定更新的情节图结构;对所述更新的情节图结构进行卷积运算,确定所述人物特征向量。
一个示例中,所述对所述更新的情节图结构进行卷积运算,确定所述人物特征向量,具体包括:通过所述预设情节推动图卷积模块,对多个所述更新的情节图结构分别进行卷积运算,并对运算结果进行加权求和,确定所述人物特征向量。
一个示例中,所述通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构,具体包括:确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块、构建关系模块;通过所述人物提取模块提取所述情节信息的人物信息;通过所述情感提取模块提取所述情节信息的情感信息;通过所述情节提取模块提取所述情节信息的情节特征信息;所述情节特征信息包括所述情节特征向量;通过所述构建关系模块将所述人物信息、所述情感信息、所述情节特征信息进行整合,确定人物关系图结构、人物情感关系图结构、人物行动关系图结构。
一个示例中,所述确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块,具体包括:获取所述长文信息领域内的样本数据;通过所述样本数据对BERT语言模型进行训练,确定所述长文信息领域对应的语言模型;对所述对应的语言模型进行微调训练,确定所述人物提取模块、所述情感提取模块、所述情节提取模块。
一个示例中,所述获取待分析的长文信息,并将所述长文信息划分若干情节单元之后,所述方法还包括:确定所述若干情节单元对应的时间线,以使所述预设情节提取构建模块根据所述时间线对各情节单元中的情节信息进行提取。
一个示例中,所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块之后,所述方法还包括:获取所述预设情节合理性判断模块的判断结果;将所述判断结果的正确率反馈至所述预设情节提取构建模块、所述预设情节推动图卷积模块、所述预设情节合理性判断模块。
一个示例中,所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断,具体包括:将所述情节特征向量以及所述人物特征向量输入至预设循环神经网络合理性判断模型,对所述情节信息的合理性进行判断。
另一方面,本申请实施例提供了一种长文语义合理性判断设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取待分析的长文信息,并将所述长文信息划分若干情节单元;通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断。
另一方面,本申请实施例提供了一种长文语义合理性判断非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:获取待分析的长文信息,并将所述长文信息划分若干情节单元;通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
本申请实施例通过从人物关系出发,以事件情节为单元构建关系,通过图卷积操作综合考虑内在联系,能够增加外部知识以及内在关联的因素,发现文字内容人物、情节、场景等潜在的联系,更好的适应和满足真实的业务场景,对长文语义做出更加准确的合理性判断。
附图说明
为了更清楚地说明本申请的技术方案,下面将结合附图来对本申请的部分实施例进行详细说明,附图中:
图1为本申请实施例提供的一种长文语义合理性判断模型的结构示意图;
图2为本申请实施例提供的一种预设情节提取构建模块的结构示意图;
图3为本申请实施例提供的一种构建情节提取构建模块的流程示意图;
图4为本申请实施例提供的一种长文语义合理性判断方法的流程示意图;
图5为本申请实施例提供的一种长文语义合理性判断设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本申请的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面参照附图来对本申请的一些实施例进行详细说明。
图1为本申请实施例提供的一种长文语义合理性判断模型的结构示意图。
该合理性判断模型可以应用于不同的业务场景,比如,案情陈述判断业务场景、文字热点事件舆情判断业务场景、长文剧本合理性分析等场景。该模型的执行主体可以由相应领域的计算设备(比如,长文剧本合理性分析业务场景对应的服务器或者智能移动终端等)执行,模型中的某些输入参数或者中间结果允许人工干预调节,以帮助提高准确性。
长文语义合理性判断模型包括预设情节提取构建模块、预设情节推动图卷积模块、预设合理性判断模块。
其中,服务器获取到待分析的长文信息后,则将长文信息划分若干情节单元,然后将各情节单元输入长文语义合理性判断模型。
具体地,预设情节提取构建模块,用于生成情节单元中情节信息的情节特征向量、情节图结构。如图1所示,情节图结构包括人物关系图结构、人物情感关系图结构、人物行动关系图结构。
人物关系图结构、人物情感关系图结构以及人物行动关系图结构是指长文中的人物图关系结构(V,E),其中V表示人物,E表示人物间的关系,人物特征采用d维向量格式表示。
人物关系图结构主要描述人物间的基本关系,包括亲属关系、朋友关系、师生关系等人际交往关系。此外,人物情感关系图结构主要描述人物间的情感关系,表达人物间的喜欢厌恶、善意恶意关系。此外,人物行动关系图结构主要描述人物间产生的行为事件,表达参与情节的人物的具体行动。
需要说明的是,预设情节提取构建模块也可以根据实际需要,生成其他情节图结构,在此不作具体限定,为了方便描述,以下均以情节图结构包括人物关系图结构、人物情感关系图结构、人物行动关系图结构为例,进行解释说明。
更直观地,本申请实施例还提供了一种预设情节提取构建模块的结构示意图。
如图2所示,预设情节提取构建模块包括人物提取模块,情感提取模块、情节提取模块、构建关系模块。
其中,人物提取模块,用于提取情节单元中情节信息的人物信息,情感提取模块用于提取情节信息中的情感信息,情节提取模块用于提取该情节信息的情节特征信息,情节特征信息包括情节特征向量。
构建关系模块,用于将人物信息、情感信息、情节特征信息进行整合,得到人物关系图结构、人物情感关系图结构、人物行动关系图结构。
人物信息是指文字中的人物,形成特征向量,并标识其身份。情感信息是指文字中当前人物间的情感关系,形成特征向量。情节特征信息是指文字的情节特征,表述情节事件参与方、事件类型、具体行动、场景背景等信息。
具体地,人物提取模块、情感提取模块、情节提取模块的核心是基于BERT语言模型的神经网络模型,采用卷积神经网络做为核心的特征提取器,通过重新训练模块对通用的BERT模型进行领域客户化,并进行微调形成的。
更直观地,本申请实施例还提供了一种构建情节提取构建模块的流程示意图。
如图3所示,在构建人物提取模块、情感提取模块、情节提取模块时,服务器获取长文信息领域内的样本数据,然后通过样本数据对BERT语言模型进行训练,确定长文信息领域对应的语言模型,最后对对应的语言模型进行微调训练,得到人物提取模块、情感提取模块、情节提取模块。
需要说明的是,对于构建关系模块的设置,在此不作具体限定。
本申请实施例通过基于现有的BERT语言模型,结合领域具体文字数据,来训练微调得到人物提取模块、情感提取模块、情节提取模块等文字语义理解模型,一方面提升了训练效率,更加合理的利用现有资源,另一方面,能更好的满足领域个性化的需求。
进一步地,预设情节推动图卷积模块,用于根据历史情节单元更新情节图结构,并通过图卷积操作,再加权求和,形成所有人物的特征向量,用于判断合理性。
需要说明的是,图卷积操作的具体算法,可以根据实际需要进行设置,在此不作限定,比如,图卷积操作采用图注意力模型GAT算法。
其中,更新图结构模块用于更新情节图结构,如图1所示,该更新图结构模块包括更新人物关系图结构模块、更新人物情感关系图结构模块、更新人物行动关系图结构模块,更新人物关系图结构模块对人物关系图结构进行调整,更新人物情感关系图结构模块对人物情感关系图结构进行调整、更新人物行动关系图结构模块对人物行动关系图结构进行调整。
本申请实施例采用图卷积神经网络,增加外部知识以及内在关联的因素,发现文字内容人物、情节、场景等潜在的联系,更好的适应和满足真实的业务场景。进一步地,通过对人物关系图结构、人物情感关系图结构、人物行动关系图结构分别进行图卷积操作再加权求和的方式,更加全面的考虑到了长文不同场景下多种联系深层次的语义关系,在实际个性化场景下能达到更好的效果,同时充分考虑到文字情节时序性的特点,沿时间轴结合情节推动,更新人物特征状态,能够持续输出到RNN结构的合理性判断模块,持续更新判断长文情节语义的合理性,能提升分析具体情节的准确性。
更进一步地,预设合理性判断模块,用于将基于所有人物形成的人物特征向量以及本次情节信息的情节特征向量,判断本次情节信息的合理性以及整体情节的合理性。其中,预设合理性判断模的主体采用循环神经网络RNN结构。
本申请实施例通过采用RNN结构的合理性判断网络,能更加准确的分析具体情节的合理性。
通过图1中的模型,本申请实施例通过针对长文语义分析的特点,结合案情陈述判断、文字热点事件舆情判断、长文剧本合理性分析等具体场景,设计人物关系、情感关系、行动关系以及情节特征,从人物关系出发,以事件情节为单元构建关系,基于人物之间基本关系、人物之间情绪关系以及人物间行动关系,通过图卷积操作综合考虑内在联系,对长文语义做出更加准确的合理性判断。
基于上面的说明,本申请实施例还提供了一种应用于图4中模型的一种长文语义合理性判断方法的流程示意图。
本申请实施例涉及的分析方法的实现可以为终端设备,也可以为服务器,本申请对此不作特殊限制。为了方便理解和描述,以下实施例均以服务器为例进行详细描述。
需要说明的是,该服务器可以是单独的一台设备,可以是有多台设备组成的系统,即,分布式服务器,本申请对此不做具体限定。
图4中的流程可以包括以下步骤:
S101:获取待分析的长文信息,并将长文信息划分若干情节单元。
具体地,在服务器获取待分析的长文信息之前,服务器根据长文内容业务领域场景的需求,设计人物关系、情感关系、行动关系以及情节特征,并收集领域内海量长文数据,基于通用的BERT模型重训练领得到领域BERT模型,从而形成针对领域的语言模型,最后基于面向具体业务领域的语言模型,微调训练所述的人物提取模块、情感提取模块、情节提取模块,形成网络模型。
服务器在获取到待分析的长文信息之后,将会确定若干情节单元对应的时间线,使得预设情节提取构建模块根据时间线对各情节单元中的情节信息进行提取。
S102:通过预设情节提取构建模块对情节单元中的情节信息进行提取,确定情节单元对应的情节特征向量、情节图结构。
在本申请的一些实施例中,预设情节提取构建模块包括人物提取模块,情感提取模块、情节提取模块、构建关系模块。进一步地,情节图结构包括人物关系图结构、人物情感关系图结构、人物行动关系图结构。
当情节单元中的情节信息输入预设情节提取构建模块时,服务器将会通过人物提取模块提取该情节信息中人物信息,并通过情感提取模块提取该情节信息中的情感信息,并通过情节提取模块提取该情节信息的情节特征信息。然后通过构建关系模块将人物信息、情感信息、情节特征信息进行整合,得到人物关系图结构、人物情感关系图结构、人物行动关系图结构。
S103:通过预设情节推动图卷积模块对情节图结构进行卷积运算,确定情节单元对应的人物特征向量。
在本申请的一些实施例中,预设情节推动图卷积模块包括更新图结构模块,更新图结构模块会结合历史情节单元的情节信息,对情节图结构进行更新。比如,根据文字具有时序性的特点,更新图结构模块参考上一情节单元的情节信息,对预设情节提取构建模块生成的本次情节单元的情节图结构进行调整,从而能够形成符合现有知识、更加合理的图结构。
具体地,更新图结构模块包括更新人物关系图结构模块、更新人物情感关系图结构模块、更新人物行动关系图结构模块,服务器通过更新人物关系图结构模块对人物关系图结构进行调整,通过更新人物情感关系图结构模块对人物情感关系图结构进行调整、通过更新人物行动关系图结构模块对人物行动关系图结构进行更新。
进一步地,服务器通过预设情节推动图卷积模块对更新的情节图结构进行卷积运算,从而得到人物特征向量。
具体地,预设情节推动图卷积模块对更新的人物关系图结构、更新的人物情感关系图结构、更新的人物行动关系图结构分别进行卷积运算,然后再对运算结果进行加权求和,最后得到本情节发生后的人物特征向量。
本申请实施例充分考虑到文字情节时序性的特点,沿时间轴结合情节推动,更新人物特征状态,能够持续输出到RNN结构的合理性判断模块,持续更新判断长文情节语义的合理性,能提升分析具体情节的准确性。
S104:将情节特征向量以及人物特征向量输入至预设情节合理性判断模块,对情节信息的合理性进行判断。
在本申请的一些实施例中,合理性判断模块主体采用RNN结构,将基于所有人物形成的特征向量以及本次情节特征向量,判断当前情节的合理性,同时输出已读入长文的语义合理性;
重复步骤101至步骤104,持续输出当前情节的合理性判断,然后读取所有的长文,输出最终的长文语义判断结果。
此外,持续收集在判定合理性过程中的数据,同时将所述判断结果的正确率反馈至所述预设情节提取构建模块、所述预设情节推动图卷积模块、所述预设情节合理性判断模块,对输出结果正确性进行反馈,用于模型的持续优化。
通过图1的方法,通过从人物关系出发,以事件情节为单元构建关系,通过图卷积操作综合考虑内在联系,能够增加外部知识以及内在关联的因素,发现文字内容人物、情节、场景等潜在的联系,更好的适应和满足真实的业务场景,对长文语义做出更加准确的合理性判断。
需要说明的是,虽然本申请实施例是参照图1来对步骤S101至步骤S104依次进行介绍说明的,但这并不代表步骤S101至步骤S104必须按照严格的先后顺序执行。本申请实施例之所以按照图1中所示的顺序对步骤S101至步骤S104依次进行介绍说明,是为了方便本领域技术人员理解本申请实施例的技术方案。换句话说,在本申请实施例中,步骤S101至步骤S104之间的先后顺序可以根据实际需要进行适当调整。
基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备和非易失性计算机存储介质。
图5为本申请实施例提供的一种长文语义合理性判断设备的结构示意图,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待分析的长文信息,并将长文信息划分若干情节单元;
通过预设情节提取构建模块对情节单元中的情节信息进行提取,确定情节单元对应的情节特征向量、情节图结构;
通过预设情节推动图卷积模块对情节图结构进行卷积运算,确定情节单元对应的人物特征向量;
将情节特征向量以及人物特征向量输入至预设情节合理性判断模块,对情节信息的合理性进行判断。
本申请的一些实施例提供的一种长文语义合理性判断非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
获取待分析的长文信息,并将长文信息划分若干情节单元;
通过预设情节提取构建模块对情节单元中的情节信息进行提取,确定情节单元对应的情节特征向量、情节图结构;
通过预设情节推动图卷积模块对情节图结构进行卷积运算,确定情节单元对应的人物特征向量;
将情节特征向量以及人物特征向量输入至预设情节合理性判断模块,对情节信息的合理性进行判断。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请技术原理之内所作的任何修改、等同替换、改进等,均应落入本申请的保护范围之内。
Claims (7)
1.一种长文语义合理性判断方法,其特征在于,所述方法包括:
获取待分析的长文信息,并将所述长文信息划分若干情节单元;
通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;
通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;
将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断;
所述通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构,具体包括:
确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块、构建关系模块;
通过所述人物提取模块提取所述情节信息的人物信息;
通过所述情感提取模块提取所述情节信息的情感信息;
通过所述情节提取模块提取所述情节信息的情节特征信息;所述情节特征信息包括所述情节特征向量;
通过所述构建关系模块将所述人物信息、所述情感信息、所述情节特征信息进行整合,确定人物关系图结构、人物情感关系图结构、人物行动关系图结构;
所述确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块,具体包括:
获取所述长文信息领域内的样本数据;
通过所述样本数据对BERT语言模型进行训练,确定所述长文信息领域对应的语言模型;
对所述对应的语言模型进行微调训练,确定所述人物提取模块、所述情感提取模块、所述情节提取模块;
所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断,具体包括:
将所述情节特征向量以及所述人物特征向量输入至预设循环神经网络合理性判断模型,对所述情节信息的合理性进行判断。
2.根据权利要求1所述的方法,其特征在于,所述通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量,具体包括:
通过所述预设情节推动图卷积模块,根据历史情节单元的情节信息,对所述情节图结构进行更新,确定更新的情节图结构;
对所述更新的情节图结构进行卷积运算,确定所述人物特征向量。
3.根据权利要求2所述的方法,其特征在于,所述对所述更新的情节图结构进行卷积运算,确定所述人物特征向量,具体包括:
通过所述预设情节推动图卷积模块,对多个所述更新的情节图结构分别进行卷积运算,并对运算结果进行加权求和,确定所述人物特征向量。
4.根据权利要求1所述的方法,其特征在于,所述获取待分析的长文信息,并将所述长文信息划分若干情节单元之后,所述方法还包括:
确定所述若干情节单元对应的时间线,以使所述预设情节提取构建模块根据所述时间线对各情节单元中的情节信息进行提取。
5.根据权利要求1所述的方法,其特征在于,所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块之后,所述方法还包括:
获取所述预设情节合理性判断模块的判断结果;
将所述判断结果的正确率反馈至所述预设情节提取构建模块、所述预设情节推动图卷积模块、所述预设情节合理性判断模块。
6.一种长文语义合理性判断设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待分析的长文信息,并将所述长文信息划分若干情节单元;
通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;
通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;
将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断;
所述通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构,具体包括:
确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块、构建关系模块;
通过所述人物提取模块提取所述情节信息的人物信息;
通过所述情感提取模块提取所述情节信息的情感信息;
通过所述情节提取模块提取所述情节信息的情节特征信息;所述情节特征信息包括所述情节特征向量;
通过所述构建关系模块将所述人物信息、所述情感信息、所述情节特征信息进行整合,确定人物关系图结构、人物情感关系图结构、人物行动关系图结构;
所述确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块,具体包括:
获取所述长文信息领域内的样本数据;
通过所述样本数据对BERT语言模型进行训练,确定所述长文信息领域对应的语言模型;
对所述对应的语言模型进行微调训练,确定所述人物提取模块、所述情感提取模块、所述情节提取模块;
所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断,具体包括:
将所述情节特征向量以及所述人物特征向量输入至预设循环神经网络合理性判断模型,对所述情节信息的合理性进行判断。
7.一种长文语义合理性判断非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
获取待分析的长文信息,并将所述长文信息划分若干情节单元;
通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构;
通过预设情节推动图卷积模块对所述情节图结构进行卷积运算,确定所述情节单元对应的人物特征向量;
将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断;
所述通过预设情节提取构建模块对所述情节单元中的情节信息进行提取,确定所述情节单元对应的情节特征向量、情节图结构,具体包括:
确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块、构建关系模块;
通过所述人物提取模块提取所述情节信息的人物信息;
通过所述情感提取模块提取所述情节信息的情感信息;
通过所述情节提取模块提取所述情节信息的情节特征信息;所述情节特征信息包括所述情节特征向量;
通过所述构建关系模块将所述人物信息、所述情感信息、所述情节特征信息进行整合,确定人物关系图结构、人物情感关系图结构、人物行动关系图结构;
所述确定所述预设情节提取构建模块包括人物提取模块、情感提取模块、情节提取模块,具体包括:
获取所述长文信息领域内的样本数据;
通过所述样本数据对BERT语言模型进行训练,确定所述长文信息领域对应的语言模型;
对所述对应的语言模型进行微调训练,确定所述人物提取模块、所述情感提取模块、所述情节提取模块;
所述将所述情节特征向量以及所述人物特征向量输入至预设情节合理性判断模块,对所述情节信息的合理性进行判断,具体包括:
将所述情节特征向量以及所述人物特征向量输入至预设循环神经网络合理性判断模型,对所述情节信息的合理性进行判断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808056.XA CN113420566B (zh) | 2021-07-16 | 2021-07-16 | 一种长文语义合理性判断方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110808056.XA CN113420566B (zh) | 2021-07-16 | 2021-07-16 | 一种长文语义合理性判断方法、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113420566A CN113420566A (zh) | 2021-09-21 |
CN113420566B true CN113420566B (zh) | 2022-11-08 |
Family
ID=77721210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110808056.XA Active CN113420566B (zh) | 2021-07-16 | 2021-07-16 | 一种长文语义合理性判断方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113420566B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052527A (zh) * | 2017-11-08 | 2018-05-18 | 中国传媒大学 | 基于标签体系的电影桥段分析推荐方法 |
CN110390102A (zh) * | 2019-07-22 | 2019-10-29 | 腾讯科技(深圳)有限公司 | 一种情感分析的方法和相关装置 |
CN111222315A (zh) * | 2019-12-31 | 2020-06-02 | 天津外国语大学 | 一种电影剧本情节预测方法 |
CN112836515A (zh) * | 2019-11-05 | 2021-05-25 | 阿里巴巴集团控股有限公司 | 文本分析方法、推荐方法、装置、电子设备及存储介质 |
CN112860843A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 一种新闻长文本情感分析方法及装置 |
CN112905753A (zh) * | 2019-12-04 | 2021-06-04 | 北京沃东天骏信息技术有限公司 | 一种判别文本信息的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287858B (zh) * | 2017-03-02 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 自然语言的语义提取方法及装置 |
-
2021
- 2021-07-16 CN CN202110808056.XA patent/CN113420566B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052527A (zh) * | 2017-11-08 | 2018-05-18 | 中国传媒大学 | 基于标签体系的电影桥段分析推荐方法 |
CN110390102A (zh) * | 2019-07-22 | 2019-10-29 | 腾讯科技(深圳)有限公司 | 一种情感分析的方法和相关装置 |
CN112836515A (zh) * | 2019-11-05 | 2021-05-25 | 阿里巴巴集团控股有限公司 | 文本分析方法、推荐方法、装置、电子设备及存储介质 |
CN112905753A (zh) * | 2019-12-04 | 2021-06-04 | 北京沃东天骏信息技术有限公司 | 一种判别文本信息的方法和装置 |
CN111222315A (zh) * | 2019-12-31 | 2020-06-02 | 天津外国语大学 | 一种电影剧本情节预测方法 |
CN112860843A (zh) * | 2021-03-31 | 2021-05-28 | 中国工商银行股份有限公司 | 一种新闻长文本情感分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113420566A (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11605226B2 (en) | Video data processing method and apparatus, and readable storage medium | |
CN110390108B (zh) | 基于深度强化学习的任务型交互方法和系统 | |
CN110364146B (zh) | 语音识别方法、装置、语音识别设备及存储介质 | |
CN111741330B (zh) | 一种视频内容评估方法、装置、存储介质及计算机设备 | |
US11335118B2 (en) | Signal retrieval apparatus, method, and program | |
CN107967258B (zh) | 文本信息的情感分析方法和系统 | |
CN113177538B (zh) | 一种视频循环识别方法、装置、计算机设备及存储介质 | |
CN114218488A (zh) | 基于多模态特征融合的信息推荐方法、装置及处理器 | |
CN116738250A (zh) | 提示文本扩展方法、装置、电子设备和存储介质 | |
CN114339285A (zh) | 知识点的处理方法、视频处理方法、装置及电子设备 | |
CN117787409A (zh) | 基于大语言模型的人机交互方法、装置及电子设备 | |
CN109522451B (zh) | 重复视频检测方法和装置 | |
CN117688155A (zh) | 业务问题的回复方法、装置、存储介质以及电子设备 | |
CN113762056A (zh) | 演唱视频识别方法、装置、设备及存储介质 | |
CN117216206A (zh) | 会话处理方法、装置、电子设备及存储介质 | |
CN113420566B (zh) | 一种长文语义合理性判断方法、设备及介质 | |
KR102243275B1 (ko) | 오프라인 오브젝트에 관한 콘텐츠 자동 생성 방법, 장치 및 컴퓨터 판독가능 저장 매체 | |
CN111914566A (zh) | 一种评论自动生成方法 | |
US20200257763A1 (en) | Visual storyline generation from text story | |
CN111695670A (zh) | 神经网络模型训练方法及装置 | |
CN113934870B (zh) | 多媒体推荐模型的训练方法、装置及服务器 | |
CN115659060A (zh) | 一种基于动态图神经网络的信息推荐方法及系统 | |
CN115294947A (zh) | 音频数据处理方法、装置、电子设备及介质 | |
CN114328995A (zh) | 内容推荐方法、装置、设备及存储介质 | |
CN114360586A (zh) | 一种大学生心理健康教育示教系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |