CN116227601B - 一种基于动词时态的泛化因果网络构建方法、设备及介质 - Google Patents

一种基于动词时态的泛化因果网络构建方法、设备及介质 Download PDF

Info

Publication number
CN116227601B
CN116227601B CN202310510993.6A CN202310510993A CN116227601B CN 116227601 B CN116227601 B CN 116227601B CN 202310510993 A CN202310510993 A CN 202310510993A CN 116227601 B CN116227601 B CN 116227601B
Authority
CN
China
Prior art keywords
causal
text
network
generalization
verb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310510993.6A
Other languages
English (en)
Other versions
CN116227601A (zh
Inventor
王华杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Yunwei Software Technology Co ltd
Original Assignee
Jinan Yunwei Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Yunwei Software Technology Co ltd filed Critical Jinan Yunwei Software Technology Co ltd
Priority to CN202310510993.6A priority Critical patent/CN116227601B/zh
Publication of CN116227601A publication Critical patent/CN116227601A/zh
Application granted granted Critical
Publication of CN116227601B publication Critical patent/CN116227601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于动词时态的泛化因果网络构建方法、设备及介质,属于因果网络技术领域,用于解决现有的因果知识网络的网络节点庞大,难以对因果事件进行广泛化的因果网络的构建,不容易反映出因果事件背后深层次的真实因果律,降低了后续事件推理的预测准确性的技术问题。方法包括:对因果事件中包含因果关系的语料进行识别标注,确定出因果文本;对因果文本中动词时态的因果关系进行事件链集合的抽取,得到因果文本的因果必然性概率以及因果充分性概率;然后将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络;并将其映射到低维连续向量空间中,得到因果网络表示学习模型。

Description

一种基于动词时态的泛化因果网络构建方法、设备及介质
技术领域
本申请涉及因果网络领域,尤其涉及一种基于动词时态的泛化因果网络构建方法、设备及介质。
背景技术
因果关系是事件推理的基础,也是问答系统的重要依据,通过自然语言文本得到大量的因果关系对,从而形成因果关系知识库,能够更好的回答“为什么”的问题。
现有的工作中,一类利用因果关系识别和抽取的事件应用因果相关性,从而构建因果知识网络,但这类方式会造成因果知识网络节点数量庞大,缺少泛化,容易产生稀疏性。另一类仅仅只对因果事件进行识别和抽取,形成具有动词时态的泛化事件短语,但没有考虑事件间的因果关系,难以形成具有广泛化的因果知识网络,来反映出因果事件背后深层次的因果律,难以将因果网络的事件向量应用到事件推理的下游任务中。
发明内容
本申请实施例提供了一种基于动词时态的泛化因果网络构建方法、设备及介质,用于解决如下技术问题:现有的因果知识网络的网络节点庞大,只能对某些事件进行因果关系的识别抽取,难以对因果事件进行广泛化的因果网络的构建,不容易反映出因果事件背后深层次的真实因果律,降低了后续事件推理的预测准确性。
本申请实施例采用下述技术方案:
一方面,本申请实施例提供了一种基于动词时态的泛化因果网络构建方法,包括:通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本;其中,所述因果模板包含若干因果对的匹配规则模板;对所述因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到所述因果文本的因果必然性概率以及因果充分性概率;根据所述因果必然性概率以及因果充分性概率,将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络;其中,所述因果网络图为基于所述因果文本的因果必然性以及因果充分性所对应生成的;将所述泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型;并通过预训练后的所述因果网络表示学习模型,反映出所述因果文本中各个语料的真实因果律。
本申请实施例通过对因果事件中包含因果关系的语料进行因果文本的提取,然后根据因果文本中的因果关系的必然性与充分性,构建出能够广泛适用于大规模因果事件的泛化因果网络,并对该泛化因果网络进行网络表示学习,通过训练得到的因果网络表示学习模型,能够更好的反映出因果事件背后深层次的真实因果律,提升了对后续事件推理的预测准确性,减少了因因果知识网络的大量节点所造成的泛化稀疏性特征,能够反映出因果事件中每个语料的真实因果关系,为因果事件的事件预测推理提供了较好的基础支撑。
在一种可行的实施方式中,在通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本之前,所述方法还包括:通过Pattern正则表达匹配规则,对所述因果事件中的因果连接词进行对应匹配训练,得到因果连接词模板;通过Constraint限制匹配规则,对所述因果事件中的时态语法进行限制性匹配训练,得到语法限制模板;通过Priority优先事项匹配规则,对所述因果事件中的包含因果关系的语料进行优先级匹配的训练,得到优先级模板;其中,所述因果模板由所述因果连接词模板、所述语法限制模板以及所述优先级模板组成。
在一种可行的实施方式中,通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本,具体包括:通过所述因果模板中的若干模板,对所述因果事件中的若干句子语料进行有关因果关系的语料匹配识别,得到包含因果关系的若干因果组对;对所述若干因果组对进行因果关系判别,得到所述若干因果组对中的原因语句以及对应的结果语句;并对所述原因语句以及对应的结果语句进行一一对应标注,得到标注后的原因文本以及对应的结果文本;将所述标注后的原因文本以及对应的结果文本确定为所述因果事件的因果文本。
在一种可行的实施方式中,对所述因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到所述因果文本的因果必然性概率以及因果充分性概率,具体包括:基于因果关系语料中的语法结构以及谓语动词的时态形式,对所述因果文本进行动词的多种时态形式的抽取分类,生成叙事事件链集合;其中,所述多种时态形式包括:动词时态与主语形式、动词时态与谓语形式以及动词时态与介词形式;所述叙事事件链集合包含了谓语动词、谓语动词的主语、谓语动词的宾语以及谓语动词的间接宾语;对所述叙事事件链集合中每个语料的动词时态形式进行因果条件处理,得到所述因果文本的因果必然性概率以及因果充分性概率。
在一种可行的实施方式中,对所述叙事事件链集合中每个语料的动词时态形式进行因果条件处理,得到所述因果文本的因果必然性概率以及因果充分性概率,具体包括:根据,得到所述因果必然性概率/>;其中,/>为所述叙事事件链集合中因果文本的一种因果对,/>为一种原因文本,/>为一种结果文本,p为所述叙事事件链集合中的谓语动词,/>为概率中间量,/>与所述因果文本的因果必然性相关联,/>为所述结果文本中的一种谓语动词值,/>为所述叙事事件链集合中一种谓语动词的因果对;根据/>,得到所述因果充分性概率;其中,/>为与所述因果文本的因果充分性相关联,/>为所述原因文本中的一种谓语动词值。
在一种可行的实施方式中,根据,得到所述原因文本中的一种谓语动词值/>;其中,W为因果文本中的因果词,/>为权重,M为所述因果文本中因果组对的数量,/>为结果文本的权重,/>为原因文本/>的概率;根据/>,得到所述结果文本中的一种谓语动词值;其中,/>为原因文本中的权重,/>为结果文本的概率;根据/>,得到所述叙事事件链集合中一种谓语动词的因果对;其中,N为所述叙事事件链集合中因果文本中的语料大小,/>为对一种因果对/>的概率。
在一种可行的实施方式中,根据所述因果必然性概率以及因果充分性概率,将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络,具体包括:根据所述因果必然性概率以及因果充分性概率,对所述因果网络图进行相同集合的分类,得到所述节点集合与所述边集合;其中,所述因果网络图为基于所述因果文本所生成的;根据,得到所述因果网络图中有关边集合的有向边权重;其中,/>为所述因果网络图中节点集合的共现频率,k为所述共现频率的个数,/>为所述节点集合中的原因节点,/>为所述节点集合中的结果节点;通过所述有关边集合的有向边权重、所述因果必然性概率以及因果充分性概率,对所述因果网络图进行广泛化的因果关系依赖训练,得到所述泛化因果网络。
在一种可行的实施方式中,将所述泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型,具体包括:通过预设DeepWalk算法,将与所述泛化因果网络对应的泛化因果网络图进行节点序列的转化,并将转换后的若干节点进行节点的向量嵌入,得到所述若干节点的节点低维向量;通过所述节点低维向量,将所述泛化因果网络对应的节点映射到低维连续向量空间中,得到所述因果事件的图谱语义信息以及图结构信息;对所述图谱语义信息以及图结构信息进行模型的网络学习,训练并得到所述因果网络表示学习模型,以通过预训练后的所述因果网络表示学习模型,反映出所述因果文本中各个语料的真实因果律。
第二方面,本申请实施例还提供了一种基于动词时态的泛化因果网络构建设备,所述设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能够被所述至少一个处理器执行的指令,以使所述至少一个处理器能够执行上述任一实施方式所述的一种基于动词时态的泛化因果网络构建方法。
第三方面,本申请实施例还提供了一种非易失性计算机存储介质,其特征在于,所述存储介质为非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有至少一个程序,每个所述程序包括指令,所述指令当被终端执行时,使所述终端执行上述任一实施方式所述的一种基于动词时态的泛化因果网络构建方法。
本申请提供了一种基于动词时态的泛化因果网络构建方法、设备及介质,通过对因果事件中包含因果关系的语料进行因果文本的提取,然后根据因果文本中的因果关系的必然性与充分性,构建出能够广泛适用于大规模因果事件的泛化因果网络,并对该泛化因果网络进行网络表示学习,通过训练得到的因果网络表示学习模型,能够更好的反映出因果事件背后深层次的真实因果律,提升了对后续事件推理的预测准确性,减少了因因果知识网络的大量节点所造成的泛化稀疏性特征,能够反映出因果事件中每个语料的真实因果关系,为因果事件的事件预测推理提供了较好的基础支撑。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例提供的一种基于动词时态的泛化因果网络构建方法流程图;
图2为本申请实施例提供的一种基于动词时态的泛化因果网络构建设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请实施例提供了一种基于动词时态的泛化因果网络构建方法,如图1所示,基于动词时态的泛化因果网络构建方法具体包括步骤S101-S104:
S101、通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出因果事件的因果文本。其中,因果模板包含若干因果对的匹配规则模板。
具体地,先通过Pattern正则表达匹配规则,对因果事件中的因果连接词进行对应匹配训练,得到因果连接词模板。通过Constraint限制匹配规则,对因果事件中的时态语法进行限制性匹配训练,得到语法限制模板。通过Priority优先事项匹配规则,对因果事件中的包含因果关系的语料进行优先级匹配的训练,得到优先级模板。其中,因果模板由因果连接词模板、语法限制模板以及优先级模板组成。
进一步地,通过因果模板中的若干模板,对因果事件中的若干句子语料进行有关因果关系的语料匹配识别,得到包含因果关系的若干因果组对。
进一步地,对若干因果组对进行因果关系判别,得到若干因果组对中的原因语句以及对应的结果语句。并对原因语句以及对应的结果语句进行一一对应标注,得到标注后的原因文本以及对应的结果文本。最后将标注后的原因文本以及对应的结果文本确定为因果事件的因果文本。
在一个实施例中,根据规则[Pattern,Constraint,Priority]的形式,其中Pattern是包含因果连接词的正则表达式,Constraint是规则应用同时的句子语法限制,Priority是当几个规则同时匹配时的优先级。以因果连接词after来举例,Pattern是After[sentence1],[sentence2],Constraint是[sentence1]不能以数字开头,该模式匹配“After stockcrash,investors feel angry”(股票暴跌以后,投资者感到愤怒),但是不会匹配“After 3 years later,missing cat turns up”(三年后,失踪的猫又回来了)。显然stockcrash→investers angry是因果关系而3 years later→missing cat turns up不是因果关系。然后分别与因果事件中的因果链接词、时态语法以及语料的优先级进行匹配训练,分别得到由因果连接词模板、语法限制模板以及优先级模板所组成的因果模板,并对因果事件中的若干句子语料进行有关因果关系的语料匹配识别,得到包含因果关系的若干因果组对以及进行原因文本以及对应的结果文本的标注,最终得到因果文本。
在一个实施例中,通过因果知识库CausalBank,对语料库中的因果连接词进行频繁程度的判断,从而筛选出具有出现最高频率的因果连接词例如:“because”、“as”、“dueto”以及“because of”等等,然后对这些因果连接词进行对应匹配训练,得到因果连接词模板。
S102、对因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到因果文本的因果必然性概率以及因果充分性概率。
具体地,基于因果关系语料中的语法结构以及谓语动词的时态形式,对因果文本进行动词的多种时态形式的抽取分类,生成叙事事件链集合。其中,多种时态形式包括:动词时态与主语形式、动词时态与谓语形式以及动词时态与介词形式。叙事事件链集合包含了谓语动词、谓语动词的主语、谓语动词的宾语以及谓语动词的间接宾语。
在一个实施例中,基于predicate-GR(每个事件表示为动作以及动作与角色之间的依存关系构成的二元组),即多种时态形:动词时态加主语形式、动词时态加谓语形式以及动词时态加介词形式,对因果文本的动词谓语语料进行事件的抽取与分类,得到叙事事件链集合,/>为每种语料中动词时态形式,/>包含了四个部分,其中,p为谓语动词,/>为谓语动词的主语,/>为谓语动词的宾语,/>为谓语动词的间接宾语。
进一步地,对叙事事件链集合中每个语料的动词时态形式进行因果条件处理,得到因果文本的因果必然性概率以及因果充分性概率。具体为根据,得到因果必然性概率/>。其中,/>为叙事事件链集合中因果文本的一种因果对,/>为一种原因文本,/>为一种结果文本,p为叙事事件链集合中的谓语动词,/>为概率中间量,/>与因果文本的因果必然性相关联,/>为结果文本中的一种谓语动词值,/>为叙事事件链集合中一种谓语动词的因果对。根据,得到因果充分性概率/>。其中,/>为与因果文本的因果充分性相关联,/>为原因文本中的一种谓语动词值。
其中,根据,得到原因文本中的一种谓语动词值/>。其中,W为因果文本中的因果词,/>为权重,M为因果文本中因果组对的数量,/>为结果文本的权重,/>为原因文本/>的概率。根据/>,得到结果文本中的一种谓语动词值。其中,/>为原因文本中的权重,/>为结果文本/>的概率。根据/>,得到叙事事件链集合中一种谓语动词的因果对。其中,N为叙事事件链集合中因果文本中的语料大小,/>为对一种因果对/>的概率。
作为一种可行的实施方式,因果必然性(Necessity Causality)是指再叙事事件链集合中因果文本的一种因果对中,原因文本/>必须在结果文本/>之前发生。而因果充分性是指在一种因果对/>中,原因文本/>发生了,结果文本/>一定会发生。/>的值越大因果必然性概率越大,/>的值越大,因果充分性概率越大。
S103、根据因果必然性概率以及因果充分性概率,将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络。其中,因果网络图为基于因果文本的因果必然性关系以及因果充分性关系所对应生成的。
具体地,根据因果必然性概率以及因果充分性概率,对因果网络图进行相同集合的分类,得到节点集合与边集合。其中,因果网络图为基于因果文本所生成的。
进一步地,根据,得到因果网络图中有关边集合的有向边权重/>。其中,/>为因果网络图中节点集合的共现频率,k为共现频率的个数,/>为节点集合中的原因节点,/>为节点集合中的结果节点。
进一步地,通过有关边集合的有向边权重、因果必然性概率以及因果充分性概率,对因果网络图进行广泛化的因果关系依赖训练,得到泛化因果网络。
在一个实施例中,对所有因果网络图中节点集合的共现频率进行计算,并且作为边集合中边的权重,得到因果网络图中有关边集合中每个边的有向边权重,即有向边/>→/>
S104、将泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型。并通过预训练后的因果网络表示学习模型,反映出因果文本中各个语料的真实因果律。
具体地,通过预设DeepWalk算法,将与泛化因果网络对应的泛化因果网络图进行节点序列的转化,并将转换后的若干节点进行节点的向量嵌入,得到若干节点的节点低维向量。
进一步地,通过节点低维向量,将泛化因果网络对应的节点映射到低维连续向量空间中,得到因果事件的图谱语义信息以及图结构信息。对图谱语义信息以及图结构信息进行模型的网络学习,训练并得到因果网络表示学习模型,以通过预训练后的因果网络表示学习模型,反映出因果文本中各个语料的真实因果律。
作为一种可行的实施方式,首先通过DeepWalk算法,将泛化因果网络对应的泛化因果网络图进行节点序列的转化,以实现多个节点的向量嵌入,完成节点的降维处理,得到多个节点的节点低维向量,然后将泛化因果网络对应的节点映射到低维连续向量空间中,得到因果事件的图谱语义信息与图结构信息,将若干组的图谱语义信息与图结构信息进行模型化的网络学习训练,最终得到能够使适用于广泛化因果事件的因果网络表示学习模型,然后将因果文本输入到该果网络表示学习模型中,输出得到该因果文本中,各个语料中有关因果关系的真实因果律。
另外,本申请实施例还提供了一种基于动词时态的泛化因果网络构建设备,如图2所示,基于动词时态的泛化因果网络构建设备200具体包括:
至少一个处理器201。以及,与至少一个处理器201通信连接的存储器202;其中,存储器202存储有能够被至少一个处理器201执行的指令,以使至少一个处理器201能够执行:
通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出因果事件的因果文本;其中,因果模板包含若干因果对的匹配规则模板;
对因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到因果文本的因果必然性概率以及因果充分性概率;
根据因果必然性概率以及因果充分性概率,将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络;其中,因果网络图为基于因果文本的因果必然性关系以及因果充分性关系所对应生成的;
将泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型;并通过预训练后的因果网络表示学习模型,反映出因果文本中各个语料的真实因果律。
本申请提供了一种基于动词时态的泛化因果网络构建方法、设备及介质,通过对因果事件中包含因果关系的语料进行因果文本的提取,然后根据因果文本中的因果关系的必然性与充分性,构建出能够广泛适用于大规模因果事件的泛化因果网络,并对该泛化因果网络进行网络表示学习,通过训练得到的因果网络表示学习模型,能够更好的反映出因果事件背后深层次的真实因果律,提升了对后续事件推理的预测准确性,减少了因因果知识网络的大量节点所造成的泛化稀疏性特征,能够反映出因果事件中每个语料的真实因果关系,为因果事件的事件预测推理提供了较好的基础支撑。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请的实施例可以有各种更改和变化。凡在本申请实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (9)

1.一种基于动词时态的泛化因果网络构建方法,其特征在于,所述方法包括:
通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本;其中,所述因果模板包含若干因果对的匹配规则模板;
对所述因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到所述因果文本的因果必然性概率以及因果充分性概率;
根据所述因果必然性概率以及因果充分性概率,将预设因果网络图中的节点集合与边集合进行泛化处理,得到泛化因果网络;其中,所述因果网络图为基于所述因果文本的因果必然性关系以及因果充分性关系所对应生成的,具体包括:
根据所述因果必然性概率以及因果充分性概率,对所述因果网络图进行相同集合的分类,得到所述节点集合与所述边集合;其中,所述因果网络图为基于所述因果文本所生成的;
根据,得到所述因果网络图中有关边集合的有向边权重/>;其中,/>为所述因果网络图中节点集合的共现频率,k为所述共现频率的个数,/>为所述节点集合中的原因节点,/>为所述节点集合中的结果节点;
通过所述有关边集合的有向边权重、所述因果必然性概率以及因果充分性概率,对所述因果网络图进行广泛化的因果关系依赖训练,得到所述泛化因果网络;
将所述泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型;并通过预训练后的所述因果网络表示学习模型,反映出所述因果文本中各个语料的真实因果律。
2.根据权利要求1所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,在通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本之前,所述方法还包括:
通过Pattern正则表达匹配规则,对所述因果事件中的因果连接词进行对应匹配训练,得到因果连接词模板;
通过Constraint限制匹配规则,对所述因果事件中的时态语法进行限制性匹配训练,得到语法限制模板;
通过Priority优先事项匹配规则,对所述因果事件中的包含因果关系的语料进行优先级匹配的训练,得到优先级模板;
其中,所述因果模板由所述因果连接词模板、所述语法限制模板以及所述优先级模板组成。
3.根据权利要求1所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,通过预设因果模板,对因果事件中包含因果关系的语料进行识别标注,确定出所述因果事件的因果文本,具体包括:
通过所述因果模板中的若干模板,对所述因果事件中的若干句子语料进行有关因果关系的语料匹配识别,得到包含因果关系的若干因果组对;
对所述若干因果组对进行因果关系判别,得到所述若干因果组对中的原因语句以及对应的结果语句;并对所述原因语句以及对应的结果语句进行一一对应标注,得到标注后的原因文本以及对应的结果文本;
将所述标注后的原因文本以及对应的结果文本确定为所述因果事件的因果文本。
4.根据权利要求1所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,对所述因果文本中动词时态的因果关系进行事件链集合的抽取,计算并得到所述因果文本的因果必然性概率以及因果充分性概率,具体包括:
基于因果关系语料中的语法结构以及谓语动词的时态形式,对所述因果文本进行动词的多种时态形式的抽取分类,生成叙事事件链集合;其中,所述多种时态形式包括:动词时态与主语形式、动词时态与谓语形式以及动词时态与介词形式;所述叙事事件链集合包含了谓语动词、谓语动词的主语、谓语动词的宾语以及谓语动词的间接宾语;
对所述叙事事件链集合中每个语料的动词时态形式进行因果条件处理,得到所述因果文本的因果必然性概率以及因果充分性概率。
5.根据权利要求4所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,对所述叙事事件链集合中每个语料的动词时态形式进行因果条件处理,得到所述因果文本的因果必然性概率以及因果充分性概率,具体包括:
根据,得到所述因果必然性概率/>;其中,/>为所述叙事事件链集合中因果文本的一种因果对,/>为一种原因文本,/>为一种结果文本,p为所述叙事事件链集合中的谓语动词,/>为概率中间量,/>与所述因果文本的因果必然性相关联,/>为所述结果文本中的一种谓语动词值,/>为所述叙事事件链集合中一种谓语动词的因果对;
根据,得到所述因果充分性概率/>;其中,/>为与所述因果文本的因果充分性相关联,/>为所述原因文本中的一种谓语动词值。
6.根据权利要求5所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,根据,得到所述原因文本中的一种谓语动词值/>;其中,W为因果文本中的因果词,/>为权重,M为所述因果文本中因果组对的数量,/>为结果文本的权重,为原因文本/>的概率;
根据,得到所述结果文本中的一种谓语动词值;其中,/>为原因文本中的权重,/>为结果文本/>的概率;
根据,得到所述叙事事件链集合中一种谓语动词的因果对;其中,N为所述叙事事件链集合中因果文本中的语料大小,/>为对一种因果对/>的概率。
7.根据权利要求1所述的一种基于动词时态的泛化因果网络构建方法,其特征在于,将所述泛化因果网络映射到低维连续向量空间中,并进行网络表示学习,得到因果网络表示学习模型,具体包括:
通过预设DeepWalk算法,将与所述泛化因果网络对应的泛化因果网络图进行节点序列的转化,并将转换后的若干节点进行节点的向量嵌入,得到所述若干节点的节点低维向量;
通过所述节点低维向量,将所述泛化因果网络对应的节点映射到低维连续向量空间中,得到所述因果事件的图谱语义信息以及图结构信息;
对所述图谱语义信息以及图结构信息进行模型的网络学习,训练并得到所述因果网络表示学习模型,以通过预训练后的所述因果网络表示学习模型,反映出所述因果文本中各个语料的真实因果律。
8.一种基于动词时态的泛化因果网络构建设备,其特征在于,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有能够被所述至少一个处理器执行的指令,以使所述至少一个处理器能够执行根据权利要求1-7任一项所述的一种基于动词时态的泛化因果网络构建方法。
9.一种非易失性计算机存储介质,其特征在于,所述存储介质为非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有至少一个程序,每个所述程序包括指令,所述指令当被终端执行时,使所述终端执行根据权利要求1-7任一项所述的一种基于动词时态的泛化因果网络构建方法。
CN202310510993.6A 2023-05-09 2023-05-09 一种基于动词时态的泛化因果网络构建方法、设备及介质 Active CN116227601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310510993.6A CN116227601B (zh) 2023-05-09 2023-05-09 一种基于动词时态的泛化因果网络构建方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310510993.6A CN116227601B (zh) 2023-05-09 2023-05-09 一种基于动词时态的泛化因果网络构建方法、设备及介质

Publications (2)

Publication Number Publication Date
CN116227601A CN116227601A (zh) 2023-06-06
CN116227601B true CN116227601B (zh) 2023-07-18

Family

ID=86589550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310510993.6A Active CN116227601B (zh) 2023-05-09 2023-05-09 一种基于动词时态的泛化因果网络构建方法、设备及介质

Country Status (1)

Country Link
CN (1) CN116227601B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901229A (zh) * 2021-09-15 2022-01-07 昆明理工大学 基于句法图卷积的汉越双语新闻事件因果关系抽取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5904559B2 (ja) * 2013-12-20 2016-04-13 国立研究開発法人情報通信研究機構 シナリオ生成装置、及びそのためのコンピュータプログラム
CN106294323B (zh) * 2016-08-10 2020-03-06 上海交通大学 对短文本进行常识性因果推理的方法
CN110781369A (zh) * 2018-07-11 2020-02-11 天津大学 一种基于依存句法和泛化因果网络进行情感原因挖掘方法
CN112149427B (zh) * 2020-10-12 2024-02-02 腾讯科技(深圳)有限公司 动词短语蕴含图谱的构建方法及相关设备
CN112559656A (zh) * 2020-12-09 2021-03-26 河海大学 基于水文事件的事理图谱构建方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901229A (zh) * 2021-09-15 2022-01-07 昆明理工大学 基于句法图卷积的汉越双语新闻事件因果关系抽取方法

Also Published As

Publication number Publication date
CN116227601A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
Umer et al. CNN-based automatic prioritization of bug reports
CN108920654B (zh) 一种问答文本语义匹配的方法和装置
Ellis et al. Unsupervised learning by program synthesis
CN111738004A (zh) 一种命名实体识别模型的训练方法及命名实体识别的方法
CN109460459B (zh) 一种基于日志学习的对话系统自动优化方法
CN103984681A (zh) 基于时序分布信息和主题模型的新闻事件演化分析方法
WO2023137911A1 (zh) 基于小样本语料的意图分类方法、装置及计算机设备
CN107992941A (zh) 一种合同条款分类方法
CN111124487A (zh) 代码克隆检测方法、装置以及电子设备
Gnanasekaran et al. Using Recurrent Neural Networks for Classification of Natural Language-based Non-functional Requirements.
CN112036705A (zh) 一种质检结果数据获取方法、装置及设备
CN116049387A (zh) 一种基于图卷积的短文本分类方法、装置、介质
US20220414344A1 (en) Method and system for generating an intent classifier
Saphra et al. Language models learn POS first
CN116227601B (zh) 一种基于动词时态的泛化因果网络构建方法、设备及介质
Wakchaure et al. A scheme of answer selection in community question answering using machine learning techniques
CN112131879A (zh) 一种关系抽取系统、方法和装置
US20230168989A1 (en) BUSINESS LANGUAGE PROCESSING USING LoQoS AND rb-LSTM
CN116483314A (zh) 一种自动化智能活动图生成方法
CN115269833A (zh) 基于深度语义和多任务学习的事件信息抽取方法及系统
CN114254622A (zh) 一种意图识别方法和装置
CN114239555A (zh) 一种关键词提取模型的训练方法及相关装置
CN113761874A (zh) 事件事实性预测方法、装置、电子设备与存储介质
CN112200268A (zh) 一种基于编码器-解码器框架的图像描述方法
CN110019772B (zh) 一种文本情绪分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant