CN112507691A - 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 - Google Patents
一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 Download PDFInfo
- Publication number
- CN112507691A CN112507691A CN202011435564.XA CN202011435564A CN112507691A CN 112507691 A CN112507691 A CN 112507691A CN 202011435564 A CN202011435564 A CN 202011435564A CN 112507691 A CN112507691 A CN 112507691A
- Authority
- CN
- China
- Prior art keywords
- chain
- entity
- event
- causal
- reasoning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000001364 causal effect Effects 0.000 claims abstract description 95
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 21
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 238000001914 filtration Methods 0.000 claims description 11
- 238000002372 labelling Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 14
- 229910000831 Steel Inorganic materials 0.000 description 9
- 239000010959 steel Substances 0.000 description 9
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 244000068988 Glycine max Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置。该方法包括:利用事件之间的因果关系建立事理逻辑库;基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链;将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链;对实体产业链传导链中的实体进行属性级的情感分析;根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果。本发明充分借助事理演化逻辑和产业链推理逻辑相结合的规则进行推理,充分体现了推理过程的动态性、演化性和传导性,推理结果更具可信度。
Description
技术领域
本发明涉及一种融合情感、产业链和事理逻辑的可解释性标的物生成装置,基于构建好的逻辑推理知识探索一种面向金融标的物的关联推理,属于自然语言处理领域,是一种面向金融领域的可解释性知识推理与标的物生成方法和装置。
背景技术
金融领域是现代经济发展非常重要的一个分支,随着金融市场规模的不断扩大,金融市场建设取得了很大的发展,对整个市场体系的发展都起着重要的作用。如今随着网络化、信息化的快速发展,股指期货、国家政策、国际资本流动等各个事件都会对其产生非常重要的影响。例如,国内外资本市场,衍生品市场热点不断,如“原油跌停”、“智利地震”、“美股暴跌”、“华鑫期货违反法律法规”、“期货公司抵制文华财经”等,这些事件涉及多个金融机构、人物、产品等多类实体,这些都会对市场的变化趋势造成影响。通过舆情分析,寻找这些事件之间的传导关系,对市场产品(国债期货、股指期货)趋势的影响有着重要意义。而且,在不同时期,不同原因事件的变化所带来的结果事件的变化也是不同的,仅仅通过人工对这些影响进行综合分析也不一定会考虑周全,同时对于原因事件对结果事件的影响程度,往往人工也难以进行定量描述。
受限于当前自然语言处理技术的水平,目前围绕事理逻辑推断,在可解释性的知识推理以及标的物生成上还存在以下不足:
1、可解释性差,知识推理的过程没有量化指标,事件推导无法显式进行量化,推理路径无法可视化,使得整个推理过程的可解释性变得很弱。
2、没有充分借助事理演化逻辑和产业链推理逻辑相结合的规则进行推理,动态性、演化性和传导性不够充分。
3、推理规则不充分,没有融合考虑情感、热度、主题等因子,使得推理结果更具可信度。
4、对于基于领域事理逻辑图谱的应用探索相对不足。事理演化逻辑可以与产业链推理逻辑相结合,并且可以支持知识推理路径的生成以及标的物生成等多方面的应用,但目前针对这些技术的应用相对还很不足。
发明内容
针对现有技术中存在的上述技术问题,本发明的目的在于提出一种融合情感、产业链和事理逻辑的可解释性标的物生成方法和装置。
本发明主要通过对金融领域信息进行提取和分析,发现关联线索,对传导关联进行建模,挖掘出市场变动的规律,最终辅助决策。本发明的主要思想是通过对金融领域信息进行提取和推理分析,寻找这些事件以及实体之间的传导关系,对金融事件趋势的影响进行挖掘和预测。基于构建好的逻辑推理知识,融合产业链推理逻辑,探索一种面向金融标的物的关联推理,针对用户输入字符串,经过关联事件识别、事件关联实体识别、事件演化路径推理、产业链推理等模块,结合情感分析结果以及领域专家知识提供事件影响查询,最终生成可解释性的标的物以及推理路径。
本发明采用的技术方案如下:
一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法,包括以下步骤:
利用事件之间的因果关系建立事理逻辑库;
基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链;
将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链;
对实体产业链传导链中的实体进行属性级的情感分析;
根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果。
进一步地,所述利用事件之间的因果关系建立事理逻辑库,其中事件之间的因果关系采用以下两种方式中的至少一种获得:
第一种,基于规则抽取因果关系:通过收集整理因果触发词构建基于触发词的规则模板,利用规则模板实现子句级别的因果关系抽取;
第二种,基于序列标注模型抽取因果关系:采用的模型结构为BERT+BiLSTM+CRF,采用的序列标签为BIO标签体系,标签类型主要为原因、因果触发词、结果。
进一步地,所述基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链,包括;
对用户输入的字符序列进行事件识别,从事理逻辑库中获取相关的相似事件,设定相似度阈值,将高于阈值的事件进行保留,形成目标事件集合;
基于目标事件集合进行深度配置,设定迭代的深度,分别迭代地找出相应的结果事件,并在结果事件中找到下一个结果事件,最终得到一个具有清晰路径的因果逻辑事件链条,即因果事件演化链;
所述的因果事件演化链是具有量化指标的逻辑链,所述量化指标是指借助事件重要程度、事件发生的频率、逻辑触发的影响程度、因果关系的强弱关联程度以及出现次数,对原因事件与结果事件之间的关联关系进行强度计算与排序。
进一步地,所述将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链,包括:
将因果事件演化链与产业链知识库进行关联,同时进行实体过滤的操作,对实体过滤结果进行实体识别与实体链接的过程;
根据实体推理规则进行产业链推导,基于产业链知识库中的实体关联关系,设定迭代推导的深度,形成实体产业链,最后结合产业链知识库中已进行过量化统计更新的实体间的传导权重,形成<实体主体,关联描述,关联实体,关联强度>的四元组集合,从而建立实体产业链传导链。
进一步地,通过所述对实体产业链传导链中的实体进行属性级的情感分析,形成<实体主体,实体属性,实体情感判定结果,情感得分>的四元组集合,完成融合情感的实体关联。
进一步地,所述根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果,包括:
基于实体产业链传导链以及情感分析结果,结合领域专家知识,对最终的影响实体进行推理分析,结合实体关联量化统计更新的传导权重以及属性情感得分,形成<实体主体,实体属性,属性情感,情感得分><实体关联描述><关联实体,关联强度,实体属性,属性情感,情感得分>的实体关联网络;结合领域所关注的标的物列表,对实体关联网络中的实体进行筛选与过滤,得到最终的标的物结果以及标的物的利好/利空的判定。
进一步地,所述根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果,还包括:
针对输入的事件,基于事理逻辑库完成因果逻辑推理模块,然后基于起始的节点事件以及后续影响事件,根据产业链知识库、事理逻辑库、实体关联网络以及影响路径的推理规则进行标的物的影响推理,得到标的物的关联推理结果。
一种采用上述方法的融合情感、产业链和事理逻辑的可解释性金融标的物生成装置,其包括:
因果逻辑推理模块,用于利用事件之间的因果关系建立事理逻辑库,基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链;
产业链逻辑推理模块,用于将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链;
标的物推理生成模块,对实体产业链传导链中的实体进行属性级的情感分析,根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果。
与现有技术相比,本发明具有以下优点:
1、本发明构建了一套大规模的因果逻辑知识库以及产业链逻辑知识库,提高了现有逻辑知识库的逻辑推理能力。
2、本发明充分借助事理演化逻辑和产业链推理逻辑相结合的规则进行推理,充分体现了推理过程的动态性、演化性和传导性。
3、本发明充分融合事件以及实体属性的情感分析等因子,缓解了知识推理过程中的趋势影响不可靠性,使得推理结果更具可信度。
4、本发明提出了一种基于事理演化逻辑与产业链推理逻辑相结合的方法,支持知识推理路径的生成以及标的物生成,从而挖掘出事件之间的传导关系、事件的舆情信息以及该事件下对市场可交易产品趋势的影响。
附图说明
图1为本发明的系统构成图。
图2为因果逻辑推理流程图。
图3为产业链逻辑推理流程图。
图4为标的物推理生成流程图。
具体实施方式
下面结合附图和实施例对本发明做出详细的描述,但本发明并不限定于以下实施方式。
如图1所示,本发明主要包括因果逻辑推理模块、产业链逻辑推理模块以及标的物推理生成模块。本发明涉及的概念包括:
实体,指的是在实际描述文本中被论述的对象,是某一个概念的实例。
实体识别,指的是基于产业链知识库进行的命名实体识别的过程,将想要获取到的实体类型,从事件中识别出来。
实体链接,是通过根据构建的实体属性表和映射关系,对输入的事件进行实体链接,圈定实体类型以及每一类实体下的属性类别,形成多类实体及对应的各自不同维度的属性表。
产业链知识库,指的是面向具体行业,利用行业上下游、主营产品、产品上下游等关联关系,将行业、公司、产品等节点进行关联形成的一类产业推理知识库。
事理逻辑库,指的是因果事理逻辑库,通过事件之间的因果逻辑关系进行组合形成的逻辑知识库,揭示事件之间的演化性。
可解释性关联推理规则,指的是基于起始的节点事件以及后续影响事件,根据产业链知识库、事理逻辑库、实体关联网络以及影响路径的推理规则进行标的物的影响推理,得到标的物的关联推理结果。
金融标的物,指的是可进行交易的产品,比如股票的标的物就是上市公司,期货中比如玉米标的物就是玉米期货,此外还有股指期权,白糖期权等期权标的物。
一.因果逻辑推理模块
图2为因果逻辑推理模块的因果逻辑推理流程图,包括以下步骤:
1、事理逻辑库的构建
因果逻辑知识,是一种以事件为核心,通过事件之间逻辑关系进行组合形成的一类知识,这类知识的目标就是揭示事件之间的一种演化性,在事件关系上主要考虑的是顺承关系和因果关系两种。在因果知识的应用上,具有高可信的因果知识,可以利用事件之间的因果关系和属性之间的关联关系来进行事件的预测,广泛应用于决策支持、事件预测、问答系统、原因分析等多个场景。
根据因果描述语句中是否包含因果触发词(如:导致、造成、...因为...所以等),可将因果三元组(原因,因果触发词,结果)分为显式因果和隐式因果两种类型。对于因果逻辑知识的抽取主要采用以下两种方式,本发明对此的实施方式也不仅限定于以下所述的实施方式:
1)基于规则进行抽取。该方法主要通过收集整理因果触发词、构建基于触发词的规则模板实现子句级别的因果抽取模型。其中,子句为文本中以逗号、分号、句号、问号、叹号切分的最短文本描述句。以规则抽取的结果示例如表1所示。
表1-规则模板及抽取结果示例
2)基于序列标注模型的抽取。本发明采用了BERT+BiLSTM+CRF的模型结构,在序列标签的设计上,模型的序列标签采用BIO标签体系,标签类型主要为cause(原因)、trigger(因果触发词)、effect(结果)。本发明在数据集的构建上采用模板预标注+人工修正的方法构建显式因果数据集。基于规则模型,识别出候选句及其预标注三元组,然后对预标注数据进行人工修正,并对每个句子分别标注出(最长原因描述,触发词,最长结果描述)和(最短原因描述,触发词,最短结果描述)。训练序列标注模型最终使用了10000条数据集,其中7000条为训练集,2000条为测试集,1000条为验证集。在经过序列标注模型识别之后,会得到一系列的序列标签,通过找到cause、trigger、effect标签,得到多个原因序列集合和结果序列集合,然后通过采取就近原则进行抽取等方法来构建基于序列标注结果的因果三元组抽取模板,分析原因描述、触发词、结果描述之间的对应关系,抽取出因果三元组结果。
基于这些实施方式,本发明最终构建并积累了2400万因果逻辑的大规模事理逻辑库。
2、事件识别与事件链接
本发明首先针对输入的事件进行标准化的过程,所述事件标准化,特征在于对原先事件进行分词、词性标注、实体识别处理,结合词性标记及停用词表,移除相应的虚词、标点符号以及时间词,最后得到标准化后的事件字符序列。然后基于事理逻辑库对标准化之后的事件进行事件识别。以当前识别出的事件为事件节点,与事理逻辑库中的历史事件进行匹配,从事理逻辑库中获取与当前事件相匹配的关键词,然后对当前事件和历史事件进行匹配(也就是匹配到的事件与当前事件为同一类型的事件)。
根据本发明的一种实施方式,事件链接是根据匹配到的事件之间的相关性进行聚合以及演化的过程,获取具有因果关系的事件之间的演化链,即图1中的获取因果事件演化链,因果事件演化链包含与当前事件直接或者间接相关的上游原因事件,以及与当前事件直接或者间接相关的下游结果事件。其中,事件分为以下几类:客观陈述事实的客观事件、包含预测词的预测事件(比如:“大概率会发生”、“几乎不可能出现”等)、带有触发词的触发事件(比如:“导致”、“引发”)等不同类型的事件。同时,事件是有重要程度排序的,有重要事件、热点事件、舆情事件等。通过获取事理逻辑库中的历史事件,将具有因果关系的各种事件根据事件之间的影响关系进行推理演化,生成以当前事件为中心节点的因果事理图谱,完成事件链接过程。
3、因果事件演化链的获取
因果事件演化链主要是针对从用户所输入字符序列中进行事件识别,从底层积累的事理逻辑库中获取与此相关的相似事件,设定相似度阈值,将高于阈值的事件进行保留,形成目标事件集合。其次,基于目标事件集合进行深度配置,设定迭代的深度(比如结果事件的拓展深度,即结果事件的层级个数),分别迭代地找出相应的结果事件,并在结果事件中找到下一个结果事件,最终得到一个具有清晰路径的因果逻辑事件链条。
本发明所述的因果事件演化链是具有量化指标因子的逻辑链,所述的量化指标是借助事件重要程度、事件发生的频率、逻辑触发的影响程度、因果关系的强弱关联程度以及出现次数等因素,对原因事件与结果事件之间的关联关系进行强度计算与排序,形成最终的因果事件演化链。
图2中的“因果逻辑对”是指原因事件、结果事件的因果对集合,通过因果事件演化链可以得到一系列具有强弱关联关系的因果逻辑对事件,通过结合后续的产业链知识库、实体关联网络以及影响路径的推理规则进行最终标的物的影响推理。
二.产业链逻辑推理模块
图3为产业链逻辑推理模块的产业链逻辑推理流程图,包括以下内容:
1、产业链知识库
所述产业链知识库,指的是面向具体行业,利用行业上下游、主营产品、产品上下游等关联关系,将行业、公司、产品等节点进行关联形成的一类产业推理知识库。通过构建产业链知识图谱,同时整合并挖掘行业、公司、产品等的基础信息、经营状况、财务状况、风险信息、关联关系等全维度数据,融合产业链上下游的信息,为金融机构提供产业链传导链以及标的物趋势预判。其中,产品上下游具有明显的传导关联关系,产业链中大量存在着上中下游关系和相互价值的交换,上游环节向下游环节输送产品或服务,下游环节向上游环节反馈信息,可以利用知识图谱研究产业链传导和事件驱动、发现重要性事件、分析资讯情感等垂直应用。
产业链是指包含价值链、企业链、供需链的链条式关联关系框架,依据特定的逻辑关系以及布局关系进行对接与组合。产业链的本质是用于描述一个具有某种内在联系的企业群结构,它是一个相对宏观的概念,存在两维属性:结构属性和价值属性。产业链中大量存在着上下游关系和相互价值的交换,上游环节向下游环节输送产品或服务,下游环节向上游环节反馈信息。
产业链数据的积累,是指需要采取多种方法进行产业链数据的抽取和处理,所有抽取和积累的数据需要填充到所构建的产业链逻辑框架里,这样累积的数据才会让整个产业链知识库更加丰富,也才能在今后的任务中更好地发挥作用。
所述产业链数据,主要是资讯的获取,资讯中包括对重大事件的解读,以及关于行业、事件、产品的关键资讯以及行业、公司等实体之间的上下游关联关系。同时增加自动对接多渠道权威数据源的模块,覆盖海量行业研究的产业链数据,并不断进行更新与扩充。
2、实体识别与实体链接
1)实体识别
实体识别是指借助外部领域实体库,对实体描述语句进行实体识别,针对查找出来的事件,对事件进行产业链实体识别,形成关联实体。包括:各大交易所可供交易的大宗商品期货名称集合,可供交易的公司、股票、行业、板块等,行业产业链中的产品、公司、行业、人物等。
2)实体链接
实体链接主要是通过根据构建的实体属性表和映射关系,对输入的事件进行实体链接,首先是圈定实体类型以及每一类实体下的属性类别,主要是采用人工以及规则扩展的方式进行,形成多类实体及其对应的各自不同维度的属性表。比如:实体供需关系包括宏观、供给、需求、库存、加工利润,还有产品实体的成本、价格等维度的属性。最后根据实体识别的结果以及实体属性表的匹配,映射到实体关系库中所对应的实体上,完成实体链接过程。
3、实体产业链游走
在本实施方式中,将因果事件之间的核心指标进行聚合,构造产业链核心的实体产业链传导链,将因果事件演化链与产业链知识库进行关联,同时进行实体过滤的操作,根据过滤规则进行筛选,然后针对实体过滤结果进行所述实体识别与实体链接的过程,最后根据实体推理规则进行产业链推导,基于产业链知识库中的实体关联关系,设定迭代推导的深度(比如实体关联关系推导到第几级),形成实体产业链,最后结合产业链知识库中已进行过量化统计更新的实体间的传导权重,形成<实体主体,关联描述,关联实体,关联强度>的四元组集合,最终完成实体产业链传导链的建立。所述关联强度即已经经过量化统计更新的实体间的传导权重。所述实体间的传导权重,指的是结合外部的经济指标数据所得到的百分比(例如:原材料的成分占比数据、行业之间的消费占比等)。本发明是将事件与产业链知识库进行关联,以事件的关联逻辑进一步延伸至金融领域的关联逻辑,最终基于积累的产业链知识库以及关联推理规则,完成对实体上下游的关联推断。通过对实体所关联的产业链知识库进行推导与判定,完成实体上下游的关联推理,最终得到一个完整的实体产业链传导链。
三.标的物推理生成模块
图4为标的物推理生成模块的标的物推理生成流程图,包括以下内容:
1、融合情感的实体关联
本发明针对事件进行属性级的情感判定,为了在句子级分析的基础上更加细化,需要从文本中抽取对象主体信息,并根据文本的上下文判断每一个属性所表达的是褒义还是贬义的情感,完成属性级的情感分析。属性级的情感分析关注的是关联实体及其属性,目标是挖掘与发现文本在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的三元组观点摘要。
所述三元组的格式可以表示为:(e,a,s,)
e表示情感分析的目标实体,比如:可以是一个具体的实例。
a表示实体e中所关联的属性。
s表示对实体e的a属性的观点中所包含的情感,观点情感可以分为正向(褒义)、负向(贬义)和中性三种分类,同时也可以通过回归算法将情感分析的结果转化为从1级到5级的评价等级。
所述属性级的情感分析,即属性级的情感分类和回归,是指对具体的属性进行情感分析,判断它是褒义、贬义还是中性情感,融合多种方式给属性赋予一个数值化的情感得分,如可以通过程度副词来对情感进行赋值,程度副词分为两种:一是能够增强情感词本身的情感,即情感加强词,比如“很好”会比“好”的情感程度更强,“非常好”会比“很好”强度更大。二是情感减弱词,比如:“没那么好”是褒义倾向,但情感强度比“好”弱很多。若出现增强词,就需要在原赋值的基础上来增加情感得分,同样,若出现了减弱词,就减少对应的情感得分。
构建的因果事件演化链中,比如事件“大豆价格变化趋势(上升或下降)”,“大豆产量变化(增加或减少)”,“大豆消费量变化(增加或减少)”,基于产业链知识库,结合实体产业链结果,对关联实体进行情感判定,并给出情感得分,形成<实体主体,实体属性,实体情感判定结果,情感得分>的四元组集合,完成融合情感的实体关联。
2、基于因果事理逻辑与产业链逻辑的标的物推理路径生成
1)标的物生成与过滤
基于产业链逻辑推理模块构建的实体产业链,融合情感分析的关联结果,依据关联推理规则进行标的物的获取。
关联推理规则是基于实体产业链传导链以及实体属性情感判定结果,结合领域专家知识,对最终的影响实体进行推理分析,结合实体关联量化统计更新的传导权重以及属性情感得分,形成<实体主体,实体属性,属性情感,情感得分><实体关联描述><关联实体,关联强度,实体属性,属性情感,情感得分>的实体关联网络,从而完成影响实体的推理与生成过程。最后,结合领域所关注的标的物列表,对实体关联网络中的实体进行筛选与过滤,得到最终的标的物结果以及标的物的利好/利空的判定。
2)标的物推理路径生成
金融实体影响路径的推理能够根据事件所关联的实体以及关联路径,对目标实体的影响情况进行可能的判定,在给出影响标的物实体的同时,还给出推理路径以及影响类型等结果。
标的物推理生成模块的实现是融合情感分析结果,基于启发式和贪心策略的推理判定最大化算法,得到关联标的物、标的物类型、标的走势以及事理逻辑影响路径。针对输入的事件,基于事理逻辑库完成因果逻辑推理模块,然后基于起始的节点事件以及后续影响事件,根据产业链知识库、事理逻辑库、实体关联网络以及影响路径的推理规则进行标的物的影响推理,得到标的物的关联推理结果。
本发明在推理方面,首先对实体的顺序依赖关系以及实体对之间的路径的复杂关系进行建模,在可解释性的基础上对实体的影响情况进行可能性判定,同时对实体在不同路径下的影响贡献进行评分。基于规则的路径推理方法,需要结合产业链知识库,根据已有的逻辑知识、领域知识以及实体间的关系推理得到关联实体以及影响路径。
以“螺纹钢价格下跌”为例,采用本发明所实施的方式,通过推理,得到了以下效果:
1)“螺纹钢价格下跌”事件推理分析
基于一级事件因果逻辑以及产业链逻辑的处理结果,“螺纹钢价格下跌”这一事件再发生后,导致了“成本端铁矿石暴跌”,两个事件的情感方向均为负向,进一步地,通过这两个事件进行实体识别和链接,分别链接到以“铁矿石”和“螺纹钢”为核心的产业链逻辑图中。“螺纹钢”事件实体的属性“价格”的情感判定为负向,“铁矿石”的实体属性“成本”的情感判定结果也是负向,最后结合领域专家知识、情感判定结果、关联规则推理、影响路径规则推理等处理之后,本发明最终可以针对每一个产业链实体节点都给出一个“利空”和“利好”的趋势预判结果。
2)“螺纹钢价格下跌”事件推理效果
以“螺纹钢价格下跌”这一事件为例,来研究该事件发生后,对整个行业实体以及标的物的影响结果。在逻辑推理和概念描述中的中间知识表示为表2所示。
表2-“螺纹钢价格下跌”关联知识集合
关联实体以及影响推理路径的结果示例如表3所示,本发明使用了“产品”、“公司”等不同类型,对不同类型的影响实体进行了区分,通过将因果逻辑深度以及产业链逻辑都限定为一层进行推理,给出最终标的物的“利好/利空”的情况,并在逻辑推理路径的结果上,用有向箭头拼接的方式进行组织。
表3-“螺纹钢价格下跌”单层逻辑影响推理结果
本发明基于产业链知识库以及事理逻辑库的联合推理,对产业链逻辑推理和因果逻辑影响推理两个策略进行统一,融合两者的优势。在具体实施上,本发明基于事理逻辑库,获取事件的因果事件演化链,再对因果事件演化链的各个事件进行实体识别,并将事件与产业链知识库进行关联,以产业链逻辑推理的生成方式,结合领域专家知识以及情感分析结果,得到标的物的利好、利空影响结果。而且,通过对因果事件演化链以及产业链关联实体链的每一个推理路径进行因果与关联强度的指标量化,使知识推理过程的可度量性和可解释性变得更强,最终生成可解释性的金融标的物以及推理路径。
基于同一发明构思,本发明的另一实施例提供一种电子装置(计算机、服务器、智能手机等),其包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行本发明方法中各步骤的指令。
基于同一发明构思,本发明的另一实施例提供一种计算机可读存储介质(如ROM/RAM、磁盘、光盘),所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现本发明方法的各个步骤。
以上公开的本发明的具体实施例和附图,其目的在于帮助理解本发明的内容并据以实施,本领域的普通技术人员可以理解,在不脱离本发明的精神和范围内,各种替换、变化和修改都是可能的。本发明不应局限于本说明书的实施例和附图所公开的内容,本发明的保护范围以权利要求书界定的范围为准。
Claims (10)
1.一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法,其特征在于,包括以下步骤:
利用事件之间的因果关系建立事理逻辑库;
基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链;
将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链;
对实体产业链传导链中的实体进行属性级的情感分析;
根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果。
2.根据权利要求1所述的方法,其特征在于,所述利用事件之间的因果关系建立事理逻辑库,其中事件之间的因果关系采用以下两种方式中的至少一种获得:
第一种,基于规则抽取因果关系:通过收集整理因果触发词构建基于触发词的规则模板,利用规则模板实现子句级别的因果关系抽取;
第二种,基于序列标注模型抽取因果关系:采用的模型结构为BERT+BiLSTM+CRF,采用的序列标签为BIO标签体系,标签类型主要为原因、因果触发词、结果。
3.根据权利要求1所述的方法,其特征在于,所述基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链,包括;
对用户输入的字符序列进行事件识别,从事理逻辑库中获取相关的相似事件,设定相似度阈值,将高于阈值的事件进行保留,形成目标事件集合;
基于目标事件集合进行深度配置,设定迭代的深度,分别迭代地找出相应的结果事件,并在结果事件中找到下一个结果事件,最终得到一个具有清晰路径的因果逻辑事件链条,即因果事件演化链;
所述的因果事件演化链是具有量化指标的逻辑链,所述量化指标是指借助事件重要程度、事件发生的频率、逻辑触发的影响程度、因果关系的强弱关联程度以及出现次数,对原因事件与结果事件之间的关联关系进行强度计算与排序。
4.根据权利要求1所述的方法,其特征在于,所述将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链,包括:
将因果事件演化链与产业链知识库进行关联,同时进行实体过滤的操作,对实体过滤结果进行实体识别与实体链接的过程;
根据实体推理规则进行产业链推导,基于产业链知识库中的实体关联关系,设定迭代推导的深度,形成实体产业链,最后结合产业链知识库中已进行过量化统计更新的实体间的传导权重,形成<实体主体,关联描述,关联实体,关联强度>的四元组集合,从而建立实体产业链传导链。
5.根据权利要求1所述的方法,其特征在于,通过所述对实体产业链传导链中的实体进行属性级的情感分析,形成<实体主体,实体属性,实体情感判定结果,情感得分>的四元组集合,完成融合情感的实体关联。
6.根据权利要求1所述的方法,其特征在于,所述根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果,包括:
基于实体产业链传导链以及情感分析结果,结合领域专家知识,对最终的影响实体进行推理分析,结合实体关联量化统计更新的传导权重以及属性情感得分,形成<实体主体,实体属性,属性情感,情感得分><实体关联描述><关联实体,关联强度,实体属性,属性情感,情感得分>的实体关联网络;结合领域所关注的标的物列表,对实体关联网络中的实体进行筛选与过滤,得到最终的标的物结果以及标的物的利好/利空的判定。
7.根据权利要求6所述的方法,其特征在于,所述根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果,还包括:
针对输入的事件,基于事理逻辑库完成因果逻辑推理模块,然后基于起始的节点事件以及后续影响事件,根据产业链知识库、事理逻辑库、实体关联网络以及影响路径的推理规则进行标的物的影响推理,得到标的物的关联推理结果。
8.一种采用权利要求1~7中任一权利要求所述方法的一种融合情感、产业链和事理逻辑的可解释性金融标的物生成装置,其特征在于,包括:
因果逻辑推理模块,用于利用事件之间的因果关系建立事理逻辑库,基于事理逻辑库对输入的事件进行事件识别和事件链接,得到因果事件演化链;
产业链逻辑推理模块,用于将因果事件演化链与产业链知识库进行关联,通过实体上下游的关联推理,得到实体产业链传导链;
标的物推理生成模块,对实体产业链传导链中的实体进行属性级的情感分析,根据事理逻辑库、产业链知识库以及情感分析的结果进行金融标的物的影响推理,生成金融标的物及金融标的物的关联推理结果。
9.一种电子装置,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~7中任一权利要求所述方法的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,所述计算机程序被计算机执行时,实现权利要求1~7中任一权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011435564.XA CN112507691A (zh) | 2020-12-07 | 2020-12-07 | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011435564.XA CN112507691A (zh) | 2020-12-07 | 2020-12-07 | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112507691A true CN112507691A (zh) | 2021-03-16 |
Family
ID=74971885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011435564.XA Pending CN112507691A (zh) | 2020-12-07 | 2020-12-07 | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507691A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449116A (zh) * | 2021-06-22 | 2021-09-28 | 青岛海信网络科技股份有限公司 | 一种图谱构建、预警方法、设备及介质 |
CN113722471A (zh) * | 2021-08-30 | 2021-11-30 | 上海明略人工智能(集团)有限公司 | 一种文本摘要生成方法、系统、电子设备及介质 |
CN114492460A (zh) * | 2022-04-08 | 2022-05-13 | 东南大学 | 基于衍生提示学习的事件因果关系抽取方法 |
CN114637766A (zh) * | 2022-05-18 | 2022-06-17 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
CN114676840A (zh) * | 2022-01-27 | 2022-06-28 | 广州数说故事信息科技有限公司 | 一种基于海量数据的因果事理组提取方法、系统及计算机可读存储介质 |
CN116662577A (zh) * | 2023-08-02 | 2023-08-29 | 北京网智天元大数据科技有限公司 | 基于知识图谱的大型语言模型训练方法及装置 |
CN117350386A (zh) * | 2023-12-04 | 2024-01-05 | 南京信息工程大学 | 一种事件溯因推理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107783973A (zh) * | 2016-08-24 | 2018-03-09 | 慧科讯业有限公司 | 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统 |
CN108052576A (zh) * | 2017-12-08 | 2018-05-18 | 国家计算机网络与信息安全管理中心 | 一种事理知识图谱构建方法及系统 |
CN109255034A (zh) * | 2018-08-08 | 2019-01-22 | 数据地平线(广州)科技有限公司 | 一种基于产业链的行业知识图谱构建方法 |
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
CN109726293A (zh) * | 2018-11-14 | 2019-05-07 | 数据地平线(广州)科技有限公司 | 一种因果事件图谱构建方法、系统、装置及存储介质 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111368095A (zh) * | 2020-02-28 | 2020-07-03 | 河海大学 | 基于水利知识-事理耦合网络的决策支持系统架构与方法 |
-
2020
- 2020-12-07 CN CN202011435564.XA patent/CN112507691A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107783973A (zh) * | 2016-08-24 | 2018-03-09 | 慧科讯业有限公司 | 基于行业知识图谱数据库对互联网媒体事件进行监测的方法、装置和系统 |
CN108052576A (zh) * | 2017-12-08 | 2018-05-18 | 国家计算机网络与信息安全管理中心 | 一种事理知识图谱构建方法及系统 |
CN109255034A (zh) * | 2018-08-08 | 2019-01-22 | 数据地平线(广州)科技有限公司 | 一种基于产业链的行业知识图谱构建方法 |
CN109726293A (zh) * | 2018-11-14 | 2019-05-07 | 数据地平线(广州)科技有限公司 | 一种因果事件图谱构建方法、系统、装置及存储介质 |
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
CN110968700A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种融合多类事理与实体知识的领域事件图谱构建方法和装置 |
CN110968699A (zh) * | 2019-11-01 | 2020-04-07 | 数地科技(北京)有限公司 | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 |
CN111368095A (zh) * | 2020-02-28 | 2020-07-03 | 河海大学 | 基于水利知识-事理耦合网络的决策支持系统架构与方法 |
Non-Patent Citations (2)
Title |
---|
FREDERIK HOGENBOOM ET AL: "A Survey of event extraction methods from text for decision support systems", DECISION SUPPORT SYSTEMS, vol. 85, 31 May 2016 (2016-05-31), pages 12 - 22, XP029510068, DOI: 10.1016/j.dss.2016.02.006 * |
刘焕勇 等: "面向开放文本的逻辑推理知识抽取与事件影响推理探索", 中文信息学报, vol. 35, no. 10, 15 October 2021 (2021-10-15), pages 56 - 63 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449116A (zh) * | 2021-06-22 | 2021-09-28 | 青岛海信网络科技股份有限公司 | 一种图谱构建、预警方法、设备及介质 |
CN113722471A (zh) * | 2021-08-30 | 2021-11-30 | 上海明略人工智能(集团)有限公司 | 一种文本摘要生成方法、系统、电子设备及介质 |
CN114676840A (zh) * | 2022-01-27 | 2022-06-28 | 广州数说故事信息科技有限公司 | 一种基于海量数据的因果事理组提取方法、系统及计算机可读存储介质 |
CN114492460A (zh) * | 2022-04-08 | 2022-05-13 | 东南大学 | 基于衍生提示学习的事件因果关系抽取方法 |
CN114492460B (zh) * | 2022-04-08 | 2022-07-12 | 东南大学 | 基于衍生提示学习的事件因果关系抽取方法 |
CN114637766A (zh) * | 2022-05-18 | 2022-06-17 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
CN114637766B (zh) * | 2022-05-18 | 2022-08-26 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
CN116662577A (zh) * | 2023-08-02 | 2023-08-29 | 北京网智天元大数据科技有限公司 | 基于知识图谱的大型语言模型训练方法及装置 |
CN116662577B (zh) * | 2023-08-02 | 2023-11-03 | 北京网智天元大数据科技有限公司 | 基于知识图谱的大型语言模型训练方法及装置 |
CN117350386A (zh) * | 2023-12-04 | 2024-01-05 | 南京信息工程大学 | 一种事件溯因推理方法及系统 |
CN117350386B (zh) * | 2023-12-04 | 2024-03-19 | 南京信息工程大学 | 一种事件溯因推理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507691A (zh) | 一种融合情感、产业链和事理逻辑的可解释性金融标的物生成方法和装置 | |
CN110799981B (zh) | 用于与领域无关的方面级别情绪检测的系统和方法 | |
Tang et al. | Multi-label patent categorization with non-local attention-based graph convolutional network | |
CN105378731A (zh) | 从被回答问题关联语料库/语料值 | |
Liu et al. | Using text mining to establish knowledge graph from accident/incident reports in risk assessment | |
CN107688870B (zh) | 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置 | |
CN109241199B (zh) | 一种面向金融知识图谱发现的方法 | |
CN112861541A (zh) | 一种基于多特征融合的商品评论情感分析方法 | |
CN116468460B (zh) | 基于人工智能的消费金融客户画像识别系统及其方法 | |
CN115687634A (zh) | 一种结合先验知识的金融实体关系抽取系统及方法 | |
CN114265935A (zh) | 一种基于文本挖掘的科技项目立项管理辅助决策方法及系统 | |
Jin et al. | Deepwalk-aware graph convolutional networks | |
CN114817454A (zh) | 一种结合信息量和BERT-BiLSTM-CRF的NLP知识图谱构建方法 | |
CN112100395B (zh) | 一种专家合作可行性分析方法 | |
Yu et al. | An approach for radical innovative design based on cross-domain technology mining in patents | |
Feng et al. | Pre-trained language embedding-based contextual summary and multi-scale transmission network for aspect extraction | |
Sharma et al. | Prediction of Customer Review's Helpfulness Based on Feature Engineering Driven Deep Learning Model | |
CN112667819A (zh) | 一种实体描述推理知识库构建与推理证据量化信息获取方法和装置 | |
AL-Rubaiee et al. | Techniques for improving the labelling process of sentiment analysis in the saudi stock market | |
CN117252186A (zh) | 基于xai的信息处理方法、装置、设备及存储介质 | |
CN117235253A (zh) | 一种基于自然语言处理技术的卡车用户隐性需求挖掘方法 | |
Dziczkowski et al. | An autonomous system designed for automatic detection and rating of film reviews | |
Jishtu et al. | Prediction of the stock market based on machine learning and sentiment analysis | |
Wang et al. | Methods for Acquiring and Incorporating Knowledge into Stock Price Prediction: A Survey | |
Punetha et al. | Sentiment analysis of stock prices and News Headlines using the MCDM Framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220712 Address after: Room 888-6, building 4, artificial intelligence Industrial Park, No. 266, Chuangyan Road, Qilin science and Technology Innovation Park, Nanjing, Jiangsu 211100 Applicant after: Digital workshop (Nanjing) Technology Co.,Ltd. Address before: 100080 v21, 17 / F, 1 Zhongguancun Street, Haidian District, Beijing Applicant before: Digital technology (Beijing) Co.,Ltd. |
|
TA01 | Transfer of patent application right |