CN107908633A - 一种基于知识图谱的财经事件推理方法 - Google Patents

一种基于知识图谱的财经事件推理方法 Download PDF

Info

Publication number
CN107908633A
CN107908633A CN201710627133.5A CN201710627133A CN107908633A CN 107908633 A CN107908633 A CN 107908633A CN 201710627133 A CN201710627133 A CN 201710627133A CN 107908633 A CN107908633 A CN 107908633A
Authority
CN
China
Prior art keywords
event
knowledge
company
relation
finance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710627133.5A
Other languages
English (en)
Inventor
姜赢
潘浩
杨静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University Zhuhai
Original Assignee
Beijing Normal University Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University Zhuhai filed Critical Beijing Normal University Zhuhai
Priority to CN201710627133.5A priority Critical patent/CN107908633A/zh
Publication of CN107908633A publication Critical patent/CN107908633A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/041Abduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于知识图谱的财经事件推理方法,首先从财经数据中抽取本体三元组搭建知识图谱,然后将一些经济客观规律及财经专家的先验知识整理成财经推理规则,并将其编写为机器可以识别和运算的代码,最后分别将本体文件及推理规则导入到数据库,通过操作数据库调用规则实现从数据到其影响的具体行业或公司的推理。

Description

一种基于知识图谱的财经事件推理方法
技术领域
本发明涉及财经趋势预测方法领域,更具体地,涉及一种基于知识图谱的财经事件推理方法。
背景技术
随着市场经济竞争日趋激烈,一个企业要想赢得市场、求得生存和良好的发展,必须最大限度地减少企业经营决策的失误,而这又基于决策者对未来市场较为准确的判断,这就要求决策者应用科学的统计预测方法,尽最大可能减少决策者犯错的概率。因此,信息分析与预测在企业财经决策中的作用越来越大。现有方案主要利用输入输出等观测变量辨识和估计未知参数,建立自变量和因变量之间较为准确的数学模型或统计模型,以分析系统特征的过程,从而对经济趋势进行预测。根据物理背景、系统特性的不同,采用不同的数学方法估计模型参数,称之为理性主义学派方案。还有另一种方案是根据中国经济运行规律、国家宏观调控政策以及国内外发展历史与现状,凭借个人经验或集体智慧,对经济趋势进行预测,称之为经验主义学派方案。
现有技术主要缺陷在于:(1)理性主义学派方案中数据的采集比较困难,往往要经历较长的时间周期。经济问题无论是研究的角度、影响因素还是自身的变化规律都具有诸多随机性和不可测性,因此收集什么样的数据,多长时间采样一个数据,数据的遍历性和关联关系如何认定等都比较复杂;(2)经济问题影响因素和边界条件难以把握。和工业过程或机械过程不同,经济问题如社会问题一样,容易受政策因素、自然因素和战争因素等的影响,所谓的蝴蝶效应就指出了经济不确定性的实质。所以,经济变化的规律往往具有突变性,往往因外部干扰,其发展特征、速度、规模以及效率等可能会和前期发生截然变化,目前缺乏较好解决方法。(3)经验学派方案普遍存在主观性和片面性等问题。
发明内容
本发明为提供一种具有较强的客观性与透明性基于知识图谱的财经事件推理方法。
为了达到上述技术效果,本发明的技术方案如下:
一种基于知识图谱的财经事件推理方法,包括以下步骤:
S1:搭建一个财经知识图谱;
S2:为搭建的财经知识图谱编写财经推理规则;
S3:根据财经推理规则确定不同事件类型的推理逻辑;
S4:将规则用计算机语言进行编写,以便机器识别处理。
进一步地,所述步骤S1的具体过程如下:
S11:根据推理涉及的财经领域范围设计财经知识图谱;
S12:将财经知识图谱进行知识分类,在财经知识图谱中建立事件类,财经事件的推理以事件为起点,将事件类按照事件类型进行划分,将知识分类往下进行一层层细化为子类,整体分类呈树状结构延伸;
S13:根据不同的知识分类建立知识关系Object Property,每条知识关系包括了关系的定义域Domain、值域Range,为每个类都建立全面的知识关系,充分的知识关系是实现推理的基础;
S14:提取出数据中的事件知识点,以事件知识点作为区分条件按照S12中建立的事件知识分类对数据进行初步划分,在数据进行初步归类后,根据S13步骤中建立的知识关系将每条数据进行进一步的提取和整理。将事件知识点作为提取的所有三元组中的主语subject,根据对事件的归类并根据S13中针对不同类定义的不同知识关系objectproperty从数据中提取相应的知识点作为三元组中的宾语,比如在这条数据中事件的发生地点是哪里,事件涉及的相关公司有哪些,就将一条数据整理为多个以事件知识点为主语的三元组的集合,格式为<event>-><object property>-><individual>;
S15:将整理后的财经事件三元组按照相应的知识分类放入知识图谱中,完成财经知识图谱的构建。
进一步地,所述步骤S2的具体过程如下:
S21:定义推理规则,财经推理规则rule用于对财经事件进行推理,以财经事件知识点event为已知条件推理到财经知识图谱中具体的公司知识点company,每条规则拥有一个或多个附属条件condition,条件由财经知识图谱中的对象属性Object Property组成;
S22:对要编写的规则进行基本的分类;
S23:通过整理知识分类中的知识关系Object Property成为推理规则。
进一步地,所述步骤S22的过程是:
S221:规则按照不同的事件类来划分,针对不同类型的事件定制推理规则的逻辑,规则只能用于指定的事件类型推理,以达到对规则的适用范围进行约束的目的,避免在推理时规则的混用;
S222:为知识图谱中所有事件类中的知识点都设定一个属性为“事件类型是”,再将所有的事件类型作为知识点单独存放在一个类中,当事件知识点存入知识图谱时,就建立好这条知识关系,格式为<event>-><事件类型是>-><event type>;
S223:将S222中的知识关系总结在某规则rule1中作为其中一个约束条件condition1,则rule1只能用于condition1中的事件类型。
进一步地,所述步骤S23的过程是:
S231:将知识图谱中知识点间的知识关系作为规则下附属的条件,当一个已知事件变量event1(其事件类型是event type1)放入知识图谱中并构建完成其知识关系ObjectProperty1,Object Property2...;
S232:定义一个规则rule2,知识关系Object Property1,Object Property2...分别为规则中的条件condition1,condition2...对事件类型是event type1的事件使用这个规则,就能从事件变量event通过其知识关系推理到其他知识点;
S233:规定:在推理流程中,以“事件”知识点为推理的起点,“公司”知识点为推理的结果。比如事件知识点“event1”与行业知识点“industry1”间存在知识关系“ObjectProperty1”;行业知识点“industry1”与公司知识点“company1”间存在知识关系“ObjectProperty2”,则认为事件知识点“event1”与公司知识点“company1”存在某种关系,推理结果表达式为:<event1>-><industry1>-><company1>。
进一步地,所述步骤S3的过程是:
S31:针对事件中涉及的地区来进行推理,出现针对某个具体地区的事件时,则按照事件和地区的关系进行推理;
S32:针对事件中涉及的人物来进行推理,如果出现针对某个具体人物的事件时,就围绕人物建立的知识关系实现推理;
S33:针对事件中涉及的行业来进行推理,如果出现针对某个具体行业的事件时,直接通过事件关联行业再关联到行业中具体的公司;
S34:针对事件中涉及的公司来进行推理,如果出现针对某个具体公司的事件时,通过公司与公司当前的竞争情况作为线索进行推理;
S35:针对事件中涉及的产品来进行推理,如果出现针对某个具体产品的事件时,围绕这个产品来实现对产品相关公司的推理。
进一步地,所述步骤S31的过程是:
S311:首先对此条数据进行三元组抽取,提取事件知识点event1并将其放在区域事件类下面即每一类事件都需要首先提取事件知识点,之后需要把事件关联到具体的地区,于是再从数据中抽取地区知识点location1并将其放在相应的行政区域类下面;
S312:创建一个对象属性Object Property1专门用于建立事件和地区之间的知识关系即不同事件的相同对象属性,对象属性只用建立一次,将事件知识点与此事件针对的地区建立联系<event1>-><object property1>-><location1>;
S313:再创建一个对象属性Object Property2专门用于建立地区和公司之间的知识关系,将地区知识点location1与在这个地区的公司变量company建立知识关系<company>-><object property2>-><location1>;
S314:再将事件中涉及到的重要知识点提取出来与此地区建立联系。比如此事件中某行业industry1是受主要影响的部分,则抽取“industry1”这个知识点放入行业知识分类中,建立一个对象属性Object Property3专门用于建立公司知识点与其所属行业之间的知识关系,将行业知识点industry1与此行业的公司变量company建立知识关系<company>-><object property3>-><industry1>;
S315:将所有的object property按照S232中的方法整理为规则rule1,此类型事件推理结果表达式为:<event>-><location>-><industry>-><company>。
进一步地,所述步骤S32的过程是:
S321:首先对数据进行知识点抽取,提取出事件知识点event2和人物知识点person1,将人物知识点放入到相应的人物类型分类中;
S322:创建一个对象属性Object Property4专门用于建立事件和人物之间的知识关系,将event2与person1建立知识关系<event2>-><objectproperty4>-><person1>;
S323:将person1和与person1有利益相关的公司变量company或会受person1言行巨大影响的行业变量industry按照S322中的形式建立人物与行业或公司的对象属性从而建立知识关系,建立的知识关系如下:<company>-><objectproperty>-><person1>或<industry>-><object property>-><person1>;
S324:将所有的object property按照S232中的方法整理为规则rule2,此类型事件推理结果表达式为:<event>-><person>-><industry>-><company>或<event>-><person>-><company>;
S325:从数据中抽取事件知识点event3和行业知识点industry2,创建一个对象属性Object Property5专门用于建立事件和行业之间的知识关系,建立的知识关系如下:<event3>-><object property5>-><industry2>,再按照S314中的对象属性建立公司与行业之间的知识关系;
S326:将所有的object property按照S232中的方法整理为规则rule3,此类型事件推理结果表达式为:<event>-><industry>-><company>。
进一步地,所述步骤S34的过程是:
S341:提取事件event4和公司company2知识点,将事件与公司通过建立相应对象属性从而建立知识关系<event4>-><object property6>-><company2>,再创建一个对象属性Object Property7专门用于建立有竞争关系的公司间的知识关系,设竞争公司变量为competitor,建立的知识关系如下:<company2>-><objectproperty7>-><competitor>;
S342:将所有的object property按照S232中的方法整理为规则rule4,此类型事件推理结果表达式为:<event>-><company>-><competitor>。
进一步地,所述步骤S35的过程是:
S351:首先在数据中提取事event5和产品product1两个知识点并放入相应知识分类;
S352:创建一个对象属性Object Property8专门用于建立事件和产品之间的知识关系,将event5和product1建立关系如下:<event5>-><objectproperty8>-><product1>;
S353:将产品的推理方向分为两个,第一个是将产品与生产产品的公司建立关系:创建一个对象属性Object Property9专门用于建立产品知识点product1和生产此产品公司变量company之间的知识关系:<product1>-><objectproperty9>-><company>,由此推理出这些具体的公司;
S354:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><company>;
S355:产品推理的第二个方向是将产品与其所需的原材料建立关系:创建一个对象属性Object Property10专门用于建立产品知识点product1和生产此产品的原材料变量material之间的知识关系:<product1>-><objectproperty10>-><material>,再将原材料变量material与生产原材料的公司变量company建立关系:<material>-><objectproperty>-><company>;
S356:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><material>-><company>。
与现有技术相比,本发明技术方案的有益效果是:
本发明提供一种基于知识图谱的财经事件推理方法,首先从财经数据中抽取本体三元组搭建知识图谱,然后将一些经济客观规律及财经专家的先验知识整理成财经推理规则,并将其编写为机器可以识别和运算的代码,最后分别将本体文件及推理规则导入到数据库,通过操作数据库调用规则实现从数据到其影响的具体行业或公司的推理。
附图说明
图1为本发明方法的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于知识图谱的财经事件推理方法,包括以下步骤:
S1:搭建一个财经知识图谱;
S2:为搭建的财经知识图谱编写财经推理规则;
S3:根据财经推理规则确定不同事件类型的推理逻辑;
S4:将规则用计算机语言进行编写,以便机器识别处理。
步骤S1的具体过程如下:
S11:根据推理涉及的财经领域范围设计财经知识图谱;
S12:将财经知识图谱进行知识分类,在财经知识图谱中建立事件类,财经事件的推理以事件为起点,将事件类按照事件类型进行划分,将知识分类往下进行一层层细化为子类,整体分类呈树状结构延伸;
S13:根据不同的知识分类建立知识关系Object Property,每条知识关系包括了关系的定义域Domain、值域Range,为每个类都建立全面的知识关系,充分的知识关系是实现推理的基础;
S14:提取出数据中的事件知识点,以事件知识点作为区分条件按照S12中建立的事件知识分类对数据进行初步划分,在数据进行初步归类后,根据S13步骤中建立的知识关系将每条数据进行进一步的提取和整理。将事件知识点作为提取的所有三元组中的主语subject,根据对事件的归类并根据S13中针对不同类定义的不同知识关系objectproperty从数据中提取相应的知识点作为三元组中的宾语,比如在这条数据中事件的发生地点是哪里,事件涉及的相关公司有哪些,就将一条数据整理为多个以事件知识点为主语的三元组的集合,格式为<event>-><object property>-><individual>;
S15:将整理后的财经事件三元组按照相应的知识分类放入知识图谱中,完成财经知识图谱的构建。
步骤S2的具体过程如下:
S21:定义推理规则,财经推理规则rule用于对财经事件进行推理,以财经事件知识点event为已知条件推理到财经知识图谱中具体的公司知识点company,每条规则拥有一个或多个附属条件condition,条件由财经知识图谱中的对象属性Object Property组成;
S22:对要编写的规则进行基本的分类;
S23:通过整理知识分类中的知识关系Object Property成为推理规则。
进一步地,所述步骤S22的过程是:
S221:规则按照不同的事件类来划分,针对不同类型的事件定制推理规则的逻辑,规则只能用于指定的事件类型推理,以达到对规则的适用范围进行约束的目的,避免在推理时规则的混用;
S222:为知识图谱中所有事件类中的知识点都设定一个属性为“事件类型是”,再将所有的事件类型作为知识点单独存放在一个类中,当事件知识点存入知识图谱时,就建立好这条知识关系,格式为<event>-><事件类型是>-><event type>;
S223:将S222中的知识关系总结在某规则rule1中作为其中一个约束条件condition1,则rule1只能用于condition1中的事件类型。
步骤S23的过程是:
S231:将知识图谱中知识点间的知识关系作为规则下附属的条件,当一个已知事件变量event1(其事件类型是event type1)放入知识图谱中并构建完成其知识关系ObjectProperty1,Object Property2...;
S232:定义一个规则rule2,知识关系Object Property1,Object Property2...分别为规则中的条件condition1,condition2...对事件类型是event type1的事件使用这个规则,就能从事件变量event通过其知识关系推理到其他知识点;
S233:规定:在推理流程中,以“事件”知识点为推理的起点,“公司”知识点为推理的结果。比如事件知识点“event1”与行业知识点“industry1”间存在知识关系“ObjectProperty1”;行业知识点“industry1”与公司知识点“company1”间存在知识关系“ObjectProperty2”,则认为事件知识点“event1”与公司知识点“company1”存在某种关系,推理结果表达式为:<event1>-><industry1>-><company1>。
步骤S3的过程是:
S31:针对事件中涉及的地区来进行推理,出现针对某个具体地区的事件时,则按照事件和地区的关系进行推理;
S32:针对事件中涉及的人物来进行推理,如果出现针对某个具体人物的事件时,就围绕人物建立的知识关系实现推理;
S33:针对事件中涉及的行业来进行推理,如果出现针对某个具体行业的事件时,直接通过事件关联行业再关联到行业中具体的公司;
S34:针对事件中涉及的公司来进行推理,如果出现针对某个具体公司的事件时,通过公司与公司当前的竞争情况作为线索进行推理;
S35:针对事件中涉及的产品来进行推理,如果出现针对某个具体产品的事件时,围绕这个产品来实现对产品相关公司的推理。
步骤S31的过程是:
S311:首先对此条数据进行三元组抽取,提取事件知识点event1并将其放在区域事件类下面即每一类事件都需要首先提取事件知识点,之后需要把事件关联到具体的地区,于是再从数据中抽取地区知识点location1并将其放在相应的行政区域类下面;
S312:创建一个对象属性Object Property1专门用于建立事件和地区之间的知识关系即不同事件的相同对象属性,对象属性只用建立一次,将事件知识点与此事件针对的地区建立联系<event1>-><object property1>-><location1>;
S313:再创建一个对象属性Object Property2专门用于建立地区和公司之间的知识关系,将地区知识点location1与在这个地区的公司变量company建立知识关系<company>-><object property2>-><location1>;
S314:再将事件中涉及到的重要知识点提取出来与此地区建立联系。比如此事件中某行业industry1是受主要影响的部分,则抽取“industry1”这个知识点放入行业知识分类中,建立一个对象属性Object Property3专门用于建立公司知识点与其所属行业之间的知识关系,将行业知识点industry1与此行业的公司变量company建立知识关系<company>-><object property3>-><industry1>;
S315:将所有的object property按照S232中的方法整理为规则rule1,此类型事件推理结果表达式为:<event>-><location>-><industry>-><company>。
进一步地,所述步骤S32的过程是:
S321:首先对数据进行知识点抽取,提取出事件知识点event2和人物知识点person1,将人物知识点放入到相应的人物类型分类中;
S322:创建一个对象属性Object Property4专门用于建立事件和人物之间的知识关系,将event2与person1建立知识关系<event2>-><objectproperty4>-><person1>;
S323:将person1和与person1有利益相关的公司变量company或会受person1言行巨大影响的行业变量industry按照S322中的形式建立人物与行业或公司的对象属性从而建立知识关系,建立的知识关系如下:<company>-><objectproperty>-><person1>或<industry>-><object property>-><person1>;
S324:将所有的object property按照S232中的方法整理为规则rule2,此类型事件推理结果表达式为:<event>-><person>-><industry>-><company>或<event>-><person>-><company>;
S325:从数据中抽取事件知识点event3和行业知识点industry2,创建一个对象属性Object Property5专门用于建立事件和行业之间的知识关系,建立的知识关系如下:<event3>-><object property5>-><industry2>,再按照S314中的对象属性建立公司与行业之间的知识关系;
S326:将所有的object property按照S232中的方法整理为规则rule3,此类型事件推理结果表达式为:<event>-><industry>-><company>。
步骤S34的过程是:
S341:提取事件event4和公司company2知识点,将事件与公司通过建立相应对象属性从而建立知识关系<event4>-><object property6>-><company2>,再创建一个对象属性Object Property7专门用于建立有竞争关系的公司间的知识关系,设竞争公司变量为competitor,建立的知识关系如下:<company2>-><objectproperty7>-><competitor>;
S342:将所有的object property按照S232中的方法整理为规则rule4,此类型事件推理结果表达式为:<event>-><company>-><competitor>。
步骤S35的过程是:
S351:首先在数据中提取事event5和产品product1两个知识点并放入相应知识分类;
S352:创建一个对象属性Object Property8专门用于建立事件和产品之间的知识关系,将event5和product1建立关系如下:<event5>-><objectproperty8>-><product1>;
S353:将产品的推理方向分为两个,第一个是将产品与生产产品的公司建立关系:创建一个对象属性Object Property9专门用于建立产品知识点product1和生产此产品公司变量company之间的知识关系:<product1>-><objectproperty9>-><company>,由此推理出这些具体的公司;
S354:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><company>;
S355:产品推理的第二个方向是将产品与其所需的原材料建立关系:创建一个对象属性Object Property10专门用于建立产品知识点product1和生产此产品的原材料变量material之间的知识关系:<product1>-><objectproperty10>-><material>,再将原材料变量material与生产原材料的公司变量company建立关系:<material>-><objectproperty>-><company>;
S356:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><material>-><company>。
针对五种类型的推理一一举例:
针对地区事件进行推理
以自然灾害类事件为例,大型的自然灾害类型事件发生的地区与此事件最终的影响结果有很大关系,而发生灾害地区所有的主要产业与最终的影响方向也有很大关系,于是总结出这样一条规则:“若某特定地区发生某重大事件,事件类型为自然灾害,则此地区的主要产业会受到影响,从而影响到对应产业对应地区的公司。”
对应Prolog规则如下:
此规则由两个规则嵌套而成,‘b’规则中先定义事件,位置和行业三个变量,再根据条件语句进行查询。在“(q?event!fo:事件类型是!fo:自然灾害类型)”这个约束条件中:‘q’为进行查询的谓词,‘?event’为定义的事件变量,‘!fo:’是利用自定义命名空间的方式来缩写URI。
这样一来,查询了符合“事件的事件类型是自然灾害类型”这个条件的事件,如:“四川汶川地震(主语)——事件类型是(谓语)——自然灾害类型(客体)”这个三元组就能够通过这个条件查出。
b规则通过图中三个组合的条件语句查询到相应事件,位置,产业的集合,之后将查询到的结果集放到c规则中作为一个已知条件,再在c规则中加入“(q?company!in:属于的行业是?industry)(q?company!fo:所在的位置是?location)”两个条件就能够查询属于规则b推理结果中的行业并且属于规则b推理结果中的位置的公司。
同时,在规则中再加入一个限定事件类型的条件“(q?event!fo:事件类型是!fo:自然灾害类型)”,可以更加精确的限定规则使用的范围,避免具有相似关系但属于不同类型的新闻错用同一条规则。
以“08年四川汶川地震”这条新闻为例,从这个数据中提取“08年四川汶川地震”作为事件知识点,“四川”和“汶川”作为地区知识点,建立对象属性“主要产业是”,通过关联知识关系1找出(四川——主要产业是——钢铁业),建立对象属性“所在的位置是”,通过关联知识关系2找出在四川的公司,如(攀钢集团——所在的位置是——四川),找出同时满足知识关系1和2的公司,利用自然灾害类事件规则进行推理,相应的推理链条如下:
08年四川汶川地震(event)->四川省(location)->钢铁业(industry)->攀钢集团(company)
针对人物进行推理
选取“百度钱包负责人章政华因个人原因离职,高管层面动荡不断”这条新闻作为例子分析,首先提取“百度钱包章政华离职”作为事件知识点,“章政华”作为人物知识点。建立对象属性“有重大关联的公司是”,从而建立知识关系(章政华——有重大关联的公司是——百度);建立对象属性“有重大关联的行业是”,从而建立知识关系(章政华——有重大关联的行业是——在线支付),相应的推理链条如下:
百度钱包章政华离职(event)->章政华(person)->百度(company)
百度钱包章政华离职(event)->章政华(person)->在线支付(industry)->阿里巴巴(company)
针对行业进行推理
选取“4月份我国钢铁价格回暖”这条新闻作为例子分析,首先提取“4月份我国钢铁价格回暖”作为事件知识点,“钢铁业”作为行业知识点。分别建立对象属性“涉及的行业”和“所属的行业是”用于关联相应知识点:(4月份我国钢铁价格回暖——涉及的行业——钢铁业)&(攀钢集团——所属的行业是——钢铁业),相应的推理链条如下:
4月份我国钢铁价格回暖(event)->钢铁业(industry)->攀钢集团(company)
针对公司进行推理
选取“滴滴收购优步中国”这条新闻作为例子分析,首先提取“滴滴收购优步中国”作为事件知识点,“滴滴出行”和“优步中国”作为公司知识点。分别建立对象属性“涉及的公司”和“竞争关系的公司有”用于关联相应知识点:(滴滴收购优步中国——涉及的公司——滴滴出行&优步中国)&(滴滴出行&优步中国——竞争关系的公司有——易到用车),相应的推理链条如下:
滴滴收购优步中国(event)->滴滴出行&优步中国(company)->易到用车(company)
针对产品进行推理
选取“国产c919大型客机成功首飞”这条新闻作为例子分析,首先提取“国产c919大型客机成功首飞”作为事件知识点,“C919飞机”作为产品知识点。分别建立对象属性“涉及的产品”和“主要产品是”用于关联相应知识点:(国产c919大型客机成功首飞——涉及的产品——C919飞机)&(中国商飞集团——主要产品是——C919飞机);或者再建立对象属性“原材料供应商有”,关联相应知识点:(C919飞机——原材料供应商有——博云新材),相应的推理链条如下:
国产c919大型客机成功首飞(event)->C919飞机(product)->中国商飞集团(company)
国产c919大型客机成功首飞(event)->C919飞机(product)->航空材料(material)->博云新材(company)
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种基于知识图谱的财经事件推理方法,其特征在于,包括以下步骤:
S1:搭建一个财经知识图谱;
S2:为搭建的财经知识图谱编写财经推理规则;
S3:根据财经推理规则确定不同事件类型的推理逻辑;
S4:将规则用计算机语言进行编写,以便机器识别处理。
2.根据权利要求1所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S1的具体过程如下:
S11:根据推理涉及的财经领域范围设计财经知识图谱;
S12:将财经知识图谱进行知识分类,在财经知识图谱中建立事件类,财经事件的推理以事件为起点,将事件类按照事件类型进行划分,将知识分类往下进行一层层细化为子类,整体分类呈树状结构延伸;
S13:根据不同的知识分类建立知识关系Object Property,每条知识关系包括了关系的定义域Domain、值域Range,为每个类都建立全面的知识关系,充分的知识关系是实现推理的基础;
S14:提取出数据中的事件知识点,以事件知识点作为区分条件按照S12中建立的事件知识分类对数据进行初步划分,在数据进行初步归类后,根据S13步骤中建立的知识关系将每条数据进行进一步的提取和整理。将事件知识点作为提取的所有三元组中的主语subject,根据对事件的归类并根据S13中针对不同类定义的不同知识关系objectproperty从数据中提取相应的知识点作为三元组中的宾语,比如在这条数据中事件的发生地点是哪里,事件涉及的相关公司有哪些,就将一条数据整理为多个以事件知识点为主语的三元组的集合,格式为<event>-><object property>-><individual>;
S15:将整理后的财经事件三元组按照相应的知识分类放入知识图谱中,完成财经知识图谱的构建。
3.根据权利要求2所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S2的具体过程如下:
S21:定义推理规则,财经推理规则rule用于对财经事件进行推理,以财经事件知识点event为已知条件推理到财经知识图谱中具体的公司知识点company,每条规则拥有一个或多个附属条件condition,条件由财经知识图谱中的对象属性Object Property组成;
S22:对要编写的规则进行基本的分类;
S23:通过整理知识分类中的知识关系Object Property成为推理规则。
4.根据权利要求3所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S22的过程是:
S221:规则按照不同的事件类来划分,针对不同类型的事件定制推理规则的逻辑,规则只能用于指定的事件类型推理,以达到对规则的适用范围进行约束的目的,避免在推理时规则的混用;
S222:为知识图谱中所有事件类中的知识点都设定一个属性为“事件类型是”,再将所有的事件类型作为知识点单独存放在一个类中,当事件知识点存入知识图谱时,就建立好这条知识关系,格式为<event>-><事件类型是>-><event type>;
S223:将S222中的知识关系总结在某规则rule1中作为其中一个约束条件condition1,则rule1只能用于condition1中的事件类型。
5.根据权利要求4所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S23的过程是:
S231:将知识图谱中知识点间的知识关系作为规则下附属的条件,当一个已知事件变量event1(其事件类型是event type1)放入知识图谱中并构建完成其知识关系ObjectProperty1,Object Property2...;
S232:定义一个规则rule2,知识关系Object Property1,Object Property2...分别为规则中的条件condition1,condition2...对事件类型是event type1的事件使用这个规则,就能从事件变量event通过其知识关系推理到其他知识点;
S233:规定:在推理流程中,以“事件”知识点为推理的起点,“公司”知识点为推理的结果。比如事件知识点“event1”与行业知识点“industry1”间存在知识关系“ObjectProperty1”;行业知识点“industry1”与公司知识点“company1”间存在知识关系“ObjectProperty2”,则认为事件知识点“event1”与公司知识点“company1”存在某种关系,推理结果表达式为:<event1>-><industry1>-><company1>。
6.根据权利要求5所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S3的过程是:
S31:针对事件中涉及的地区来进行推理,出现针对某个具体地区的事件时,则按照事件和地区的关系进行推理;
S32:针对事件中涉及的人物来进行推理,如果出现针对某个具体人物的事件时,就围绕人物建立的知识关系实现推理;
S33:针对事件中涉及的行业来进行推理,如果出现针对某个具体行业的事件时,直接通过事件关联行业再关联到行业中具体的公司;
S34:针对事件中涉及的公司来进行推理,如果出现针对某个具体公司的事件时,通过公司与公司当前的竞争情况作为线索进行推理;
S35:针对事件中涉及的产品来进行推理,如果出现针对某个具体产品的事件时,围绕这个产品来实现对产品相关公司的推理。
7.根据权利要求6所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S31的过程是:
S311:首先对此条数据进行三元组抽取,提取事件知识点event1并将其放在区域事件类下面即每一类事件都需要首先提取事件知识点,之后需要把事件关联到具体的地区,于是再从数据中抽取地区知识点location1并将其放在相应的行政区域类下面;
S312:创建一个对象属性Object Property1专门用于建立事件和地区之间的知识关系即不同事件的相同对象属性,对象属性只用建立一次,将事件知识点与此事件针对的地区建立联系<event1>-><object property1>-><location1>;
S313:再创建一个对象属性Object Property2专门用于建立地区和公司之间的知识关系,将地区知识点location1与在这个地区的公司变量company建立知识关系<company>-><object property2>-><location1>;
S314:再将事件中涉及到的重要知识点提取出来与此地区建立联系。比如此事件中某行业industry1是受主要影响的部分,则抽取“industry1”这个知识点放入行业知识分类中,建立一个对象属性Object Property3专门用于建立公司知识点与其所属行业之间的知识关系,将行业知识点industry1与此行业的公司变量company建立知识关系<company>-><object property3>-><industry1>;
S315:将所有的object property按照S232中的方法整理为规则rule1,此类型事件推理结果表达式为:<event>-><location>-><industry>-><company>。
8.根据权利要求7所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S32的过程是:
S321:首先对数据进行知识点抽取,提取出事件知识点event2和人物知识点person1,将人物知识点放入到相应的人物类型分类中;
S322:创建一个对象属性Object Property4专门用于建立事件和人物之间的知识关系,将event2与person1建立知识关系<event2>-><object property4>-><person1>;
S323:将person1和与person1有利益相关的公司变量company或会受person1言行巨大影响的行业变量industry按照S322中的形式建立人物与行业或公司的对象属性从而建立知识关系,建立的知识关系如下:<company>-><object property>-><person1>或<industry>-><object property>-><person1>;
S324:将所有的object property按照S232中的方法整理为规则rule2,此类型事件推理结果表达式为:<event>-><person>-><industry>-><company>或<event>-><person>-><company>;
S325:从数据中抽取事件知识点event3和行业知识点industry2,创建一个对象属性Object Property5专门用于建立事件和行业之间的知识关系,建立的知识关系如下:<event3>-><object property5>-><industry2>,再按照S314中的对象属性建立公司与行业之间的知识关系;
S326:将所有的object property按照S232中的方法整理为规则rule3,此类型事件推理结果表达式为:<event>-><industry>-><company>。
9.根据权利要求8所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S34的过程是:
S341:提取事件event4和公司company2知识点,将事件与公司通过建立相应对象属性从而建立知识关系<event4>-><object property6>-><company2>,再创建一个对象属性Object Property7专门用于建立有竞争关系的公司间的知识关系,设竞争公司变量为competitor,建立的知识关系如下:<company2>-><object property7>-><competitor>;
S342:将所有的object property按照S232中的方法整理为规则rule4,此类型事件推理结果表达式为:<event>-><company>-><competitor>。
10.根据权利要求9所述的基于知识图谱的财经事件推理方法,其特征在于,所述步骤S35的过程是:
S351:首先在数据中提取事event5和产品product1两个知识点并放入相应知识分类;
S352:创建一个对象属性Object Property8专门用于建立事件和产品之间的知识关系,将event5和product1建立关系如下:<event5>-><object property8>-><product1>;
S353:将产品的推理方向分为两个,第一个是将产品与生产产品的公司建立关系:创建一个对象属性Object Property9专门用于建立产品知识点product1和生产此产品公司变量company之间的知识关系:<product1>-><object property9>-><company>,由此推理出这些具体的公司;
S354:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><company>;
S355:产品推理的第二个方向是将产品与其所需的原材料建立关系:创建一个对象属性Object Property10专门用于建立产品知识点product1和生产此产品的原材料变量material之间的知识关系:<product1>-><object property10>-><material>,再将原材料变量material与生产原材料的公司变量company建立关系:<material>-><objectproperty>-><company>;
S356:将所有的object property按照S232中的方法整理为规则rule5,此类型事件推理结果表达式为:<event>-><product>-><material>-><company>。
CN201710627133.5A 2017-07-26 2017-07-26 一种基于知识图谱的财经事件推理方法 Pending CN107908633A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710627133.5A CN107908633A (zh) 2017-07-26 2017-07-26 一种基于知识图谱的财经事件推理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710627133.5A CN107908633A (zh) 2017-07-26 2017-07-26 一种基于知识图谱的财经事件推理方法

Publications (1)

Publication Number Publication Date
CN107908633A true CN107908633A (zh) 2018-04-13

Family

ID=61839981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710627133.5A Pending CN107908633A (zh) 2017-07-26 2017-07-26 一种基于知识图谱的财经事件推理方法

Country Status (1)

Country Link
CN (1) CN107908633A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189867A (zh) * 2018-10-23 2019-01-11 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质
CN110175239A (zh) * 2019-04-23 2019-08-27 成都数联铭品科技有限公司 一种知识图谱的构建方法及系统
CN111209400A (zh) * 2020-01-03 2020-05-29 北京明略软件系统有限公司 一种数据分析的方法及装置
CN112487306A (zh) * 2020-12-07 2021-03-12 华东师范大学 基于知识图谱的自动化事件标记与分类方法
CN113767403A (zh) * 2019-05-29 2021-12-07 国际商业机器公司 知识图中过指定和欠指定的自动解析

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189867A (zh) * 2018-10-23 2019-01-11 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质
CN109189867B (zh) * 2018-10-23 2021-09-17 中山大学 基于公司知识图谱的关系发现方法、装置及存储介质
CN110175239A (zh) * 2019-04-23 2019-08-27 成都数联铭品科技有限公司 一种知识图谱的构建方法及系统
CN113767403A (zh) * 2019-05-29 2021-12-07 国际商业机器公司 知识图中过指定和欠指定的自动解析
CN113767403B (zh) * 2019-05-29 2024-02-27 勤达睿公司 知识图中过指定和欠指定的自动解析
CN111209400A (zh) * 2020-01-03 2020-05-29 北京明略软件系统有限公司 一种数据分析的方法及装置
CN111209400B (zh) * 2020-01-03 2023-06-16 北京明略软件系统有限公司 一种数据分析的方法及装置
CN112487306A (zh) * 2020-12-07 2021-03-12 华东师范大学 基于知识图谱的自动化事件标记与分类方法
CN112487306B (zh) * 2020-12-07 2023-01-17 华东师范大学 基于知识图谱的自动化事件标记与分类方法

Similar Documents

Publication Publication Date Title
Nimmy et al. Explainability in supply chain operational risk management: A systematic literature review
Zhu et al. Research on optimization of an enterprise financial risk early warning method based on the DS-RF model
Tsui et al. Knowledge-based extraction of intellectual capital-related information from unstructured data
CN107908633A (zh) 一种基于知识图谱的财经事件推理方法
US10296850B2 (en) Document coding computer system and method with integrated quality assurance
Sousa et al. Credit analysis using data mining: application in the case of a credit union
Lai Smart Financial Management System Based on Data Ming and Man‐Machine Management
Sun et al. Design of macroeconomic growth prediction algorithm based on data mining
Kou et al. An analytic hierarchy model for classification algorithms selection in credit risk analysis
Schuh et al. Data mining methods for macro level process planning
Franchina et al. High quality dataset for machine learning in the business intelligence domain
Zhang et al. A dynamic attributes-driven graph attention network modeling on behavioral finance for stock prediction
Islam et al. A framework for effective big data analytics for decision support systems
Pishvaee et al. A fuzzy clustering-based method for scenario analysis in strategic planning: the case of an Asian pharmaceutical company
Cao Design and optimization of a decision support system for sports training based on data mining technology
Zaliluddin Bibliometric Analysis of “Accuracy of Multi Criteria Decision Making (MCDM) of Assistance Recipients with Fuzzy Logic Algorithm”
Attri et al. A Relative Study on Analytical Models
Li Predicting the investment risk in supply chain management using BPNN and machine learning
Lytvyn et al. Ontology of big data analytics
Park et al. A new forecasting system using the latent dirichlet allocation (LDA) topic modeling technique
Li Application of multisource big data mining technology in sports economic management analysis
Chen et al. A time-series-based technology intelligence framework by trend prediction functionality
Andreasik Knowledge management model based on the enterprise ontology for the KB DSS system of enterprise situation assessment in the SME sector
Schmidt et al. Enterprise architecture analytics and decision support
Xia et al. Integrated prediction and control of mobility changes of young talents in the field of science and technology based on convolutional neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180413

RJ01 Rejection of invention patent application after publication