CN107480137A - 用语义迭代提取网络突发事件并识别外延事件关系的方法 - Google Patents

用语义迭代提取网络突发事件并识别外延事件关系的方法 Download PDF

Info

Publication number
CN107480137A
CN107480137A CN201710679941.6A CN201710679941A CN107480137A CN 107480137 A CN107480137 A CN 107480137A CN 201710679941 A CN201710679941 A CN 201710679941A CN 107480137 A CN107480137 A CN 107480137A
Authority
CN
China
Prior art keywords
event
extension
extraction
relation
trigger word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710679941.6A
Other languages
English (en)
Inventor
林飞
洪秋月
赵喜荣
熊骁
毛俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Asia Century Technology Development Co Ltd
Original Assignee
Beijing Asia Century Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Asia Century Technology Development Co Ltd filed Critical Beijing Asia Century Technology Development Co Ltd
Priority to CN201710679941.6A priority Critical patent/CN107480137A/zh
Publication of CN107480137A publication Critical patent/CN107480137A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

用语义迭代提取网络突发事件并识别外延事件关系的方法涉及信息技术领域中知识图谱技术领域,本发明包含事件触发词提取步骤,外延事件主题集合步骤,外延事件关系识别步骤,其中外延事件关系识别步骤包括了迭代抽取流程,迭代抽取流程使用Hearst Pattern算法;触发词提取步骤由分词,句法树建立,建立句法路径,提取触发词系列过程完成;外延事件主题集合步骤由事件元素识别,事件的表示,LDA聚类系列过程完成;外延事件关系识别步骤经过事件表示对主实体识别和外延实体识别进行迭代抽取,最终得到事件关系推理结果。本发明实现半自动的提取事件的方式,然后语义的迭代提取也可以在不牺牲召回率的情况下,实现事件关系提取的自动高效。

Description

用语义迭代提取网络突发事件并识别外延事件关系的方法
技术领域
本发明涉及信息技术领域,尤其是知识图谱的技术领域。
背景技术
随着计算机技术的飞速发展,我们已经步入到互联网信息爆炸的时代,根据中国互联网络信息中心(CNNIC)在国家网信办新闻发布厅发布的第38次《中国互联网络发展状况统计报告》,截至2016年6月,中国网民人数规模达7.10亿,上半年新增网民2132万人,增长率为3.1%,互联网普及率达到51.7%,人们的生活方式也逐渐被其改变和影响,越来越多的人愿意在互联网上分享经验、知识,互联网上堆积了大量的文本信息,其中不乏社会热点、舆论热点的信息。而这些信息往往是以无边界半结构化的形式存在,想从海量的数据中发现直观的感兴趣的知识无疑难度很大,本技术意在解决此类难题,将事件和事件关系抽取出来,组成直观、有效的知识。有利于提高用户获取信息的效率,更有利于提高对突发事件的组织、发现、挖掘和处理的能力。
首先,对于“事件”的界定。“事件”一次来源于认知心理学,认为人是以“事件”为单位记忆和理解现实世界,而细分到不同领域下,“事件”的界定都会有所不同,到目前为止对于“事件”没有统一的界定。如在信息检索领域,“事件”被认为是细化了的用于检索的主题;在信息抽取即Information Extraction中“事件”指的是发生在某个特定的时间片段和环境范围之内,由若干角色参与的,由若干动作组成的场景,一般表现为句子级。ACE即Automatic Context Extraction评测会议中,事件抽取是其子任务之一,事件抽取要求从含有事件信息的非结构化源文本中,自动识别和抽取出含有事件类型、时间元素和事件角色信息的结构化信息。
事件抽取属于信息抽取的重要组成部分,其中涉及的理论知识包括自然语言处理、数据挖掘、数据库等多学科的技术,目前主流的有两种:一是模式匹配法;二是机器学习方法。模式匹配法相对来说准确率较高,并且其知识表示方式自然、直观、易于理解且便于推理,缺点对领域知识的依赖性大,且受语言、甚至文本格式的限制,其可移植性差,往往需要投入大量人力,并且有领域专家和语言学专家的协助。在模式匹配法的研究过程中,已经有了许多成果,许多学者先后设计了各种获取信息抽取模式获取系统,如AutoSlog(相关参考文献:Ellen Riloff.Automatically Constructing a Dictionary for InformationExtraction Tasks.In Proceed of 11th National Conf.on Artifical Intelligence)、PALKA(相关参考文献:Jun-Tea Kim,and Dan I.Moldovan. Acquisition of LinguisticPatterns for Knowledge-based Information Extraction.IEEE Transactions onKnowledge and Data Engineering)、AutoSlog-TS(相关参考文献:Ellen Riloff,and JayShoen. Automatically Acquiring Conceotual Answer Patterns without anAnnotated Corpus.In Proceeding of the Third Workshop on Very Large Corpora.)、ExDiso(相关参考文献:YANGARBER R.Scenario customization for informationextraction.NewYork:New York University)、GenPAM(相关参考文献:姜吉发. 自由文本的信息抽取模式获取的研究.北京:中国科学院)。
基于模式匹配法的事件提取方式经历从人工手动整理到后来的基于句型模板构造提取规则(相关参考文献:吴平博,陈群秀,马亮.基于时间矿建的事件相关文档的智能检所研究),在手工整理时期,要求用户有较高的技能水平,而且这种方式需要消耗大量的人力。后来的句型模板的方法利用的是手工确定的句模提取规则,用于对处理之后的文本进行匹配和抽取。我国中科院的姜吉发提出了一种基于领域无关概念知识库的事件抽取模式学习方法GenPAM。
对于机器学习的方法,灵活性明显优于模式匹配法,不需要太多的人工参与和领域知识做基础,且召回率较高,其缺点是准确性相较于模式匹配较低,且存在数据稀疏、维灾难等问题,并且语料的典型性和规模限制了机器学习的效果。机器学习在事件抽取的中主要包括两个部分,其一是触发词、类别的识别,二是元素的识别。ACE更为关注的是信息抽取系统的测评而非会议本身。经过7年时间,ACE测评会议取得了明显的发展。任务量和语料语种都有了大幅度增加。同时,ACE还公布了2005年和2007年两届的测评结果,这些成绩及其变化对目前分析信息抽取领域的研究有着较大的参考价值。ACE评测会议2005年定义信息抽取系统主要包括五个子任务,分别是:实体检测和识别EDR、关系的检测和识别RDR、事件检测和识别VDR,值的检测和识别VAL、时间表达式的识别和规范TERN。
近年来,在MUC会议和ACE评测会议的推动下,机器学习在事件抽取的领域得到长足的发展,Hai L .Chieu和Hwee T.Ng首次在实践抽取中引入最大熵模型用于时间元素的识别(相关参考文献:Hai L .Chieu,Hwee T.Ng.A Maximum Entropy Approach toInformation Extraction from Semi-Structured and Free Text.Proceedings of the18th National Conference on Artificial Intelligence.);H.Llorens和E.Saquete等人通过CRF模型进行语义角色标注(相关参考文献:H.Llorens,E.Saquete,et al. TimeMLevents recognition and classification learning CRF models with semanticroles);Ahn结合MegaM和Timbl两种机器学习方法分别实现了事件抽取中触发词、类别识别、元素识别两个主要步骤(相关参考文献:David Ahn. The Stages of EventExtraction.Proceedings of the Workshop on Annotations and Reasoning aboutTime and Events)。
SemEval-2007Task04是公认的关系体系,其总共定义了7种关系Relation,见说明书附图的图4 SemEval关系类别图。
美国国家标准技术研究院NISTAutomatic Content Extraction即ACE评测定义了7种关系,见说明书附图的图5:ACE关系类别图。分类标准是面向普通意义上实体关系,其中包括人物、组织关系,从属关系,物理关系等。
在现有技术中查新搜索“语义迭代”,发现CN201410391873.X,一种文本大数据的查询处理方法,该发明涉及一种文本大数据的查询处理方法,包括以下步骤:1)规范文本大数据语义,构造文本大数据查询分析过程中的查询对象语义范式模型以及精确描述语义,2)建立指令解析与查询工作流模型,构建查询指令语义模型,精炼语义,并且选择和重构查询工作流,3)查询过程控制和反馈结果,筛选查询方法模型,评估和计算查询置信度,并且返回置信度最高的工作流。与现有技术相比,本发明具有方便快速、准确可靠等优点。该专利与本专利申请所述技术目的不同,方法不同,需要先定义语意范式模型及精准描述语义。数据现有技术中模式匹配法的一种案例。搜索“提取网络突发事件”,没有相关专利,搜索“识别外延事件关系”,没有相关专利。
现有的技术,主要是模式匹配法和机器学习法,模式匹配法相对来说准确率较高,并且其知识表示方式自然、直观、易于理解且便于推理,缺点对领域知识的依赖性大,且受语言、甚至文本格式的限制,其可移植性差,往往需要投入大量人力,并且有领域专家和语言学专家的协助。对于机器学习方法,灵活性明显优于模式匹配法,不需要太多的人工参与和领域知识做基础,且召回率较高,其缺点是准确性相较于模式匹配较低,且存在数据稀疏、维灾难等问题,并且语料的典型性和规模限制了机器学习的效果。
本发明结合模式匹配的相关方法和机器学习方法的优势,采用句法分析和语义分析相结合的方法,发现关系词,依据关系词定位事件实体,并且利用迭代提取的概率模型的方法,在句字级的层面上进行自动的实体识别,减少人工参与并且这种多方整合的方式提高了准确率。
本发明用到的现有技术和工具解释:
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。不仅仅是分词,而是提供词法分析、句法分析、语义理解等完备的功能。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
StandfordParser是Stanford NLP小组提供的一系列工具之一,是用来完成语法分析的任务。StanfordParser可以找出句子中词语之间的dependency关联信息,并且以StanfordDependency格式输出,包括有向图及树等形式。
隐含狄利克雷分布简称LDA(Latent Dirichlet allocation),是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。LDA首先由Blei,David M.、吴恩达和Jordan, Michael I于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。LDA可以被认为是一种聚类算法:主题对应聚类中心,文档对应数据集中的例子。主题和文档在特征空间中都存在,且特征向量是词频向量。LDA不是用传统的距离来衡量一个类簇,它使用的是基于文本文档生成的统计模型的函数。
发明内容
基于现有技术的不足,本发明给出用语义迭代提取网络突发事件并识别外延事件关系的方法,本发明包含事件触发词提取步骤,外延事件主题集合步骤,外延事件关系识别步骤,其中外延事件关系识别步骤包括了迭代抽取流程,迭代抽取流程使用HearstPattern算法;触发词提取步骤由分词,句法树建立,建立句法路径,提取触发词系列过程完成;外延事件主题集合步骤由事件元素识别,事件的表示,LDA聚类系列过程完成;外延事件关系识别步骤经过事件表示对主实体识别和外延实体识别进行迭代抽取,最终得到事件关系推理结果;
实现用语义迭代提取网络突发事件并识别外延事件关系的方法的具体步骤如下:
1).事件触发词提取步骤
(1)分词:利用HanLp对在句级层面上对事件进行分词;
(2)句法树建立:将分词后的数据输入Standford Parser建立句子的语法树型结构,此处值得注意的需要是基于已有的树形结构进句法分析;
(3) 建立句法路径:根据树结构建立句法路径:举例说明例如:[损失NNNPVPVA惨重],“损失”,“NN”等表示句法树节点,“↓”表示前一节点是后一节点的父节点,“↑”表示前一节点是后一节点的子节点。泛化后的句法路径可表示为[NT↑…↑NT↓…↓NT front( back) ],其中NT 表示句法树中任意非终结符号; front 表示在这条句法路径中,触发词位于最左边;back表示触发词位于最右边;依据句法路径找到触发词;
2). 外延事件主题集合步骤
(1)事件元素识别:事件元素识别使用优化后的ACE2005的定义,优化ACE2005中定义的8种事件类别以及33种子类别,将时间即Time加入到每个事件类别中;
(2)事件的表示:在完成事件元素识别的前提下,将句子表示成一个事件元素组成的单元,举例说明例如:Lif/Die事件类型包含time,victim,place,instrument四个要素,这个类别的事件可以表示为
(3)LDA聚类:定义外延事件只存在于在同类事件当中,外延事件与原事件本身是存在依赖关系的,用LDA聚类算法将事件聚类;
3).外延事件关系识别步骤
(1)事件的表示:根据事件表示找到语义词,举例说明例如“因此,“但是”,“比如”是语义词;
(2)主实体识别和外延实体识别:根据分组的语义词进行主实体和外延实体的识别,主实体和外延实体都来源于触发词和部分事件元素,定义当事件的触发词和事件元素为外延实体,那么此事件为外延事件;
(3)Hearst Pattern算法:
输入:句子的Hearst Pattern
输出:,外延事件集合
1.
2.repeat
3.foreach do
4.
5.if then
6.
7.end
8.if then
9.
10. foreach do
11.
12. if
13. add to
14. end
15. End。
有益效果
本发明实现半自动的提取事件的方式,然后语义的迭代提取也可以在不牺牲召回率的情况下,实现事件关系提取的自动高效。
附图说明
图1是本发明的总体流程图;
图2是本发明的句法树结构示意图;
图3是本发明的句法树结构及其基本组成要素示意图;
图4是SemEval关系类别图;
图5是ACE关系类别图。
具体实施方式
参考图1至图3,本发明给出用语义迭代提取网络突发事件并识别外延事件关系的方法,本发明包含事件触发词提取步骤S01,外延事件主题集合步骤S02,外延事件关系识别步骤S03,其中外延事件关系识别步骤S03包括了迭代抽取流程S031,迭代抽取流程S031使用Hearst Pattern算法;触发词提取步骤S01由分词,句法树建立,建立句法路径,提取触发词系列过程完成;外延事件主题集合步骤S02由事件元素识别,事件的表示,LDA聚类系列过程完成;外延事件关系识别步骤S03经过事件表示对主实体识别和外延实体识别进行迭代抽取,最终得到事件关系推理结果。
实施例一
一种网站画像方法实现的具体步骤如下:
1.基于句法树与句法分析的触发词提取
句法树实例如图1所示:
利用HanLp对在句级层面上对事件进行分词之后,将分词后的数据输入StandfordParser建立句子的语法树型结构,此处值得注意的需要是基于已有的树形结构进句法分析。
然后根据树结构建立句法路径:如:[损失NNNPVPVA惨重], “损失”,“NN”等表示句法树节点,“↓”表示前一节点是后一节点的父节点,“↑”表示前一节点是后一节点的子节点。泛化后的句法路径可表示为[NT↑…↑NT↓…↓NT front( back) ],其中NT 表示句法树中任意非终结符号; front 表示在这条句法路径中,触发词位于最左边; back表示触发词位于最右边。依据句法路径找到触发词。
如图2,例2句法树结构及其基本组成要素所示:
在对于“某月某日,某某在某地某处遇害”句子中,时间要素是“某月某日”;人物要素是“某某”;地点要素是“某地某处”,这句话所属的事件类型是“Life”,所属的子事件类型是“Die”,触发词是“遇害”。
在这里事件的类型和子类型都是依据的ACE2005中定义的8种事件类别以及33种子类别,ACE2005对于每个事件类别和子类别有对应的唯一的事件模板。本技术借鉴ACE2005的事件类别定义方式,为了更加适应网络突发事件的实际场景,对事件模板稍作修改,比如在ACE2005中Lif/Die事件模板的三要素是:Victim-Place-Instrument,考虑到网络事件对时间的敏感度,本技术将Time加入模板。
2.基于语义迭代提取的网络事件的外延事件关系识别:
如图3,以上已经介绍了全面事件定位的部分步骤,本技术意在发现网络事件的外延事件关系,即在同一话题下的“EE事件”。
例如:“特朗普上任美国总统。”
(1)“对中国商品征收高额关税,加大中国经济下行压力”;
(2)“人民币贬值压力”;
(3)“特朗普的亚洲战略不可预测,对中国既是机遇也是挑战”;
这三句话都为上例的外延事件,而(3)明显和上例存在直接的联系。
之前已经将句子表示成一个事件元素组成的单元,以图2为例,Lif/Die事件类型包含time,victim,place,instrument四个要素,这个类别的事件可以表示为 ,根据表示可以用LDA聚类算法将事件聚类,建立假设一:外延事件只存在于在同类事件当中,外延事件与原事件本身是存在依赖关系的。
在进行语义提取之前,需要找到语义词,比如“因此,“但是”,“比如”,接下来以从属关系为例进行阐述。
根据这些分组的语义词进行主实体和外延实体的识别,这里的主实体和外延实体都来源于触发词和部分事件元素,在这里提出第二个假设:如果事件的触发词和事件元素为外延实体,那么此事件为外延事件。
算法步骤:
输入:句子的Hearst Pattern
输出:,外延事件集合
1.
2.repeat
3. foreach do
4.
5. if then
6.
7. end
8. if then
9.
10. foreach do
11.
12. if
13. add to
14. end
15. end。

Claims (1)

1.用语义迭代提取网络突发事件并识别外延事件关系的方法,其特征在于包含事件触发词提取步骤,外延事件主题集合步骤,外延事件关系识别步骤,其中外延事件关系识别步骤包括了迭代抽取流程,迭代抽取流程使用Hearst Pattern算法;触发词提取步骤由分词,句法树建立,建立句法路径,提取触发词系列过程完成;外延事件主题集合步骤由事件元素识别,事件的表示,LDA聚类系列过程完成;外延事件关系识别步骤经过事件表示对主实体识别和外延实体识别进行迭代抽取,最终得到事件关系推理结果;
实现用语义迭代提取网络突发事件并识别外延事件关系的方法的具体步骤如下:
1).事件触发词提取步骤
(1)分词:利用HanLp对在句级层面上对事件进行分词;
(2)句法树建立:将分词后的数据输入Standford Parser建立句子的语法树型结构,此处值得注意的需要是基于已有的树形结构进句法分析;
(3) 建立句法路径:根据树结构建立句法路径:“NN”表示句法树节点,“↓”表示前一节点是后一节点的父节点,“↑”表示前一节点是后一节点的子节点;泛化后的句法路径可表示为[NT↑…↑NT↓…↓NT front( back) ],其中NT 表示句法树中任意非终结符号; front 表示在这条句法路径中,触发词位于最左边; back表示触发词位于最右边;依据句法路径找到触发词;
2).外延事件主题集合步骤
(1)事件元素识别:事件元素识别使用优化后的ACE2005的定义,优化ACE2005中定义的8种事件类别以及33种子类别,将时间即time加入到每个事件类别中;
(2)事件的表示:在完成事件元素识别的前提下,将句子表示成一个事件元素组成的单元,举例说明例如:Lif/Die事件类型包含time,victim,place,instrument四个要素,这个类别的事件可以表示为
(3)LDA聚类:定义外延事件只存在于在同类事件当中,外延事件与原事件本身是存在依赖关系的,用LDA聚类算法将事件聚类;
3).外延事件关系识别步骤
(1)事件的表示:根据事件表示找到语义词;
(2)主实体识别和外延实体识别:根据分组的语义词进行主实体和外延实体的识别,主实体和外延实体都来源于触发词和部分事件元素,定义当事件的触发词和事件元素为外延实体,那么此事件为外延事件;
(3)Hearst Pattern算法:
输入:句子的Hearst Pattern
输出:,外延事件集合
1.
2.repeat
3.foreach do
4.
5.if then
6.
7.end
8.if then
9.
10.foreach do
11.
12.if
13.add to
14.end
15.End。
CN201710679941.6A 2017-08-10 2017-08-10 用语义迭代提取网络突发事件并识别外延事件关系的方法 Pending CN107480137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710679941.6A CN107480137A (zh) 2017-08-10 2017-08-10 用语义迭代提取网络突发事件并识别外延事件关系的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710679941.6A CN107480137A (zh) 2017-08-10 2017-08-10 用语义迭代提取网络突发事件并识别外延事件关系的方法

Publications (1)

Publication Number Publication Date
CN107480137A true CN107480137A (zh) 2017-12-15

Family

ID=60599176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710679941.6A Pending CN107480137A (zh) 2017-08-10 2017-08-10 用语义迭代提取网络突发事件并识别外延事件关系的方法

Country Status (1)

Country Link
CN (1) CN107480137A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284088A (zh) * 2018-08-02 2019-01-29 北京天元创新科技有限公司 一种信令大数据处理方法及电子设备
CN109344262A (zh) * 2018-10-31 2019-02-15 百度在线网络技术(北京)有限公司 知识体系的建立方法、装置及存储介质
CN110263177A (zh) * 2019-05-23 2019-09-20 广州市香港科大霍英东研究院 用于事件预测的知识图构建方法与事件预测方法
CN110489520A (zh) * 2019-07-08 2019-11-22 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN116152647A (zh) * 2023-04-18 2023-05-23 中国科学技术大学 基于多轮迭代策略和差异性感知的场景图生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881399A (zh) * 2015-05-15 2015-09-02 中国科学院自动化研究所 基于概率软逻辑psl的事件识别方法和系统
CN106055658A (zh) * 2016-06-02 2016-10-26 中国人民解放军国防科学技术大学 一种针对Twitter文本事件抽取的方法
CN106445990A (zh) * 2016-06-25 2017-02-22 上海大学 事件本体构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104881399A (zh) * 2015-05-15 2015-09-02 中国科学院自动化研究所 基于概率软逻辑psl的事件识别方法和系统
CN106055658A (zh) * 2016-06-02 2016-10-26 中国人民解放军国防科学技术大学 一种针对Twitter文本事件抽取的方法
CN106445990A (zh) * 2016-06-25 2017-02-22 上海大学 事件本体构建方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MARTI A. HEARST ET AL.: "Automatic Acquisition of Hyponyms from Large Text Corpora", 《PROCEEDINGS OF THE 14TH CONFERENCE ON COMPUTATIONAL LINGUISTICS》 *
张智雄 等: "非结构化文本中内容对象抽取的技术方法综述", 《HTTP://WWW.CHINALIBS.NET》 *
杨雪蓉 等: "基于核心词和实体推理的事件关系识别方法", 《中文信息学报》 *
马彬: "事件关系识别关键技术研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284088A (zh) * 2018-08-02 2019-01-29 北京天元创新科技有限公司 一种信令大数据处理方法及电子设备
CN109284088B (zh) * 2018-08-02 2022-04-26 北京天元创新科技有限公司 一种信令大数据处理方法及电子设备
CN109344262A (zh) * 2018-10-31 2019-02-15 百度在线网络技术(北京)有限公司 知识体系的建立方法、装置及存储介质
CN110263177A (zh) * 2019-05-23 2019-09-20 广州市香港科大霍英东研究院 用于事件预测的知识图构建方法与事件预测方法
CN110489520A (zh) * 2019-07-08 2019-11-22 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN110489520B (zh) * 2019-07-08 2023-05-16 平安科技(深圳)有限公司 基于知识图谱的事件处理方法、装置、设备和存储介质
CN116152647A (zh) * 2023-04-18 2023-05-23 中国科学技术大学 基于多轮迭代策略和差异性感知的场景图生成方法
CN116152647B (zh) * 2023-04-18 2023-07-18 中国科学技术大学 基于多轮迭代策略和差异性感知的场景图生成方法

Similar Documents

Publication Publication Date Title
CN107609052B (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN107480137A (zh) 用语义迭代提取网络突发事件并识别外延事件关系的方法
CN105069560B (zh) 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法
CN106156286B (zh) 面向专业文献知识实体的类型抽取系统及方法
CN108874878A (zh) 一种知识图谱的构建系统及方法
CN107885874A (zh) 数据查询方法和装置、计算机设备及计算机可读存储介质
CN102117281B (zh) 一种构建领域本体的方法
CN106484767A (zh) 一种跨媒体的事件抽取方法
CN106919689A (zh) 基于术语释义知识单元的专业领域知识图谱动态构建方法
CN109325040B (zh) 一种faq问答库泛化方法、装置及设备
CN105653590A (zh) 一种中文文献作者重名消歧的方法
CN110019712A (zh) 多意图查询方法和装置、计算机设备及计算机可读存储介质
CN104484380A (zh) 个性化搜索方法及装置
CN110188359B (zh) 一种文本实体抽取方法
CN110442730A (zh) 一种基于deepdive的知识图谱构建方法
CN106202039B (zh) 基于条件随机场的越南语组合词消歧方法
CN110019713A (zh) 基于意图理解的数据检索方法和装置、设备及存储介质
Gupta et al. Joint bootstrapping machines for high confidence relation extraction
CN112989208A (zh) 一种信息推荐方法、装置、电子设备及存储介质
US10706030B2 (en) Utilizing artificial intelligence to integrate data from multiple diverse sources into a data structure
CN104881399A (zh) 基于概率软逻辑psl的事件识别方法和系统
CN109815478A (zh) 基于卷积神经网络的药化实体识别方法及系统
CN116362243A (zh) 一种融入句子间关联关系的文本关键短语提取方法、存储介质及装置
Devika et al. A semantic graph-based keyword extraction model using ranking method on big social data
Gollapalli Literature review of attribute level and structure level data linkage techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171215

WD01 Invention patent application deemed withdrawn after publication