CN112559756A - 一种地震事件知识图谱构建方法、应用方法 - Google Patents

一种地震事件知识图谱构建方法、应用方法 Download PDF

Info

Publication number
CN112559756A
CN112559756A CN202010922395.6A CN202010922395A CN112559756A CN 112559756 A CN112559756 A CN 112559756A CN 202010922395 A CN202010922395 A CN 202010922395A CN 112559756 A CN112559756 A CN 112559756A
Authority
CN
China
Prior art keywords
seismic
news
seismic event
event
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010922395.6A
Other languages
English (en)
Inventor
李明玉
刘方然
徐常亮
贺大为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinhua Fusion Media Technology Development Beijing Co ltd
Xinhua Zhiyun Technology Co ltd
Original Assignee
New Media Center Of Xinhua News Agency
Xinhua Zhiyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Media Center Of Xinhua News Agency, Xinhua Zhiyun Technology Co ltd filed Critical New Media Center Of Xinhua News Agency
Publication of CN112559756A publication Critical patent/CN112559756A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

一种地震事件知识图谱构建方法、应用方法,包括以下步骤:构建地震事件知识图谱的schema;构建历史地震事件信息库;识别并筛选地震事件新闻,抽取地震信息;将历史地震事件新闻信息库和抽取的地震信息进行知识融合;对融合后的地震知识进行知识加工;根据S200‑S500的步骤定时更新地震事件知识图谱。采用上述方法构建一个具有全面历史数据、同时具有实时更新能力的地震事件知识图谱。

Description

一种地震事件知识图谱构建方法、应用方法
技术领域
本发明涉及地震事件新闻处理领域,尤其涉及一种地震事件知识图谱构建方法。
背景技术
地震事件是隶属于突发事件下具有极大危害性的自然灾害事件,通常会造成极大社会影 响、带来严重经济损失和人员伤亡。随着互联网技术的飞速发展,为媒体高效报道地震事件, 乃至实现信息跟踪、整合、梳理,提供了新的工具。
从媒体报道从业人员获取信息的途径看来,有关地震事件信息的收集整合方式仍然主要 停留在人工阶段,即需要手动从不同的地震信息的来源网站检索地震事件的最新动态,提取 地震震级、伤亡人数等相关属性。并且还需要人工辨别数据的真伪、整合各类不同数据源的 原始信息,经过大量的后续加工处理才能获得准确,完整的相关地震事件信息,并没有一个 专门的且具有时效性的地震领域信息库。
从媒体报道地震事件的角度来看,不同媒体之间的时间差和不同采访对象也导致其报道 的新闻往往关注地震事件的不同方面,诸如地震带来的人员伤亡,是否导致震区交通阻断, 救援队伍的救灾情况等,这也使得想详细了解地震相关信息的受众难以经由一家媒体了解地 震事件发生的全貌,只能通过不同媒体播报的不同侧重点的地震信息做二次加工以获取整个 地震事件的脉络与全貌。
发明内容
本发明针对现有技术中的缺点,构建一个具有全面历史数据、同时具有实时更新能力的 地震事件数据库的方法。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种地震事件知识图谱构建方法,包括以下步骤:
S100,构建地震事件知识图谱的schema;
S200,构建历史地震事件信息库;
S300,识别并筛选地震事件新闻,抽取地震信息;
S400,将历史地震事件新闻信息库和抽取的地震信息进行知识融合;
S500,对融合后的地震知识进行知识加工;
S600,根据S200-S500的步骤定时更新地震事件知识图谱。
可选的,构建历史地震事件新闻信息库包括:
定时获取官方网站的历史地震信息,进行处理后构建历史地震信息库的schema。
可选的,所述识别地震事件新闻包括:
S310,对全网新闻做新闻预处理,包括新闻的清洗和去重;
S320,通过突发事件分类算法识别突发事件新闻;
S330,通过突发事件识别算法识别突发事件新闻下的自然灾害新闻;
S340,通过地震事件新闻识别算法识别自然灾害新闻下的地震事件新闻。
可选的,所述地震新闻识别算法包括:
S341,对新闻标题和首句进行新闻特征增强;
S342,构建地震事件关联词词袋,对新闻特征增强后的新闻进行关联词匹配,匹配数据 达到阈值范围则判定为地震事件新闻;
S343,利用ALBERT预训练的语言模型获取新闻文本的词向量表示,将所述词向量表示 接入TextCNN模型中,通过多窗口卷积的方式获取不同维度的新闻文本特征,将卷积后得到 的文本特征经过softmax分类器进行最终的分类;
将S342-S343步骤获得的分类数据进行汇总后得到地震事件新闻。
可选的,构建地震事件知识图谱的schema的方法包括:
模式层本体类型构建,包括自然灾害、地震事件、新闻、人物、机构、国家、省/直辖市、 市、区县;
模式层的schema构建,包括本体之间的关系定义;
数据层的schema构建,包括不同类型数据之间的关系定义以及不同类型数据的属性定 义。
可选的,地震信息抽取包括:
抽取地震事件数字属性信息,其包括地震事件基本属性抽取和地震事件社会属性抽取;
抽取地震事件三元组信息,其包括地震事件实体链接、地震事件属性抽取、实体识别、 地震事件关系抽取和关系属性抽取。
可选的,地震知识融合包括:采用消歧算法,将所述三元组信息进行去重和整合;
通过实体链接标识相似实体,关联相同实体的不同表达形式,并对相同实体的不同属性 或者相同实体相同属性的不同属性值进行合并,去除重复的实体、属性以及关系。
可选的,所述地震知识加工包括知识推理、质量评估和知识更新:
其中,知识推理为利用所述三元组信息的实体和关系,计算出未能从原始信息中获取的 隐含信息;
质量评估,是对已有地震知识的质量做评估,删除低质量的地震知识;
知识更新,对图谱的数据层中具有时间特性的知识进行实时更新。
可选的,还包括地震信息抽取审核,对抽取的地震信息进行文字审核、数字审核、关系 审核中的至少一种方式进行审核。
本发明还提供一种地震事件知识图谱的应用方法,其应用包括地震信息的检索、地震事 件自动播报、地震事件脉络梳理或地震问答机器人。
本发明的有益效果为:
本发明提供的方法通过对官方历史地震信息整合以及对国内外权威性网站报道的地震新 闻进行信息抽取,构建出历史地震事件数据库、地震社会属性数据库、地震事件实体关系库 以及地震事件知识图谱,从而实现对基于时间的历史地震事件脉络梳理,对新发生地震的实 时信息追踪,并可以通过地震事件知识图谱了解与该地震息息相关的实体人物、机构和相关 事件,全面了解地震事件的内在联系。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一 些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这 些附图获得其他的附图。
图1是地震事件知识图谱的整体构建流程;
图2是地震事件知识图谱模式层和数据层schema示意图;
图3是历史地震信息获取模块;
图4是地震事件新闻识别模块;
图5是地震事件新闻识别算法;
图6是地震信息抽取模块;
图7是地震信息抽取审核模块。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明 并不局限于以下实施例。
如图1,是一种地震事件知识图谱构建方法,包括以下步骤:
S100,构建地震事件知识图谱的schema;
S200,构建历史地震事件信息库;
S300,识别并筛选地震事件新闻,抽取地震信息;
S400,将历史地震事件信息库和抽取的地震信息进行知识融合;
S500,对融合后的地震知识进行知识加工;
S600,根据S200-S500的步骤定时更新地震事件知识图谱。
其中,如图7,抽取地震信息后还包括地震信息抽取审核,对抽取的地震信息进行文字 审核、数字审核、关系审核中的至少一种方式进行审核。
地震事件知识图谱存储采用多种数据库,包括MySQL关系型数据库、Neo4J图数据库、 ES检索式数据库,以及数据混合存储方式。
如图2,构建地震事件知识图谱的schema的方法包括:
模式层本体类型构建,包括自然灾害、地震事件、新闻、人物、机构、国家、省/直辖市、 市、区县;
模式层的schema构建,包括本体之间的关系定义,如表1所示;
表1:模式层schema定义
本体1 关系 本体2
地震事件 子类(rdfs:subClassOf) 突发事件-自然灾害事件
地震事件 发生于 区县
新闻 主题 自然灾害
新闻 提及 机构
新闻 提及 人物
区县 子类(rdfs:subClassOf)
子类(rdfs:subClassOf) 省/直辖市
省/直辖市 子类(rdfs:subClassOf) 国家
数据层的schema构建,包括不同类型数据之间的关系定义以及不同类型数据的属性定 义。
具体地,对于不同类型数据之间的关系,按照本体类型分包括地震事件与人物之间的关 系、地震事件与机构之间的关系;对于不同类型数据的属性,按照实体类型分包括地震事件 属性、人物属性、机构属性、地震事件关系属性。关系类别和属性类别举例参见,表2、表3。
地震事件的属性分为基础属性和数字属性。其中,基础属性包括8种,如表4所示;数 字属性包括10大类30种,具体内容如表5所示。
表2:地震事件-人物之间的关系定义表
事件类实体 关系 实体
地震事件 作出指示 人物
地震事件 进行视频会议 人物
地震事件 亲临救灾 人物
地震事件 应急处置 人物
地震事件 召开会议 人物
地震事件 参加会议 人物
地震事件 指导救灾 人物
地震事件 汇报灾情 人物
地震事件 灾情解读 人物
地震事件 慰问 人物
地震事件 应急救援 人物
表3:地震事件-机构之间的关系定义表
Figure BDA0002667183100000051
Figure BDA0002667183100000061
表4:地震事件基本属性字段表
属性大类 序号 字段名
基本属性 1 地震名
基本属性 2 发震时刻
基本属性 3 纬度
基本属性 4 经度
基本属性 5 震源深度
基本属性 6 震级
基本属性 7 所在行政区
表5:地震事件数字属性字段表
Figure BDA0002667183100000062
Figure BDA0002667183100000071
如图3,构建历史地震事件信息库包括:
定时获取官方网站的历史地震信息,进行处理后构建历史地震信息库的schema。
历史地震信息库由地震局和地震台网的历史地震信息的基础上汇总而成,即历史地震的 总数据表。
历史地震事件信息库的构建采用全量数据爬虫和增量数据更新的方式对结构化数据进行 整合。首先从垂直网站(如地震局官网和中国地震台网)爬取全量的历史地震信息,经过数 据的预处理后进入历史地震信息库;设置监听机制和重复爬取时间间隔,对垂直网站的数据 更新做实时处理并入库。
历史地震信息库的schema如表6所示,共有10个字段。历史地震事件信息库用于地震 识别,将地震事件新闻中披露的地震信息与历史地震事件信息库进行比对,确定地震事件新 闻披露的地震是历史地震事件信息库的哪一地震。
表6:历史地震表字段表
序号 字段名
1 地震名
2 发震时刻
3 纬度
4 经度
5 震源所在行政区
6 数据来源
7 震级
8 震源深度
9 国内外
10 所在省
如图4,识别地震事件新闻包括:
S310,对全网新闻做新闻预处理,包括新闻的清洗和去重;
S320,通过突发事件分类算法识别突发事件新闻;
S330,通过自然灾害识别算法识别突发事件新闻下的自然灾害新闻,得到属于自然灾害 突发事件下的新闻;
S340,通过地震事件新闻识别算法识别S303步骤处理后的地震事件新闻。
其中,新闻预处理方法包括:包括新闻的清洗、新闻的字面去重和新闻的语义去重。
其中,新闻的清洗,采用正则匹配方法去除从全网新闻库爬虫获得的噪声数据,如无意 义的URL,HTML标签等。
字面去重,采用Simhash算法,将获取到的新闻提取短句,每个短句在分词后生成对应 的Simhash,根据文本长度不同一篇新闻最多可生成19条Simhash。每一条长度为64位的 Simhash将被分解为16个索引(两级索引拼接,第一级16位、第二级12位,共28位二进 制数),针对每一个索引可以在历史新闻记录中找到对应的Simhash值列表。在经过16个索 引段下的去重后,最终可以得到19段Simhash对应的历史Hash列表,而每个历史Hash都对 应着一条历史新闻,根据每一段历史Hash对应的历史新闻id进行Map查找,计算出命中次 数最高的一组历史新闻id。最后针对这一组历史新闻id读取它们自身的19段Simhash值, 根据海明距离可以计算历史Simhash段与当前新闻Simhash段的命中值,当命中值超过预先设置的阈值时说明新闻存在重复。
语义去重,在字面去重的基础上引入实体命中数量的判断,最新获取到的新闻会根据分 词结果提取其中包含的实体信息以及数字信息,在字面去重筛选出相似历史新闻后,将历史 新闻中包含的实体信息与当前新闻的实体信息进行内积运算,运算后的结果用以计算Jaccard 系数,当系数大于预先设置的阈值时判断新闻存在重复。
S320,通过突发事件分类算法识别突发事件新闻;
由于地震新闻隶属于突发事件新闻类别,同时包含地震事件相关的特征属性,即包括了 地震的名称、发生地、伤亡人数等。经过新闻预处理后通过该算法训练一个分类器,将新闻 分类为突发事件新闻和非突发事件新闻。被分类为突发事件的新闻接入突发事件识别算法。 即步骤S330。
S330,通过突发事件识别算法识别突发事件新闻下的自然灾害新闻;
所述突发事件识别算法用于识别突发事件类别,突发事件的类别包括:1)自然灾害;2) 事故灾难;3)公共卫生事件;4)社会安全事件。被识别为自然灾害类别的突发事件新闻接 入自然灾害识别算法,即步骤S340。
S340,通过地震事件新闻识别算法识别自然灾害新闻下的地震事件新闻。
自然灾害识别算法的目的是将属于自然灾害突发事件下的新闻识别出具体的自然灾害的 具体类别。自然灾害的具体类别包括1)水旱灾害;2)气象灾害;3)地震灾害;4)地质灾 害;5)海洋灾害、6)生物灾害、7)森林火灾等。构建地震知识图谱所需要的新闻是属于地 震灾害子类别下的新闻。最终被分类为地震灾害的新闻成为构建地震事件知识图谱的非结构 化数据源。还包括一些非结构化数据中存在的一些表格、信息框等非完全结构化的数据,即 半结构化数据。
如图5,所述地震新闻识别算法包括:
S341,对新闻标题和首句进行新闻特征增强;
由于突发事件新闻的特征主要存在于标题和首句,所以新闻特征增强主要包括标题重复 和首句重复。对于有新闻标题的原始新闻,将标题重复3次随机插入到新闻的正文文本中。 截取原始新闻的首句,重复2次随机插入到新闻的正文文本中。
S342,构建地震事件关联词词袋,对新闻特征增强后的新闻进行关联词匹配,匹配数据 达到阈值范围则判定为地震事件新闻;
利用预先定义好的模式(包括关键词,关键短语,固定句式等模式)来匹配特征增强后 的新闻数据。构建地震事件关联词的词袋,包括:地震、震感、震级、震源深度等地震领域 专属词汇。判断新闻中的已匹配模式超过或达到阈值,则判断为地震事件新闻类别。
S343,利用ALBERT预训练的语言模型获取新闻文本的词向量表示,将所述词向量表示 接入TextCNN模型中,通过多窗口卷积的方式获取不同维度的新闻文本特征,将卷积后得到 的文本特征经过softmax分类器进行最终的分类。
最终将S342-S342步骤获得的分类数据进行汇总后得到地震事件新闻。
与BERT模型相比,ALBERT通过对Embedding的因式分解和跨层的参数共享实现了模 型参数的大幅度缩减,节约机器的内存。同时,ALBERT使用了句间连贯和移除dropout的计算方式保证了模型的精度不下降或很小幅度下降。
如图6,地震信息抽取步骤包括:
抽取地震事件数字属性信息,其包括地震事件基本属性抽取和地震事件社会属性抽取; 其抽取的基本属性和社会属性分别为表4和表5所列出的字段。
抽取地震事件三元组信息,其包括地震事件实体链接、地震事件属性抽取、实体识别、 地震事件关系抽取和关系属性抽取。
其中地震事件实体链接利用构建的历史地震信息库。地震事件属性抽取模块抽取地震事 件发生的阶段、时间。实体识别模块利用命名实体识别算法识别关于地震事件的人物和机构。 地震事件关系抽取模块抽取表2中的地震事件-人物之间的关系和表3中的地震事件-机构之 间的关系。
其中,地震知识融合包括:采用消歧算法,将所述三元组信息进行去重和整合;
通过实体链接标识相似实体,关联相同实体的不同表达形式,并对相同实体的不同属性 或者相同实体相同属性的不同属性值进行合并,去除重复的实体、属性以及关系。
其中,所述地震知识加工包括知识推理、质量评估和知识更新:
其中,知识推理为利用所述三元组信息的实体和关系,计算出未能从原始信息中获取的 隐含信息;
质量评估,是对已有地震知识的质量做评估,删除低质量的地震知识;
知识更新,对图谱的数据层中具有时间特性的知识(如伤亡人数、救灾资源等)进行实 时更新。
具体的,推理出隐含信息方法包括:即利用已经构建的三元组信息推理出未显式提到的信息。如图谱中有三元组:(某县—县长—某某),(某县县长—做出指示—某地震事件)。则可以推理出新闻中未显式提及到的知识(某某—做出指示—某地震事件)。
对已有地震知识的质量做评估的方法包括:根据不同媒体来源对同一地震事件的报道所 抽取的地震相关知识做质量评估,评估标准按照媒体优先级(如央媒>地方媒体>自媒体)和 投票(及少数服从多数,5个媒体报道地震等级为4.8,3个媒体报道地震等级为4.7,最终选 择4.8级)等加权的方式,计算出每条地震知识的质量评分。
本实施例还提供一种地震事件知识图谱的应用方法,其应用包括地震信息的检索、地震 事件自动播报、地震事件脉络梳理或地震问答机器人。
本发明实施例还提供一种计算机存储介质,包括指令,执行上述方法步骤。具体的各个 步骤之间的执行顺序详见上述实施例,本申请在此不再赘述。
本发明实施例还提供一种计算机程序产品,该计算机程序产品包括计算机执行指令,该 计算机执行指令存储在计算机可读存储介质中;至少一个处理器执行该计算机执行指令使得 上述实施例的方法步骤执行。需要说明的是,上述步骤的具体执行顺序可以参见上述实施例 中的描述,本申请在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的 方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分, 仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结 合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。
所述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单 元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际 的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个 单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以 采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以 存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对 现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该 软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等) 或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包 括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本 发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的 保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种地震事件知识图谱构建方法,其特征在于,包括以下步骤:
S100,构建地震事件知识图谱的schema;
S200,构建历史地震事件信息库;
S300,识别并筛选地震事件新闻,抽取地震信息;
S400,将历史地震事件新闻信息库和抽取的地震信息进行知识融合;
S500,对融合后的地震知识进行知识加工;
S600,根据S200-S500的步骤定时更新地震事件知识图谱。
2.根据权利要求1所述的地震事件知识图谱构建方法,其特征在于,构建历史地震事件新闻信息库包括:
定时获取官方网站的历史地震信息,进行处理后构建历史地震信息库的schema。
3.根据权利要求1所述的地震事件知识图谱构建方法,其特征在于,所述识别地震事件新闻包括:
S310,对全网新闻做新闻预处理,包括新闻的清洗和去重;
S320,通过突发事件分类算法识别突发事件新闻;
S330,通过突发事件识别算法识别突发事件新闻下的自然灾害新闻;
S340,通过地震事件新闻识别算法识别自然灾害新闻下的地震事件新闻。
4.根据权利要求3所述的地震事件知识图谱构建方法,其特征在于,所述地震新闻识别算法包括:
S341对新闻标题和首句进行新闻特征增强;
S342构建地震事件关联词词袋,对新闻特征增强后的新闻进行关联词匹配,匹配数据达到阈值范围则判定为地震事件新闻;
S343利用ALBERT预训练的语言模型获取新闻文本的词向量表示,将所述词向量表示接入TextCNN模型中,通过多窗口卷积的方式获取不同维度的新闻文本特征,将卷积后得到的文本特征经过softmax分类器进行最终的分类;
将S342-S343步骤获得的分类数据进行汇总后得到地震事件新闻。
5.根据权利要求1所述的地震事件知识图谱构建方法,其特征在于,构建地震事件知识图谱的schema的方法包括:
模式层本体类型构建,包括自然灾害、地震事件、新闻、人物、机构、国家、省/直辖市、市、区县;
模式层的schema构建,包括本体之间的关系定义;
数据层的schema构建,包括不同类型数据之间的关系定义以及不同类型数据的属性定义。
6.根据权利要求1所述的地震事件知识图谱构建方法,其特征在于,地震信息抽取包括:
抽取地震事件数字属性信息,其包括地震事件基本属性抽取和地震事件社会属性抽取;
抽取地震事件三元组信息,其包括地震事件实体链接、地震事件属性抽取、实体识别、地震事件关系抽取和关系属性抽取。
7.根据权利要求6所述的地震事件知识图谱构建方法,其特征在于,地震知识融合包括:采用消歧算法,将所述三元组信息进行去重和整合;
通过实体链接标识相似实体,关联相同实体的不同表达形式,并对相同实体的不同属性或者相同实体相同属性的不同属性值进行合并,去除重复的实体、属性以及关系。
8.根据权利要求6或7所述的地震事件知识图谱构建方法,其特征在于,所述地震知识加工包括知识推理、质量评估和知识更新:
其中,知识推理为利用所述三元组信息的实体和关系,计算出未能从原始信息中获取的隐含信息;
质量评估,是对已有地震知识的质量做评估,删除低质量的地震知识;
知识更新,对图谱的数据层中具有时间特性的知识进行实时更新。
9.根据权利要求1所述的地震事件知识图谱构建方法,其特征在于,还包括地震信息抽取审核,对抽取的地震信息进行文字审核、数字审核、关系审核中的至少一种方式进行审核。
10.一种地震事件知识图谱的应用方法,其应用包括地震信息的检索、地震事件自动播报、地震事件脉络梳理或地震问答机器人。
CN202010922395.6A 2020-08-07 2020-09-04 一种地震事件知识图谱构建方法、应用方法 Pending CN112559756A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020107884437 2020-08-07
CN202010788443 2020-08-07

Publications (1)

Publication Number Publication Date
CN112559756A true CN112559756A (zh) 2021-03-26

Family

ID=75041015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010922395.6A Pending CN112559756A (zh) 2020-08-07 2020-09-04 一种地震事件知识图谱构建方法、应用方法

Country Status (1)

Country Link
CN (1) CN112559756A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159532A (zh) * 2021-04-01 2021-07-23 兰州天泉信息科技有限公司 一种面向智能消防指挥系统的辅助决策关键技术
CN113326358A (zh) * 2021-08-04 2021-08-31 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN117273139A (zh) * 2023-11-21 2023-12-22 北京网智天元大数据科技有限公司 基于开放数据的知识图谱动态风险识别方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763333A (zh) * 2018-05-11 2018-11-06 北京航空航天大学 一种基于社会媒体的事件图谱构建方法
US20190188332A1 (en) * 2017-12-15 2019-06-20 Mito.AI AS System of dynamic knowledge graph based on probabalistic cardinalities for timestamped event streams
CN111143576A (zh) * 2019-12-18 2020-05-12 中科院计算技术研究所大数据研究院 一种面向事件的动态知识图谱构建方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190188332A1 (en) * 2017-12-15 2019-06-20 Mito.AI AS System of dynamic knowledge graph based on probabalistic cardinalities for timestamped event streams
CN108763333A (zh) * 2018-05-11 2018-11-06 北京航空航天大学 一种基于社会媒体的事件图谱构建方法
CN111143576A (zh) * 2019-12-18 2020-05-12 中科院计算技术研究所大数据研究院 一种面向事件的动态知识图谱构建方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159532A (zh) * 2021-04-01 2021-07-23 兰州天泉信息科技有限公司 一种面向智能消防指挥系统的辅助决策关键技术
CN113326358A (zh) * 2021-08-04 2021-08-31 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN113326358B (zh) * 2021-08-04 2021-12-07 中国测绘科学研究院 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN117273139A (zh) * 2023-11-21 2023-12-22 北京网智天元大数据科技有限公司 基于开放数据的知识图谱动态风险识别方法及装置
CN117273139B (zh) * 2023-11-21 2024-02-09 北京网智天元大数据科技有限公司 基于开放数据的知识图谱动态风险识别方法及装置

Similar Documents

Publication Publication Date Title
Shan et al. Disaster management 2.0: A real-time disaster damage assessment model based on mobile social media data—A case study of Weibo (Chinese Twitter)
CN112559756A (zh) 一种地震事件知识图谱构建方法、应用方法
Gordon et al. Reporting bias and knowledge acquisition
CN102937960B (zh) 突发事件热点话题的识别与评估装置
Yaqub et al. Analysis and visualization of subjectivity and polarity of Twitter location data
Liu et al. A search and summary application for traffic events detection based on twitter data
Gasco et al. Beyond sound level monitoring: Exploitation of social media to gather citizens subjective response to noise
CN112035658A (zh) 基于深度学习的企业舆情监测方法
CN105447080A (zh) 一种社区问答搜索中的查询补全方法
Maldonado et al. System for monitoring natural disasters using natural language processing in the social network Twitter
CN104142913A (zh) 词语极性的判别方法和判别系统
Farrall et al. Thatcherism, crime and the legacy of the social and economic ‘storms’ of the 1980s
Xia et al. Building terrorist knowledge graph from global terrorism database and wikipedia
CN116244446A (zh) 社交媒体认知威胁检测方法及系统
Bügel et al. Multilingual analysis of twitter news in support of mass emergency events
Sadr The use of LSTM neural network to detect fake news on persian twitter
Singh et al. Fighting for Information Credibility: AnEnd-to-End Framework to Identify FakeNews during Natural Disasters.
Brand et al. In case of doubt for the speculation? When people falsely remember facts in the news as being uncertain.
Fu et al. Mining newsworthy events in the traffic accident domain from Chinese microblog
Haider et al. Autonomous Eyewitness Identification by Employing Linguistic Rules for Disaster Events.
Gorodova et al. Artificial Intelligence Technologies Counteracting the Manipulation of People’s Conscience on Social Networks
Gurini et al. Trec microblog 2012 track: Real-time algorithm for microblog ranking systems
US11941052B2 (en) Online content evaluation system and methods
Scoville et al. The politicization of face masks in the American public sphere during the COVID-19 pandemic
Halterman Linking Events and Locations in Political Text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230828

Address after: Room 430, Cultural and Entertainment Center, No. 460 Wenyi West Road, Xihu District, Hangzhou City, Zhejiang Province, 310050

Applicant after: XINHUA ZHIYUN TECHNOLOGY Co.,Ltd.

Applicant after: Xinhua fusion media technology development (Beijing) Co.,Ltd.

Address before: Room 430, cultural center, 460 Wenyi West Road, Xihu District, Hangzhou City, Zhejiang Province, 310012

Applicant before: XINHUA ZHIYUN TECHNOLOGY Co.,Ltd.

Applicant before: New media center of Xinhua News Agency

TA01 Transfer of patent application right