CN113326358B - 基于知识图谱语义匹配的地震灾害信息服务方法和系统 - Google Patents

基于知识图谱语义匹配的地震灾害信息服务方法和系统 Download PDF

Info

Publication number
CN113326358B
CN113326358B CN202110889105.7A CN202110889105A CN113326358B CN 113326358 B CN113326358 B CN 113326358B CN 202110889105 A CN202110889105 A CN 202110889105A CN 113326358 B CN113326358 B CN 113326358B
Authority
CN
China
Prior art keywords
earthquake disaster
earthquake
disaster prevention
user
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110889105.7A
Other languages
English (en)
Other versions
CN113326358A (zh
Inventor
康风光
董春
谢炎宏
王亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN202110889105.7A priority Critical patent/CN113326358B/zh
Publication of CN113326358A publication Critical patent/CN113326358A/zh
Application granted granted Critical
Publication of CN113326358B publication Critical patent/CN113326358B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于知识图谱语义匹配的地震灾害信息服务方法和系统,该方法包括:构建地震灾害防治语料库;根据地震灾害防治语料库构建地震灾害防治知识图谱;根据用户输入的内容从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,本申请首先通过构建地震灾害防治语料库,比起通用的语料库针对性强,其次根据地震灾害防治语料库构建地震灾害防治知识图谱,从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,在语义匹配的基础上,通过知识图谱建立信息间的语义关联,依据用户输入内容,建立用户输入内容与地震灾害知识图谱中实体的信息匹配,从而得到答案信息,解决了用户检索意图与系统提供信息服务间差异过大的问题。

Description

基于知识图谱语义匹配的地震灾害信息服务方法和系统
技术领域
本发明涉及地震灾害技术领域,具体涉及基于知识图谱语义匹配的地震灾害信息服务方法和系统。
背景技术
目前,随着近十年来在地震灾害防灾减灾领域的大规模投入,众多学者在地震防御、灾情分析与防震救灾等方面的研究使得现有地震信息服务的深度与广度有很大程度的提高。然而,仍存在不足,一是现有信息匹配准确度不高,信息服务系统无法针对用户身处灾害场景条件提供最契合的抗震避难措施;二是针对地震防灾减灾信息服务过程中多类型数据间纷乱繁复的语义关联难以梳理;地震信息、场景、防灾策略知识间信息关联不足;用户检索意图与系统提供信息服务间差异过大的问题。
发明内容
本发明提供的基于知识图谱语义匹配的地震灾害信息服务方法和系统。能够解决用户检索意图与系统提供信息服务间差异过大的问题的技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明实施例提出了一种基于知识图谱语义匹配的地震灾害信息服务方法,包括:
构建地震灾害防治语料库;
根据地震灾害防治语料库构建地震灾害防治知识图谱;
根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息。
在一个实施例中,上述方法中根据用户输入的内容从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,包括:
对用户输入的内容进行拆解分析得到关键词且识别用户意图;
根据用户意图划分候选答案范围;
根据地震灾害防治语义网络建立用户输入关键词与候选答案范围中实体的信息匹配。
在一个实施例中,上述方法中地震灾害防治语义网络建立的步骤如下:
获取地震灾害防治语料库中的实体、关系、属性信息;
根据实体、关系、属性信息构造“实体—关系—实体”和“实体—属性—属性值”类型的三元组得到地震灾害防治语义网络;
其中,三元组之间依据语义关系互相关联。
在一个实施例中,上述方法中构建地震灾害防治语料库,包括:
获取地震灾害防治领域数据;
对地震灾害防治领域数据形式转装换、分词处理和去停用词处理建立地震灾害领域词典;
通过序列标注和类别标注相结合的方式,对地震灾害领域词典进行标注得到地震灾害防治语料库。
在一个实施例中,上述方法中根据所述地震灾害防治语料库构建地震灾害防治知识图谱,
包括:构建知识图谱模式层和构建知识图谱数据层,根据知识图谱模式层和知识图谱数据层构建地震灾害防治知识图谱。
在一个实施例中,上述方法中构建知识图谱模式层包括:
构建地震灾害防治领域本体库;
定义本体间的层次关系、语义关系和属性关系,形成实际场景为核心的地震灾害防治层次体系;
根据地震灾害防治层次体系自上而下构建知识图谱模式层;
其中,防治领域本体库包括:地震灾害事件、防震减灾策略、灾害数据和服务功能。
在一个实施例中,上述方法中构建知识图谱数据层包括:
基于地震灾害防治语料库中的语料,根据知识抽取、知识融合和知识推理技术,自下向上构建知识图谱数据层。
在一个实施例中,上述方法还包括:
将知识图谱模式层中的本体映射到知识图谱数据层的灾害数据实体中,建立知识图谱数据层与知识图谱模式层之间的映射;
运用Neo4j图数据库进行存储和直观展示。
在一个实施例中,上述方法中的
地震灾害事件包括:地震灾害信息、次生灾害信息、应急管理信息和防震减灾信息;
实际场景包括:地点类型、地形地貌、灾害情况和附近风险;
防震减灾策略本体包括:地震灾害应急预案、决策调度、防御措施和减轻对策;
服务功能包括:地震监测预警、地震灾害防御和日常功能服务
地震灾害数据包括:基础地理信息数据、历史地震灾情数据、社会经济数据以及地震监测数据。
第二方面,本发明实施例提供了一种基于知识图谱语义匹配的地震灾害信息服务系统,包括:
第一构建模块:用于构建地震灾害防治语料库;
第二构建模块:用于根据所述地震灾害防治语料库构建地震灾害防治知识图谱;
语义匹配模块:用于根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息。
本发明的有益效果是:基于知识图谱语义匹配的地震灾害信息服务方法和系统,该方法包括:构建地震灾害防治语料库;根据地震灾害防治语料库构建地震灾害防治知识图谱;根据用户输入的内容从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,本申请构建地震灾害防治语料库,只包括地震灾害防治语料,比起通用的语料库针对性强,根据地震灾害防治语料库构建地震灾害防治知识图谱,从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,在语义匹配的基础上,通过知识图谱建立信息间的语义关联,依据用户输入内容,建立用户输入内容与地震灾害知识图谱中实体的信息匹配,从而得到答案信息,解决了用户检索意图与系统提供信息服务间差异过大的问题。
附图说明
图1为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图一;
图2为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图二;
图3为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图三;
图4为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图四;
图5为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图五;
图6为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图六;
图7本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务系统图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本公开,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
图1为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图一。
第一方面,本发明实施例提出了一种基于知识图谱语义匹配的地震灾害信息服务方法,结合图1,包括S101、S102和S103三个步骤:
S101:构建地震灾害防治语料库;
具体的,本申请实施例中的地震灾害防治语料库只包括地震灾害防治语料,比起通用的语料库针对性强,数据特点更为统一,更便于后续的使用与分析。构建地震灾害防治语料库具体包括获取地震灾害防治领域数据;对地震灾害防治领域数据形式转换、分词处理、去停用词、建立地震灾害领域词典;通过序列标注和类别标注相结合的方式,对地震灾害领域词典进行标注得到地震灾害防治语料库,下文结合步骤S401、S402和S403对构建步骤进行详细说明。
S102:根据地震灾害防治语料库构建地震灾害防治知识图谱。
具体的,本申请实施例中根据地震灾害防治语料库构建地震灾害防治知识图谱模式层和地震灾害防治知识图谱数据层;建立地震灾害防治知识图谱模式层与地震灾害防治知识图谱数据层间逻辑的映射,从而建立地震灾害防治知识图谱。
S103:根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息。
具体的,本申请实施例中如用户输入的内容为“教学楼里如何进行避险”从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,将对应的答案信息反馈给用户。
图2为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图二。
在一个实施例中,结合图2,上述方法中S103根据用户输入的内容从地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,包括S201、S202和S203三个步骤:
S201:对用户输入的内容进行拆解分析得到关键词且识别用户意图。
具体的,本申请实施例中的拆解分析可以是通过分词、消歧和关键词识别,对用户输入的内容进行拆解分析获取其关键词,识别用户输入内容对应的用户意图,具体的,用户输入的内容可以理解为问题,可以是通过问题匹配模板和问题分类器拆解分析用户输入的内容关键词及用户意图。
S202:根据用户意图划分候选答案范围。
具体的,本申请实施例中依据用户意图划分候选答案范围,应理解,本申请中候选答案的范围以地震灾害防治知识图谱为结构基础,通过问题分类器中关键词和问题需求匹配模板,在地震灾害防治知识图谱中分析用户所处实际场景和用户意图,从而筛选对应防震减灾策略得到候选答案范围。
S203:根据地震灾害防治语义网络建立用户输入关键词与候选答案范围中实体的信息匹配。
具体的,本申请实施例中在划定了候选答案范围后,依据关键词和意图信息,在地震灾害防治知识图谱中对地震相关实体进行筛选匹配,得出对应的多个信息实体,并根据地震灾害防治语义网络建立多个信息实体之间的语义关联后,将这条语义关系链上的防震减灾信息实体返回给用户得到用户输入的内容对应的答案信息。
如:用户问题“教学楼里如何进行避险”,依据“避险”这一关键词,确定用户意图属于个人防震避难措施,进而,通过关键词“教学楼”确定用户问题所对应的场景实体为学校,形成信息实体对“校园—避难—”对知识图谱进行检索,通过在防震减灾策略下实体结构的筛选,得出候选答案为几种候选三元组形式,如“校园—避难场所—操场”,“学校—避难方法—迅速抱头、闭眼、蹲到各自的课桌下,地震一停,迅速有秩序撤离”。根据地震灾害防治语义网络建立用户输入关键词与候选答案范围中实体的信息匹配。对候选答案进行进一步筛选匹配得到答案信息,将答案信息反馈给用户。
图3为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图三。
在一个实施例中,结合图3,上述步骤S203中地震灾害防治语义网络建立包括S301和S302两个步骤:
S301:获取地震灾害防治语料库中的实体、关系、属性信息。
具体的,本申请实施例中运用知识抽取获取语料中的实体、关系、属性信息,首先采用人工序列标注进行训练样本标注,运用基于神经网络的命名实体识别和关系分类模型相结合的方法,实现对地震灾害防治三元组信息的抽取。应理解,人工序列标注方法,如字面意思,手动对语料库中的实体信息、语义关系和实体属性进行标注,最终统一抽取。在知识抽取领域,人工标注方法具有高识别率和高准确度的特点,但同时,其标注效率较为低下,且花费较高,因此,本申请中只用于训练样本的标注。其次,运用命名实体识别和关系抽取模型相结合的三元组抽取方法进行知识抽取实体、关系、属性信息。
S302:根据实体、关系、属性信息构造“实体—关系—实体”和“实体—属性—属性值”类型的三元组得到地震灾害防治语义网络。
其中,三元组之间依据语义关系互相关联。
具体的,本申请实施例中抽取语料库中的实体、关系、属性信息,构造地震灾害信息三元组,因为三元组间依据语义关系互相关联,从而构造地震灾害防治语义网络。
图4为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图四。
在一个实施例中,结合图4,上述方法中构建地震灾害防治语料库,包括S401、S402和S403三个步骤:
S401:获取地震灾害防治领域数据。
具体的,本申请实施例中获取地震灾害防治领域数据可以是应用爬虫、API接口、数据库资料调用等技术手段,获取对应领域相关文本资料,得到地震灾害防治领域数据。
S402:对地震灾害防治领域数据形式转换、分词处理、去停用词建立地震灾害领域词典。
具体的,本申请实施例中,数据形式转换部分主要包括语言转换、繁简转换和编码方式转换。以实现地震灾害语料在语言形式上统一表现为简体中文,在编码方式上统一为“UTF-8”,解决数据来源多样造成的地震灾害信息格式混乱问题。
具体的,本申请实施例中,分词处理通过对地震灾害语料内容的句式结构进行分析,结合每个词的词性、词义,对句子成分进行分解,标识出各部分的词性以及其中的人名、地名和领域专有名词等特殊词汇。通过分词处理有效的提升了地震领域专有名词的分词准确率。
具体的,本申请实施例中,去停用词是在分词处理后,对文本中语气词、助词等无实际意义内容进行去除的操作,进一步提升了地震灾害领域词典的准确率。
应理解,对地震灾害防治领域数据形式转换、分词处理、去停用词建立地震灾害领域词典,地震灾害领域词典是语义匹配系统中关键词识别和候选答案划分的数据基础。
S403:通过序列标注和类别标注相结合的方式,对地震灾害领域词典进行标注得到地震灾害防治语料库。
具体的,本申请实施例中,对地震灾害领域词典进行标注得到地震灾害防治语料库是依据用户实际需求对感兴趣内容进行标注,通过序列标注和类别标注相结合的方式对地震灾害领域词典进行标注,标注完成后,对标注完的地震灾害领域词典,经过检验后,汇总得到地震灾害防治语料库。
具体的,本申请实施例中,序列标注是通过对地震灾害防治语料库的每个字词位序列进行标注,将核心词特征传递给实体识别函数进行学习,通过估计标注内容为特征序列的条件概率,从而辅助知识识别算法进行实体信息标注。类别标注则是通过对获取的语料的分析,将其划分到事前规定语料库数据类别中并进行类别信息的标注。类别信息的标注主要涉及粗粒度标注和人工细粒度校对两个步骤,通过地震灾害防治领域数据,确定地震灾害语料的大致类别范围,并进行标记,其后通过人工手段对其进行检验和纠正,提升了地震灾害防治语料库的准确率。
在一个实施例中,上述方法中根据地震灾害防治语料库构建地震灾害防治知识图谱,
包括:构建知识图谱模式层和知识图谱构建数据层,根据知识图谱模式层和知识图谱数据层构建地震灾害防治知识图谱。
具体的,本申请实施例中的基于实际场景的地震灾害防治本体,自上而下构建知识图谱的模式层,基于地震灾害语料库中语料,运用知识抽取、知识融合和知识推理技术,自下向上构建知识图谱数据层。依据地震信息三元组间语义关联,建立地震信息、场景和防震策略间语义网络,从而实现模式层和数据层间逻辑关系的映射,建立地震灾害防治知识图谱。
图5为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图五。
在一个实施例中,上述方法中构建知识图谱模式层包括:S501、S502和S503三个步骤:
S501:构建地震灾害防治领域本体库。
S502:定义本体间的层次关系、语义关系和属性关系,形成实际场景为核心的地震灾害防治层次体系。
具体的,本申请实施例中通过基于地震专业词典归纳灾害防治领域概念,以丰富本体内容,构建地震灾害防治领域本体库,然后定义各个本体间的层次关系、语义关系、属性关系,形成实际场景出发的地震灾害防治层次体系,进而构建地震灾害防治模式层。
S503:根据防治层次体系自上而下构建知识图谱模式层。
其中,地震灾害防治领域本体库包括:地震灾害事件、防震减灾策略、灾害数据和服务功能。
具体的,本申请实施例中在地震灾害防治领域本体库的基础上,面向校园、社区、机关等多种具有差异化的实际场景,围绕地震灾害事件、防震减灾策略、灾害数据和服务功能四个核心要素,设计地震灾害防治知识图谱模式层。
在一个实施例中,上述方法中构建知识图谱数据层包括:
基于地震灾害防治语料库中的语料,根据知识抽取、知识融合和知识推理技术,自下向上构建知识图谱数据层。
具体的,本申请实施例中在上述构建的模式层的指导下,运用知识抽取、知识融合和知识推理技术,获取地震灾害信息三元组,构造“实体—关系—属性”或“实体—关系—实体”形式的基础三元组后,建立三元组间的语义关联网络,并依据地震灾害防治知识图谱模式层中本体层次体系对数据层实体的约束,自下向上构建知识图谱数据层。
图6为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务方法图六。
在一个实施例中,结合图6,上述方法中构建数据层还包括S601和S602两个步骤:
S601:将模式层中的本体映射到数据层的灾害数据实体中,建立数据层与模式层之间的映射;
S602:运用Neo4j图数据库进行存储和直观展示。
具体的,本申请实施例中构造“实体—关系—属性”或“实体—关系—实体”形式的基础三元组后,以csv文件形式分别存储不同类型的实体与语义关系数据,将以csv文件形式分别不同类型的实体与语义关系数据导入neo4j图数据库中,以节点、边和字段的形式存储,建立三元组间的语义关联网络,依据地震灾害防治模式层中本体层次体系对数据层实体的约束,建立地震灾害事件、防震减灾策略、地震灾害数据和功能服务实体类别之间的实体映射,从而建立地震灾害防治知识图谱并进行展示。
在一个实施例中,上述方法中的地震灾害事件包括:地震灾害信息、次生灾害信息、应急管理信息和防震减灾信息;实际场景包括:地点类型、地形地貌、灾害情况和附近风险;防震减灾策略本体包括:地震灾害应急预案、决策调度、防御措施和减轻对策;服务功能包括:地震监测预警、地震灾害防御和日常功能服务;地震灾害数据包括:基础地理信息数据、历史地震灾情数据、社会经济数据以及地震监测数据。
具体的,本申请实施例中的地震灾害信息包括:地震灾害发生时间、地点等基本属性和受灾情况;次生灾害信息包括:次生灾害的基本属性和可能造成的影响;应急管理信息包括:应急预案、决策调度、历史救援案例等;
防震减灾信息包括:群众集体疏散避难及应对措施信息。
具体的,本申请实施例中的地点类型包括:机关、社区、学校、医院、闹市区、广场、火车站、乡村等;地形地貌包括:平原、丘陵、山地、盆地、高原、水边等;灾害情况包括:震中位置、震源深度、震级、波及范围、断裂方向等;附近风险包括:水坝、加油站、水库、泥石流风险、化工厂等。
具体的,本申请实施例中的防灾减灾策略本体中的地震灾害应急预案、决策调度、防御措施和减轻对策;包含当前制定的相关标准和法律法规,以及一些具有大范围通用性的抗震防灾策略;区域层面的实体主要包含面向场景的防震策略或具有区域适用性的策略规划,包含地区防震减灾规划和面向不同地理条件、面向多种实际应用场景的区域防震减灾处理预案;个人层面的内容主要是从微观角度出发,以提高居民个人抗震设防能力为目标的防灾措施,包含面向地震及次生灾害的日常防范策略和不同场景下不同群体民众的避震防护自救措施。
具体的,本申请实施例中日常功能服务对应普通用户,主要提供抗震减灾基础知识及自救手段;地震监测预警对应应急行动用户,为区域性管理者提供地震监测信息,为其防震避难提供提前预警;地震灾害防御面向决策层用户,通过知识图谱现有应急预案和灾情信息,辅助其在宏观角度进行抗震决策。
具体的,本申请实施例中的基础地理信息数据、历史地震灾情数据、社会经济数据以及地震监测数据可根据灾害信息产品实际数据情况向下继续划分小类,数据类型涵盖文本、数据、表格、图片等多种数据形式。灾害数据实体的属性包括名称、时间范围、数据类型、数据描述等内容,通过上述属性对地震灾害数据实体进行全面的描述。
图7为本发明实施例提供的基于知识图谱语义匹配的地震灾害信息服务系统图;
第二方面,结合图7,本发明实施例提供了一种基于知识图谱语义匹配的地震灾害信息服务系统,包括:
第一构建模块701:用于构建地震灾害防治语料库。
具体的,本申请实施例中的地震灾害防治语料库只包括地震灾害防治语料,比起通用的地震灾害防治语料库针对性强,数据特点更为统一,更便于后续的使用与分析。第一构建模块701构建地震灾害防治语料库具体包括获取地震灾害防治领域数据;对地震灾害防治领域数据形式转换、分词处理、去停用词、建立地震灾害领域词典;通过序列标注和类别标注相结合的方式,对地震灾害领域词典进行标注得到地震灾害防治语料库。
第二构建模块702:用于根据所述地震灾害防治语料库构建地震灾害防治知识图
具体的,本申请实施例中第二构建模块702根据地震灾害防治语料库构建地震灾害防治知识图谱模式层和知识图谱数据层;建立模式层与数据层间逻辑的映射,从而建立地震灾害防治知识图谱。
语义匹配模块703:用于根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息。
具体的,本申请实施例中如用户输入的内容为“教学楼里如何进行避险”语义匹配模块703从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,将对应的答案信息反馈给用户。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,包括:
构建地震灾害防治语料库;
根据所述地震灾害防治语料库构建地震灾害防治知识图谱;
根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配所述用户输入的内容对应的答案信息;
所述根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配用户输入的内容对应的答案信息,包括:
对所述用户输入的内容进行拆解分析得到关键词且识别用户意图;
根据所述用户意图划分候选答案范围;
根据地震灾害防治语义网络建立用户输入关键词与所述候选答案范围中实体的信息匹配;
其中,对所述用户输入的内容进行拆解分析得到关键词且识别用户意图,包括:通过问题匹配模板和问题分类器拆解分析用户输入的内容得到关键词及用户意图;
根据用户意图划分候选答案范围,包括:通过所述问题分类器和所述问题需求匹配模板,在地震灾害防治知识图谱中分析用户所处实际场景和用户意图,从而筛选对应防震减灾策略得到候选答案范围。
2.根据权利要求1所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,地震灾害防治语义网络建立的步骤如下:
获取地震灾害防治语料库中的实体、关系、属性信息;
根据所述实体、关系、属性信息构造“实体—关系—实体”和“实体—属性—属性值”类型的三元组得到地震灾害防治语义网络;
其中,所述三元组之间依据语义关系互相关联。
3.根据权利要求1所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,所述构建地震灾害防治语料库,包括:
获取地震灾害防治领域数据;
对所述地震灾害防治领域数据形式转换、分词处理和去停用词处理建立地震灾害领域词典;
通过序列标注和类别标注相结合的方式,对所述地震灾害领域词典进行标注得到地震灾害防治语料库。
4.根据权利要求1所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,所述根据所述地震灾害防治语料库构建地震灾害防治知识图谱,包括构建知识图谱模式层和构建知识图谱数据层,根据所述知识图谱模式层和所述知识图谱数据层构建地震灾害防治知识图谱。
5.根据权利要求4所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,所述构建知识图谱模式层包括:
构建地震灾害防治领域本体库;
定义所述本体间的层次关系、语义关系和属性关系,形成实际场景为核心的地震灾害防治层次体系;
根据所述地震灾害防层次体系自上而下构建知识图谱模式层;
其中,所述防治领域本体库包括:地震灾害事件、防震减灾策略、灾害数据和服务功能。
6.根据权利要求4所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,所述构建知识图谱数据层包括:
基于地震灾害防治语料库中的语料,根据知识抽取、知识融合和知识推理技术,自下向上构建知识图谱数据层。
7.根据权利要求4所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,所述方法还包括:
将所述知识图谱模式层中的本体映射到所述数据层的灾害数据实体中,建立知识图谱数据层与知识图谱模式层之间的映射;
运用Neo4j图数据库进行存储和直观展示。
8.根据权利要求5所述的基于知识图谱语义匹配的地震灾害信息服务方法,其特征在于,
所述地震灾害事件包括:地震灾害信息、次生灾害信息、应急管理信息和防震减灾信息;
所述实际场景包括:地点类型、地形地貌、灾害情况和附近风险;
所述防震减灾策略本体包括:地震灾害应急预案、决策调度、防御措施和减轻对策;
所述服务功能包括:地震监测预警、地震灾害防御和日常功能服务
所述地震灾害数据包括:基础地理信息数据、历史地震灾情数据、社会经济数据以及地震监测数据。
9.基于知识图谱语义匹配的地震灾害信息服务系统,其特征在于,包括:
第一构建模块:用于构建地震灾害防治语料库;
第二构建模块:用于根据所述地震灾害防治语料库构建地震灾害防治知识图谱;
语义匹配模块:用于根据用户输入的内容从所述地震灾害防治知识图谱中语义匹配所述用户输入的内容对应的答案信息;
所述语义匹配模块还用于:对所述用户输入的内容进行拆解分析得到关键词且识别用户意图;
根据所述用户意图划分候选答案范围;
根据地震灾害防治语义网络建立用户输入关键词与所述候选答案范围中实体的信息匹配;
其中,对所述用户输入的内容进行拆解分析得到关键词且识别用户意图,包括:通过问题匹配模板和问题分类器拆解分析用户输入的内容得到关键词及用户意图;
根据用户意图划分候选答案范围,包括:通过所述问题分类器和所述问题需求匹配模板,在地震灾害防治知识图谱中分析用户所处实际场景和用户意图,从而筛选对应防震减灾策略得到候选答案范围。
CN202110889105.7A 2021-08-04 2021-08-04 基于知识图谱语义匹配的地震灾害信息服务方法和系统 Active CN113326358B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110889105.7A CN113326358B (zh) 2021-08-04 2021-08-04 基于知识图谱语义匹配的地震灾害信息服务方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110889105.7A CN113326358B (zh) 2021-08-04 2021-08-04 基于知识图谱语义匹配的地震灾害信息服务方法和系统

Publications (2)

Publication Number Publication Date
CN113326358A CN113326358A (zh) 2021-08-31
CN113326358B true CN113326358B (zh) 2021-12-07

Family

ID=77427057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110889105.7A Active CN113326358B (zh) 2021-08-04 2021-08-04 基于知识图谱语义匹配的地震灾害信息服务方法和系统

Country Status (1)

Country Link
CN (1) CN113326358B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113806487B (zh) * 2021-09-23 2023-09-05 平安科技(深圳)有限公司 基于神经网络的语义搜索方法、装置、设备和存储介质
CN114186759A (zh) * 2022-02-16 2022-03-15 杭州杰牌传动科技有限公司 基于减速机知识图谱的物料调度控制方法及其系统
CN114218406A (zh) * 2022-02-17 2022-03-22 杭州杰牌传动科技有限公司 基于传动知识图谱的传动解决方案生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992672A (zh) * 2019-04-11 2019-07-09 华北科技学院 基于灾害场景的知识图谱构建方法
CN110427478A (zh) * 2019-08-12 2019-11-08 南京邮电大学 一种基于知识图谱的问答搜索方法及系统
CN112463992A (zh) * 2021-02-04 2021-03-09 中至江西智能技术有限公司 基于麻将领域知识图谱的决策辅助自动问答方法及系统
CN112559756A (zh) * 2020-08-07 2021-03-26 新华智云科技有限公司 一种地震事件知识图谱构建方法、应用方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8510321B2 (en) * 2006-08-03 2013-08-13 International Business Machines Corporation Information retrieval from relational databases using semantic queries

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992672A (zh) * 2019-04-11 2019-07-09 华北科技学院 基于灾害场景的知识图谱构建方法
CN110427478A (zh) * 2019-08-12 2019-11-08 南京邮电大学 一种基于知识图谱的问答搜索方法及系统
CN112559756A (zh) * 2020-08-07 2021-03-26 新华智云科技有限公司 一种地震事件知识图谱构建方法、应用方法
CN112463992A (zh) * 2021-02-04 2021-03-09 中至江西智能技术有限公司 基于麻将领域知识图谱的决策辅助自动问答方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜志强 等.自然灾害应急知识图谱构建方法研究.《武汉大学学报•信息科学版》.2020,第45卷(第9期), *

Also Published As

Publication number Publication date
CN113326358A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN113326358B (zh) 基于知识图谱语义匹配的地震灾害信息服务方法和系统
CN108073569B (zh) 一种基于多层级多维度语义理解的法律认知方法、装置和介质
CN110334212A (zh) 一种基于机器学习的领域性审计知识图谱构建方法
CN109614501A (zh) 一种基于知识图谱的工业隐患规范化上报方法及系统
Fan et al. A system analytics framework for detecting infrastructure-related topics in disasters using social sensing
CN113779358B (zh) 一种事件检测方法和系统
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
Abalı et al. Detecting citizen problems and their locations using twitter data
Yao et al. Weakly-supervised fine-grained event recognition on social media texts for disaster management
CN116595155A (zh) 基于标准数字化的突发事件智能应急辅助决策方法和系统
Khatoon et al. Development of social media analytics system for emergency event detection and crisismanagement
Chaparro et al. Quantifying perception of security through social media and its relationship with crime
CN113407726A (zh) 一种应急处置预案方法和系统
CN113360480B (zh) 地震防治主题库构建方法、系统、电子设备及存储介质
CN116186422A (zh) 基于社交媒体和人工智能的疾病相关舆情分析系统
CN111949781B (zh) 一种基于自然语句句法分析的智能交互方法及装置
CN112988972A (zh) 一种基于数据模型的行政处罚案卷评查方法及系统
Tikhonova et al. Detecting a citizens' activity profile of an urban territory through natural language processing of social media data
CN112241446A (zh) 一种大数据下基于学生画像的精准资助系统
Dashdorj et al. High‐level event identification in social media
Syliongka et al. Combining automatic and manual approaches: Towards a framework for discovering themes in disaster-related Tweets
Shamoug et al. Information Retrieval for Humanitarian Crises via a Semantically Classified Word Embedding
de Lima et al. Geographic information extraction using natural language processing in Wikipedia texts.
Subowo et al. Prediction Meaning of Words with Word2Vec on Whatsapp Data for Disaster Topic
Rudra et al. EUDETECTOR: Leveraging Language Model to Identify EU-Related News

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant