CN109947916A - 基于气象领域知识图谱的问答系统装置及问答方法 - Google Patents

基于气象领域知识图谱的问答系统装置及问答方法 Download PDF

Info

Publication number
CN109947916A
CN109947916A CN201910153832.XA CN201910153832A CN109947916A CN 109947916 A CN109947916 A CN 109947916A CN 201910153832 A CN201910153832 A CN 201910153832A CN 109947916 A CN109947916 A CN 109947916A
Authority
CN
China
Prior art keywords
weather
answer
type
knowledge mapping
slot position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910153832.XA
Other languages
English (en)
Other versions
CN109947916B (zh
Inventor
江跃华
周二亮
刘伟
朱玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Shangyun Information Technology Co Ltd
Original Assignee
Hebei Shangyun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Shangyun Information Technology Co Ltd filed Critical Hebei Shangyun Information Technology Co Ltd
Priority to CN201910153832.XA priority Critical patent/CN109947916B/zh
Publication of CN109947916A publication Critical patent/CN109947916A/zh
Application granted granted Critical
Publication of CN109947916B publication Critical patent/CN109947916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于自然语言处理的问答系统领域,尤其涉及气象问答领域的方法及装置。装置包括:气象领域的知识图谱构建模块,问题解析模块,数据聚合模块,答案生成模块。该系统接收用户提出的问题,并通过问题解析模块使用自然语言处理的方式解析用户所提出的关于天气的问题,并排除不合理的问题;根据知识图谱中所存储的天气知识来判断实时的天气数据是否符合该天气信息,根据用户所提的问题,生成相应的答案,反馈给用户。对于结构不固定,类型多样的天气、生活和其他类的规则,可以方便的进行存储与查询。

Description

基于气象领域知识图谱的问答系统装置及问答方法
技术领域
本发明属于自然语言处理的问答系统领域,尤其涉及气象问答领域的方法及装置。
背景技术
问答系统是信息检索的一种高级形式,以其简单、准确的互动方式深受人类青睐,在人工智能的大时代下,问答系统的智能化也成为研究热点。20世纪80年代,LENAT等发起的Cyc研究项目,将问答系统带入“知识原则”的时代,在知识库的基础上进行自然语言的理解、学习及问答研究。20世纪90年代,国内的许多研究者也开始知识库的建设研究工作。
科学知识图谱将复杂的科学知识领域通过数据挖掘、信息处理、知识计量和图形绘制,以可视化的方式显示科学知识的发展进程与结构关系,揭示科学知识及其活动规律,展现知识结构关系与演进规律。构建知识图谱,突破知识库发展瓶颈成为这场变革的重中之重。
天气时刻伴随着我们的生活,应用天气预报可以及时了解天气的趋势,给人们的工作、出行、旅游、化妆、洗车、运动生活等带来乐趣和便利,所以应用前景广阔。
发明内容
本发明所要解决的技术问题主要是将气象领域的知识图谱,引入人机问答系统中,进而使机器能够理解用户所提出的气象领域的问题并做出回答。
为解决上述技术问题,本发明系统实施提供了基于气象领域知识图谱的问答系统装置,其特征在于,包括:
气象领域的知识图谱构建模块,用以将气象领域的专业知识转换为实体,实体和实体之间用与或关系进行链接,构建气象领域天气知识的知识图谱;用于所有天气知识转成三元组,人工构建天气的气象判断规则,存储到图数据库中并组成三元组;
问题解析模块,用于解析用户所提出的关于天气的问题,将用户提出的问题进行分词和预处理,根据分得的词汇的词性和该词汇对应自定义词库的类别作为依据,填充在该模块设置的问题槽位,并排除不合理的问题;
数据聚合模块,用于对问题槽位中的词,通过词的相似度计算方式,选取与知识图谱中最匹配的规则,进而判断实时的天气数据是否符合该规则,并将天气数据和多种判断结果存入该模块设置的答案槽位中;
答案生成模块,用于将数据聚合模块中答案槽位的数据取出,并根据答案的类型生成相应的回答;对于各个类型的答案进行组合时,需要对每个类型的答案进行排序;最后将答案反馈给用户。
进一步的,实时的天气数据来源于在线的第三方接口平台。
进一步的,用户提出的问题可划分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣。
进一步的,问题槽位所设置的形式包括(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型)。
进一步的,答案槽位形式为(时间及其属性;地点及其属性;天气数据和判断结果;生活和判断结果;其他;问题类型)。
进一步的,气象判断规则划分为时间类型、地点类型、天气类型、生活类型、其他类型。
进一步的,答案生成模块中预先定义有答案模板,用于产生答案时使用该模板,仅需将采集的天气数据替换到该模板中对应位置即可产生相应的答案。
进一步的,在问题解析模块中使用分词软件进行分词之前,预加载本地的自定义词库;该本地的自定义词库按行读取文本内容并添加到分词软件的自定义词库中;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词汇。
进一步的,问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词汇,以及将这五种类型词组合后缺少时间类型或地点类型的词汇的问题槽位对应的问题为不合理的问题。
进一步的,数据聚合模块还用于训练词向量模型;用于在知识图谱中查询相似度最高的节点;用于将查询后的所有路径信息转换成树形结构的路径;用于遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;还用于提前计算重要天气信息,若存在,则填充到答案槽位中。
进一步的,使用判断函数计算实时的天气数据是否符合其规则天气知识图谱中所存储的天气知识时,没有在原始数据中直接给出的天气数据通过自定义函数计算。
基于气象领域知识图谱的问答系统的问答方法,使用所述的基于气象领域知识图谱的问答系统装置,
人工构建气象领域的天气知识图谱;
接收用户提出的问题,并通过问题解析模块使用自然语言处理的方式解析用户所提出的关于天气的问题,填充问题槽位,并排除不合理的问题;
使用问题槽位中的词,通过词的相似度计算方式,选取知识图谱中最匹配的规则,进而使用判断函数判断实时的天气数据是否符合该规则,并将天气数据和多种判断结果存入答案槽位中;
根据用户所提的问题,将答案槽位中的数据填充到答案模板中,生成相应的答案,反馈给用户。
进一步的,人工构建知识图谱的步骤包括:将气象领域的专业知识转换为实体;再将实体和实体之间用与或关系进行链接;将所有天气知识转成三元组后,存储到图数据库中。
进一步的,用户提出的问题可分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣。
进一步的,实时的天气数据来源于在线的第三方接口平台。
进一步的,问题解析的步骤包括:
a)设置问题槽位的形式为(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型);
b)解析用户所提出的关于天气的问题,使用分词软件对用户所输入的问题进行分词,然后按分得的词汇特征信息填充到问题槽位中;
c)根据填充后的问题槽位判断,是否为满足合理的条件,对于判断为不合理的问题,结束当前流程并告知用户修改所提问题。
进一步的,对用户所输入的问题使用开源的第三方分词软件进行分词,在分词之前,会加载本地的自定义词库,按行读取文本内容;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词。
进一步的,不合理的问题包括填充后的问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词语的问题,以及将这五种类型的词组合后仍缺少时间类或地点类的问题。
进一步的,根据天气知识图谱中所存储的天气知识和天气实时数据进行判断的步骤为:
a)在计算词的相似度前,需要先训练词向量模型,只需训练一次即可,对于问题槽位中各个类型的词,在词向量模型中找到对应的词向量;
b)得到输入词汇的词向量后,在气象领域的知识图谱中找出与该词向量相似度最高的节点;
c)根据选择的节点,使用查询语法,将天气的规则路径从图数据库中取出,再将所有规则路径转换成树形结构的路径;
d)数据聚合模块会遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;
e)答案槽位定义为(时间及其属性;地点及其属性;天气数据和判断结果;生活和判断结果;其他;问题类型),其中,时间及其属性、地点及其属性、其他和问题类型由问题槽位中对应的词汇,经过查询知识图谱后得到,对于用户查询的天气和生活需要按照a-d步骤进行查询、计算并聚合,填充到答案槽位中。
进一步的,根据天气知识图谱中所存储的天气知识和天气实时数据进行判断过程中,当使用判断函数时,有的天气数据并没有在原始数据中直接给出,通过自定义函数计算得出。
进一步的,答案生成的步骤为:
a)将产生的答案槽位的内容取出,并根据答案的类型选择不同的答案模板;
b)使用预先定义好的模板,在生成时,只需将采集的天气数据替换到该模板中对应位置,即可产生相应的答案;
c)对于各个类型的答案进行组合时,需要将对日常生活有较大影响的答案内容,排到前面。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
使用知识图谱进行知识的存储和管理,对于问答系统的准确性和速度,有一定的提升。尤其对于结构不固定,类型多样的天气、生活和其他类的规则,可以方便的进行存储与查询。
天气信息与我们的生活息息相关,基于知识图谱的天气问答系统的应用将会给人们的工作、出行、旅游、运动等提供便利性,应用前景广阔。
相比于现有的其他技术,在使用时天气信息需要用户自行搜索,且对于重要的天气信息无法做出排序,对于用户所关心的出行、穿衣等方面的建议,需要用户自行发现与挖掘。问答系统采用一问一答形式,返回的内容按重要性进行排序,对于用户所提的生活类问题,可以提出合理的建议,对于重要天气信息,可以及时提醒用户。
附图说明
图1是根据本发明实施例的天气问答系统的方法的主要步骤的示意图。
图2是根据本发明实施例的天气问答系统的方法的具体流程示意图。
图3是根据本发明实施例的天气问答系统的装置的主要模块的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
本发明公开一种基于气象领域知识图谱的问答系统的问答方法,利用上述的装置,人工构建气象领域的天气知识图谱;接收用户提出的问题,并通过问题解析模块使用自然语言处理的方式解析用户所提出的关于天气的问题,并排除不合理的问题;根据知识图谱中所存储的天气知识来判断实时的天气数据是否符合该天气信息,并将天气数据和多种判断结果存入聚合数据字典,以供后续使用;根据用户所提的问题,将聚合数据字典填充到答案模板中,生成相应的答案,反馈给用户。
包括针对气象领域的天气知识构建知识图谱。使用自然语言处理的方式解析用户所提出的关于天气的问题,并排除不合理的问题,根据知识图谱中所存储的天气知识和实时的天气数据进行计算并聚合数据,根据用户所提的问题,生成相应的答案。
气象领域的知识图谱使用的人工构建方式,将判断天气的规则抽象成三元组存储到图数据库中。人工构建知识图谱的步骤包括:将气象领域的专业知识转换为实体;再将实体和实体之间用与或关系进行链接;将所有天气知识转成三元组后,存储到图数据库中。除实体中本身固有的属性值以外,还将赋予每个实体一个对用户日常生活影响程度的整数型属性值,该值由人工确定,值越大,表示影响程度越大。
解析问题包括:使用分词软件对用户所输问题分词,判断所分得词汇属于哪些问题槽位。问题槽位定义为(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型),解析问题时需要将各个元素填充到所有槽位中。当用户提出的问题明显不合理时,排除该问题。排除不合理的问题,需要根据所填充的槽位信息,例如若只是填充(生活,其他)这类的问题将会排除掉。
在解析问题填充槽位时,会加载一些自定义的词库,包括时间类型、天气类型、地点类型、生活类型的词库,辅助系统能更精确的解析问题。
问题解析的步骤包括:设置问题槽位的形式为(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型);解析用户所提出的关于天气的问题,使用分词软件对用户所输入的问题进行分词,然后按词汇特征信息填充到问题槽位中;根据填充后的问题槽位判断,是否为满足合理的条件,对于判断为不合理的问题,结束当前流程并告知用户修改所提问题。对用户所输入的问题使用开源的第三方分词软件进行分词,在分词之前,会加载本地的自定义词库,按行读取文本内容;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词。不合理的问题包括填充后的问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词语的问题,以及将这六种类型的词组合后仍缺少时间类或地点类的问题。
用户提出的问题类型分为五类:天气详情、被查询天气详情、天气属性、出行、穿衣。
天气的实时数据来源于在线的第三方接口平台,该平台提供了天气预测信息、每隔三小时的预测信息以及当前时刻的天气信息。
在根据天气知识图谱和天气实时数据进行计算的时候,需要先从图数据库中使用查询语法,将天气的判断规则从中取出。
对于取出的天气判断规则需要先转换成树形结构,其中树的根节点为查询的天气,叶子节点包含具体的天气属性规则,例如:72小时内最低温度降幅大于等于12、48小时内最低温度降幅大于等于10。节点与节点之间使用与或关系互相链接。
由于用户输入的词语可能在系统中是为录入,或查询不到。所以在使用查询数据时,使用该查询的天气的词向量选取查询最相似的节点。
在使用天气规则进行判断时,需要进行深度遍历,当遍历到叶子节点时,需要对叶子节点的内容解析并查询相应时间段内的天气数据,并返回这段天气数据是否满足条件,最后将判断后的结果返回到上一层,接着遍历其他叶子节点,直到遍历完成整个规则树。
除了要查询用户所输入的天气,还需要查询其他重要的天气信息,例如寒潮、暴雨、冰雹等。以便提前告知用户预防。
根据天气知识图谱中所存储的天气知识和天气实时数据进行判断的步骤为:对于用户输入的词语在词向量模型中找出词向量;得到输入词汇的词向量后,找出与输入词汇的词向量相似度最高的节点;根据选择的节点,使用查询语法,将天气的判断规则从图数据库中取出;再将所有路径转换成树形结构的路径;用于遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;答案槽位定义为(时间及其属性;地点及其属性;天气数据和判断结果;生活和判断结果;其他;问题类型),对于用户查询的天气和生活需要按照上述步骤进行查询、计算并聚合,填充到答案槽位中。根据天气知识图谱中所存储的天气知识和天气实时数据进行判断过程中,当使用判断函数时,有的天气数据并没有在原始数据中直接给出,通过自定义函数计算得出。
对所有查询的天气以及实时数据进行聚合,填充到答案槽位。
在答案生成模块,需要根据问题的类型和查询到的数据,生成不同的答案,最后将所有的答案组合到一起,返回到前端页面进行展示。
答案生成的步骤为:将数据聚合模块产生的答案槽位的内容取出,并根据答案的类型生成相应的回答;在生成时,使用预先定义好的模板,只需将采集的天气数据替换到该模板中对应位置,即可产生相应的答案;对于各个类型的答案进行组合时,因答案槽位中的数据都有从知识图谱中查询出来的属性值,其中有对日常生活影响程度的分数,将所有答案按照分数排序,分值越大的答案越靠前。
本发明的提供了一种使用知识图谱的天气问答系统的基于气象领域知识图谱的问答系统装置。包括:知识图谱构建模块、问题解析模块、数据聚合模块、答案生成模块。
气象领域的知识图谱构建模块,用以构建气象领域天气知识的知识图谱;用于天气的判断规则进行人工构建,组成三元组;且将气象规则划分为时间类型、地点类型、天气类型、生活类型、其他类型五个类型。天气、生活和其他类别的规则信息存储需要按照树形结构组成,节点与节点之间的连接需要用与非关系。时间类型和地点类型,为单节点并拥有各自固有的属性值,连接到根节点中。
时间类的属性值包括:时间范围,增加小时数,别名等。
地点类的属性值包括:城市名,省,经纬度,站点编号。
天气类的属性值包括:影响程度,最高温度,最低温度,紫外线强度,风力,风速等。
生活类的属性值包括:影响程度,温度,紫外线强度,风力,风速等。
其他类的属性值包括:影响程度,温度,风力,风速等。
这些类别的属性值以及节点不仅限于上述几种,需要注意的是,气象领域的知识图谱是一个不断扩充和构建的知识体系,不应局限于现有的知识,需要根据业务需要和时间的变化而动态的更新或添加某些节点。
进一步的,气象领域的知识图谱构建模块还用于将气象领域的专业知识转换为实体;将实体和实体之间用与或关系进行链接;将所有天气知识转成三元组后,存储到图数据库中。
对于用户问题需要进行分类,可分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣。
问题解析模块,用于将用户提出的问题进行分词和预处理,根据词语的词性和所在词典的类别进行填充该模块设置的问题槽位,并排除不合理的问题。
问题解析模块还用于解析用户所提出的关于天气的问题,使用分词软件对用户所输入的问题进行分词;还用于判断所分得的词汇属于哪些问题槽位,按词汇特征信息填充到相应的问题槽位;并过滤不合理的问题。对于填充后的问题槽位需要进行判断,过滤掉不合理的问题,问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词汇,以及将这五种类型词组合后仍然缺少时间类型或地点类型的词汇的问题槽位对应的问题为不合理的问题。例如只包含地点类和其他类词语的问句。
在问题解析模块中使用分词软件进行分词之前,预加载本地的自定义词库;该本地的自定义词库按行读取文本内容并添加到分词软件的自定义词库中;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词汇。
数据聚合模块,适用于使用知识图谱中所存储的天气知识来判断实时的天气数据是否符合该天气信息,并将天气数据和多种判断结果存入该模块设置的答案槽位中。实时数据来源于在线的第三方接口平台。
数据聚合模块,适用于采集实时的天气数据并根据查询问题的时间段,自动切割数据;自动切割数据时,需要根据查询的时间段,返回数据。例如:查询时间为未来两天,则自动判断后续的处理需要以天为单位的天气预测信息,则自动返回七天的预测信息。数据聚合模块适用于将问题槽位中的天气转换为查询语句,并使用词向量的方法查询最相似的天气规则。数据聚合模块还用于训练词向量模型;用于在知识图谱中查询相似度最高的节点;用于将查询后的所有路径信息转换成树形结构的路径;用于遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;还用于提前计算重要天气信息,若存在,则填充到问题槽位中。词向量模型,是使用气象领域的文本训练的。所述的相似查询,会将被查询的天气、生活、其他等词汇转换成词向量,使用图数据库中的相似算法,最后取出相似度最高的节点。
数据聚合模块适用于将查询的天气规则和天气数据,综合判断并封装为答案槽位。封装为答案槽位,对于查询后的天气、生活和其他规则路径,会转成树形结构,使用预先定义好的判断函数判断该查询时间段内的天气是否符合规则,若符合则将该节点以及数据填充到相应的答案槽位中。封装为答案槽位,还包括将所有判断结果、所有可能出现的重要天气信息以及查询时间段内的数据填充到答案槽位中。
使用判断函数计算实时的天气数据是否符合其规则天气知识图谱中所存储的天气知识时,没有在原始数据中直接给出的天气数据通过自定义函数计算。判断函数,可能在计算时有的天气数据并没有在原始数据中直接给出,该函数可根据业务需要自定义计算逻辑。
答案生成模块,用于将数据聚合模块聚合的存入聚合数据字典的数据取出,并根据答案的类型生成相应的回答;对于各个类型的答案进行组合时,需要对每个类型的答案进行排序;最后将答案反馈给用户。
生成相应的回答,会对各个类型的答案进行组合,并对每个类型的答案进行排序,例如:对于天气原因造成灾害,或者影响到生活的内容,需要排到最前。对于天气的详情内容则依次向后排列。
答案生成模块中预先定义有答案模板,用于产生答案时使用该模板,只需将采集的天气数据替换到该模板中对应位置即可产生相应的答案。
图1是根据本发明实施例的天气问答系统的方法的主要步骤的示意图。
如图1所示,本发明实施例的天气问答系统的方法主要包括如下步骤:
步骤S1:知识图谱的构建,需要人工将天气的规则解析成三元组,节点的类别总共划分五大类型:时间、地点、天气、生活、其他。天气的规则信息需要按照树形结构存储,节点与节点之间的连接需要用与或关系。生活和其他这两种类型的规则与天气规则存储相似。
例如:“寒潮”的最低标准为48小时内平均气温或最低气温降幅≥8℃,最低气温≤4℃,平均风力5级以上。这条知识的实体就包含:寒潮、48小时内平均气温、最低气温降幅、最低气温和平均风力。每个实体都拥有各自的属性,例如:最低温度降幅≥8℃,该实体上有关系运算符“≥”,限制的属性值“8℃”。
每类的所有节点都与根节点“天气”相互连接。根节点“天气”上拥有属性节点,例如:风速、紫外线、能见度等。
所有天气知识转成三元组后,存储到图数据库中。
步骤S2:当用户输入问题后,需要将用户的提问的问题进行分词和预处理,根据词语的词性和所在词典的类别进行填充槽位。对于填充后的问题槽位需要进行判断,过滤掉不合理的问题,例如只包含地点类型和其他类型词语的问句。例如:用户提问:“我今天穿的衣服好看吗”转成问题槽位后为:(时间:今天,地点:某地点,天气:空,生活:衣服,其他:空),对于这类问题一律判断为不合理的问题,结束当前流程并告知用户修改所提问题。
同时,需要对于问题需要进行分类,可分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣。例如:用户提问“北京未来两天下雹子吗”,最后得到的槽位信息即(时间:未来两天;地点:北京;天气:雹子;生活:未知;其他:未知;问题类型:被查询天气详情)。
步骤S3:为了提升查询的准确率和模型的泛化能力,使用气象领域的文本,这里可以选用任意的词向量训练方法,本系统优选用Glove算法,训练词向量模型,模型只需训练一次即可,以后使用不需要重新训练。
同时,用户输入的词语可能在图数据库中未录入,或查询不到。可先从词向量模型中取出该词汇的表征。对于词向量模型中不存在的词汇,可分割为字,再从词向量模型中取表征相加后取平均。
在查询知识图谱时,需要将被查询词的词向量和各个节点的词向量进行比较,使用计算向量相似度算法计算两个向量,最终选择与输入词汇的词向量相似度最高的节点。
根据选择的节点,使用查询语法,将天气的判断规则从图数据库中取出。得到的是一条条的路径信息,该路径包含了几个实体和关系。以寒潮为例,其中的一条路径为:(E:寒潮,R:与,E:最低温度降幅,R:或,E:48小时内)。在每个节点中,都包含有实体的属性数据。
查询后的路径可能是多条的,需要将所有路径转换成树形结构的路径。对于每条路径,为每个实体编排序号,从第一个实体开始遍历,每一层对应一个实体,父子节点之间的边用与或关系相连接。假设根节点为寒潮,由于每个路径中第一个实体都是寒潮,所以都需要从寒潮这个根节点出发,若到达某层次有相同的节点A,则从A节点找到下一层次的子节点,若子节点中没有相同节点,则需要在A节点下添加该层次的节点内容。即,对于相同序号的相同节点合并,最终转成树形结构,即为天气规则。
采集实时的天气数据并根据查询问题的时间段,自动切割数据。需要根据查询的时间段、查询的位置信息返回数据。例如:查询时间为未来两天,则自动判断需要返回以天为单位的天气预测信息,以便后续的处理。
在使用天气规则进行判断时,采用深度优先的策略,当遍历到叶子节点时,需要对叶子节点的内容解析并查询相应时间段内的天气数据,使用判断函数并返回这段天气数据是否满足条件,最后将判断后的结果返回到上一层,接着遍历其他叶子节点,直到遍历完成整个规则树。
当使用判断函数时,可能有的天气数据并没有在原始数据中直接给出,需要通过自定义函数计算得出。例如:48小时内的降温幅度,则需要根据未来两天的最低温度相减,才能得出结果。
例如步骤S2中的例子,用户想要查询的天气是雹子,实际想要查询的是冰雹,使用词向量的方法可以查询到雹子和冰雹相似度最高,则系统自动将冰雹的判断规则取出。如果查询到的未来两天下冰雹,则将冰雹的信息和下冰雹时的天气数据一起封装到答案槽位中。
对于一些重要的天气信息也需要提前查询和判断,例如寒潮、暴雨、雷电等天气,虽然用户并未提问,但对用户的日常生活影响较大,所以应该提前计算,以便后续生成答案时,提醒用户。
当完成所有的天气规则判断后,需要将所有可能出现的天气信息以及对应时间段内的数据填充到答案槽位中。
步骤S4:将上述数据聚合模块产生的答案槽位的内容取出,并根据答案的类型生成相应的回答。例如被查询的天气详情,如果在用户的查询时间段内存在,则生成详细的答案,如果不存在,也需告诉用户该查询时间段内不存在。
答案的生成,使用的是预先定义好的模板,例如生成天气属性详情的模板定义为“时间:{time} 天气:{weather} 详情:{weather_attr}”,在生成时,只需将采集的天气数据替换到该模板中对应位置,即可产生相应的答案。
对于各个类型的答案进行组合时,需要对每个类型的答案进行排序,对于天气原因造成灾害,或者影响到生活的内容,需要排到最前。对于天气的详情内容则依次向后排列。
至此,所有计算过程完成,最后需要对所有产生的答案合并,将结果以文字的形式返回给用户。从上述步骤说明来看,通过建立知识图谱可以方便的管理气象领域的规则。对于用户所输入的问题,使用槽位填充的方式,补全系统所需信息,便于查询和计算。当查询天气、生活和其他类的规则时,使用词向量的方式可以较好的查询相似内容,有利于系统的健壮性。在判断规则是否满足条件时,首先将天气的规则转成树形结构,每个叶子节点使用判断函数时,可以通过自定义函数的方式,计算各种所需的天气属性。天气数据为实时采集,可保证数据的时效性。再将符合规则的天气信息和实时数据聚合成答案槽,输入到答案生成模块,按照问题类型选择不同的生成模板,按照重要性进行排序输出。从而生成用户所关心的答案内容。
图3是根据本发明实施例的基于知识图谱的天气问答系统的装置的主要模块的示意图。
如图3所示,本发明实施例的基于知识图谱的天气问答系统的装置20主要包括,气象领域的知识图谱构建模块201、问题解析模块202、数据聚合模块203和答案生成模块204。
气象领域的知识图谱构建模块201用于存储气象领域的知识。人工构建天气的判断规则进行,组成三元组。用于将气象规则划分为五大类型:时间、地点、天气、生活、其他。天气的规则信息存储需要按照树形结构组成,节点与节点之间的连接需要用与非关系。根节点“天气”与其他类的节点相互连接。
问题解析模块202,用于将用户的提问的问题进行分词和预处理,根据词语的词性和所在词典的类别进行填充槽位。对于填充后的问题槽位需要进行判断,过滤掉不合理的问题,对问题进行分类,可分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣。
数据聚合模块203,用于采集实时的天气数据并根据查询问题的时间段,自动切割数据。用于将问题槽位中的天气转换为查询语句,并使用词向量的方法查询最相似的天气规则。用于查询后的天气、生活和其他规则,先转成树形结构,再对其进行深度遍历,当遇到叶子节点时,使用原有的天气属性或者自定义的判断函数判断该查询时间段内的天气是否符合规则,若符合则将该节点以及数据填充到相应的答案槽位中。用于完成所有的天气规则判断后,需要将所有可能出现的天气信息以及对应时间段内的数据进行聚合。
答案生成模块204,适用于将模块203聚合的数据取出,并根据答案的类型生成相应的回答。对于各个类型的答案进行组合时,需要对每个类型的答案进行排序,对于天气原因造成灾害,或者影响到生活的内容,需要排列到最前。对于天气的详情内容则依次向后排列。最后将答案返还给用户。
根据上述基于知识图谱的天气问答系统可以看出,通过建立知识图谱可以方便的管理气象领域的规则。对于用户所输入的问题,使用槽位填充的方式,补全系统所需信息,便于查询和计算。当查询天气、生活和其他类的规则时,使用词向量的方式可以较好的查询相似内容,有利于系统的健壮性。在判断规则是否满足条件时,首先将天气的规则转成树形结构,每个叶子节点使用判断函数时,可以通过自定义函数的方式,计算各种所需的天气属性。天气数据为实时采集,可保证数据的时效性。再将符合规则的天气信息和实时数据聚合成答案槽,输入到答案生成模块,按照问题类型选择不同的生成模板,按照重要性进行排序输出。从而生成用户所关心的答案内容。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和设备的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来开发出的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (15)

1.基于气象领域知识图谱的问答系统装置,其特征在于,包括:
气象领域的知识图谱构建模块,用以将气象领域的专业知识转换为实体,实体和实体之间用与或关系进行链接,构建气象领域天气知识的知识图谱;用于所有天气知识转成三元组,人工构建天气的气象判断规则,存储到图数据库中并组成三元组;
问题解析模块,用于解析用户所提出的关于天气的问题,将用户提出的问题进行分词和预处理,根据分得的词汇的词性和该词汇对应自定义词库的类别作为依据,填充在该模块设置的问题槽位,并排除不合理的问题;
数据聚合模块,用于对问题槽位中的词,通过词的相似度计算方式,选取与知识图谱中最匹配的规则,进而判断实时的天气数据是否符合该规则,并将天气数据和多种判断结果存入该模块设置的答案槽位中;
答案生成模块,用于将数据聚合模块中答案槽位的数据取出,并根据答案的类型生成相应的回答;对于各个类型的答案进行组合时,需要对每个类型的答案进行排序;最后将答案反馈给用户。
2.如权利要求1所述的基于气象领域知识图谱的问答系统装置,其特征在于,实时的天气数据来源于在线的第三方接口平台;
用户提出的问题可划分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣;
问题槽位所设置的形式包括(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型);
答案槽位形式为(时间及其属性;地点及其属性;天气数据和判断结果;生活和判断结果;其他;问题类型);
气象判断规则划分为时间类型、地点类型、天气类型、生活类型、其他类型;
答案生成模块中预先定义有答案模板,用于产生答案时使用该模板,仅需将采集的天气数据替换到该模板中对应位置即可产生相应的答案。
3.如权利要求2中任一项所述的基于气象领域知识图谱的问答系统装置,其特征在于,在问题解析模块中使用分词软件进行分词之前,预加载本地的自定义词库;该本地的自定义词库按行读取文本内容并添加到分词软件的自定义词库中;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词汇。
4.如权利要求3所述的基于气象领域知识图谱的问答系统装置,其特征在于,问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词汇,以及将这五种类型词组合后缺少时间类型或地点类型的词汇的问题槽位对应的问题为不合理的问题。
5.如权利要求3所述的基于气象领域知识图谱的问答系统装置,其特征在于,数据聚合模块还用于训练词向量模型;用于在知识图谱中查询相似度最高的节点;用于将查询后的所有路径信息转换成树形结构的路径;用于遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;还用于提前计算重要天气信息,若存在,则填充到答案槽位中。
6.如权利要求5所述的基于气象领域知识图谱的问答系统装置,其特征在于,使用判断函数计算实时的天气数据是否符合其规则天气知识图谱中所存储的天气知识时,没有在原始数据中直接给出的天气数据通过自定义函数计算。
7.基于气象领域知识图谱的问答系统的问答方法,其特征在于:使用权利要求1-6任一项所述的基于气象领域知识图谱的问答系统装置,
人工构建气象领域的天气知识图谱;
接收用户提出的问题,并通过问题解析模块使用自然语言处理的方式解析用户所提出的关于天气的问题,填充问题槽位,并排除不合理的问题;
使用问题槽位中的词,通过词的相似度计算方式,选取知识图谱中最匹配的规则,进而使用判断函数判断实时的天气数据是否符合该规则,并将天气数据和多种判断结果存入答案槽位中;
根据用户所提的问题,将答案槽位中的数据填充到答案模板中,生成相应的答案,反馈给用户。
8.如权利要求7所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,人工构建知识图谱的步骤包括:将气象领域的专业知识转换为实体;再将实体和实体之间用与或关系进行链接;将所有天气知识转成三元组后,存储到图数据库中。
9.如权利要求7所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,用户提出的问题可分为五种类别:天气详情、被查询天气详情、天气属性、出行、穿衣;
实时的天气数据来源于在线的第三方接口平台;
对用户所输入的问题使用开源的第三方分词软件进行分词,在分词之前,会加载本地的自定义词库,按行读取文本内容;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词。
10.如权利要求7所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,问题解析的步骤包括:
设置问题槽位的形式为(时间类型,地点类型,天气类型,生活类型,其他类型,问题类型);
解析用户所提出的关于天气的问题,使用分词软件对用户所输入的问题进行分词,然后按分得的词汇特征信息填充到问题槽位中;
根据填充后的问题槽位判断,是否为满足合理的条件,对于判断为不合理的问题,结束当前流程并告知用户修改所提问题。
11.如权利要求10所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,对用户所输入的问题使用开源的第三方分词软件进行分词,在分词之前,会加载本地的自定义词库,按行读取文本内容;本地自定义词库包括时间类型、天气类型、地点类型、生活类型的词。
12.如权利要求11所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,不合理的问题包括填充后的问题槽位只包含时间类型或地点类型或天气类型或生活类型或其他类型词语的问题,以及将这五种类型的词组合后仍缺少时间类或地点类的问题。
13.如权利要求12任一项所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,根据天气知识图谱中所存储的天气知识和天气实时数据进行判断的步骤为:
在计算词的相似度前,需要先训练词向量模型,只需训练一次即可,对于问题槽位中各个类型的词,在词向量模型中找到对应的词向量;
得到输入词汇的词向量后,在气象领域的知识图谱中找出与该词向量相似度最高的节点;
根据选择的节点,使用查询语法,将天气的规则路径从图数据库中取出,再将所有规则路径转换成树形结构的路径;
数据聚合模块会遍历整个规则树,使用判断函数计算实时的天气数据是否符合其规则;
答案槽位定义为(时间及其属性;地点及其属性;天气数据和判断结果;生活和判断结果;其他;问题类型),其中,时间及其属性、地点及其属性、其他和问题类型由问题槽位中对应的词汇,经过查询知识图谱后得到,对于用户查询的天气和生活需要按照a-d步骤进行查询、计算并聚合,填充到答案槽位中。
14.如权利要求13所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,根据天气知识图谱中所存储的天气知识和天气实时数据进行判断过程中,当使用判断函数时,有的天气数据并没有在原始数据中直接给出,通过自定义函数计算得出。
15.如权利要求14所述的基于气象领域知识图谱的问答系统的问答方法,其特征在于,答案生成的步骤为:
将产生的答案槽位的内容取出,并根据答案的类型选择不同的答案模板;
使用预先定义好的模板,在生成时,只需将采集的天气数据替换到该模板中对应位置,即可产生相应的答案;
对于各个类型的答案进行组合时,需要将对日常生活有较大影响的答案内容,排到前面。
CN201910153832.XA 2019-03-01 2019-03-01 基于气象领域知识图谱的问答系统装置及问答方法 Active CN109947916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910153832.XA CN109947916B (zh) 2019-03-01 2019-03-01 基于气象领域知识图谱的问答系统装置及问答方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910153832.XA CN109947916B (zh) 2019-03-01 2019-03-01 基于气象领域知识图谱的问答系统装置及问答方法

Publications (2)

Publication Number Publication Date
CN109947916A true CN109947916A (zh) 2019-06-28
CN109947916B CN109947916B (zh) 2023-08-08

Family

ID=67008236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910153832.XA Active CN109947916B (zh) 2019-03-01 2019-03-01 基于气象领域知识图谱的问答系统装置及问答方法

Country Status (1)

Country Link
CN (1) CN109947916B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287304A (zh) * 2019-06-30 2019-09-27 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN110457431A (zh) * 2019-07-03 2019-11-15 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN110502608A (zh) * 2019-07-05 2019-11-26 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置
CN110659360A (zh) * 2019-10-09 2020-01-07 初米网络科技(上海)有限公司 一种人机对话方法、装置和系统
CN111813889A (zh) * 2020-06-24 2020-10-23 北京安博盛赢教育科技有限责任公司 一种提问信息的排序方法、装置、介质和电子设备
CN113254473A (zh) * 2021-07-05 2021-08-13 中国气象局公共气象服务中心(国家预警信息发布中心) 一种获取气象服务知识的方法及装置
CN113626571A (zh) * 2021-08-09 2021-11-09 南方电网数字电网研究院有限公司 答句生成方法、装置、计算机设备和存储介质
CN115098666A (zh) * 2022-08-29 2022-09-23 中国气象局公共气象服务中心(国家预警信息发布中心) 一种Chatbot自然语言处理方法及装置
CN117725189A (zh) * 2024-02-18 2024-03-19 国家超级计算天津中心 专业领域的生成式问答方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及系统
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN108804521A (zh) * 2018-04-27 2018-11-13 南京柯基数据科技有限公司 一种基于知识图谱的问答方法及农业百科问答系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912527A (zh) * 2016-04-19 2016-08-31 北京高地信息技术有限公司 根据自然语言输出答案的方法、装置及系统
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN108804521A (zh) * 2018-04-27 2018-11-13 南京柯基数据科技有限公司 一种基于知识图谱的问答方法及农业百科问答系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287304A (zh) * 2019-06-30 2019-09-27 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN110457431A (zh) * 2019-07-03 2019-11-15 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
CN110457431B (zh) * 2019-07-03 2020-12-25 深圳追一科技有限公司 基于知识图谱的问答方法、装置、计算机设备和存储介质
WO2021003819A1 (zh) * 2019-07-05 2021-01-14 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置
CN110502608A (zh) * 2019-07-05 2019-11-26 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置
CN110502608B (zh) * 2019-07-05 2023-10-10 平安科技(深圳)有限公司 基于知识图谱的人机对话方法及人机对话装置
CN110659360A (zh) * 2019-10-09 2020-01-07 初米网络科技(上海)有限公司 一种人机对话方法、装置和系统
CN111813889A (zh) * 2020-06-24 2020-10-23 北京安博盛赢教育科技有限责任公司 一种提问信息的排序方法、装置、介质和电子设备
CN113254473A (zh) * 2021-07-05 2021-08-13 中国气象局公共气象服务中心(国家预警信息发布中心) 一种获取气象服务知识的方法及装置
CN113254473B (zh) * 2021-07-05 2021-09-24 中国气象局公共气象服务中心(国家预警信息发布中心) 一种获取气象服务知识的方法及装置
CN113626571A (zh) * 2021-08-09 2021-11-09 南方电网数字电网研究院有限公司 答句生成方法、装置、计算机设备和存储介质
CN113626571B (zh) * 2021-08-09 2024-04-09 南方电网数字电网研究院股份有限公司 答句生成方法、装置、计算机设备和存储介质
CN115098666A (zh) * 2022-08-29 2022-09-23 中国气象局公共气象服务中心(国家预警信息发布中心) 一种Chatbot自然语言处理方法及装置
CN117725189A (zh) * 2024-02-18 2024-03-19 国家超级计算天津中心 专业领域的生成式问答方法及电子设备
CN117725189B (zh) * 2024-02-18 2024-04-16 国家超级计算天津中心 专业领域的生成式问答方法及电子设备

Also Published As

Publication number Publication date
CN109947916B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN109947916A (zh) 基于气象领域知识图谱的问答系统装置及问答方法
Malczewski A GIS-based approach to multiple criteria group decision-making
CN104573106B (zh) 一种基于案例推理技术的城市建设智能审批方法
Yang et al. A new short-term load forecasting approach using self-organizing fuzzy ARMAX models
Dubois et al. Possibility theory and its applications: a retrospective and prospective view
US8868535B1 (en) Search engine optimizer
CN109711865A (zh) 一种基于用户行为挖掘的移动通信网流量精细化预测的方法
CN108038222A (zh) 用于信息系统建模和数据访问的实体-属性框架的系统
CN109741120B (zh) 用于用户需求的产品深度个性化定制方法
CN110826237B (zh) 基于贝叶斯信念网络的风电设备可靠性分析方法及装置
CN113239566B (zh) 基于智能体的融合情绪化的灾后三级层次仿真系统及方法
CN104699786A (zh) 一种语义智能搜索的通信网络投诉系统
CN116721001B (zh) 基于数字孪生的智慧城市资源管理方法
Feng et al. Using fuzzy linguistic representations to provide explanatory semantics for data warehouses
CN107016566A (zh) 基于本体的用户模型构建方法
Benítez et al. Consistent clustering of entries in large pairwise comparison matrices
Kim et al. Classifier using extended data expression
Leung et al. An intelligent expert system shell for knowledge-based geographical information systems: 2. Some applications
CN104317853B (zh) 一种基于语义Web的服务簇构建方法
Bai et al. Adaptive query relaxation and result categorization of fuzzy spatiotemporal data based on XML
CN110059967A (zh) 一种应用于城市辅助决策分析的数据处理方法及装置
CN108256077A (zh) 一种面向中国移动智能客服的动态扩展知识图推理方法
CN109190204A (zh) 一种基于复杂网络的复杂机械产品模块划分方法
CN106168982A (zh) 用于特定主题的数据检索方法
CN106294652A (zh) web页面信息搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant