CN108491378B - 电力信息运维智能应答系统 - Google Patents

电力信息运维智能应答系统 Download PDF

Info

Publication number
CN108491378B
CN108491378B CN201810189009.XA CN201810189009A CN108491378B CN 108491378 B CN108491378 B CN 108491378B CN 201810189009 A CN201810189009 A CN 201810189009A CN 108491378 B CN108491378 B CN 108491378B
Authority
CN
China
Prior art keywords
entity
module
keywords
question
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810189009.XA
Other languages
English (en)
Other versions
CN108491378A (zh
Inventor
吴飞
连纪文
王国强
罗富财
李霆
陈倩
王秋琳
林伟
石静
李明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Fujian Electric Power Co Ltd
Fujian Yirong Information Technology Co Ltd
Original Assignee
State Grid Fujian Electric Power Co Ltd
Fujian Yirong Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Fujian Electric Power Co Ltd, Fujian Yirong Information Technology Co Ltd filed Critical State Grid Fujian Electric Power Co Ltd
Priority to CN201810189009.XA priority Critical patent/CN108491378B/zh
Publication of CN108491378A publication Critical patent/CN108491378A/zh
Application granted granted Critical
Publication of CN108491378B publication Critical patent/CN108491378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种电力信息运维智能应答系统,包括:用户问答模块、智能应答模块和管理模块;所述智能应答模块提取用户问题的一个或多个关键词,通过近义词关联模块从数据库中提取一个或多个与关键词匹配的问题解答方案供用户选择;所述管理模块可监控用户问答模块与智能应答模块之间的互动,并可接入用户问答模块,同时断开用户问答模块与智能应答模块之间的连接;所述管理模块可选取用户问题的关键词并添加到数据库中,并建立关键词与问题解答方案的新的匹配关系;所述管理模块可删除关键词与问题解答方案的匹配关系。本发明与现有技术相比,解决了现有电力运维客服系统严重依赖人工,且智能化程度低的缺陷。

Description

电力信息运维智能应答系统
技术领域
本发明属于电力运维管理领域,尤其涉及一种电力信息运维智能应答系统。
背景技术
当前的电力运维客服系统每天都在面临着来自各方的海量的客户的心声,企业和个人用户通过微信公众号、微博、掌上电力APP、95598智能互动网站等各种渠道进行业务咨询、故障保修、投诉、举报、建议、意见及表扬、电网信息、政策订阅等,对服务提供及消费提出了更高的要求,需要及时、准确洞察客户的心声,以最短时间、以最好的服务满足客户的需求;同时客户要求更友好、方便、快捷的使用我们所提供的服务。为此,需要通过不断提升信息支撑服务,改进客户服务体系来提高客户服务质量和效率,然而在互联网发展的时代,传统的呼叫中心客服系统需要大量的人力和物力。
国网信通部于2015年下达了关于开展信息系统运行管理水平提升活动,提出了切实提升运行管理水平的要求,信息系统需按照“两级调度、三层检修、一体化运行、统一的客户服务和信息技术三线支持中心”模式,开展信息运维工作,由此积累了大量的运维工单数据。随着大众对电力生产可靠性要求的不断提高,国网公司对供电服务质量也有较高的要求标准。如何不断提高电力信息运维人员的业务素质,在生产中如何快速、准确的处理信息系统运维问题,在日常生产中如何快速查找定位缺陷防范于未然,是电力生产技术和管理者的诉求。
面向电力行业构建公共知识图谱存在很多的技术难点,如运维知识的分析较弱,数据资源价值体现整体停留在粗放型阶段,没有将数据资源有效转化为知识资产,以及没有形成知识良性循环、对业务需求的支撑能力和对管理变革的推动能力较弱等问题,这些都阻碍了电力运维知识图谱的组织与构建。尤其是公司的一单两票系统存在大量的可利用数据,可被有效挖掘和利用,为构建运检修知识图谱提供基础数据及理论依据。
发明内容
针对现有技术存在的问题和空白,本发明采用以下技术方案:
一种电力信息运维智能应答系统,其特征在于,包括:
用户问答模块、智能应答模块和管理模块;
所述智能应答模块提取用户问题的一个或多个关键词,通过近义词关联模块从数据库中提取一个或多个与关键词匹配的问题解答方案供用户选择;
所述管理模块可监控用户问答模块与智能应答模块之间的互动,并可接入用户问答模块,同时断开用户问答模块与智能应答模块之间的连接;
所述管理模块可选取用户问题的关键词并添加到数据库中,并建立关键词与问题解答方案的新的匹配关系;
所述管理模块可删除关键词与问题解答方案的匹配关系。
优选地,通过所述管理模块解答,并获得用户认可的用户问题,与其对应的人工问题解答方案构成关键词和问题解答方案的匹配关系,并添加到数据库中。
优选地,所述数据库通过多个知识库学习关键词和问题解答方案的匹配,以及关键词和其近义词之间的匹配,并构成知识图谱。
优选地,所述数据库采用Neo4j图数据库存储;所述知识库采用MySQL进行数据存储。
优选地,所述知识库的数据来源包括电力系统工单数据和/或电力系统ERP数据库和/或I6000知识库。
优选地,所述数据库通过PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来。
优选地,所述电力系统工单数据生成知识库的过程包括以下步骤:
步骤1:进行工单采集,并转换为文本格式,并根据文本含义属性划分为多个文本域;
步骤2:以工单为单位,对工单文本数据进行分词处理;
步骤3:对文本域进行分组;
步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;
步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;
步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;
步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,来抽取实体关系。
优选地,所述电力系统工单数据生成知识库之后构建成为数据库中的知识图谱还包括以下步骤:
步骤8:将实体和实体关系转化为基于RDF的三元组;
步骤9:通过PTransE模型将实体和实体关系进行翻译和学习,构建成为知识图谱。
优选地,所述PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来,将逻辑推理规则视为向量加法操作,其评分函数为:
Figure 377006DEST_PATH_IMAGE001
其中,
Figure 836675DEST_PATH_IMAGE002
表示实体间关系路径集合,
Figure 769252DEST_PATH_IMAGE003
为实体间的一条路径,
Figure 710137DEST_PATH_IMAGE004
等价于TransE的参数模型
Figure 554597DEST_PATH_IMAGE005
Figure 289728DEST_PATH_IMAGE006
的计算公式为
Figure 637664DEST_PATH_IMAGE007
其中
Figure 265960DEST_PATH_IMAGE008
是一个归一化函数,
Figure 505705DEST_PATH_IMAGE009
表示头实体h到尾实体t的关系路径p的可靠性;
Figure 667696DEST_PATH_IMAGE010
表示头实体h到尾实体t的关系路径p的势能函数;
对于路径集合
Figure 401297DEST_PATH_IMAGE011
,其函数如下
Figure DEST_PATH_IMAGE012
其中
Figure 905222DEST_PATH_IMAGE013
用于衡量头实体h到尾实体t的关系路径p的可靠性,即
Figure 458694DEST_PATH_IMAGE014
其中实体h到实体t的路径关系p,
Figure 362059DEST_PATH_IMAGE015
,从实体h通过路径关系p,将路径表示为
Figure 917543DEST_PATH_IMAGE016
,其中
Figure 550957DEST_PATH_IMAGE017
Figure 293522DEST_PATH_IMAGE018
;对于任何实体
Figure 734999DEST_PATH_IMAGE019
Figure 882340DEST_PATH_IMAGE020
Figure 118281DEST_PATH_IMAGE021
的关系的直接用关系来表示
Figure 676039DEST_PATH_IMAGE022
;首先对实体h赋予权重1,然后对函数
Figure 921206DEST_PATH_IMAGE023
进行不断迭代,获得t的权重。
优选地,对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采集;采用BeautifulSoup包对采集的内容进行解析;采用R环境下的Rwordseg包进行分词。
本发明与现有技术相比,解决了现有电力运维客服系统严重依赖人工,且智能化程度低的缺陷,以半自动构建的电力系统知识图谱为核心,实现了电力运维的智能化应答,且能够在后台的干预下持续进行自我学习和升级,对电力运维领域的技术升级起到重要作用。且有效利用了电力运维系统的工单数据,对知识图谱的构建完善起到重要的作用。本发明对于电力系统运维的完善有重要作用,具备积极的社会意义和经济价值。
附图说明
下面结合附图和具体实施方式对本发明进一步详细的说明:
图1是本发明实施例总体架构示意图;
图2是本发明实施例数据架构示意图;
图3是本发明实施例核心流程示意图;
图4是本发明实施例应用架构示意图;
图5是本发明实施例中电力系统工单数据生成知识库的过程示意图。
具体实施方式
为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:
如图1所示,本实施例系统的总体架构包括接入层、服务层、应用层、数据层四个部分。其中:
①接入层:通过webserice、sdk、websocket等方向提供第三方系统接入,并能够在业务上灵活的与业务系统对接。
②服务层:通过集成到信息运维支持平台系统上为该系统用户提供信息咨询服务及自然语言处理服务。
③应用层:系统提供了后端系统管理、前端用户问答客户端、客服工作台及统计分析等功能覆盖客服工作全业务。
④数据层:通过收集和梳理ERP系统、电力运维支持平台、I6000系统形成领域知识库并结合通用知识库及业务元数据对应用层提供支撑。
如图4所示,本实施例系统功能模块划分为:客户端、客服工作台和管理后台。其中:
1.客户端:客户可以与客服或者智能系统(机器人)会话,并实现转人工服务等功能。
2.客服工作台:工作台提供客服比较完善的功能,方便服务客户。实现交接单等业务;能够邀请用户,在无法处理问题的时候能选择转接客服;可以设置快捷回复,也可以使用智能回复,方便回答客户问题。
3.管理后台:系统设计有可以在工作中不断完善的知识库,实现自我学习机制,客服人员通过对对机器人无法回答的问题的智能学习,使机器人在以后遇到同样问题时可以自动回复;有较为严格的知识库采编流程,保证知识库的准确性。系统还有统计分析模块,方便分析和改进客服工作。
如图2所示,作为本发明实施例的功能核心,包括:
用户问答模块、智能应答模块和管理模块;
智能应答模块提取用户问题的一个或多个关键词,通过近义词关联模块从数据库中提取一个或多个与关键词匹配的问题解答方案供用户选择;
管理模块可监控用户问答模块与智能应答模块之间的互动,并可接入用户问答模块,同时断开用户问答模块与智能应答模块之间的连接;
管理模块可选取用户问题的关键词并添加到数据库中,并建立关键词与问题解答方案的新的匹配关系;
管理模块可删除关键词与问题解答方案的匹配关系。
通过管理模块解答,并获得用户认可的用户问题,与其对应的人工问题解答方案构成关键词和问题解答方案的匹配关系,并添加到数据库中。
如图3、图4所示,在本实施例中,管理模块以客服工作台和管理后台的形式实现。
在本实施例中,数据库通过多个知识库学习关键词和问题解答方案的匹配,以及关键词和其近义词之间的匹配,并构成知识图谱。
数据库采用Neo4j图数据库存储;知识库采用MySQL进行数据存储。
其中,Neo4j支持多种方式导入数据。既可以手动导入,也可以采用CSV文件直接导入,同时,Neo4j也支持从主流关系型数据库导入数据。本实施例釆用CSV批量导入的方法将数据导入至Neo4j中。釆用CSV批量导入数据到Neo4j后,就可以采用Cypher查询数据库中存储的数据,并釆用图形化的方式展示出来。
知识库的数据来源包括电力系统工单数据、电力系统ERP数据库、I6000知识库等。
数据库通过PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来。
如图3所示,在本实施例中,运维客服人员通过客服工作台统一受理客户通过用户前台发起的咨询服务请求。
客服工作台状态分在线、离线、不接单三种状态,客服默认进入工作台则为在线状态,客服可根据需求自由切换。
客服人员在下班时候,可设置成离线状态,系统会自动要求客服人员填写当天交接单即工作日志。管理员可查看所有人员的交接单数据。
客服人员在临近交接班或有事需临时离开的时候可以设置不接单。不接单的作用是不再接收系统自动分配过来的客户。
客服在临下班的时候可以设置不接单,在下班后客服可以填写交接单,所有在线客服可以查阅;填写完交接单后并确认交接,该客服手上的在线客户按随机重新分发到在线客服。
用户列表分在线会话和历史记录,在线会话展示客服正在服务的用户清单,历史记录展示该客服历史会话过的用户清单,允许客服按用户名检索了历史记录的用户。
用户列表默认按用户是否有未读(优先展示)和已读消息数分组,再按用户的最后一次消息时间降序展示,同时在线会话顶部展示客服的会话数和用户头像处也展示用户的未读消息数。
客服人员点击会话窗口中的聊天内容,进而实现该聊天内容在知识库内容的检索,在选择确认好知识库的标题和答案后,客服可将检索结果答案通过点击“直接发送”按钮直接发给用户,发送知识信息将会转到回复框,智能回复功能是智能知识库辅助客服高效工作的一个体现。
当客服人员正在受理的问题遇到无法解答或交接班时间等原因,可将该客户转接给其他在线客服。
当转接过程中,无其他客服在线,则二次确认后,将用户会话转接到留言状态;当当前客服电脑异常,如ie异常关闭、电脑异常关机等情况下,系统优先将该客服正在服务的用户会话自动转接其他客服(客服超过系统自动分发数量则等待接入),如果均无客服在线,则转接留言状态。
邀请会话是运维客服闲暇时候可以实时观察前台用户与机器人对话,一旦发现需要人工辅助的情况,就邀请用户进入人工会话过程中。另外邀请会话也支持客服针对排队中的用户针对性的优先安排进入会话。邀请会话弹出层可以展示用户访问的方式、满意度情况、危险程度,辅助客服做出决策,其中危险程度与后台的敏感词的程度有关联。
客服可以在聊天会话窗口中对用户的聊天回复语设置为忽略词,被设置成忽略词将不作为用户未读信息累加,系统也不做消息会话提示。
客服通过点击问题管理菜单进入到问题管理模块,默认按更新时间降序展示所有问题数据。客服可在该模块页面能够对分类进行添加、删除、修改操作。
添加问题模块是实现知识点的核心基础功能,对知识内容进行录入,录入信息包括标准问法、相似问法、标准答案、关联问法、问题分类、生效时间、启用状态、审核人员等信息。
系统自动收集前台机器人无法回答的未知问题,客服通过问题学习模块能够浏览所有的未知问题,并对未知问题进行管理。可对系统后台收集的未知问题进行管理操作,如条件检索、关联、忽略、屏蔽。关联操作表示系统将这条未知问题关联知识库中的某条已存在的知识。忽略操作表示将未知问题进行单次删除操作,不在未知问题列表展示。屏蔽操作表示将未知问题进行永久性屏蔽,即不在未知问题列表展示。
近义词管理模块能够浏览所有的近义词,并能够对近义词进行添加、删除、修改操作。
客服可以在本模块中对忽略词进行增、删、改、查。对于已经被忽略的词不再作为未读信息累计且不做转人工提醒。可以通过定义忽略规则对客户的回复进行忽略。忽略词在历史对话消息中继续保留。
屏蔽词及忽略词的设置能够提升系统本身以及人工使用系统的效率。
如图5所示,电力系统工单数据生成知识库的过程包括以下步骤:
步骤1:进行工单采集,并转换为文本格式,并根据文本含义属性划分为多个文本域;
步骤2:以工单为单位,对工单文本数据进行分词处理;
步骤3:对文本域进行分组;
步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;
步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;
步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;其中,出现的频次可用于知识图谱构建时的机器学习的运算。
步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,来抽取实体关系。
其中,
1)实体。每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。最典型的包括人名、地名、机构名等三类通用实体。对于电力信息运维领域,除了通用实体外,存在更丰富的实体,如服务器、运维系统、电网、变压器、变电站、输电线路、配网、主网等等。
2)属性一值。每个属性一值对用来刻画实体的内在特性。属性值范围包括:数值型(如工单号、电话),枚举型(如部门、单位),短文本(如工单事件标题),长文本(如工单事件详述)。
3)关系。而关系用来连接两个实体,刻画它们之间的关联。典型的关系抽取方法按照“模板生成实例抽取”的流程不断迭代直至收敛。例如,最初可以通过“X是Y的总部地址”模板抽取出(国家电网,总部地址,北京)三元组实例;然后根据三元组中的实体对“国家电网一北京”可以发现更多的匹配模板,如“Y的总部地址是X”、“X是Y的中心”等;进而用新发现的模板抽取更多新的三元组实例,通过反复迭代不断抽取新的实例与模板。还可以通过识别表达语义关系的短语来抽取实体间关系。例如,通过句法分析,可以从文本中发现“国家电网”与“北京”的如下关系:(国家电网,总部位于,北京)、(国家电网,总部设置于,北京)、以及(国家电网,将其总部建于,北京)。通过这种方法抽取出的实体间关系非常丰富而自由,一般是一个以动词为核心的短语。
在本实施例中,电力系统工单数据具体是指,“一单两票”,即:检修计划工单、工作票和操作票。通过对“一单两票”非结构化文本数据的收集。并根据这些数据中的电力实体、电力实体之间的关系以及每个电力实体的属性及属性值,建立电力运维领域知识图谱,使得该领域以外的人可以通过该领域的知识图谱了解该领域目前的行业现状、发展趋势。对采集的文本数据进行分词,词性标注,通过命名实体识别方法识别电力运维实体,再通过实体关系抽取方法抽取出实体之间的关系,将识别过后的数据存储在图数据库Neo4j中,使用图模型属性表示知识图谱,通过图形可视化技术将存储在图数据库中的数据进行应用,对知识图谱进行实体关系展示。
电力系统工单数据生成知识库之后构建成为数据库中的知识图谱还包括以下步骤:
步骤8:将实体和实体关系转化为基于RDF的三元组;
步骤9:通过PTransE模型将实体和实体关系进行翻译和学习,构建成为知识图谱。
其中,PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来,将逻辑推理规则视为向量加法操作,其评分函数为:
Figure 454212DEST_PATH_IMAGE001
其中,
Figure 657791DEST_PATH_IMAGE002
表示实体间关系路径集合,
Figure 938731DEST_PATH_IMAGE003
为实体间的一条路径,
Figure 814021DEST_PATH_IMAGE004
等价于TransE的参数模型
Figure 762386DEST_PATH_IMAGE005
Figure 933604DEST_PATH_IMAGE006
的计算公式为
Figure 967419DEST_PATH_IMAGE007
其中
Figure 616706DEST_PATH_IMAGE008
是一个归一化函数,
Figure 389883DEST_PATH_IMAGE009
表示头实体h到尾实体t的关系路径p的可靠性;
Figure 200845DEST_PATH_IMAGE010
表示头实体h到尾实体t的关系路径p的势能函数;
对于路径集合
Figure 721956DEST_PATH_IMAGE011
,其函数如下
Figure 142311DEST_PATH_IMAGE012
其中
Figure 534109DEST_PATH_IMAGE013
用于衡量头实体h到尾实体t的关系路径p的可靠性,即
Figure 250392DEST_PATH_IMAGE014
其中实体h到实体t的路径关系p,
Figure 178508DEST_PATH_IMAGE015
,从实体h通过路径关系p,将路径表示为
Figure 169597DEST_PATH_IMAGE016
,其中
Figure 180016DEST_PATH_IMAGE017
Figure 332780DEST_PATH_IMAGE018
;对于任何实体
Figure 297325DEST_PATH_IMAGE019
Figure 357685DEST_PATH_IMAGE020
Figure 225540DEST_PATH_IMAGE021
的关系的直接用关系来表示
Figure 814785DEST_PATH_IMAGE022
;首先对实体h赋予权重1,然后对函数
Figure 797784DEST_PATH_IMAGE023
进行不断迭代,获得t的权重。
具体地,在本实施例中,由于深度学习算法的计算较为复杂,特征的维度常常达到上万级别,对计算机的资源开销极大,并且由于深度学习算法在有限样本量上也能具备较好的表征能力,在选取有限数量样本的前提下,对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采集;采用BeautifulSoup包对采集的内容进行解析;
由于中文与英文在自然语言处理方面一个显著的差别是英文可以通过空格来切分单词,而中文在词的划分上是不明确的,因此在对中文进行处理时,首先需要对它进行分词。本实施例中采用R环境下的Rwordseg包进行分词,Rwordseg基于中科院的ICTCLAS中文分词算法写成,可以实现分词、多级词性标注、关键词提取等功能,还可以导入自定义的词典来进行分词。
由于实验数据来源于“国网福建电力有限公司--集中认证服务单点登录平台中的“一单两票”非结构化文本数据,因此在釆用Rwordseg包进行分词时,还需要增加该领域的词典,以提高分词的准确性。电力行业相对来说不是很开放的领域,目前并没有完整的领域词典,因此需要人工对该领域的词典进行构建。机器釆集和人工采集相结合的办法来构建该领域的词典。首先通过程序自动采集“一单两票”数据中的词条,继而釆取人工采集方式进一步扩充该领域的词典。
词典的构建过程如下:
(1)对“一单两票”的词条进行标注分析,选择了“开单人”、“开单时间”、“开单内容”等多个标签。
(2)釆用Python编写爬虫,爬取(1)中确定的多个标签下的词条。并对釆集到的词条进行去重。
(3)由于采集的是“一单两票”的tag页面下的词条,而tag页面中最多只列出了某些词条,那些没有列出的词条没有办法通过程序直接釆集。基于这个原因,实验通过人工查看数据集中的内容,补充没有采集到的词条。
采用Rwordseg包中的installDict可以安装自建的词典,对数据集进行分词。对收集到的文本数据进行分词,然后,用这些词用来进行知识实体识别。将分词后得到的内容与自建的词典入库,后续将结合两者进行进一步处理。
在本实施例中,通过构建词典和概念匹配的方式来解决共指消解这一问题,在构建知识图谱前,利用字典将同一概念的不同表述方式映射为同一个实体。例如,对于“国家电网”这个实体,实验会自动识别“SGCC”、“国家电网”、“国家电网公司”等多种表述方式,并将这些表述方式转换为“国家电网”这一表达方式。
电力领域知识图谱中的概念层包括:开单人、时间、申请内容以及操作对象。针对知识图谱中的概念以及概念中的实体,在本实施例中,采取自顶向下的方法来构建电子领域知识图谱。自顶向下的方式不是首先通过人工的方法构建顶层关系本体,而是直接以属性图中属性键值对以及实体对关系的形式进行表示。
1)属性图中的属性键值对以及标签表示
比如“虚拟服务器”实体术语操作对象类,则在属性图中针对“虚拟服务器”节点,添加一个type属性,其值为“操作对象”。
2)实体对关系
比如“虚拟服务器”实体跟“开票人”概念中“张建晖”以及“张超”实体有联系,“开票人”对“虚拟服务器”执行某种操作,则我们将“虚拟服务器”与“张建晖”进行实体关系连接,建立related Body相关关系。
本专利不局限于上述最佳实施方式,任何人在本专利的启示下都可以得出其它各种形式的电力信息运维智能应答系统,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本专利的涵盖范围。

Claims (7)

1.一种电力信息运维智能应答系统,其特征在于,包括:
用户问答模块、智能应答模块和管理模块;
所述智能应答模块提取用户问题的一个或多个关键词,通过近义词关联模块从数据库中提取一个或多个与关键词匹配的问题解答方案供用户选择;
所述管理模块可监控用户问答模块与智能应答模块之间的互动,并可接入用户问答模块,同时断开用户问答模块与智能应答模块之间的连接;
所述管理模块可选取用户问题的关键词并添加到数据库中,并建立关键词与问题解答方案的新的匹配关系;
所述管理模块可删除关键词与问题解答方案的匹配关系;
所述数据库通过多个知识库学习关键词和问题解答方案的匹配,以及关键词和其近义词之间的匹配,并构成知识图谱;
电力系统工单数据生成知识库的过程包括以下步骤:
步骤1:进行工单采集,并转换为文本格式,并根据文本含义属性划分为多个文本域;
步骤2:以工单为单位,对工单文本数据进行分词处理;
步骤3:对文本域进行分组;
步骤4:对各文本域分别进行域分词处理,采用基于字符串匹配的分词方法分别对各分组的内容进行词汇切分;
步骤5:根据无效词汇表进行无效词汇过滤,过滤掉无效词汇和敏感词汇;
步骤6:将有效词汇与知识库中词汇表进行比对,将新词汇加入到知识库的词汇列表,对己有词汇进行累加其出现的频次;
步骤7:抽取加入词汇的实体关系:通过预先定义实体关系类型及基于实体的特征,来抽取实体关系;
步骤8:将实体和实体关系转化为基于RDF的三元组;
步骤9:通过PTransE模型将实体和实体关系进行翻译和学习,构建成为知识图谱。
2.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:通过所述管理模块解答,并获得用户认可的用户问题,与其对应的人工问题解答方案构成关键词和问题解答方案的匹配关系,并添加到数据库中。
3.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:所述数据库采用Neo4j图数据库存储;所述知识库采用MySQL进行数据存储。
4.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:所述知识库的数据来源包括电力系统工单数据和/或电力系统ERP数据库和/或I6000知识库。
5.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:所述数据库通过PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来。
6.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:所述PTransE模型将知识图谱中的关系路径与关系的向量表达联系起来,将逻辑推理规则视为向量加法操作,其评分函数为:
f(h,r,t)=E(h,r,t)+E(h,P(h,t),t)
其中,P(h,t)={p1,p2,... ,pN}表示实体间关系路径集合,pi=(r1,r2,…,rk)为实体间的一条路径,E(h,r,t)等价于TransE的参数模型fE(h,r,t)=||h+r-t||2,E(h,P(h,t),t)的计算公式为
Figure FDA0003260000020000021
其中Z=∑p∈P(h,t)R(p|h,t)是一个归一化函数,R(p|h,t)表示头实体h到尾实体t的关系路径p的可靠性;E′(h,p,t)表示头实体h到尾实体t的关系路径p的势能函数;
对于R(p|h,t),其函数如下
Figure FDA0003260000020000022
其中Rp(m)用于衡量头实体h到尾实体t的关系路径p的可靠性,即R(p|h,t)=Rp(m),
其中实体h到实体t的路径关系p,p=(r1,…,rl),从实体h通过路径关系p,将路径表示为
Figure FDA0003260000020000023
其中S0=h,Sl=t;对于任何实体m∈Si,ri在Si-1的关系的直接用关系来表示Si-1(·,m);首先对实体h赋予权重1,然后对函数Rp(m)进行不断迭代,获得t的权重。
7.根据权利要求1所述的电力信息运维智能应答系统,其特征在于:对电力系统工单数据采用Python的urllib2包对非结构化文本数据的内容进行采集;采用BeautifulSoup包对采集的内容进行解析;采用R环境下的Rwordseg包进行分词。
CN201810189009.XA 2018-03-08 2018-03-08 电力信息运维智能应答系统 Active CN108491378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810189009.XA CN108491378B (zh) 2018-03-08 2018-03-08 电力信息运维智能应答系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810189009.XA CN108491378B (zh) 2018-03-08 2018-03-08 电力信息运维智能应答系统

Publications (2)

Publication Number Publication Date
CN108491378A CN108491378A (zh) 2018-09-04
CN108491378B true CN108491378B (zh) 2021-11-09

Family

ID=63337903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810189009.XA Active CN108491378B (zh) 2018-03-08 2018-03-08 电力信息运维智能应答系统

Country Status (1)

Country Link
CN (1) CN108491378B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189752A (zh) * 2018-10-12 2019-01-11 国网山东省电力公司电力科学研究院 基于智能检索技术的电力营销知识库系统
CN109615407A (zh) * 2018-10-19 2019-04-12 国家电网有限公司 基于人工智能的在线电力智慧客服方法
CN109740928A (zh) * 2018-12-29 2019-05-10 北京中电普华信息技术有限公司 电力咨询业务处理方法和装置
CN109831590A (zh) * 2019-01-15 2019-05-31 深圳供电局有限公司 一种通信管理平台及管理方法
CN109829046A (zh) * 2019-01-18 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能坐席系统及方法
CN110535752A (zh) * 2019-08-26 2019-12-03 南京睿数网络科技有限公司 一种基于微信公众号的智能问答系统和方法
CN111708867A (zh) * 2020-01-10 2020-09-25 国网浙江省电力有限公司杭州供电公司 应用于电力运检的问答查询方法及装置、设备
CN111522949A (zh) * 2020-04-24 2020-08-11 北京思特奇信息技术股份有限公司 一种基于文本聚类的智能回答方法及系统
CN111831792B (zh) * 2020-07-03 2021-08-27 国网江苏省电力有限公司信息通信分公司 一种电力知识库构建方法及系统
CN112580831B (zh) * 2020-11-19 2024-03-29 国网江苏省电力有限公司信息通信分公司 一种基于知识图谱的电力通信网智能辅助运维方法及系统
CN113836280A (zh) * 2021-08-31 2021-12-24 上海欣能信息科技发展有限公司 基于知识图谱技术的电网运检知识语音问答方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1734445A (zh) * 2004-07-26 2006-02-15 索尼株式会社 用于对话的方法、装置和程序及其中存储程序的存储介质
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答系统及方法
CN101178711A (zh) * 2006-11-30 2008-05-14 腾讯科技(深圳)有限公司 一种中文自动应答方法及系统
CN102004989A (zh) * 2010-10-19 2011-04-06 福建亿榕信息技术有限公司 一种电力业务服务系统
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服系统的构建方法及系统
CN106600298A (zh) * 2016-12-23 2017-04-26 国网山东省电力公司信息通信公司 基于工单数据分析的电力信息系统客服知识库构建方法
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN107273490A (zh) * 2017-06-14 2017-10-20 北京工业大学 一种基于知识图谱的组合错题推荐方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103493045B (zh) * 2011-01-18 2019-07-30 谷歌有限责任公司 对在线问题的自动回答
CN105279587A (zh) * 2014-05-27 2016-01-27 刘中一 基于移动互联网智能应答及问卷调研测评分析转化系统
CN105701253B (zh) * 2016-03-04 2019-03-26 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN106844723B (zh) * 2017-02-10 2019-09-10 厦门大学 基于问答系统的医学知识库构建方法
CN107562792B (zh) * 2017-07-31 2020-01-31 同济大学 一种基于深度学习的问答匹配方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1734445A (zh) * 2004-07-26 2006-02-15 索尼株式会社 用于对话的方法、装置和程序及其中存储程序的存储介质
CN101097573A (zh) * 2006-06-28 2008-01-02 腾讯科技(深圳)有限公司 一种自动问答系统及方法
CN101178711A (zh) * 2006-11-30 2008-05-14 腾讯科技(深圳)有限公司 一种中文自动应答方法及系统
CN102004989A (zh) * 2010-10-19 2011-04-06 福建亿榕信息技术有限公司 一种电力业务服务系统
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服系统的构建方法及系统
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN106600298A (zh) * 2016-12-23 2017-04-26 国网山东省电力公司信息通信公司 基于工单数据分析的电力信息系统客服知识库构建方法
CN107273490A (zh) * 2017-06-14 2017-10-20 北京工业大学 一种基于知识图谱的组合错题推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Modeling Relation Paths for Representation Learning of Knowledge Bases;Yankai Lin等;《https://arxiv.org/pdf/1506.00379.pdf》;20150815;1-10 *
电力智能问答平台架构的研究与设计;张峰等;《能源与环保》;20170720;第39卷(第7期);193-195,200 *

Also Published As

Publication number Publication date
CN108491378A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN108491378B (zh) 电力信息运维智能应答系统
CN108460136A (zh) 电力运维信息知识图谱构建方法
CN109033284A (zh) 基于知识图谱的电力信息运维系统数据库构建方法
US11258902B2 (en) Partial automation of text chat conversations
CN110516077A (zh) 面向企业商情的知识图谱构建方法及装置
CN108874783A (zh) 电力信息运维知识模型构建方法
CN109657072B (zh) 一种应用于政府辅助决策的智能搜索web系统及方法
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN115858758A (zh) 一种多非结构化数据识别的智慧客服知识图谱系统
CN112966089A (zh) 基于知识库的问题处理方法、装置、设备、介质和产品
CN112927082A (zh) 信用风险的预测方法、装置、设备、介质和程序产品
Tang et al. Research on automatic labeling of imbalanced texts of customer complaints based on text enhancement and layer-by-layer semantic matching
CN113553431A (zh) 用户标签提取方法、装置、设备及介质
CN112199488A (zh) 面向电力客服问答的渐增式知识图谱实体抽取方法和系统
Wan et al. Evaluation model of power operation and maintenance based on text emotion analysis
CN116467291A (zh) 一种知识图谱存储与搜索方法及系统
Küçük Monitoring Energy Trends through Automatic Information Extraction
CN115269862A (zh) 一种基于知识图谱的电力问答与可视化系统
Liu et al. Construction of intelligent query system for metro electromechanical equipment faults based on the knowledge graph
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
Meng et al. Design and Implementation of Knowledge Graph Platform of Power Marketing
Meng et al. Research on the typical application of knowledge graph in power marketing
CN110147980A (zh) 工单处理方法及装置
CN110413636A (zh) 一种数据处理方法和装置
Zhong et al. Research on technology and application of tag portrait based on electric power big data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant