CN103744919A - 电网知识库的自学习方法和系统 - Google Patents

电网知识库的自学习方法和系统 Download PDF

Info

Publication number
CN103744919A
CN103744919A CN201310738216.3A CN201310738216A CN103744919A CN 103744919 A CN103744919 A CN 103744919A CN 201310738216 A CN201310738216 A CN 201310738216A CN 103744919 A CN103744919 A CN 103744919A
Authority
CN
China
Prior art keywords
power networks
experience
experiential
user
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310738216.3A
Other languages
English (en)
Other versions
CN103744919B (zh
Inventor
周强强
莫文雄
黄奕俊
邹庆年
刘晶
李津
程振华
陈创
陈文睿
刘灿萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangzhou Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Power Supply Bureau Co Ltd filed Critical Guangzhou Power Supply Bureau Co Ltd
Priority to CN201310738216.3A priority Critical patent/CN103744919B/zh
Publication of CN103744919A publication Critical patent/CN103744919A/zh
Application granted granted Critical
Publication of CN103744919B publication Critical patent/CN103744919B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Abstract

本发明公开了电网运行经验知识库的自学习方法和系统,接收查询请求,从查询请求语句中提取特征建立用户意图模型,利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索,比较转换后得到的信息和其它的或被评估的用户意图,利用启发式算法量化具体用户意图和信息的相似度,获得相似度最接近的需求术语,相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似程度,通过电网运行经验术语库来完成查询请求的转换,根据所述需求术语进行经验搜索,运用面向对象技术展现搜索到的电网运行经验;以及根据运行所述电网运行经验的反馈信息对经验知识库进行更新。本发明拥有主动学习能力,可根据用户的反馈进行更新,可快速为工作人员提供电气设备相关工作经验。

Description

电网知识库的自学习方法和系统
【技术领域】
本发明属于电力自动化技术领域,具体一种电网运行经验知识库的自学习方法和系统。 
【背景技术】
电力安全始终是电力运行的重中之重,为实现电力系统的经济安全运行,在目前电力系统的元件和自动装置可靠性一定的条件下,只能努力提高工作人员的业务水平。因此,建立电网运行经验知识库,将电网现有的运行经验与电力员工在工作中积累的设备运行维护、故障判断及处理经验等知识编码化、有序化,加快知识流动,促进知识共享,有利于知识管理,提高企业的竞争力。现有的电网电气设备知识库管理系统,实现了电网企业隐性知识到显性知识的转换,构建了一个知识共享学习平台,但目前系统提供的学习是单方面的,即只有人向现有的已存在数据库中的知识学习,而无系统主动向人学习的功能,无法实现人与系统的反馈交流;另一方面,目前广泛应用于电力系统的面向对象技术仅局限于电气元件本身固有属性的继承化与模块化,并没有考虑到元件的电网中运行经验这一外延属性。 
【发明内容】
为实现上述目的,本发明提供了一种电网运行经验知识库的自学习方法和系统,该运行方法具体包括如下步骤: 
接收查询请求; 
从查询请求语句中提取特征建立用户意图模型; 
利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索; 
比较转换后得到的需求术语和被评估的用户意图; 
利用启发式算法量化具体用户意图和信息的相似度; 
获得相似度最接近的需求术语,相似度是基于权重的贝叶斯函数来比较两 条信息请求之间的相似程度,查询请求的转换是通过电网运行经验术语库来完成; 
根据需求术语进行经验搜索; 
运用面向对象技术展现搜索到的电网运行经验;以及 
根据运行所述电网运行经验的反馈信息对经验知识库进行更新。 
该自学习系统包括如下模块,具体如下: 
接收模块,用于接收查询请求; 
转换模块,用于转换所述查询请求为标准的需求术语,所述查询请求的转换是通过电网运行经验术语库来完成; 
搜索模块,用于根据转换模块获得需求术语进行经验搜索; 
展现模块,用于运用面向对象技术展现搜索到的电网运行经验; 
更新模块,用于根据反馈信息对经验知识库进行更新。 
本发明的有益效果:本发明的经验知识库拥有主动学习能力,包含了电网多种工作性质的运行经验,经验知识库可根据用户的反馈对经验知识库更新,运用面向对象的知识表达方法,把电网运行经验作为系统的属性,可快速为工作人员提供电气设备相关工作经验。 
【附图说明】 
图1为本发明方法采用的电网运行经验知识库的自学习方法流程图; 
图2为本发明另一方法采用的电网运行经验知识库的自学习方法流程图; 
图3为本发明方法采用的电网运行经验知识库运行方法示意图; 
图4为本发明方法采用的电网运行经验知识库知识运行方法示意图; 
图5为本发明方法采用的变压器运行经验元知识表达方式示意图; 
图6为本发明系统采用的电网运行经验知识库的模块框架图; 
图7为本发明另一实施例采用的电网运行经验知识库的模块框架图。 
【具体实施方式】
下面以运用本发明方法设计的中国南方电网广东供电局电网运行经验知识 库为实施例,对本发明方法进行详细描述。 
实施例一 
图1示出了本发明电网运行经验知识库系统的运行方法,具体包括如下步骤: 
步骤A:接收查询请求。 
在电网运行过程中,电网工作人员或者普通用户,在实际生活中出现问题,可以输入针对问题的查询请求,该查询请求包括但不限于:文本、语音或者手写轨迹。优选的,在实际运行中,当电网运行出现故障的时候,系统会提示“上报错误”等信息,电网工作人员或者用户可以出发该信息,完成查询请求的输入。 
步骤B:转换查询请求为标准的需求术语,所述请求的转换是通过电网运行经验术语库来完成。 
转换查询请求为标准的需求术语具体可以为: 
从查询请求语句中提取特征建立用户意图模型; 
利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索; 
比较转换后得到的需求术语和其它的或被评估的用户意图; 
利用启发式算法量化具体用户意图和信息的相似度; 
获得相似度最接近的需求术语,相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似程度,查询请求的转换是通过电网运行经验术语库来完成; 
以查询“#1变压器无法调压”为例,系统将自动进行语义转换得到并显示“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三项缺陷描述供电网工作者或用户根据现场实际情况选择“电动调压卡阻”。 
一种语义转换方法为系统对查询请求进行分词处理,剔除“语气词”、“助词”等干扰词汇,剩下的词作为术语。通过术语显示与术语相关的需求术语,比如:“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”。将需求术语显示并提供电网工作者或用户来选择。 
步骤C:根据获得需求术语进行经验搜索。 
具体的通过知识规则库对需求术语进行经验搜索。 
具体的,根据获得的需求术语进行经验搜索需要包括:1,进行知识归纳分析;2,搜索相关的电网运行经验。 
具体的知识归纳是指将需求术语相关的分类汇总,一方面可以提高查询和搜索效果;另一方面,可以降低管理成本,有利于后续经验的更新。 
以步骤B中需求术语“电动调压卡阻”为例,步骤C为知识规则库根据步骤B得到的需求术语“电动调压卡阻”进行知识分析归纳以及经验搜索。 
步骤D:运用面向对象技术展现步骤C搜索到的电网运行经验。 
具体以需求术语“电动调压卡阻”为例: 
运用面向对象技术展现步骤C搜索到的电网运行经验,系统显示#1变压器电动调压卡阻缺陷管理如表1,并显示#1变压器电动调压卡阻的历史记录如表2。 
表1#1变压器电动调压卡阻缺陷管理 
Figure BDA0000447425960000041
表2#1变压器电动调压卡阻历史记录 
序号 型号 故障日期 处理措施 维护人员
1 xxxxx 2013-08-23 对操作轴进行润滑 xxx
步骤E:根据运行所述电网运行经验的反馈信息对经验知识库进行更新。 
电网工作者或用户按照表1给出的操作指导进行操作或者根据实际情况选择更加合理的处理措施,并检查实际效果,然后对操作指导进行反馈,反馈信息如表3,系统根据用户反馈信息对知识规则库的规则做出更新。 
表3#1变压器电动调压卡阻缺陷管理反馈 
指导处理措施 实际处理措施 实际处理效果 维护人员
对操作轴进行润滑 对操作轴进行润滑 良好 xxx
[0058] 用户在从经验知识库中得到电网运行经验后,对这条经验进行评价,1.经验知识库自动匹配的需求术语是否满足切合用户的意思。2.查询到的经验是否解决了现场存在的问题,如果没有解决已有的问题,请用户对这条经验进行批注即补充新的经验。 
通过上述方法建立的面向主动式电网运行的经验知识库,可根据用户的反馈对经验知识库内的知识进行分类,向用户提供相联度的运行经验;运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新 
实施例二 
在实施例一的基础上,实施例二细化的方法为: 
步骤a:建立电网运行的经验知识库 
候选的建立包含多种工作性质的面向主动式电网运行的经验知识库,包括绘制电气一次接线图,添加变压器、电压互感器、电流互感器等相关设备信息。 
工作性质包括但不限于作业规范、缺陷管理、反事故措施、装置说明书、事故分析与处理、仪器仪表的操作方法、保护配置二次回路典型设计、技术规范等。 
所述经验知识库包括对经验知识库库内的知识进行分类,排序。 
步骤A0:接收电网运行的查询请求。 
步骤B0:利用电网运行经验术语库将接收到的电网运行的查询请求转换为标准的需求术语。 
优选的,从用户查询请求语句中提取特征建立用户意图模型,再利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索;转换后得到的信息和其它的或被评估的用户意图进行比较,最后利用启发式算法量化具体用户意图和信息的相似度,通过相似度转换为标准的需求术语。本优选方案可以用户要查询的内容进行提炼,找出最切合的关键字。相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似 程度。相似度最接近的需求术语为标准的需求术语。 
优选的,概率判断通过贝叶斯函数概率算法来得到。 
优选的,根据电网运行的实际场景,结合用户意图以及相似度来来确定用户的查询请求,以便准备转换为标准术语。具体的,用户将要查询的内容进行描述,现场工作人员对于同一待查询内容的描述基本上是一致的。将用户的查询语句与经验知识库中的术语建立映射关系。这个是一N对1的映射,即N条用户描述句对应为1条术语。 
以查询“#1变压器无法调压”为例,系统将自动进行语义转换得到并显示“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三项缺陷描述,根据电网当前的实际场景、用户的意图以及相似度,有限认为该查询请求为“电动调压卡阻”。 
步骤C0:根据知识规则库,对获得需求术语进行知识分析以及经验搜索。 
优选的,通过知识规则库的事件引擎检索方式进行知识分析以及经验搜索。如此一来,可以提高信息查询的效率。 
优选的,利用模糊数据模型的智能查询优化算法提高信息查询效率。该方案是通过模糊检索技术来实现的。 
以步骤B中需求术语“电动调压卡阻”为例,步骤C0为知识规则库根据步骤B得到的需求术语“电动调压卡阻”进行知识分析归纳以及经验搜索 
步骤D0:运用面向对象技术展现步骤C搜索到的电网运行经验 
获取电网运行的运行状态和/或历史数据,所述运行状态和/或历史数据,运营面向对象技术展现电网运行经验 
优选的,利用历史数据与DDRTS结合实现故障重演分析。 
可以在虚拟场景下,通过日志(logo文件)进行回滚或者撤销,已恢复到电网运行故障的场景。根据该场景来查找最佳的处理方案,以搜索到最合适的电网运行经验。 
优选的,在对电网的相关设备进行维护和操作时,将于该设备相关的时间发送给继保或自动化管理员。该发送请求包括该设备的历史状态。 
继保或自动化管理员及时了解设备的运行状态,能够提高操作的准备性和 可靠性,使得在运行故障处理时,电网运行经验更加有针对性,能够为正确处理事故提供可靠依据。 
具体以需求术语“电动调压卡阻”为例: 
运用面向对象技术展现步骤C0搜索到的电网运行经验,系统显示#1变压器电动调压卡阻缺陷管理如表1,并显示#1变压器电动调压卡阻的历史记录如表2。 
表1#1变压器电动调压卡阻缺陷管理 
Figure BDA0000447425960000071
表2#1变压器电动调压卡阻历史记录 
序号 型号 故障日期 处理措施 维护人员
1 xxxxx 2013-08-23 对操作轴进行润滑 xxx
在电网运行中,继保或自动化管理员可以了解电网设备的运行状况、历史记录,可以确定电网运行经验的不同场景。当接收到不同的查询请求时,可以确定对应的网络运行经验的场景。根据当前电网运行的场景,知识规则库可以根据继保或自动化管理员设定的场景认为“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三个可能的电网运行故障中“无法电动调压”和“调压装置不起作用”不符合当前场景。而选择该场景下,出现概率最大的“电动调压卡阻”,并且以面向对象的方式显示“电动调压卡阻”的电网运行经验。 
优选的,知识规则库获取不同需求术语在不同电网运行场景下出现的次数,该次数可以通过历史数据统计得到。根据获得历史数据,对需求术语进行排序,并更新经验知识库中的排序信息。 
优选的,需求术语的排序可以结合不同场景进行。在不同场景下,相关的需求术语按照出现概率的大小进行排序。 
步骤E0:经验知识库根据对需求术语的反馈进行更新。 
电网工作者或用户按照表1给出的操作指导进行操作或者根据实际情况选 择更加合理的处理措施,并检查实际效果,然后对操作指导进行反馈,反馈信息如表3,系统根据用户反馈信息对知识规则库的规则做出更新。 
表3#1变压器电动调压卡阻缺陷管理反馈 
Figure BDA0000447425960000081
优选的,采用贝叶斯函数的概率原理计算评价反馈信息的可靠性,若可靠性低于设计的最小概率则放弃此项内容的更新,反之则更新经验知识库。 
将电网运行的查询请求转换为标准的需求术语的过程中是将每一条需求术语作为一个词条,这个词条的计算属性为词频与反文档频率;将每一个电网运行经验作为一个小文档。处理电网运行经验实质上是处理一个一个的小文本,这样以文本分类的形式来建立贝叶斯函数。 
朴素贝叶斯函数对文本分来说,它假设各个词条Wi和Wj之间两两独立。设训练样本集分为k类,记为C={C1,C2,L,Ck}则每个类Ci的先验概率为P(Ci),i=1,2,L,k其值为Ci类的样本数除以训练集总样本数n。对于新样本d,其属于Ci类的条件概率是P(d/Ci)。 
从贝叶斯公式直观看来,文本的类别与特征词的词频、文档频率有很大关系,词频、文档频率越大,说明该词越具有代表性。但实际情况并非如此,词频及文档频率并不足以完全代表某个词在分类中的重要程度。这就导致分类系统不能有效地找到那些能够标识一个类别的特征,从而造成应用朴素贝叶斯的分类效率的低下。 
为了有效地表示特征词(电网运行经验库术语)与每个类别的关系,通过使用了权重来代替词频或文档频率计算特征词属于某类的先验概率,并认为权重较大的特征词对分类的影响较大。 
某个词条或某几个词条的组合在一条电网运行经验中出现频率很高,而在其他电网运行经验中出现频率比较低,则认为此词语或此词语的组合有很好的类区别能力,其相应的权重值应该较高。 
目前常见而又高效率的权重计算方式为TFDIF模型,计算公式为:TF×IDF。 TF为词频,表示电网运行经验需求术语(词条)tk在一条电网运行经验(文档)d中出现的频率。IDF为反文档频率,计算公式为IDF=log(N/n)。其中,N为全部文档数,n表示包含词条tk的文档频率。 
由于训练集的偏差,如每类训练集数目不同、训练集文本内容大小不相等。通过TFIDF计算词条对训练集的权重时,可能会出现某些词条对几类训练集具有相似的权重,这就不能体现出该词条对其他的类别的权重状态。为了解决同一词条对多个类别有类似的贡献度的问题,我们需要对TFIDF计算所得的权重进行改进。在这里,采用信息增益IG来改进权重,IG可以用下式表示: 
IG ( t ) = - Σ i = 1 m P ( C i ) log P ( C i ) + P ( t ) Σ i = 1 m P ( C i / t ) log P ( C i / t ) + P ( t ) ‾ Σ i = 1 m P ( C i / t ‾ ) log P ( C i / t ‾ ) - - - ( 1 )
公式(1)中,P(Cit)表示文本中出现特征t时,文本属于Ci的概率;
Figure BDA0000447425960000094
表示文本中不出现单词t时,文本属于Ci的概率;P(Ci)表示类别出现的概率;P(t)表示t在整个文本训练集中出现的概率。将权重归一化如下: 
W ( t i , d j ) = tf ik × log ( N / n + 0.01 ) × IG k Σ k = 1 t ( f ik × log ( N / n + 0.01 ) × IG k ) 2 - - - ( 2 )
W(ti,dj)为计算词条tk在类别dj所得的权重,这样有效地改善了在某类中权重较大而在其他类别中权重较小的词对分类结果的影响。 
对于在电气设备下的七大属性中的某个属性的电网运行经验文档中,总会出现的高频词条,这个词条对类内的文档分类没有任何贡献,只是能区别不同的设备属性,我们采用公式(3)来计算先验概率: 
P ( w j / C i ) = 1 + W ( w j / C i ) | V | + Σ k = 0 | V | ( w j / C i ) - - - ( 3 )
|V|表示特征词表中总词条数,(wj/Ci)表示该词条的权重。 
将权重的概念引入到朴素贝叶斯分类方法中,则基于权重的朴素贝叶斯函数的公式为: 
P ( C i / d ) = P ( C i ) Π j = 1 m P ( w j / C i ) × W ( w j / C i ) = P ( C i ) Π j = 1 m 1 + W ( w j / C i ) | V | + Σ k = 0 | V | ( w j / C i ) × W ( w j / C i ) - - - ( 4 )
|V|表示特征词表中总词条数,(wj/Ci)表示该词条的权重。 
公式(4)基于如下思想:该词条在某类中先验概率越大,权重越大,它对区分文档类别的贡献也就越大。 
这样既可以保证经验知识库的持续更新,又能为经验知识库节约存储空间,减少经验知识库的运行成本。 
优选的,基于权重的贝叶斯函数计算电网运行经验与用户查询请求的关联度,并对这些电网运行经验按照关联度的大小进行排序,以便后续优先向用户或电网工作者提供关联度最大的运行经验。 
通过上述方法建立的面向主动式电网运行的经验知识库,可根据用户的反馈对经验知识库内的知识进行分类,向用户提供相联度的运行经验;运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新 
本发明实施例拥有主动学习能力的电网运行经验知识库法包含了电网多种工作性质的运行经验,经验知识库可根据用户或电网工作者的反馈对经验知识库内的知识进行分类、排序与优化,优先向用户提供关联度最大的运行经验;运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新。这种学习是可重复的,而且对于每一种特征都是相互独立的,即不同的属性不会相互影响,属于离散的单一学习。利用基于参数权重的朴素贝叶斯函数来统计用户反馈的某一知识的频率,以此提高经验知识库的可靠性与客观性。 
实施例三 
图6示出了本发明电网运行经验知识库系统的自学习系统,自学习系统包括接收模块、转换模块、搜索模块、展现模块和更新模块,具体如下: 
接收模块:用于接收查询请求。 
在电网运行过程中,电网工作人员或者普通用户,在实际生活中出现问题,可以输入针对问题的查询请求,该查询请求包括但不限于:文本、语音或者手写轨迹。优选的,在实际运行中,当电网运行出现故障的时候,系统会提示“上报错误”等信息,电网工作人员或者用户可以出发该信息,完成查询请求的输入。 
转换模块:用于转换接收模块获得查询请求为标准的需求术语,所述请求的转换是通过电网运行经验术语库来完成。 
从查询请求语句中提取特征建立用户意图模型; 
利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索; 
比较转换后得到的需求术语和其它的或被评估的用户意图; 
利用启发式算法量化具体用户意图和信息的相似度; 
获得相似度最接近的需求术语,相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似程度,查询请求的转换是通过电网运行经验术语库来完成; 
以查询“#1变压器无法调压”为例,系统将自动进行语义转换得到并显示“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三项缺陷描述供电网工作者或用户根据现场实际情况选择“电动调压卡阻”。 
一种语义转换方法为系统对查询请求进行分词处理,剔除“语气词”、“助词”等干扰词汇,剩下的词作为术语。通过术语显示与术语相关的需求术语,比如:“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”。将需求术语显示并提供电网工作者或用户来选择。 
搜索模块:用于根据转换模块获得需求术语进行经验搜索。 
搜索模块通过查询知识规则库,对需求术语进行经验搜索。 
具体的,根据获得的需求术语进行经验搜索需要包括:1,进行知识归纳分 析;2,搜索相关的电网运行经验。 
具体的知识归纳是指将需求术语相关的分类汇总,一方面可以提高查询和搜索效果;另一方面,可以降低管理成本,有利于后续经验的更新。 
以需求术语“电动调压卡阻”为例,搜索模块通过知识规则库根据转换模块获得需求术语“电动调压卡阻”进行知识分析归纳以及经验搜索 
展现模块:用于通过面向对象技术展现搜索模块搜索到的电网运行经验 
具体以需求术语“电动调压卡阻”为例: 
运用面向对象技术展现搜索模块搜索到的电网运行经验,系统显示#1变压器电动调压卡阻缺陷管理如表1,并显示#1变压器电动调压卡阻的历史记录如表2。 
更新模块:根据电网运行经验的反馈信息对经验知识库进行更新。 
电网工作者或用户按照表1给出的操作指导进行操作或者根据实际情况选择更加合理的处理措施,并检查实际效果,然后对操作指导进行反馈,反馈信息如表3,系统根据用户反馈信息对知识规则库的规则做出更新。 
用户在从经验知识库中得到电网运行经验后,对这条经验进行评价,1.经验知识库自动匹配的需求术语是否满足切合用户的意思。2.查询到的经验是否解决了现场存在的问题,如果没有解决已有的问题,请用户对这条经验进行批注即补充新的经验。 
通过运行的面向主动式电网运行的经验知识库,可根据用户的反馈对经验知识库内的知识进行分类,向用户提供相联度的运行经验;运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新 
实施例四 
在实施例三的基础上,实施例四细化的自学习系统包括: 
建立模块:用于建立电网运行的经验知识库 
候选的建立包含多种工作性质的面向主动式电网运行的经验知识库模型, 包括绘制电气一次接线图,添加变压器、电压互感器、电流互感器等相关设备信息。 
工作性质包括但不限于作业规范、缺陷管理、反事故措施、装置说明书、事故分析与处理、仪器仪表的操作方法、保护配置二次回路典型设计、技术规范等。 
所述经验知识库包括对经验知识库库内的知识进行分类,排序。 
接收模块:进一步用于接收电网运行的查询请求。 
转换模块:进一步用于利用电网运行经验术语库将接收到的电网运行的查询请求转换为标准的需求术语。 
优选的,转换模块从用户查询请求语句中提取特征建立用户意图模型,再利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索。转换后得到的信息可以和其它的或被评估的用户意图进行比较,最后利用启发式算法量化具体用户意图和信息的相似度以达到转换标准的需求术语的目的。 
优选的,概率判断通过贝叶斯函数来得到。 
优选的,转换模块根据电网运行的实际场景,结合用户意图以及相似度来来确定用户的查询请求,以便准备转换为标准的需求术语。相似度最接近的需求术语为标准的需求术语。 
以查询“#1变压器无法调压”为例,系统将自动进行语义转换得到并显示“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三项缺陷描述,根据电网当前的实际场景、用户的意图以及相似度,可以认为该查询请求为“电动调压卡阻”。 
搜索模块:进一步用于根据知识规则库,对获得需求术语进行知识分析以及经验搜索。 
搜索模块通过知识规则库的事件引擎检索方式进行知识分析以及经验搜索。如此一来,可以提高搜索模块信息查询的效率。 
优选的,搜索模块利用模糊数据模型的智能查询优化算法提高信息查询效率。该方案是通过模糊检索技术来实现的。 
展现模块:进一步用于运用面向对象技术展现步骤C搜索到的电网运行经验 
优选的,展现模块包括故障重演单元,用于历史数据与DDRTS结合实现故障重演分析。 
可以在虚拟场景下,通过日志(logo文件)进行回滚或者撤销,已恢复到电网运行故障的场景。根据该场景来查找最佳的处理方案,以搜索到最合适的电网运行经验。 
优选的,展现模块还包括发送单元,用于在对电网的相关设备进行维护和操作时,将于该设备相关的时间发送给继保或自动化管理员。该发送请求包括该设备的历史状态。 
继保或自动化管理员及时了解设备的运行状态,能够提高操作的准备性和可靠性,使得在运行故障处理时,电网运行经验更加有针对性,能够为正确处理事故提供可靠依据。 
具体以需求术语“电动调压卡阻”为例: 
运用面向对象技术展现步骤C0搜索到的电网运行经验,系统显示#1变压器电动调压卡阻缺陷管理如表1,并显示#1变压器电动调压卡阻的历史记录如表2。 
表1#1变压器电动调压卡阻缺陷管理 
Figure BDA0000447425960000141
表2#1变压器电动调压卡阻历史记录 
Figure BDA0000447425960000142
在电网运行中,继保或自动化管理员可以了解电网设备的运行状况、历史记录,可以确定电网运行经验的不同场景。当接收到不同的查询请求时,可以确定对应的网络运行经验的场景。根据当前电网运行的场景,知识规则库可以根据继保或自动化管理员设定的场景认为“无法电动调压”、“电动调压卡阻”、“调压装置不起作用”三个可能的电网运行故障中“无法电动调压”和“调压装置不起作用”不符合当前场景。而选择该场景下,出现概率最大的“电动调压卡阻”,并且以面向对象的方式显示“电动调压卡阻”的电网运行经验。 
优选的,知识规则库获取不同需求术语在不同电网运行场景下出现的次数,该次数可以通过历史数据统计得到。根据获得历史数据,对需求术语进行排序,并更新经验知识库中的排序信息。 
优选的,需求术语的排序可以结合不同场景进行。在不同场景下,相关的需求术语按照出现概率的大小进行排序。 
优选的,根据电网运行的实际场景,结合用户意图以及相似度来来确定用户的查询请求,以便准备转换为标准术语。具体的,用户将要查询的内容进行描述,现场工作人员对于同一待查询内容的描述基本上是一致的。将用户的查询语句与经验知识库中的术语建立映射关系。这个是一N对1的映射,即N条用户描述句对应为1条术语。相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似程度。 
更新模块:用于根据对需求术语的反馈更新经验知识库。 
电网工作者或用户按照表1给出的操作指导进行操作或者根据实际情况选择更加合理的处理措施,并检查实际效果,然后对操作指导进行反馈,反馈信息如表3,自学习系统根据用户反馈信息对知识规则库的规则做出更新。 
更新模块采用贝叶斯函数的概率原理计算评价反馈结构的可靠性,若可靠性低于设计的最小概率则放弃此项内容的更新,反之则更新经验知识库。 
将电网运行的查询请求转换为标准的需求术语的过程中是将每一条需求术语作为一个词条,这个词条的计算属性为词频与反文档频率;将每一个电网运行经验作为一个小文档。处理电网运行经验实质上是处理一个一个的小文本,这样以文本分类的形式来建立贝叶斯的函数。 
朴素贝叶斯函数对文本分来说,它假设各个词条Wi和Wj之间两两独立。设训练样本集分为k类,记为C={C1,C2,L,Ck}则每个类Ci的先验概率为P(Ci),i=1,2,L,k其值为Ci类的样本数除以训练集总样本数n。对于新样本d,其属于Ci类的条件概率是P(d/Ci)。 
从贝叶斯公式直观看来,文本的类别与特征词的词频、文档频率有很大关系,词频、文档频率越大,说明该词越具有代表性。但实际情况并非如此,词频及文档频率并不足以完全代表某个词在分类中的重要程度。这就导致分类系统不能有效地找到那些能够标识一个类别的特征,从而造成应用朴素贝叶斯的分类效率的低下。 
为了有效地表示特征词(电网运行经验库术语)与每个类别的关系,通过使用了权重来代替词频或文档频率计算特征词属于某类的先验概率,并认为权重较大的特征词对分类的影响较大。 
某个词条或某几个词条的组合在一条电网运行经验中出现频率很高,而在其他电网运行经验中出现频率比较低,则认为此词语或此词语的组合有很好的类区别能力,其相应的权重值应该较高。 
目前常见而又高效率的权重计算方式为TFDIF模型,计算公式为:TF×IDF。TF为词频,表示电网运行经验需求术语(词条)tk在一条电网运行经验(文档)d中出现的频率。IDF为反文档频率,计算公式为IDF=log(Nn)。其中,N为全部文档数,n表示包含词条tk的文档频率。 
由于训练集的偏差,如每类训练集数目不同、训练集文本内容大小不相等。通过TFIDF计算词条对训练集的权重时,可能会出现某些词条对几类训练集具有相似的权重,这就不能体现出该词条对其他的类别的权重状态。为了解决同一词条对多个类别有类似的贡献度的问题,我们需要对TFIDF计算所得的权重进行改进。在这里,采用信息增益IG来改进权重IG可以用下式表示: 
IG ( t ) = - Σ i = 1 m P ( C i ) log P ( C i ) + P ( t ) Σ i = 1 m P ( C i / t )
log P ( C i / t ) + P ( t ) ‾ Σ i = 1 m P ( C i / t ‾ ) log P ( C i / t ‾ ) - - - ( 1 )
公式(1)中,P(Ci/t)表示文本中出现特征t时,文本属于Ci的概率; 
Figure DEST_PATH_GDA0000462884750000193
表示文本中不出现单词t时,文本属于Ci的概率;P(Ci)表示类别出现的概率;P(t)表示t在整个文本训练集中出现的概率。将权重归一 化如下: W ( t i , d j ) = tf ik × log ( N / n + 0.01 ) × IG k Σ k = 1 t ( f ik × log ( N / n + 0.01 ) × IG k ) 2 - - - ( 2 )
W(ti,dj)为计算词条tk在类别dj所得的权重,这样有效地改善了在某类中权重较大而在其他类别中权重较小的词对分类结果的影响。 
对于在电气设备下的七大属性中的某个属性的电网运行经验文档中,总会出现的高频词条,这个词条对类内的文档分类没有任何贡献,只是能区别不同的设备属性,我们采用公式(3)来计算先验概率: 
P ( w j / C i ) = 1 + W ( w j / C i ) | V | + Σ k = 0 | V | ( w j / C i ) - - - ( 3 )
|V|表示特征词表中总词条数,(wjCi)表示该词条的权重。 
将权重的概念引入到朴素贝叶斯分类方法中,则基于权重的朴素贝叶斯函数的公式为: 
P ( C i / d ) = P ( C i ) Π j = 1 m P ( w j / C i ) × W ( w j / C i ) = P ( C i ) Π j = 1 m 1 + W ( w j / C i ) | V | + Σ k = 0 | V | ( w j / C i ) × W ( w j / C i ) - - - ( 4 )
|V|表示特征词表中总词条数,(wj/Ci)表示该词条的权重。 
公式(4)基于如下思想:该词条在某类中先验概率越大,权重越大,它对区分文档类别的贡献也就越大。 
这样既可以保证经验知识库的持续更新,又能为经验知识库节约存储空间,减少经验知识库的运营成本。 
优选的,更新模块基于权重的贝叶斯函数会重新计算电网运行经验与用户查询请求的关联度,并对这些电网运行经验按照关联度的大小进行排序,以便后续优先向用户或电网工作者提供关联度最大的运行经验。 
上述自学习系统可根据用户的反馈对经验知识库内的知识进行分类,向用户提供相联度的运行经验;运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新 
本发明实施例拥有主动学习能力的电网运行经验知识库法包含了电网多种工作性质的运行经验,经验知识库可根据用户或电网工作者的反馈对经验知识库内的知识进行分类、排序与优化,优先向用户提供关联度最大的运行经验; 运用面向对象的知识表达方法,把电网运行经验作为设备的属性,可快速为工作人员提供电气设备相关工作经验。能主动学习用户的偏好(即用户单位常需要查询使用的电网运行经验),并要能根据用户的反馈对知识进行校正与更新。这种学习是可重复的,而且对于每一种特征都是相互独立的,即不同的属性不会相互影响,属于离散的单一学习。利用基于参数权重的朴素贝叶斯函数来统计用户反馈的某一知识的频率,以此提高经验知识库的可靠性与客观性。 
说明书附图中虚线的模块以及虚线连接的关系代表该模块以及连接关系并不是本发明的必要技术特征,仅仅是为了描述技术方案。经验知识库以及知识规则库,可以通过其他数据库或者数据结构来替代。经验知识库和知识规则库可以单独存在,也可以嵌入在其他模块中。 
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。 

Claims (10)

1.一种电网运行经验知识库的自学习方法,其特征在于,所述方法包括:
接收查询请求;
从所述查询请求语句中提取特征建立用户意图模型;
利用概率判断用户查询语句的意思,从专业术语库中自动选择最切合的需求术语进行匹配,并在知识库中检索;
比较转换后得到的需求术语和被评估的用户意图;
利用启发式算法量化具体用户意图和信息的相似度;
获得相似度最接近的需求术语,所述相似度是基于权重的贝叶斯函数来比较两条信息请求之间的相似程度,所述查询请求的转换是通过电网运行经验术语库来完成;
根据所述需求术语进行经验搜索;
运用面向对象技术展现搜索到的电网运行经验;以及
根据运行所述电网运行经验的反馈信息对经验知识库进行更新。
2.根据权利要求1所述的方法,其特征在于,所述接收查询请求之前,所述方法还包括:
建立包含多种工作性质的面向主动式电网运行的经验知识库,所述工作性质包括但不限于作业规范、缺陷管理、反事故措施、装置说明书、事故分析与处理、仪器仪表的操作方法、保护配置二次回路典型设计、技术规范。
3.根据权利要求1所述的方法,其特征在于:
基于权重的贝叶斯函数计算电网运行经验与用户查询请求的关联度,并对这些电网运行经验按照关联度的大小进行排序。
4.根据权利要求1所述的方法,其特征在于,所述经验搜索包括:
通过模糊检索算法来搜索电网运行经验。
5.根据权利要求1所述的方法,其特征在于,还包括;
获取电网运行的运行状态和/或历史数据;
结合所述运行状态,运用面向对象技术展现电网运行经验;
结合所述历史数据,运用面向对象技术展现电网运行经验
结合所述历史数据和运行状态,运用面向对象技术展现电网运行经验。
6.根据权利要求4所述的方法,其特征在于,所述根据所述用户标识,判断所述待发表信息是否允许发表,包括:
判断所述待发表信息中是否包含预设的关键字;
当所述待发表信息中不包含所述预设关键字符时,则确定所述待发表信息允许发表。
7.根据权利要求1所述的方法,其特征在于,所述根据运行所述电网运行经验的反馈信息对经验知识库进行更新的步骤,还包括:
采用贝叶斯函数的概率原理计算反馈信息的可靠性,若可靠性低于设计的最小概率则放弃此项内容的更新,反之则更新所述经验知识库。
8.根据权利要求7所述的方法,其特征在于,所述根据运行所述电网运行经验的反馈信息对经验知识库进行更新的步骤,还包括:
基于权重的贝叶斯函数计算电网运行经验与所述查询请求的关联度,对所述电网运行经验按照关联度的大小进行排序。
9.一种电网运行经验知识库的自学习系统,其特征在于,所述系统包括:
接收模块,用于接收查询请求;
转换模块,用于转换所述查询请求为标准的需求术语,所述查询请求的转换是通过电网运行经验术语库来完成;
搜索模块,用于根据转换模块获得需求术语进行经验搜索;
展现模块,用于运用面向对象技术展现搜索到的电网运行经验;
更新模块,用于根据所述电网运行经验的反馈信息对经验知识库进行更新。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括:
建立模块,用于建立所述电网运行的经验知识库;
接收模块,用于接收所述电网运行的查询请求;
转换模块,用于利用电网运行经验术语库将接收到的所述电网运行的查询请求转换为标准的需求术语;
搜索模块,用于根据知识规则库,对所述获得需求术语进行知识分析以及经验搜索;
展现模块,用于运用面向对象技术展现搜索到的电网运行经验;
更新模块,用于根据所述需求术语的反馈更新所述经验知识库。
CN201310738216.3A 2013-12-26 2013-12-26 电网知识库的自学习方法和系统 Active CN103744919B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310738216.3A CN103744919B (zh) 2013-12-26 2013-12-26 电网知识库的自学习方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310738216.3A CN103744919B (zh) 2013-12-26 2013-12-26 电网知识库的自学习方法和系统

Publications (2)

Publication Number Publication Date
CN103744919A true CN103744919A (zh) 2014-04-23
CN103744919B CN103744919B (zh) 2017-02-08

Family

ID=50501937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310738216.3A Active CN103744919B (zh) 2013-12-26 2013-12-26 电网知识库的自学习方法和系统

Country Status (1)

Country Link
CN (1) CN103744919B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468663A (zh) * 2015-02-12 2016-04-06 国网山东省电力公司潍坊供电公司 一种基于云模型的智能决策电网知识库的搭建方法
CN105528671A (zh) * 2015-11-30 2016-04-27 武汉大学 一种基于大数据的电网多维感知与安全评估系统及方法
CN106599064A (zh) * 2016-11-16 2017-04-26 西安交通大学 一种适用于高端装备的复杂知识自动分类、获取及存储方法
CN107195301A (zh) * 2017-05-19 2017-09-22 深圳市优必选科技有限公司 智能机器人语义处理的方法及装置
CN107729440A (zh) * 2017-09-29 2018-02-23 华北理工大学 一种基于贝叶斯网络的结构化文档检索模型及其检索方法
US10671928B2 (en) 2016-08-30 2020-06-02 International Business Machines Corporation Adaptive analytical modeling tool
CN111241247A (zh) * 2020-01-19 2020-06-05 国网湖南省电力有限公司 一种电力系统异常状态历史记录搜索方法、系统及介质
CN111737992A (zh) * 2020-07-06 2020-10-02 和宇健康科技股份有限公司 三向文本信息处理方法、计算机设备和存储介质
CN112182019A (zh) * 2020-10-20 2021-01-05 国网福建省电力有限公司经济技术研究院 一种电网统计专业指标特征提取的语义解析搜索方法
CN112713584A (zh) * 2020-11-20 2021-04-27 中国南方电网有限责任公司 适用于稳控系统预想故障集外故障的控制方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009065682A1 (en) * 2007-11-19 2009-05-28 International Business Machines Corporation Method, system and computer program for storing information with a description logic file system
CN102765643A (zh) * 2012-05-31 2012-11-07 天津大学 基于数据驱动的电梯故障诊断与预警方法
CN103135014A (zh) * 2012-12-14 2013-06-05 西安电子科技大学 基于案例推理的变压器故障诊断方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009065682A1 (en) * 2007-11-19 2009-05-28 International Business Machines Corporation Method, system and computer program for storing information with a description logic file system
CN102765643A (zh) * 2012-05-31 2012-11-07 天津大学 基于数据驱动的电梯故障诊断与预警方法
CN103135014A (zh) * 2012-12-14 2013-06-05 西安电子科技大学 基于案例推理的变压器故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
廖瑞金等: "基于人工智能的电力变压器绝缘故障诊断面向对象知识库", 《电工技术学报》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468663A (zh) * 2015-02-12 2016-04-06 国网山东省电力公司潍坊供电公司 一种基于云模型的智能决策电网知识库的搭建方法
CN105528671A (zh) * 2015-11-30 2016-04-27 武汉大学 一种基于大数据的电网多维感知与安全评估系统及方法
CN105528671B (zh) * 2015-11-30 2019-10-11 武汉大学 一种基于大数据的电网多维感知与安全评估系统及方法
US10671928B2 (en) 2016-08-30 2020-06-02 International Business Machines Corporation Adaptive analytical modeling tool
CN106599064B (zh) * 2016-11-16 2020-03-17 西安交通大学 一种适用于高端装备的复杂知识自动分类、获取及存储方法
CN106599064A (zh) * 2016-11-16 2017-04-26 西安交通大学 一种适用于高端装备的复杂知识自动分类、获取及存储方法
CN107195301A (zh) * 2017-05-19 2017-09-22 深圳市优必选科技有限公司 智能机器人语义处理的方法及装置
CN107729440A (zh) * 2017-09-29 2018-02-23 华北理工大学 一种基于贝叶斯网络的结构化文档检索模型及其检索方法
CN111241247A (zh) * 2020-01-19 2020-06-05 国网湖南省电力有限公司 一种电力系统异常状态历史记录搜索方法、系统及介质
CN111737992A (zh) * 2020-07-06 2020-10-02 和宇健康科技股份有限公司 三向文本信息处理方法、计算机设备和存储介质
CN112182019A (zh) * 2020-10-20 2021-01-05 国网福建省电力有限公司经济技术研究院 一种电网统计专业指标特征提取的语义解析搜索方法
CN112713584A (zh) * 2020-11-20 2021-04-27 中国南方电网有限责任公司 适用于稳控系统预想故障集外故障的控制方法和装置
CN112713584B (zh) * 2020-11-20 2023-02-14 中国南方电网有限责任公司 适用于稳控系统预想故障集外故障的控制方法和装置

Also Published As

Publication number Publication date
CN103744919B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103744919A (zh) 电网知识库的自学习方法和系统
CN103605665B (zh) 一种基于关键词的评审专家智能检索与推荐方法
Rudin et al. A process for predicting manhole events in Manhattan
CN106096830B (zh) 基于广义证据理论的继电保护状态评价方法及系统
CN113704451B (zh) 一种电力用户诉求筛选方法、系统、电子设备和存储介质
CN107330125A (zh) 基于知识图谱技术的海量非结构化配网数据集成方法
CN108304468A (zh) 一种文本分类方法以及文本分类装置
US20230237055A1 (en) Method and system for analytic based connections among user types in an online platform
CN113435759B (zh) 一种基于深度学习的一次设备风险智能评估方法
CN111179115A (zh) 故障处理辅助决策方法、装置、存储介质及电子设备
CN112560465B (zh) 批量异常事件的监控方法、装置、电子设备及存储介质
CN111881961A (zh) 基于数据挖掘的配电网故障风险等级预测方法
CN115827886A (zh) 电网一体化调度运行管理智能语音客服系统
CN111104483A (zh) 基于机器学习的ict系统故障分析及辅助判别方法
Fornaciari et al. Geolocation with attention-based multitask learning models
EP4186069A1 (en) System and method for improved spare part search for maintenance services using topic modelling
CN116843162A (zh) 一种矛盾调解方案推荐与评分系统及方法
CN112765314B (zh) 一种基于电力本体知识库的电力信息检索方法
CN111767404B (zh) 一种事件挖掘方法和装置
CN115564170A (zh) 一种配电智能终端可靠性评估方法
CN113961708A (zh) 一种基于多层次图卷积网络的电力设备故障溯源方法
CN110866173B (zh) 一种基于深度学习的遥信梳理方法
Xi et al. A novel ensemble approach to multi-label classification for electric power fault diagnosis
CN112949304A (zh) 一种施工案例知识重用查询方法及其装置
Lin et al. The strategy research on electrical equipment condition-based maintenance based on cloud model and grey DS evidence theory

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200915

Address after: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Patentee after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd.

Address before: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No.

Patentee before: GUANGZHOU POWER SUPPLY Co.,Ltd.

TR01 Transfer of patent right