CN109189752A - 基于智能检索技术的电力营销知识库系统 - Google Patents
基于智能检索技术的电力营销知识库系统 Download PDFInfo
- Publication number
- CN109189752A CN109189752A CN201811187121.6A CN201811187121A CN109189752A CN 109189752 A CN109189752 A CN 109189752A CN 201811187121 A CN201811187121 A CN 201811187121A CN 109189752 A CN109189752 A CN 109189752A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- module
- elasticsearch
- management
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于智能检索技术的电力营销知识库系统,基于B/S架构作为整体架构,包括存储层,按照标准实现知识的分类和存放,同时包含对知识库的备份存储;服务层,用于连接存储层和应用层,包括数据和数据交换、数据质量等功能和服务;应用层,用于展示系统操作界面,为用户提供相关应用功能;其运用分布式搜索引擎技术Elasticsearch,实现大数据实时检索。本系统将应用层放在Web端,存储层在服务器端,在便捷操作的基础上,对海量文件进行有效的知识财富归纳、形成条理的文件分类体系,用户可通过本系统进行便捷的文件管理操作,本系统采用Elasticsearch能够实现实时检索,实现了极速文件动态、多平台文件互联、智能全文检索、个性化规则定制、类视窗操作等功能。
Description
技术领域
本发明涉及一种基于智能检索技术的电力营销知识库系统。
背景技术
95598知识主要面向居民客户,内容相对浅显,多以知识元结构点状分布。国网知识库管理系统使用权限仅开放至省公司层级,95598知识的省内采编及传递均为体外流转,知识管理尚未实现在线管控。
随着当前营销业务领域的不断拓展,新型业务增多,客户对供用电服务水平的要求不断提升,原有的知识收集与报送流程均为线下操作,无法完成知识管理的在线管控,知识信息的共享、更新平台无法覆盖营销全业务。目前的知识管理存在管理困难、查找缓慢、效率低下、版本管理混乱、无法有效协作共享问题,
发明内容
本发明要解决的技术问题是提供一种可以实现知识的管理、应用以及统计分析的电力营销知识库系统。
为解决上述技术问题,本发明基于B/S架构作为整体架构,包括存储层,按照标准实现知识的分类和存放,同时包含对知识库的备份存储;服务层,用于连接存储层和应用层,包括数据和数据交换、数据质量等功能和服务;应用层,用于展示系统操作界面,为用户提供相关应用功能;其运用分布式搜索引擎技术Elasticsearch,实现大数据实时检索;
所述存储层包括基础词库、备份数据库,所述存储层采用关系型数据库、分布式文件系统、分布式在线数据库等存储技术,提供关系型数据存储、非结构化数据存储、分布式文件存储等数据存储能力,同时提供同意存储访问接口;
所述服务层包含数据和数据交换、非结构化数据存取管理、基于主题词内容的检索、数据管理和监控工具集等功能和服务;
所述应用层包括:知识管理模块,用于收集、报送、处理电力营销知识;知识应用模块,用于对系统所存储的知识信息进行应用;知识论坛模块,用于系统用户对知识信息进行交流;知识统计分析模块,可辅助用户对知识状态有直观了解;辅助管理模块,用于对基础词进行相应功能操作。
所述存储层基于HDFS分布式文件系统对索引文件进行分布式存储和读取管理,基于FastDFS分布式文件系统对知识文件附件、静态HTML文件进行分布式存储和读取管理;所述存储层还采用读写分离模式,将索引文件的生成、读取分别部署在不同服务上实现。
所述知识管理模块包括以下模块:知识采编模块、知识报送模块、知识反馈查询模块、知识停用申请模块、知识目录管理模块、知识纠错查询模块、知识主题管理模块;其中知识采编模块,用于省公司向地市进行知识征集;知识报送模块,用于地市知识管理员直接发起知识采编流程(进行新增、更新)提交审核的业务。
所述知识应用模块包括以下模块:知识搜索模块、个人中心模块、知识导航模块、知识架构模块、知识门户模块、智能机器人模块;知识搜索模块,用于通过知识目录导航、智能推荐检索等不同形式实现多知识的快速、准确的检索定位;个人中心模块,用于展示登录账号,收藏、阅读的知识量和论坛的发表、评价、回复数据量等信息;知识导航模块,用于通过输入关键词,搜索相应知识目录下具体知识信息;知识架构模块可以展示全部知识信息的一级知识目录及下级各知识目录;知识门户模块为知识使用人员展示知识公告信息、最新知识、热点知识、知识地图以及提供知识搜索;智能机器人模块,在对话框内输入想要咨询的问题的关键字段信息,机器人会进行相应检索回答。
所述知识论坛模块包括以下模块:知识论坛模块、论坛管理模块;知识论坛模块,使用人员可以公开提出问题,所有用户可以通过点击问题查看内容,并进行评论;论坛管理模块对提出的问题,进行回复、评论、关闭、删除操作。
所述知识统计分析模块包括以下模块:知识合格率模块、知识资产统计模块、知识采编统计模块;知识合格率模块,用于通过知识上报时间、采编时间段,统计各单位下的合格率;知识资产统计模块,用于统计知识发布的各指标信息;知识采编统计子模块,用于统计各工单的总体采编数量和知识状态数量。
所述辅助管理模块包括:基础词管理子模块、近义词管理子模块、联想词管理子模块,均是用于对不同形式词进行新增、删除、查询操作。
所述ElasticSearch的整体架构图,包括:
(1)Gateway是Elasticsearch用来存储索引的文件系统,支持多种文件类型,本地磁盘是存储在本地的文件系统,共享磁盘是共享存储,也可以使用Hadoop的HDFS分布式存储,也可以存储在Amazon S3云服务上或其他;
(2)Gateway的上层是一个分布式的Lucene框架,Elasticsearch的底层API是由Lucene提供的,每一个Elasticsearch节点上都有一个Lucene引擎的支持;
(3)Lucene之上是Elasticsearch的模块,包括索引模块、搜索模块、映射模块、River;
(4)Elasticsearch模块之上是Discovery、Scripting脚本语言和第三方插件;Discovery是Elasticsearch的节点发现模块,不同机器上的Elasticsearch节点要组成集群需要进行消息通信,集群内部需要选举master节点,由Discovery模块完成;Scripting用来支持JavaScript、Python等多种语言,可以在查询语句中嵌入。
(5)再上层是Elasticsearch的传输模块和JMX;传输模块支持Thrift、Memcached、HTTP,默认使用HTTP传输。JMX是Java的管理框架,用来管理Elasticsearch应用。
(6)最上层是Elasticsearch提供给用户的接口,可以通过RESTful API和Elasticsearch集群进行交互。
所述Elasticsearch采用倒排索引,用来存储全文搜索下某个单词在一个文档或一组文档中位置的映射。
采用上述结构后,本系统提取知识中的财富,建立电力营销知识库基础词库。以B/S结构作为系统的整体架构,将应用层放在Web端,存储层在服务器端。在便捷操作的基础上,对海量文件进行有效的知识财富归纳、形成条理的文件分类体系,用户可通过本系统进行便捷的文件管理操作,本系统将用户体验度放在首位位置,采用Elasticsearch能够实现实时检索,实现了极速文件动态、多平台文件互联、智能全文检索、个性化规则定制、类视窗操作等功能。本系统通过知识采集和分布式搜索引擎等技术,对内为一线窗口员工提供最齐全的供电服务统一答复口径、业务执行依据和内控政策规范,对外为电力客户全渠道提供最具实用价值的供电服务政策及业务知识信息。本系统通过构建知识管理、知识应用、知识论坛和统计分析等业务模块,加强了公司知识管理的规范性,构建知识共享机制,提高客户服务支撑能力。
附图说明
下面结合附图及具体实施方式对本发明作进一步详细说明:
图1为本发明知识库系统的结构示意图;
图2为分布式搜索引擎技术Elasticsearch的整体架构图;
图3为分布式搜索引擎技术Elasticsearch信息检索系统的架构图。
具体实施方式
如图1所示,基于智能检索技术的电力营销知识库系统,基于B/S架构作为整体架构,包括存储层、服务层和应用层,将应用层放在Web端,存储层在服务器端。
存储层按照标准实现知识的分类和存放,同时包含对知识库的备份存储。存储层包括基础词库、备份数据库,存储层采用关系型数据库、分布式文件系统、分布式在线数据库等存储技术,提供关系型数据存储、非结构化数据存储、分布式文件存储等数据存储能力,同时提供同意存储访问接口,从而提高数据存储低成本的横向扩展能力,提高在高并发条件下的快速数据访问响应能力、满足海量数据实时与准实时存储需求。系统支持的数据库包括Oracle,SQL Server和DB2;应用服务器硬件平台包括Sun,IBM等UNIX和Windows XP,2000,NT家族;因而可以根据自己的应用要求和人员技能情况灵活地选择适合的系统部署方案以满足运行要求。中间件包括BEA的WebLogic。这保证系统可以利用业界最先进的中间件与其它系统紧密地集成,并支持在此基础上构建企业的全面应用系统。
存储层在知识信息的分布式存储设计中,基于HDFS分布式文件系统对索引文件进行分布式存储和读取管理,基于FastDFS分布式文件系统对知识文件附件、静态HTML文件进行分布式存储和读取管理;所述存储层还采用读写分离模式,将索引文件的生成、读取分别部署在不同服务上实现。通过这些分布式设计,增强知识库在高并发下的知识更新、知识检索应用请求的处理能力。
基础词库包括:主词典、量词词库、扩展词典、停止词词库、敏感词词库、同义词词库、易错词词库。基础词库的建设是本系统的基础工作,基础词库质量好能提高分词准确率;整个项目的全生命周期内都需要对基础词库进行维护,比如有些词设置的不合理或者优先级不对等需要调整。
服务层,用于连接存储层和应用层,包括数据和数据交换、数据质量等功能和服务;应用层,用于展示系统操作界面,为用户提供相关应用功能。服务层包含数据和数据交换、非结构化数据存取管理、基于主题词内容的检索、数据管理和监控工具集等功能和服务。
应用层包括:知识管理模块,用于收集、报送、处理电力营销知识;知识应用模块,用于对系统所存储的知识信息进行应用;知识论坛模块,用于系统用户对知识信息进行交流;知识统计分析模块,可辅助用户对知识状态有直观了解;辅助管理模块,用于对基础词进行相应功能操作。
知识管理模块包括以下模块:知识采编模块、知识报送模块、知识反馈查询模块、知识停用申请模块、知识目录管理模块、知识纠错查询模块、知识主题管理模块;其中知识采编模块,用于省公司向地市进行知识征集;知识报送模块,用于地市知识管理员直接发起知识采编流程(进行新增、更新)提交审核的业务。
知识应用模块包括以下模块:知识搜索模块、个人中心模块、知识导航模块、知识架构模块、知识门户模块、智能机器人模块;知识搜索模块,用于通过知识目录导航、智能推荐检索等不同形式实现多知识的快速、准确的检索定位;个人中心模块,用于展示登录账号,收藏、阅读的知识量和论坛的发表、评价、回复数据量等信息;知识导航模块,用于通过输入关键词,搜索相应知识目录下具体知识信息;知识架构模块可以展示全部知识信息的一级知识目录及下级各知识目录;知识门户模块为知识使用人员展示知识公告信息、最新知识、热点知识、知识地图以及提供知识搜索;智能机器人模块,在对话框内输入想要咨询的问题的关键字段信息,机器人会进行相应检索回答。
知识论坛模块包括以下模块:知识论坛模块、论坛管理模块;知识论坛模块,使用人员可以公开提出问题,所有用户可以通过点击问题查看内容,并进行评论;论坛管理模块对提出的问题,进行回复、评论、关闭、删除操作。
知识统计分析模块包括以下模块:知识合格率模块、知识资产统计模块、知识采编统计模块;知识合格率模块,用于通过知识上报时间、采编时间段,统计各单位下的合格率;知识资产统计模块,用于统计知识发布的各指标信息;知识采编统计子模块,用于统计各工单的总体采编数量和知识状态数量。
辅助管理模块包括:基础词管理子模块、近义词管理子模块、联想词管理子模块,均是用于对不同形式词进行新增、删除、查询操作。
本系统的知识采集和知识查询运用分布式搜索引擎技术Elasticsearch,Elasticsearch在知识采集时建立索引与文档的关系,知识查询时找到索引对应的文档经过计算给出最佳的搜索结果。ElasticSearch的整体架构图,如图2所示,其包括:
(1)Gateway是Elasticsearch用来存储索引的文件系统,支持多种文件类型,本地磁盘是存储在本地的文件系统,共享磁盘是共享存储,也可以使用Hadoop的HDFS分布式存储,也可以存储在Amazon S3云服务上或其他;
(2)Gateway的上层是一个分布式的Lucene框架,Elasticsearch的底层API是由Lucene提供的,每一个Elasticsearch节点上都有一个Lucene引擎的支持;
(3)Lucene之上是Elasticsearch的模块,包括索引模块、搜索模块、映射模块、River;
(4)Elasticsearch模块之上是Discovery、Scripting脚本语言和第三方插件;Discovery是Elasticsearch的节点发现模块,不同机器上的Elasticsearch节点要组成集群需要进行消息通信,集群内部需要选举master节点,由Discovery模块完成;Scripting用来支持JavaScript、Python等多种语言,可以在查询语句中嵌入。
(5)再上层是Elasticsearch的传输模块和JMX(Java Management Extensions,即Java管理扩展);传输模块支持Thrift、Memcached、HTTP,默认使用HTTP传输。JMX是Java的管理框架,用来管理Elasticsearch应用。
(6)最上层是Elasticsearch提供给用户的接口,可以通过RESTful API和Elasticsearch集群进行交互。
本系统中的Elasticsearch采用倒排索引,用来存储全文搜索下某个单词在一个文档或一组文档中位置的映射。例如:文档1:人工智能学习,文档2:互联网人工智能
词项 | 文档频率 | 倒排记录 |
人工 | 2 | 文档1->文档2 |
智能 | 2 | 文档1->文档2 |
学习 | 1 | 文档1 |
互联网 | 1 | 文档2 |
Elasticsearch可以实现:如图3所示,当用户输入一个查询语句,Elasticsearch首先把查询语句切分,根据分词进行检索,Elasticsearch通过排序模型计算文档和查询关键词之间的相关度,按照评分排序后返回最相关的文档给用户。另外,Elasticsearch中还有Filter过滤器,解决的是只根据条件对文档进行过滤,不计算评分。
由于本系统存放信息大部分为中文文本,属于非结构化文本,要进行挖掘就必须将文本词汇转换成计算机能够识别的语言,以便后续的文本分类、文本聚类分析。所以必须对文本词汇进行建模,常用的方法有向量空间模型、概率模型、语言模型。
用户上传文件之后,本系统利用Apache Lucene Tika算法,在后台处理程序会对文件进行文本抽取,提取其中的关键词,或进行元数据的信息提取,生成文件的摘要;所运用的Apache Lucene Tika算法,Tika由一个解析器框架、MIME检测机制、语言检测、和一个facade组件关联所有组件。
ElasticSearch可内置多种分词器使用,在索引和查询过程中可以指定分词器,也可以通过安装插件的方式使用第三方分词工具。本系统中使用的自动分词算法,主要原理是,切分出单子串,然后和词库进行比对,如果是一个词就记录下来,否则通过增加或者减少一个单子,继续比较,直到剩下一个单子则终止。
本系统中自动分词算法为:正向最大匹配算法。设Maxlen表示虽大词长,D为分词词典,1)从待切分语料中按正向取长度为MaxLen的字串str,令Len=MaxLen;2)将str与D中的词相匹配;3)若匹配成功,则认为该字串为词,指向待切分语料的指针向前移Len个汉字(字节),返回到1);4)若不成功:如果Len>1,则将Len减2个字节,从待切分语料中取长度为Len的字串str,返回到2)。否则,得到长度为2的单字词,指向待切分语料的指针向前移1个汉字,返回1)。
本系统使用的模型是向量空间模型(Vector Space Model,VSM)。向量空间模型的基本思想是将文本分为若干的特征项,通过特定的手段计算出每个特征项在该文本中的权重,进而将整个文本用以特征项的权重为分量的向量来表示,在将文本用特征向量的方式表示为数学模型以后,再基于特征向量进行文本之间的相似度计算。
权重可分为词频型和布尔型,词频即词条在文章中出现的次数,布尔型即词条在文本中是否出现过,出现为1,未出现为0。本系统中向量空间模型的权重计算,通常采用TF-IDF方法计算。
TF-IDF称为词频-逆文档频率,用以计算词项对于一个文档集或一个语料库中的一份文件的重要程度。词项的重要性随着它在文档中出现的次数成正比增加,但同时会随着它在文档集中出现的频率成反比下降。换句话说,如果一个词项在一篇文档中出现的频率非常高,说明其重要性比较高,但是如果这个词项在文档集中的其他的文档中出现的频率也很高,那么说明这个词语有可能是比较通用比较常见的。Elasticsearch全文搜索默认采用的是相关性打分TF-IDF。
TF-IDF算法:设d是文本集中的文本,f是文本集的特征词,将词频标准化,计算方法如下:
文档频率用DF来表示,代表文档集中包含某个词的所有文档数目。DF通常比较大,把它映射到一个较小的取值范围,用逆文档频率(Inverse document Frequency,IDF)来表示如下:
上式中分母越大,说明该词越常见,逆文档频率越小。则词项的权重用TF-IDF来表示,计算公式如下:
TF-IDF=词频(TFf,d)*逆文档频率(IDFf)
通过TF-IDF可以把文档表示成n维的词项权重向量:
document vector=(W1,W2,...,Wn)
生成n维权重向量后,再使用K-means进行文本聚类。聚类的定义如下:在数据空间A中存在包含N个对象的数据集χ,χi=(χi1,χi2,...,χid)∈A是数据集χ中的数据点,χij表示χi(i=1,2,...,N)的特征、维度等属性,这些数据既可以是数值类型也可以是枚举类型。聚类就是要将数据集X划分为k个簇Cm(其中m=1,2,...,k)但是利用聚类算法完成聚类以后,某些数据对象有可能不属于任何一个簇,这些数据对象统一包含在一个簇中,被称为噪声Cn。聚类的结果应满足X=C1∪C2∪...∪Cn,并且所有不同划分Ci与Cj之间没有交集,Cm就是所要求得的聚类结果。
通过文本聚类过程旨在将拥有相同语义的文本加以分类,方便用户通过关键词检索的方式得到相关信息或得到关键词的近义词信息。k-means算法实现步骤如下:
1)从n个数据对象任意选择k个对象作为初始聚类中心;
2)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分;
3)重新计算每个有变化聚类的均值;
4)计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;若条件不满足,则回到2)继续执行。
k-means算法的最终目的是使划分的结果需要满足:(1)在相同的类别内的投诉数据信息差异性较小,(2)不同的类别内的投诉数据差异性较大。所有类别内数据对象的平均状态结合得到一个“中心对象”(引力中心),它们的相似程度和差异性是通过此数据来进行计算的。
基于本系统的文本聚类实现如下:
1)针对系统中的文本数据进行预处理,包括文本数字化、数据降维等操作,通过TF-DIF方法赋予文本词项权重。
2)执行文本聚类分析,确定是否自动确定聚类簇数,如果选择手动确定簇数,则直接输入聚类簇数,如果选择自动确定聚类簇数,则采用聚类分析计算簇数值。
3)通过聚类分析,将文档进行细分,便于用户在按照某个关键词查询时快速找到词项对应文本簇,完成检索功能。
4)同时通过聚类分析还可对拥有相近含义的词进行分类聚类,将词项之间进行关联,便于用户对系统的查找运用。
本系统提取知识中的财富,建立电力营销知识库基础词库。以B/S结构作为系统的整体架构,将应用层放在Web端,存储层在服务器端。在便捷操作的基础上,对海量文件进行有效的知识财富归纳、形成条理的文件分类体系,用户可通过本系统进行便捷的文件管理操作,本系统将用户体验度放在首位位置,采用Elasticsearch能够实现实时检索,实现了极速文件动态、多平台文件互联、智能全文检索、个性化规则定制、类视窗操作等功能。
本系统通过知识采集和分布式搜索引擎等技术,对内为一线窗口员工提供最齐全的供电服务统一答复口径、业务执行依据和内控政策规范,对外为电力客户全渠道提供最具实用价值的供电服务政策及业务知识信息。
本系统通过构建知识管理、知识应用、知识论坛和统计分析等业务模块,加强了公司知识管理的规范性,构建知识共享机制,提高客户服务支撑能力。
本系统以“客户为导向”的“互联网+”供电服务新渠道,实现全公司、全专业、全流程、全环节的供电服务信息共享,在进一步提升营销人员专业业务素质的同时,由被动解决客户诉求转向主动为客户提供增值服务,持续提升全省供电服务整体水平。本系统以客户服务工作提质增效为总体目标,建立一体化、互动化、智能化,覆盖电力公司全业务领域的知识管理系统,作为电力公司知识管理、知识共享、知识学习和智能服务支持的“四个平台”,支撑知识体系的有效沉淀和共享,支撑人才队伍素质不断提高,支撑客户服务水平的持续提升,同时使得知识得到更广的传播,帮助企业实现知识的创新。
Claims (9)
1.一种基于智能检索技术的电力营销知识库系统,其特征是在于:基于B/S架构作为整体架构,包括存储层,按照标准实现知识的分类和存放,同时包含对知识库的备份存储;服务层,用于连接存储层和应用层,包括数据和数据交换、数据质量等功能和服务;应用层,用于展示系统操作界面,为用户提供相关应用功能;其运用分布式搜索引擎技术Elasticsearch,实现大数据实时检索;
所述存储层包括基础词库、备份数据库,所述存储层采用关系型数据库、分布式文件系统、分布式在线数据库等存储技术,提供关系型数据存储、非结构化数据存储、分布式文件存储等数据存储能力,同时提供同意存储访问接口;
所述服务层包含数据和数据交换、非结构化数据存取管理、基于主题词内容的检索、数据管理和监控工具集等功能和服务;
所述应用层包括:知识管理模块,用于收集、报送、处理电力营销知识;知识应用模块,用于对系统所存储的知识信息进行应用;知识论坛模块,用于系统用户对知识信息进行交流;知识统计分析模块,可辅助用户对知识状态有直观了解;辅助管理模块,用于对基础词进行相应功能操作。
2.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述存储层基于HDFS分布式文件系统对索引文件进行分布式存储和读取管理,基于FastDFS分布式文件系统对知识文件附件、静态HTML文件进行分布式存储和读取管理;所述存储层还采用读写分离模式,将索引文件的生成、读取分别部署在不同服务上实现。
3.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述知识管理模块包括以下模块:知识采编模块、知识报送模块、知识反馈查询模块、知识停用申请模块、知识目录管理模块、知识纠错查询模块、知识主题管理模块;其中知识采编模块,用于省公司向地市进行知识征集;知识报送模块,用于地市知识管理员直接发起知识采编流程(进行新增、更新)提交审核的业务。
4.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述知识应用模块包括以下模块:知识搜索模块、个人中心模块、知识导航模块、知识架构模块、知识门户模块、智能机器人模块;知识搜索模块,用于通过知识目录导航、智能推荐检索等不同形式实现多知识的快速、准确的检索定位;个人中心模块,用于展示登录账号,收藏、阅读的知识量和论坛的发表、评价、回复数据量等信息;知识导航模块,用于通过输入关键词,搜索相应知识目录下具体知识信息;知识架构模块可以展示全部知识信息的一级知识目录及下级各知识目录;知识门户模块为知识使用人员展示知识公告信息、最新知识、热点知识、知识地图以及提供知识搜索;智能机器人模块,在对话框内输入想要咨询的问题的关键字段信息,机器人会进行相应检索回答。
5.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述知识论坛模块包括以下模块:知识论坛模块、论坛管理模块;知识论坛模块,使用人员可以公开提出问题,所有用户可以通过点击问题查看内容,并进行评论;论坛管理模块对提出的问题,进行回复、评论、关闭、删除操作。
6.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述知识统计分析模块包括以下模块:知识合格率模块、知识资产统计模块、知识采编统计模块;知识合格率模块,用于通过知识上报时间、采编时间段,统计各单位下的合格率;知识资产统计模块,用于统计知识发布的各指标信息;知识采编统计子模块,用于统计各工单的总体采编数量和知识状态数量。
7.根据权利要求1所述的基于智能检索技术的电力营销知识库系统,其特征是所述辅助管理模块包括:基础词管理子模块、近义词管理子模块、联想词管理子模块,均是用于对不同形式词进行新增、删除、查询操作。
8.根据权利要求1至7中任一项所述的基于智能检索技术的电力营销知识库系统,其特征是所述ElasticSearch的整体架构图,包括:
(1)Gateway是Elasticsearch用来存储索引的文件系统,支持多种文件类型,本地磁盘是存储在本地的文件系统,共享磁盘是共享存储,也可以使用Hadoop的HDFS分布式存储,也可以存储在Amazon S3云服务上或其他;
(2)Gateway的上层是一个分布式的Lucene框架,Elasticsearch的底层API是由Lucene提供的,每一个Elasticsearch节点上都有一个Lucene引擎的支持;
(3)Lucene之上是Elasticsearch的模块,包括索引模块、搜索模块、映射模块、River;
(4)Elasticsearch模块之上是Discovery、Scripting脚本语言和第三方插件;Discovery是Elasticsearch的节点发现模块,不同机器上的Elasticsearch节点要组成集群需要进行消息通信,集群内部需要选举master节点,由Discovery模块完成;Scripting用来支持JavaScript、Python等多种语言,可以在查询语句中嵌入。
(5)再上层是Elasticsearch的传输模块和JMX;传输模块支持Thrift、Memcached、HTTP,默认使用HTTP传输。JMX是Java的管理框架,用来管理Elasticsearch应用。
(6)最上层是Elasticsearch提供给用户的接口,可以通过RESTful API和Elasticsearch集群进行交互。
9.根据权利要求8所述的基于智能检索技术的电力营销知识库系统,其特征是所述Elasticsearch采用倒排索引,用来存储全文搜索下某个单词在一个文档或一组文档中位置的映射。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811187121.6A CN109189752A (zh) | 2018-10-12 | 2018-10-12 | 基于智能检索技术的电力营销知识库系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811187121.6A CN109189752A (zh) | 2018-10-12 | 2018-10-12 | 基于智能检索技术的电力营销知识库系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109189752A true CN109189752A (zh) | 2019-01-11 |
Family
ID=64948177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811187121.6A Pending CN109189752A (zh) | 2018-10-12 | 2018-10-12 | 基于智能检索技术的电力营销知识库系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109189752A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872082A (zh) * | 2019-03-14 | 2019-06-11 | 山东中和慧明信息科技有限公司 | 企业智能电话营销管理系统 |
CN110175151A (zh) * | 2019-05-22 | 2019-08-27 | 中国农业科学院农业信息研究所 | 一种农业大数据的处理方法、装置、设备和存储介质 |
CN110555201A (zh) * | 2019-09-11 | 2019-12-10 | 中国联合网络通信集团有限公司 | 知识文档生成方法、装置、电子设备及存储介质 |
CN110598080A (zh) * | 2019-08-13 | 2019-12-20 | 浙江省建工集团有限责任公司 | 一种智能化企业知识管理平台 |
CN110929007A (zh) * | 2019-11-08 | 2020-03-27 | 国网江苏省电力有限公司电力科学研究院 | 一种电力营销知识体系平台及应用方法 |
CN111159133A (zh) * | 2019-12-16 | 2020-05-15 | 北京航天智造科技发展有限公司 | 一种基于微服务的分布式论坛系统 |
CN111460078A (zh) * | 2020-03-02 | 2020-07-28 | 广州高新工程顾问有限公司 | 一种基于流程的工程监理企业知识库管理系统 |
CN111858483A (zh) * | 2020-07-29 | 2020-10-30 | 湖南泛联新安信息科技有限公司 | 基于多种数据库与文件系统的软件样本混合存储系统 |
CN111881100A (zh) * | 2020-07-10 | 2020-11-03 | 棕榈设计有限公司 | 知识库管理框架系统及管理方法、设备及存储介质 |
CN112199347A (zh) * | 2020-08-27 | 2021-01-08 | 国网山东省电力公司日照供电公司 | 一种供电服务知识共享平台系统 |
CN112307171A (zh) * | 2020-10-30 | 2021-02-02 | 中国电力科学研究院有限公司 | 一种基于电力知识库的制度标准检索方法及系统和可读存储介质 |
CN112465143A (zh) * | 2020-12-07 | 2021-03-09 | 广东电网有限责任公司佛山供电局 | 一种知识储备系统 |
CN112905685A (zh) * | 2021-03-12 | 2021-06-04 | 国网安徽省电力有限公司 | 一种面向信息化建设的架构管控系统及设备 |
CN112905158A (zh) * | 2021-01-28 | 2021-06-04 | 广州衣科明夷信息技术有限公司 | 一种基于层级串联技术的营销中台系统 |
CN113094025A (zh) * | 2021-04-06 | 2021-07-09 | 国家电网有限公司客户服务中心 | 基于知识库的电力营业厅服务系统 |
CN115860925A (zh) * | 2023-02-19 | 2023-03-28 | 广东德澳智慧医疗科技有限公司 | 一种基于人工智能负债数据智能查询和投资管理系统 |
CN117591631A (zh) * | 2023-11-23 | 2024-02-23 | 知学云(北京)科技股份有限公司 | 基于AI PaaS平台的Elasticsearch文本向量化搜索系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820670A (zh) * | 2015-03-13 | 2015-08-05 | 国家电网公司 | 一种电力信息大数据的采集和存储方法 |
US20160203548A1 (en) * | 2007-02-09 | 2016-07-14 | Xcira, Inc. | Integrated auctioning environment platform |
CN106202401A (zh) * | 2016-07-11 | 2016-12-07 | 刘辉 | 一种绝缘子全生命周期信息管理平台及其方法 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN107545007A (zh) * | 2016-06-26 | 2018-01-05 | 国网天津市电力公司 | 电力大数据快速检索引擎 |
CN107577588A (zh) * | 2017-09-26 | 2018-01-12 | 北京中安智达科技有限公司 | 一种海量日志数据智能运维系统 |
CN108491378A (zh) * | 2018-03-08 | 2018-09-04 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
-
2018
- 2018-10-12 CN CN201811187121.6A patent/CN109189752A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160203548A1 (en) * | 2007-02-09 | 2016-07-14 | Xcira, Inc. | Integrated auctioning environment platform |
CN104820670A (zh) * | 2015-03-13 | 2015-08-05 | 国家电网公司 | 一种电力信息大数据的采集和存储方法 |
CN107545007A (zh) * | 2016-06-26 | 2018-01-05 | 国网天津市电力公司 | 电力大数据快速检索引擎 |
CN106202401A (zh) * | 2016-07-11 | 2016-12-07 | 刘辉 | 一种绝缘子全生命周期信息管理平台及其方法 |
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN107577588A (zh) * | 2017-09-26 | 2018-01-12 | 北京中安智达科技有限公司 | 一种海量日志数据智能运维系统 |
CN108491378A (zh) * | 2018-03-08 | 2018-09-04 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
Non-Patent Citations (3)
Title |
---|
王明珠: ""客户服务知识库管理系统设计与实现"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
许诺: ""电力企业知识管理体系的构建与应用"", 《现代计算机》 * |
迷途码界: ""Elasticsearch分布式架构解析"", 《HTTPS://BLOG.CSDN.NET/ZX711166/ARTICLE/DETAILS/81952827》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109872082A (zh) * | 2019-03-14 | 2019-06-11 | 山东中和慧明信息科技有限公司 | 企业智能电话营销管理系统 |
CN110175151A (zh) * | 2019-05-22 | 2019-08-27 | 中国农业科学院农业信息研究所 | 一种农业大数据的处理方法、装置、设备和存储介质 |
CN110598080A (zh) * | 2019-08-13 | 2019-12-20 | 浙江省建工集团有限责任公司 | 一种智能化企业知识管理平台 |
CN110555201A (zh) * | 2019-09-11 | 2019-12-10 | 中国联合网络通信集团有限公司 | 知识文档生成方法、装置、电子设备及存储介质 |
CN110929007A (zh) * | 2019-11-08 | 2020-03-27 | 国网江苏省电力有限公司电力科学研究院 | 一种电力营销知识体系平台及应用方法 |
CN111159133B (zh) * | 2019-12-16 | 2022-05-17 | 北京航天智造科技发展有限公司 | 一种基于微服务的分布式论坛系统 |
CN111159133A (zh) * | 2019-12-16 | 2020-05-15 | 北京航天智造科技发展有限公司 | 一种基于微服务的分布式论坛系统 |
CN111460078A (zh) * | 2020-03-02 | 2020-07-28 | 广州高新工程顾问有限公司 | 一种基于流程的工程监理企业知识库管理系统 |
CN111881100A (zh) * | 2020-07-10 | 2020-11-03 | 棕榈设计有限公司 | 知识库管理框架系统及管理方法、设备及存储介质 |
CN111858483A (zh) * | 2020-07-29 | 2020-10-30 | 湖南泛联新安信息科技有限公司 | 基于多种数据库与文件系统的软件样本混合存储系统 |
CN112199347A (zh) * | 2020-08-27 | 2021-01-08 | 国网山东省电力公司日照供电公司 | 一种供电服务知识共享平台系统 |
CN112199347B (zh) * | 2020-08-27 | 2023-03-24 | 国网山东省电力公司日照供电公司 | 一种供电服务知识共享平台系统 |
CN112307171A (zh) * | 2020-10-30 | 2021-02-02 | 中国电力科学研究院有限公司 | 一种基于电力知识库的制度标准检索方法及系统和可读存储介质 |
CN112465143A (zh) * | 2020-12-07 | 2021-03-09 | 广东电网有限责任公司佛山供电局 | 一种知识储备系统 |
CN112905158A (zh) * | 2021-01-28 | 2021-06-04 | 广州衣科明夷信息技术有限公司 | 一种基于层级串联技术的营销中台系统 |
CN112905158B (zh) * | 2021-01-28 | 2023-10-31 | 杭州衣科信息技术股份有限公司 | 一种基于层级串联技术的营销中台系统 |
CN112905685A (zh) * | 2021-03-12 | 2021-06-04 | 国网安徽省电力有限公司 | 一种面向信息化建设的架构管控系统及设备 |
CN112905685B (zh) * | 2021-03-12 | 2023-11-28 | 国网安徽省电力有限公司 | 一种面向信息化建设的架构管控系统及设备 |
CN113094025A (zh) * | 2021-04-06 | 2021-07-09 | 国家电网有限公司客户服务中心 | 基于知识库的电力营业厅服务系统 |
CN115860925A (zh) * | 2023-02-19 | 2023-03-28 | 广东德澳智慧医疗科技有限公司 | 一种基于人工智能负债数据智能查询和投资管理系统 |
CN117591631A (zh) * | 2023-11-23 | 2024-02-23 | 知学云(北京)科技股份有限公司 | 基于AI PaaS平台的Elasticsearch文本向量化搜索系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189752A (zh) | 基于智能检索技术的电力营销知识库系统 | |
US11714831B2 (en) | Data processing and classification | |
Yan et al. | Fast business process similarity search | |
CA2900498C (en) | Hive table links | |
Wang et al. | Ranking user's relevance to a topic through link analysis on web logs | |
CN110019689A (zh) | 职位匹配方法和职位匹配系统 | |
CN103473256B (zh) | 用于内容管理的方法和系统 | |
CN106055908B (zh) | 基于云计算的个人医疗信息推荐方法及系统 | |
CN107832392A (zh) | 一种元数据管理系统 | |
Varfolomeyev et al. | Smart personal assistant for historical tourism | |
CN103116642A (zh) | 电力系统知识管理及应用的调度百科系统 | |
BRPI1105271A2 (pt) | Método, e um ou mais meios legíveis por computador | |
CN111382279A (zh) | 审单方法和装置 | |
CN107316229A (zh) | 一种在线展示演出项目信息的方法及装置 | |
CN104615636A (zh) | 一种基于互联网的个人与商业资源匹配的方法 | |
Li et al. | Network analysis of navigation paths of tourists’ trip planning and power structure of the online tourism in China | |
Van Ackooij et al. | A strongly convergent proximal bundle method for convex minimization in Hilbert spaces | |
US20190130015A1 (en) | Systems and methods for categorizing data transactions | |
Mohamadina et al. | Business intelligence: concepts, issues and current systems | |
Ahmed et al. | Big data and semantic web, challenges and opportunities a survey | |
Rani et al. | Provenance framework for twitter data using zero-information loss graph database | |
KR101022643B1 (ko) | 전자 카탈로그 관리 장치 및 방법 | |
Zu | [Retracted] Hadoop‐Based Painting Resource Storage and Retrieval Platform Construction and Testing | |
Shirgave et al. | Semantically Enriched Variable Length Markov Chain Model for Analysis of User Web Navigation Sessions | |
Sun et al. | Data Management across Geographically-Distributed Autonomous Systems: Architecture, Implementation, and Performance Evaluation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190111 |
|
WD01 | Invention patent application deemed withdrawn after publication |