CN113673229B - 一种电力营销数据交互方法、系统及存储介质 - Google Patents
一种电力营销数据交互方法、系统及存储介质 Download PDFInfo
- Publication number
- CN113673229B CN113673229B CN202110970658.5A CN202110970658A CN113673229B CN 113673229 B CN113673229 B CN 113673229B CN 202110970658 A CN202110970658 A CN 202110970658A CN 113673229 B CN113673229 B CN 113673229B
- Authority
- CN
- China
- Prior art keywords
- data
- power marketing
- keywords
- database
- marketing data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003066 decision tree Methods 0.000 claims abstract description 33
- 238000009877 rendering Methods 0.000 claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 230000011218 segmentation Effects 0.000 claims description 18
- 230000002452 interceptive effect Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 14
- 238000004140 cleaning Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 2
- 230000005611 electricity Effects 0.000 claims 4
- 238000012216 screening Methods 0.000 abstract description 6
- 238000012800 visualization Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract 2
- 230000006870 function Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种电力营销数据交互方法、系统及存储介质,本方法通过用户侧配电系统采集电力营销数据,能够实时获得电力营销数据,提高电力营销数据的实时性,并将电力营销数据存入至MMIS数据库中,利用决策树算法对电力营销数据进行数据特征提取,输出文本信息,可以提高筛选数据的效率,同时,提取文本信息中的关键词,赋予关键词的权重,根据关键词的权重对关键词进行排序,并将排序后的关键词上传至交互终端,调用渲染工具对所述关键词进行渲染,从而实现可视化,提高了查阅效率,并能够实时进行信息交互,提高了用户体验感。
Description
技术领域
本申请涉及电力数据交互技术领域,尤其涉及一种电力营销数据交互方法、系统及存储介质。
背景技术
目前,电力系统的规模和技术水平已经成为一个国家经济发展水平的重要标志之一,它的出现推动了社会各个领域的变化,使高效、无污染、使用方便且易于调控的电能得到了广泛的应用。随着电网的不断扩大,电力设备越来越多,使得如何精确高效地管理电力营销信息成为了重点研究方向之一。
目前,对于电力营销信息多是以人工处理方式进行管理的,而电力营销信息需要进行精准筛选、分类等工序,而通过人工管理电力营销信息既费时又费力,导致工作效率较低,同时,用户在查阅电力营销信息时候,仍需人工查阅,这使得查阅效率较低,难以保证信息交互的实时性,造成用户体验感较差。
发明内容
本申请提供了一种电力营销数据交互方法、系统及存储介质,用于解决上述信息管理工作效率较低,查阅效率较低,信息交互的实时性较差且用户体验感较差的技术问题。
有鉴于此,本申请第一方面提供了一种电力营销数据交互方法,包括以下步骤:
基于用户侧配电系统采集电力营销数据,将所述电力营销数据存入至MMIS数据库;
基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令模型对所述数据特征进行解码,输出相应的文本信息;
对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序;
将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染。
可选地,所述基于用户侧配电系统采集电力营销数据,将所述电力营销数据存入至MMIS数据库的步骤具体包括:
基于所述用户侧配电系统实时采集电力营销数据,所述电力营销数据包括用电量、电费、有功功率、无功功率和异常告警信息;
对所述电力营销数据进行数据清洗,所述数据清洗的方式包括去停用词、同义词合并;
将数据清洗后的所述电力营销数据存入至所述MMIS数据库。
可选地,本方法还包括:
基于k-Means聚类算法对存入所述MMIS数据库的所述电力营销数据进行聚类,从而对所述电力营销数据进行分类。
可选地,所述基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令规则对所述数据特征进行解码,输出相应的文本信息的步骤包括:
基于所述MMIS数据库通过下式计算经验熵:
;
式中,H(D)为经验熵,k为目标变量的种类,D为样本数量,为种类k的样本个数;
根据经验熵计算信息增益,将最大的信息增益作为决策树模型的根节点,将最小的信息增益作为决策树模型的叶节点,从而构建决策树模型;
利用所述决策树模型对所述电力营销数据进行提取数据特征;
通过语言命令模型对所述数据特征进行解码,输出相应的文本信息。
可选地,本方法还包括:
对所述文本信息经过UTF-8编码转换成二进制数据,再将所述二进制数据转换成十进制数据,再将所述十进制数据转换成json数据,将所述json数据传上传到指定的远程服务器中;
通过所述指定的远程服务器接收所述json数据,将所述json数据上传至云端。
可选地,所述对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词的步骤之前还包括:
获取电力营销词汇数据,所述电力营销词汇数据包括日常词汇和专业词汇;
对所述电力营销词汇数据进行预处理;
基于预处理后的所述电力营销词汇数据建立电力词典。
可选地,所述根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序的步骤具体包括:
提取所述关键词的集合特征,所述集合特征包括词性特征、TF-IDF特征、词长特征和标志热词特征;
基于专家数据库对所述关键词的集合特征进行分别打分,将打分结果求和得到所述关键词的综合权重;
按照所述关键词的综合权重的大小对所述关键词进行降序排列。
可选地,所述将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染的步骤具体包括:
将排序后的所述关键词按顺序依次上传至交互终端的通知界面;
调用渲染工具对所述关键词进行不同颜色的渲染。
第二方面,本发明提供了一种电力营销数据交互系统,包括:
数据采集存储模块,用于基于用户侧配电系统采集电力营销数据,将所述电力营销数据存入至MMIS数据库;
文本输出模块,用于基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令模型对所述数据特征进行解码,输出相应的文本信息;
关键词提取模块,用于对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
排序模块,用于根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序;
渲染模块,用于将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染。
第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的电力营销数据交互方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过用户侧配电系统采集电力营销数据,能够实时获得电力营销数据,提高电力营销数据的实时性,并将电力营销数据存入至MMIS数据库中,利用决策树算法对电力营销数据进行数据特征提取,输出文本信息,可以提高筛选数据的效率,同时,提取文本信息中的关键词,赋予关键词的权重,根据关键词的权重对关键词进行排序,并将排序后的关键词上传至交互终端,调用渲染工具对所述关键词进行渲染,从而实现可视化,提高了查阅效率,并能够实时进行信息交互,提高了用户体验感。
附图说明
图1为本申请实施例提供的一种电力营销数据交互方法的流程图;
图2为本申请实施例提供的一种电力营销数据交互系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,对于电力营销信息多是以人工处理方式进行管理的,而电力营销信息需要进行精准筛选、分类等工序,而通过人工管理电力营销信息既费时又费力,导致工作效率较低,同时,用户在查阅电力营销信息时候,仍需人工查阅,这使得查阅效率较低,难以保证信息交互的实时性,造成用户体验感较差。
为此,请参阅图1,本发明提供的一种电力营销数据交互方法,包括以下步骤:
S1、基于用户侧配电系统采集电力营销数据,将电力营销数据存入至MMIS数据库;
需要说明的是,MMIS(Multimedia Management Information System,多媒体信息管理)数据库包括基础数据库、决策数据库和共享数据库;其中,基础数据库是各个业务子系统中业务信息的重要资产信息,它是建立其他数据库的基础;决策数据库使企业决策者执行决策、计算的常用数据。数据库作为电力营销管理系统的核心部分,各级MMIS通过物联网交互数据错综复杂;共享数据库的使用范围比较广,综合性较强,其包含的数据类型也较多。
S2、基于MMIS数据库,用决策树算法对电力营销数据进行数据特征提取,通过预先建立的语言命令模型对数据特征进行解码,输出相应的文本信息;
S3、对文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
S4、根据预设的权重赋值规则确定关键词的权重,根据关键词的权重对关键词进行排序;
S5、将排序后的关键词上传至交互终端,调用渲染工具对关键词进行渲染。
需要说明的是,本实施例提供的一种电力营销数据交互方法,通过用户侧配电系统采集电力营销数据,能够实时获得电力营销数据,提高电力营销数据的实时性,并将电力营销数据存入至MMIS数据库中,利用决策树算法对电力营销数据进行数据特征提取,输出文本信息,可以提高筛选数据的效率,同时,提取文本信息中的关键词,赋予关键词的权重,根据关键词的权重对关键词进行排序,并将排序后的关键词上传至交互终端,调用渲染工具对关键词进行渲染,从而实现可视化,提高了查阅效率,并能够实时进行信息交互,提高了用户体验感。
以下为本发明提供的一种电力营销数据交互方法的实施例的详细描述。
本发明提供的一种电力营销数据交互方法,包括以下步骤:
S100、基于用户侧配电系统采集电力营销数据,将电力营销数据存入至MMIS数据库;
需要说明的是,MMIS(Multimedia Management Information System,多媒体信息管理)数据库包括基础数据库、决策数据库和共享数据库;其中,基础数据库是各个业务子系统中业务信息的重要资产信息,它是建立其他数据库的基础;决策数据库使企业决策者执行决策、计算的常用数据。数据库作为电力营销管理系统的核心部分,各级MMIS通过物联网交互数据错综复杂;共享数据库的使用范围比较广,综合性较强,其包含的数据类型也较多。
同时,用户侧配电系统可以包括用电表、计费器、电力营销业务平台。
在本实施例中,步骤S100具体包括:
S101、基于用户侧配电系统实时采集电力营销数据,电力营销数据包括用电量、电费、有功功率、无功功率和异常告警信息;
S102、对电力营销数据进行数据清洗,数据清洗的方式包括去停用词、同义词合并;
S103、将数据清洗后的电力营销数据存入至MMIS数据库。
S200、基于k-Means聚类算法对存入MMIS数据库的电力营销数据进行聚类,从而对电力营销数据进行分类。
S300、基于MMIS数据库,用决策树算法对电力营销数据进行数据特征提取,通过预先建立的语言命令模型对数据特征进行解码,输出相应的文本信息;
在本实施例中,步骤S300具体包括:
S301、基于MMIS数据库通过下式计算经验熵:
;
式中,H(D)为经验熵,k为目标变量的种类,D为样本数量,为种类k的样本个数;
S302、根据经验熵计算信息增益,将最大的信息增益作为决策树模型的根节点,将最小的信息增益作为决策树模型的叶节点,从而构建决策树模型;
需要说明的是,用户选择信息增益最大的特征作为当前分裂特征。
假设计算特征X对数据库集D的经验条件熵为H(D|X),根据经验熵计算特征X的信息增益g:。
S303、利用决策树模型对电力营销数据进行提取数据特征;
S304、通过预先建立的语言命令模型对数据特征进行解码,输出相应的文本信息。
需要说明的是,语言命令模型是即采用seq2seq+attention模型中的Decoder进行解码,其中,Decoder利用LSTM和attention机制对数据特征进行解码。
在解码和搜索过程中,在给定数据特征的情况下,找到最可能的对应的词组过程,其中,对应的词组为数据类型下的关键词,如电力营销数据对应有电量、费用、线损等等,在此过程中,计算每个对应的分类器的得分,再乘以目标似然函数其中,目标似然函数为seq2seq+attention模型的目标函数;然后可利用Viterbi算法对数据特征进行解码,求取目标似然函数的最大值;在Decode解码阶段最大化条件概率p,当条件概率p达到最大值时,输出此时的文本,即识别的文本信息,并由decoder网络的输出端输出文本信息。
在一个具体实施例中,在输出相应的文本信息之后还包括:
S305、对文本信息经过UTF-8编码转换成二进制数据,再将二进制数据转换成十进制数据,再将十进制数据转换成json数据,将json数据传上传到指定的远程服务器中;
S306、通过指定的远程服务器接收json数据,将json数据上传至云端。
S400、对文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
需要说明的是,在步骤S400之前包括:
S401、获取电力营销词汇数据,电力营销词汇数据包括日常词汇和专业词汇;
S402、对电力营销词汇数据进行预处理;
预处理的方式包括去停用词、无意义文本过滤和同义词合并。
S403、基于预处理后的电力营销词汇数据建立电力词典。
S500、根据预设的权重赋值规则确定关键词的权重,根据关键词的权重对关键词进行排序;
在本实施例中,步骤S500具体包括:
S501、提取关键词的集合特征,集合特征包括词性特征、TF-IDF特征、词长特征和标志热词特征;
需要说明的是,标志热词特征是为用户自行设定的标志热词,在提取标志热词特征时,需要根据自行设定的标志热词库筛选关键词中的标志热词,标志热词为需要紧急通知和处理的标志性词汇,如告警、数据异常、故障等词汇。
S502、基于专家数据库对关键词的集合特征进行分别打分,将打分结果求和得到关键词的综合权重;
需要说明的是,在专家数据库可以设定一系列评分规则,并通过对词性特征、TF-IDF特征、词长特征和标志热词特征进行评分,在具体实现中,标志热词特征的评分比重相对于其他特征较高,从而实现突发事件的优先级较高,能够及时通知到用户进行应急处理。
S503、按照关键词的综合权重的大小对关键词进行降序排列。
S600、将排序后的关键词上传至交互终端,调用渲染工具对关键词进行渲染。
在本实施例中,步骤S600具体包括:
S601、将排序后的关键词按顺序依次上传至交互终端的通知界面;
需要说明的是,交互终端可以为手机、电脑和浏览器,而关键词可以以通知栏消息的方式上传至交互终端的通知界面。
S602、调用渲染工具对关键词进行不同颜色的渲染。
在具体应用过程中,例如,紧急的关键词(如为标志热词)会被渲染为红色,普通的关键词会被渲染为绿色。
以上为本发明提供的一种电力营销数据交互方法的实施例的详细描述,以下为本发明提供的一种电力营销数据交互系统的实施例的详细描述。
为了方便理解,请参阅图2,本发明提供的一种电力营销数据交互系统,包括:
数据采集存储模块100,用于基于用户侧配电系统采集电力营销数据,将电力营销数据存入至MMIS数据库;
文本输出模块200,用于基于MMIS数据库,用决策树算法对电力营销数据进行数据特征提取,通过预先建立的语言命令模型对数据特征进行解码,输出相应的文本信息;
关键词提取模块300,用于对文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
排序模块400,用于根据预设的权重赋值规则确定关键词的权重,根据关键词的权重对关键词进行排序;
渲染模块500,用于将排序后的关键词上传至交互终端,调用渲染工具对关键词进行渲染。
进一步地,数据采集存储模块具体包括:
采集子模块,用于基于用户侧配电系统实时采集电力营销数据,电力营销数据包括用电量、电费、有功功率、无功功率和异常告警信息;
数据清洗子模块,用于对电力营销数据进行数据清洗,数据清洗的方式包括去停用词、同义词合并;
存储子模块,用于将数据清洗后的电力营销数据存入至MMIS数据库。
进一步地,本系统还包括:
分类模块,用于基于k-Means聚类算法对存入MMIS数据库的电力营销数据进行聚类,从而对电力营销数据进行分类。
进一步地,文本输出模块具体包括:
经验熵计算模块,用于基于MMIS数据库通过下式计算经验熵:
;
式中,H(D)为经验熵,k为目标变量的种类,D为样本数量,为种类k的样本个数;
构建模块,用于根据经验熵计算信息增益,将最大的信息增益作为决策树模型的根节点,将最小的信息增益作为决策树模型的叶节点,从而构建决策树模型;
特征提取模块,用于利用决策树模型对电力营销数据进行提取数据特征;
解码模块,用于通过预先建立的语言命令模型对数据特征进行解码,输出相应的文本信息。
进一步地,本系统还包括:
转换模块,用于对文本信息经过UTF-8编码转换成二进制数据,再将二进制数据转换成十进制数据,再将十进制数据转换成json数据,将json数据传上传到指定的远程服务器中;
上传模块,用于通过指定的远程服务器接收json数据,将json数据上传至云端。
进一步地,本系统还包括:
词汇获取模块,用于获取电力营销词汇数据,电力营销词汇数据包括日常词汇和专业词汇;
预处理模块,用于对电力营销词汇数据进行预处理;
词典建立模块,用于基于预处理后的电力营销词汇数据建立电力词典。
进一步地,排序模块具体包括:
特征子模块,用于提取关键词的集合特征,集合特征包括词性特征、TF-IDF特征、词长特征和标志热词特征;
打分子模块,用于基于专家数据库对关键词的集合特征进行分别打分,将打分结果求和得到关键词的综合权重;
排序子模块,用于按照关键词的综合权重的大小对关键词进行降序排列。
进一步地,渲染模块具体包括:
通知子模块,用于将排序后的关键词按顺序依次上传至交互终端的通知界面;
颜色渲染子模块,用于调用渲染工具对关键词进行不同颜色的渲染。
需要说明的是,本实施例提供的一种电力营销数据交互系统与上述提供的一种电力营销数据交互方法的工作流程一致,在此不再赘述。
本实施例提供的一种电力营销数据交互系统,通过用户侧配电系统采集电力营销数据,能够实时获得电力营销数据,提高电力营销数据的实时性,并将电力营销数据存入至MMIS数据库中,利用决策树算法对电力营销数据进行数据特征提取,输出文本信息,可以提高筛选数据的效率,同时,提取文本信息中的关键词,赋予关键词的权重,根据关键词的权重对关键词进行排序,并将排序后的关键词上传至交互终端,调用渲染工具对关键词进行渲染,从而实现可视化,提高了查阅效率,并能够实时进行信息交互,提高了用户体验感。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的电力营销数据交互方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (8)
1.一种电力营销数据交互方法,其特征在于,包括以下步骤:
基于用户侧配电系统实时采集电力营销数据,将所述电力营销数据存入至MMIS数据库,所述电力营销数据包括用电量、电费、有功功率、无功功率和异常告警信息,MMIS数据库为多媒体信息管理数据库,MMIS数据库包括基础数据库、决策数据库和共享数据库;
基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令模型对所述数据特征进行解码,输出相应的文本信息;
所述基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令规则对所述数据特征进行解码,输出相应的文本信息的步骤包括:
基于所述MMIS数据库通过下式计算经验熵:
;
式中,H(D)为经验熵,k为目标变量的种类,D为样本数量,为种类k的样本个数;
根据经验熵计算信息增益,将最大的信息增益作为决策树模型的根节点,将最小的信息增益作为决策树模型的叶节点,从而构建决策树模型;
利用所述决策树模型对所述电力营销数据进行提取数据特征;
通过语言命令模型对所述数据特征进行解码,输出相应的文本信息;
对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序;
将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染;
所述对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词的步骤之前还包括:
获取电力营销词汇数据,所述电力营销词汇数据包括日常词汇和专业词汇;
对所述电力营销词汇数据进行预处理;
基于预处理后的所述电力营销词汇数据建立电力词典。
2.根据权利要求1所述的电力营销数据交互方法,其特征在于,所述基于用户侧配电系统采集电力营销数据,将所述电力营销数据存入至MMIS数据库的步骤具体包括:
基于所述用户侧配电系统实时采集电力营销数据;
对所述电力营销数据进行数据清洗,所述数据清洗的方式包括去停用词、同义词合并;
将数据清洗后的所述电力营销数据存入至所述MMIS数据库。
3.根据权利要求1所述的电力营销数据交互方法,其特征在于,还包括:
基于k-Means聚类算法对存入所述MMIS数据库的所述电力营销数据进行聚类,从而对所述电力营销数据进行分类。
4.根据权利要求3所述的电力营销数据交互方法,其特征在于,还包括:
对所述文本信息经过UTF-8编码转换成二进制数据,再将所述二进制数据转换成十进制数据,再将所述十进制数据转换成json数据,将所述json数据传上传到指定的远程服务器中;
通过所述指定的远程服务器接收所述json数据,将所述json数据上传至云端。
5.根据权利要求1所述的电力营销数据交互方法,其特征在于,所述根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序的步骤具体包括:
提取所述关键词的集合特征,所述集合特征包括词性特征、TF-IDF特征、词长特征和标志热词特征;
基于专家数据库对所述关键词的集合特征进行分别打分,将打分结果求和得到所述关键词的综合权重;
按照所述关键词的综合权重的大小对所述关键词进行降序排列。
6.根据权利要求1所述的电力营销数据交互方法,其特征在于,所述将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染的步骤具体包括:
将排序后的所述关键词按顺序依次上传至交互终端的通知界面;
调用渲染工具对所述关键词进行不同颜色的渲染。
7.一种电力营销数据交互系统,其特征在于,包括:
数据采集存储模块,用于基于用户侧配电系统实时采集电力营销数据,将所述电力营销数据存入至MMIS数据库,所述电力营销数据包括用电量、电费、有功功率、无功功率和异常告警信息,MMIS数据库为多媒体信息管理数据库,MMIS数据库包括基础数据库、决策数据库和共享数据库;
文本输出模块,用于基于所述MMIS数据库,用决策树算法对所述电力营销数据进行数据特征提取,通过语言命令模型对所述数据特征进行解码,输出相应的文本信息;
文本输出模块具体包括:
经验熵计算模块,用于基于MMIS数据库通过下式计算经验熵:
;
式中,H(D)为经验熵,k为目标变量的种类,D为样本数量,为种类k的样本个数;
构建模块,用于根据经验熵计算信息增益,将最大的信息增益作为决策树模型的根节点,将最小的信息增益作为决策树模型的叶节点,从而构建决策树模型;
特征提取模块,用于利用决策树模型对电力营销数据进行提取数据特征;
解码模块,用于通过语言命令模型对数据特征进行解码,输出相应的文本信息;
关键词提取模块,用于对所述文本信息进行分词处理,基于预先建立的电力词典对分词结果进行提取关键词;
排序模块,用于根据预设的权重赋值规则确定所述关键词的权重,根据所述关键词的权重对所述关键词进行排序;
渲染模块,用于将排序后的所述关键词上传至交互终端,调用渲染工具对所述关键词进行渲染;
本系统还包括:
词汇获取模块,用于获取电力营销词汇数据,电力营销词汇数据包括日常词汇和专业词汇;
预处理模块,用于对电力营销词汇数据进行预处理;
词典建立模块,用于基于预处理后的电力营销词汇数据建立电力词典。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的电力营销数据交互方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110970658.5A CN113673229B (zh) | 2021-08-23 | 2021-08-23 | 一种电力营销数据交互方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110970658.5A CN113673229B (zh) | 2021-08-23 | 2021-08-23 | 一种电力营销数据交互方法、系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113673229A CN113673229A (zh) | 2021-11-19 |
CN113673229B true CN113673229B (zh) | 2024-04-05 |
Family
ID=78545210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110970658.5A Active CN113673229B (zh) | 2021-08-23 | 2021-08-23 | 一种电力营销数据交互方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113673229B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115794756A (zh) * | 2022-11-08 | 2023-03-14 | 珠海芯聚科技有限公司 | 一种仿真文件的压缩方法及装置、设备、存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407406A (zh) * | 2016-09-22 | 2017-02-15 | 国信优易数据有限公司 | 一种文本处理方法和系统 |
CN109992646A (zh) * | 2019-03-29 | 2019-07-09 | 腾讯科技(深圳)有限公司 | 文本标签的提取方法和装置 |
CN110188344A (zh) * | 2019-04-23 | 2019-08-30 | 浙江工业大学 | 一种多特征融合的关键词提取方法 |
CN110750640A (zh) * | 2019-09-17 | 2020-02-04 | 平安科技(深圳)有限公司 | 基于神经网络模型的文本数据分类方法、装置及存储介质 |
CN111241056A (zh) * | 2019-12-31 | 2020-06-05 | 国网浙江省电力有限公司电力科学研究院 | 一种基于决策树模型的电力用能数据存储优化方法 |
CN111444944A (zh) * | 2020-03-16 | 2020-07-24 | 中国平安人寿保险股份有限公司 | 基于决策树的信息筛选方法、装置、设备和存储介质 |
CN111598723A (zh) * | 2020-05-18 | 2020-08-28 | 刘金德 | 一种基于大数据管理的电力营销管理平台构建方法 |
CN111694946A (zh) * | 2020-05-27 | 2020-09-22 | 平安银行股份有限公司 | 文本关键词可视化显示方法、装置及计算机设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11003864B2 (en) * | 2016-05-11 | 2021-05-11 | Stratifyd, Inc. | Artificial intelligence optimized unstructured data analytics systems and methods |
CN108073568B (zh) * | 2016-11-10 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 关键词提取方法和装置 |
CN108228676B (zh) * | 2016-12-22 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 信息抽取方法和系统 |
-
2021
- 2021-08-23 CN CN202110970658.5A patent/CN113673229B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407406A (zh) * | 2016-09-22 | 2017-02-15 | 国信优易数据有限公司 | 一种文本处理方法和系统 |
CN109992646A (zh) * | 2019-03-29 | 2019-07-09 | 腾讯科技(深圳)有限公司 | 文本标签的提取方法和装置 |
CN110188344A (zh) * | 2019-04-23 | 2019-08-30 | 浙江工业大学 | 一种多特征融合的关键词提取方法 |
CN110750640A (zh) * | 2019-09-17 | 2020-02-04 | 平安科技(深圳)有限公司 | 基于神经网络模型的文本数据分类方法、装置及存储介质 |
CN111241056A (zh) * | 2019-12-31 | 2020-06-05 | 国网浙江省电力有限公司电力科学研究院 | 一种基于决策树模型的电力用能数据存储优化方法 |
CN111444944A (zh) * | 2020-03-16 | 2020-07-24 | 中国平安人寿保险股份有限公司 | 基于决策树的信息筛选方法、装置、设备和存储介质 |
CN111598723A (zh) * | 2020-05-18 | 2020-08-28 | 刘金德 | 一种基于大数据管理的电力营销管理平台构建方法 |
CN111694946A (zh) * | 2020-05-27 | 2020-09-22 | 平安银行股份有限公司 | 文本关键词可视化显示方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113673229A (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063945B (zh) | 一种基于价值评估体系的售电公司360度客户画像构建方法 | |
CN111797210A (zh) | 基于用户画像的信息推荐方法、装置、设备及存储介质 | |
CN108280541A (zh) | 基于随机森林和决策树的客户服务策略制定方法、装置 | |
CN106649681B (zh) | 一种数据处理方法、装置及设备 | |
Defersha et al. | Machine cell formation using a mathematical model and a genetic-algorithm-based heuristic | |
CN111047369A (zh) | 一种电力现货市场监测分析装置及系统 | |
CN107809370B (zh) | 用户推荐方法及装置 | |
CN113673229B (zh) | 一种电力营销数据交互方法、系统及存储介质 | |
WO2021068798A1 (zh) | 基于文本的指标提取方法、装置、计算机设备及存储介质 | |
CN116701584A (zh) | 基于电力用户画像的智能问答方法、装置以及电子设备 | |
US20210027320A1 (en) | Method and system for generating return forecasts and portfolio construction | |
CN113177366A (zh) | 一种综合能源系统规划方法、装置和终端设备 | |
CN113361959A (zh) | 一种银行业务集中运营成熟度的计算方法和装置 | |
Lee et al. | Energy-efficient knowledge distillation for spiking neural networks | |
CN111178578A (zh) | 一种融合聚类与集成学习的金融股票预测方法 | |
CN114913008A (zh) | 基于决策树的债券价值分析方法、装置、设备及存储介质 | |
CN116485237A (zh) | 一种电力调控数据资产价值评估方法、系统、设备及介质 | |
CN116303922A (zh) | 咨询消息应答方法、装置、计算机设备、存储介质和产品 | |
CN113381417B (zh) | 一种配电网台区三相负荷不平衡优化方法、装置及终端 | |
CN110766488A (zh) | 一种自动确定主题场景的方法和装置 | |
CN110928990B (zh) | 一种基于用户画像专用于电力设备台账数据推荐的方法 | |
CN113032554A (zh) | 一种决策系统和计算机可读存储介质 | |
CN117408573B (zh) | 一种upfc设备画像展示与性能分析方法和系统 | |
CN114969486B (zh) | 语料推荐方法、装置、设备及存储介质 | |
CN116777148B (zh) | 一种基于数据分析的服务工单智能分配处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |