CN110659277A - 一种能源互联网数据采集方法及装置 - Google Patents

一种能源互联网数据采集方法及装置 Download PDF

Info

Publication number
CN110659277A
CN110659277A CN201910955678.8A CN201910955678A CN110659277A CN 110659277 A CN110659277 A CN 110659277A CN 201910955678 A CN201910955678 A CN 201910955678A CN 110659277 A CN110659277 A CN 110659277A
Authority
CN
China
Prior art keywords
module
data
energy
acquisition
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910955678.8A
Other languages
English (en)
Inventor
谭旭
邢立宁
马国栋
程东升
王琼
张倩
李君�
向尚
薛含钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Information Technology
Original Assignee
Shenzhen Institute of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Information Technology filed Critical Shenzhen Institute of Information Technology
Priority to CN201910955678.8A priority Critical patent/CN110659277A/zh
Publication of CN110659277A publication Critical patent/CN110659277A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种能源互联网数据采集方法及装置,涉及数据采集方法技术领域。该能源互联网数据采集方法及装置,包括预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块、用户查询模块、紧急处理模块与实时监测模块,所述预采集模块的输出端与预处理模块的输入端信号连接,所述预处理模块的输出端与采集模块的输入端信号连接。通过预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块与用户查询模块之间的相互配合,将采集的能源数据进行合理的删去以及提取,使得数据中的能源相关数据与一些其它数据就不会掺杂在一起,提高了用户终端的查询效率,给终端的查询带来了一定的便利。

Description

一种能源互联网数据采集方法及装置
技术领域
本发明涉及数据采集方法技术领域,具体为一种能源互联网数据采集方法及装置。
背景技术
能源互联网可理解是综合运用先进的电力电子技术,信息技术和智能管理技术,将大量由分布式能量采集装置,分布式能量储存装置和各种类型负载构成的新型电力网络、石油网络、天然气网络等能源节点互联起来,以实现能量双向流动的能量对等交换与共享网络。
人们为了清楚的了解到能源的实时情况,常常需要借助互联网工具对能源信息进行查询,但是利用现有的能源互联网工具查询时,查询的信息中真实有效的信息少之又少,这跟数据采集的方法有着直接的关系,现有的能源互联网数据采集方法较为简单,一般都是直接将所有搜索到的数据都采集起来,从而就导致数据中的能源相关数据与一些其它数据掺杂在一起,给终端的查询带来了一定的不便。
发明内容
针对现有技术的不足,本发明提供了一种能源互联网数据采集方法及装置,解决了现有的能源互联网数据采集方法较为简单,一般都是直接将所有搜索到的数据都采集起来,从而就导致数据中的能源相关数据与一些其它数据掺杂在一起,给终端的查询带来了一定不便的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种能源互联网数据采集装置,包括预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块、用户查询模块、紧急处理模块与实时监测模块,所述预采集模块的输出端与预处理模块的输入端信号连接,所述预处理模块的输出端与采集模块的输入端信号连接,所述采集模块的输出端与整合模块的输入端信号连接,所述整合模块的输出端与数据库模块的输入端信号连接,所述数据库模块的输出端与能源互联网管理模块和紧急处理模块的输入端信号连接,所述能源互联网管理模块的输出端与用户查询模块的输入端信号连接,所述紧急处理模块的输出端与能源互联网管理模块的输入端信号连接,所述数据库模块和能源互联网管理模块的输出端均与实时监测模块的输入端信号连接,所述实时监测模块的输出端与采集模块的输入端信号连接。
一种能源互联网数据采集方法,所述采集方法包括以下步骤:
S1.利用预采集模块对互联网中知名、高流量、高信息量等网站、论坛、贴吧的能源数据进行少量采集,预采集模块利用关键字、关键词、关键词组等抽取法提取能源数据中的关键内容,同时预采集模块对采集的数据中无关的内容进行屏蔽,建立一个关于能源数据无关内容的屏蔽算法;
S2.预处理模块将利用能源数据无关内容的屏蔽算法采集的数据进行预处理,由于能源数据无关内容的屏蔽算法初步建成,其稳定性以及准确性都有待提高,通过预处理模块对采集的数据进行及时更改以及修正,从而对能源数据无关内容的屏蔽算法进行合理优化,提高其稳定性以及准确性;
S3.采集模块利用高稳定性以及准确性的能源数据无关内容的屏蔽算法对互联网中各大能源网页数据进行采集,采集近期互联网中出现的新数据,对数据内容相似度较高的网页进行自动过滤,然后将采集到的新数据进行保存并发送给整合模块;
S4.整合模块将采集之后的能源数据按照主题、领域、内容等进行分类,并将每类数据设置一个或多个关键词组,以后整合模块再接收到采集数据时,直接按照关键词组进行分类整合即可;
S5.数据库模块接收整合模块整合之后的所有数据,对能源数据进行保存以及备份,并利用数据库对能源数据进行集中控制和管理,可以防止数据丢失、错误更新和越权使用,并且能够保证数据的正确性、有效性和相容性,同时允许对数据实现多路存取,又能防止用户之间的不正常交互作用;
S6.能源互联网管理模块将数据库中数据建立信息共享平台,并对输入端与输出端实现双重管理,严格控制能源数据的输入与输出,及时提醒采集模块补充新数据以及及时删除失效的数据内容,对能源互联网实施24小时的维护管理;
S7.用户查询模块包括PC端与移动端,用户无论通过PC端还是移动端均可查询到需要的能源数据,用户只需输入需要查询的关键词组即可,能源互联网管理模块会自动输出相关的能源数据;
S8.紧急处理模块将数据库模块的所有数据进行备份,并且数据库模块每隔一个星期都会将接收的所有新数据发送到紧急处理模块中,当数据库模块出现瘫痪的情况中,紧急处理模块启动可以将数据发送给能源互联网管理模块,实现紧急处理模块与能源互联网管理模块之间的信息共享;
S9.通过实时监测模块对数据库模块与能源互联网管理模块进行24小时实时监测,监测各类数据的录入、用户查询的种类以及能源数据的匹配性,并将信息反馈给采集模块。
工作原理:利用预采集模块对互联网中知名、高流量、高信息量等网站、论坛、贴吧的能源数据进行少量采集,建立一个关于能源数据无关内容的屏蔽算法;预处理模块将利用能源数据无关内容的屏蔽算法采集的数据进行预处理,由于能源数据无关内容的屏蔽算法初步建成,其稳定性以及准确性都有待提高,通过预处理模块对采集的数据进行及时更改以及修正;采集模块利用高稳定性以及准确性的能源数据无关内容的屏蔽算法对互联网中各大能源网页数据进行采集,采集近期互联网中出现的新数据;整合模块将采集之后的能源数据按照主题、领域、内容等进行分类,并将每类数据设置一个或多个关键词组;数据库模块接收整合模块整合之后的所有数据,对能源数据进行保存以及备份,并利用数据库对能源数据进行集中控制和管理;能源互联网管理模块将数据库中数据建立信息共享平台,并对输入端与输出端实现双重管理,严格控制能源数据的输入与输出。
本发明提供了一种能源互联网数据采集方法及装置。具备以下有益效果:
1、该能源互联网数据采集方法及装置,通过预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块与用户查询模块之间的相互配合,将采集的能源数据进行合理的删去以及提取,使得数据中的能源相关数据与一些其它数据就不会掺杂在一起,提高了用户终端的查询效率,给终端的查询带来了一定的便利。
2、该能源互联网数据采集方法及装置,通过采集模块、数据库模块、能源互联网管理模块、紧急处理模块与实时监测模块之间的相互配合,使得数据能够及时的更新维护,且可根据用户的需求侧重收集相关的数据。
附图说明
图1为本发明的整体示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
如图1所示,本发明实施例提供一种能源互联网数据采集装置,包括预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块、用户查询模块、紧急处理模块与实时监测模块,预采集模块的输出端与预处理模块的输入端信号连接,预处理模块的输出端与采集模块的输入端信号连接,采集模块的输出端与整合模块的输入端信号连接,整合模块的输出端与数据库模块的输入端信号连接,数据库模块的输出端与能源互联网管理模块和紧急处理模块的输入端信号连接,能源互联网管理模块的输出端与用户查询模块的输入端信号连接,紧急处理模块的输出端与能源互联网管理模块的输入端信号连接,数据库模块和能源互联网管理模块的输出端均与实时监测模块的输入端信号连接,实时监测模块的输出端与采集模块的输入端信号连接。
一种能源互联网数据采集方法,采集方法包括以下步骤:
S1.利用预采集模块对互联网中知名、高流量、高信息量等网站、论坛、贴吧的能源数据进行少量采集,预采集模块利用关键字、关键词、关键词组等抽取法提取能源数据中的关键内容,同时预采集模块对采集的数据中无关的内容进行屏蔽,建立一个关于能源数据无关内容的屏蔽算法;
S2.预处理模块将利用能源数据无关内容的屏蔽算法采集的数据进行预处理,由于能源数据无关内容的屏蔽算法初步建成,其稳定性以及准确性都有待提高,通过预处理模块对采集的数据进行及时更改以及修正,从而对能源数据无关内容的屏蔽算法进行合理优化,提高其稳定性以及准确性;
S3.采集模块利用高稳定性以及准确性的能源数据无关内容的屏蔽算法对互联网中各大能源网页数据进行采集,采集近期互联网中出现的新数据,对数据内容相似度较高的网页进行自动过滤,然后将采集到的新数据进行保存并发送给整合模块;
S4.整合模块将采集之后的能源数据按照主题、领域、内容等进行分类,并将每类数据设置一个或多个关键词组,以后整合模块再接收到采集数据时,直接按照关键词组进行分类整合即可;
S5.数据库模块接收整合模块整合之后的所有数据,对能源数据进行保存以及备份,并利用数据库对能源数据进行集中控制和管理,可以防止数据丢失、错误更新和越权使用,并且能够保证数据的正确性、有效性和相容性,同时允许对数据实现多路存取,又能防止用户之间的不正常交互作用;
S6.能源互联网管理模块将数据库中数据建立信息共享平台,并对输入端与输出端实现双重管理,严格控制能源数据的输入与输出,及时提醒采集模块补充新数据以及及时删除失效的数据内容,对能源互联网实施24小时的维护管理;
S7.用户查询模块包括PC端与移动端,用户无论通过PC端还是移动端均可查询到需要的能源数据,用户只需输入需要查询的关键词组即可,能源互联网管理模块会自动输出相关的能源数据;
S8.紧急处理模块将数据库模块的所有数据进行备份,并且数据库模块每隔一个星期都会将接收的所有新数据发送到紧急处理模块中,当数据库模块出现瘫痪的情况中,紧急处理模块启动可以将数据发送给能源互联网管理模块,实现紧急处理模块与能源互联网管理模块之间的信息共享;
S9.通过实时监测模块对数据库模块与能源互联网管理模块进行24小时实时监测,监测各类数据的录入、用户查询的种类以及能源数据的匹配性,并将信息反馈给采集模块,及时的对需求多的数据进行补充。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (2)

1.一种能源互联网数据采集装置,包括预采集模块、预处理模块、采集模块、整合模块、数据库模块、能源互联网管理模块、用户查询模块、紧急处理模块与实时监测模块,其特征在于:所述预采集模块的输出端与预处理模块的输入端信号连接,所述预处理模块的输出端与采集模块的输入端信号连接,所述采集模块的输出端与整合模块的输入端信号连接,所述整合模块的输出端与数据库模块的输入端信号连接,所述数据库模块的输出端与能源互联网管理模块和紧急处理模块的输入端信号连接,所述能源互联网管理模块的输出端与用户查询模块的输入端信号连接,所述紧急处理模块的输出端与能源互联网管理模块的输入端信号连接,所述数据库模块和能源互联网管理模块的输出端均与实时监测模块的输入端信号连接,所述实时监测模块的输出端与采集模块的输入端信号连接。
2.一种能源互联网数据采集方法,根据权利要求1所述的一种能源互联网数据采集装置,其特征在于:所述采集方法包括以下步骤:
S1.利用预采集模块对互联网中知名、高流量、高信息量等网站、论坛、贴吧的能源数据进行少量采集,预采集模块利用关键字、关键词、关键词组等抽取法提取能源数据中的关键内容,同时预采集模块对采集的数据中无关的内容进行屏蔽,建立一个关于能源数据无关内容的屏蔽算法;
S2.预处理模块将利用能源数据无关内容的屏蔽算法采集的数据进行预处理,由于能源数据无关内容的屏蔽算法初步建成,其稳定性以及准确性都有待提高,通过预处理模块对采集的数据进行及时更改以及修正,从而对能源数据无关内容的屏蔽算法进行合理优化,提高其稳定性以及准确性;
S3.采集模块利用高稳定性以及准确性的能源数据无关内容的屏蔽算法对互联网中各大能源网页数据进行采集,采集近期互联网中出现的新数据,对数据内容相似度较高的网页进行自动过滤,然后将采集到的新数据进行保存并发送给整合模块;
S4.整合模块将采集之后的能源数据按照主题、领域、内容等进行分类,并将每类数据设置一个或多个关键词组,以后整合模块再接收到采集数据时,直接按照关键词组进行分类整合即可;
S5.数据库模块接收整合模块整合之后的所有数据,对能源数据进行保存以及备份,并利用数据库对能源数据进行集中控制和管理,可以防止数据丢失、错误更新和越权使用,并且能够保证数据的正确性、有效性和相容性,同时允许对数据实现多路存取,又能防止用户之间的不正常交互作用;
S6.能源互联网管理模块将数据库中数据建立信息共享平台,并对输入端与输出端实现双重管理,严格控制能源数据的输入与输出,及时提醒采集模块补充新数据以及及时删除失效的数据内容,对能源互联网实施24小时的维护管理;
S7.用户查询模块包括PC端与移动端,用户无论通过PC端还是移动端均可查询到需要的能源数据,用户只需输入需要查询的关键词组即可,能源互联网管理模块会自动输出相关的能源数据;
S8.紧急处理模块将数据库模块的所有数据进行备份,并且数据库模块每隔一个星期都会将接收的所有新数据发送到紧急处理模块中,当数据库模块出现瘫痪的情况中,紧急处理模块启动可以将数据发送给能源互联网管理模块,实现紧急处理模块与能源互联网管理模块之间的信息共享;
S9.通过实时监测模块对数据库模块与能源互联网管理模块进行24小时实时监测,监测各类数据的录入、用户查询的种类以及能源数据的匹配性,并将信息反馈给采集模块。
CN201910955678.8A 2019-10-09 2019-10-09 一种能源互联网数据采集方法及装置 Withdrawn CN110659277A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910955678.8A CN110659277A (zh) 2019-10-09 2019-10-09 一种能源互联网数据采集方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910955678.8A CN110659277A (zh) 2019-10-09 2019-10-09 一种能源互联网数据采集方法及装置

Publications (1)

Publication Number Publication Date
CN110659277A true CN110659277A (zh) 2020-01-07

Family

ID=69040313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910955678.8A Withdrawn CN110659277A (zh) 2019-10-09 2019-10-09 一种能源互联网数据采集方法及装置

Country Status (1)

Country Link
CN (1) CN110659277A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377854A (zh) * 2021-06-21 2021-09-10 国网宁夏电力有限公司电力科学研究院 一种基于能源大数据的数据整合系统
CN114840776A (zh) * 2022-07-04 2022-08-02 北京拓普丰联信息科技股份有限公司 一种数据发布源收录的方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113377854A (zh) * 2021-06-21 2021-09-10 国网宁夏电力有限公司电力科学研究院 一种基于能源大数据的数据整合系统
CN114840776A (zh) * 2022-07-04 2022-08-02 北京拓普丰联信息科技股份有限公司 一种数据发布源收录的方法、装置、电子设备及存储介质
CN114840776B (zh) * 2022-07-04 2022-09-20 北京拓普丰联信息科技股份有限公司 一种数据发布源收录的方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN106779581A (zh) 一种人力资源管理系统
CN110471995B (zh) 一种跨领域信息共享交换数据模型建模方法
CN111090643B (zh) 一种基于数据分析系统下的海量用电数据挖掘方法
CN110659277A (zh) 一种能源互联网数据采集方法及装置
CN104112242A (zh) 电力系统10kV母线电压合格率分析系统及方法
CN103064842A (zh) 信息订阅处理装置和信息订阅处理方法
CN108959645A (zh) 一种政策法规收集分析系统
CN104615734A (zh) 一种社区管理服务大数据处理系统及其处理方法
CN106446084A (zh) 一种互联网人物搜索信息整合分析方法
CN116361367A (zh) 一种高效发布招聘信息的内容识别系统及方法
CN114218291A (zh) 基于目标对象的画像生成方法、装置、设备及存储介质
CN106709050A (zh) 一种环境法学案例储存查询系统
CN113010624B (zh) 配电智能巡检系统
CN110751382A (zh) 一种高效能源互联网的运行系统
CN102325143A (zh) 一种基于云平台的信息收集存储和加密检索系统
CN105631583A (zh) 一种电网省地一体化调度报表的数据采集处理方法
CN105677745A (zh) 一种通用高效自助数据查询系统及实现方法
CN111340253A (zh) 一种主网检修申请单的解析方法及系统
CN111292201A (zh) 一种基于Apriori和RETE的电力通信网现场运维信息推送的方法
CN111221967A (zh) 一种基于区块链架构的语言数据分类存储系统
CN113792111B (zh) 一种基于分布式存储的非结构化数据管理系统及其方法
CN108280790A (zh) 基于大数据分析的政策信息服务系统
CN111077861A (zh) 一种智慧工厂的远程运维系统
CN107609016A (zh) 基于表达式解析的电力交易数据准确性校验方法
CN110895541A (zh) 一种Timing云数据统计智能化平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200107