CN112306992A - 一种基于互联网的大数据平台 - Google Patents

一种基于互联网的大数据平台 Download PDF

Info

Publication number
CN112306992A
CN112306992A CN202011216201.7A CN202011216201A CN112306992A CN 112306992 A CN112306992 A CN 112306992A CN 202011216201 A CN202011216201 A CN 202011216201A CN 112306992 A CN112306992 A CN 112306992A
Authority
CN
China
Prior art keywords
data
big data
subsystem
unit
big
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011216201.7A
Other languages
English (en)
Other versions
CN112306992B (zh
Inventor
兰海龙
杨志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia Zhenglian Information Technology Co ltd
Original Assignee
Inner Mongolia Zhenglian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia Zhenglian Information Technology Co ltd filed Critical Inner Mongolia Zhenglian Information Technology Co ltd
Priority to CN202011216201.7A priority Critical patent/CN112306992B/zh
Publication of CN112306992A publication Critical patent/CN112306992A/zh
Application granted granted Critical
Publication of CN112306992B publication Critical patent/CN112306992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出的一种基于互联网的大数据平台,包括:大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统和大数据安全管理子系统。本发明通过梳理现有共享开放数据资源、互联网数据资源,建立统一的大数据基础资源库,统一建立数据标准、数据分类,搭建高性能、高可靠的智能分析服务平台。

Description

一种基于互联网的大数据平台
技术领域
本发明涉及大数据技术领域,更具体的说是涉及一种基于互联网的大数据平台。
背景技术
大数据时代的到来,简单的说是海量数据同完美计算能力结合的结果。确切的说是移动互联网、物联网产生了海量的数据,大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题。大数据时代开启人类社会利用数据价值的另一个时代。
随着大数据技术的快速发展,为了满足企业对于数据的各种要求,大数据平台应运而生。大数据平台是指以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。现有的大数据平台既可以采用开源平台,也可以采用商业级解决方案,既可以部署在私有云上,也可以部署在公有云上。大数据平台具有数据存储量大,计算速度快,兼容性强等优点,并能提供数据分析功能,符合当前国际大数据产业的发展趋势和产业化应用要求。
然而现有的大数据平台大多功能单一,框架不完善,由于数据处理量巨大,数据安全性有所欠缺,无法实现真正的大数据时代。
发明内容
针对以上问题,本发明的目的在于提供一种基于互联网的大数据平台,通过梳理现有共享开放数据资源、互联网数据资源,建立统一的大数据基础资源库,统一建立数据标准、数据分类,搭建高性能、高可靠的智能分析服务平台。
本发明为实现上述目的,通过以下技术方案实现:一种基于互联网的大数据平台,包括:大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统和大数据安全管理子系统;
所述大数据采集子系统,用于互联网访问进程中的日志采集和数据源数据同步;所述大数据治理子系统,用于设定数据治理标准和数据清洗规则,并配置数据清洗规则,对清洗后的数据进行检查和验证;
所述大数据管理子系统,用于管理数据标准和元数据,并进行元数据亲缘关系配置和数据质量监控;
所述大数据存储子系统,用于建立分布式、关系型存储数据库,并支持选择数据存储方式;
所述大数据资源中心子系统,用于对数据库数据进行分层维护和数据安全管理,设定并执行数据自动备份机制;
所述大数据安全管理子系统,用于收集和汇总子系统产生的信息数据,运用预设风险分析方法对信息数据事件进行统一加工分析,根据分析结果信息数据进行统一监控管理和未知风险预警处理。
进一步,所述大数据采集子系统包括:日志采集单元、数据源数据同步单元和配置单元;
所述日志采集单元包括:
浏览器页面采集模块,用于收集页面的浏览日志和交互操作日志,并在页面日志收集完成后,在服务端进行预设的预处理
客户端日志采集模块,用于通过专用SDK进行客户端的数据采集,采集完成的数据与唯一ID相关联,通过预设插件进行合并,并通过SDK统一的发送;
所述数据源数据同步单元用于通过直接数据源同步、生成数据文件同步和数据库日志同步的方式完成数据同步,具体包括:
第一同步模块,用于连接业务数据库,通过预设接口去读取目标数据库的数据;第二同步模块,用于从数据源系统中生成数据文件,然后通过文件系统同步到目标数据库里;
第三同步模块,用于基于源数据库的日志文件进行同步;
所述配置单元,用于建立大数据采集规则,并进行定时任务配置。
进一步,所述大数据治理子系统包括:
预处理单元,用于将数据导入预处理工具并查看元数据;
清洗单元,用于根据数据清洗规则去除或补全缺失的数据、去除或修改数据的格式和内容、去除或修改数据的逻辑错误、并去除非必要数据;
验证单元,用于根据数据的来源进行关联性验证。
进一步,所述大数据管理子系统包括:
数据标准管理单元,用于定义、维护和展现数据标准,并按照预设流程实现数据标准;
元数据管理单元,用于采集元数据,并对采集的元数据信息进行展示、查询和统计,并按照预设机制完成元数据的影响分析和亲缘分析;
数据质量监控单元,用于根据数据质量检查规则来进行计算和比对,并输出数据质量查询结果和处理结果;
补录单元,用于根据数据质量的处理结果,通过配置补录的字段、格式、检查规则,在后台系统及数据库自动产生补录界面。
进一步,所述元数据管理单元包括:
第一分析模块,用于以元数据的任一物理表或字段为出发点,查找其下游所有层次的影响对象,并将查找结果以图形方式展示;
第二分析模块,用于以元数据的任一物理表或字段为出发点,查找其上游所有层次的对象,并将查找结果以图形方式展示。
进一步,所述大数据存储子系统包括:
查询单元,用于接收用户查询指令,根据预设算法对查询指令进行编译后生成查询程序,执行查询程序并生产查询结果;
监控单元,用于根据数据管理标准执行分布式计算任务,并进行元数据管理和存储节点监控;
部署单元,用于部署分布式计算任务和关系型数据库。
进一步,所述大数据资源中心子系统包括:
数据源管理单元,用于采集预设格式和系统的数据源,并对数据源进行汇总和质量管理;
同步单元,用于将数据源同步到大数据存储子系统中对应的存储数据库中。
进一步,所述大数据安全管理子系统包括:
采集单元,用于收集和汇总大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统在运行过程中产生的信息数据;
扫描单元,用于扫描信息数据中是否含有预设敏感数据,若是,划定含有敏感数据的数据块,并根据预设加密算法对所述数据块进行加密;
加固单元,用于根据含有敏感数据的数据块的数据表找到所属的数据库,针对所属数据库启动访问控制引擎,向用户提供黑白名单和例外策略,并对用户登录行为、用户访问权限进行控制。
对比现有技术,本发明有益效果在于:本发明提供了基于互联网的大数据平台,提供数据采集、数据治理、数据管理、数据存储的基础支撑体系,实现目标数据从“异构”到“同构”的复杂过程,对不同领域的数据进行战略性规划与运用,将各种数据进行汇聚融合,形成大数据资源中心,建立统一的数据管理体系,从全局审视盘点数据内容,实现各种产业链业务数据互联互通。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
附图1是本发明的系统结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做出说明。
如图1所示的一种基于互联网的大数据平台,包括大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统和大数据安全管理子系统。
1、大数据采集子系统,用于互联网访问进程中的日志采集和数据源数据同步。包括:日志采集单元、数据源数据同步单元和配置单元;
其中,日志采集单元包括:
浏览器页面采集模块,用于收集页面的浏览日志和交互操作日志,并在页面日志收集完成后,在服务端进行预设的预处理
客户端日志采集模块,用于通过专用SDK进行客户端的数据采集,采集完成的数据与唯一ID相关联,通过预设插件进行合并,并通过SDK统一的发送。
所述数据源数据同步单元用于通过直接数据源同步、生成数据文件同步和数据库日志同步的方式完成数据同步,具体包括:
第一同步模块,用于连接业务数据库,通过预设接口去读取目标数据库的数据;第二同步模块,用于从数据源系统中生成数据文件,然后通过文件系统同步到目标数据库里;
第三同步模块,用于基于源数据库的日志文件进行同步。
所述配置单元,用于建立大数据采集规则,并进行定时任务配置。
2、大数据治理子系统,用于设定数据治理标准和数据清洗规则,并配置数据清洗规则,对清洗后的数据进行检查和验证。包括:
预处理单元,用于将数据导入预处理工具并查看元数据;
清洗单元,用于根据数据清洗规则去除或补全缺失的数据、去除或修改数据的格式和内容、去除或修改数据的逻辑错误、并去除非必要数据;
验证单元,用于根据数据的来源进行关联性验证。
3、大数据管理子系统,用于管理数据标准和元数据,并进行元数据亲缘关系配置和数据质量监控。包括:
数据标准管理单元,用于定义、维护和展现数据标准,并按照预设流程实现数据标准;
元数据管理单元,用于采集元数据,并对采集的元数据信息进行展示、查询和统计,并按照预设机制完成元数据的影响分析和亲缘分析;
数据质量监控单元,用于根据数据质量检查规则来进行计算和比对,并输出数据质量查询结果和处理结果;
补录单元,用于根据数据质量的处理结果,通过配置补录的字段、格式、检查规则,在后台系统及数据库自动产生补录界面。
其中,元数据管理单元包括:
第一分析模块,用于以元数据的任一物理表或字段为出发点,查找其下游所有层次的影响对象,并将查找结果以图形方式展示;
第二分析模块,用于以元数据的任一物理表或字段为出发点,查找其上游所有层次的对象,并将查找结果以图形方式展示。
4、大数据存储子系统,用于建立分布式、关系型存储数据库,并支持选择数据存储方式。包括:
查询单元,用于接收用户查询指令,根据预设算法对查询指令进行编译后生成查询程序,执行查询程序并生产查询结果;
监控单元,用于根据数据管理标准执行分布式计算任务,并进行元数据管理和存储节点监控;
部署单元,用于部署分布式计算任务和关系型数据库。
5、大数据资源中心子系统,用于对数据库数据进行分层维护和数据安全管理,设定并执行数据自动备份机制。包括:
数据源管理单元,用于采集预设格式和系统的数据源,并对数据源进行汇总和质量管理;
同步单元,用于将数据源同步到大数据存储子系统中对应的存储数据库中。
6、大数据安全管理子系统,用于收集和汇总子系统产生的信息数据,运用预设风险分析方法对信息数据事件进行统一加工分析,根据分析结果信息数据进行统一监控管理和未知风险预警处理。包括:
采集单元,用于收集和汇总大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统在运行过程中产生的信息数据;
扫描单元,用于扫描信息数据中是否含有预设敏感数据,若是,划定含有敏感数据的数据块,并根据预设加密算法对所述数据块进行加密;
加固单元,用于根据含有敏感数据的数据块的数据表找到所属的数据库,针对所属数据库启动访问控制引擎,向用户提供黑白名单和例外策略,并对用户登录行为、用户访问权限进行控制。
本发明采用hadoop+spark技术架构,集成kafka、solr等大数据组件,基于TensorFlow、Caffe、Torch等开源深度学习框架进行自主研发,对外提供数据检索、数据分析等服务。
本发明能够通过梳理现有共享开放数据资源、互联网数据资源,建立统一的大数据基础资源库,统一建立数据标准、数据分类,搭建高性能、高可靠的智能分析服务平台,提供大数据交易平台、金融大数据综合服务系统、政务服务门户、电商大数据系统、旅游大数据系统等分析服务,同时支持更多应用扩展。
结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。

Claims (8)

1.一种基于互联网的大数据平台,其特征在于,包括:大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统和大数据安全管理子系统;
所述大数据采集子系统,用于互联网访问进程中的日志采集和数据源数据同步;
所述大数据治理子系统,用于设定数据治理标准和数据清洗规则,并配置数据清洗规则,对清洗后的数据进行检查和验证;
所述大数据管理子系统,用于管理数据标准和元数据,并进行元数据亲缘关系配置和数据质量监控;
所述大数据存储子系统,用于建立分布式、关系型存储数据库,并支持选择数据存储方式;
所述大数据资源中心子系统,用于对数据库数据进行分层维护和数据安全管理,设定并执行数据自动备份机制;
所述大数据安全管理子系统,用于收集和汇总子系统产生的信息数据,运用预设风险分析方法对信息数据事件进行统一加工分析,根据分析结果信息数据进行统一监控管理和未知风险预警处理。
2.根据权利要求1所述的基于互联网的大数据平台,其特征在于,所述大数据采集子系统包括:日志采集单元、数据源数据同步单元和配置单元;
所述日志采集单元包括:
浏览器页面采集模块,用于收集页面的浏览日志和交互操作日志,并在页面日志收集完成后,在服务端进行预设的预处理
客户端日志采集模块,用于通过专用SDK进行客户端的数据采集,采集完成的数据与唯一ID相关联,通过预设插件进行合并,并通过SDK统一的发送;
所述数据源数据同步单元用于通过直接数据源同步、生成数据文件同步和数据库日志同步的方式完成数据同步,具体包括:
第一同步模块,用于连接业务数据库,通过预设接口去读取目标数据库的数据;
第二同步模块,用于从数据源系统中生成数据文件,然后通过文件系统同步到目标数据库里;
第三同步模块,用于基于源数据库的日志文件进行同步;
所述配置单元,用于建立大数据采集规则,并进行定时任务配置。
3.根据权利要求1所述基于互联网的大数据平台,其特征在于,所述大数据治理子系统包括:
预处理单元,用于将数据导入预处理工具并查看元数据;
清洗单元,用于根据数据清洗规则去除或补全缺失的数据、去除或修改数据的格式和内容、去除或修改数据的逻辑错误、并去除非必要数据;
验证单元,用于根据数据的来源进行关联性验证。
4.根据权利要求1所述的基于互联网的大数据平台,其特征在于,所述大数据管理子系统包括:
数据标准管理单元,用于定义、维护和展现数据标准,并按照预设流程实现数据标准;
元数据管理单元,用于采集元数据,并对采集的元数据信息进行展示、查询和统计,并按照预设机制完成元数据的影响分析和亲缘分析;
数据质量监控单元,用于根据数据质量检查规则来进行计算和比对,并输出数据质量查询结果和处理结果;
补录单元,用于根据数据质量的处理结果,通过配置补录的字段、格式、检查规则,在后台系统及数据库自动产生补录界面。
5.根据权利要求4所述的基于互联网的大数据平台,其特征在于,所述元数据管理单元包括:
第一分析模块,用于以元数据的任一物理表或字段为出发点,查找其下游所有层次的影响对象,并将查找结果以图形方式展示;
第二分析模块,用于以元数据的任一物理表或字段为出发点,查找其上游所有层次的对象,并将查找结果以图形方式展示。
6.根据权利要求1所述的基于互联网的大数据平台,其特征在于,所述大数据存储子系统包括:
查询单元,用于接收用户查询指令,根据预设算法对查询指令进行编译后生成查询程序,执行查询程序并生产查询结果;
监控单元,用于根据数据管理标准执行分布式计算任务,并进行元数据管理和存储节点监控;
部署单元,用于部署分布式计算任务和关系型数据库。
7.根据权利要求1所述的基于互联网的大数据平台,其特征在于,所述大数据资源中心子系统包括:
数据源管理单元,用于采集预设格式和系统的数据源,并对数据源进行汇总和质量管理;
同步单元,用于将数据源同步到大数据存储子系统中对应的存储数据库中。
8.根据权利要求1所述的基于互联网的大数据平台,其特征在于,所述大数据安全管理子系统包括:
采集单元,用于收集和汇总大数据采集子系统、大数据治理子系统、大数据管理子系统、大数据存储子系统、大数据资源中心子系统在运行过程中产生的信息数据;
扫描单元,用于扫描信息数据中是否含有预设敏感数据,若是,划定含有敏感数据的数据块,并根据预设加密算法对所述数据块进行加密;
加固单元,用于根据含有敏感数据的数据块的数据表找到所属的数据库,针对所属数据库启动访问控制引擎,向用户提供黑白名单和例外策略,并对用户登录行为、用户访问权限进行控制。
CN202011216201.7A 2020-11-04 2020-11-04 一种基于互联网的大数据平台系统 Active CN112306992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011216201.7A CN112306992B (zh) 2020-11-04 2020-11-04 一种基于互联网的大数据平台系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011216201.7A CN112306992B (zh) 2020-11-04 2020-11-04 一种基于互联网的大数据平台系统

Publications (2)

Publication Number Publication Date
CN112306992A true CN112306992A (zh) 2021-02-02
CN112306992B CN112306992B (zh) 2024-02-13

Family

ID=74325870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011216201.7A Active CN112306992B (zh) 2020-11-04 2020-11-04 一种基于互联网的大数据平台系统

Country Status (1)

Country Link
CN (1) CN112306992B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094385A (zh) * 2021-03-10 2021-07-09 广州中国科学院软件应用技术研究所 一种基于软件定义开放工具集的数据共享融合平台及方法
CN114066636A (zh) * 2021-11-15 2022-02-18 深圳前海鸿泰源兴科技发展有限公司 一种基于大数据的金融信息系统与操作方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法
CN106599713A (zh) * 2016-11-11 2017-04-26 中国电子科技网络信息安全有限公司 一种基于大数据的数据库脱敏系统及方法
CN107045472A (zh) * 2017-05-04 2017-08-15 武汉轻工大学 移动设备信息采集系统
CN107315776A (zh) * 2017-05-27 2017-11-03 国网安徽省电力公司信息通信分公司 一种基于云计算的数据管理系统
US20180027006A1 (en) * 2015-02-24 2018-01-25 Cloudlock, Inc. System and method for securing an enterprise computing environment
CN108647217A (zh) * 2017-12-27 2018-10-12 广东智政信息科技有限公司 基于安监应用的大数据平台集成管理系统
CN108717456A (zh) * 2018-05-22 2018-10-30 浪潮软件股份有限公司 一种数据源无关的数据全生命周期管理平台及方法
CN108769255A (zh) * 2018-06-26 2018-11-06 铭阳数通科技(西安)有限公司 企业数据的采集和治理方法
CN111125068A (zh) * 2019-11-13 2020-05-08 深圳市华傲数据技术有限公司 一种元数据治理方法和系统
CN111506660A (zh) * 2020-04-21 2020-08-07 瑞纳智能设备股份有限公司 一种热网实时数据仓系统
CN111858546A (zh) * 2020-06-22 2020-10-30 网联清算有限公司 数据处理方法、装置及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180027006A1 (en) * 2015-02-24 2018-01-25 Cloudlock, Inc. System and method for securing an enterprise computing environment
CN106529329A (zh) * 2016-10-11 2017-03-22 中国电子科技网络信息安全有限公司 一种用于大数据的脱敏系统及脱敏方法
CN106599713A (zh) * 2016-11-11 2017-04-26 中国电子科技网络信息安全有限公司 一种基于大数据的数据库脱敏系统及方法
CN107045472A (zh) * 2017-05-04 2017-08-15 武汉轻工大学 移动设备信息采集系统
CN107315776A (zh) * 2017-05-27 2017-11-03 国网安徽省电力公司信息通信分公司 一种基于云计算的数据管理系统
CN108647217A (zh) * 2017-12-27 2018-10-12 广东智政信息科技有限公司 基于安监应用的大数据平台集成管理系统
CN108717456A (zh) * 2018-05-22 2018-10-30 浪潮软件股份有限公司 一种数据源无关的数据全生命周期管理平台及方法
CN108769255A (zh) * 2018-06-26 2018-11-06 铭阳数通科技(西安)有限公司 企业数据的采集和治理方法
CN111125068A (zh) * 2019-11-13 2020-05-08 深圳市华傲数据技术有限公司 一种元数据治理方法和系统
CN111506660A (zh) * 2020-04-21 2020-08-07 瑞纳智能设备股份有限公司 一种热网实时数据仓系统
CN111858546A (zh) * 2020-06-22 2020-10-30 网联清算有限公司 数据处理方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ARCHANA R. A. ET AL.: "A Study on Big Data Privacy Protection Models using Data Masking Methods", 《INTERNATIONAL JOURNAL OF ELECTRICAL AND COMPUTER ENGINEERING 》, pages 3976 - 3983 *
吴信东 等: "数据治理技术", 《软件学报》, pages 2830 - 2856 *
江佳希: "基于Hadoop的安全态势感知系统的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 1338 - 21 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113094385A (zh) * 2021-03-10 2021-07-09 广州中国科学院软件应用技术研究所 一种基于软件定义开放工具集的数据共享融合平台及方法
CN113094385B (zh) * 2021-03-10 2024-04-30 广州中国科学院软件应用技术研究所 一种基于软件定义开放工具集的数据共享融合平台及方法
CN114066636A (zh) * 2021-11-15 2022-02-18 深圳前海鸿泰源兴科技发展有限公司 一种基于大数据的金融信息系统与操作方法

Also Published As

Publication number Publication date
CN112306992B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
Das et al. Big data analytics: A framework for unstructured data analysis
CN109582717B (zh) 一种面向电力大数据的数据库统一平台及其读取方法
CN103838847B (zh) 一种面向海云协同网络计算环境的数据组织方法
US20190050435A1 (en) Object data association index system and methods for the construction and applications thereof
CN113282611B (zh) 一种流数据同步的方法、装置、计算机设备及存储介质
CN112948492A (zh) 一种数据处理系统、方法、装置、电子设备及存储介质
CN112306992B (zh) 一种基于互联网的大数据平台系统
CN112419129A (zh) 一种构建政务服务中台体系基础架构的方法和系统
CN112559634A (zh) 一种基于计算机云计算大数据用数据管理系统
CN111538720B (zh) 电力行业基础数据清理的方法及系统
CN115934856A (zh) 一种构造综合能源数据资产的方法和系统
Wu et al. An Auxiliary Decision‐Making System for Electric Power Intelligent Customer Service Based on Hadoop
Lian Implementation of computer network user behavior forensic analysis system based on speech data system log
CN116795816A (zh) 一种基于流式处理的数仓建设方法和系统
Yu et al. Design and implementation of business access control in new generation power grid dispatching and control system
CN112667393B (zh) 分布式任务计算调度框架搭建的方法、装置及计算机设备
Zhang et al. Research on lightweight blockchain technology based on edge computing
Luo et al. [Retracted] Design of Data Classification and Classification Management System for Big Data of Hydropower Enterprises Based on Data Standards
Pan et al. An open sharing pattern design of massive power big data
Shao et al. Optimization research of information management system based on big data technology
Bojkovic et al. Mobile cloud analytics in Big data era
Li Research Review of Cloud Computing Technology Based on Big Data
Yi Key Technology Research for Unstructured Data Cloud Storage: New Exploring
CN112988736B (zh) 一种海量数据质量检核方法及其系统
CN116340691B (zh) 基于多源数据的数据资产网络化管理和共享方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant