CN109460498A - 一种数据核对方法及装置 - Google Patents

一种数据核对方法及装置 Download PDF

Info

Publication number
CN109460498A
CN109460498A CN201811315841.6A CN201811315841A CN109460498A CN 109460498 A CN109460498 A CN 109460498A CN 201811315841 A CN201811315841 A CN 201811315841A CN 109460498 A CN109460498 A CN 109460498A
Authority
CN
China
Prior art keywords
data
unit
verification
processing unit
central processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811315841.6A
Other languages
English (en)
Inventor
钟文洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiaotian Software Co Ltd
Original Assignee
Guangzhou Xiaotian Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiaotian Software Co Ltd filed Critical Guangzhou Xiaotian Software Co Ltd
Priority to CN201811315841.6A priority Critical patent/CN109460498A/zh
Publication of CN109460498A publication Critical patent/CN109460498A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据核对方法及装置,核对方法包括以下步骤:A、数据采集单元采集企业运营数据,企业运营数据包括企业成本数据、利润数据、员工考勤数据、采购数据、订单数据、交易数据,采集的数据通过数据处理单元进行处理后传输至中央处理器处理;B、中央处理器向数据聚类单元发动指令,对数据进行聚类处理;C、之后中央处理器向核对指令生产单元发送核对指令,同时,调用数据库单元中的原始数据,数据检查单元对聚类后的数据进行核对检查;D、检查到异常数据,立即发出报警信号,同时,核对后的数据发送至存储单元中存储;E、最后,核对后的数据通过通信单元发送至后台服务器。本发明采用的核对方法操作简单,成本低,核对精度高。

Description

一种数据核对方法及装置
技术领域
本发明涉及数据核对技术领域,具体为一种数据核对方法及装置。
背景技术
企业数据泛指所有与企业经营相关的信息、资料,包括公司概况、产品信息、经营数据、研究成果等,其中不乏涉及商业机密。通常所说的企业数据是指狭义的企业数据,一般只包含公司概况介绍,包括公司经营范围、联系方式、企业规模等,通常是公开的数据。企业数据的获取渠道分为集中式和分布式。集中式一般由统一的政府部门发布,如工商局数据、统计局数据,具有权威性和全面性,但数据内容比较粗略,缺乏精细度。分布式是由商业公司透过下属部门通过各种手段分散获取并统一整理,一般能使数据的精细度和准确度达到一定要求。
目前,每一次进行企业数据核对时,主要是通过数据库与需要进行核对的数据库进行相连,然后系统自动从每一个数据库中均提取出相关数据,并进行一一核对,或者采用EXCEL表进行数据自动核对,以上两种核对方式虽然不需要人工参与就能进行核对数据,但是核对精度低,而且无法实现对大量数据进行分类后核对,降低了工作效率,因此,有必要进行改进。
发明内容
本发明的目的在于提供一种数据核对方法及装置,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种数据核对方法,核对方法包括以下步骤:
A、数据采集单元采集企业运营数据,企业运营数据包括企业成本数据、利润数据、员工考勤数据、采购数据、订单数据、交易数据,采集的数据通过数据处理单元进行处理后传输至中央处理器处理;
B、中央处理器向数据聚类单元发动指令,对数据进行聚类处理;
C、之后中央处理器向核对指令生产单元发送核对指令,同时,调用数据库单元中的原始数据,数据检查单元对聚类后的数据进行核对检查;
D、检查到异常数据,立即发出报警信号,同时,核对后的数据发送至存储单元中存储;
E、最后,核对后的数据通过通信单元发送至后台服务器。
优选的,所述步骤B中数据聚类单元聚类方法如下:
a、采集待聚类数据,并将数据切割呈N个子数据集;
b、对N个子数据集进行冗余过滤,得到非冗余数据;
c、对非冗余数据采用多个计算线程进行合并计算;
d、对合并计算后的计算结果进行修正并保存;
e、最后从非冗余数据中确定相关数据,即完成对数据的聚类。
优选的,所述步骤e中具体方式为:根据随机森林算法和预设训练数据,建立随机森林模型;根据随机森林模型对非冗余数据进行判别和分类,以在非冗余数据中确定相关数据。
优选的,一种数据核对装置,包括中央处理器、数据采集单元、数据处理单元、数据检查单元、核对指令生成单元、存储单元、数据库单元、报警单元、数据聚类单元以及通信单元,所述数据采集单元通过数据处理单元连接中央处理器,所述中央处理器分别连接数据检查单元、核对指令生成单元、存储单元、数据库单元、报警单元、数据聚类单元,所述中央处理器通过通信单元连接后台服务器;其中,数据采集单元用于采集企业运营数据;数据处理单元用于对采集的数据进行降噪处理;数据检查单元用于检查采集的企业数据;核对指令生成单元用于生成数据核对指令;存储单元用于存储核对后的数据;数据库单元用于保存原始数据;报警单元用于在检查出异常时发出报警信号;数据聚类单元用于对采集的数据进行聚类处理;通信单元用于传输核对后的数据。
与现有技术相比,本发明的有益效果是:本发明采用的核对方法操作简单,成本低,核对时,先自动采集企业数据至中央处理器,中央处理器发送数据聚类指令,对采集的企业数据进行聚类处理,之后中央处理器发送核对指令后对聚类后的数据进行核对,该数据核对过程自动化程度高,通过对数据聚类后再进行核对,能够提高束核对精度;其中,本发明采用的数据聚类单元聚类方法能够降低总体计算复杂度以及提高了计算的稳定性,而且数据概况分析能力强,适于海量数据的快速聚类处理,进一步提高了数据分类的精确性,从而提高了数据核对效果,此外,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,与现有的数据核对系统相比,明显具有高精度、全自动化、海量数据处理的优点。
附图说明
图1为本发明流程;
图2为本发明装置原理框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种数据核对方法,核对方法包括以下步骤:
A、数据采集单元采集企业运营数据,企业运营数据包括企业成本数据、利润数据、员工考勤数据、采购数据、订单数据、交易数据,采集的数据通过数据处理单元进行处理后传输至中央处理器处理;
B、中央处理器向数据聚类单元发动指令,对数据进行聚类处理;
C、之后中央处理器向核对指令生产单元发送核对指令,同时,调用数据库单元中的原始数据,数据检查单元对聚类后的数据进行核对检查;
D、检查到异常数据,立即发出报警信号,同时,核对后的数据发送至存储单元中存储;
E、最后,核对后的数据通过通信单元发送至后台服务器。
本发明中,步骤B中数据聚类单元聚类方法如下:
a、采集待聚类数据,并将数据切割呈N个子数据集;
b、对N个子数据集进行冗余过滤,得到非冗余数据;
c、对非冗余数据采用多个计算线程进行合并计算;
d、对合并计算后的计算结果进行修正并保存;
e、最后从非冗余数据中确定相关数据,即完成对数据的聚类。
其中,步骤e中具体方式为:根据随机森林算法和预设训练数据,建立随机森林模型;根据随机森林模型对非冗余数据进行判别和分类,以在非冗余数据中确定相关数据。通过建立的随机森林模型对非冗余数据进行判别和分类,以确定相关数据,从而将不相关数据从非冗余数据中过滤掉,进而在对相关数据进行聚类时有效地提高了聚类的速度和准确率。
此外,本发明还公开了一种数据核对装置,包括中央处理器1、数据采集单元2、数据处理单元3、数据检查单元4、核对指令生成单元5、存储单元6、数据库单元7、报警单元8、数据聚类单元9以及通信单元10;所述数据采集单元2通过数据处理单元3连接中央处理器1,所述中央处理器1分别连接数据检查单元4、核对指令生成单元5、存储单元6、数据库单元7、报警单元8、数据聚类单元9,所述中央处理器1通过通信单元10连接后台服务器11;其中,数据采集单元2用于采集企业运营数据;数据处理单元3用于对采集的数据进行降噪处理;数据检查单元4用于检查采集的企业数据;核对指令生成单元5用于生成数据核对指令;存储单元6用于存储核对后的数据;数据库单元7用于保存原始数据;报警单元8用于在检查出异常时发出报警信号;数据聚类单元9用于对采集的数据进行聚类处理;通信单元10用于传输核对后的数据。
本发明采用的核对方法操作简单,成本低,核对时,先自动采集企业数据至中央处理器,中央处理器发送数据聚类指令,对采集的企业数据进行聚类处理,之后中央处理器发送核对指令后对聚类后的数据进行核对,该数据核对过程自动化程度高,通过对数据聚类后再进行核对,能够提高束核对精度;其中,本发明采用的数据聚类单元聚类方法能够降低总体计算复杂度以及提高了计算的稳定性,而且数据概况分析能力强,适于海量数据的快速聚类处理,进一步提高了数据分类的精确性,从而提高了数据核对效果,此外,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,与现有的数据核对系统相比,明显具有高精度、全自动化、海量数据处理的优点。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种数据核对方法,其特征在于:核对方法包括以下步骤:
A、数据采集单元采集企业运营数据,企业运营数据包括企业成本数据、利润数据、员工考勤数据、采购数据、订单数据、交易数据,采集的数据通过数据处理单元进行处理后传输至中央处理器处理;
B、中央处理器向数据聚类单元发动指令,对数据进行聚类处理;
C、之后中央处理器向核对指令生产单元发送核对指令,同时,调用数据库单元中的原始数据,数据检查单元对聚类后的数据进行核对检查;
D、检查到异常数据,立即发出报警信号,同时,核对后的数据发送至存储单元中存储;
E、最后,核对后的数据通过通信单元发送至后台服务器。
2.根据权利要求1所述的一种数据核对方法,其特征在于:所述步骤B中数据聚类单元聚类方法如下:
a、采集待聚类数据,并将数据切割呈N个子数据集;
b、对N个子数据集进行冗余过滤,得到非冗余数据;
c、对非冗余数据采用多个计算线程进行合并计算;
d、对合并计算后的计算结果进行修正并保存;
e、最后从非冗余数据中确定相关数据,即完成对数据的聚类。
3.根据权利要求2所述的一种数据核对方法,其特征在于:所述步骤e中具体方式为:根据随机森林算法和预设训练数据,建立随机森林模型;根据随机森林模型对非冗余数据进行判别和分类,以在非冗余数据中确定相关数据。
4.一种数据核对装置,其特征在于:包括中央处理器(1)、数据采集单元(2)、数据处理单元(3)、数据检查单元(4)、核对指令生成单元(5)、存储单元(6)、数据库单元(7)、报警单元(8)、数据聚类单元(9)以及通信单元(10);所述数据采集单元(2)通过数据处理单元(3)连接中央处理器(1),所述中央处理器(1)分别连接数据检查单元(4)、核对指令生成单元(5)、存储单元(6)、数据库单元(7)、报警单元(8)、数据聚类单元(9),所述中央处理器(1)通过通信单元(10)连接后台服务器(11),其中,数据采集单元(2)用于采集企业运营数据;数据处理单元(3)用于对采集的数据进行降噪处理;数据检查单元(4)用于检查采集的企业数据;核对指令生成单元(5)用于生成数据核对指令;存储单元(6)用于存储核对后的数据;数据库单元(7)用于保存原始数据;报警单元(8)用于在检查出异常时发出报警信号;数据聚类单元(9)用于对采集的数据进行聚类处理;通信单元(10)用于传输核对后的数据。
CN201811315841.6A 2018-11-07 2018-11-07 一种数据核对方法及装置 Withdrawn CN109460498A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811315841.6A CN109460498A (zh) 2018-11-07 2018-11-07 一种数据核对方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811315841.6A CN109460498A (zh) 2018-11-07 2018-11-07 一种数据核对方法及装置

Publications (1)

Publication Number Publication Date
CN109460498A true CN109460498A (zh) 2019-03-12

Family

ID=65609521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811315841.6A Withdrawn CN109460498A (zh) 2018-11-07 2018-11-07 一种数据核对方法及装置

Country Status (1)

Country Link
CN (1) CN109460498A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303467A (zh) * 2015-11-18 2016-02-03 国网山东省电力公司济宁供电公司 保持电力营销系统与配电系统数据一致性的方法及其系统
CN105488235A (zh) * 2016-02-03 2016-04-13 苏州见微物联网科技有限公司 一种基于工业大数据的云平台数据管理系统及其构建方法
CN106022640A (zh) * 2016-06-01 2016-10-12 国家电网公司 电量指数核对系统及方法
CN106371975A (zh) * 2016-08-31 2017-02-01 国信优易数据有限公司 一种运维自动化预警方法和系统
WO2018179065A1 (ja) * 2017-03-27 2018-10-04 株式会社日立製作所 データ分析装置およびデータ分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303467A (zh) * 2015-11-18 2016-02-03 国网山东省电力公司济宁供电公司 保持电力营销系统与配电系统数据一致性的方法及其系统
CN105488235A (zh) * 2016-02-03 2016-04-13 苏州见微物联网科技有限公司 一种基于工业大数据的云平台数据管理系统及其构建方法
CN106022640A (zh) * 2016-06-01 2016-10-12 国家电网公司 电量指数核对系统及方法
CN106371975A (zh) * 2016-08-31 2017-02-01 国信优易数据有限公司 一种运维自动化预警方法和系统
WO2018179065A1 (ja) * 2017-03-27 2018-10-04 株式会社日立製作所 データ分析装置およびデータ分析方法

Similar Documents

Publication Publication Date Title
CN105446991B (zh) 数据存储方法、查询方法及设备
CN112395325A (zh) 一种数据治理方法、系统、终端设备及存储介质
DE60210477T2 (de) Gemeinsam-benutzte datenverarbeitung für prozesssteuerungssysteme
CN110008201A (zh) 一种面向大数据的数据质量稽核监控方法
CN103345209B (zh) 生产监控方法及系统
CN103714479A (zh) 银行个人业务欺诈行为实时智能化集中监控的方法和系统
CN107330080A (zh) 一种数据处理方法、装置及应用其的计算机设备
CN106327055A (zh) 一种基于大数据技术的电力费控方法及系统
CN109039710A (zh) 路由数据稽核方法、装置、服务器及存储介质
CN115328975B (zh) 基于工业日常巡查的巡查数据上传系统及方法
CN103310375A (zh) 智慧天网行为审计分析系统
CN107577748A (zh) 基于大数据的建筑行业信息采集系统及其方法
CN114880405A (zh) 一种基于数据湖的数据处理方法及系统
CN115730909A (zh) 一种企业客户信息管理系统
CN112383630A (zh) 一种基于生产线切面的分布式可插拔工序数据上报系统
CN106951360B (zh) 数据统计完整度计算方法和系统
CN115760024A (zh) 基于bim的智慧建造管控平台
CN109460498A (zh) 一种数据核对方法及装置
CN105117435A (zh) 一种动态数据一致性比对方法及系统
CN109658318A (zh) 一种基于铁路信号监测的施工自动盯控系统及方法
CN112559511B (zh) 一种存款系统历史数据清理方法和系统
EP3954593A1 (en) Multi-layer coupling relationship-based method for identifying train operation deviation propagation conditions
CN109993840A (zh) 针对铁路自动售检票设备监控状态的大数据分析系统
CN114140241A (zh) 一种交易监控指标的异常识别方法及装置
CN110910008A (zh) 可视化核算流程的一键成本核算管理系统及管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190312

WW01 Invention patent application withdrawn after publication