CN105095473A - 一种对差异数据进行分析的方法及系统 - Google Patents

一种对差异数据进行分析的方法及系统 Download PDF

Info

Publication number
CN105095473A
CN105095473A CN201510490417.5A CN201510490417A CN105095473A CN 105095473 A CN105095473 A CN 105095473A CN 201510490417 A CN201510490417 A CN 201510490417A CN 105095473 A CN105095473 A CN 105095473A
Authority
CN
China
Prior art keywords
data
variance
analyzed
analysis
variance data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510490417.5A
Other languages
English (en)
Other versions
CN105095473B (zh
Inventor
崔伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Si Tech Information Technology Co Ltd
Original Assignee
Beijing Si Tech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Si Tech Information Technology Co Ltd filed Critical Beijing Si Tech Information Technology Co Ltd
Priority to CN201510490417.5A priority Critical patent/CN105095473B/zh
Publication of CN105095473A publication Critical patent/CN105095473A/zh
Application granted granted Critical
Publication of CN105095473B publication Critical patent/CN105095473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种对差异数据进行分析的方法及系统,包括以下步骤:将现有数据和历史数据进行对比,得到差异数据;获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。本发明可以灵活配置需要监控的数据,是对异常数据统一分析及管理的一次有益尝试。

Description

一种对差异数据进行分析的方法及系统
技术领域
本发明涉及计算机领域,特别涉及一种对差异数据进行分析的方法及系统。
背景技术
我们一直缺少对差异数据的分析,希望可以建立统一的方法对差异数据进行分析,达到辅助客户进行快速定位问题。
现有技术中缺少对差异数据进行分析,手工数据提取的复杂度很高,数据分析难以自动化,并且难以形成完整的差异化报告,用户难以进行数据治理及指导系统建设及数据运营等。
发明内容
本发明所要解决的技术问题是提供一种能够自动对数据差异进行分析并得到形成差异的影响因素的对差异数据进行分析的方法及系统。
本发明解决上述技术问题的技术方案如下:一种对差异数据进行分析的方法,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
本发明的有益效果是:本发明通过对差异数据进行分析,减少手工数据提取的复杂度,提供数据分析的自动化,最终形成差异化报告,指导客户进行数据治理及指导系统建设及数据运营等。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
进一步,所述分析时间和分析维度用于限定需要分析的数据范围。
进一步,还包括根据差异因素生成评论和注释。
进一步,还包括显示差异因素。
进一步,一种对差异数据进行分析的系统,包括对比模块、获取模块和分析排序模块;
所述对比模块,用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块,用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块,用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
进一步,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
进一步,所述分析时间和分析维度用于限定需要分析的数据范围。
进一步,还包括生成模块,用于根据差异因素生成评论和注释。
进一步,还包括显示模块,用于显示差异因素。
附图说明
图1为本发明方法步骤流程图;
图2为本发明系统结构图。
附图中,各标号所代表的部件列表如下:
1、对比模块,2、获取模块,3、分析排序模块,4、生成模块,5、显示模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1
如图1所示,一种对差异数据进行分析的方法,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
所述分析时间和分析维度用于限定需要分析的数据范围。
还包括根据差异因素生成评论和注释。
还包括显示差异因素。
如图2所示,一种对差异数据进行分析的系统,包括对比模块1、获取模块2和分析排序模块3;
所述对比模块1,用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块2,用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块3,用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
所述分析时间和分析维度用于限定需要分析的数据范围。
还包括生成模块4,用于根据差异因素生成评论和注释。
还包括显示模块5,用于显示差异因素。
在具体实施中,1.1选择分析的指标。
用户选择需要分析的指标,该指标选择一般是同比或环比差异比较大的指标,比如选择实际收入指标。
1.2设置时间和维度。
选择需要设置的时间和维度,维度包括地域,品牌,渠道类型等,选择时间和维度来限定需要分析的数据范围。
1.3数据集中处理。
根据设定的处理方式对数据进行处理,比如找出影响收入的比较大的区域;找出影响排名前5名的产品;找出影响收入的特殊用户类别变化情况;是否是节假日等特殊情况。
1.4添加评论与注释。
根据数据集中处理的结果,给出经验性的结论,比如因为暂停用户同比较多导致收入减少等,在数据集中处理下方的输入框中添加结论和注释。
其中1.3步骤通过SQL进行实现。
1.3数据集中处理步骤包括:
a.根据历史数据分析及经验设置影响指标相关度比较大的维度
b.根据维度分别通过SQL语句进行算法实现,实现了分类别显示各种影响数据差异比较大的因素情况,比如区域变化大的,产品变化大的,用户类别变化大的等,并最终获取影响该指标的分析,分析的结果是找出差异的原因,通过分析结果可以推导出数据差异的原因。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种对差异数据进行分析的方法,其特征在于,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
2.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
3.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,所述分析时间和分析维度用于限定需要分析的数据范围。
4.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,还包括根据差异因素生成评论和注释。
5.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,还包括显示差异因素。
6.一种对差异数据进行分析的系统,其特征在于,包括对比模块(1)、获取模块(2)和分析排序模块(3);
所述对比模块(1),用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块(2),用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块(3),用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
7.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
8.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,所述分析时间和分析维度用于限定需要分析的数据范围。
9.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,还包括生成模块(4),用于根据差异因素生成评论和注释。
10.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,还包括显示模块(5),用于显示差异因素。
CN201510490417.5A 2015-08-11 2015-08-11 一种对差异数据进行分析的方法及系统 Active CN105095473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510490417.5A CN105095473B (zh) 2015-08-11 2015-08-11 一种对差异数据进行分析的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510490417.5A CN105095473B (zh) 2015-08-11 2015-08-11 一种对差异数据进行分析的方法及系统

Publications (2)

Publication Number Publication Date
CN105095473A true CN105095473A (zh) 2015-11-25
CN105095473B CN105095473B (zh) 2018-12-18

Family

ID=54575909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510490417.5A Active CN105095473B (zh) 2015-08-11 2015-08-11 一种对差异数据进行分析的方法及系统

Country Status (1)

Country Link
CN (1) CN105095473B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909497A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 测试方法和装置
CN106971002A (zh) * 2017-04-18 2017-07-21 北京思特奇信息技术股份有限公司 一种数据稽核方法和系统
CN107908155A (zh) * 2017-10-19 2018-04-13 郑州力通水务有限公司 智慧水务管理分析系统
CN108572995A (zh) * 2017-03-14 2018-09-25 阿里巴巴集团控股有限公司 一种数据处理方法、装置及电子设备
CN108614811A (zh) * 2016-12-09 2018-10-02 腾讯科技(深圳)有限公司 一种数据分析方法及装置
CN109002261A (zh) * 2018-07-11 2018-12-14 佛山市云端容灾信息技术有限公司 差异区块大数据分析方法、装置、存储介质及服务器
CN109033104A (zh) * 2017-06-09 2018-12-18 微软技术许可有限责任公司 对多维数据集之间的差异的自动分析
CN110807589A (zh) * 2019-10-31 2020-02-18 广东电网有限责任公司 一种电力现货市场的案例分析系统
CN115858895A (zh) * 2023-02-21 2023-03-28 山东优嘉环境科技有限公司 一种用于智慧城市的多源异构数据处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546320A (zh) * 2008-03-27 2009-09-30 林兆祥 一种基于滑动窗口的数据差异分析方法
US20140280073A1 (en) * 2013-03-15 2014-09-18 Futrixip Limited Method and system for event based analysis
CN104636970A (zh) * 2013-11-06 2015-05-20 航天信息股份有限公司 一种通过商品差异监控企业逃税的方法及其系统
CN104731814A (zh) * 2013-12-23 2015-06-24 北京宸瑞科技有限公司 数据灵活比对分析系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546320A (zh) * 2008-03-27 2009-09-30 林兆祥 一种基于滑动窗口的数据差异分析方法
US20140280073A1 (en) * 2013-03-15 2014-09-18 Futrixip Limited Method and system for event based analysis
CN104636970A (zh) * 2013-11-06 2015-05-20 航天信息股份有限公司 一种通过商品差异监控企业逃税的方法及其系统
CN104731814A (zh) * 2013-12-23 2015-06-24 北京宸瑞科技有限公司 数据灵活比对分析系统及方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909497B (zh) * 2015-12-22 2021-01-19 阿里巴巴集团控股有限公司 测试方法和装置
CN106909497A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 测试方法和装置
CN108614811A (zh) * 2016-12-09 2018-10-02 腾讯科技(深圳)有限公司 一种数据分析方法及装置
CN108614811B (zh) * 2016-12-09 2021-11-05 腾讯科技(深圳)有限公司 一种数据分析方法及装置
CN108572995A (zh) * 2017-03-14 2018-09-25 阿里巴巴集团控股有限公司 一种数据处理方法、装置及电子设备
CN106971002A (zh) * 2017-04-18 2017-07-21 北京思特奇信息技术股份有限公司 一种数据稽核方法和系统
CN109033104A (zh) * 2017-06-09 2018-12-18 微软技术许可有限责任公司 对多维数据集之间的差异的自动分析
US11308134B2 (en) 2017-06-09 2022-04-19 Microsoft Technology Licensing, Llc Automatic analysis of difference between multi-dimensional datasets
CN107908155A (zh) * 2017-10-19 2018-04-13 郑州力通水务有限公司 智慧水务管理分析系统
CN109002261A (zh) * 2018-07-11 2018-12-14 佛山市云端容灾信息技术有限公司 差异区块大数据分析方法、装置、存储介质及服务器
CN109002261B (zh) * 2018-07-11 2022-03-22 佛山市云端容灾信息技术有限公司 差异区块大数据分析方法、装置、存储介质及服务器
CN110807589A (zh) * 2019-10-31 2020-02-18 广东电网有限责任公司 一种电力现货市场的案例分析系统
CN115858895A (zh) * 2023-02-21 2023-03-28 山东优嘉环境科技有限公司 一种用于智慧城市的多源异构数据处理方法及系统

Also Published As

Publication number Publication date
CN105095473B (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN105095473A (zh) 一种对差异数据进行分析的方法及系统
CN105160038B (zh) 一种基于审计知识库的数据分析方法及系统
CN105303469A (zh) 线损异常原因数据挖掘分析的方法与系统
EP3206146A1 (en) Data information processing method and device
CN110750650A (zh) 企业知识图谱的构建方法及装置
CN105447090A (zh) 一种自动化数据挖掘预处理方法
CN103227734A (zh) 一种OpenStack云平台异常的检测方法
CN103903086A (zh) 一种基于业务模型驱动的管理信息系统开发方法及系统
CN105354697A (zh) 一种基于财务科目规则库的自动在线审计方法及系统
CN104484410A (zh) 应用于大数据系统的数据融合方法及系统
CN104133857A (zh) 一种基于配置约束的业务流程模型挖掘的新方法
CN104484412A (zh) 基于多形式处理的大数据分析系统
CN105183742A (zh) 一种简历识别方法
CN105138650A (zh) 一种基于孤立点挖掘的Hadoop数据清洗方法及系统
CN104850577A (zh) 一种基于有序复合树结构的数据流最大频繁项集挖掘方法
CN113098888A (zh) 异常行为预测方法、装置、设备及存储介质
CN103336765B (zh) 一种文本关键词的马尔可夫矩阵离线修正方法
CN102662962B (zh) 一种基于网页元素的动态展示方法
CN107301593A (zh) 一种财务信息系统
CN104834730A (zh) 数据分析系统和方法
CN103473305A (zh) 一种在统计分析中进行决策流程展示的方法及系统
CN110427410B (zh) 一种基于表单组件实现数据统计的方法及系统
CN105069044A (zh) 基于拟间接依赖的过程模型挖掘的新方法
CN105843961B (zh) 一种流程与后台数据分离的信息化系统数据库架构方法
CN111125082B (zh) 基于关联规则挖掘的水泥工艺参数数据分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant