CN105095473A - 一种对差异数据进行分析的方法及系统 - Google Patents
一种对差异数据进行分析的方法及系统 Download PDFInfo
- Publication number
- CN105095473A CN105095473A CN201510490417.5A CN201510490417A CN105095473A CN 105095473 A CN105095473 A CN 105095473A CN 201510490417 A CN201510490417 A CN 201510490417A CN 105095473 A CN105095473 A CN 105095473A
- Authority
- CN
- China
- Prior art keywords
- data
- variance
- analyzed
- analysis
- variance data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种对差异数据进行分析的方法及系统,包括以下步骤:将现有数据和历史数据进行对比,得到差异数据;获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。本发明可以灵活配置需要监控的数据,是对异常数据统一分析及管理的一次有益尝试。
Description
技术领域
本发明涉及计算机领域,特别涉及一种对差异数据进行分析的方法及系统。
背景技术
我们一直缺少对差异数据的分析,希望可以建立统一的方法对差异数据进行分析,达到辅助客户进行快速定位问题。
现有技术中缺少对差异数据进行分析,手工数据提取的复杂度很高,数据分析难以自动化,并且难以形成完整的差异化报告,用户难以进行数据治理及指导系统建设及数据运营等。
发明内容
本发明所要解决的技术问题是提供一种能够自动对数据差异进行分析并得到形成差异的影响因素的对差异数据进行分析的方法及系统。
本发明解决上述技术问题的技术方案如下:一种对差异数据进行分析的方法,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
本发明的有益效果是:本发明通过对差异数据进行分析,减少手工数据提取的复杂度,提供数据分析的自动化,最终形成差异化报告,指导客户进行数据治理及指导系统建设及数据运营等。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
进一步,所述分析时间和分析维度用于限定需要分析的数据范围。
进一步,还包括根据差异因素生成评论和注释。
进一步,还包括显示差异因素。
进一步,一种对差异数据进行分析的系统,包括对比模块、获取模块和分析排序模块;
所述对比模块,用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块,用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块,用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
进一步,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
进一步,所述分析时间和分析维度用于限定需要分析的数据范围。
进一步,还包括生成模块,用于根据差异因素生成评论和注释。
进一步,还包括显示模块,用于显示差异因素。
附图说明
图1为本发明方法步骤流程图;
图2为本发明系统结构图。
附图中,各标号所代表的部件列表如下:
1、对比模块,2、获取模块,3、分析排序模块,4、生成模块,5、显示模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1
如图1所示,一种对差异数据进行分析的方法,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
所述分析时间和分析维度用于限定需要分析的数据范围。
还包括根据差异因素生成评论和注释。
还包括显示差异因素。
如图2所示,一种对差异数据进行分析的系统,包括对比模块1、获取模块2和分析排序模块3;
所述对比模块1,用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块2,用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块3,用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
所述分析时间和分析维度用于限定需要分析的数据范围。
还包括生成模块4,用于根据差异因素生成评论和注释。
还包括显示模块5,用于显示差异因素。
在具体实施中,1.1选择分析的指标。
用户选择需要分析的指标,该指标选择一般是同比或环比差异比较大的指标,比如选择实际收入指标。
1.2设置时间和维度。
选择需要设置的时间和维度,维度包括地域,品牌,渠道类型等,选择时间和维度来限定需要分析的数据范围。
1.3数据集中处理。
根据设定的处理方式对数据进行处理,比如找出影响收入的比较大的区域;找出影响排名前5名的产品;找出影响收入的特殊用户类别变化情况;是否是节假日等特殊情况。
1.4添加评论与注释。
根据数据集中处理的结果,给出经验性的结论,比如因为暂停用户同比较多导致收入减少等,在数据集中处理下方的输入框中添加结论和注释。
其中1.3步骤通过SQL进行实现。
1.3数据集中处理步骤包括:
a.根据历史数据分析及经验设置影响指标相关度比较大的维度
b.根据维度分别通过SQL语句进行算法实现,实现了分类别显示各种影响数据差异比较大的因素情况,比如区域变化大的,产品变化大的,用户类别变化大的等,并最终获取影响该指标的分析,分析的结果是找出差异的原因,通过分析结果可以推导出数据差异的原因。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种对差异数据进行分析的方法,其特征在于,包括以下步骤:
将现有数据和历史数据进行对比,得到差异数据;
获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
2.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
3.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,所述分析时间和分析维度用于限定需要分析的数据范围。
4.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,还包括根据差异因素生成评论和注释。
5.根据权利要求1所述的对差异数据进行分析的方法,其特征在于,还包括显示差异因素。
6.一种对差异数据进行分析的系统,其特征在于,包括对比模块(1)、获取模块(2)和分析排序模块(3);
所述对比模块(1),用于将现有数据和历史数据进行对比,得到差异数据;
所述获取模块(2),用于获取用户选择的差异数据中待分析的差异数据、分析时间和分析维度;
所述分析排序模块(3),用于根据分析时间和分析维度对待分析的差异数据进行分析排序,得到影响现有数据相对历史数据变化的差异因素。
7.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,所述待分析的差异数据为现有数据中同比或环比差异超过预设阈值的部分现有数据。
8.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,所述分析时间和分析维度用于限定需要分析的数据范围。
9.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,还包括生成模块(4),用于根据差异因素生成评论和注释。
10.根据权利要求6所述的对差异数据进行分析的系统,其特征在于,还包括显示模块(5),用于显示差异因素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510490417.5A CN105095473B (zh) | 2015-08-11 | 2015-08-11 | 一种对差异数据进行分析的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510490417.5A CN105095473B (zh) | 2015-08-11 | 2015-08-11 | 一种对差异数据进行分析的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105095473A true CN105095473A (zh) | 2015-11-25 |
CN105095473B CN105095473B (zh) | 2018-12-18 |
Family
ID=54575909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510490417.5A Active CN105095473B (zh) | 2015-08-11 | 2015-08-11 | 一种对差异数据进行分析的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105095473B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909497A (zh) * | 2015-12-22 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 测试方法和装置 |
CN106971002A (zh) * | 2017-04-18 | 2017-07-21 | 北京思特奇信息技术股份有限公司 | 一种数据稽核方法和系统 |
CN107908155A (zh) * | 2017-10-19 | 2018-04-13 | 郑州力通水务有限公司 | 智慧水务管理分析系统 |
CN108572995A (zh) * | 2017-03-14 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及电子设备 |
CN108614811A (zh) * | 2016-12-09 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法及装置 |
CN109002261A (zh) * | 2018-07-11 | 2018-12-14 | 佛山市云端容灾信息技术有限公司 | 差异区块大数据分析方法、装置、存储介质及服务器 |
CN109033104A (zh) * | 2017-06-09 | 2018-12-18 | 微软技术许可有限责任公司 | 对多维数据集之间的差异的自动分析 |
CN110807589A (zh) * | 2019-10-31 | 2020-02-18 | 广东电网有限责任公司 | 一种电力现货市场的案例分析系统 |
CN115858895A (zh) * | 2023-02-21 | 2023-03-28 | 山东优嘉环境科技有限公司 | 一种用于智慧城市的多源异构数据处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101546320A (zh) * | 2008-03-27 | 2009-09-30 | 林兆祥 | 一种基于滑动窗口的数据差异分析方法 |
US20140280073A1 (en) * | 2013-03-15 | 2014-09-18 | Futrixip Limited | Method and system for event based analysis |
CN104636970A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品差异监控企业逃税的方法及其系统 |
CN104731814A (zh) * | 2013-12-23 | 2015-06-24 | 北京宸瑞科技有限公司 | 数据灵活比对分析系统及方法 |
-
2015
- 2015-08-11 CN CN201510490417.5A patent/CN105095473B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101546320A (zh) * | 2008-03-27 | 2009-09-30 | 林兆祥 | 一种基于滑动窗口的数据差异分析方法 |
US20140280073A1 (en) * | 2013-03-15 | 2014-09-18 | Futrixip Limited | Method and system for event based analysis |
CN104636970A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品差异监控企业逃税的方法及其系统 |
CN104731814A (zh) * | 2013-12-23 | 2015-06-24 | 北京宸瑞科技有限公司 | 数据灵活比对分析系统及方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106909497B (zh) * | 2015-12-22 | 2021-01-19 | 阿里巴巴集团控股有限公司 | 测试方法和装置 |
CN106909497A (zh) * | 2015-12-22 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 测试方法和装置 |
CN108614811A (zh) * | 2016-12-09 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种数据分析方法及装置 |
CN108614811B (zh) * | 2016-12-09 | 2021-11-05 | 腾讯科技(深圳)有限公司 | 一种数据分析方法及装置 |
CN108572995A (zh) * | 2017-03-14 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种数据处理方法、装置及电子设备 |
CN106971002A (zh) * | 2017-04-18 | 2017-07-21 | 北京思特奇信息技术股份有限公司 | 一种数据稽核方法和系统 |
CN109033104A (zh) * | 2017-06-09 | 2018-12-18 | 微软技术许可有限责任公司 | 对多维数据集之间的差异的自动分析 |
US11308134B2 (en) | 2017-06-09 | 2022-04-19 | Microsoft Technology Licensing, Llc | Automatic analysis of difference between multi-dimensional datasets |
CN107908155A (zh) * | 2017-10-19 | 2018-04-13 | 郑州力通水务有限公司 | 智慧水务管理分析系统 |
CN109002261A (zh) * | 2018-07-11 | 2018-12-14 | 佛山市云端容灾信息技术有限公司 | 差异区块大数据分析方法、装置、存储介质及服务器 |
CN109002261B (zh) * | 2018-07-11 | 2022-03-22 | 佛山市云端容灾信息技术有限公司 | 差异区块大数据分析方法、装置、存储介质及服务器 |
CN110807589A (zh) * | 2019-10-31 | 2020-02-18 | 广东电网有限责任公司 | 一种电力现货市场的案例分析系统 |
CN115858895A (zh) * | 2023-02-21 | 2023-03-28 | 山东优嘉环境科技有限公司 | 一种用于智慧城市的多源异构数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN105095473B (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105095473A (zh) | 一种对差异数据进行分析的方法及系统 | |
CN105160038B (zh) | 一种基于审计知识库的数据分析方法及系统 | |
CN105303469A (zh) | 线损异常原因数据挖掘分析的方法与系统 | |
EP3206146A1 (en) | Data information processing method and device | |
CN110750650A (zh) | 企业知识图谱的构建方法及装置 | |
CN105447090A (zh) | 一种自动化数据挖掘预处理方法 | |
CN103227734A (zh) | 一种OpenStack云平台异常的检测方法 | |
CN103903086A (zh) | 一种基于业务模型驱动的管理信息系统开发方法及系统 | |
CN105354697A (zh) | 一种基于财务科目规则库的自动在线审计方法及系统 | |
CN104484410A (zh) | 应用于大数据系统的数据融合方法及系统 | |
CN104133857A (zh) | 一种基于配置约束的业务流程模型挖掘的新方法 | |
CN104484412A (zh) | 基于多形式处理的大数据分析系统 | |
CN105183742A (zh) | 一种简历识别方法 | |
CN105138650A (zh) | 一种基于孤立点挖掘的Hadoop数据清洗方法及系统 | |
CN104850577A (zh) | 一种基于有序复合树结构的数据流最大频繁项集挖掘方法 | |
CN113098888A (zh) | 异常行为预测方法、装置、设备及存储介质 | |
CN103336765B (zh) | 一种文本关键词的马尔可夫矩阵离线修正方法 | |
CN102662962B (zh) | 一种基于网页元素的动态展示方法 | |
CN107301593A (zh) | 一种财务信息系统 | |
CN104834730A (zh) | 数据分析系统和方法 | |
CN103473305A (zh) | 一种在统计分析中进行决策流程展示的方法及系统 | |
CN110427410B (zh) | 一种基于表单组件实现数据统计的方法及系统 | |
CN105069044A (zh) | 基于拟间接依赖的过程模型挖掘的新方法 | |
CN105843961B (zh) | 一种流程与后台数据分离的信息化系统数据库架构方法 | |
CN111125082B (zh) | 基于关联规则挖掘的水泥工艺参数数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |