CN106909691A - 一种基于缓存的高效税收数据分析方法 - Google Patents

一种基于缓存的高效税收数据分析方法 Download PDF

Info

Publication number
CN106909691A
CN106909691A CN201710138675.6A CN201710138675A CN106909691A CN 106909691 A CN106909691 A CN 106909691A CN 201710138675 A CN201710138675 A CN 201710138675A CN 106909691 A CN106909691 A CN 106909691A
Authority
CN
China
Prior art keywords
data
revenue
analysis
tax
detailed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710138675.6A
Other languages
English (en)
Inventor
张永震
邹建军
杨培强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Business System Co Ltd
Original Assignee
Shandong Inspur Business System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Business System Co Ltd filed Critical Shandong Inspur Business System Co Ltd
Priority to CN201710138675.6A priority Critical patent/CN106909691A/zh
Publication of CN106909691A publication Critical patent/CN106909691A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/10Tax strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于缓存的高效税收数据分析方法,所述方法在大量税收明细数据的基础上,通过关联分析挖掘出有价值的明细数据;建立“税收数据立方体”,通过联机在线处理技术对明细数据进行多维度的深度处理,将原始明细数据转化为用户所理解的、并真实反映税收多维特性的汇总数据。本发明方法通过对大量的税收明细数据进行关联分析,将不合理和不符合规则的税收数据剔除,保留正确的有价值的税收数据,进而支持决策的正确性,建立“税收数据立方体”,从多个维度对税收数据进行处理,可以发现不同的税务特性,支持决策的全面性,设置调度任务及时对分析数据进行更新,可以在充分利用资源的基础上,用空间换取时间,大大提高分析效率。

Description

一种基于缓存的高效税收数据分析方法
技术领域
本发明涉及税收数据挖掘和分析技术领域,具体涉及一种基于缓存的高效税收数据分析方法。
背景技术
随着“金税三期”第一阶段完成后,积累了大量的税收明细数据,目前单纯的查询或操纵一张关系表中的一条或几条记录已不能满足用户的需求,如何充分利用这些明细数据更好的支持决策成为了亟待解决的问题。
本发明基于缓存的高效税收数据分析方法,通过建立“税收数据立方体”对多张税收表中千万条记录的数据进行数据分析和信息综合,将原始税收明细数据转化为用户所理解的、并真实反映税收多维特性的汇总数据,从而使用户对基于大量复杂税收数据的分析变得轻松而高效,以利于迅速做出正确判断。通过缓存技术将分析数据进行短暂保存,在不影响准确性的基础上,大大提高了分析效率。
发明内容
本发明要解决的技术问题是:本发明针对以上问题,提供一种基于缓存的高效税收数据分析方法。
本发明所采用的技术方案为:
一种基于缓存的高效税收数据分析方法,所述方法在大量税收明细数据的基础上,通过关联分析挖掘出有价值的明细数据;建立“税收数据立方体”,通过联机在线处理(OLAP)技术对明细数据进行多维度的深度处理,将原始明细数据转化为用户所理解的、并真实反映税收多维特性的汇总数据,以便决策人员了解真实状况,做出正确的决策。
所述方法通过缓存技术,将分析的税收规律数据进行短暂保存,在不影响准确性的基础上,大大提高了分析效率,提高处理速度。因税收数据具有稳定性和规律性,部分税收分析数据可以放到缓存中,避免每次分析都需要重新对税收数据进行处理,大大加快了分析效率,税收分析数据将在汇总库中固化,用于风险管理和政策评估。
所述方法通过将税收分析数据固化,为其他分析的使用提供数据支持。
所述方法实现步骤如下:
1)数据源配置,利用Druid技术通过用户名和密码连接需要分析的任意税收数据明细仓库,并需要分析的明细表的元数据导入分析平台;
2)建立税务模型,通过拖拽化的方式,构建表间关系,依据用户需求按照业务规则对税收明细数据进行数据清洗、关联挖掘,获得有价值的明细税收数据;
3)建立税收数据立方体,依照设置的维度和指标,利用OLAP技术对明细税务数据立体化处理,使决策人员可以在不同的角度发现税收明细数据的不同特性;
4)利用缓存技术,将税收分析数据进行短暂保存,大大提升查询处理效率;
5)通过报表对税收指标项进行灵活的展示;
6)保存分析税收数据到汇总库,设置调度任务,及时更新分析数据。通过设置调度任务及时对分析数据进行更新,可以在充分利用资源的基础上,用空间换取时间,大大提高分析效率。
其中:
Druid是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。
联机分析处理 (OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。
数据立方体是一类多维矩阵,让用户从多个角度探索和分析数据集,通常是一次同时考虑三个因素(维度)。
本发明的有益效果为:
本发明方法通过对大量的税收明细数据进行关联分析,将不合理和不符合规则的税收数据剔除,保留正确的有价值的税收数据,进而支持决策的正确性,建立“税收数据立方体”,从多个维度对税收数据进行处理,可以发现不同的税务特性,支持决策的全面性,因税收数据具有稳定性和规律性,部分税收分析数据可以放到缓存中,避免每次分析都需要重新对税收数据进行处理,大大加快了分析效率,税收分析数据将在汇总库中固化,用于风险管理和政策评估。设置调度任务及时对分析数据进行更新,可以在充分利用资源的基础上,用空间换取时间,大大提高分析效率。
具体实施方式
下面结合具体实施方式对本发明进一步说明:
一种基于缓存的高效数据分析方法,第一步设置数据源,用户选择数据库的类型和输入数据库的用户名和密码就可以连接需要分析的数据明细库,添加完成后,可以通过测试连接按钮对明细库的连接状态进行测试,连接成功后可以导入数据明细表进行分析,因数据库可以自由添加,使分析平台变得更加灵活智能;
当数据明细库连接成功后,通过导入数据表按钮,查询出数据明细库中的所有数据表,选择需要分析的数据明细表,将其导入分析平台,为接下来的分析展示提供数据支撑;导入的数据表只是用于分析所必需的数据,在增加平台的可用性基础上,也充分考虑了数据库的安全性;
将数据表导入后,按照一定的规则将数据表进行分类,以方便快速查找,同时可以为缺失中文备注的表和字段手动添加中文备注,增加分析平台的可用性;
完成数据元后,第二步是建立数据模型,数据模型包括的源数据的筛选、分析、处理等,首先对关联数据进行关联挖掘,得到有价值的数据,在模型上双击表结点对数据进行筛选,通过拖拽两表结点将数据进行关联分析;
根据分析人员的要求,在数据模型中添加维度和指标,根据设置的指标公式,对明细数据进行不同维度的处理,统计出重要的指标信息,进而使用户迅速做出正确判断;
点击添加维度按钮,输入维度名称和选择维度类型,生成相应维度,拖拽左侧数据表的字段添加维度成员,维度设置完成后,添加分析指标,将字段拖拽到指标区,输入指标名称,选择指标公式,构建分析指标;
数据模型创建完成后,接下来创建报表对模型的数据进行展示,主要包括两种形式的报表,包括数据报表和立方体报表,数据报表,展示明细数据;立方体报表用于展示指标的相关统计信息。
引入数据模型,当报表为数据报表时,展示明细数据的同时可以在报表页面对数据进行再次清洗,去除不需要的或者不正确的明细数据,当报表为立方体报表时,报表展示不同维度的指标信息,通过左侧的维度栏对数据的分析维度进行指定,当不需要该维度时,可以删除该分析维度,左侧的指针项,表示不同维度下的指针处理结果,通过勾选可以在右侧的报表里显示,这部分指标数据在缓存中进行短暂存储,在数据准确的前提下,大大加快了分析的速度,也为决策提供数据支撑。同时在分析过程中提供新指标的构建、数据趋势分析、数值预警等常用分析功能。
实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (4)

1.一种基于缓存的高效税收数据分析方法,其特征在于,所述方法在大量税收明细数据的基础上,通过关联分析挖掘出有价值的明细数据;建立“税收数据立方体”,通过联机在线处理技术对明细数据进行多维度的深度处理,将原始明细数据转化为用户所理解的、并真实反映税收多维特性的汇总数据。
2.根据权利要求1所述的一种基于缓存的高效税收数据分析方法,其特征在于,所述方法通过缓存技术,将分析的税收规律数据进行短暂保存。
3.根据权利要求2所述的一种基于缓存的高效税收数据分析方法,其特征在于,所述方法通过将税收分析数据固化,为其他分析的使用提供数据支持。
4.根据权利要求3所述的一种基于缓存的高效税收数据分析方法,其特征在于,所述方法实现步骤如下:
1)数据源配置,利用Druid技术通过用户名和密码连接需要分析的任意税收数据明细仓库,并需要分析的明细表的元数据导入分析平台;
2)建立税务模型,通过拖拽化的方式,构建表间关系,依据用户需求按照业务规则对税收明细数据进行数据清洗、关联挖掘,获得有价值的明细税收数据;
3)建立税收数据立方体,依照设置的维度和指标,利用OLAP技术对明细税务数据立体化处理,使决策人员可以在不同的角度发现税收明细数据的不同特性;
4)利用缓存技术,将税收分析数据进行短暂保存,大大提升查询处理效率;
5)通过报表对税收指标项进行灵活的展示;
6)保存分析税收数据到汇总库,设置调度任务,及时更新分析数据。
CN201710138675.6A 2017-03-09 2017-03-09 一种基于缓存的高效税收数据分析方法 Pending CN106909691A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710138675.6A CN106909691A (zh) 2017-03-09 2017-03-09 一种基于缓存的高效税收数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710138675.6A CN106909691A (zh) 2017-03-09 2017-03-09 一种基于缓存的高效税收数据分析方法

Publications (1)

Publication Number Publication Date
CN106909691A true CN106909691A (zh) 2017-06-30

Family

ID=59187833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710138675.6A Pending CN106909691A (zh) 2017-03-09 2017-03-09 一种基于缓存的高效税收数据分析方法

Country Status (1)

Country Link
CN (1) CN106909691A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242332A (zh) * 2018-09-25 2019-01-18 广东中标数据科技股份有限公司 一种税收征管数据的监控分析系统、方法及装置
CN110471956A (zh) * 2019-08-13 2019-11-19 浪潮云信息技术有限公司 一种适用于政务应用的统计展示系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1551014A (zh) * 2003-03-28 2004-12-01 利用联机分析处理变型的预设高速缓存的系统和方法
CN1790397A (zh) * 2005-12-28 2006-06-21 浙江工业大学 基于联机分析的第三方物流数据处理方法
CN101008954A (zh) * 2007-01-30 2007-08-01 金蝶软件(中国)有限公司 联机分析处理系统中多维表达式数据缓存的方法和装置
CN101523388A (zh) * 2005-07-25 2009-09-02 微软公司 在用户设备上高速缓存和修改多维数据库的部分

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1551014A (zh) * 2003-03-28 2004-12-01 利用联机分析处理变型的预设高速缓存的系统和方法
CN101523388A (zh) * 2005-07-25 2009-09-02 微软公司 在用户设备上高速缓存和修改多维数据库的部分
CN1790397A (zh) * 2005-12-28 2006-06-21 浙江工业大学 基于联机分析的第三方物流数据处理方法
CN101008954A (zh) * 2007-01-30 2007-08-01 金蝶软件(中国)有限公司 联机分析处理系统中多维表达式数据缓存的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
夏琰: "基于数据挖掘技术的税务数据仓库应用平台建设", 《万方学位数据库》 *
谭鹿敏: "税务数据仓库系统的设计与实现", 《万方学位数据库》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242332A (zh) * 2018-09-25 2019-01-18 广东中标数据科技股份有限公司 一种税收征管数据的监控分析系统、方法及装置
CN110471956A (zh) * 2019-08-13 2019-11-19 浪潮云信息技术有限公司 一种适用于政务应用的统计展示系统及方法

Similar Documents

Publication Publication Date Title
EP3173950B1 (en) Systems and methods for database investigation tool
US10504047B2 (en) Metadata-driven audit reporting system with dynamically created display names
CA3022113A1 (en) Learning from historical logs and recommending database operations on a data-asset in an etl tool
US20140052695A1 (en) Systems and methods for capturing data refinement actions based on visualized search of information
CN110442620B (zh) 一种大数据探索和认知方法、装置、设备以及计算机存储介质
Yulianto Extract transform load (ETL) process in distributed database academic data warehouse
CN104572709A (zh) 用于企业创新体系的数据挖掘系统
CN106055621A (zh) 一种日志检索方法及装置
CN108846691A (zh) 区域性粮油市场价格监测分析预测系统及监测方法
CN110751361B (zh) 一种银行需求条目级管理方法及系统
US20180181657A1 (en) Organization of database search results
DE102012221251A1 (de) Semantisches und kontextbezogenes Durchsuchen von Wissensspeichern
CN112000773A (zh) 基于搜索引擎技术的数据关联关系挖掘方法及应用
CN111078675A (zh) 一种多维度的综合数据库sql审核及优化方法和系统
CN102855290A (zh) 一种移动互联网知识管理方法
CN111489135A (zh) 一种稽核数据的分析管理系统及方法
CN106909691A (zh) 一种基于缓存的高效税收数据分析方法
US20130290065A1 (en) Method and System to Analyze Processes
Brum et al. Business intelligence and data warehouse in agrarian sector: A bibliometric study
CN107895235A (zh) 基于决策树分析法的财务建模系统
CN116228402A (zh) 一种金融征信特征仓库技术支持系统
CN103123641A (zh) 一种社交搜索的方法和装置
Homocianu et al. An Analysis of Scientific Publications on'Decision Support Systems' and'Business Intelligence'Regarding Related Concepts Using Natural Language Processing Tools
CN116756373A (zh) 基于知识图谱更新的项目评审专家筛选方法、系统及介质
US20150081735A1 (en) System and method for fast identification of variable roles during initial data exploration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170630