CN109300023A - 一种土地增值税大数据抽取和应用的方法及系统 - Google Patents
一种土地增值税大数据抽取和应用的方法及系统 Download PDFInfo
- Publication number
- CN109300023A CN109300023A CN201811003708.7A CN201811003708A CN109300023A CN 109300023 A CN109300023 A CN 109300023A CN 201811003708 A CN201811003708 A CN 201811003708A CN 109300023 A CN109300023 A CN 109300023A
- Authority
- CN
- China
- Prior art keywords
- data
- tax
- increment
- land value
- extracts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 29
- 230000029305 taxis Effects 0.000 claims abstract description 26
- 238000007405 data analysis Methods 0.000 claims abstract description 17
- 230000009466 transformation Effects 0.000 claims abstract description 11
- 238000003032 molecular docking Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 abstract description 9
- 238000012550 audit Methods 0.000 abstract description 5
- 239000002689 soil Substances 0.000 description 9
- 239000000203 mixture Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012827 research and development Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 101100217298 Mus musculus Aspm gene Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002674 ointment Substances 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000031877 prophase Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/123—Tax preparation or submission
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种土地增值税大数据抽取和应用的方法及系统,该方法包括如下步骤:建立大数据集群服务平台;对接税务局内部办税系统,并配置数据源转换规则,进行全量或增量抽取涉税数据和鉴证数据;针对抽取的数据建立指标,组合成多维度数据立方体;利用数据立方体进行数据分析实例。可以进行实时数据计算与查询动作,实时掌握税局、企业、地方放鉴证机构的数据,真正全面覆盖,查无遗漏。能方便直观的利用图形操作制作出符合不同业务条件的N维度数据结构表,高效简洁的分析出纳税疑点,达到智能管税的目的,以及方便对审核档案的翻阅,达到对正在进行土地增值税清算审核工作的指导目的。
Description
技术领域
本发明涉及税务管理技术领域,特别是涉及一种土地增值税大数据抽取和 应用的方法及系统。
背景技术
近年来,由于不断加强和完善土地增值税征管,强化土地增值税清算,土 地增值税的征管水平不断得到提升,但还存在土地增值税清算前期管理偏松、 建筑造价核实取证难、清算鉴证疏于规范等方面问题,由此产生不小的涉税风 险和执法风险。
目前土地增值税征收主要存在以下问题:
1、征收范围窄,征收率偏高。
2、扣除项目复杂,重复征收,房地产开发成本和开发费用需由房地产企业 提供。
3、征收管理信息不对称,目前土地增值税的预征率较低。
4、房地产开发项目前期监控困难,无法有效实时的监控项目开发周期中的 预售、建设用地规划、成本支出等情况。
5、已清算项目档案不能很好的共享利用,无法直观的对往后清算项目进行 对碰分析和指导。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种土地增值税 大数据抽取和应用的方法及系统,通过建立大数据集群服务平台,对接税务局 内部办税系统与本公司研发的土地增值税清算平台企业端,建立查询/计算性能 良好的大数据平台仓库,通过设定数据分析指标,形成多维度的数据立方体, 全方面的对土地增值税相关的涉税数据、纳税人、房地产开发项目进行分析, 推导出符合清算条件的项目以及各房地产开发项目土地增值税相关的纳税疑 点,达到智能管税的目的。
为达上述及其它目的,本发明提出一种土地增值税大数据抽取和应用的方 法,具体包括如下步骤:
步骤一,建立大数据集群服务平台;
步骤二,对接税务局内部办税系统,并配置数据源转换规则,进行全量或 增量抽取涉税数据和鉴证数据;
步骤三,针对抽取的数据建立指标,组合成多维度数据立方体;
步骤四,利用数据立方体进行数据分析实例。
进一步地,所述对接税务局内部办税系统为通过ETL技术进行对接。
进一步地,所述全量或增量抽取为通过HASH算法进行抽取;
所述鉴证数据为企业和第三方鉴证数据。
进一步地,所述进行数据分析实例为对碰分析实例。
进一步地,于步骤二中,执行抽取任务,获取目标库数据源,根据数据源 设定分析指标。
进一步地,于步骤四之后,将清算完成的项目自动归档整理,按照维度进 行直观的档案图表展示。
为达到上述目的,本发明还提供一种土地增值税大数据抽取和应用的系统, 具体包括平台建立单元、数据抽取单元、多维度数据立方体单元和数据分析单 元;
平台建立单元,用于建立大数据集群服务平台;
数据抽取单元,用于对接税务局内部办税系统,并配置数据源转换规则, 进行全量或增量抽取涉税数据和鉴证数据;
多维度数据立方体单元,用于针对抽取的数据建立指标,组合成多维度数 据立方体;
数据分析单元,用于利用数据立方体进行数据分析实例。
进一步地,所述系统还包括数据源模块,用于获取目标库数据源,根据数 据源设定分析指标。
进一步地,所述系统还包括展示模块,用于将清算完成的项目自动归档整 理,按照维度进行直观的档案图表展示。
与现有技术相比,本发明具有以下有益效果:
1、在海量数据压力(过百亿级)下可以进行实时数据计算与查询动作,比 传统数据库i/o查询效率有了质的提升。
2、能与税务局内部办税系统和本公司研发的土地增值税清算企业端系统进 行无缝对接,实时掌握税局、企业、地方放鉴证机构的数据,真正全面覆盖, 查无遗漏。
3、可以在海量数据中筛取针对性强的有用数据,达到数据智能挖掘的目的。
4、能方便直观的利用图形操作制作出符合不同业务条件的N维度数据结构 表,高效简洁的分析出纳税疑点,达到智能管税的目的。
5、能很直观的统计辖区内的土地增值税入库台账,以及方便对审核档案的 翻阅,达到对正在进行土地增值税清算审核工作的指导目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图1为本发明一种土地增值税大数据抽取和应用的方法的步骤流程图;
图2为本发明一种土地增值税大数据抽取和应用的系统架构图;
图3为本发明一种土地增值税大数据抽取和应用的系统技术架构图;
图4为本发明一种土地增值税大数据抽取和应用的系统部署方案图;
图5为本发明一种土地增值税大数据抽取和应用的系统的网络拓扑图;
图6为本发明一种土地增值税大数据抽取和应用的系统的数据立方体构建 流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术 人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明 亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基 于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种土地增值税大数据抽取和应用的方法的步骤流程图。如 图1所示,本发明一种土地增值税大数据抽取和应用的方法,具体包括如下步 骤:
步骤101,建立大数据集群服务平台;具体地,数据集群平台由多个子节点 组成,较佳地,所述子节点的个数以及子节点的CPU、内存容量、硬盘容量分 配按照数据量和运算量而定,通常一个子节点是一个独立的计算机主机或者虚 拟主机。
步骤102,对接税务局内部办税系统,并配置数据源转换规则,进行全量或 增量抽取涉税数据和鉴证数据;具体地,搭建ETL数据调度服务,设置定时抽 取任务,配置数据源到目标源的转换规则,分别配置全量抽取任务和增量抽取 任务。
较佳地,配置数据源,即税务局内部办税系统,如金税三期系统、辅助征 收系统等;目标源,即步骤101所述的大数据集群服务平台的目标数据文件, 转换规则为数据源表与目标表的对应关系,数据源表字段与目标表字段的对应 关系,以及数据源主从表之间的主外键关系等,全量抽取即全部数据的抽取, 增量抽取为按照上一次抽取时间节点,抽取一定时间段的数据,通过HASH算 法计算出上一次数据准确抽取点,并执行抽取任务,获取目标库数据源。
也就是说,在本发明具体实施例中,利用时下流行的ETL(数据调度引擎) 技术,无缝对接税务局各办税系统,把跟土地增值税有关的涉税数据(如面积、 收入、成本、税金等)、项目前期开发过程中企业上报的实时数据(如项目土地 增值税预征数据、尾盘数据、第三方鉴证数据等)、以及跟土地增值税清算相关 的中央总局政策、地方省局、市局政策等抽取到大数据集群平台。
步骤103,针对抽取的数据建立指标,组合成多维度数据立方体;具体地, 根据业务需求,利用设定好的分析指标组成多维度的数据立方体,数据立方体 由多个指标组成新的多维数据结构,具体按需求而定,比如需要查找符合土地 增值税清算的项目与纳税人信息,查找以纳税人、年度、项目等为维度的土地 增值税开发、土地、税金等成本。
也就是说,通过设立对碰指标形成数据立方体,对碰指标由各数据之间的 字段组合、关联条件、组合查询条件、过滤条件等组成,数据立方体指通过不 同指标形成多维度的新数据结构,例如:把纳税人信息、房地产开发项目信息、 增值税发票信息,通过纳税人社会信用代码关联,组成全新的纳税人项目成本 数据结构,直观的展示纳税人当前名下的项目与成本支出信息。
步骤104,利用数据立方体进行数据分析实例。具体地,利用步骤103中的 数据立方体进行分析实例运作,分析出纳税疑点或者统计出符合土地增值税清 算条件的房地产开发项目,作针对性的决策,比如:风险疑点推送到土地增值 税清算审核任务点,对符合清算的项目对应的企业下发土地增值税清算通知书。
在土地增值税清算审核过程中利用步骤103中预构建的数据立方体,进行 土地增值税不同清算项目之间的个案对碰分析,指导现正进行的土地增值税清 算项目的审核工作。
也就是说,形成的数据立方体,用于税务局对辖区内所有跟土地增值税有 关数据的自动分析实例,如:针对尚未申报土地增值税清算的房地产项目,自 动分析出符合土地增值税清算条件的项目(通过项目预售率、开发进度等),对 正在参与土地增值税项目,自动分析出纳税人的土地增值税相关的各项纳税疑 点、以及当前项目通过多维度(地区、容积率、产品类型等)与周边已清算楼 盘的各项指标(如单方造价、土地增值税增值率、土地增值税税负率等)的对 碰。
具体地,于步骤102中,执行抽取任务,获取目标库数据源,根据数据源 设定分析指标。在本发明具体实施例中,分析指标由具体业务而定,分析指标 的内容一般包含多个数据源表的不同数据字段的对碰,根据关联条件与过滤条 件组合成新的数据维度。
于步骤104之后,将清算完成的项目自动归档整理,按照维度进行直观的 档案图表展示。具体地,针对在本发明实例中进行土地增值税清算审核周期的 项目,已经清算完成的,系统自动归档整理,并按照地区、年份、企业等维度 进行直观的档案图表展示,方便税务局各级人员进行土地增值税台账统计,对 清算案例进行翻阅查询,总结经验。
也就是说,清算完成后,自动对已清算项目的全过程数据进行自动归档分 类,通过图表方式进行直观的展示,税务局可用于进行辖区内土增税台账的统 计以及已清算个案的各项指标(比如收入、成本、税金、费用等)对碰分析。
图2为本发明一种土地增值税大数据抽取和应用的系统架构图。
如图2所示,本发明一种土地增值税大数据抽取和应用的系统,包括一种土 地增值税大数据抽取和应用的系统,具体包括平台建立单元201、数据抽取单元 202、多维度数据立方体单元203和数据分析单元204;
平台建立单元201,用于建立大数据集群服务平台;具体地,数据集群平台 由多个子节点组成,较佳地,所述子节点的个数以及子节点的CPU、内存容量、 硬盘容量分配按照数据量和运算量而定,通常一个子节点是一个独立的计算机 主机或者虚拟主机。
数据抽取单元202,用于对接税务局内部办税系统,并配置数据源转换规则, 进行全量或增量抽取涉税数据和鉴证数据;
具体地,搭建ETL数据调度服务,设置定时抽取任务,配置数据源到目标 源的转换规则,分别配置全量抽取任务和增量抽取任务。
较佳地,配置数据源,即税务局内部办税系统,如金税三期系统、辅助征 收系统等;目标源,即大数据集群服务平台的目标数据文件,转换规则为数据 源表与目标表的对应关系,数据源表字段与目标表字段的对应关系,以及数据 源主从表之间的主外键关系等,全量抽取即全部数据的抽取,增量抽取为按照 上一次抽取时间节点,抽取一定时间段的数据,通过HASH算法计算出上一次 数据准确抽取点,并执行抽取任务,获取目标库数据源;所述的HASH算法为 不限于MD5、SHA1在内的多种HASH标准的算法。
多维度数据立方体单元203,用于针对抽取的数据建立指标,组合成多维度 数据立方体;具体地,根据业务需求,利用设定好的分析指标组成多维度的数 据立方体,数据立方体由多个指标组成新的多维数据结构,具体按需求而定, 比如需要查找符合土地增值税清算的项目与纳税人信息,查找以纳税人、年度、 项目等为维度的土地增值税开发、土地、税金等成本。
也就是说,通过设立对碰指标形成数据立方体,对碰指标由各数据之间的 字段组合、关联条件、组合查询条件、过滤条件等组成,数据立方体指通过不 同指标形成多维度的新数据结构,例如:把纳税人信息、房地产开发项目信息、 增值税发票信息,通过纳税人社会信用代码关联,组成全新的纳税人项目成本 数据结构,直观的展示纳税人当前名下的项目与成本支出信息。
数据分析单元204,用于利用数据立方体进行数据分析实例。
具体地,利用步数据立方体进行分析实例运作,分析出纳税疑点或者统计 出符合土地增值税清算条件的房地产开发项目,作针对性的决策,在土地增值 税清算审核过程中利用预构建的数据立方体,进行土地增值税不同清算项目之 间的个案对碰分析,指导现正进行的土地增值税清算项目的审核工作。
较佳地,系统还包括数据源模块,用于获取目标库数据源,根据数据源设 定分析指标。具体地,分析指标由具体业务而定,分析指标的内容一般包含多 个数据源表的不同数据字段的对碰,根据关联条件与过滤条件组合成新的数据 维度。
系统还包括展示模块,用于将清算完成的项目自动归档整理,按照维度进 行直观的档案图表展示。
具体地,针对在本发明实例中进行土地增值税清算审核周期的项目,已经 清算完成的,系统自动归档整理,并按照地区、年份、企业等维度进行直观的 档案图表展示,方便税务局各级人员进行土地增值税台账统计,对清算案例进 行翻阅查询,总结经验。
图3为本发明一种土地增值税大数据抽取和应用的系统技术架构图,在本 发明具体实施例中,技术架构包括核心框架、操作层和展示层,核心框架包括 控制层、接口服务、服务层、数据持久层及DB;操作层包括ETL抽取、缓存 机制、工作流引擎、全文搜索引擎、报表设计和安全权限控制;展示层展示JSP、 JSTL标签、UI框架(EasyUI+boostrap)和图表控件(highchars)。
也就是说,技术架构图主要分为数据仓库层:通过ETL (Extract-Transform-Load,数据调度引擎)技术抽取税务局内部办税系统(如金 税三期系统)以及本系统的纳税人端企业提交的申报涉税数据,抽象出具体的 业务数据模型,输出到大数据集群服务器,形成数据仓库;数据应用层:针对 数据仓库的业务模型,根据实际业务分析场景,用户可动态直观通过系统提供 的BI设计操作界面,建立维度表、度量表,形成多维度指标,通过多维度指标 的对碰形成数据立方体,最终计算解析数据立方体,生成计算结果;
缓存层:通过EhCache(一种Java内进程缓存框架)架构做内存块的缓存 机制,用redis(一种基于内存的缓存框架,亦可作为Key-Value键值对形式的 数据持久化数据库)做数据持久块的缓存机制;通过缓存机制,把系统已解析 过的多维度指标和数据立方体缓存起来,形成快速计算库,以供后续计算提供 效率支持,节省计算时间;
展示层:通过JSP(Java服务器界面)界面与EasyUI(一种基于JQuery的 界面插件框架)框架的结合,做常规表格类数据展示,用highchars(一种用纯 JavaScript脚本编写的图表库)框架做包括但不仅限于柱形图、饼图、折线图、 地理图等图形类的数据展示;
底层架构平台:以Spring Framework(一个基于IOC和AOP的多层j2ee系 统的框架)架构为核心枢纽,串联数据持久块、业务逻辑服务块、控制块形成 核心底层技术框架;以源恒自研发的工作流平台、报表设计平台、全文搜索引 擎提供中间件支持;以SpringSecurity(基于Spring框架的用户身份验证架构) 为用户鉴权机制,维护系统安全稳定。
图4为本发明一种土地增值税大数据抽取和应用的系统部署方案图,在本 发明具体实施例中,建立大数据集群服务平台;具体地,数据集群平台由多个 子节点组成,通常一个子节点是一个独立的计算机主机或者虚拟主机。通过数 据集群服务平台对接税务局内部办税系统,并配置数据源转换规则,通过HASH 等计算算法进行全量/增量抽取跟土地增值税相关的涉税数据、企业以及第三方 鉴证数据,通过与本公司研发的土增税清算企业端系统的数据通道抽取,即企 业有企业的企业申报系统,第三方机构有第三方鉴证系统。
也就是说,大数据抽取和应用的系统部署方案主要表现为:
1、建立大数据集群服务:使用但不限于hadoop(是一个由Apache基金会 所开发的分布式系统,数据集群仓库的基础架构)建立多个大数据集群子节点, 子节点可以是独立的计算机主机或虚拟主机;
2、ETL(Extract-Transform-Load,数据调度引擎)抽取数据到大数据集群 服务:使用但不限于kettle(一种用Java编写的开源数据调度引擎)在内的ETL (Extract-Transform-Load,数据调度引擎)抽取工具,配置抽取任务,通过HASH (哈希标准算法)(例如MD5(信息摘要算法第五版)、SHA1(哈希算法中关于 数字签名领域的一种分支算法))算法计算出全量/增量节点,抽取跟土地增值税 相关的涉税数据、企业以及第三方的鉴证数据到大数据集群服务平台
图5为本发明一种土地增值税大数据抽取和应用的系统的网络拓扑图,在 本发明具体实施例中,系统应用主服务部署在税务局内部前置机上(指既可访 问税务局内部网络,又可访问外部互联网的机器),各分局通过计算机和内部网 络访问本系统税务局端应用服务,系统通过敏感词、关键词以及危险判断的机 制(包括但不限于SQL(一种数据库结构化查询标准语言)注入、敏感文件注入、 DOS(一种磁盘操作系统)攻击等)过滤出危险请求和数据;企业用户通过计算 机和互联网访问本系统纳税人端。
图6为本发明一种土地增值税大数据抽取和应用的系统的数据立方体构建 流程图,在本发明具体实施例中,通过数据管理和数据查询选择数据源,针对 数据源建立分析组合,建立分析组合包括建立维度和建立度量,建立维度包含 关联维度和简单维度,建立度量包括聚合度量与指标度量,通过建立分析组合 后,发送到多维度分析。
也就是说,针对抽取的数据建立指标,组合成多维度数据立方体;具体地, 根据业务需求,利用设定好的分析指标组成多维度的数据立方体,数据立方体 由多个指标组成新的多维数据结构,具体按需求而定,比如需要查找符合土地 增值税清算的项目与纳税人信息,查找以纳税人、年度、项目等为维度的土地 增值税开发、土地、税金等成本。
综上所述,本发明实例通过大数据集群服务平台,对接税务局内部办税系 统与本公司研发的土地增值税清算平台企业端,建立查询/计算性能良好的大数 据平台仓库,通过设定数据分析指标,形成多维度的数据立方体,全方面的对 土地增值税相关的涉税数据、纳税人、房地产开发项目进行分析,推导出符合 清算条件的项目以及各房地产开发项目土地增值税相关的纳税疑点,达到智能 管税的目的。
通过本发明的大数据集群服务平台,海量数据压力(过百亿级)下可以进 行实时数据计算与查询动作,比传统数据库i/o查询效率有了质的提升。
通过本发明的ETL数据调度模块,能与税务局内部办税系统和本公司研发 的土地增值税清算企业端系统进行无缝对接,实时掌握税局、企业、地方放鉴 证机构的数据,真正全面覆盖,查无遗漏。
通过本发明的指标制作模块,可以在海量数据中筛取针对性强的有用数据, 达到数据智能挖掘的目的。
通过本发明的数据立方体制作模块,能方便直观的利用图形操作制作出符 合不同业务条件的N维度数据结构表,高效简洁的分析出纳税疑点,达到智能 管税的目的。
通过本发明的已清算项目档案分析模块,能很直观的统计辖区内的土地增 值税入库台账,以及方便对审核档案的翻阅,达到对正在进行土地增值税清算 审核工作的指导目的。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。 任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行 修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。
Claims (9)
1.一种土地增值税大数据抽取和应用的方法,其特征在于,所述方法包括如下步骤:
步骤一,建立大数据集群服务平台;
步骤二,对接税务局内部办税系统,并配置数据源转换规则,进行全量或增量抽取涉税数据和鉴证数据;
步骤三,针对抽取的数据建立指标,组合成多维度数据立方体;
步骤四,利用数据立方体进行数据分析实例。
2.根据权利要求1所述的一种土地增值税大数据抽取和应用的方法,其特征在于:所述对接税务局内部办税系统为通过ETL技术进行对接。
3.根据权利要求1所述的一种土地增值税大数据抽取和应用的方法,其特征在于:所述全量或增量抽取为通过HASH算法进行抽取;
所述鉴证数据为企业和第三方鉴证数据。
4.根据权利要求1所述的一种土地增值税大数据抽取和应用的方法,其特征在于:所述进行数据分析实例为对碰分析实例。
5.根据权利要求1所述的一种土地增值税大数据抽取和应用的方法,其特征在于:于步骤二中,执行抽取任务,获取目标库数据源,根据数据源设定分析指标。
6.根据权利要求1所述的一种土地增值税大数据抽取和应用的方法,其特征在于:于步骤四之后,将清算完成的项目自动归档整理,按照维度进行直观的档案图表展示。
7.一种土地增值税大数据抽取和应用的系统,其特征在于,所述系统包括平台建立单元、数据抽取单元、多维度数据立方体单元和数据分析单元;
平台建立单元,用于建立大数据集群服务平台;
数据抽取单元,用于对接税务局内部办税系统,并配置数据源转换规则,进行全量或增量抽取涉税数据和鉴证数据;
多维度数据立方体单元,用于针对抽取的数据建立指标,组合成多维度数据立方体;
数据分析单元,用于利用数据立方体进行数据分析实例。
8.根据权利要求7所述的一种土地增值税大数据抽取和应用的系统,其特征在于:所述系统还包括数据源模块,用于获取目标库数据源,根据数据源设定分析指标。
9.根据权利要求7所述的一种土地增值税大数据抽取和应用的系统,其特征在于:所述系统还包括展示模块,用于将清算完成的项目自动归档整理,按照维度进行直观的档案图表展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811003708.7A CN109300023A (zh) | 2018-08-30 | 2018-08-30 | 一种土地增值税大数据抽取和应用的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811003708.7A CN109300023A (zh) | 2018-08-30 | 2018-08-30 | 一种土地增值税大数据抽取和应用的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109300023A true CN109300023A (zh) | 2019-02-01 |
Family
ID=65165962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811003708.7A Pending CN109300023A (zh) | 2018-08-30 | 2018-08-30 | 一种土地增值税大数据抽取和应用的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109300023A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000312A (zh) * | 2020-07-24 | 2020-11-27 | 湖北地信科技集团股份有限公司 | 基于Kettle和GeoTools的空间大数据自动化并行处理方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140100891A1 (en) * | 2012-10-05 | 2014-04-10 | First Responder Dispatch Service, Llc | First Responder Dispatch System |
CN103984755A (zh) * | 2014-05-28 | 2014-08-13 | 中国地质大学(北京) | 基于多维度模型的油气资源数据要览系统实现方法及系统 |
CN105046552A (zh) * | 2015-07-03 | 2015-11-11 | 广东源恒软件科技有限公司 | 一种基于云计算平台的企业税务管控系统及方法 |
CN106484855A (zh) * | 2016-09-30 | 2017-03-08 | 广州特道信息科技有限公司 | 一种大数据涉税情报分析系统 |
US20180018338A1 (en) * | 2015-11-29 | 2018-01-18 | Vatbox, Ltd. | System and method for improved analysis of travel-indicating unstructured electronic documents |
CN107749030A (zh) * | 2017-10-31 | 2018-03-02 | 广东源恒软件科技有限公司 | 一种税务指标管理方法及系统 |
CN108255819A (zh) * | 2016-12-27 | 2018-07-06 | 航天信息股份有限公司 | 一种基于分析工具spark的增值税数据整合方法及系统 |
-
2018
- 2018-08-30 CN CN201811003708.7A patent/CN109300023A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140100891A1 (en) * | 2012-10-05 | 2014-04-10 | First Responder Dispatch Service, Llc | First Responder Dispatch System |
CN103984755A (zh) * | 2014-05-28 | 2014-08-13 | 中国地质大学(北京) | 基于多维度模型的油气资源数据要览系统实现方法及系统 |
CN105046552A (zh) * | 2015-07-03 | 2015-11-11 | 广东源恒软件科技有限公司 | 一种基于云计算平台的企业税务管控系统及方法 |
US20180018338A1 (en) * | 2015-11-29 | 2018-01-18 | Vatbox, Ltd. | System and method for improved analysis of travel-indicating unstructured electronic documents |
CN106484855A (zh) * | 2016-09-30 | 2017-03-08 | 广州特道信息科技有限公司 | 一种大数据涉税情报分析系统 |
CN108255819A (zh) * | 2016-12-27 | 2018-07-06 | 航天信息股份有限公司 | 一种基于分析工具spark的增值税数据整合方法及系统 |
CN107749030A (zh) * | 2017-10-31 | 2018-03-02 | 广东源恒软件科技有限公司 | 一种税务指标管理方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000312A (zh) * | 2020-07-24 | 2020-11-27 | 湖北地信科技集团股份有限公司 | 基于Kettle和GeoTools的空间大数据自动化并行处理方法和系统 |
CN112000312B (zh) * | 2020-07-24 | 2022-04-29 | 湖北地信科技集团股份有限公司 | 基于Kettle和GeoTools的空间大数据自动化并行处理方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11914620B2 (en) | System and method for aggregating values through risk dimension hierarchies in a multidimensional database environment | |
US11681702B2 (en) | Conversion of model views into relational models | |
US10296519B2 (en) | Synchronization of time between different simulation models | |
US10540375B2 (en) | Systems and methods for self-pairing databases | |
CN110347719A (zh) | 一种基于大数据的企业外贸风险预警方法及系统 | |
CN106484855A (zh) | 一种大数据涉税情报分析系统 | |
Schintler et al. | Encyclopedia of big data | |
CN111444256A (zh) | 一种数据可视化的实现方法和装置 | |
CN110795509A (zh) | 一种数据仓库的指标血缘关系图的构建方法、装置和电子设备 | |
US7814045B2 (en) | Semantical partitioning of data | |
CN112527774A (zh) | 数据中台搭建方法、系统及存储介质 | |
US10769175B1 (en) | Real-time hosted system analytics | |
CN112927082A (zh) | 信用风险的预测方法、装置、设备、介质和程序产品 | |
CN113989018A (zh) | 风险管理方法、装置、电子设备和介质 | |
CN116089495A (zh) | 一种基于大数据的自助分析平台 | |
Sfaxi et al. | DECIDE: An Agile event-and-data driven design methodology for decisional Big Data projects | |
CN107679977A (zh) | 一种基于语义分析的税务管理平台及实现方法 | |
Chen et al. | Intelligent management information system of urban planning based on GIS | |
CN116594683A (zh) | 一种代码注释信息生成方法、装置、设备及存储介质 | |
Huang et al. | PFPMine: A parallel approach for discovering interacting data entities in data-intensive cloud workflows | |
CN111640031B (zh) | 跨系统的理赔数据处理方法、装置及相关设备 | |
Fan et al. | Digitalization and outward foreign direct investment of Chinese listed firms | |
CN109300023A (zh) | 一种土地增值税大数据抽取和应用的方法及系统 | |
US9069373B2 (en) | Generating a runtime framework | |
CN111611099A (zh) | 失联用户信息的修复方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |