CN109726247A - 一种数据可视化分析系统及方法 - Google Patents
一种数据可视化分析系统及方法 Download PDFInfo
- Publication number
- CN109726247A CN109726247A CN201811623529.3A CN201811623529A CN109726247A CN 109726247 A CN109726247 A CN 109726247A CN 201811623529 A CN201811623529 A CN 201811623529A CN 109726247 A CN109726247 A CN 109726247A
- Authority
- CN
- China
- Prior art keywords
- label
- data
- concerning taxes
- platform
- taxpayer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 37
- 238000013079 data visualisation Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 22
- 230000029305 taxis Effects 0.000 claims abstract description 56
- 238000002372 labelling Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000006243 chemical reaction Methods 0.000 claims abstract description 10
- 238000004140 cleaning Methods 0.000 claims abstract description 8
- 238000012800 visualization Methods 0.000 claims abstract description 6
- 230000005540 biological transmission Effects 0.000 claims abstract description 3
- 238000007726 management method Methods 0.000 claims description 27
- 238000012550 audit Methods 0.000 claims description 9
- 230000003542 behavioural effect Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- 230000010354 integration Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 238000010276 construction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据可视化分析系统及方法,属于税务数据分析技术领域。本发明的数据可视化分析系统包括税务大数据平台、标签管理平台和上层应用层,税务大数据平台与标签管理平台相连接,税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集,将涉税数据传送给标签管理平台,标签管理平台对涉税数据打标签,将集中起来的涉税数据进行标签化处理,形成标签库,并完成对标签的管理;上层应用层通过标签调用接口与标签管理平台相连接,采用可视化画像展现纳税人的涉税数据。该发明的数据可视化分析系统能快速构建税务行业标签体系,为纳税人提供差异化的服务,使税务部门的风险管控更具针对性,具有很好的推广应用价值。
Description
技术领域
本发明涉及税务数据分析技术领域,具体提供一种数据可视化分析系统及方法。
背景技术
随着社会的不断进步,社会经济飞速发展,同时也带动各项科学技术的不断进步。计算机具有存储信息量大,使用者获取信息方便快捷等优点,受到广泛的应用。特别是近年来,随着社会及经济的进一步发展,计算机的应用领域逐步扩展,计算机在各个领域都得到广泛的应用。其中,计算机在税务中的应用也越来越广泛,计算机的出现为税务数据分析带来了很多的便捷。
但是随着金税三期工程的推广和税务大数据平台的建立,统一了全国征管数据标准和口径,实现了全国征管数据大集中,金税三期工程采用“应用省级集中,生产数据省局落地,然后集中到总局”的模式,并建立了第三方信息共享机制,因此能够实时、完整、准确的掌握纳税人涉税信息。
在当前运行的纳税人数据分析系统中,往往是简单的对纳税人数据进行集中展现,展现方式大部分为表格和图表,这种方式造成了分析场景僵化、分析工作量大、展现方式不直观、展现内容无关联等诸多缺陷。
怎么充分利用这些来自各个业务系统的数据,如何更加精确地了解纳税人涉税信息、更加精准地为纳税人服务、更加精细地对纳税人进行管理,充分发挥数据优势,来反映纳税人的经营情况、诚信记录、涉税风险、税收贡献、纳税习惯等信息,为税务部门开展差别化纳税服务、精细化税源管理和针对性风险管控,成为了亟待解决的问题。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种能快速构建税务行业标签体系,为纳税人提供差异化的服务,使税务部门的风险管控更具针对性的数据可视化分析系统。
本发明进一步的技术任务是提供一种数据可视化分析方法。
为实现上述目的,本发明提供了如下技术方案:
一种数据可视化分析系统,该系统基于标签化技术,包括税务大数据平台、标签管理平台和上层应用层,税务大数据平台与标签管理平台相连接,税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集,将涉税数据传送给标签管理平台,标签管理平台对涉税数据打标签,将集中起来的涉税数据进行标签化处理,形成标签库,并完成对标签的管理;上层应用层通过标签调用接口与标签管理平台相连接,结合标签管理平台处理的标签,采用可视化画像展现纳税人的涉税数据。
所述数据可视化分析系统底层依赖税务大数据平台,税务大数据平台根据涉税数据采集的质量、数量和具体需求,完成涉税数据的采集、清洗、转换、匹配和汇总归集,经过处理的涉税数据能够更加方便的进行标签化处理。在税务大数据平台的基础上,搭建标签管理平台,标签管理平台主要实现标签的管理,通过标签管理平台可以把集中起来的涉税数据进行标签化处理,结合业务需要定期扫描相关税务数据,根据标签定义对涉税数据进行标签化处理,最终形成标签库,标签库不仅存放标签的定义,还存放标签的扫描结果数据。上层应用层通过标签管理平台对外开放的标签调用接口调用标签数据,并通过可视化的方式进行展现。
作为优选,所述对标签的管理包括标签的创建、修改、审核、发布、评估和下线。
作为优选,所述标签的创建提供业务人员自行创建标签的入口;标签的修改为按照实际业务需求对标签规则进行修改调整;标签的审核提供标签审批功能,对审核通过的标签进行发布使用;标签的评估即对标签的使用频率和效率进行评估;标签的下线即对不常用标签、过时的标签执行下线操作。
作为优选,标签的创建方式包括自动标签、手工标签和组合标签。
作为优选,所述标签规则即标签的计算口径,包括数据项、计算公式。
标签规则即标签的计算口径,包括但不限于数据项、计算公式。
作为优选,所述上层应用层基于标签库,建立纳税人分类分级管理体系,通过查询纳税人涉税数据对应的标签,直观呈现征管和风险状态,以画像形式直观展示纳税人的涉税数据。
标签处理好后,即为标签应用阶段,基于标签库,建立纳税人分类分级管理体系,通过查询纳税人涉税数据对应的标签,直观呈现征管和风险状态,纳税人的涉税数据以更加合理的方式进行组织,以更加直观的方式展现,能够实现有针对性的开展分类管理和差异化服务。
一种数据可视化分析方法,所述方法具体包括以下步骤:
S1:涉税数据集成:通过税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集;
S2:行为建模:标签管理平台对收集到的涉税数据进行行为建模,抽象出标签,并对纳税人标签进行分类,把抽象出来的标签贴在相应的实体上;
S3:构建体系:采用数据可视化技术,以文字和图表展示相结合,通过组合标签展示纳税人信息。
作为优选,步骤S1中,涉税数据集成分为税务内部数据、税务外部数据、互联网数据和日常情报数据。
作为优选,步骤S2中,纳税人标签包括事实标签、统计标签和预测标签。
事实标签即描述纳税人基本特征,直接从税收系统、外部数据、互联网数据采集中提取的能直接显示纳税人社会属性、经营习惯和纳税行为的标签。
统计标签在事实标签的基础上,通过简单的计算,将纳税人分为若干类别,满足纳税人分类管理的需要。分类后,需要保证群体内和群体外的数量具有区分度。
预测标签是在事实标签和统计标签的基础上,搭建应用场景,引入决策树、回归算法、聚类算法分析等建模分析,使用内部数据、外部数据、互联网数据和日常情报数据反复测算,再将数据规律进行业务转换和提炼,最终形成预测标签。
作为优选,步骤S2中,提取纳税人的行为特征,通过迭代、聚类算法反复测试,结合纳税人的行为数据,抽象出标签。
行为建模阶段注重的影视大概率事件,通过数学算法尽可能的排除用户的偶然行为。标签的确定过程是提取纳税人的行为特征,通过迭代、聚类算法反复测试,结合纳税人的行为数据,经过合理的取舍,保留既有区分度,又能发硬每个“小群体”特征的纳税人属性,即抽象出标签。该过程需要标签提炼者对纳税人角色有伸入的理解,需要项目建设方和承担方共同完成。
与现有技术相比,本发明的数据可视化分析方法具有以下突出的有益效果:
(一)所述数据可视化分析方法一方面能够方便业务人员理解数据,另一方面方便计算机处理数据,实现对纳税人的分类管理;
(二)利用标签化技术,数据分析和使用人员面对的不再是枯燥、繁琐的文字和数字,而是直观的画像,表现形式更鲜活,内容更具针对性;
(三)利用标签化技术,能够鉴别纳税人的个性化需求,为纳税人提供差异化服务,使税务部门的风险管控更具有针对性,提供精准服务;
(四)通过标签组合,开展群体共性特征的可视化展示,进行共性提取,能够使税务人员有效地搜寻、了解目标企业,对税收风险的监控更加准确,具有良好的推广应用价值。
附图说明
图1是本发明所述数据可视化分析系统的拓扑图;
图2是本发明所述数据可视化分析方法的流程图。
具体实施方式
下面将结合附图和实施例,对本发明的数据可视化分析系统及方法作进一步详细说明。
实施例
如图1所示,本发明的数据可视化分析系统,该系统基于标签化技术,包括税务大数据平台、标签管理平台和上层应用层。
该数据可视化分析系统底层依赖税务大数据平台,税务大数据平台根据设施数据采集的质量、数量和具体需求,完成涉税数据的采集、清洗、转换、匹配和汇总归集,经过处理的涉税数据能够更加方便的进行标签化处理。
在税务大数据平台的基础上搭建标签管理平台,标签管理平台与税务大数据平台相连接,,标签管理平台主要实现标签的管理,通过标签管理平台可以把集中起来的涉税数据进行标签化处理,结合业务需要定期扫描相关税务数据,根据标签定义对涉税数据进行标签化处理,最终形成标签库,标签库不仅存放标签的定义,还存放标签的扫描结果数据。
标签的管理包括标签的创建、修改、审核、发布、评估和下线。标签的创建提供业务人员自行创建标签的入口,标签的创建方式包括自动标签、手工标签和组合标签。标签的修改为按照实际业务需求对标签规则进行修改调整,标签规则即标签的计算口径,包但不限于括数据项、计算公式。标签的审核提供标签审批功能,对审核通过的标签进行发布使用;标签的评估即对标签的使用频率和效率进行评估;标签的下线即对不常用标签、过时的标签执行下线操作。
上层应用层通过标签管理平台对外开放的标签调用接口调用标签数据,结合标签管理平台处理的标签,采用可视化画像展现纳税人的涉税数据。可视化画像可以包括纳税人画像、税务人员画像及税务机关画像等。标签处理好后,即为标签应用阶段,基于标签库,建立纳税人分类分级管理体系,通过查询纳税人涉税数据对应的标签,直观呈现征管和风险状态,纳税人的涉税数据以更加合理的方式进行组织,以更加直观的方式展现,能够实现有针对性的开展分类管理和差异化服务。
如图2所示,本发明的数据可视化分析方法,具体包括以下步骤:
S1:涉税数据集成:通过税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集。
涉税数据集成分为税务内部数据、税务外部数据、互联网数据和日常情报数据。
S2:行为建模:标签管理平台对收集到的涉税数据进行行为建模,抽象出标签,并对纳税人标签进行分类,把抽象出来的标签贴在相应的实体上。
纳税人标签包括事实标签、统计标签和预测标签。
事实标签即描述纳税人基本特征,直接从税收系统、外部数据、互联网数据采集中提取的能直接显示纳税人社会属性、经营习惯和纳税行为的标签。
统计标签在事实标签的基础上,通过简单的计算,将纳税人分为若干类别,满足纳税人分类管理的需要。分类后,需要保证群体内和群体外的数量具有区分度。
预测标签是在事实标签和统计标签的基础上,搭建应用场景,引入决策树、回归算法、聚类算法分析等建模分析,使用内部数据、外部数据、互联网数据和日常情报数据反复测算,再将数据规律进行业务转换和提炼,最终形成预测标签。
行为建模阶段注重的影视大概率事件,通过数学算法尽可能的排除用户的偶然行为。标签的确定过程是提取纳税人的行为特征,通过迭代、聚类算法反复测试,结合纳税人的行为数据,经过合理的取舍,保留既有区分度,又能发硬每个“小群体”特征的纳税人属性,即抽象出标签。该过程需要标签提炼者对纳税人角色有深入的理解,需要项目建设方和承担方共同完成。
S3:构建体系:采用数据可视化技术,以文字和图表展示相结合,通过组合标签展示纳税人信息。建构体系依据画像、预测、服务及风险性来完成。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
Claims (10)
1.一种数据可视化分析系统,其特征在于:该系统基于标签化技术,包括税务大数据平台、标签管理平台和上层应用层,税务大数据平台与标签管理平台相连接,税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集,将涉税数据传送给标签管理平台,标签管理平台对涉税数据打标签,将集中起来的涉税数据进行标签化处理,形成标签库,并完成对标签的管理;上层应用层通过标签调用接口与标签管理平台相连接,结合标签管理平台处理的标签,采用可视化画像展现纳税人的涉税数据。
2.根据权利要求1所述的数据可视化分析系统,其特征在于:所述对标签的管理包括标签的创建、修改、审核、发布、评估和下线。
3.根据权利要求2所述的数据可视化分析系统,其特征在于:所述标签的创建提供业务人员自行创建标签的入口;标签的修改为按照实际业务需求对标签规则进行修改调整;标签的审核提供标签审批功能,对审核通过的标签进行发布使用;标签的评估即对标签的使用频率和效率进行评估;标签的下线即对不常用标签、过时的标签执行下线操作。
4.根据权利要求3所述的数据可视化分析系统,其特征在于:标签的创建方式包括自动标签、手工标签和组合标签。
5.根据权利要求4所述的数据可视化分析系统,其特征在于:所述标签规则即标签的计算口径,包括数据项、计算公式。
6.根据权利要求5所述的数据可视化分析系统,其特征在于:所述上层应用层基于标签库,建立纳税人分类分级管理体系,通过查询纳税人涉税数据对应的标签,直观呈现征管和风险状态,以画像形式直观展示纳税人的涉税数据。
7.一种数据可视化分析方法,其特征在于:所述方法具体包括以下步骤:
S1:涉税数据集成:通过税务大数据平台完成涉税数据的采集、清洗、转换、匹配和汇总归集;
S2:行为建模:标签管理平台对收集到的涉税数据进行行为建模,抽象出标签,并对纳税人标签进行分类,把抽象出来的标签贴在相应的实体上;
S3:构建体系:采用数据可视化技术,以文字和图表展示相结合,通过组合标签展示纳税人信息。
8.根据权利要求7所述的数据可视化分析方法,其特征在于:步骤S1中,涉税数据集成分为税务内部数据、税务外部数据、互联网数据和日常情报数据。
9.根据权利要求8所述的数据可视化分析方法,其特征在于:步骤S2中,纳税人标签包括事实标签、统计标签和预测标签。
10.根据权利要求9所述的数据可视化分析方法,其特征在于:步骤S2中,提取纳税人的行为特征,通过迭代、聚类算法反复测试,结合纳税人的行为数据,抽象出标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811623529.3A CN109726247A (zh) | 2018-12-28 | 2018-12-28 | 一种数据可视化分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811623529.3A CN109726247A (zh) | 2018-12-28 | 2018-12-28 | 一种数据可视化分析系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109726247A true CN109726247A (zh) | 2019-05-07 |
Family
ID=66297487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811623529.3A Pending CN109726247A (zh) | 2018-12-28 | 2018-12-28 | 一种数据可视化分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109726247A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222112A (zh) * | 2019-06-12 | 2019-09-10 | 江南大学 | 一种面向ar说明手册产品的数据可视化分析系统及方法 |
CN110569298A (zh) * | 2019-09-12 | 2019-12-13 | 成都中科大旗软件股份有限公司 | 一种数据对接、可视化方法和系统 |
CN112070428A (zh) * | 2020-07-29 | 2020-12-11 | 京能秦皇岛热电有限公司 | 一种实物与税票管理平台、方法、设备及介质 |
CN112416488A (zh) * | 2020-11-03 | 2021-02-26 | 深圳依时货拉拉科技有限公司 | 一种用户画像实现的方法、装置、计算机设备及计算机可读存储介质 |
CN113191868A (zh) * | 2021-05-06 | 2021-07-30 | 江苏索迩软件技术有限公司 | 一种税务系统的智能风险识别方法 |
CN113343306A (zh) * | 2021-06-29 | 2021-09-03 | 招商局金融科技有限公司 | 基于差分隐私的数据查询方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934712A (zh) * | 2017-03-16 | 2017-07-07 | 深圳微众税银信息服务有限公司 | 一种企业画像数据处理方法及系统 |
CN108460100A (zh) * | 2018-02-02 | 2018-08-28 | 方欣科技有限公司 | 一种用户画像构建方法及装置 |
-
2018
- 2018-12-28 CN CN201811623529.3A patent/CN109726247A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934712A (zh) * | 2017-03-16 | 2017-07-07 | 深圳微众税银信息服务有限公司 | 一种企业画像数据处理方法及系统 |
CN108460100A (zh) * | 2018-02-02 | 2018-08-28 | 方欣科技有限公司 | 一种用户画像构建方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222112A (zh) * | 2019-06-12 | 2019-09-10 | 江南大学 | 一种面向ar说明手册产品的数据可视化分析系统及方法 |
CN110569298A (zh) * | 2019-09-12 | 2019-12-13 | 成都中科大旗软件股份有限公司 | 一种数据对接、可视化方法和系统 |
CN110569298B (zh) * | 2019-09-12 | 2023-03-24 | 成都中科大旗软件股份有限公司 | 一种数据对接、可视化方法和系统 |
CN112070428A (zh) * | 2020-07-29 | 2020-12-11 | 京能秦皇岛热电有限公司 | 一种实物与税票管理平台、方法、设备及介质 |
CN112416488A (zh) * | 2020-11-03 | 2021-02-26 | 深圳依时货拉拉科技有限公司 | 一种用户画像实现的方法、装置、计算机设备及计算机可读存储介质 |
CN112416488B (zh) * | 2020-11-03 | 2024-05-14 | 深圳依时货拉拉科技有限公司 | 一种用户画像实现的方法、装置、计算机设备及计算机可读存储介质 |
CN113191868A (zh) * | 2021-05-06 | 2021-07-30 | 江苏索迩软件技术有限公司 | 一种税务系统的智能风险识别方法 |
CN113343306A (zh) * | 2021-06-29 | 2021-09-03 | 招商局金融科技有限公司 | 基于差分隐私的数据查询方法、装置、设备及存储介质 |
CN113343306B (zh) * | 2021-06-29 | 2024-02-20 | 招商局金融科技有限公司 | 基于差分隐私的数据查询方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109726247A (zh) | 一种数据可视化分析系统及方法 | |
CN109767255B (zh) | 一种通过大数据建模实现智能运营及精准营销的方法 | |
CN106651424B (zh) | 基于大数据技术的电力用户画像建立与分析方法 | |
Ranjan | Business justification with business intelligence | |
Lipaj et al. | Influence of information systems on business performance | |
CN109583796A (zh) | 一种用于物流园区运营分析的数据挖掘系统及方法 | |
CN110851667B (zh) | 一种多源头大量数据的整合分析方法及工具 | |
Quaddus et al. | Handbook of corporate sustainability: frameworks, strategies and tools | |
CN110390475A (zh) | 一种基于集团大数据的预警与决策支持方法 | |
CN107169632A (zh) | 全球媒体形象分析方法、装置和系统 | |
Salim et al. | Towards data quality into the data warehouse development | |
Mkrttchian | Human Capital management in the context of the implementation of digital intelligent decision support systems and knowledge management: theoretical and methodological aspects | |
CN117151415A (zh) | 一种面向城乡融合发展的基础设施规划系统 | |
Mircea et al. | An agile architecture framework that leverages the strengths of business intelligence, decision management and service orientation | |
Wei | Data-Driven Revolution: Advancing Scientific and Technological Innovation in Chinese A-Share Listed Companies | |
Shi et al. | Knowledge management platforms and intelligent knowledge beyond data mining | |
CN115577971A (zh) | 一种基于算法模型的员工能力动态价值评估系统 | |
CN113361911A (zh) | 一种基于资产风控的新媒体内容投放方法及设备 | |
CN112382396A (zh) | 一种医疗器械数据可视化分析系统及方法 | |
CN111126951A (zh) | 一种基于数字化的企业干部人才决策方法 | |
Zhukovskaya et al. | The development of the consulting industry in China | |
Kasemsap | Implementing business intelligence in contemporary organizations | |
Zhong et al. | Research on technology and application of tag portrait based on electric power big data | |
Ragulan et al. | Designing a data warehouse system for sales and distribution company | |
Wang et al. | Construction of knowledge graph for internal control of financial enterprises |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190507 |