CN104732436A - 一种第三方涉税信息采集与分析利用工具 - Google Patents

一种第三方涉税信息采集与分析利用工具 Download PDF

Info

Publication number
CN104732436A
CN104732436A CN201510135772.0A CN201510135772A CN104732436A CN 104732436 A CN104732436 A CN 104732436A CN 201510135772 A CN201510135772 A CN 201510135772A CN 104732436 A CN104732436 A CN 104732436A
Authority
CN
China
Prior art keywords
data
tax
model
information
related information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510135772.0A
Other languages
English (en)
Inventor
李俊峰
邹建军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Group Co Ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN201510135772.0A priority Critical patent/CN104732436A/zh
Publication of CN104732436A publication Critical patent/CN104732436A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种第三方涉税信息采集与分析利用工具,通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过数据质量控制模型和工具实现采集数据的清洗与加工;通过数据关联模型实现数据与纳税人登记信息关联;通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。本发明提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。

Description

一种第三方涉税信息采集与分析利用工具
技术领域
本发明涉及处理第三方涉税信息抽取、清洗、关联、利用工具的领域,具体涉及一种第三方涉税信息采集与分析利用工具,对第三方涉税信息不对称性、广泛多样性有很好的处理结果,适用于政府部门之间涉税数据共享、大量涉税数据分析利用产生有价值的税源信息的应用场景。
背景技术
随着经济社会的转型和信息技术发展,大量的行政、事业单位内包含有大量有价值的涉税信息,比如,工商、社保、交通、国土等部门,由于不同单位间的信息系统成为一个个信息孤岛,这些信息对于税务部门来说都没有得到有效的应用。如何充分利用第三方涉税信息资源,破解税收征管难题,进一步提高税源监控管理水平,切实起到堵漏增收,营造公平、公正、透明的税收发展环境有着积极而重要的意义。目前通用的采集工具,用户使用较为复杂,不能切实贴近税务系统,且采集的信息未得到有效的分析利用。
第三方涉税信息采集与分析利用工具为以上问题提出了解决的方法,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。此数据交换工具既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。
发明内容
本发明的目的是:本发明专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发。
本发明要解决的技术问题是:
1)数据采集工具问题,技术门槛高,需要专业的技能;数据量大,数据采集需要占用大量的服务器资源;
2)数据的清洗加工过程复杂,需清洗出高质量的结构化数据;
3)数据关联过程复杂多样,需多种关联模型,关联出有效的数据;
4)数据的派发反馈过程多变,需可配置流程。
本发明所采用的技术方案为:
一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;
通过数据质量控制模型和工具实现采集数据的清洗与加工;
通过数据关联模型实现数据与纳税人登记信息关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。
整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。
所述工具操作流程如下:
1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
本发明的有益效果为:本发明专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的,既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。
附图说明
图1 为本发明总体架构示意图;
图2为本发明总体流程图。
具体实施方式
下面通过具体实施方式对本发明进一步说明:
实施例1:
一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过配置管理对数据源、抽数表对象及抽数规则进行配置定义,使用定时器引擎(提供数据层、应用层接口),调用抽数引擎(支持复杂的抽数处理规则),完成数据的采集过程;
通过数据质量控制模型和工具实现采集数据的清洗与加工;运用多种数据清洗工具,通过内置数据计算功能,自动调度等实现数据的清洗过程;
通过数据关联模型实现数据与纳税人登记信息关联;运用数据关联模型,在目标与户籍信息中建立映射关系库,通过组织机构代码或识别号等多种方式实现数据关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用;
数据派发反馈过程引入轻量工作流,实现派发的流程可配置。
实施例2:
在实施例1的基础上,本实施例整个信息处理过程通过监控引擎进行记录,能在监控日志、异常预警、预警展示中对处理过程进行处理。
实施例3:
如图2所示,在实施例1或2的基础上,本实施例所述工具操作流程如下:
1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (3)

1.一种第三方涉税信息采集与分析利用工具,其特征在于:所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;
通过数据质量控制模型和工具实现采集数据的清洗与加工;
通过数据关联模型实现数据与纳税人登记信息关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。
2.根据权利要求1所述的一种第三方涉税信息采集与分析利用工具,其特征在于:整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。
3.根据权利要求1或2所述的一种第三方涉税信息采集与分析利用工具,其特征在于,所述工具操作流程如下:
1)采集数据前确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
CN201510135772.0A 2015-03-26 2015-03-26 一种第三方涉税信息采集与分析利用工具 Pending CN104732436A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510135772.0A CN104732436A (zh) 2015-03-26 2015-03-26 一种第三方涉税信息采集与分析利用工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510135772.0A CN104732436A (zh) 2015-03-26 2015-03-26 一种第三方涉税信息采集与分析利用工具

Publications (1)

Publication Number Publication Date
CN104732436A true CN104732436A (zh) 2015-06-24

Family

ID=53456308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510135772.0A Pending CN104732436A (zh) 2015-03-26 2015-03-26 一种第三方涉税信息采集与分析利用工具

Country Status (1)

Country Link
CN (1) CN104732436A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653696A (zh) * 2015-12-29 2016-06-08 台山核电合营有限公司 一种核电站数据库数据处理方法及系统
CN105741170A (zh) * 2016-01-29 2016-07-06 浪潮软件集团有限公司 一种第三方涉税信息处理方法及装置
CN107463664A (zh) * 2017-08-01 2017-12-12 山东浪潮云服务信息科技有限公司 一种基于政务数据采集的etl处理方法及装置
CN111090682A (zh) * 2019-11-15 2020-05-01 湖北瑞致和科技有限公司 一种税务第三方数据利用共享系统及装置
CN115563069A (zh) * 2022-09-27 2023-01-03 高丹 基于人工智能的数据共享处理方法、系统及云平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136101A (zh) * 2007-04-02 2008-03-05 四川亚元防伪科技有限公司 “核量控票、核票控税”“数据大跟踪”税控方法、系统构建和操作方法
JP2011070563A (ja) * 2009-09-28 2011-04-07 Jsol Corp 電話催告システム及び電話催告用プログラム
US8165997B1 (en) * 2009-07-27 2012-04-24 Intuit Inc. Method and system for classifying postings in a forum
CN103177514A (zh) * 2011-12-20 2013-06-26 航天信息股份有限公司 税控业务实现方法及系统
CN103455500A (zh) * 2012-05-30 2013-12-18 航天信息股份有限公司 一种数据抽取和下发的方法及其装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136101A (zh) * 2007-04-02 2008-03-05 四川亚元防伪科技有限公司 “核量控票、核票控税”“数据大跟踪”税控方法、系统构建和操作方法
US8165997B1 (en) * 2009-07-27 2012-04-24 Intuit Inc. Method and system for classifying postings in a forum
JP2011070563A (ja) * 2009-09-28 2011-04-07 Jsol Corp 電話催告システム及び電話催告用プログラム
CN103177514A (zh) * 2011-12-20 2013-06-26 航天信息股份有限公司 税控业务实现方法及系统
CN103455500A (zh) * 2012-05-30 2013-12-18 航天信息股份有限公司 一种数据抽取和下发的方法及其装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653696A (zh) * 2015-12-29 2016-06-08 台山核电合营有限公司 一种核电站数据库数据处理方法及系统
CN105741170A (zh) * 2016-01-29 2016-07-06 浪潮软件集团有限公司 一种第三方涉税信息处理方法及装置
CN107463664A (zh) * 2017-08-01 2017-12-12 山东浪潮云服务信息科技有限公司 一种基于政务数据采集的etl处理方法及装置
CN111090682A (zh) * 2019-11-15 2020-05-01 湖北瑞致和科技有限公司 一种税务第三方数据利用共享系统及装置
CN111090682B (zh) * 2019-11-15 2023-09-01 湖北瑞致和科技有限公司 一种税务第三方数据利用共享系统及装置
CN115563069A (zh) * 2022-09-27 2023-01-03 高丹 基于人工智能的数据共享处理方法、系统及云平台
CN115563069B (zh) * 2022-09-27 2024-01-16 北京燕华科技发展有限公司 基于人工智能的数据共享处理方法、系统及云平台

Similar Documents

Publication Publication Date Title
CN104732436A (zh) 一种第三方涉税信息采集与分析利用工具
CN105528280B (zh) 系统日志与健康监控关系决定日志告警等级的方法及系统
CN104361445B (zh) 劳动力实时管理系统及管理方法
Guoyou et al. Stakeholders' influences on corporate green innovation strategy: A case study of manufacturing firms in China
CN103824159B (zh) 科研项目经费预算执行智能提醒系统
CN104348667A (zh) 基于告警信息的故障定位方法
CN105373472B (zh) 一种基于数据库的统计准确性的测试方法及测试系统
CN106056511A (zh) 一种药物临床试验网络化监督管理系统
CN106504161A (zh) 一种动物卫生风险管理方法和系统
CN103475535A (zh) 云计算服务器日志管理系统
CN102346901A (zh) 一种互联网药品交易主体信用评估系统及其方法
CN105930511A (zh) 一种answer大数据订阅平台
CN106022659A (zh) 一种网格化农产品质量安全监管系统
CN103679353A (zh) 报表处理的方法及系统
CN106845916A (zh) 一种基于净水器的智能app考勤管理及状态监控方法
CN106355489A (zh) 一种面向管理的数据中心系统及数据处理方法
CN105589796A (zh) 用于监测信息交互数据异常的方法
CN103701850A (zh) 一种农事黄历云管理系统及其方法
CN109284330A (zh) 一种用于园区的物联网大数据管理系统
CN103116860A (zh) 一种企业税务档案管理平台
CN106446164A (zh) Sql审计系统及方法
CN109165203A (zh) 基于Hadoop架构的大型公共建筑能耗数据存储分析方法
CN112667736B (zh) 一种数字运营管理系统
Escalona E-policing in the PNP Laoag City police station: Case study
CN105741170A (zh) 一种第三方涉税信息处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150624