CN104732436A - 一种第三方涉税信息采集与分析利用工具 - Google Patents
一种第三方涉税信息采集与分析利用工具 Download PDFInfo
- Publication number
- CN104732436A CN104732436A CN201510135772.0A CN201510135772A CN104732436A CN 104732436 A CN104732436 A CN 104732436A CN 201510135772 A CN201510135772 A CN 201510135772A CN 104732436 A CN104732436 A CN 104732436A
- Authority
- CN
- China
- Prior art keywords
- data
- tax
- model
- information
- related information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000013075 data extraction Methods 0.000 claims abstract description 7
- 238000003908 quality control method Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 6
- 230000008676 import Effects 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000013499 data model Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000013480 data collection Methods 0.000 abstract 1
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Abstract
本发明公开了一种第三方涉税信息采集与分析利用工具,通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过数据质量控制模型和工具实现采集数据的清洗与加工;通过数据关联模型实现数据与纳税人登记信息关联;通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。本发明提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。
Description
技术领域
本发明涉及处理第三方涉税信息抽取、清洗、关联、利用工具的领域,具体涉及一种第三方涉税信息采集与分析利用工具,对第三方涉税信息不对称性、广泛多样性有很好的处理结果,适用于政府部门之间涉税数据共享、大量涉税数据分析利用产生有价值的税源信息的应用场景。
背景技术
随着经济社会的转型和信息技术发展,大量的行政、事业单位内包含有大量有价值的涉税信息,比如,工商、社保、交通、国土等部门,由于不同单位间的信息系统成为一个个信息孤岛,这些信息对于税务部门来说都没有得到有效的应用。如何充分利用第三方涉税信息资源,破解税收征管难题,进一步提高税源监控管理水平,切实起到堵漏增收,营造公平、公正、透明的税收发展环境有着积极而重要的意义。目前通用的采集工具,用户使用较为复杂,不能切实贴近税务系统,且采集的信息未得到有效的分析利用。
第三方涉税信息采集与分析利用工具为以上问题提出了解决的方法,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的。此数据交换工具既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。
发明内容
本发明的目的是:本发明专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发。
本发明要解决的技术问题是:
1)数据采集工具问题,技术门槛高,需要专业的技能;数据量大,数据采集需要占用大量的服务器资源;
2)数据的清洗加工过程复杂,需清洗出高质量的结构化数据;
3)数据关联过程复杂多样,需多种关联模型,关联出有效的数据;
4)数据的派发反馈过程多变,需可配置流程。
本发明所采用的技术方案为:
一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;
通过数据质量控制模型和工具实现采集数据的清洗与加工;
通过数据关联模型实现数据与纳税人登记信息关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。
整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。
所述工具操作流程如下:
1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
本发明的有益效果为:本发明专利提供一种灵活的、轻量的、可配置、可监控的技术实现第三方涉税信息的采集、交换、清洗、加工、关联、派发,用户通过简单配置之后可以根据自己的需求,定义数据采集模型,定义数据抽取时间等配置,即可实现对数据的统一采集,完成数据交换,并可对采集的数据清洗、关联、派发得到产生经济效益的目的,既节省用户学习抽取工具的时间,又可以很好、很快捷的完成数据交换,又节约了项目的成本。
附图说明
图1 为本发明总体架构示意图;
图2为本发明总体流程图。
具体实施方式
下面通过具体实施方式对本发明进一步说明:
实施例1:
一种第三方涉税信息采集与分析利用工具,所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;通过配置管理对数据源、抽数表对象及抽数规则进行配置定义,使用定时器引擎(提供数据层、应用层接口),调用抽数引擎(支持复杂的抽数处理规则),完成数据的采集过程;
通过数据质量控制模型和工具实现采集数据的清洗与加工;运用多种数据清洗工具,通过内置数据计算功能,自动调度等实现数据的清洗过程;
通过数据关联模型实现数据与纳税人登记信息关联;运用数据关联模型,在目标与户籍信息中建立映射关系库,通过组织机构代码或识别号等多种方式实现数据关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用;
数据派发反馈过程引入轻量工作流,实现派发的流程可配置。
实施例2:
在实施例1的基础上,本实施例整个信息处理过程通过监控引擎进行记录,能在监控日志、异常预警、预警展示中对处理过程进行处理。
实施例3:
如图2所示,在实施例1或2的基础上,本实施例所述工具操作流程如下:
1)采集数据前需确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (3)
1.一种第三方涉税信息采集与分析利用工具,其特征在于:所述工具通过配置采集的模型和数据抽取工具,实现涉税信息的批量采集分类;
通过数据质量控制模型和工具实现采集数据的清洗与加工;
通过数据关联模型实现数据与纳税人登记信息关联;
通过数据比对模型实现疑点任务派发以及任务的核查反馈,保证涉税信息的充分利用。
2.根据权利要求1所述的一种第三方涉税信息采集与分析利用工具,其特征在于:整个信息处理过程通过监控引擎进行记录,能够在监控日志、异常预警、预警展示中对处理过程进行处理。
3.根据权利要求1或2所述的一种第三方涉税信息采集与分析利用工具,其特征在于,所述工具操作流程如下:
1)采集数据前确定采集数据的结构化模型、根据采集数据信息的结构化模型定义采集数据模型;
2)数据抽取的及导入的配置阶段,配置采集数据源配置,采集数据表配置,抽取时间配置,抽取表配置,并实现EXCEL文档数据的导入;
3)数据加工清洗阶段,采用数据筛选、数据修改、列复制、数据去重工具对原始数据手工或者自动清洗加工处理;
4)数据关联匹配阶段,配置关联模型对采集的信息与户籍信息关联匹配,对关联的结果确认,修改;
5)数据整理派发阶段,对具有相同纳税人的信息合并,派发,并按照配置的流程派发到最终的人员;
6)数据核查反馈阶段,对任务的第三方信息关联核查,最终导入核查结果的税款入库信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510135772.0A CN104732436A (zh) | 2015-03-26 | 2015-03-26 | 一种第三方涉税信息采集与分析利用工具 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510135772.0A CN104732436A (zh) | 2015-03-26 | 2015-03-26 | 一种第三方涉税信息采集与分析利用工具 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104732436A true CN104732436A (zh) | 2015-06-24 |
Family
ID=53456308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510135772.0A Pending CN104732436A (zh) | 2015-03-26 | 2015-03-26 | 一种第三方涉税信息采集与分析利用工具 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104732436A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653696A (zh) * | 2015-12-29 | 2016-06-08 | 台山核电合营有限公司 | 一种核电站数据库数据处理方法及系统 |
CN105741170A (zh) * | 2016-01-29 | 2016-07-06 | 浪潮软件集团有限公司 | 一种第三方涉税信息处理方法及装置 |
CN107463664A (zh) * | 2017-08-01 | 2017-12-12 | 山东浪潮云服务信息科技有限公司 | 一种基于政务数据采集的etl处理方法及装置 |
CN111090682A (zh) * | 2019-11-15 | 2020-05-01 | 湖北瑞致和科技有限公司 | 一种税务第三方数据利用共享系统及装置 |
CN115563069A (zh) * | 2022-09-27 | 2023-01-03 | 高丹 | 基于人工智能的数据共享处理方法、系统及云平台 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101136101A (zh) * | 2007-04-02 | 2008-03-05 | 四川亚元防伪科技有限公司 | “核量控票、核票控税”“数据大跟踪”税控方法、系统构建和操作方法 |
JP2011070563A (ja) * | 2009-09-28 | 2011-04-07 | Jsol Corp | 電話催告システム及び電話催告用プログラム |
US8165997B1 (en) * | 2009-07-27 | 2012-04-24 | Intuit Inc. | Method and system for classifying postings in a forum |
CN103177514A (zh) * | 2011-12-20 | 2013-06-26 | 航天信息股份有限公司 | 税控业务实现方法及系统 |
CN103455500A (zh) * | 2012-05-30 | 2013-12-18 | 航天信息股份有限公司 | 一种数据抽取和下发的方法及其装置 |
-
2015
- 2015-03-26 CN CN201510135772.0A patent/CN104732436A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101136101A (zh) * | 2007-04-02 | 2008-03-05 | 四川亚元防伪科技有限公司 | “核量控票、核票控税”“数据大跟踪”税控方法、系统构建和操作方法 |
US8165997B1 (en) * | 2009-07-27 | 2012-04-24 | Intuit Inc. | Method and system for classifying postings in a forum |
JP2011070563A (ja) * | 2009-09-28 | 2011-04-07 | Jsol Corp | 電話催告システム及び電話催告用プログラム |
CN103177514A (zh) * | 2011-12-20 | 2013-06-26 | 航天信息股份有限公司 | 税控业务实现方法及系统 |
CN103455500A (zh) * | 2012-05-30 | 2013-12-18 | 航天信息股份有限公司 | 一种数据抽取和下发的方法及其装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653696A (zh) * | 2015-12-29 | 2016-06-08 | 台山核电合营有限公司 | 一种核电站数据库数据处理方法及系统 |
CN105741170A (zh) * | 2016-01-29 | 2016-07-06 | 浪潮软件集团有限公司 | 一种第三方涉税信息处理方法及装置 |
CN107463664A (zh) * | 2017-08-01 | 2017-12-12 | 山东浪潮云服务信息科技有限公司 | 一种基于政务数据采集的etl处理方法及装置 |
CN111090682A (zh) * | 2019-11-15 | 2020-05-01 | 湖北瑞致和科技有限公司 | 一种税务第三方数据利用共享系统及装置 |
CN111090682B (zh) * | 2019-11-15 | 2023-09-01 | 湖北瑞致和科技有限公司 | 一种税务第三方数据利用共享系统及装置 |
CN115563069A (zh) * | 2022-09-27 | 2023-01-03 | 高丹 | 基于人工智能的数据共享处理方法、系统及云平台 |
CN115563069B (zh) * | 2022-09-27 | 2024-01-16 | 北京燕华科技发展有限公司 | 基于人工智能的数据共享处理方法、系统及云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104732436A (zh) | 一种第三方涉税信息采集与分析利用工具 | |
CN105528280B (zh) | 系统日志与健康监控关系决定日志告警等级的方法及系统 | |
CN104361445B (zh) | 劳动力实时管理系统及管理方法 | |
Guoyou et al. | Stakeholders' influences on corporate green innovation strategy: A case study of manufacturing firms in China | |
CN103824159B (zh) | 科研项目经费预算执行智能提醒系统 | |
CN104348667A (zh) | 基于告警信息的故障定位方法 | |
CN105373472B (zh) | 一种基于数据库的统计准确性的测试方法及测试系统 | |
CN106056511A (zh) | 一种药物临床试验网络化监督管理系统 | |
CN106504161A (zh) | 一种动物卫生风险管理方法和系统 | |
CN103475535A (zh) | 云计算服务器日志管理系统 | |
CN102346901A (zh) | 一种互联网药品交易主体信用评估系统及其方法 | |
CN105930511A (zh) | 一种answer大数据订阅平台 | |
CN106022659A (zh) | 一种网格化农产品质量安全监管系统 | |
CN103679353A (zh) | 报表处理的方法及系统 | |
CN106845916A (zh) | 一种基于净水器的智能app考勤管理及状态监控方法 | |
CN106355489A (zh) | 一种面向管理的数据中心系统及数据处理方法 | |
CN105589796A (zh) | 用于监测信息交互数据异常的方法 | |
CN103701850A (zh) | 一种农事黄历云管理系统及其方法 | |
CN109284330A (zh) | 一种用于园区的物联网大数据管理系统 | |
CN103116860A (zh) | 一种企业税务档案管理平台 | |
CN106446164A (zh) | Sql审计系统及方法 | |
CN109165203A (zh) | 基于Hadoop架构的大型公共建筑能耗数据存储分析方法 | |
CN112667736B (zh) | 一种数字运营管理系统 | |
Escalona | E-policing in the PNP Laoag City police station: Case study | |
CN105741170A (zh) | 一种第三方涉税信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150624 |