CN108230127A - 一种通过顶版开票率监控企业虚开发票的方法和系统 - Google Patents
一种通过顶版开票率监控企业虚开发票的方法和系统 Download PDFInfo
- Publication number
- CN108230127A CN108230127A CN201611198516.7A CN201611198516A CN108230127A CN 108230127 A CN108230127 A CN 108230127A CN 201611198516 A CN201611198516 A CN 201611198516A CN 108230127 A CN108230127 A CN 108230127A
- Authority
- CN
- China
- Prior art keywords
- invoice
- taxpayer
- ceiling
- amount
- rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种通过顶版开票率监控企业虚开发票的方法和系统,所述方法包括:步骤1、获取发票信息数据库中的发票,使用分析工具sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库;步骤2、获取纳税人指定开票金额字段,进行抽取‑转换‑加载ETL过程,将处理后的纳税人指定开票金额存入数据仓库;步骤3、当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于第一预定值时,确定所述发票为顶版开票,使用sparkSQL计算出每个纳税人以月为粒度的纳税人顶版开票数量;步骤4、使用sparkSQL计算顶版开票率;步骤5、当纳税人的顶版开票率大于第二预定值时,判定该疑点纳税人为高危疑点纳税人。
Description
技术领域
本发明涉及税控应用领域,并且更具体地,涉及一种通过顶版开票率监控企业虚开发票的方法和系统。
背景技术
在“以票管税”的税收征管模式下,增值税专用发票是税收征管的核心。增值税防伪税控系统的推广使用极大地增加了国家的税收并且已经成为国家税收征管的强有力手段之一,但是仍然有企业利用现有税收征管手段的不足从事违法经营活动。在增值税税收的过程中,税局工作人员反应经常出现各类虚开增值税发票的情况,典型的主要有以下四种:
一是“借壳”虚开。例如,不法分子在乡镇等较偏僻的地区租借经营不良企业的厂房或民房,成立若干个药业或药材公司,以收购加工中药材之名,购置一些简单的加工设备和少量中药材作为“道具”,从税务机关套取农产品收购发票和增值税专用发票,通过为自己虚开农产品收购发票抵扣进项税款,为他人虚开增值税专用发票,从中收取开票“手续费”。
二是“买壳”虚开。一些不法分子用少量的资金“盘下”经营不善企业作为操作平台,在没有货物出口的情况下,采用“异地报关、两头在外”的出口模式,通过“配货、配单、配票”的办法,将他人的出口业务虚构为自己的出口业务,以达到骗取出口退税的目的。
三是“冒壳”虚开。一些不法分子利用购买货物但不需要增值税专用发票抵扣的企业、个体工商户和消费者的“开票额”,虚构进货业务,或采用“票货分离”方式,从销货企业套取增值税专用发票来抵扣进项税额,然后对外大量虚开增值税专用发票,从中牟利。
四是“造壳”虚开。一些不法分子通过民间借贷资金注册虚假公司或空壳公司,将生产设备出租给其他个人,由承租人自行承接受托加工业务自主经营、自负盈亏,涉案企业将承租人的生产经营活动虚构为自己公司的生产经营活动,骗取认定增值税一般纳税人资格并从税务机关套取增值税专用发票,为自己在异地设立或参股经营的企业虚开,然后通过异地关联企业“配货、配票、配资金”,操作虚假“出口”业务以达到骗取出口退税的目的。
在这四类典型虚开增值税发票的情况中,税局工作人员发现一个共同的特征:发票的顶版开票率都达到了90%以上。所以根据税局工作人员经验,顶版开票率高是一个显著的疑点特征。
随着营改增的推行,数据量逐渐增大,如何在税收征管中更好更精确的计算出疑点纳税人,成为税收征管工作中的一大核心问题。
发明内容
为了解决背景技术存在的上述问题,本发明提供一种通过顶版开票率监控企业虚开发票的方法,其特征在于,所述方法包括:
步骤1、获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用分析工具sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库;
步骤2、获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行抽取-转换-加载ETL过程,将处理后的纳税人指定开票金额存入数据仓库;
步骤3、当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于第一预定值时,确定所述发票为顶版开票,使用sparkSQL计算出每个纳税人以月为粒度的纳税人顶版开票数量;
步骤4、使用sparkSQL计算顶版开票率,其中计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数;
步骤5、根据顶版开票率对疑点纳税人进行筛选,当疑点纳税人的顶版开票率大于第二预定值时,判定该疑点纳税人为高危疑点纳税人。
进一步地,所述发票信息数据库是电子抵账库,所述纳税人信息数据库是金税三期库。
进一步地,所述第一预定值是0.9。
进一步地,所述第二预定值是0.9。
根据本发明的另一方面,本发明提供一种通过顶版开票率监控企业虚开发票的系统,所述系统包括:
开票金额计算单元,其用于获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库;
指定开票金额计算单元,其用于获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行ETL过程,将处理后的纳税人指定开票金额存入数据仓库;
顶版开票数量计算单元,其用于使用sparkSQL计算每个纳税人以月为粒度的纳税人顶版开票数量,其中当每张发票的开票金额与指定开票金额的比值大于等于第一预定值时,确定所述发票为顶版开票;
顶版开票率计算单元,其用于使用sparkSQL计算顶版开票率,计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数;
高危疑点纳税人确定单元,其用于当疑点纳税人的顶版开票率大于第二预定值时,确定该疑点纳税人为高危疑点纳税人。
进一步地,所述开票金额计算单元中的发票信息数据库是电子抵账库,所述指定开票金额计算单元中的纳税人信息数据库是金税三期库。
进一步地,顶版开票数量计算单元中的第一预定值为0.9。
进一步地,顶版开票率计算单元中的第二预定值为0.9。
本发明提供的通过顶版开票率监控企业虚开发票的方法和系统利用Spark将工作中间输出结果保存在内存中,较好地实现了发票数据的挖掘,从而能够比较精确地计算出疑点纳税人。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1是本发明具体实施方式的通过顶版开票率监控企业虚开发票的方法的流程图;以及
图2是本发明具体实施方式的通过顶版开票率监控企业虚开发票的系统的结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1是本发明具体实施方式的通过顶版开票率监控企业虚开发票的方法的流程图。如图1所示,所述通过顶版开票率监控企业虚开发票的方法100从步骤S101开始。
在步骤101,获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用分析工具sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库。
在步骤102,获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行抽取-转换-加载ETL过程,将处理后的纳税人指定开票金额存入数据仓库。
在步骤103,当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于第一预定值时,确定所述发票为顶版开票,使用sparkSQL计算出每个纳税人以月为粒度的纳税人顶版开票数量。
在步骤S104,使用sparkSQL计算顶版开票率,其中计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数;
在步骤S105,根据顶版开票率对疑点纳税人进行筛选,当疑点纳税人的顶版开票率大于第二预定值时,判定该疑点纳税人为高危疑点纳税人。
优选地,所述发票信息数据库是电子抵账库,所述纳税人信息数据库是金税三期库。
优选地,所述第一预定值是0.9,即当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于0.9时,确定所述发票为顶版开票。
优选地,所述第二预定值是0.9,即根据顶版开票率对疑点纳税人进行筛选,当疑点纳税人的顶版开票率大于0.9时,判定该疑点纳税人为高危疑点纳税人。
图2是本发明具体实施方式的通过顶版开票率监控企业虚开发票的系统的结构图。如图2所示,通过顶版开票率监控企业虚开发票的系统200包括开票金额计算单元201、指定开票金额计算单元202、顶版开票数量计算单元203、顶版开票率计算单元204和高危疑点纳税人确定单元205。
开票金额计算单元201,其用于获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库。
指定开票金额计算单元202,其用于获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行ETL过程,将处理后的纳税人指定开票金额存入数据仓库。
顶版开票数量计算单元203,其用于使用sparkSQL计算每个纳税人以月为粒度的纳税人顶版开票数量,其中当每张发票的开票金额与指定开票金额的比值大于等于第一预定值时,确定所述发票为顶版开票。
顶版开票率计算单元204,其用于使用sparkSQL计算顶版开票率,计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数。
高危疑点纳税人确定单元205,其用于当疑点纳税人的顶版开票率大于第二预定值时,确定该疑点纳税人为高危疑点纳税人。
优选地,所述开票金额计算单元中的发票信息数据库是电子抵账库,所述指定开票金额计算单元中的纳税人信息数据库是金税三期库。
优选地,顶版开票数量计算单元203中的第一预定值为0.9,即当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于0.9时,确定所述发票为顶版开票。
优选地,顶版开票率计算单元中的第二预定值为0.9,即根据顶版开票率对疑点纳税人进行筛选,当疑点纳税人的顶版开票率大于0.9时,判定该疑点纳税人为高危疑点纳税人。
已经通过上述实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该【装置、组件等】”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
Claims (8)
1.一种通过顶版开票率监控企业虚开发票的方法,其特征在于,所述方法包括:
步骤1、获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用分析工具sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库;
步骤2、获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行抽取-转换-加载ETL过程,将处理后的纳税人指定开票金额存入数据仓库;
步骤3、当每张发票的开票金额与所述纳税人指定开票金额的比值大于或等于第一预定值时,确定所述发票为顶版开票,使用sparkSQL计算出每个纳税人以月为粒度的纳税人顶版开票数量;
步骤4、使用sparkSQL计算顶版开票率,其中计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数;
步骤5、根据顶版开票率对疑点纳税人进行筛选,当疑点纳税人的顶版开票率大于第二预定值时,判定该疑点纳税人为高危疑点纳税人。
2.根据权利要求1所述的方法,其特征在于,所述发票信息数据库是电子抵账库,所述纳税人信息数据库是金税三期库。
3.根据权利要求1所述的方法,其特征在于,所述第一预定值是0.9。
4.根据权利要求1所述的方法,其特征在于,所述第二预定值是0.9。
5.一种通过顶版开票率监控企业虚开发票的系统,其特征在于,所述系统包括:
开票金额计算单元,其用于获取发票信息数据库中的增值税发票、机动车发票、普通发票、货运发票和认证抵扣联,使用sparkSQL计算纳税人以月为粒度的开票金额,并且将所述以月为粒度的开票金额存入数据仓库;
指定开票金额计算单元,其用于获取纳税人信息数据库内发票票证表中的纳税人指定开票金额字段,进行ETL过程,将处理后的纳税人指定开票金额存入数据仓库;
顶版开票数量计算单元,其用于使用sparkSQL计算每个纳税人以月为粒度的纳税人顶版开票数量,其中当每张发票的开票金额与指定开票金额的比值大于等于第一预定值时,确定所述发票为顶版开票;
顶版开票率计算单元,其用于使用sparkSQL计算顶版开票率,计算顶版开票率的公式如下:
顶版开票率=顶版开票数量/发票总数;
高危疑点纳税人确定单元,其用于当疑点纳税人的顶版开票率大于第二预定值时,确定该疑点纳税人为高危疑点纳税人。
6.根据权利要求5所述的系统,其特征在于,所述开票金额计算单元中的发票信息数据库是电子抵账库,所述指定开票金额计算单元中的纳税人信息数据库是金税三期库。
7.根据权利要求5所述的系统,其特征在于,所述第一预定值为0.9。
8.根据权利要求5所述的系统,其特征在于,所述第二预定值为0.9。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611198516.7A CN108230127A (zh) | 2016-12-22 | 2016-12-22 | 一种通过顶版开票率监控企业虚开发票的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611198516.7A CN108230127A (zh) | 2016-12-22 | 2016-12-22 | 一种通过顶版开票率监控企业虚开发票的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108230127A true CN108230127A (zh) | 2018-06-29 |
Family
ID=62656962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611198516.7A Pending CN108230127A (zh) | 2016-12-22 | 2016-12-22 | 一种通过顶版开票率监控企业虚开发票的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108230127A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614416A (zh) * | 2018-10-30 | 2019-04-12 | 平安科技(深圳)有限公司 | 一种基于数据统计分析的发票管理方法及装置 |
CN111222928A (zh) * | 2019-12-30 | 2020-06-02 | 航天信息股份有限公司 | 一种用于监控企业规范开具发票的方法及系统 |
CN111311340A (zh) * | 2018-12-10 | 2020-06-19 | 航天信息股份有限公司 | 一种识别虚开发票行为的方法及装置 |
CN112529453A (zh) * | 2020-12-21 | 2021-03-19 | 航天信息股份有限公司 | 一种风险企业确定方法、装置、设备和介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679972A (zh) * | 2013-12-26 | 2014-03-26 | 北京德信易税网络技术有限公司 | 税控终端的监控方法、装置及系统 |
CN104700303A (zh) * | 2013-12-05 | 2015-06-10 | 航天信息股份有限公司 | 从增值税普通发票中分析货物流向监控企业逃税的方法 |
CN104700304A (zh) * | 2013-12-05 | 2015-06-10 | 航天信息股份有限公司 | 通过增值税普通发票的金额监控企业逃税的方法和系统 |
-
2016
- 2016-12-22 CN CN201611198516.7A patent/CN108230127A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700303A (zh) * | 2013-12-05 | 2015-06-10 | 航天信息股份有限公司 | 从增值税普通发票中分析货物流向监控企业逃税的方法 |
CN104700304A (zh) * | 2013-12-05 | 2015-06-10 | 航天信息股份有限公司 | 通过增值税普通发票的金额监控企业逃税的方法和系统 |
CN103679972A (zh) * | 2013-12-26 | 2014-03-26 | 北京德信易税网络技术有限公司 | 税控终端的监控方法、装置及系统 |
Non-Patent Citations (1)
Title |
---|
晓力: "挖掘数据潜力防范税收风险的成效与建议", 《税收征纳》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614416A (zh) * | 2018-10-30 | 2019-04-12 | 平安科技(深圳)有限公司 | 一种基于数据统计分析的发票管理方法及装置 |
CN111311340A (zh) * | 2018-12-10 | 2020-06-19 | 航天信息股份有限公司 | 一种识别虚开发票行为的方法及装置 |
CN111311340B (zh) * | 2018-12-10 | 2024-02-13 | 航天信息股份有限公司 | 一种识别虚开发票行为的方法及装置 |
CN111222928A (zh) * | 2019-12-30 | 2020-06-02 | 航天信息股份有限公司 | 一种用于监控企业规范开具发票的方法及系统 |
CN112529453A (zh) * | 2020-12-21 | 2021-03-19 | 航天信息股份有限公司 | 一种风险企业确定方法、装置、设备和介质 |
CN112529453B (zh) * | 2020-12-21 | 2024-02-20 | 航天信息股份有限公司 | 一种风险企业确定方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
D’Silva et al. | The design of digital financial infrastructure: lessons from India | |
Davidson et al. | ‘Picking up the pieces’: austerity urbanism, California and fiscal crisis | |
D'Erasmo et al. | Financial structure, informality and development | |
Slavtchev et al. | Does the technological content of government demand matter for private R&D? Evidence from US states | |
Bennett et al. | On the need for national land administration infrastructures | |
CN108230127A (zh) | 一种通过顶版开票率监控企业虚开发票的方法和系统 | |
Fatica et al. | How much profit shifting do European banks do? | |
CN109447783A (zh) | 授信方法、装置、终端设备及存储介质 | |
Zahedi-Seresht et al. | A robust data envelopment analysis model with different scenarios | |
US20130144782A1 (en) | Electronic invoice payment prediction system and method | |
Skiba | Tax rebates and the cycle of payday borrowing | |
CN108875981A (zh) | 一种房屋维修资金归集和使用的信息系统及其使用方法 | |
JP2014093041A (ja) | 遺産管理プログラムおよび遺産管理システム | |
Unel et al. | Sustainable tax system design for use of mass real estate appraisal in land management | |
Aribigbola | Urban land use planning, policies and management in Sub Saharan African countries: Empirical evidence from Akure, Nigeria | |
Kibet et al. | Towards A Blockchain-Based Smart Contracts Model Design For Housing Market Applications | |
Jonas et al. | Endangered neoliberal suburbanism? The use of the Federal Endangered Species Act as a growth management tool in southern California | |
Mehrotra et al. | A depository institution's optimal currency supply network under the Fed's new guidelines: Operating policies, logistics, and impact | |
Bhattacharya et al. | Local institutional structure and clientelistic access to employment: the case of MGNREGS in three states of India | |
CN109447571A (zh) | 自来水业务管理方法及系统 | |
Mao | Testing for error cross‐sectional independence using pairwise augmented regressions | |
Buettner | Equalization Transfers and Dynamic Fiscal Adjustment: Results for German Municipalities and a US-German Comparison | |
KR20050081337A (ko) | 통합 보험 컨설팅 시스템 | |
Sukrri et al. | An enhanced house price index model in Malaysia: A Laspeyres approach | |
Saha | Labour institutions in China and India: A tale of two nations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |