CN112232894A - 基于增值税发票的数据分析方法 - Google Patents
基于增值税发票的数据分析方法 Download PDFInfo
- Publication number
- CN112232894A CN112232894A CN202011159645.1A CN202011159645A CN112232894A CN 112232894 A CN112232894 A CN 112232894A CN 202011159645 A CN202011159645 A CN 202011159645A CN 112232894 A CN112232894 A CN 112232894A
- Authority
- CN
- China
- Prior art keywords
- invoice
- data
- taxpayer
- information
- tax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 31
- 238000010586 diagram Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims description 8
- 239000003086 colorant Substances 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/04—Billing or invoicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于增值税发票的数据分析方法。其包括如下步骤:步骤1、获取发票数据信息,并将所述发票数据信息处理后得到所需的发票汇总信息;步骤2、对任一纳税人,对所述发票汇总信息中的交易信息,得到所述当前纳税人所对应的发票数据上下游关联数据;步骤3、根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,利用不同纳税人之间的关联关系绘制发票开具关联关系导图,在所述绘制的一发票开关关联关系导图中,每个节点对应唯一的纳税人,且在每个节点能拓展所需的纳税相关信息。本发明能有效对票据的关系进行有效展示与分析,提高数据分析的效率。
Description
技术领域
本发明涉及一种数据分析方法,尤其是一种基于增值税发票的数据分析方法。
背景技术
近些年随着国家经济的高速发展,许多犯罪分子利用政策空隙进行虚开、虚受、骗税等违法犯罪活动,造成了国家经济财产的大量损失和恶劣的社会影响。犯罪分子作案手法高明,反侦察能力极强且带有跨地域犯罪性质,通过以往的检查分析方式很难发现从虚开到骗税的利益链条。而面对繁杂的业务系统,海量的登记、认定、申报、征管、发票等数据,往往无从下手,难以进行有效的数据分析。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种基于增值税发票的数据分析方法,其能有效对票据的关系进行有效展示与分析,提高数据分析的效率。
按照本发明提供的技术方案,一种基于增值税发票的数据分析方法,所述数据分析方法包括如下步骤:
步骤1、获取发票数据信息,并将所述发票数据信息处理后得到所需的发票汇总信息;
步骤2、对任一纳税人,对所述发票汇总信息中的交易信息,得到所述当前纳税人所对应的发票数据上下游关联数据;
步骤3、根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,利用不同纳税人之间的关联关系绘制发票开具关联关系导图,在所述绘制的一发票开关关联关系导图中,每个节点对应唯一的纳税人,且在每个节点能拓展所需的纳税相关信息。
在每个节点所拓展的纳税相关信息包括办税人、财务负责人、法人、投资方、电话号码和/或MAC地址;
在拓展后,对于不同节点的纳税人具有相同的纳税相关信息时,采用标识线连接所述具有相同纳税相关信息的节点,且不同的纳税相关信息采用不同颜色的标示线。
采用开源组件d3.js力导向图以及yFiles插件绘制发票开具关联关系导图,以及对所述发票开具关联关系导图中的节点进行纳税相关信息的拓展。
步骤1中,获取的发票数据信息的方式包括电子底账、防伪税控数据或人工导入的发票数据,所述发票数据信息包括纳税人基本信息、发票开具信息以及每张发票的明细数据。
在获取发票数据信息后,将所获取的发票数据信息与标准数据字段进行匹配,且在匹配后,能得到发票数据标准信息;
所述发票汇总信息包括发票汇总表、纳税人MAC地址表、纳税人投资方表、货物品名汇总表、纳税人主板序列号表和/或纳税人关联关系结果表。
步骤2中,具体得到当前纳税人所对应的发票数据上下游关联数据时,采用链式分析方法,展示与当前纳税人对应的发票数据上下游关联数据。
本发明的优点:根据发票数据信息,得到所需的发票汇总信息;对任一纳税人,对所述发票汇总信息中的交易信息,得到所述当前纳税人所对应的发票数据上下游关联数据;根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,利用不同纳税人之间的关联关系绘制发票开具关联关系导图,在所述绘制的一发票开关关联关系导图中,每个节点对应唯一的纳税人,且在每个节点能拓展所需的纳税相关信息,从而根据发票开关关联关系导图能直观地展示纳税人之间的关系,以及纳税人之间的具体的关联信息,能有效对票据的关系进行有效展示与分析,提高数据分析的效率。
附图说明
图1为本发明绘制得到发票开关关联关系导图的示意图。
图2为本发明利用发票开关关联关系导图得到具有相同MAC地址时的示意图。
图3为本发明在进行链式分析时的临时表的示意图。
图4为本发明获取第1层销售方纳税人信息后的临时表。
图5为本发明获取多层销售方纳税人信息后的临时表。
图6为本发明获取第一次购买方纳税人信息后的临时表。
图7为本发明获取多层购买方纳税人信息后的临时表。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
为了能有效对票据的关系进行有效展示与分析,提高数据分析的效率,本发明的数据分析方法包括如下步骤:
步骤1、获取发票数据信息,并将所述发票数据信息处理后得到所需的发票汇总信息;
具体地,获取的发票数据信息的方式包括电子底账、防伪税控数据或人工导入的发票数据,所述发票数据信息包括纳税人基本信息、发票开具信息以及每张发票的明细数据。一般地,发票数据信息可以为纳税人名称、纳税人识别号、纳税人所属行业、纳税人所属地区、纳税人规模,法人名称及电话、办税人员名称及电话、财务负责人名称及电话、发票代码、发票号码、发票货物品名、单价、数量等,发票数据信息的具体内容可以根据实际需要进行选择确定,此处不再赘述。
进一步地,在获取发票数据信息后,将所获取的发票数据信息与标准数据字段进行匹配,且在匹配后,能得到发票数据标准信息;
所述发票汇总信息包括发票汇总表、纳税人MAC地址表、纳税人投资方表、货物品名汇总表、纳税人主板序列号表和/或纳税人关联关系结果表。
本发明实施例中,发票数据包括发票主表和发票明细表,其中,发票主表的内容可以包括发票号码、发票代码,开票日期、价税合计、金额、税率、税额、购买方名称、购买方纳税人识别号、购买方地址、购买方电话、购买方开户行,购买方帐号、出售方名称、出售方纳税人识别号、出售方地址、出售方电话、出售方开户行、开票人,发票状态以及备注信息等。发票明细表,一般可包括商品名称、规格型号、单位、数量、单价、价税合计、金额税率和数额。
在进行匹配时,需要匹配的字段即为发票主表和发票明细表中相对应的字段。例如,在发票数据中某一个字段叫gf_djxh,待匹配的字段可以为f_gf_djxh,通过字符以及字段的直接比较匹配,其他依次类推。匹配完成之后,通过数据库层面将数据抽取过来,即可以得到发票数据标准信息。具体实施时,在得到发票数据标准信息后,即得到后续能处理的标准发票主表和标准发票明细表。
本发明实施例中,在获取发票数据信息时,一般还能获取其他的信息,如纳税人MAC地址等,将这些信息进行提取后,能得到发票汇总表、纳税人MAC地址表、纳税人投资方表、货物品名汇总表、纳税人主板序列号表和/或纳税人关联关系结果表。当然,具体实施时,还可以包括纳税人关联关系表、案件纳税人分析结果表以及案件货物品名结果表等,具体得到上述具体数据表的过程与方式均为本技术领域人员所熟知,此处不再赘述。
步骤2、对任一纳税人,对所述发票汇总信息中的交易信息,得到所述当前纳税人所对应的发票数据上下游关联数据;
本发明实施例中,具体得到当前纳税人所对应的发票数据上下游关联数据时,采用链式分析方法,展示与当前纳税人对应的发票数据上下游关联数据。
具体实施时,为区分上下游层级的关系,使用类似于坐标轴的方式,最终将数据存储到结果临时表中,如图3所示。流向分析时,需要设置当前分析的节点,即当前的纳税人,所有的发票流向通过该节点,不经过该节点的流向不显示。
下面对具体的分析过程进行说明,具体地,当前分析的纳税人:纳税人A、纳税人B、纳税人C。
1)、获取第1层销方纳税人:
可以理解为获取当前纳税人的上游,也就是上游开票企业,以当前集合中的纳税人为购方纳税人,从发票汇总信息获取所有有关的发票数据,存入发票临时表TI_XXX,此时类别为-1;此时生成的数据结构如图4所示。
2)、获取第2~N层销方纳税人:
相当于往左方向扩围,也就是获取上游的上游、销方的销方。这个时候需以销方作为购方,从发票汇总信息中获取发票数据(此时根据当前节点作为购买方,去获取它的销售方数据)。
这里需要循环,类别为下标*-1,也就是从-2开始依次远离坐标轴原点(当前的纳税人作为坐标原点)。值得注意的是,这里的数据来自第一次发票临时表TI_XXX,即图3所示的表格。由于要分析的数据不再是开始的三个纳税人了,而是这三个纳税人的上游数据。
举个例子:假如数据从第2层开始循环,则说明要生成上游2层数据,则在生成第2层的时候,数据依托是第1层数据,类别为-1;
假如数据从第3层开始循环,则说明我要生成上游3层数据,则在生成第3层的时候,数据依托是第2层数据,类别为-2;
因此,就是要生成上游N层数据的话,则需要在发票临时表TI_XXX中找到类别为(N-1)*-1的数据。
从而,以TI_XXX中找到类别为(N-1)*-1的数据中纳税人销项为进项,在发票汇总信息中获取有关的发票数据。此时生成的数据如图5所示。
3)、获取第1层购方纳税人:
也就是获取当前纳税人的下游企业,获取下游购票企业。以当前纳税人为销方。以当前集合中的纳税人为销方纳税人,从发票汇总信息获取所有有关的发票数据,存入发票临时表TI_XXX,此时类别为1;此时生成的数据结构如下图6所示。
4)、获取第2~N层购方纳税人:
相当于往右方向扩围,获取下游的下游、购方的购方。这个时候需要以购方为销方,从上下游汇总表中获取发票数据。
这里需要循环,类别下标为1,也就是从2开始依次远离坐标轴原点。需要注意的是,这里的数据来源于图6中发票临时表TI_XXX中的第一层购方纳税人数据的。由于这里要分析的数据不再是开始的三个纳税人了,而是这三个纳税人的下游数据。
假如数据从第2层开始循环,则说明要生成下游2层数据,则在生成第2层的时候,数据依托是第1层数据,类别为1;假如数据从第3层开始循环,则说明要生成下游3层数据,则在生成第3层的时候,数据依托是第2层数据,类别为2。
因此,就是要生成下游N层数据的话,则需要在发票临时表TI_XXX中找到类别为(N-1)*1的数据。
从而,以TI_XXX中找到类别为(N-1)*1的数据中纳税人进项为销项,在发票汇总信息中获取有关的发票数据。此时生成的数据如图7所示。
经过上述步骤,对于任意纳税人,能得到与所述纳税人所对应的发票数据上下游关联数据。
步骤3、根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,利用不同纳税人之间的关联关系绘制发票开具关联关系导图,在所述绘制的一发票开关关联关系导图中,每个节点对应唯一的纳税人,且在每个节点能拓展所需的纳税相关信息。
本发明实施例中,在每个节点所拓展的纳税相关信息包括办税人、财务负责人、法人、投资方、电话号码和/或MAC地址;
在拓展后,对于不同节点的纳税人具有相同的纳税相关信息时,采用标识线连接所述具有相同纳税相关信息的节点,且不同的纳税相关信息采用不同颜色的标示线。图1为具体生成的发票开关关联关系导图,图2中,由于纳税人10、纳税人14以及纳税人15具有相同的开票MAC地址,在进行连接后,能直观展示相互之间的关联状态,不仅可以分析发票数据,还可以分析人员关系等。
具体实施时,采用开源组件d3.js力导向图以及yFiles插件绘制发票开具关联关系导图,以及对所述发票开具关联关系导图中的节点进行纳税相关信息的拓展。具体地,利用开源组件d3.js力导向图以及yFiles插件绘制发票开具关联关系导图的具体过程以及方式均为本技术领域人员所熟知,此处不再赘述。
本发明实施例中,yFiles绘制时,具体可以采用下述方式,具体地:
1)、根据根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,从而能得到节点集合arrList,遍历该集合。
2)、使用hashTable(key,obj),变量为mHTAllCompany来存储节点,这样查找速度快!
3)、获取上游节点Node,通过mHTAllCompany判断是否存在,不存在则创建Node,通过Enterprise.as类来创建;
4)、获取下游节点Node,通过mHTAllCompany判断是否存在,不存在则创建Node,通过Enterprise.as类来创建;
遍历上游,找下游节点。
具体地,创建节点后,如节点Node1--→节点Node2,则会自动生成一条线,由节点1指向节点2,会产生层级关系。具体利用yFiles插件绘制的方式可以根据需要进行选择,具体为本技术领域人员所熟知,此处不再赘述。
Claims (6)
1.一种基于增值税发票的数据分析方法,其特征是,所述数据分析方法包括如下步骤:
步骤1、获取发票数据信息,并将所述发票数据信息处理后得到所需的发票汇总信息;
步骤2、对任一纳税人,对所述发票汇总信息中的交易信息,得到所述当前纳税人所对应的发票数据上下游关联数据;
步骤3、根据每个纳税人对应的发票数据上下游关联数据,以得到不同纳税人之间的关联关系,利用不同纳税人之间的关联关系绘制发票开具关联关系导图,在所述绘制的一发票开关关联关系导图中,每个节点对应唯一的纳税人,且在每个节点能拓展所需的纳税相关信息。
2.根据权利要求1所述的基于增值税发票的数据分析方法,其特征是:在每个节点所拓展的纳税相关信息包括办税人、财务负责人、法人、投资方、电话号码和/或MAC地址;
在拓展后,对于不同节点的纳税人具有相同的纳税相关信息时,采用标识线连接所述具有相同纳税相关信息的节点,且不同的纳税相关信息采用不同颜色的标示线。
3.根据权利要求1或2所述的基于增值税发票的数据分析方法,其特征是:采用开源组件d3.js力导向图以及yFiles插件绘制发票开具关联关系导图,以及对所述发票开具关联关系导图中的节点进行纳税相关信息的拓展。
4.根据权利要求1所述的基于增值税发票的数据分析方法,其特征是:步骤1中,获取的发票数据信息的方式包括电子底账、防伪税控数据或人工导入的发票数据,所述发票数据信息包括纳税人基本信息、发票开具信息以及每张发票的明细数据。
5.根据权利要求4所述的基于增值税发票的数据分析方法,其特征是:在获取发票数据信息后,将所获取的发票数据信息与标准数据字段进行匹配,且在匹配后,能得到发票数据标准信息;
所述发票汇总信息包括发票汇总表、纳税人MAC地址表、纳税人投资方表、货物品名汇总表、纳税人主板序列号表和/或纳税人关联关系结果表。
6.根据权利要求5所述的基于增值税发票的数据分析方法,其特征是:步骤2中,具体得到当前纳税人所对应的发票数据上下游关联数据时,采用链式分析方法,展示与当前纳税人对应的发票数据上下游关联数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011159645.1A CN112232894A (zh) | 2020-10-27 | 2020-10-27 | 基于增值税发票的数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011159645.1A CN112232894A (zh) | 2020-10-27 | 2020-10-27 | 基于增值税发票的数据分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112232894A true CN112232894A (zh) | 2021-01-15 |
Family
ID=74110827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011159645.1A Pending CN112232894A (zh) | 2020-10-27 | 2020-10-27 | 基于增值税发票的数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232894A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116957631A (zh) * | 2023-08-31 | 2023-10-27 | 深圳欧税通技术有限公司 | 一种税务发票数据智能识别方法、系统和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543073A (zh) * | 2018-10-17 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 企业供销关系图谱生成方法、装置和计算机设备 |
CN109993641A (zh) * | 2017-12-28 | 2019-07-09 | 航天信息股份有限公司 | 一种发票虚开预警方法及系统 |
CN110413665A (zh) * | 2019-07-01 | 2019-11-05 | 北京邮电大学 | 一种数据查询方法及装置 |
CN110930205A (zh) * | 2019-11-04 | 2020-03-27 | 江苏税软软件科技有限公司 | 一种发票数据分析方法 |
-
2020
- 2020-10-27 CN CN202011159645.1A patent/CN112232894A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109993641A (zh) * | 2017-12-28 | 2019-07-09 | 航天信息股份有限公司 | 一种发票虚开预警方法及系统 |
CN109543073A (zh) * | 2018-10-17 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 企业供销关系图谱生成方法、装置和计算机设备 |
CN110413665A (zh) * | 2019-07-01 | 2019-11-05 | 北京邮电大学 | 一种数据查询方法及装置 |
CN110930205A (zh) * | 2019-11-04 | 2020-03-27 | 江苏税软软件科技有限公司 | 一种发票数据分析方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116957631A (zh) * | 2023-08-31 | 2023-10-27 | 深圳欧税通技术有限公司 | 一种税务发票数据智能识别方法、系统和介质 |
CN116957631B (zh) * | 2023-08-31 | 2023-12-22 | 深圳欧税通技术有限公司 | 一种税务发票数据智能识别方法、系统和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7940899B2 (en) | Fraud detection, risk analysis and compliance assessment | |
US20090182653A1 (en) | System and method for case management | |
US20110137760A1 (en) | Method, system, and computer program product for customer linking and identification capability for institutions | |
US20080301016A1 (en) | Method, System, and Computer Program Product for Customer Linking and Identification Capability for Institutions | |
US20070233597A1 (en) | Least cost network routing for electronic transactions | |
US20210373721A1 (en) | Artificial intelligence assisted evaluations and user interface for same | |
US8185471B1 (en) | Integrated payment receiving and processing system | |
US20140279500A1 (en) | Methods and Systems for Generating a Transaction Lifecycle Output for a Payment Card Transaction | |
CN110648211B (zh) | 数据验证 | |
CN110019324B (zh) | 一种生成纳税人资金回路的方法及系统 | |
CN107679103B (zh) | 用于实体的属性分析方法及系统 | |
US8505811B2 (en) | Anomalous billing event correlation engine | |
US7577653B2 (en) | Registration system and duplicate entry detection algorithm | |
CN112465601A (zh) | 一种电子订单生成方法、装置及存储介质 | |
US20140279452A1 (en) | Vendor propensity analysis component for an electronic invoice payment system | |
CN112232894A (zh) | 基于增值税发票的数据分析方法 | |
CN111951081A (zh) | 一种让每个材料都附上信息属性用数据构建场景的系统 | |
US10068239B2 (en) | Systems and methods for determining enhanced merchant identification | |
CN113919946A (zh) | 一种交易信息核验方法、装置和电子设备 | |
CN114119195A (zh) | 跨境电商数据资产管理方法、装置、计算机设备及介质 | |
CN108763233A (zh) | 基于大数据的疑似假货商品识别及分类的方法和装置 | |
CN112529625A (zh) | 生成企业税务画像的方法、装置、存储介质及电子设备 | |
CN112767002A (zh) | 一种基于区块链的旅游营商环境和旅游区评价方法及装置 | |
Kingston | Representing, reasoning and predicting fraud using fraud plans | |
CN110930205A (zh) | 一种发票数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |