CN109978675B - 一种税务监控方法和装置 - Google Patents
一种税务监控方法和装置 Download PDFInfo
- Publication number
- CN109978675B CN109978675B CN201711402133.1A CN201711402133A CN109978675B CN 109978675 B CN109978675 B CN 109978675B CN 201711402133 A CN201711402133 A CN 201711402133A CN 109978675 B CN109978675 B CN 109978675B
- Authority
- CN
- China
- Prior art keywords
- commodity
- item
- entering
- selling
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/10—Tax strategies
Abstract
本发明公开了一种税务监控方法和装置,所述方法包括,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;根据进销项商品的商品名称的相似度将进销项商品分为三个区间,这样就能够减少计算的复杂度,完全一致的商品和匹配度低的商品都可以提出单独计算。针对物品匹配的部分利用匈牙利算法,更有效准确的得到每个物品的最佳匹配,有效的提高数据的准确性。
Description
技术领域
本发明涉及税控技术领域,尤其涉及一种税务监控方法和装置。
背景技术
针对现有税务平台的监控系统,需要通过纳税人进项物品和销项物品之间的差异监控企业是否有逃税漏税的风险。随着税务大数据的兴起,税务业务的大数据化也在逐步进行中。在分析纳税人监控的时候,进销项差异的计算尤为重要。
现在大数据技术越来越成熟,这就要求在税务监控中使用更成熟的技术提供更准确更有效的分析。想要分析纳税人进项和销项的差异,我们需要对比进项物品和销项物品的差异,然而计算机并不清楚利用哪个物品和哪个物品做匹配来计算差异度,因此,计算差异度的算法尤为重要。
但是,现有技术中在进行税务监控时,差异度计算方法复杂,计算效率低下。
发明内容
本发明实施例通过提供一种税务监控方法和装置,用于解决现有技术中在进行税务监控时,差异度计算方法复杂,计算效率低下的技术问题。
第一方面,本发明一种税务监控方法,所述方法包括:
获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
可选的,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,包括:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
可选的,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,包括:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
可选的,所述获得第三进销项商品对应的第三物品差异度集合,包括:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
第二方面,本发明一实施例提供了一种税务监控装置,所述装置包括:
第一获得模块,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
可选的,所述第一获得模块具体用于:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
可选的,所述第一获得模块具体用于:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
可选的,所述第一获得模块具体用于:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
第三方面,本发明一实施例提供了一种计算机装置,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现第一方面实施例中所述方法的步骤。
第四方面,本发明一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面实施例中所述方法的步骤。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
采用本发明提供的技术方案,针对需要对比两个集合的差异度或者相似度,提供有效的匹配方式,将复杂问题简单化,划分好每个需要对比的物品的区间,减少计算的复杂度,提高计算的准确性。
附图说明
图1为本发明实施例提供的税务监控方法的流程图;
图2为本发明实施例提供的税务监控装置的示意图。
具体实施方式
为了解决上述技术问题,本发明实施例中的技术方案的总体思路如下:一种税务监控方法和装置,所述方法包括,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。这样针对需要对比两个集合的差异度或者相似度,提供有效的匹配方式,将复杂问题简单化,划分好每个需要对比的物品的区间,减少计算的复杂度,提高计算的准确性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
如图1所示,本发明实施例一提供了一种税务监控方法,所述方法包括:
S101,获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
S102,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
S103,利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
对于步骤S101,总进销项商品包括总进项商品和总销项商品,总进项商品对应有进项商品数据集合,总销项商品对应有销项商品数据集。
进行总进项商品对应的进项商品数据准备,执行进项数据查询,对查询到的数据结果按照纳税人识别号和商品名称做分组计算,得到进项商品数据集合。
进行总销项商品对应的销项商品数据准备,执行销项数据查询,对查询到的数据结果按照纳税人和商品名称做分组计算,得到构成的销项商品数据集合。
在获得进项商品数据集合和销项商品数据集合后,执行步骤S102,进行进销项差异度计算,具体计算方法如下:
以进项商品数据集合中的商品名称和销项商品数据集合中商品名称为比较对象,将进销项商品分为三个区间,第一区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品,第二区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品,第三区间是总进销项商品中除第一进销项商品、第二进销项商品之外其余的进销项商品,这些其余的进销项商品构成第三进销项商品。
其中,第一进销项商品对应第一物品差异度集合,第二进销项商品对应第二物品差异度集合,第三进销项商品对应第三物品差异度集合。
获得第一、第二以及第三物品差异度集合的具体方法如下所述。
1、对于获得第一物品差异度集合的方法具体是:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度,其中,所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度与所述商品名称相同的一进项商品和一销项商品的相似度之和为1;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述进商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
具体地,例如,对于述商品名称相同的一进项商品和一销项商品,二者的商品名称的相似度为1,则二者的商品名称的初始差异度为0;
计算二者的物品总金额差异,利用物品总金额差异对初始差异度0进行加权,获得加权处理后的结果,对加权处理后的结果进行归一化,获得二者的物品差异度。所述第一进销项商品中的商品名称相同所述每一进销项商品的物品差异度组成所述第一物品差异度集合A。
2、对于获得第二物品差异度集合的方法具体是:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
例如,对于第二进销项商品,其对应的进项商品数据集合中商品名称和销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值,第一阈值可以人为选定,例如第一阈值是0.2。那么根据相似度计算商品名称初始差异度。例如,所述第二进销项商品中的一进项商品和一销项商品的商品名称的初始差异度与所述第二进销项商品中的一进项商品和一销项商品的相似度之和为1。述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合B。
3、对于获得第三物品差异度集合的方法具体是:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
例如,对于总进销项商品,剔除掉商品名称完全相同的进项商品和销项商品,剔除掉商品名称相似度很低(例如小于相似度阈值0.2)的商品,剩余的进项商品和销项商品构成第三进销项商品,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵,利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合C。
在获得第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C之后,将第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C分别存储到差异度临时表“tmp”。
然后执行步骤S103,具体地,通过纳税人识别号对表“tmp”进行聚合,得到最终的差异度结果吗,即得到商品差异度集合,利用商品差异度集合可以对纳税人的税务信息进行监控。
如图2所示,本发明实施例二提供了一种税务监控装置,所述装置包括:
第一获得模块201,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块202,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,以及获得第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块203,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
其中,总进销项商品包括总进项商品和总销项商品,总进项商品对应有进项商品数据集合,总销项商品对应有销项商品数据集。
第一获得模块201,进行总进项商品对应的进项商品数据准备,执行进项数据查询,对查询到的数据结果按照纳税人识别号和商品名称做分组计算,得到进项商品数据集合。第一获得模块201,还进行总销项商品对应的销项商品数据准备,执行销项数据查询,对查询到的数据结果按照纳税人和商品名称做分组计算,得到构成的销项商品数据集合。
在获得进项商品数据集合和销项商品数据集合后,第二获得模块202进行进销项差异度计算,具体计算的实现方式如下:
以进项商品数据集合中的商品名称和销项商品数据集合中商品名称为比较对象,将进销项商品分为三个区间,第一区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品,第二区间是所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品,第三区间是总进销项商品中除第一进销项商品、第二进销项商品之外其余的进销项商品,这些其余的进销项商品构成第三进销项商品。
其中,第一进销项商品对应第一物品差异度集合,第二进销项商品对应第二物品差异度集合,第三进销项商品对应第三物品差异度集合。
第二获得模块202获得第一、第二以及第三物品差异度集合的具体方法如下所述。
1、第二获得模块202获得第一物品差异度集合的实现方式具体是:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度,其中,所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度与所述商品名称相同的一进项商品和一销项商品的相似度之和为1;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述进商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
具体地,例如,对于述商品名称相同的一进项商品和一销项商品,二者的商品名称的相似度为1,则二者的商品名称的初始差异度为0;
计算二者的物品总金额差异,利用物品总金额差异对初始差异度0进行加权,获得加权处理后的结果,对加权处理后的结果进行归一化,获得二者的物品差异度。所述第一进销项商品中的商品名称相同所述每一进销项商品的物品差异度组成所述第一物品差异度集合A。
2、第二获得模块202获得第二物品差异度集合的实现方式具体是:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
例如,对于第二进销项商品,其对应的进项商品数据集合中商品名称和销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值,第一阈值可以人为选定,例如第一阈值是0.2。那么根据相似度计算商品名称初始差异度。例如,所述第二进销项商品中的一进项商品和一销项商品的商品名称的初始差异度与所述第二进销项商品中的一进项商品和一销项商品的相似度之和为1。述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合B。
3、第二获得模块202获得第三物品差异度集合的实现方式具体是:
根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合。
例如,对于总进销项商品,剔除掉商品名称完全相同的进项商品和销项商品,剔除掉商品名称相似度很低(例如小于相似度阈值0.2)的商品,剩余的进项商品和销项商品构成第三进销项商品,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵,利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三物品差异度集合C。
在获得第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C之后,将第一物品差异度集合A、第二物品差异度集合B以及第三物品差异度集合C分别存储到差异度临时表“tmp”。
然后聚合模块203进行数据聚合,具体地,聚合模块通过纳税人识别号对表“tmp”进行聚合,得到最终的差异度结果吗,即得到商品差异度集合,利用商品差异度集合可以对纳税人的税务信息进行监控。
本发明实施例三提供了一种计算机装置,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如实施例一所述方法的步骤。
本发明实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一所述方法的步骤。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
根据进销项商品的商品名称的相似度将进销项商品分为三个区间,这样就能够减少计算的复杂度,完全一致的商品和匹配度低的商品都可以提出单独计算。针对物品匹配的部分利用匈牙利算法,更有效准确的得到每个物品的最佳匹配,有效的提高数据的准确性。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种税务监控方法,其特征在于,所述方法包括:
获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合;
根据第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
根据所述初始差异度矩阵,利用匈牙利算法获得所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第三进销项商品对应的第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
2.如权利要求1所述的方法,其特征在于,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,包括:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
3.如权利要求1所述的方法,其特征在于,所述获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合,包括:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
4.一种税务监控装置,其特征在于,所述装置包括:
第一获得模块,用于获得总进销项商品对应的进项商品数据集合和销项商品数据集合;
第二获得模块,用于获得所述进项商品数据集合中商品名称和所述销项商品数据集合中商品名称相同的第一进销项商品对应的第一物品差异度集合,获得所述进项商品数据集合中商品名称和所述销项商品数据集合中每个商品的商品名称的相似度均小于第一阈值的第二进销项商品对应的第二物品差异度集合;
所述第一获得模块还用于:根据所述第三进销项商品中的每个进项商品和每个销项商品的相似度,计算所述第三进销项商品中的每个进项商品和每个销项商品的商品名称的初始差异度矩阵;
所述第一获得模块还用于:根据所述初始差异度矩阵,利用匈牙利算法获得第三进销项商品中的每个进项商品和每个销项商品的商品名称的最佳匹配结果;
所述第一获得模块还用于:利用所述最佳匹配结果中的进销项商品的物品总金额差值对所述最佳匹配结果中的进销项商品的初始差异度进行加权处理,对加权处理后的结果进行归一化,获得第三物品差异度集合,其中,所述总进销项商品由所述第一进销项商品、第二进销项商品和第三进销项商品组成;
聚合模块,用于利用纳税人识别号对所述第一物品差异度集合、所述第二物品差异度集合和所述第三物品差异度集合进行聚合,获得商品差异度集合。
5.如权利要求4所述的装置,其特征在于,所述第一获得模块具体用于:
对所述第一进销项商品中的商品名称相同的每一进销项商品进行以下操作:
确定商品名称相同的一进项商品和一销项商品为一进销项商品;
获得所述商品名称相同的一进项商品和一销项商品的商品名称的初始差异度;
获得所述商品名称相同的一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述商品名称相同的一进项商品和一销项商品的物品差异度;其中,所述每一进销项商品的物品差异度组成所述第一物品差异度集合。
6.如权利要求4所述的装置,其特征在于,所述第一获得模块具体用于:
对所述第二进销项商品中的每个进项商品和每个销项商品进行以下操作:
确定所述第二进销项商品中一进项商品和一销项商品;
获得所述第二进销项商品中一进项商品和一销项商品的商品名称的初始差异度;
获得所述第二进销项商品中一进项商品和一销项商品的物品总金额差值;
利用所述物品总金额差值对所述初始差异度进行加权处理,对加权处理后的结果进行归一化,获得所述第二进销项商品中一进项商品和一销项商品的物品差异度;其中,所述第二进销项商品中每一进项商品和每一销项物品的物品差异度组成所述第二物品差异度集合。
7.一种计算机装置,其特征在于,所述装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-3中任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711402133.1A CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711402133.1A CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109978675A CN109978675A (zh) | 2019-07-05 |
CN109978675B true CN109978675B (zh) | 2022-06-07 |
Family
ID=67072127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711402133.1A Active CN109978675B (zh) | 2017-12-22 | 2017-12-22 | 一种税务监控方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109978675B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112258255A (zh) * | 2020-09-23 | 2021-01-22 | 河北航天信息技术有限公司 | 一种住宿业纳税人风险模型分析方法及装置 |
CN111881265B (zh) * | 2020-09-28 | 2020-12-29 | 成都数联铭品科技有限公司 | 报关单商品信息的处理方法及系统、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN103902545A (zh) * | 2012-12-25 | 2014-07-02 | 北京京东尚科信息技术有限公司 | 一种类目路径识别方法及系统 |
CN104424595A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 税务监控方法及其系统 |
CN104424613A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 一种增值税发票的监控方法及其系统 |
CN104636341A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种用于增值税一号多名监控的数据清洗存储方法 |
CN104636973A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品构成监控企业虚开发票的方法及其系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150120519A1 (en) * | 2013-10-28 | 2015-04-30 | Black Knight IP Holding Company LLC | System for estimating property taxes |
-
2017
- 2017-12-22 CN CN201711402133.1A patent/CN109978675B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839172A (zh) * | 2012-11-23 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 商品推荐方法及系统 |
CN103902545A (zh) * | 2012-12-25 | 2014-07-02 | 北京京东尚科信息技术有限公司 | 一种类目路径识别方法及系统 |
CN104424595A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 税务监控方法及其系统 |
CN104424613A (zh) * | 2013-09-04 | 2015-03-18 | 航天信息股份有限公司 | 一种增值税发票的监控方法及其系统 |
CN104636341A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种用于增值税一号多名监控的数据清洗存储方法 |
CN104636973A (zh) * | 2013-11-06 | 2015-05-20 | 航天信息股份有限公司 | 一种通过商品构成监控企业虚开发票的方法及其系统 |
Non-Patent Citations (1)
Title |
---|
深化数据应用筑起税收风险新防线;孙正密;《中国税务》;20160801;64 * |
Also Published As
Publication number | Publication date |
---|---|
CN109978675A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021052031A1 (zh) | 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质 | |
CN109858740B (zh) | 企业风险的评估方法、装置、计算机设备及存储介质 | |
JP6843882B2 (ja) | 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨 | |
KR101879416B1 (ko) | 이상 금융거래 탐지 방법 및 그 전자 장치 | |
CN109559029B (zh) | 一种海关商品智能归类方法和装置 | |
CN109191133B (zh) | 支付渠道的选择方法及终端设备 | |
US20200074509A1 (en) | Business data promotion method, device, terminal and computer-readable storage medium | |
CN106682923B (zh) | 商品调整方法及系统 | |
US20160132496A1 (en) | Data filtering | |
CN109978675B (zh) | 一种税务监控方法和装置 | |
US11182436B2 (en) | Predicting locations based on transaction records | |
US20180211272A1 (en) | Combinatorial optimization using a reduced search space | |
CN110928893B (zh) | 一种标签查询方法、装置、设备和存储介质 | |
CN114444863A (zh) | 一种企业生产安全评估方法、系统、装置及存储介质 | |
CN108985755B (zh) | 一种账号状态识别方法、装置及服务器 | |
US20130013244A1 (en) | Pattern based test prioritization using weight factors | |
CN113112186A (zh) | 一种企业评估方法、装置及设备 | |
CN107480861A (zh) | 一种研发工时计算方法和装置 | |
CN104866493B (zh) | 一种提升信息的曝光率的方法和装置 | |
Balder et al. | Primal–dual linear Monte Carlo algorithm for multiple stopping—an application to flexible caps | |
CN108665345B (zh) | 标签映射方法 | |
CN112613762A (zh) | 基于知识图谱的集团评级方法、装置和电子设备 | |
CN112950017A (zh) | 合同风险识别方法、装置和电子设备 | |
CN112465564A (zh) | 一种供应商推荐方法、装置、终端 | |
CN111242720A (zh) | 一种用于为求购商推荐供应商的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |