CN114398942A - 一种基于集成的个人所得税异常检测方法及装置 - Google Patents

一种基于集成的个人所得税异常检测方法及装置 Download PDF

Info

Publication number
CN114398942A
CN114398942A CN202111494392.8A CN202111494392A CN114398942A CN 114398942 A CN114398942 A CN 114398942A CN 202111494392 A CN202111494392 A CN 202111494392A CN 114398942 A CN114398942 A CN 114398942A
Authority
CN
China
Prior art keywords
data
abnormal
detection model
characteristic data
tax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111494392.8A
Other languages
English (en)
Other versions
CN114398942B (zh
Inventor
李明权
伺彦伟
张婷
祁洪波
马军肖
周江涛
陈扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Aisino Co ltd
Original Assignee
Hebei Aisino Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Aisino Co ltd filed Critical Hebei Aisino Co ltd
Priority to CN202111494392.8A priority Critical patent/CN114398942B/zh
Publication of CN114398942A publication Critical patent/CN114398942A/zh
Application granted granted Critical
Publication of CN114398942B publication Critical patent/CN114398942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/123Tax preparation or submission

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于集成的个人所得税异常检测方法,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;采集待检测纳税人的特征数据列表中的特征数据;预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。本发明选用多种算法集成方式提高异常检测性能,能够检测出区别于大多数正常数据的异常数据,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。

Description

一种基于集成的个人所得税异常检测方法及装置
技术领域
本发明属于税务管理领域,特别是涉及到一种基于集成的个人所得税异常检测方法及装置。
背景技术
随着社会经济和科技信息的飞速发展,企业在生产经营方式和交易支付手段上日益多样化、电子化,使得个人所得税税源越来越隐蔽,同时自然人流动性大,涉税行为零星分散,这都给个人所得税征收管理带来较大困难。而2019年标志着综合与分类相结合的个人所得税新税制的全面实施,更给自然人税收风险管理带来更严峻挑战,同时也给个人带来了较大的涉税风险。在当前大数据时代,传统的个人所得税税收风险管理模式已不能满足日常工作要求,传统的异常风险分析方法已不再适用。
发明内容
本发明提出一种基于集成的个人所得税异常检测方法及装置,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
为了实现上述目的,本发明的技术方案是这样实现的:
一种基于集成的个人所得税异常检测方法,包括:
S1、基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
S2、基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
S3、采集待检测纳税人的特征数据列表中的特征数据;
S4、预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
进一步的,步骤S2中,建立IForest异常检测模型的方法包括:
S201、构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
S202、构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
S203、计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
Figure BDA0003399640740000021
其中,score(x)为数据的异常分数,E(h(x))表示筛选异常数据在多个二叉树上的平均路径长度,
Figure BDA0003399640740000022
为多个二叉树的平均路径长度;
S204、得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
进一步的,步骤S2中,建立LOF异常检测模型的方法包括:
S211、指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
S212、结合指定k值,计算出每一个原始数据的局部离群因子大小;
S213、输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
进一步的,步骤S2中,建立OCSVM异常检测模型的方法包括:
S221、输入特征数据;
S222、构建拉格朗日目标函数;
S223、求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
S224、距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
进一步的,步骤S1、S2、S3中,所述特征数据进行预处理,具体方法包括:
S301、缺失值处理,将缺失值使用数值0代替;
S302、通过计算特征数据的方差,剔除方差为零的特征数据;
S303、将剩余的特征数据进行标准化处理。
本发明的另一方面,还提出了一种基于集成的个人所得税异常检测装置,包括:
特征数据列表模块,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
建模模块,基于所有纳税人的历史纳税数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
数据采集模块,采集待检测纳税人的特征数据列表中的特征数据并进行预处理;
异常检测模块,将预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
进一步的,所述建模模块包括IForest异常检测模型建立单元,用于:
构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
Figure BDA0003399640740000031
其中,score(x)为数据的异常分数,E(h(x))表示筛选异常数据在多个二叉树上的平均路径长度,
Figure BDA0003399640740000032
为多个二叉树的平均路径长度;
得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
进一步的,所述建模模块包括LOF异常检测模型建立单元,用于:
指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
结合指定k值,计算出每一个原始数据的局部离群因子大小;
输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
进一步的,所述建模模块包括OCSVM异常检测模型建立单元,用于:
输入特征数据;
构建拉格朗日目标函数;
求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
进一步的,特征数据列表模块、建模模块、数据采集模块都包括预处理单元,用于将特征数据进行预处理,包括:
缺失值处理,将缺失值使用数值0代替;
通过计算特征数据的方差,剔除方差为零的特征数据;
将特征数据进行标准化处理。
与现有技术相比,本发明具有如下的有益效果:
本发明选用多种算法集成方式提高异常检测性能,能够检测出区别于大多数正常数据的异常数据,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
附图说明
图1是本发明实施例的特征数据方差图;
图2是本发明实施例的流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
在数据挖掘的过程中,数据库中可能包含一些数据对象,这些数据对象与数据的一般行为或模型不一致,这些数据对象被称为异常对象,异常对象又称作异常点或离群点。对数据的异常点或者特点的问题进行分析,可以得到具有价值的信息。比如:税收数据中可以通过分散的个人涉税信息进行全样本的整合处理检测出自然人异常税收行为;税收数据异常点的挖掘就是寻找税收风险点的过程等等,这些都是数据挖掘在税收领域中发挥的重要价值和作用。
为了提高异常点检测的准确性,本发明采用集成的方式对个人所得税数据进行异常检测,重点集成基于IFOREST,LOF,OCSVM三种主流异常检测算法,其中,孤立森林算法(IForest)是一种异常值检测算法,从给定的特征集合中随机选择特征,然后在特征的最大值和最小值间随机选择一个分割值,来隔离离群值。单类支持向量机(OCSVM)是基于线性模型,通过寻找一个超平面将样本中的正例圈出来,预测就是用这个超平面做决策,在圈内的样本就认为是正样本。局部异常因子算法(LOF)是基于相似性度量模型,通过计算一个数值score来反映一个样本的异常程度。
但由于IForest、LOF、OCSVM算法都只针对某一类型的离群点进行检测,无法全面检测各种类型离群点。本专利基于提升框架提出了一种集成的异常点检测模型,鉴于孤立森林、LOF、OCSVM分别对于全局、局部、线性的高度敏感,以这三种基分类器为基础,修改其目标函数,再通过Boosting进行融合,充分发挥各分类器的不同优势,全面考虑了多维数据的各个离群属性,最终形成基于孤立森林、LOF、OCSVM集成综合的异常检测模型,根据“投票”结果判别纳税人是否存在异常数据,从而实现个人所得税的税收风险分析,以期达到跨界应用、减少人为因素影响、精准识别的效果。
本实施例中采用的方案如图2所示,具体如下:
一、数据预处理
为了构建基于集成的异常点检测模型,首先需要根据实际业务情景中的以往分析经验,总结自然人的税收行为规律,形成可以区分正常纳税人和异常纳税人的特征数据列表,并整理为可参与计算的量化数据。在特征数据处理的过程中,为确保特征的有效性,尽量挑选相对独立的特征进行组合,作为输入特征。
本专利根据实际业务经验,从“自然人申报综合所得个人所得税年度自行申报表”中整理共27个特征数据项作为个人所得税异常分析的特征,例如:个人收入额所得、减免税额、应征税额、住房贷款合计以及继续教育合计等。
数据质量校验是进行数据完整性、一致性技术校验。指定规则检查,包括格式检查、范围检查、缺失记录检查、相似重复记录检查、精度检查、逻辑表达式检查、复合规则检查等,本专利对数据做了如下预处理:
(1)缺失值处理:通过观察数据,可看到数据中含有部分null值,而在模型拟合中如果存在null值会报错,根据实际指标含义,将null值用数值0替代。
(2)特征数据筛选:方差是衡量源数据和期望值相差的度量值,统计中方差是每个样本值与全体样本值的平均数之差的平方值的平均数,因此如果方差为0或接近于0,也就可以说明该特征数据的特征值之间基本上没有差异,对于异常检测过程无意义,应舍弃该特征数据。因此,本专利为避免多与特征数据的干扰,计算27个指标特征的方差,将方差为0的特征数据在后续计算中剔除。计算结果如图1所示。
其中,Q**E,J**E,J**E三个特征数据方差为0,因此为提高算法性能,将其从算法计算中去除。
(3)数据标准化:不同字段间的量纲不同,这也会对实验分析结果造成干扰,所以需要对剩余的特征数据进行标准化处理,标准化的目的就是将数据转化为无量纲的指标测评值,减小量纲对实验分析的影响。
本发明使用StandardScaler来进行数据的标准化,利用标准化,减少某个数据特征的重要程度过大或过小。具体地,把数据变换到均值为0,标准差为1的范围内,公式如下:
Figure BDA0003399640740000061
其中,mean为平均值,σ为标准差。
二、基于IForest、LOF和OCSVM集成异常检测算法:
为了提高异常点检测的准确性,避免不同类型算法对结果的干扰,本发明采用集成的方式对个人所得税数据进行异常检测,重点集成基于IFOREST,LOF,OCSVM三种主流异常检测算法,根据3种算法各自的检测结果进行投票,投票结果越多,异常值越大,代表风险程度越高。
(一)三种算法的具体算法原理步骤如下:
1、孤立森林算法采用多重二分法将样本点进行分区,该算法将样本中所有样本进行切分,直到每个样本点或极少样本点被划分在同一区域,这样样本越密集的区域,区域中的点被孤立时所需要的切分次数就越多,同理样本是孤立点,则该点被孤立时切分的次数就越低具体地,孤立森林算法(IForest)算法主要步骤如下:
(1)构建孤立树:从所有纳税人的训练集数据中进行采样,构建多个二叉树;
(2)构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
(3)计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分(anomaly score),具体公式如下:
Figure BDA0003399640740000071
(4)得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
其中,score(x)为数据的异常分数,E(h(x))表示筛选异常数据在多个二叉树上的平均路径长度,
Figure BDA0003399640740000072
为多个二叉树的平均路径长度。
2、局部异常因子算法(LOF)适用于二维或高维坐标体系内异常点的判别,例如二维平面坐标或经纬度空间坐标下异常点识别,可用此类方法。
算法的具体步骤:
(1)指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
(2)结合指定k值,计算出每一个原始数据的局部离群因子大小大小;
(3)输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
3、单类支持向量机(OCSVM),首次是在论文《Support Vector Method forNovelty Detection》中由Bernhard
Figure BDA0003399640740000073
等人在2000年提出,其与SVM的原理类似,更像是将零点作为负样本点,其他数据作为正样本点,来训练支持向量机。策略是将数据映射到与内核相对应的特征空间,在数据与原点间构建超平面,该超平面与原点呈最大距离。
算法具体步骤:
(1)输入特征数据;
(2)构建拉格朗日目标函数;
(3)求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
(4)距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
(二)基于上述IFOREST,LOF,OCSVM三种算法集成的综合异常检测流程如下:
1.对个人所得税数据共27个特征数据,进行数据预处理,包括缺失值处理,特征数据筛选,利用StandardScaler来进行数据的标准化;
2.输入整理后的特征数据利用孤立森林算法构建异常检测模型,形成检测器G1,对于输入的个人所得税数据,得出每个纳税人的异常程度值
Figure BDA0003399640740000081
3.利用LOF算法进行异常检测分析,形成检测器G2,对于输入的个人所得税数据,得出每个纳税人的异常程度值
Figure BDA0003399640740000082
4.利用OCSVM算法进行异常检测分析,形成检测器G3,对于输入的个人所得税数据,得出每个纳税人的异常程度值
Figure BDA0003399640740000083
5.默认异常程度大于50%为异常,即判定为异常纳税人,同时,异常得分积一分;
当异常积分>=2时,即两种及以上算法识别为异常纳税人,则该纳税人最终确定为异常纳税人。
算法集成(Boosting)融合过程如图2的流程所示。
本专利选用个人所得税数据通过三个算法算出异常积分,最终得到纳税行为异常的纳税人。通过本专利,共X省内整理特征数据集4870户,最终得到487条异常数据。对异常数据的自然人列为异常自然人,形成税收风险任务,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。

Claims (10)

1.一种基于集成的个人所得税异常检测方法,其特征在于,包括:
S1、基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
S2、基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
S3、采集待检测纳税人的特征数据列表中的特征数据;
S4、预处理后的数据,经过基于IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型所集成的综合异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
2.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立IForest异常检测模型的方法包括:
S201、构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
S202、构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
S203、计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
Figure FDA0003399640730000011
其中,score(x)为数据的异常分数,E(h(x))表示筛选异常数据在多个二叉树上的平均路径长度,
Figure FDA0003399640730000012
为多个二叉树的平均路径长度;
S204、得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
3.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立LOF异常检测模型的方法包括:
S211、指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
S212、结合指定k值,计算出每一个原始数据的局部离群因子大小;
S213、输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
4.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立OCSVM异常检测模型的方法包括:
S221、输入特征数据;
S222、构建拉格朗日目标函数;
S223、求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
S224、距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
5.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S1、S2、S3中,所述特征数据进行预处理,具体方法包括:
S301、缺失值处理,将缺失值使用数值0代替;
S302、通过计算特征数据的方差,剔除方差为零的特征数据;
S303、将剩余的特征数据进行标准化处理。
6.一种基于集成的个人所得税异常检测装置,其特征在于,包括:
特征数据列表模块,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
建模模块,基于所有纳税人的历史纳税数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
数据采集模块,采集待检测纳税人的特征数据列表中的特征数据并进行预处理;
异常检测模块,将预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
7.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,所述建模模块包括IForest异常检测模型建立单元,用于:
构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
Figure FDA0003399640730000031
其中,score(x)为数据的异常分数,E(h(x))表示筛选异常数据在多个二叉树上的平均路径长度,
Figure FDA0003399640730000032
为多个二叉树的平均路径长度;
得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
8.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,所述建模模块包括LOF异常检测模型建立单元,用于:
指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
结合指定k值,计算出每一个原始数据的局部离群因子大小;
输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
9.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,所述建模模块包括OCSVM异常检测模型建立单元,用于:
输入特征数据;
构建拉格朗日目标函数;
求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
10.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,特征数据列表模块、建模模块、数据采集模块都包括预处理单元,用于将特征数据进行预处理,包括:
缺失值处理,将缺失值使用数值0代替;
通过计算特征数据的方差,剔除方差为零的特征数据;
将特征数据进行标准化处理。
CN202111494392.8A 2021-12-08 2021-12-08 一种基于集成的个人所得税异常检测方法及装置 Active CN114398942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111494392.8A CN114398942B (zh) 2021-12-08 2021-12-08 一种基于集成的个人所得税异常检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111494392.8A CN114398942B (zh) 2021-12-08 2021-12-08 一种基于集成的个人所得税异常检测方法及装置

Publications (2)

Publication Number Publication Date
CN114398942A true CN114398942A (zh) 2022-04-26
CN114398942B CN114398942B (zh) 2024-11-29

Family

ID=81226297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111494392.8A Active CN114398942B (zh) 2021-12-08 2021-12-08 一种基于集成的个人所得税异常检测方法及装置

Country Status (1)

Country Link
CN (1) CN114398942B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342301A (zh) * 2023-03-08 2023-06-27 深圳欧税通技术有限公司 一种基于大数据的跨境企业税务申报状况监测管理系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078567A1 (en) * 2014-09-11 2016-03-17 Intuit Inc. Methods systems and articles of manufacture for using a predictive model to determine tax topics which are relevant to a taxpayer in preparing an electronic tax return
US20170213294A1 (en) * 2016-01-27 2017-07-27 Intuit Inc. Methods, systems and computer program products for calculating an estimated result of a tax return
CN107301596A (zh) * 2017-07-24 2017-10-27 北京三正科技股份有限公司 一种基于纳税人画像的税务大数据挖掘方法及装置
CN108009903A (zh) * 2016-11-01 2018-05-08 航天信息股份有限公司 纳税用户诚信评分方法及系统
CN109409969A (zh) * 2018-10-24 2019-03-01 仲恺农业工程学院 一种企业税务欺诈检测方法、电子设备及存储介质
CN110162975A (zh) * 2019-05-28 2019-08-23 江苏大学 一种基于近邻传播聚类算法的多步异常点检测方法
CN110827131A (zh) * 2018-07-23 2020-02-21 中国软件与技术服务股份有限公司 一种分布式自动特征组合的纳税人信用评估方法
CN110909963A (zh) * 2018-09-14 2020-03-24 中国软件与技术服务股份有限公司 一种信用评分卡模型训练方法及纳税人非正常风险评估方法
CN111783577A (zh) * 2020-06-19 2020-10-16 航天信息股份有限公司 一种基于发票数据分析的疑似税务异常企业筛选方法
CN113285441A (zh) * 2021-04-27 2021-08-20 西安交通大学 智能电网lr攻击检测方法、系统、设备及可读存储介质
CN113469950A (zh) * 2021-06-08 2021-10-01 海南电网有限责任公司电力科学研究院 一种基于深度学习的复合绝缘子异常发热缺陷的诊断方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078567A1 (en) * 2014-09-11 2016-03-17 Intuit Inc. Methods systems and articles of manufacture for using a predictive model to determine tax topics which are relevant to a taxpayer in preparing an electronic tax return
US20170213294A1 (en) * 2016-01-27 2017-07-27 Intuit Inc. Methods, systems and computer program products for calculating an estimated result of a tax return
CN108009903A (zh) * 2016-11-01 2018-05-08 航天信息股份有限公司 纳税用户诚信评分方法及系统
CN107301596A (zh) * 2017-07-24 2017-10-27 北京三正科技股份有限公司 一种基于纳税人画像的税务大数据挖掘方法及装置
CN110827131A (zh) * 2018-07-23 2020-02-21 中国软件与技术服务股份有限公司 一种分布式自动特征组合的纳税人信用评估方法
CN110909963A (zh) * 2018-09-14 2020-03-24 中国软件与技术服务股份有限公司 一种信用评分卡模型训练方法及纳税人非正常风险评估方法
CN109409969A (zh) * 2018-10-24 2019-03-01 仲恺农业工程学院 一种企业税务欺诈检测方法、电子设备及存储介质
CN110162975A (zh) * 2019-05-28 2019-08-23 江苏大学 一种基于近邻传播聚类算法的多步异常点检测方法
CN111783577A (zh) * 2020-06-19 2020-10-16 航天信息股份有限公司 一种基于发票数据分析的疑似税务异常企业筛选方法
CN113285441A (zh) * 2021-04-27 2021-08-20 西安交通大学 智能电网lr攻击检测方法、系统、设备及可读存储介质
CN113469950A (zh) * 2021-06-08 2021-10-01 海南电网有限责任公司电力科学研究院 一种基于深度学习的复合绝缘子异常发热缺陷的诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯绍伍;: "基于A-S模型的个人所得税逃税理论实证分析与逃税治理", 广东行政学院学报, no. 05, 10 October 2008 (2008-10-10) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116342301A (zh) * 2023-03-08 2023-06-27 深圳欧税通技术有限公司 一种基于大数据的跨境企业税务申报状况监测管理系统
CN116342301B (zh) * 2023-03-08 2023-11-28 深圳欧税通技术有限公司 一种基于大数据的跨境企业税务申报状况监测管理系统

Also Published As

Publication number Publication date
CN114398942B (zh) 2024-11-29

Similar Documents

Publication Publication Date Title
CN107633265B (zh) 用于优化信用评估模型的数据处理方法及装置
WO2017143919A1 (zh) 一种建立数据识别模型的方法及装置
CN108960833B (zh) 一种基于异构金融特征的异常交易识别方法,设备及存储介质
CN109949152A (zh) 一种个人信贷违约预测方法
US12141806B2 (en) Clustering-based data selection for optimization of risk predictive machine learning models
CN109739844A (zh) 基于衰减权重的数据分类方法
CN110134719A (zh) 一种结构化数据敏感属性的识别与分类分级方法
CN115343676B (zh) 密封电子设备内部多余物定位技术的特征优化方法
CN110377605A (zh) 一种结构化数据的敏感属性识别与分类分级方法
WO2019200739A1 (zh) 数据欺诈识别方法、装置、计算机设备和存储介质
CN113569920A (zh) 基于自动编码的第二近邻异常检测方法
CN112183652A (zh) 一种联邦机器学习环境下的边缘端偏见检测方法
CN109902731B (zh) 一种基于支持向量机的性能故障的检测方法及装置
CN118134633A (zh) 一种基于ai技术的银行信贷资产风险分析方法及系统
Lu et al. A modified active learning intelligent fault diagnosis method for rolling bearings with unbalanced samples
CN118644707A (zh) 一种3d类器物的智能识别系统
CN113158777A (zh) 质量评分方法、质量评分模型的训练方法及相关装置
CN114398942B (zh) 一种基于集成的个人所得税异常检测方法及装置
CN115797047A (zh) 智能化客户经营风险评估方法及系统
CN118735703A (zh) 企业财务数据偏离度预测方法和系统
US20240152818A1 (en) Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact
CN115293641A (zh) 一种基于金融大数据的企业风险智能识别方法
CN114596152A (zh) 基于无监督模型预测发债主体违约的方法、设备及存储介质
CN115661042A (zh) 一种基于注意力机制指导的分层分类缺陷检测方法
Vats et al. Tea Leaf Disease Detection: Federated Learning CNN Used for Accurate Severity Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant