CN114398942A - 一种基于集成的个人所得税异常检测方法及装置 - Google Patents
一种基于集成的个人所得税异常检测方法及装置 Download PDFInfo
- Publication number
- CN114398942A CN114398942A CN202111494392.8A CN202111494392A CN114398942A CN 114398942 A CN114398942 A CN 114398942A CN 202111494392 A CN202111494392 A CN 202111494392A CN 114398942 A CN114398942 A CN 114398942A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- detection model
- characteristic data
- tax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 78
- 230000010354 integration Effects 0.000 title abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims abstract description 85
- 230000005856 abnormality Effects 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000013450 outlier detection Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims 1
- 238000013498 data listing Methods 0.000 claims 1
- 230000006399 behavior Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/123—Tax preparation or submission
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于集成的个人所得税异常检测方法,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;采集待检测纳税人的特征数据列表中的特征数据;预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。本发明选用多种算法集成方式提高异常检测性能,能够检测出区别于大多数正常数据的异常数据,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
Description
技术领域
本发明属于税务管理领域,特别是涉及到一种基于集成的个人所得税异常检测方法及装置。
背景技术
随着社会经济和科技信息的飞速发展,企业在生产经营方式和交易支付手段上日益多样化、电子化,使得个人所得税税源越来越隐蔽,同时自然人流动性大,涉税行为零星分散,这都给个人所得税征收管理带来较大困难。而2019年标志着综合与分类相结合的个人所得税新税制的全面实施,更给自然人税收风险管理带来更严峻挑战,同时也给个人带来了较大的涉税风险。在当前大数据时代,传统的个人所得税税收风险管理模式已不能满足日常工作要求,传统的异常风险分析方法已不再适用。
发明内容
本发明提出一种基于集成的个人所得税异常检测方法及装置,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
为了实现上述目的,本发明的技术方案是这样实现的:
一种基于集成的个人所得税异常检测方法,包括:
S1、基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
S2、基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
S3、采集待检测纳税人的特征数据列表中的特征数据;
S4、预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
进一步的,步骤S2中,建立IForest异常检测模型的方法包括:
S201、构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
S202、构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
S203、计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
S204、得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
进一步的,步骤S2中,建立LOF异常检测模型的方法包括:
S211、指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
S212、结合指定k值,计算出每一个原始数据的局部离群因子大小;
S213、输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
进一步的,步骤S2中,建立OCSVM异常检测模型的方法包括:
S221、输入特征数据;
S222、构建拉格朗日目标函数;
S223、求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
S224、距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
进一步的,步骤S1、S2、S3中,所述特征数据进行预处理,具体方法包括:
S301、缺失值处理,将缺失值使用数值0代替;
S302、通过计算特征数据的方差,剔除方差为零的特征数据;
S303、将剩余的特征数据进行标准化处理。
本发明的另一方面,还提出了一种基于集成的个人所得税异常检测装置,包括:
特征数据列表模块,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
建模模块,基于所有纳税人的历史纳税数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
数据采集模块,采集待检测纳税人的特征数据列表中的特征数据并进行预处理;
异常检测模块,将预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
进一步的,所述建模模块包括IForest异常检测模型建立单元,用于:
构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
进一步的,所述建模模块包括LOF异常检测模型建立单元,用于:
指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
结合指定k值,计算出每一个原始数据的局部离群因子大小;
输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
进一步的,所述建模模块包括OCSVM异常检测模型建立单元,用于:
输入特征数据;
构建拉格朗日目标函数;
求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
进一步的,特征数据列表模块、建模模块、数据采集模块都包括预处理单元,用于将特征数据进行预处理,包括:
缺失值处理,将缺失值使用数值0代替;
通过计算特征数据的方差,剔除方差为零的特征数据;
将特征数据进行标准化处理。
与现有技术相比,本发明具有如下的有益效果:
本发明选用多种算法集成方式提高异常检测性能,能够检测出区别于大多数正常数据的异常数据,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
附图说明
图1是本发明实施例的特征数据方差图;
图2是本发明实施例的流程示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
在数据挖掘的过程中,数据库中可能包含一些数据对象,这些数据对象与数据的一般行为或模型不一致,这些数据对象被称为异常对象,异常对象又称作异常点或离群点。对数据的异常点或者特点的问题进行分析,可以得到具有价值的信息。比如:税收数据中可以通过分散的个人涉税信息进行全样本的整合处理检测出自然人异常税收行为;税收数据异常点的挖掘就是寻找税收风险点的过程等等,这些都是数据挖掘在税收领域中发挥的重要价值和作用。
为了提高异常点检测的准确性,本发明采用集成的方式对个人所得税数据进行异常检测,重点集成基于IFOREST,LOF,OCSVM三种主流异常检测算法,其中,孤立森林算法(IForest)是一种异常值检测算法,从给定的特征集合中随机选择特征,然后在特征的最大值和最小值间随机选择一个分割值,来隔离离群值。单类支持向量机(OCSVM)是基于线性模型,通过寻找一个超平面将样本中的正例圈出来,预测就是用这个超平面做决策,在圈内的样本就认为是正样本。局部异常因子算法(LOF)是基于相似性度量模型,通过计算一个数值score来反映一个样本的异常程度。
但由于IForest、LOF、OCSVM算法都只针对某一类型的离群点进行检测,无法全面检测各种类型离群点。本专利基于提升框架提出了一种集成的异常点检测模型,鉴于孤立森林、LOF、OCSVM分别对于全局、局部、线性的高度敏感,以这三种基分类器为基础,修改其目标函数,再通过Boosting进行融合,充分发挥各分类器的不同优势,全面考虑了多维数据的各个离群属性,最终形成基于孤立森林、LOF、OCSVM集成综合的异常检测模型,根据“投票”结果判别纳税人是否存在异常数据,从而实现个人所得税的税收风险分析,以期达到跨界应用、减少人为因素影响、精准识别的效果。
本实施例中采用的方案如图2所示,具体如下:
一、数据预处理
为了构建基于集成的异常点检测模型,首先需要根据实际业务情景中的以往分析经验,总结自然人的税收行为规律,形成可以区分正常纳税人和异常纳税人的特征数据列表,并整理为可参与计算的量化数据。在特征数据处理的过程中,为确保特征的有效性,尽量挑选相对独立的特征进行组合,作为输入特征。
本专利根据实际业务经验,从“自然人申报综合所得个人所得税年度自行申报表”中整理共27个特征数据项作为个人所得税异常分析的特征,例如:个人收入额所得、减免税额、应征税额、住房贷款合计以及继续教育合计等。
数据质量校验是进行数据完整性、一致性技术校验。指定规则检查,包括格式检查、范围检查、缺失记录检查、相似重复记录检查、精度检查、逻辑表达式检查、复合规则检查等,本专利对数据做了如下预处理:
(1)缺失值处理:通过观察数据,可看到数据中含有部分null值,而在模型拟合中如果存在null值会报错,根据实际指标含义,将null值用数值0替代。
(2)特征数据筛选:方差是衡量源数据和期望值相差的度量值,统计中方差是每个样本值与全体样本值的平均数之差的平方值的平均数,因此如果方差为0或接近于0,也就可以说明该特征数据的特征值之间基本上没有差异,对于异常检测过程无意义,应舍弃该特征数据。因此,本专利为避免多与特征数据的干扰,计算27个指标特征的方差,将方差为0的特征数据在后续计算中剔除。计算结果如图1所示。
其中,Q**E,J**E,J**E三个特征数据方差为0,因此为提高算法性能,将其从算法计算中去除。
(3)数据标准化:不同字段间的量纲不同,这也会对实验分析结果造成干扰,所以需要对剩余的特征数据进行标准化处理,标准化的目的就是将数据转化为无量纲的指标测评值,减小量纲对实验分析的影响。
本发明使用StandardScaler来进行数据的标准化,利用标准化,减少某个数据特征的重要程度过大或过小。具体地,把数据变换到均值为0,标准差为1的范围内,公式如下:
其中,mean为平均值,σ为标准差。
二、基于IForest、LOF和OCSVM集成异常检测算法:
为了提高异常点检测的准确性,避免不同类型算法对结果的干扰,本发明采用集成的方式对个人所得税数据进行异常检测,重点集成基于IFOREST,LOF,OCSVM三种主流异常检测算法,根据3种算法各自的检测结果进行投票,投票结果越多,异常值越大,代表风险程度越高。
(一)三种算法的具体算法原理步骤如下:
1、孤立森林算法采用多重二分法将样本点进行分区,该算法将样本中所有样本进行切分,直到每个样本点或极少样本点被划分在同一区域,这样样本越密集的区域,区域中的点被孤立时所需要的切分次数就越多,同理样本是孤立点,则该点被孤立时切分的次数就越低具体地,孤立森林算法(IForest)算法主要步骤如下:
(1)构建孤立树:从所有纳税人的训练集数据中进行采样,构建多个二叉树;
(2)构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
(3)计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分(anomaly score),具体公式如下:
(4)得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
2、局部异常因子算法(LOF)适用于二维或高维坐标体系内异常点的判别,例如二维平面坐标或经纬度空间坐标下异常点识别,可用此类方法。
算法的具体步骤:
(1)指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
(2)结合指定k值,计算出每一个原始数据的局部离群因子大小大小;
(3)输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
3、单类支持向量机(OCSVM),首次是在论文《Support Vector Method forNovelty Detection》中由Bernhard等人在2000年提出,其与SVM的原理类似,更像是将零点作为负样本点,其他数据作为正样本点,来训练支持向量机。策略是将数据映射到与内核相对应的特征空间,在数据与原点间构建超平面,该超平面与原点呈最大距离。
算法具体步骤:
(1)输入特征数据;
(2)构建拉格朗日目标函数;
(3)求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
(4)距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
(二)基于上述IFOREST,LOF,OCSVM三种算法集成的综合异常检测流程如下:
1.对个人所得税数据共27个特征数据,进行数据预处理,包括缺失值处理,特征数据筛选,利用StandardScaler来进行数据的标准化;
5.默认异常程度大于50%为异常,即判定为异常纳税人,同时,异常得分积一分;
当异常积分>=2时,即两种及以上算法识别为异常纳税人,则该纳税人最终确定为异常纳税人。
算法集成(Boosting)融合过程如图2的流程所示。
本专利选用个人所得税数据通过三个算法算出异常积分,最终得到纳税行为异常的纳税人。通过本专利,共X省内整理特征数据集4870户,最终得到487条异常数据。对异常数据的自然人列为异常自然人,形成税收风险任务,降低征纳双方涉税行为信息的不对称性,有效减少自然人税源流失的风险。
Claims (10)
1.一种基于集成的个人所得税异常检测方法,其特征在于,包括:
S1、基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
S2、基于所有纳税人的历史特征数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
S3、采集待检测纳税人的特征数据列表中的特征数据;
S4、预处理后的数据,经过基于IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型所集成的综合异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
2.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立IForest异常检测模型的方法包括:
S201、构建孤立树:从所有纳税人税务数据的特征数据中进行采样,构建多个二叉树;
S202、构建森林:通过随机采样对每棵树进行训练,对森林中的每棵孤立树进行测试,记录路径长度;
S203、计算异常分数:孤立森林引入异常分数计算公式,计算每个样本点的异常得分,具体公式如下:
S204、得出异常点结果:根据异常得分低于阈值的认定为异常点,并且类别设为-1。
3.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立LOF异常检测模型的方法包括:
S211、指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
S212、结合指定k值,计算出每一个原始数据的局部离群因子大小;
S213、输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
4.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S2中,建立OCSVM异常检测模型的方法包括:
S221、输入特征数据;
S222、构建拉格朗日目标函数;
S223、求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
S224、距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
5.根据权利要求1所述的基于集成的个人所得税异常检测方法,其特征在于,步骤S1、S2、S3中,所述特征数据进行预处理,具体方法包括:
S301、缺失值处理,将缺失值使用数值0代替;
S302、通过计算特征数据的方差,剔除方差为零的特征数据;
S303、将剩余的特征数据进行标准化处理。
6.一种基于集成的个人所得税异常检测装置,其特征在于,包括:
特征数据列表模块,基于税务数据,建立区分正常纳税人和异常纳税人的特征数据列表;
建模模块,基于所有纳税人的历史纳税数据,建立IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型;
数据采集模块,采集待检测纳税人的特征数据列表中的特征数据并进行预处理;
异常检测模块,将预处理后的数据,经IForest异常检测模型、LOF异常检测模型、以及OCSVM异常检测模型分别进行异常检测,并计算异常评分,根据总的异常评分判定是否异常纳税人。
8.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,所述建模模块包括LOF异常检测模型建立单元,用于:
指定离群异常检测算法的k值大小和离群因子大小判断的阈值大小epsilon;
结合指定k值,计算出每一个原始数据的局部离群因子大小;
输出局部离群因子大于1的点,即判读为异常点,小于1的点判断输出为正常点。
9.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,所述建模模块包括OCSVM异常检测模型建立单元,用于:
输入特征数据;
构建拉格朗日目标函数;
求得最优分割面(超平面),能使支持向量和超平面最小距离的最大值;
距离超平面近的点标为正常数据,距离超平面远的点标为异常点。
10.根据权利要求6所述的基于集成的个人所得税异常检测装置,其特征在于,特征数据列表模块、建模模块、数据采集模块都包括预处理单元,用于将特征数据进行预处理,包括:
缺失值处理,将缺失值使用数值0代替;
通过计算特征数据的方差,剔除方差为零的特征数据;
将特征数据进行标准化处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111494392.8A CN114398942A (zh) | 2021-12-08 | 2021-12-08 | 一种基于集成的个人所得税异常检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111494392.8A CN114398942A (zh) | 2021-12-08 | 2021-12-08 | 一种基于集成的个人所得税异常检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114398942A true CN114398942A (zh) | 2022-04-26 |
Family
ID=81226297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111494392.8A Pending CN114398942A (zh) | 2021-12-08 | 2021-12-08 | 一种基于集成的个人所得税异常检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114398942A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116342301A (zh) * | 2023-03-08 | 2023-06-27 | 深圳欧税通技术有限公司 | 一种基于大数据的跨境企业税务申报状况监测管理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009903A (zh) * | 2016-11-01 | 2018-05-08 | 航天信息股份有限公司 | 纳税用户诚信评分方法及系统 |
CN109409969A (zh) * | 2018-10-24 | 2019-03-01 | 仲恺农业工程学院 | 一种企业税务欺诈检测方法、电子设备及存储介质 |
CN110827131A (zh) * | 2018-07-23 | 2020-02-21 | 中国软件与技术服务股份有限公司 | 一种分布式自动特征组合的纳税人信用评估方法 |
CN110909963A (zh) * | 2018-09-14 | 2020-03-24 | 中国软件与技术服务股份有限公司 | 一种信用评分卡模型训练方法及纳税人非正常风险评估方法 |
CN111783577A (zh) * | 2020-06-19 | 2020-10-16 | 航天信息股份有限公司 | 一种基于发票数据分析的疑似税务异常企业筛选方法 |
CN113285441A (zh) * | 2021-04-27 | 2021-08-20 | 西安交通大学 | 智能电网lr攻击检测方法、系统、设备及可读存储介质 |
-
2021
- 2021-12-08 CN CN202111494392.8A patent/CN114398942A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108009903A (zh) * | 2016-11-01 | 2018-05-08 | 航天信息股份有限公司 | 纳税用户诚信评分方法及系统 |
CN110827131A (zh) * | 2018-07-23 | 2020-02-21 | 中国软件与技术服务股份有限公司 | 一种分布式自动特征组合的纳税人信用评估方法 |
CN110909963A (zh) * | 2018-09-14 | 2020-03-24 | 中国软件与技术服务股份有限公司 | 一种信用评分卡模型训练方法及纳税人非正常风险评估方法 |
CN109409969A (zh) * | 2018-10-24 | 2019-03-01 | 仲恺农业工程学院 | 一种企业税务欺诈检测方法、电子设备及存储介质 |
CN111783577A (zh) * | 2020-06-19 | 2020-10-16 | 航天信息股份有限公司 | 一种基于发票数据分析的疑似税务异常企业筛选方法 |
CN113285441A (zh) * | 2021-04-27 | 2021-08-20 | 西安交通大学 | 智能电网lr攻击检测方法、系统、设备及可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116342301A (zh) * | 2023-03-08 | 2023-06-27 | 深圳欧税通技术有限公司 | 一种基于大数据的跨境企业税务申报状况监测管理系统 |
CN116342301B (zh) * | 2023-03-08 | 2023-11-28 | 深圳欧税通技术有限公司 | 一种基于大数据的跨境企业税务申报状况监测管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633265B (zh) | 用于优化信用评估模型的数据处理方法及装置 | |
CN111882446B (zh) | 一种基于图卷积网络的异常账户检测方法 | |
WO2017143919A1 (zh) | 一种建立数据识别模型的方法及装置 | |
CN107230108A (zh) | 业务数据的处理方法及装置 | |
Chen et al. | An alternative model for the analysis of detecting electronic industries earnings management using stepwise regression, random forest, and decision tree | |
US20220383322A1 (en) | Clustering-based data selection for optimization of risk predictive machine learning models | |
CN109657011A (zh) | 一种筛选恐怖袭击事件犯罪团伙的数据挖掘方法及系统 | |
CN113569920B (zh) | 基于自动编码的第二近邻异常检测方法 | |
CN112270596A (zh) | 基于用户画像构建的风险控制系统及方法 | |
CN111782806A (zh) | 一种基于人工智能算法的相似上市企业检索分类方法及系统 | |
Wahab et al. | Digital economy tax compliance model in Malaysia using machine learning approach | |
CN114398942A (zh) | 一种基于集成的个人所得税异常检测方法及装置 | |
Dairi et al. | Efficient driver drunk detection by sensors: A manifold learning-based anomaly detector | |
Shi et al. | Improved credit risk prediction based on an integrated graph representation learning approach with graph transformation | |
CN113435713A (zh) | 基于gis技术和两模型融合的风险地图编制方法及系统 | |
Tan et al. | Three-way decision-based co-detection for outliers | |
CN115660834B (zh) | 基于决策树的个贷风险评估方法 | |
De Stefano et al. | Evolutionary computation to implement an IoT-based system for water pollution detection | |
Alireza et al. | Evaluation of the Financial Ratio Capability to Predict the Financial Crisis of Companies. | |
US20240152818A1 (en) | Methods for mitigation of algorithmic bias discrimination, proxy discrimination and disparate impact | |
Najadat et al. | Performance evaluation of industrial firms using DEA and DECORATE ensemble method. | |
CN115293641A (zh) | 一种基于金融大数据的企业风险智能识别方法 | |
CN114596152A (zh) | 基于无监督模型预测发债主体违约的方法、设备及存储介质 | |
Yang et al. | An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity | |
CN114663102A (zh) | 基于半监督模型预测发债主体违约的方法、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |