CN109583978A - 一种识别虚开发票企业的方法、装置及设备 - Google Patents
一种识别虚开发票企业的方法、装置及设备 Download PDFInfo
- Publication number
- CN109583978A CN109583978A CN201811455524.4A CN201811455524A CN109583978A CN 109583978 A CN109583978 A CN 109583978A CN 201811455524 A CN201811455524 A CN 201811455524A CN 109583978 A CN109583978 A CN 109583978A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- characteristic
- invoice
- identified
- out falsely
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/04—Billing or invoicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/123—Tax preparation or submission
Landscapes
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种识别虚开发票企业的方法,能获取待识别企业的特征数据,然后将特征数据输入预先训练得到的LightGBM模型,以便于该模型计算待识别企业为虚开发票企业的概率值,最后根据概率值判断待识别企业是否为虚开发票企业。可见,由于LightGBM模型是一种基于决策树的机器学习模型,采用最优的leaf‑wise策略分裂叶子节点,因此具备计算精度高计算速度快的特点,而本发明能够预先对该模型进行训练,使其能计算待识别企业为虚开发票企业的概率,最后根据概率得出识别结果,显著提升了识别的准确度和识别效率。此外,本发明还提供了一种识别虚开发票企业的装置、设备及计算机可读存储介质,其作用与上述方法相对应。
Description
技术领域
本发明涉及金融科技领域,特别涉及一种识别虚开发票企业的方法、装置、设备及计算机可读存储介质。
背景技术
虚开发票,是指纳税单位或个人为了达到偷税的目的,或购货单位为了满足某种需要,在商品交易过程中开具发票时,在商品名称、商品数量、商品单价或金额采取弄虚作假的手法,虚构交易事项等行为。
目前,虚开发票是我国一种严重且普遍的经济犯罪行为,其行为侵蚀增值税税基,扰乱市场秩序,危害极大。国家及地方税务稽查部门对虚开发票这一问题还没有比较好的解决方法和措施,目前主要通过人工根据以往的业务经验来识别一个企业是否为虚开发票的企业,由于这个过程需要耗费大量的时间和人力,因此识别效率非常低,此外,由于判断一个企业是否虚开发票的条件复杂而隐晦,因此识别准确率也不理想。
发明内容
本发明的目的是提供一种识别虚开发票企业的方法、装置、设备及计算机可读存储介质,用以解决通过人工识别企业是否为虚开发票的企业的识别效率和识别准确率均较低的问题。
为解决上述技术问题,本发明提供了一种识别虚开发票企业的方法,包括:
获取待识别企业的特征数据;
将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值;
根据所述概率值判断所述待识别企业是否为虚开发票企业。
可选的,所述LightGBM模型的训练过程为:
预先选取多个企业特征;
利用决策树方法计算各个所述企业特征的重要程度,并筛选出重要程度最高的预设数量的目标企业特征;
将所述目标企业特征输入所述LightGBM模型,并利用交叉验证法对所述LightGBM模型进行训练。
可选的,所述利用交叉验证法对所述LightGBM模型进行训练,具体包括:
利用交叉验证法对所述LightGBM模型进行训练,确定各个所述目标企业特征的权重。
可选的,所述利用交叉验证法对所述LightGBM模型进行训练,具体包括:
从税局数据库分别获取合法纳税企业以及虚开发票企业的样本;
将所述样本按照预设比例划分为训练样本和测试样本;
根据所述训练样本和所述测试样本对所述LightGBM模型进行训练。
可选的,所述获取待识别企业的特征数据,具体包括:
获取待识别企业的预设时间粒度的特征数据,其中,所述特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
可选的,在所述根据所述概率值判断所述待识别企业是否为虚开发票企业之后,还包括:
对判定为虚开发票企业的企业进行验证,得到验证结果;
根据所述验证结果,对所述LightGBM模型的参数进行调整。
相应的,本发明还提供了一种识别虚开发票企业的装置,包括:
特征数据获取模块:用于获取待识别企业的特征数据;
数据输入模块:用于将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值;
识别模块:用于根据所述概率值判断所述待识别企业是否为虚开发票企业。
可选的,所述特征数据获取模块具体用于:获取待识别企业的预设时间粒度的特征数据,其中,所述特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
此外,本发明还提供了一种识别虚开发票企业的设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的一种识别虚开发票企业的方法的步骤。
最后,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的一种识别虚开发票企业的方法的步骤。
本发明所提供的一种识别虚开发票企业的方法,能够获取待识别企业的特征数据,然后将特征数据输入预先训练得到的LightGBM模型,以便于该模型根据特征数据计算待识别企业为虚开发票企业的概率值,最后根据概率值判断待识别企业是否为虚开发票企业。可见,由于LightGBM模型是一种基于决策树算法的机器学习模型,采用最优的leaf-wise策略分裂叶子节点,因此具备计算精度高计算速度快的特点,而本发明能够预先对LightGBM模型进行训练,使其能够计算待识别企业为虚开发票企业的概率,最后根据概率值得出识别结果,显著提升了识别的准确度和识别效率。
此外,本发明还提供了一种识别虚开发票企业的装置、设备及计算机可读存储介质,其作用与上述方法相对应,这里不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种识别虚开发票企业的方法实施例一的实现流程图;
图2为本发明所提供的一种识别虚开发票企业的方法实施例二中训练模型的流程示意图;
图3为本发明所提供的一种识别虚开发票企业的方法实施例二中利用模型进行识别的流程示意图;
图4为本发明所提供的一种识别虚开发票企业的装置实施例的功能框图;
图5为本发明所提供的一种识别虚开发票企业的设备实施例的结构框图。
具体实施方式
本发明的核心是提供一种识别虚开发票企业的方法、装置、设备及计算机可读存储介质,避免了人工识别费时费力的问题,显著提升了识别的准确度和识别效率。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面对本发明提供的一种识别虚开发票企业的方法实施例一进行介绍,参见图1,实施例一包括:
步骤S101:获取待识别企业的特征数据。
本实施例中将需要进行判别的企业称为待识别企业,这里的判别主要是指判断一个或多个企业是否为虚开发票的企业。上述特征数据是指与企业是否虚开发票相关联的特征,例如,顶额发票占比、异地发票占比、待识别企业的行业领域等等。显然,即便一个企业具体以上特征,也不能直接得出该企业为虚开发票企业的结论,只能说明该企业为虚开发票企业的可能性较高。需要说明的是,步骤S101具体获取多少种特征数据,以及这些特征数据分别为哪种特征数据,均需要根据下文提到的LightGBM模型来确定。
步骤S102:将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值。
上述LightGBM模型(全称Light Gradient Boosting Machine)是一种快速的、分布式的、高性能的、基于决策树算法的梯度提升框架,可用于排序、分类、回归等多项机器学习任务中。因为该模型基于决策树算法的,采用了最优的leaf-wise策略分裂叶子节点,因此当增长到相同的叶子节点,LightGBM模型能够实现更高的精度,且计算速度非常快。
具体的,在训练LightGBM模型的之前,需要获取训练样本,为保证训练样本的真实性和可靠性,作为一种可选的实施方式,可以从税局获取虚开发票企业的原始企业数据,并获取正常纳税企业的原始企业数据。然后,从这些原始企业数据中抽取出可能与虚开发票相关联的特征数据,具体可以根据业务经验和专家知识确定抽取对象。最后,对抽取出来的特征数据进行格式调整,并利用这些特征数据对LightGBM模型进行训练。
步骤S103:根据所述概率值判断所述待识别企业是否为虚开发票企业。
显然,需要预先设定参考数值,通过比较参考数值以及LightGBM模型计算得到的概率值,得出识别结果,即待识别企业为虚开发票企业,或待识别企业不为虚开发票企业。
本实施例所提供一种识别虚开发票企业的方法,能够获取待识别企业的特征数据,然后将特征数据输入预先训练得到的LightGBM模型,以便于该模型根据特征数据计算待识别企业为虚开发票企业的概率值,最后根据概率值判断待识别企业是否为虚开发票企业。可见,由于LightGBM模型是一种基于决策树算法的机器学习模型,采用最优的leaf-wise策略分裂叶子节点,因此具备计算精度高计算速度快的特点,而本发明能够预先对LightGBM模型进行训练,使其能够计算待识别企业为虚开发票企业的概率,最后根据概率值得出识别结果,显著提升了识别的准确度和识别效率。
下面开始详细介绍本发明提供的一种识别虚开发票企业的方法实施例二,实施例二基于实施例一实现,并在实施例一的基础上进行了一定程度的拓展。
具体的,实施例二具体可以分为两个过程,即LightGBM模型的训练过程,以及训练完成的LightGBM模型的应用过程,下面分别对这两个过程进行描述:
参见图2,LightGBM模型的训练过程主要包括:
步骤S201:获取训练样本。
如上所述,为保证训练样本的真实性和可靠性,可以从税局数据库获取企业数据来作为训练样本。具体的,训练样本中需要同时包括虚开发票企业的企业数据和合法纳税企业的企业数据。在获取某企业的企业数据时,考虑到税局数据库可能保存了该企业从始至今的数据,而这些数据可能并非全部都是必要的,因此,在实际应用场景中,可以根据实际需求,选择获取该企业在某个时间段所具备的企业数据。
步骤S202:初步筛选特征,并进行数据处理与整合。
准确的来说,上述训练样本是尚未进行加工的原始数据,需要对其进行一些处理,才能得到最终的用于进行训练的训练样本。一方面,上述步骤中获取到的原始数据中可能包括一些与虚开发票根本毫无关联的数据,因此,可以根据业务经验和专家知识来从原始数据中筛选出一定数量的特征(特征是指可能与虚开发票相关联的数据,或者说,是一种衡量企业是否虚开发票的参考指标);另一方面,从税局数据库中获取到的原始数据可能在数据格式上不适合直接输入LightGBM模型,因此,需要对其进行数据整合格式调整。
步骤S203:计算各个特征的重要程度,并根据重要程度对特征进行再次筛选。
具体的,先根据业务需求对LightGBM模型进行调整,然后将步骤S202中的多个特征数据输入LightGBM模型,利用决策树算法计算得到每个特征的重要程度(这里的重要程度,实际上就是特征与虚开发票相关联的程度),最后根据计算出的重要程度对特征进行筛选,选出重要程度最高的预设数量的特征,作为一种可选的实施方式,本实施例可以选取最重要的50个特征。
步骤S204:根据上述步骤筛选得到的特征,利用交叉验证法训练LightGBM模型。
交叉验证法,基本思想是把原始数据进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set or test set)。在训练模型的过程中,首先用训练集对模型进行训练,然后再利用验证集来测试训练得到的模型,以此来做为评价模型的性能指标。具体的,在本实施例中,可以按照7:3的比例将样本划分为训练样本和测试样本。
上述训练过程的目的在于调整模型参数,这里的模型参数可以包括各个特征的权重,甚至还可以包括各个特征的时间粒度。由于某些特征数据可能是随时间变化的,不同时间粒度的特征数据包含了不同时间层面的信息,因此,需要考虑哪种时间粒度的特征数据的参考意义最大,所以可以在模型训练过程中以时间粒度为变量来确定各个特征最可取的时间粒度。
下面对识别过程进行描述,参见图3,利用LightGBM模型对企业进行识别的过程主要包括:
步骤S301:获取待识别企业的预设时间粒度的特征数据,其中,特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
需要说明,这里的特征数据可能为一种,也可能为多种,本实施例对特征数据的种类数量,以及特征数据具体为哪种不做限定。
步骤S302:将特征数据输入预先训练得到的LightGBM模型,以便于该模型根据特征数据计算待识别企业为虚开发票企业的概率值。
步骤S303:根据概率值判断待识别企业是否为虚开发票企业,得到识别结果。
步骤S304:对判定为虚开发票企业的企业进行验证,得到验证结果,并根据验证结果对LightGBM模型的模型参数进行调整。
经过实验证明,本实施例所提供的一种识别虚开发票企业的方法,至少具备以下三项特点:快速性,该方法仅需几十分钟便能完成一个省所有企业的诊断。相比以前大大减少了时间;准确性,该方法可以保证至少85%的识别准确率;针对性,根据该方法的识别结果,能够有效分析出一个企业是否为虚开发票企业,有助于相关部门有针对性的排查相关企业,大大提高排查效率。
下面对本发明提供的一种识别虚开发票企业的装置实施例进行介绍,下文描述的一种识别虚开发票企业的装置与上文描述的一种识别虚开发票企业的方法可相互对应参照。
参见图4,该装置实施例具体包括:
特征数据获取模块401:用于获取待识别企业的特征数据。
数据输入模块402:用于将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值。
识别模块403:用于根据所述概率值判断所述待识别企业是否为虚开发票企业。
作为一种可选的实施方式,所述特征数据获取模块401具体用于:获取待识别企业的预设时间粒度的特征数据,其中,所述特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
本实施例的一种识别虚开发票企业的装置用于实现前述的一种识别虚开发票企业的方法,因此该装置的具体实施方式可见前文中的一种识别虚开发票企业的方法的实施例部分,例如,特征数据获取模块401、数据输入模块402、识别模块403,分别用于实现上述一种识别虚开发票企业的方法中步骤S101,S102,S103。所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再展开介绍。
另外,由于本实施例的一种识别虚开发票企业的装置用于实现前述的一种识别虚开发票企业的方法,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本发明还提供了一种识别虚开发票企业的设备实施例,如图5所示,该设备实施例包括:
存储器501:用于存储计算机程序;
处理器502:用于执行所述计算机程序,以实现如上所述的一种识别虚开发票企业的方法的步骤。
在实际应用场景中,上述存储器501可以是随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM等用于存储计算机程序的存储介质,而上述处理器502是具备运算能力和控制能力的逻辑器件,具体为包括运算逻辑部件、寄存器部件和控制部件的硬件设备,例如CPU。
最后,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的一种识别虚开发票企业的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种识别虚开发票企业的方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种识别虚开发票企业的方法,其特征在于,包括:
获取待识别企业的特征数据;
将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值;
根据所述概率值判断所述待识别企业是否为虚开发票企业。
2.如权利要求1所述的方法,其特征在于,所述LightGBM模型的训练过程为:
预先选取多个企业特征;
利用决策树方法计算各个所述企业特征的重要程度,并筛选出重要程度最高的预设数量的目标企业特征;
将所述目标企业特征输入所述LightGBM模型,并利用交叉验证法对所述LightGBM模型进行训练。
3.如权利要求2所述的方法,其特征在于,所述利用交叉验证法对所述LightGBM模型进行训练,具体包括:
利用交叉验证法对所述LightGBM模型进行训练,确定各个所述目标企业特征的权重。
4.如权利要求2所述的方法,其特征在于,所述利用交叉验证法对所述LightGBM模型进行训练,具体包括:
从税局数据库分别获取合法纳税企业以及虚开发票企业的样本;
将所述样本按照预设比例划分为训练样本和测试样本;
根据所述训练样本和所述测试样本对所述LightGBM模型进行训练。
5.如权利要求1-4任意一项所述的方法,其特征在于,所述获取待识别企业的特征数据,具体包括:
获取待识别企业的预设时间粒度的特征数据,其中,所述特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
6.如权利要求5所述的方法,其特征在于,在所述根据所述概率值判断所述待识别企业是否为虚开发票企业之后,还包括:
对判定为虚开发票企业的企业进行验证,得到验证结果;
根据所述验证结果,对所述LightGBM模型的参数进行调整。
7.一种识别虚开发票企业的装置,其特征在于,包括:
特征数据获取模块:用于获取待识别企业的特征数据;
数据输入模块:用于将所述特征数据输入预先训练得到的LightGBM模型,以便于所述LightGBM模型根据所述特征数据计算所述待识别企业为虚开发票企业的概率值;
识别模块:用于根据所述概率值判断所述待识别企业是否为虚开发票企业。
8.如权利要求7所述的装置,其特征在于,所述特征数据获取模块具体用于:获取待识别企业的预设时间粒度的特征数据,其中,所述特征数据的预设时间粒度为预先通过训练LightGBM模型确定的。
9.一种识别虚开发票企业的设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-6任意一项所述的一种识别虚开发票企业的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-6任意一项所述的一种识别虚开发票企业的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811455524.4A CN109583978A (zh) | 2018-11-30 | 2018-11-30 | 一种识别虚开发票企业的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811455524.4A CN109583978A (zh) | 2018-11-30 | 2018-11-30 | 一种识别虚开发票企业的方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109583978A true CN109583978A (zh) | 2019-04-05 |
Family
ID=65925924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811455524.4A Pending CN109583978A (zh) | 2018-11-30 | 2018-11-30 | 一种识别虚开发票企业的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583978A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178219A (zh) * | 2019-12-24 | 2020-05-19 | 泰康保险集团股份有限公司 | 票据识别管理方法、装置、存储介质及电子设备 |
CN111445320A (zh) * | 2020-03-30 | 2020-07-24 | 深圳市华云中盛科技股份有限公司 | 目标社群识别方法、装置、计算机设备及存储介质 |
WO2021088499A1 (zh) * | 2019-11-04 | 2021-05-14 | 西安交通大学 | 一种基于动态网络表征的发票虚开识别方法及系统 |
CN114154754A (zh) * | 2021-12-21 | 2022-03-08 | 税友信息技术有限公司 | 一种走逃企业的预测方法、系统及相关装置 |
CN114297319A (zh) * | 2021-12-23 | 2022-04-08 | 税友信息技术有限公司 | 一种数据识别方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023340A (zh) * | 2015-07-09 | 2015-11-04 | 胡昭 | 基于扫描仪的云智能发票识别查验系统及方法 |
CN106780001A (zh) * | 2016-12-26 | 2017-05-31 | 税友软件集团股份有限公司 | 一种发票虚开企业监控识别方法及系统 |
CN108416368A (zh) * | 2018-02-08 | 2018-08-17 | 北京三快在线科技有限公司 | 样本特征重要性的确定方法及装置,电子设备 |
-
2018
- 2018-11-30 CN CN201811455524.4A patent/CN109583978A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023340A (zh) * | 2015-07-09 | 2015-11-04 | 胡昭 | 基于扫描仪的云智能发票识别查验系统及方法 |
CN106780001A (zh) * | 2016-12-26 | 2017-05-31 | 税友软件集团股份有限公司 | 一种发票虚开企业监控识别方法及系统 |
CN108416368A (zh) * | 2018-02-08 | 2018-08-17 | 北京三快在线科技有限公司 | 样本特征重要性的确定方法及装置,电子设备 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021088499A1 (zh) * | 2019-11-04 | 2021-05-14 | 西安交通大学 | 一种基于动态网络表征的发票虚开识别方法及系统 |
CN111178219A (zh) * | 2019-12-24 | 2020-05-19 | 泰康保险集团股份有限公司 | 票据识别管理方法、装置、存储介质及电子设备 |
CN111445320A (zh) * | 2020-03-30 | 2020-07-24 | 深圳市华云中盛科技股份有限公司 | 目标社群识别方法、装置、计算机设备及存储介质 |
CN111445320B (zh) * | 2020-03-30 | 2023-09-29 | 深圳市华云中盛科技股份有限公司 | 目标社群识别方法、装置、计算机设备及存储介质 |
CN114154754A (zh) * | 2021-12-21 | 2022-03-08 | 税友信息技术有限公司 | 一种走逃企业的预测方法、系统及相关装置 |
CN114297319A (zh) * | 2021-12-23 | 2022-04-08 | 税友信息技术有限公司 | 一种数据识别方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109583978A (zh) | 一种识别虚开发票企业的方法、装置及设备 | |
EP3082051A1 (en) | Data mining method | |
CN110895758B (zh) | 存在作弊交易的信用卡账户的筛选方法、装置及系统 | |
CN106651573A (zh) | 一种业务数据处理方法及装置 | |
CN110097451B (zh) | 一种银行业务的监控方法及装置 | |
CN112541817A (zh) | 一种个人消费贷款潜在客户的营销响应处理方法及系统 | |
CN109754157A (zh) | 一种反映企业健康经营、融资增信的评分方法及系统 | |
CN110097450A (zh) | 车贷风险评估方法、装置、设备和存储介质 | |
Da Silva et al. | Selecting audit samples using Benford's Law | |
CN111882140A (zh) | 风险评测方法、模型训练方法、装置、设备及存储介质 | |
CN109102396A (zh) | 一种用户信用评级方法、计算机设备及可读介质 | |
CN109993641A (zh) | 一种发票虚开预警方法及系统 | |
CN106875185A (zh) | 一种风控模型训练方法及装置 | |
CN109657186A (zh) | 一种人数统计方法、系统及相关装置 | |
CN106598925A (zh) | 一种快速生成部门决算报表数据的方法及系统 | |
CN117114409A (zh) | 企业数据的数据处理方法、设备和存储介质 | |
US20090187496A1 (en) | Data workbench for accounting data management | |
CN115545652A (zh) | 人员综合评价方法、装置、设备和存储介质 | |
CN108038692A (zh) | 角色识别方法、装置及服务器 | |
CN110097443A (zh) | 一种基于经济事务分类的账务处理方法及其系统 | |
CN114298172A (zh) | 一种基于经济价值及风险预测的预警方法及系统 | |
CN109615232A (zh) | 一种信用积分预测的方法、系统及相关装置 | |
CN110111201A (zh) | 一种信用额度管理方法、装置、系统和记录介质 | |
WO2022227210A1 (zh) | 车主置换评估方法、系统、电子设备及存储介质 | |
US7676427B1 (en) | System and method of continuous assurance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |