CN114386856A - 一种空壳企业识别方法、装置、设备及计算机存储介质 - Google Patents

一种空壳企业识别方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN114386856A
CN114386856A CN202210041810.6A CN202210041810A CN114386856A CN 114386856 A CN114386856 A CN 114386856A CN 202210041810 A CN202210041810 A CN 202210041810A CN 114386856 A CN114386856 A CN 114386856A
Authority
CN
China
Prior art keywords
enterprise
identified
enterprises
information
risk index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210041810.6A
Other languages
English (en)
Inventor
林一鸣
李睿军
刘洋
陈少冬
江凌志
张祎琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202210041810.6A priority Critical patent/CN114386856A/zh
Publication of CN114386856A publication Critical patent/CN114386856A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063114Status monitoring or status determination for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products

Abstract

本申请公开了一种空壳企业识别方法、装置、设备及计算机存储介质。在本申请的技术方案中包括:获取待识别企业的工商注册信息,基于工商注册信息,获取待识别企业的企业信息风险指标数据并输入至空壳企业识别模型中,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的,根据评分,确定所述待识别企业是否为空壳企业。根据本申请实施例,能够有效识别所述待识别企业是否为空壳企业,能够实现无需人工操作、人工审核,避免了人工处理情况下带来的风险;无需对空壳企业样本与非空壳企业样本进行人工标注,节省了大量时间与人力;避免了因正负样本边界模糊和样本分布不均匀等问题导致的分类可靠性不足的问题。

Description

一种空壳企业识别方法、装置、设备及计算机存储介质
技术领域
本申请属于网络信息技术领域,尤其涉及一种空壳企业识别方法、装置、设备及计算机存储介质。
背景技术
空壳企业通常是指没有实体经营或资产的法人实体,常被用于掩盖非法的金融活动。我国目前对于空壳企业仍没有统一认定标准,因此利用数据驱动和科技赋能的方法在开立对公账户前进行核验显得尤为重要。
现有常见的空壳企业识别方法主要有:金融机构的专业人员人工调查与采用机器学习建模方法,通过分析企业各类数据指标建立模型进而对企业的空壳风险进行评估,其中机器学习方法包括监督学习和无监督学习。
现有的空壳企业识别方法,人工调查耗时费力效率低且存在专业人员受利益驱使而导致人工防控措施失效的风险。监督学习需要大量的标注企业空壳与非空壳的标签,而标注过程中也要消耗大量时间与人力。无监督学习因为正负样本边界模糊和样本分布不均匀等问题,导致分类的可靠性不足。
发明内容
本申请实施例提供了一种空壳企业识别的方法、装置、设备及计算机存储介质,能够识别待识别企业是否为空壳企业,能够实现无需人工操作、人工审核,避免了专业人员在人工处理的情况下带来的风险;实现了无需对空壳企业样本与非空壳企业样本进行人工标注,节省了大量时间与人力;避免了因为正负样本边界模糊和样本分布不均匀等问题导致的分类可靠性不足的问题。
一方面,本申请实施例提供了一种空壳企业的识别方法,方法包括:
获取待识别企业的工商注册信息;
基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分;空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
根据评分,确定待识别企业是否为空壳企业。
在一个示例中,企业信息风险指标数据包括至少一项:
企业注册地址风险指标数据;
企业基本信息风险指标数据;
企业法定代表人风险指标数据;
企业受益所有人风险指标数据;
企业治理结构风险指标数据。
在一个示例中,企业信息风险指标数据包括企业注册地址风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
在一个示例中,企业信息风险指标数据包括企业基本信息风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括以下至少一项:
根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;
根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
在一个示例中,企业信息风险指标数据包括法定代表人风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
基于待识别企业工商注册信息,分析待识别企业股东和任职关系,生成股东、高管投资关系图谱;
基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量,以得到法定代表人实际控制企业数量风险指标数据;
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
在一个示例中,企业信息风险指标数据包括企业收益所有人风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据待识别企业的受益所有人控制企业的数量,确定待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;
在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
预设匹配规则包括至少一项:
根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
在一个示例中,企业信息风险指标数据包括企业治理结构风险指标数据;基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
在一个示例中,获取待识别企业的工商注册信息之前,还包括:
获取多个空壳企业的工商注册信息和评分标签;
根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
在一个示例中,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型,具体包括:
采用AHP层次分析法设置的企业信息风险指标标签数据的权重;
根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
在预测评分与评分标签的差值不满足预设条件的情况下,返回采用AHP层次分析法设置的企业信息风险指标标签数据的权重,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型。
再一方面,本申请实施例还提供一种企业识别装置,装置包括:
第一获取模块,用于获取待识别企业的工商注册信息;
第二获取模块,用于基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
识别模块,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
确定模块,根据评分与预设阈值比较分析,确定待识别企业是否为空壳企业。
再一方面,本申请实施例提供了一种空壳企业识别装备,设备包括:
处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现上述实施例的空壳企业识别的方法。
再一方面,本申请实施例提供了一种计算机存储介质,其特征在于,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述实施例的空壳企业识别的方法。
再一方面,本申请实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行上述实施例的空壳企业识别方法。
本申请实施例的空壳企业识别方法、装置、设备及计算机存储介质,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的空壳企业识别模型的构建方法流程示意图;
图2是本申请一个实施例提供的S130的具体实现方式的流程示意图;
图3是本申请一个实施例提供的空壳企业识别方法的流程示意图;
图4是本申请另一个实施例提供的空壳企业识别方法的流程示意图;
图5是本申请一个实施例提供的空壳企业识别装置的结构示意图;
图6是本申请一个实施例提供的空壳企业识别设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
本申请技术方案中对数据的获取、存储、使用以及处理等均符合国家法律法规的相关规定。
为了解决现有技术问题,本申请实施例提供了一种空壳企业识别方法。该方法将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
在介绍本申请实施例所提供的空壳企业识别方法之前,首先介绍本申请实施例提供的识别方法遇到的空壳企业识别模型。
如图1所示,本申请实施例所提供的空壳企业识别模型的构建方法包括以下步骤:
S110,获取多个空壳企业的工商注册信息和评分标签;
S120,根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
S130,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
通过上述实施方式,可以根据已知的空壳企业样本信息生成风险指标数据从而构建空壳企业识别模型,并且可以根据多个空壳企业样本的企业信息风险指标数据与多个空壳企业样本的企业得分之间的关系,进一步对空壳企业识别模型进行迭代优化。
具体地,在S110中,多个空壳企业样本的工商注册信息可直接获取,空壳企业样本的工商注册信息包括但不限于:注册号、公司名称、股东名称、投资比例、法定代表人、经营期限、组织机构、注册时间、注册地址等;评分标签是对空壳企业进行人工评估得到的评分。
在S120中,根据空壳企业工商注册信息生成对应的空壳企业信息风险指标标签数据的过程与S220过程类似,不同之处在于S120过程中需要的是空壳企业,S220过程中需要的可以是任意待识别企业,详细实施内容将在S220中进行详细描述。
在S130中,根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
作为S130的一个示例,如图2所示,S130可以具体包括以下步骤:
S210:采用AHP层次分析法设置的企业信息风险指标标签数据的权重;
S220:根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
S230:判断预测评分与评分标签的差值是否满足预设条件。
S240:在预测评分与评分标签的差值不满足预设条件的情况下,返回S210,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型;在预测评分与评分标签的差值满足预设条件的情况下,结束上述识别过程。
S210中,可以采用层次分析法(Analytic Hierarchy Process,AHP)对企业的风险指标数据进行赋权。
AHP层次分析法是指是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法。这种方法的特点就是在对复杂决策问题的本质、影响因素及其内在关系等进行深入研究的基础上,利用较少的定量信息使决策的思维过程数学化,从而为多目标、多准则或无结构特性的复杂决策问题提供简便的决策方法,是对难以完全定量的复杂系统做出决策的模型和方法。
本申请实施例中采用AHP层次分析法根据识别空壳企业这一问题的性质和总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系将因素按不同的层次聚集组合,形成一个多层次的分析结构模型,从而最终使问题归结为最低层(供决策的方案、措施等)相对于最高层(总目标)的相对重要权值的确定或相对优劣次序的排定。
层次分析法所对应的比较矩阵的值主要反映了每一个风险指标数据相对重要性的认识。
请参照表1,表1给出了层次分析法比较矩阵值及其含义。
Figure BDA0003470547360000081
比较矩阵是层次分析法的基本信息,也是进行层次分析法分析的基础,比较矩阵的特征向量经过归一化后,即为同层次相应因素对于上一层次某因素相对重要性的排序权值。具体地,在S210中,采用AHP层次分析法对一个空壳企业样本的各项企业信息风险指标数据进行赋权,得到各风险指标数据的权重值,假设该企业有n个风险指标数据:w1,w2,w3,……,wn;对应地设置该企业各项企业信息风险指标数据的权重值:a1,a2,a3,……,an,其中w1,w,w3,……,wn的值根据该企业的实际情况取值,a1,a2,a3,……,an的值只能为0或1。至此,得到该企业第一轮空壳企业识别过程中的风险指标数据和权重值。
在S220中,初始空壳企业识别模型可以如下式表示:
P=a1*w1+a2*w2+…+an*wn
其中,P为评分;
w1,w2,w3,……,wn为空壳企业有n个风险指标数据;
a1,a2,a3,……,an分别为各项企业信息风险指标数据的权重值,该权重值可以根据S210步骤得到。
作为S220的一个示例,本步骤可以具体为:将一个空壳企业的n个风险指标数据输入到初始空壳企业识别模型中,得到该空壳企业的预测评分P1。
在S230中,判断预测评分与评分标签的差值是否满足预设条件,如果是,执行S240,如果否,返回S210。
其中,作为一示例,预设条件可以为预测评分与对该企业预先设定的评分标签的差值小于预设阈值。
以上本申请实施例提供的空壳企业识别模型的构建方法的具体实现方式。在该具体实现方式中,通过拟合空壳企业的评分及其对应的空壳企业信息风险指标之间的关系即可得到空壳企业识别模型。在上述过程中无需对空壳与非空壳企业样本进行标注,节省了大量时间与人力,不会因正负样本边界模糊和样本分布不均匀等问题,导致分类的可靠性不足。
基于上述实施例中提供的空壳企业识别模型,下面对本申请实施例所提供的空壳企业识别方法进行介绍。
如图3所示,本申请实施例提供的空壳企业识别方法包括以下步骤:空壳企业识别方法的流程示意图;
S310,获取待识别企业的工商注册信息;
S320,基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
S330,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
S340,根据评分,确定待识别企业是否为空壳企业。
通过上述实施方式,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该方法也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
下面结合具体实施例对上述各步骤做出详细叙述。
在S310中,获取待识别企业的工商注册信息。其中,待识别企业是指评估其是否为空壳企业的对象。企业的工商注册信息具体包括但不限于注册号、公司名称、股东名称、投资比例、法定代表人、经营期限、组织机构、注册时间、注册地址等。在一个实施例中,若要获取企业的工商注册信息可向企业所在地的工商局处查询企业公开的工商注册信息。
在S320中,基于待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据。
作为本申请的一个示例,企业信息风险指标数据可以具体包括以下中的至少一项:
企业注册地址风险指标数据;
企业基本信息风险指标数据;
企业法定代表人风险指标数据;
企业受益所有人风险指标数据;
企业治理结构风险指标数据。
在本申请实施例中,企业注册地址风险指标数据需要对企业工商注册信息中的注册地址挖掘分析,综合运用数据分析和挖掘、互联网地图应用程序接口(ApplicationProgramming Interface,API)、Python和神经语言程序学(Neuro-LinguisticProgramming,NLP)等技术,基于企业注册地址信息生成企业网格数据库,从而设定待识别企业所在区域范围内企业数量分布等级,形成待识别企业是否过于偏远的标签,为识别空壳企业提供辅助判断。
作为一个示例,当企业信息风险指标数据包括企业注册地址风险指标数据时,S320可以具体包括:
S321、根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
S322、根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
S323、根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
在S321中,企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的。作为一示例,该数据库的构建过程可以如下:基于区域范围内企业的工商注册信息,提取出该区域范围内企业的注册地址信息,通过互联网地图API获得企业的位置信息,根据位置信息按照r公里划分网格区域,统计各网格区域的企业数量,形成企业网格区域数据库。
作为S321的一个示例,S321可以具体包括:根据待识别企业所在地址的位置信息,运用基于欧式距离的概率密度函数计算待识别企业与β公里范围内各网格区域的权重系数,采用加权平均法获得待识别企业β公里范围内企业加权平均数量。
在S322中,可以通过对待识别企业β公里范围以内企业数量分布进行统计分析。在一个示例中,采用均值方法,根据β公里范围内企业的总数量与待识别企业β公里范围内网格区域数量的比值,可以得到各网格区域内企业数量的平均值,根据待识别企业β公里范围内企业加权平均数量、待识别企业β公里范围内企业加权平均数量和/或待识别企业所在网格区域内企业数量和/或上述平均值比较分析,根据均值法的比较规则,设定待识别企业的数量分布等级为N,N是一个正整数。
在另一个示例中,采用百分位数方法,根据β公里范围内各网格区域内企业的数量之间的比值,确定待识别企业所在网格区域内企业数量占区域范围内企业总数量的百分位数,和/或待识别企业所在网格区域内企业数量的区间范围占区域范围内企业总数量的百分位数,和/或其他根据百分位数法能够得到的百分位数,根据待识别企业相关的企业数量百分位数与百分位数法的比较规则,设定待识别企业的数量分布等级为N,N是一个正整数。
在本申请实施例中,对待识别企业β公里范围以内企业数量分布进行统计分析,以设定企业数量分布等级的过程中,统计分析采用的方法包括但不限于上述两个示例的均值法、百分位数法,采用的方法所得到的数据包括但不限于上述示例中的数据。
将待识别企业的企业数量分布等级N与预设的等级阈值进行比较,形成待识别企业是否过于偏远的标签,为识别待识别企业是否为空壳企业提供辅助判断。
作为一个示例,当企业信息风险指标数据包括企业基本信息风险指标数据时;S320可以包括以下至少一项:
根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
作为一个示例,企业法定代表人风险指标数据基于企业的股东、高管投资关系图谱而形成,关系图谱是通过大数据分析区域范围内企业的工商注册信息,采用图数据库技术解析企业的股东任职关系,生成企业的股东、高管投资关系图谱。
当企业信息风险指标数据包括企业法定代表人风险指标数据时,S220可以包括以下至少一项:
基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量是否超过第二预设阈值,以得到法定代表人实际控制企业数量风险指标数据;基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
作为一个示例,当企业信息风险指标数据包括企业受益所有人风险指标数据时;S220可以包括以下至少一项:
根据待识别企业的受益所有人控制企业的数量,确定待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
预设匹配规则包括至少一项:
根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
作为一个示例,当企业信息风险指标数据包括企业治理结构风险指标数据时;S320可以包括以下至少一项:
根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
企业信息风险指标数据是基于企业的工商注册信息进一步挖掘、处理、分析而得到的,相较于企业的工商注册信息能够更加直观、综合、全面地反映企业的相关特征信息,能够直接被空壳企业识别模型所采用。
在S330中,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分。
待识别企业的企业信息风险指标数据输入到上述构建得到的空壳企业识别模型中,可以得到待识别空壳企业评分。
在S340中,根据评分,确定待识别企业是否为空壳企业。
上述实施例,综合运用大数据挖掘分析构建企业网格区域数据库、企业投资关系图谱和层次分析法等技术手段搭建空壳企业识别模型,基于企业的工商注册信息实现了深层次、多维度地挖掘企业的风险指标,精准地识别待识别企业,最大程度上提高了空壳企业识别模型的准确率。能够挖掘出隐藏较深的空壳企业及其法定代表人、企业受益所有人等团伙,避免了因空壳企业的非法金融活动对市场造成的风险。
为了能够更加准确地识别空壳企业,本申请还提供了一种空壳企业识别方法的另一个实施例。具体如图4所示,该方法在S310之前还可以包括:
S410:获取多个空壳企业的工商注册信息和评分标签;
S420:根据每个空壳企业的工商注册信息,分别生成空壳企业对应的空壳企业信息风险指标标签数据;
S430:根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
在一个示例中,S410-S430具体实施部分与本申请实施例空壳企业识别模型构建方法相同,详细描述可参见图1空壳企业识别模型方法构建的流程示意图中空壳企业识别模型的构建过程。
基于上述实施例提供的空壳企业识别方法,本申请还提供了一种空壳企业识别装置实施例500。如图5所示,该装置包括:第一获取模块510、第二获取模块520、识别模块530、确定模块540。
第一获取模块510,用于获取待识别企业的工商注册信息。
第二获取模块520,用于获取基于待识别企业的工商注册信息而得到的风险指标数据。
识别模块530,用于将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过空壳企业识别模型对待识别企业进行识别,得到待识别企业的评分,空壳企业识别模型为根据空壳企业的信息风险指标构建得到的。
确定模块540,用于将评分根据预设规则与预设评分阈值进行比较,得出待识别企业的识别结果。
本申请实施例的空壳企业识别装置,将待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,得到待识别企业的评分,根据该评分来确定待识别企业是否为空壳企业。其中,该空壳企业识别模型是根据空壳企业的信息风险指标构建得到的。如此,该识别模型的构建过程无需对空壳企业样本与非空壳企业样本进行标注,如此,该方法不存在标注样本而消耗时间和人力的问题,另外,该装置也不需要正负样本,从而也避免了机器学习的无监督学习方法中带来的正负样本边界模糊和样本分布不均等而导致的分类可靠性不足的问题。
作为一示例,所述企业信息风险指标数据包括企业注册地址风险指标数据;第二获取模块520可以具体用于:
根据企业网格区域数据库,确定相距待识别企业预设距离内的企业数量;企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
根据企业数量以及预设企业数量分布等级,确定企业数量对应的目标数量分布等级;
根据目标数量分布等级与预设等级阈值,确定待识别企业是否为偏远企业,以得到待识别企业的企业注册地址风险指标数据。
作为一示例,企业信息风险指标数据包括企业基本信息风险指标数据;第二获取模块520可以具体用于以下至少一项:
根据待识别企业的联系方式以及数据库内其他企业的联系方式,确定联系方式重复数量;根据联系方式重复数量与第一预设阈值,确定待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
根据待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;
根据待识别企业注册地址,确定待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
根据待识别企业注册时间,确定待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
根据待识别企业注册资金,确定待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
作为一示例,企业信息风险指标数据包括企业法定代表人风险指标数据;第二获取模块520可以具体用于以下至少一项:
基于待识别企业工商注册信息,分析待识别企业股东和任职关系,生成股东、高管投资关系图谱;
基于投资关系图谱,确定待识别企业的法定代表人实际控制企业数量是否超过第二预设阈值,以得到法定代表人实际控制企业数量风险指标数据;
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册地址所属地区,确定企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
基于投资关系图谱,根据待识别企业的法定代表人实际控制企业的注册时间,确定待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
作为一示例,企业信息风险指标数据包括企业受益所有人风险指标数据;第二获取模块520可以具体用于以下至少一项:
根据所述待识别企业的受益所有人控制企业的数量,确定所述待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;
在实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的实际控制企业的企业受益所有人是否为同一人,以得到待识别企业的企业受益所有人风险指标数据;
预设匹配规则包括至少一项:
根据实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
根据实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
作为一示例,企业信息风险指标数据包括企业治理结构风险指标数据;第二获取模块520可以具体用于以下至少一项:
根据待识别企业的法定代表人、股东大会、董事会、监事会、高管与企业网格区域数据库内其他公司重复人员的数量,确定待识别企业管理人员与企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到待识别企业的企业治理结构风险指标数据。
作为装置的另一实施例,为了提高识别准确率,装置还可以包括:
第三获取模块,用于待识别企业的工商注册信息之前,获取多个空壳企业的工商注册信息和评分标签;
生成模块,用于根据每个所述空壳企业的工商注册信息,分别生成壳企业对应的空壳企业信息风险指标标签数据;
拟合模块,用于根据空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合空壳企业信息风险指标标签数据与空壳企业的得分之间的关系,得到空壳企业识别模型。
作为一示例,拟合模块可以具体包括:
采用AHP层次分析法设置的企业信息风险指标标签数据的权重;
根据权重和初始空壳企业识别模型,得到空壳企业的预测评分;
在所述预测评分与所述评分标签的差值不满足预设条件的情况下,返回所述采用AHP层次分析法设置的企业信息风险指标标签数据的权重,直至预测评分与评分标签的差值满足预设条件,得到空壳企业识别模型。
图6示出了本申请实施例提供的空壳企业识别设备的硬件结构示意图。
在空壳企业识别设备可以包括处理器601以及存储有计算机程序指令的存储器602。
具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。
存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种空壳企业识别方法。
在一个示例中,空壳企业识别设备还可包括通信接口603和总线510。其中,如图6所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
通信接口603,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线610包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该空壳企业识别设备可以基于当前待识别企业的风险指标数据以及层次分析法执行本申请实施例中的空壳企业识别方法,从而实现结合图1描述的空壳企业识别模型构建的流程和图2描述的空壳企业识别方法。
另外,结合上述实施例中的空壳企业识别方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种空壳企业识别方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (13)

1.一种空壳企业的识别方法,其特征在于,包括:
获取待识别企业的工商注册信息;
基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据;
将所述待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过所述空壳企业识别模型对所述待识别企业进行识别,得到待识别企业的评分,所述空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
根据所述评分,确定所述待识别企业是否为空壳企业。
2.根据权利要求1所述的空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括至少一项:
企业注册地址风险指标数据;
企业基本信息风险指标数据;
企业法定代表人风险指标数据;
企业受益所有人风险指标数据;
企业治理结构风险指标数据。
3.根据权利要求2所述空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括企业注册地址风险指标数据;所述基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据企业网格区域数据库,确定相距所述待识别企业预设距离内的企业数量;所述企业网格区域数据库是对预设范围内的企业的位置信息进行网格划分得到的;
根据所述企业数量以及预设企业数量分布等级,确定所述企业数量对应的目标数量分布等级;
根据所述目标数量分布等级与预设等级阈值,确定所述待识别企业是否为偏远企业,以得到所述待识别企业的企业注册地址风险指标数据。
4.根据权利要求2所述空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括企业基本信息风险指标数据;所述基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括以下至少一项:
根据所述待识别企业的联系方式以及所述数据库内其他企业的联系方式,确定联系方式重复数量;根据所述联系方式重复数量与第一预设阈值,确定所述待识别企业是否为联系方式为公用的企业,以得到联系方式的风险指标数据;
根据所述待识别企业注册地址与办公地址,确定待识别企业是否为异地经营,以得到异地经营风险指标数据;
根据所述待识别企业注册地址,确定所述待识别企业的注册地址是否属于自贸区,以得到注册地址风险指标数据;
根据所述待识别企业注册时间,确定所述待识别企业注册时间是否在预设时间范围内,以得到注册时间风险指标数据;
根据所述待识别企业注册资金,确定所述待识别企业注册资金是否在预设资金额度范围内,以得到注册资金风险指标数据。
5.根据权利要求2所述空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括法定代表人风险指标数据;所述基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
基于所述待识别企业工商注册信息,分析所述待识别企业股东和任职关系,生成股东、高管投资关系图谱;
基于所述投资关系图谱,确定所述待识别企业的法定代表人实际控制企业数量是否超过第二预设阈值,以得到法定代表人实际控制企业数量风险指标数据;
基于所述投资关系图谱,根据所述待识别企业的法定代表人实际控制企业的注册地址所属地区,确定所述企业的注册地址所属地区是否均不相同,以得到法定代表人实际控制企业所属地区风险指标数据;
基于所述投资关系图谱,根据所述待识别企业的法定代表人实际控制企业的注册时间,确定所述待识别企业法定代表人实际控制企业的注册时间是否集中在一段时间内,以得到法定代表人实际控制企业注册时间风险指标数据。
6.根据权利要求2所述空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括企业收益所有人风险指标数据;所述基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据所述待识别企业的受益所有人控制企业的数量,确定所述待识别企业受益所有人实际控制企业数量是否超过第三预设阈值;
在所述实际控制企业数量超过第三预设阈值的情况下,根据预设匹配规则,确定待识别企业受益所有人与具有相同姓名的所述实际控制企业的企业受益所有人是否为同一人,以得到所述待识别企业的企业受益所有人风险指标数据;
所述预设匹配规则包括至少一项:
根据所述实际控制的企业之间投资关系的层级数量与第四预设阈值,确定具有相同姓名的企业受益所有人是否为同一人;
根据所述实际控制的企业间有相同的联系方式、注册地址信息制定筛选规则,确定具有相同姓名的企业受益所有人是否为同一人;
根据待识别企业的企业法定代表人、股东大会、董事会、监事会、高管与所述实际控制的企业的重复人员的数量与第五预设阈值,确定具有相同姓名的企业受益所有人是否为同一人。
7.根据权利要求2所述空壳企业识别方法,其特征在于,所述企业信息风险指标数据包括企业治理结构风险指标数据;所述基于所述待识别企业的工商注册信息,获取待识别企业的企业信息风险指标数据,包括:
根据所述待识别企业的法定代表人、股东大会、董事会、监事会、高管与所述企业网格区域数据库内其他公司重复人员的数量,确定所述待识别企业管理人员与所述企业网格区域数据库内其他公司重复人员数量是否超过第六预设阈值,以得到所述待识别企业的企业治理结构风险指标数据。
8.根据权利要求1-7任一项所述的空壳企业识别方法,其特征在于,所述获取待识别企业的工商注册信息之前,还包括:
获取多个空壳企业的工商注册信息和评分标签;
根据每个所述空壳企业的工商注册信息,分别生成所述空壳企业对应的空壳企业信息风险指标标签数据;
根据所述空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合所述空壳企业信息风险指标标签数据与所述空壳企业的得分之间的关系,得到所述空壳企业识别模型。
9.根据权利要求8任一项所述的空壳企业识别方法,其特征在于,所述根据所述空壳企业对应的空壳企业信息风险指标标签数据以及评分标签,拟合所述空壳企业信息风险指标标签数据与所述空壳企业的得分之间的关系,得到所述空壳企业识别模型,具体包括:
采用AHP层次分析法设置的所述企业信息风险指标标签数据的权重;
根据所述权重和初始空壳企业识别模型,得到所述空壳企业的预测评分;
在所述预测评分与所述评分标签的差值不满足预设条件的情况下,返回所述采用AHP层次分析法设置的所述企业信息风险指标标签数据的权重,直至所述预测评分与所述评分标签的差值满足预设条件,得到所述空壳企业识别模型。
10.一种空壳企业识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取待识别企业的工商注册信息;
第二获取模块,用于基于所述待识别企业的工商注册信息,获取所述待识别企业的企业信息风险指标数据;
识别模块,用于将所述待识别企业的企业信息风险指标数据输入至空壳企业识别模型中,通过所述空壳企业识别模型对所述待识别企业进行识别,得到待识别企业的评分,所述空壳企业识别模型为根据空壳企业的信息风险指标构建得到的;
确定模块,用于根据所述评分与预设阈值比较分析,确定所述待识别企业是否为空壳企业。
11.一种空壳企业识别设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-9任意一项所述的空壳企业识别的方法。
12.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-9任意一项所述的空壳企业识别的方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1-9任意一项所述的空壳企业识别方法。
CN202210041810.6A 2022-01-14 2022-01-14 一种空壳企业识别方法、装置、设备及计算机存储介质 Pending CN114386856A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210041810.6A CN114386856A (zh) 2022-01-14 2022-01-14 一种空壳企业识别方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210041810.6A CN114386856A (zh) 2022-01-14 2022-01-14 一种空壳企业识别方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114386856A true CN114386856A (zh) 2022-04-22

Family

ID=81201181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210041810.6A Pending CN114386856A (zh) 2022-01-14 2022-01-14 一种空壳企业识别方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114386856A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577701A (zh) * 2022-09-23 2023-01-06 刘娇平 针对大数据安全的风险行为识别方法、装置、设备及介质
CN115619420A (zh) * 2022-07-26 2023-01-17 撼地数智(重庆)科技有限公司 一种空壳企业精准识别方法、系统、设备及存储介质
CN116681358A (zh) * 2023-08-04 2023-09-01 深圳中科闻歌科技有限公司 一种基于XGBoost模型的新注册异常企业检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115619420A (zh) * 2022-07-26 2023-01-17 撼地数智(重庆)科技有限公司 一种空壳企业精准识别方法、系统、设备及存储介质
CN115577701A (zh) * 2022-09-23 2023-01-06 刘娇平 针对大数据安全的风险行为识别方法、装置、设备及介质
CN115577701B (zh) * 2022-09-23 2023-09-19 刘娇平 针对大数据安全的风险行为识别方法、装置、设备及介质
CN116681358A (zh) * 2023-08-04 2023-09-01 深圳中科闻歌科技有限公司 一种基于XGBoost模型的新注册异常企业检测方法

Similar Documents

Publication Publication Date Title
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
CN114386856A (zh) 一种空壳企业识别方法、装置、设备及计算机存储介质
CN110688536A (zh) 一种标签预测方法、装置、设备和存储介质
CN108777004B (zh) 高速公路客运车辆跨省匹配方法及装置
CN112016313A (zh) 口语化要素识别方法及装置、警情分析系统
CN112990294A (zh) 行为判别模型的训练方法、装置、电子设备及存储介质
CN109784352A (zh) 一种评估分类模型的方法和装置
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN114118816A (zh) 一种风险评估方法、装置、设备及计算机存储介质
CN117235608B (zh) 风险检测方法、装置、电子设备及存储介质
CN111754261B (zh) 一种车辆出租意愿的评估方法、装置及终端设备
CN112950347A (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN111815435A (zh) 一种群体风险特征的可视化方法、装置、设备及存储介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN115205026A (zh) 信用评估方法、装置、设备及计算机存储介质
CN113052604A (zh) 一种对象检测方法、装置、设备及存储介质
CN114154617A (zh) 一种基于vfl的低压居民用户异常用电识别方法及系统
Shen et al. Modelling the predictive performance of credit scoring
CN112396513B (zh) 一种数据处理的方法及装置
CN116051296B (zh) 基于标准化保险数据的客户评价分析方法及系统
CN115187387B (zh) 一种风险商家的识别方法及设备
CN117010569A (zh) 客户流失预测方法、装置、设备、存储介质及程序产品
CN114021952A (zh) 企业合作评分方法、装置、电子设备及计算机存储介质
CN114168814A (zh) 数据处理方法、相关装置
CN116308416A (zh) 一种空壳企业识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination