CN115630732A - 一种面向城市运营的企业迁移大数据监测预警方法及装置 - Google Patents

一种面向城市运营的企业迁移大数据监测预警方法及装置 Download PDF

Info

Publication number
CN115630732A
CN115630732A CN202211267371.7A CN202211267371A CN115630732A CN 115630732 A CN115630732 A CN 115630732A CN 202211267371 A CN202211267371 A CN 202211267371A CN 115630732 A CN115630732 A CN 115630732A
Authority
CN
China
Prior art keywords
enterprise
migration
database
analysis
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211267371.7A
Other languages
English (en)
Inventor
王富海
蒋峻涛
任俊宇
钱征寒
吕泽辉
石思炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Planning And Design Consulting Ltd By Share Ltd
Original Assignee
Shenzhen Planning And Design Consulting Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Planning And Design Consulting Ltd By Share Ltd filed Critical Shenzhen Planning And Design Consulting Ltd By Share Ltd
Priority to CN202211267371.7A priority Critical patent/CN115630732A/zh
Publication of CN115630732A publication Critical patent/CN115630732A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种面向城市运营的企业迁移大数据监测预警方法、装置及终端设备,所述方法包括如下步骤:构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;通过机器学习算法构建企业迁移风险预测模型;将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。本发明通过能够实现提前对企业迁移风险进行监测预警,避免导致政府的措施出现滞后,以及能够为针对性地开展引导工作提供精准的决策支撑。

Description

一种面向城市运营的企业迁移大数据监测预警方法及装置
技术领域
本发明属于风险监测预警技术领域,尤其涉及一种面向城市运营的企业迁移大数据监测预警方法及装置。
背景技术
近年来,随着经济全球化深入发展,城市化进程和产业结构调整不断加快,企业在不同城市区域之间的频繁迁移。一般情况下,企业因产业结构调整、生产规模扩张和资源优化配置等原因发生迁移,有利于产业优化升级,应积极鼓励及引导。但盲目的迁移、恶性竞争以及无序流动会导致资源的非必要浪费。一方面,企业主体在发生迁移后,实际情况没能达到预期效果,甚至出现负面影响;另一方面,企业原所在地市因企业的迁移导致税收减少,影响城市经济健康平稳发展。
目前,对于企业的迁移分析大多基于事后分析,无法提前感知企业的迁移行为,导致政府的许多措施存在明显的滞后性。另外,在企业迁移的影响规律分析中,现有的方法大多是通过传统的统计学方法,通过方差分析或者线性回归来分析整体的迁移规律,难以实现在个体层面对企业迁移的核心要素进行识别,导致许多引导措施没有针对性。
因此,传统的技术方案中存在难以提前对企业迁移风险进行监测预警和难以在个体层面对企业迁移的核心要素进行识别的问题。
发明内容
本发明的目的在于提供一种面向城市运营的企业迁移大数据监测预警方法、装置及终端设备,旨在解决传统的技术方案存在的难以提前对企业迁移风险进行监测预警和难以在个体层面对企业迁移的核心要素进行识别的问题。
本发明实施例的第一方面提供了一种面向城市运营的企业迁移大数据监测预警方法,所述方法包括如下步骤:
构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;
基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;
通过机器学习算法构建企业迁移风险预测模型;
将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
在一个实施例中,所述构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库包括如下步骤:
获取企业的工商登记信息,对所述工商登记信息进行清洗预处理,得到所述企业基础信息数据库;
获取企业的经营活动信息,对所述经营活动信息进行清洗预处理,得到所述企业经营活动数据库;
获取企业的外部环境信息,根据所述外部环境信息的地址信息,通过地理编码得到所述企业外部环境数据库。
在一个实施例中,所述基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量包括如下步骤:
基于所述企业基础信息数据库,提取所述基础信息特征;
基于所述企业经营活动数据库,提取所述经营活动特征;
基于所述企业外部环境数据库,根据企业的地址信息,通过地理空间匹配,得到所述外部环境特征。
在一个实施例中,所述通过机器学习算法构建企业迁移风险预测模型包括如下步骤:
选取行业类型相同的企业的所述企业迁移分析特征向量作为样本集;
将所述样本集划分为训练集和测试集;
基于所述训练集和所述测试集,选择多种机器学习算法进行模型训练;
将训练好的模型融合得到投票模型作为所述企业迁移风险预测模型。
在一个实施例中,所述将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果包括如下步骤:
将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移概率;
基于所述企业迁移概率和企业实际迁移结果,设定迁移风险预警阈值;
对所述企业迁移概率超过所述迁移风险预警阈值的企业进行分级预警。
在一个实施例中,所述方法还包括如下步骤:
基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征;
对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因。
在一个实施例中,所述基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征包括如下步骤:
通过不同的特征重要性计算方法得到所述企业迁移风险预测模型中各特征的重要性分布;
从不同的所述各特征的重要性分布中识别影响企业迁移的共性特征,输出特征重要性指标。
在一个实施例中,所述对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因包括如下步骤:
通过模型局部解释器构建企业迁移影响因素分析模型;
将每个具有迁移风险的企业输入所述企业迁移影响因素分析模型,得到影响企业迁移的个性特征;
经统计分析输出影响企业迁移的迁移原因。
本发明实施例的第二方面提供了一种面向城市运营的企业迁移大数据监测预警装置,所述装置包括:
第一构建模块,用于构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;
第二构建模块,用于基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;
第三构建模块,用于通过机器学习算法构建企业迁移风险预测模型;
监测预警模块,用于将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法。
本发明实施例与现有技术相比存在的有益效果是:上述的面向城市运营的企业迁移大数据监测预警方法,通过构建企业迁移风险预测模型,将企业迁移分析特征向量输入企业迁移风险预测模型,得到企业迁移风险预测结果,并识别影响企业迁移的共性特征和影响特定具有迁移风险企业迁移的个性特征,能够实现提前对企业迁移风险进行监测预警,避免导致政府的措施出现滞后,以及能够在个体层面对企业迁移的核心要素进行识别,为针对性地开展引导工作提供精准的决策支撑。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警方法的流程示意图;
图2为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警方法的步骤S101的流程示意图;
图3为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警方法的步骤S102的流程示意图;
图4为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警方法的步骤S103的流程示意图;
图5为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警方法的步骤S104的流程示意图;
图6为本发明实施例提供的另一种面向城市运营的企业迁移大数据监测预警方法的流程示意图;
图7为本发明实施例提供的另一种面向城市运营的企业迁移大数据监测预警方法的步骤S105的流程示意图;
图8为本发明实施例提供的另一种面向城市运营的企业迁移大数据监测预警方法的步骤S106的流程示意图;
图9为本发明实施例提供的一种面向城市运营的企业迁移大数据监测预警装置的结构示意图;
图10为本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
本实施例的第一方面提供了一种面向城市运营的企业迁移大数据监测预警方法,如图1所示,所述方法包括如下步骤:
S101、构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库。
在本实施例中,需要说明的是,所述企业基础信息数据库、企业经营活动数据库和企业外部环境数据库可来自于市场监督管理局的基础数据以及互联网开源数据,根据企业统一信用代码及企业名称实现企业数据的融合,形成所述企业迁移分析多源基础数据库。
S102、基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量。
在本实施例中,需要说明的是,所述基础信息特征、经营活动特征和外部环境特征可分别从所述企业基础信息数据库、企业经营活动数据库和企业外部环境数据库中对应提取。
S103、通过机器学习算法构建企业迁移风险预测模型。
在本实施例中,需要说明的是,所述企业迁移风险预测模型可以通过一种机器学习算法构建,也可以通过多种机器学习算法融合构建。
S104、将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
在本实施例中,需要说明的是,可以是将每个企业的所述企业迁移分析特征向量分别输入所述企业迁移风险预测模型,得到对应的所述企业迁移风险预测结果。
本实施例提供的这种面向城市运营的企业迁移大数据监测预警方法,通过基于企业迁移分析多源基础数据库,构建企业迁移分析特征向量,通过机器学习算法构建企业迁移风险预测模型,将企业迁移分析特征向量输入企业迁移风险预测模型,得到企业迁移风险预测结果,能够实现提前对企业迁移风险进行监测预警。所使用的数据来自于市场监督管理局的基础数据以及互联网开源数据,未使用到特殊来源的数据,方法的使用条件更具有一般性,容易在不同城市推广使用。
可选地,如图2所示,步骤S101构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库包括如下步骤:
S1011、获取企业的工商登记信息,对所述工商登记信息进行清洗预处理,得到所述企业基础信息数据库。
在本实施例中,需要说明的是,所述工商登记信息可包括企业名称、企业类型、成立时间、注册资本、注册地、股东等,对所述工商登记信息进行清洗预处理可包括对所述工商登记信息进行规范化和去重。
S1012、获取企业的经营活动信息,对所述经营活动信息进行清洗预处理,得到所述企业经营活动数据库。
在本实施例中,需要说明的是,所述经营活动信息可包括企业年报数据、企业变更数据、行政处罚数据、企业异常经营数据、企业招聘数据等,对所述经营活动信息进行清洗预处理可包括对所述经营活动信息进行补全。
S1013、获取企业的外部环境信息,根据所述外部环境信息的地址信息,通过地理编码得到所述企业外部环境数据库。
在本实施例中,需要说明的是,所述外部环境信息可包括POI数据、企业招聘数据、人口密度数据、交通设施数据、办公租赁数据等。
通过构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库,能够使得数据维度丰富,分析结果更为科学,并且企业经营活动信息和外部环境信息具有一定的动态性,可以实现企业迁移风险的动态监测预警。
可选地,如图3所示,步骤S102基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量包括如下步骤:
S1021、基于所述企业基础信息数据库,提取所述基础信息特征。
在本实施例中,需要说明的是,所述基础信息特征可包括企业类型、成立时间、注册资本、注册地址、行业类型、股东等。
S1022、基于所述企业经营活动数据库,提取所述经营活动特征。
在本实施例中,需要说明的是,所述经营活动特征可包括企业年报、企业变更、行政处罚、经营异常、违法登记、企业招聘等。
S1023、基于所述企业外部环境数据库,根据企业的地址信息,通过地理空间匹配,得到所述外部环境特征。
在本实施例中,需要说明的是,所述外部环境特征可包括办公场地、办公租金、劳动力供给、创新环境、交通条件、法制环境等。
通过构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量,将企业迁移分析特征向量输入企业迁移风险预测模型后能够实现对企业迁移风险的监测预警。
可选地,如图4所示,步骤S103通过机器学习算法构建企业迁移风险预测模型包括如下步骤:
S1031、选取行业类型相同的企业的所述企业迁移分析特征向量作为样本集。
在本实施例中,需要说明的是,所述行业类型相同的企业可基于工商登记信息中的行业类型字段和经营范围字段,通过关键词提取分析和文本相似性分析获取得到。按照行业类型对企业进行划分,筛选出迁移企业数量多,迁移率高的行业的企业的所述企业迁移分析特征向量作为建模的样本集。
S1032、将所述样本集划分为训练集和测试集。
在本实施例中,需要说明的是,先对样本集的数据进行预处理,包括对特征空值的处理、类别变量的转换、连续数值变量的归一化等,形成可用于模型训练的数据集,而后通过随机抽样的方式将预处理后的所述企业迁移分析特征向量划分为训练集和测试集,其中训练集可包括发生迁移的企业和未发生迁移的企业,测试集可包括发生迁移的企业和未发生迁移的企业。
S1033、基于所述训练集和所述测试集,选择多种机器学习算法进行模型训练。
在本实施例中,需要说明的是,可选择四种机器学习算法包括逻辑回归、支持向量机、随机森林、XGBOOST,将训练集中企业的预处理后的所述企业迁移分析特征向量作为算法的输入,分别进行机器学习的模型训练,在模型训练的过程中,对输入的所述企业迁移分析特征向量中的特征进行重要性排序分析,剔除对模型预测无效的特征,提升模型训练的效率,同时利用随机数模拟的方式来进行算法参数的设定,通过测试集来评估各模型在不同参数组合下企业迁移预测的准确率,筛选出模型预测准确率最高的参数组合。例如,随机森林模型中的两个超参数:mtry和ntree,通过随机数设置这2个参数一系列的数值组合,输入训练集进行多次模型训练,并通过对测试集中企业迁移概率进行预测,通过对比测试集中企业迁移的实际情况来评估不同参数取值下模型预测的准确率,筛选出最优的参数组合,并得到算法性能最优的预测模型。
S1034、将训练好的模型融合得到投票模型作为所述企业迁移风险预测模型。
在本实施例中,需要说明的是,在完成上述四个模型的训练后,构建基于模型融合的投票模型,来实现对企业迁移风险的预测。
通过采用多个机器学习算法的投票模型来构建所述企业迁移风险预测模型,在算法上具有更高的准确性和鲁棒性。
可选地,如图5所示,步骤S104将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果包括如下步骤:
S1041、将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移概率。
在本实施例中,需要说明的是,企业迁移概率的计算方法如下:
Figure BDA0003893947410000101
其中,Pi表示企业i的迁移概率,Pi,j表示企业i在模型j中迁移的概率。
S1042、基于所述企业迁移概率和企业实际迁移结果,设定迁移风险预警阈值。
在本实施例中,需要说明的是,所述基于所述企业迁移概率和企业实际迁移结果,设定迁移风险预警阈值的方法如下:
Figure BDA0003893947410000102
其中,Yi表示训练集中企业是否发生迁移,若发生则取值为1,未发生则取值为0,ɑ训练集表示训练集的权重,Yj表示测试集中企业是否发生迁移,若发生则取值为1,未发生则取值为0,1-ɑ训练集表示测试集的权重。通过蒙特卡洛方法模拟ɑ训练集的取值,对应每一个取值求得λ0,最后通过求取λ0的平均值得到所述迁移风险预警阈值。
S1043、对所述企业迁移概率超过所述迁移风险预警阈值的企业进行分级预警。
在本实施例中,需要说明的是,预警等级按照迁移概率值大小划分为高、中、低三个等级,通过K-Means算法来实现对企业迁移概率的分级聚类,根据聚类结果输出高、中、低三个等级所对应的临界值λ1和λ2,分级预警结果如下:
Figure BDA0003893947410000103
通过将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果,能够实现对企业迁移风险的提前感知和分级预警,避免导致政府的措施出现滞后。
可选地,如图6所示,所述方法还包括如下步骤:
S105、基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征。
在本实施例中,需要说明的是,可通过所述企业迁移风险预测模型来计算所述企业迁移分析特征向量中不同特征对模型结果的重要程度,从而识别出影响企业迁移风险的重要的共性特征。
S106、对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因。
在本实施例中,需要说明的是,所述影响每个企业迁移的个性特征包括正向影响因素和负向影响因素,正向影响因素为有利于企业迁移的特征,负向影响因素为不利于企业迁移的特征,通过对每个企业的正向影响因素和负向影响因素进行统计分析,得到影响企业迁移的迁移原因。
通过识别影响企业迁移的共性特征和影响特定具有迁移风险企业迁移的个性特征,能够为针对性地开展引导工作提供精准的决策支撑。
可选地,如图7所示,步骤S105基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征包括如下步骤:
S1051、通过不同的特征重要性计算方法得到所述企业迁移风险预测模型中各特征的重要性分布。
在本实施例中,需要说明的是,可根据gain、weight、cover等特征重要性计算方法得到所述企业迁移风险预测模型中各特征的重要性分布。
S1052、从不同的所述各特征的重要性分布中识别影响企业迁移的共性特征,输出特征重要性指标。
在本实施例中,需要说明的是,可从通过不同的特征重要性计算方法得到的所述企业迁移风险预测模型中各特征的重要性分布中识别出影响企业迁移的共性特征,将共性特征按照重要性由大到小的顺序排列得到特征重要性指标。
通过识别影响企业迁移的共性特征,能够为针对性地开展引导工作提供精准的决策支撑。
可选地,如图8所示,步骤S106对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因包括如下步骤:
S1061、通过模型局部解释器构建企业迁移影响因素分析模型。
在本实施例中,需要说明的是,所述模型局部解释器为LIME解释器(LocalInterpretable Model-Agnostic Explanations),所述企业迁移影响因素分析模型能够对每个企业的所述企业迁移分析特征向量进行解释,从而输出影响特定企业迁移的个性特征。
S1062、将每个具有迁移风险的企业输入所述企业迁移影响因素分析模型,得到影响企业迁移的个性特征。
在本实施例中,需要说明的是,所述将每个具有迁移风险的企业输入所述企业迁移影响因素分析模型,可以是将每个具有迁移风险的企业的所述企业迁移分析特征向量输入所述企业迁移影响因素分析模型,所述影响企业迁移的个性特征包括正向影响因素和负向影响因素,正向影响因素为有利于企业迁移的特征,负向影响因素为不利于企业迁移的特征。
S1063、经统计分析输出影响企业迁移的迁移原因。
在本实施例中,需要说明的是,可通过对每个具有迁移风险的企业的正向影响因素和负向影响因素进行统计分析,得到影响企业迁移的迁移原因。
通过识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因,能够在个体层面对企业迁移的核心要素进行识别,为针对性地开展引导工作提供更精准的决策支撑。
本实施例提供的这种面向城市运营的企业迁移大数据监测预警方法,通过构建企业迁移风险预测模型,将企业迁移分析特征向量输入企业迁移风险预测模型,得到企业迁移风险预测结果,并识别影响企业迁移的共性特征和影响特定具有迁移风险企业迁移的个性特征,能够实现提前对企业迁移风险进行监测预警,避免导致政府的措施出现滞后,以及能够在个体层面对企业迁移的核心要素进行识别,为针对性地开展引导工作提供精准的决策支撑。
本实施例的第二方面提供了一种面向城市运营的企业迁移大数据监测预警装置,如图9所示,所述装置包括:
第一构建模块,用于构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;
第二构建模块,用于基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;
第三构建模块,用于通过机器学习算法构建企业迁移风险预测模型;
监测预警模块,用于将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
本实施例的第三方面提供了一种终端设备,如图10所示,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法。
本实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时可实现上述方法实施例中的步骤。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述方法包括如下步骤:
构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;
基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;
通过机器学习算法构建企业迁移风险预测模型;
将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
2.如权利要求1所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库包括如下步骤:
获取企业的工商登记信息,对所述工商登记信息进行清洗预处理,得到所述企业基础信息数据库;
获取企业的经营活动信息,对所述经营活动信息进行清洗预处理,得到所述企业经营活动数据库;
获取企业的外部环境信息,根据所述外部环境信息的地址信息,通过地理编码得到所述企业外部环境数据库。
3.如权利要求1所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量包括如下步骤:
基于所述企业基础信息数据库,提取所述基础信息特征;
基于所述企业经营活动数据库,提取所述经营活动特征;
基于所述企业外部环境数据库,根据企业的地址信息,通过地理空间匹配,得到所述外部环境特征。
4.如权利要求1所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述通过机器学习算法构建企业迁移风险预测模型包括如下步骤:
选取行业类型相同的企业的所述企业迁移分析特征向量作为样本集;
将所述样本集划分为训练集和测试集;
基于所述训练集和所述测试集,选择多种机器学习算法进行模型训练;
将训练好的模型融合得到投票模型作为所述企业迁移风险预测模型。
5.如权利要求1所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果包括如下步骤:
将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移概率;
基于所述企业迁移概率和企业实际迁移结果,设定迁移风险预警阈值;
对所述企业迁移概率超过所述迁移风险预警阈值的企业进行分级预警。
6.如权利要求1所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述方法还包括如下步骤:
基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征;
对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因。
7.如权利要求6所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述基于所述企业迁移风险预测模型,识别影响企业迁移的共性特征包括如下步骤:
通过不同的特征重要性计算方法得到所述企业迁移风险预测模型中各特征的重要性分布;
从不同的所述各特征的重要性分布中识别影响企业迁移的共性特征,输出特征重要性指标。
8.如权利要求6所述的一种面向城市运营的企业迁移大数据监测预警方法,其特征在于,所述对所有具有迁移风险的企业进行归因分析,识别影响每个企业迁移的个性特征,并统计分析输出影响企业迁移的迁移原因包括如下步骤:
通过模型局部解释器构建企业迁移影响因素分析模型;
将每个具有迁移风险的企业输入所述企业迁移影响因素分析模型,得到影响企业迁移的个性特征;
经统计分析输出影响企业迁移的迁移原因。
9.一种面向城市运营的企业迁移大数据监测预警装置,其特征在于,所述装置包括:
第一构建模块,用于构建包括企业基础信息数据库、企业经营活动数据库和企业外部环境数据库的企业迁移分析多源基础数据库;
第二构建模块,用于基于所述企业迁移分析多源基础数据库,构建包括基础信息特征、经营活动特征和外部环境特征的企业迁移分析特征向量;
第三构建模块,用于通过机器学习算法构建企业迁移风险预测模型;
监测预警模块,用于将所述企业迁移分析特征向量输入所述企业迁移风险预测模型,得到企业迁移风险预测结果。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。
CN202211267371.7A 2022-10-17 2022-10-17 一种面向城市运营的企业迁移大数据监测预警方法及装置 Pending CN115630732A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211267371.7A CN115630732A (zh) 2022-10-17 2022-10-17 一种面向城市运营的企业迁移大数据监测预警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211267371.7A CN115630732A (zh) 2022-10-17 2022-10-17 一种面向城市运营的企业迁移大数据监测预警方法及装置

Publications (1)

Publication Number Publication Date
CN115630732A true CN115630732A (zh) 2023-01-20

Family

ID=84905318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211267371.7A Pending CN115630732A (zh) 2022-10-17 2022-10-17 一种面向城市运营的企业迁移大数据监测预警方法及装置

Country Status (1)

Country Link
CN (1) CN115630732A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116739395A (zh) * 2023-08-15 2023-09-12 浙江同信企业征信服务有限公司 一种企业外迁预测方法、装置、设备及存储介质
CN118096234A (zh) * 2024-02-28 2024-05-28 广州市城市规划勘测设计研究院有限公司 基于Stacking模型融合的企业迁移预警方法、系统及电子设备
CN118428742A (zh) * 2024-07-02 2024-08-02 杭州市公安局高新技术产业开发区分局、杭州市公安局滨江区分局 迁入企业的风险预警方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116739395A (zh) * 2023-08-15 2023-09-12 浙江同信企业征信服务有限公司 一种企业外迁预测方法、装置、设备及存储介质
CN118096234A (zh) * 2024-02-28 2024-05-28 广州市城市规划勘测设计研究院有限公司 基于Stacking模型融合的企业迁移预警方法、系统及电子设备
CN118428742A (zh) * 2024-07-02 2024-08-02 杭州市公安局高新技术产业开发区分局、杭州市公安局滨江区分局 迁入企业的风险预警方法

Similar Documents

Publication Publication Date Title
JP7090936B2 (ja) Esg基盤の企業評価遂行装置及びその作動方法
CN115630732A (zh) 一种面向城市运营的企业迁移大数据监测预警方法及装置
CN110968699A (zh) 一种基于事理推荐的逻辑图谱构建及预警方法和装置
Wang et al. Research on anomaly detection and real-time reliability evaluation with the log of cloud platform
CN112508723B (zh) 基于自动择优建模的金融风险预测方法、装置和电子设备
CN107066389A (zh) 基于集成学习的软件缺陷重新打开的预测方法
CN114139636B (zh) 异常作业处理方法及装置
CN116542800A (zh) 基于云端ai技术的智能化财务报表分析系统
CN113743453A (zh) 一种基于随机森林的人口数量预测方法
Hilal et al. Artificial intelligence based optimal functional link neural network for financial data Science
CN114282875A (zh) 流程审批确定性规则和语义自学习结合判定方法及装置
Keskin et al. Cohort fertility heterogeneity during the fertility decline period in Turkey
CN116955534A (zh) 投诉工单智能处理方法、装置、设备及存储介质
CN115619539A (zh) 贷前风险评价方法以及装置
CN113191540A (zh) 一种产业链路制造资源的构建方法及装置
Yuan et al. Early Detecting the At-risk Students in Online Courses Based on Their Behavior Sequences
CN111221704A (zh) 一种确定办公管理应用系统运行状态的方法及系统
Belete et al. A Deep Learning Approaches for Modeling and Predicting of HIV Test Results Using EDHS Dataset
Mulla et al. The Use of Clustering and Classification Methods in Machine Learning and Comparison of Some Algorithms of the Methods
CN112115705B (zh) 一种电子简历的筛选方法及装置
Zhang Data Information Technology Evaluation Algorithm Based on Knowledge Graph and Feature Recognition
Zhang Application of English Score Management System Based on Spark-Decision Tree Algorithm
CN116956027A (zh) 员工画像更新方法、装置、设备及存储介质
Mentari et al. Comparative Analysis of Naïve Bayes Algorithm, K-Nearest Neighbours, Neural Network, Decision Tree, and Random Forest to Classify Data Mining in Predicting Heart Disease
Li Construction and Verification of Academic Performance Early Warning Model based on PSO-XGBoost Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination