CN114091904A - 一种基于人工智能算法的企业迁移园区招商分析方法 - Google Patents

一种基于人工智能算法的企业迁移园区招商分析方法 Download PDF

Info

Publication number
CN114091904A
CN114091904A CN202111386130.XA CN202111386130A CN114091904A CN 114091904 A CN114091904 A CN 114091904A CN 202111386130 A CN202111386130 A CN 202111386130A CN 114091904 A CN114091904 A CN 114091904A
Authority
CN
China
Prior art keywords
enterprise
migrated
training
migration
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111386130.XA
Other languages
English (en)
Inventor
康琦
王东强
张续
刘心月
马欢
赵锋力
许雯睿
王泽林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCCC First Highway Consultants Co Ltd
Original Assignee
CCCC First Highway Consultants Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCCC First Highway Consultants Co Ltd filed Critical CCCC First Highway Consultants Co Ltd
Priority to CN202111386130.XA priority Critical patent/CN114091904A/zh
Publication of CN114091904A publication Critical patent/CN114091904A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于人工智能算法的企业迁移园区招商分析方法。其基于人工智能算法对迁移企业特征进行优化和重构,使其从多种不同的角度更好地展现出企业的不同特征,更好地为招商人员提供招商判断依据。本发明的步骤为:1)整理迁移企业特征数据集;2)将迁移企业特征数据集进行归一化处理,处理为算法可识别的数值类型特征;3)将整理好的数据集输入到PCA主成分分析算法中进行特征优化及降维;4)将经过PCA处理得到的特征集分为训练集与测试集两部分;5)将训练集输入到LSSVM分类模型中进行训练,训练出迁移与未迁移企业的区分界限,然后利用测试数据测试LSSVM模型分析的区分界限的准确性,得到迁移与未迁移企业的分类界限,预测和判断企业迁移动向。

Description

一种基于人工智能算法的企业迁移园区招商分析方法
技术领域
本发明涉及一种基于人工智能算法的企业迁移园区招商分析方法。
背景技术
招商引资作为刺激经济发展的重要手段之一,在提高地区开放型经济水平的同时也带动了地区的就业,扩大了城市影响力,提升了城市的综合实力,推动了整个地区经济水平的发展。通过在经济领域特别是招商引资方面的不断探索,政府引导的招商引资模式在拉动经济发展方面取得了巨大成效,但同时很多弊端也在实践过程中逐渐显露,由于招商引资的传统导向作用,使得对于想要引进的招商企业无法进行一个准确的判断,导致了资源和环境的浪费,传统的招商规模使得经济出现了增幅下降,局部地区甚至出现了负增长。因此,为准确判别企业概况,判断企业迁移意向及自身规模,在招商引资的过程中需要及时转变观念,不断优化和建设新的智能招商平台。
据不完全统计,我国现有各类产业园区15000多个,其中国家级高新区169个、经开区218个、新区19个、边合区17个、跨合区2个、海关特殊监管区域160个等,对全国经济的贡献达到30%以上,初步形成了2大类别,综合型和功能型,10余种形态的产业园区体系,覆盖了国家级、省级、市级等各个行政层级。
虽然我国产业园区数量多、类型丰富、覆盖全,但同时许多产业园区仍存在着智慧化水平低、运营能力弱、主导产业附加值低等诸多问题。园区运营理念较为保守,多数园区尚未形成独特的区域特色,个性化能力不足。部分园区存在定位趋同、产业结构低端等问题,战略性新兴产业占比不高,产品技术含量、附加值偏低,创业成本偏高,园区抗风险能力较差。部分园区企业的主营业务收人来自房地产开发,收入结构相对单一,加剧了潜在运营风险。企业在园区内难以实现配套,大量研发、生产等环节依赖园区外部产业。园区内企业自主创新资金投入力度有待加强,产业共性研究及产学研合作不足,与周边学术机构联系不紧密,企业缺少科技实力支撑。
部分园区管理模式创新性不足,管理理念滞后于产业发展现实需求。部门间信息沟通不畅,对企服务效率有待提高。园区规划主要基于产业需求对城市空间资源进行组织,容易忽视产业发展与城市功能的协同,产生重产业、轻城市等问题,导致产业布局与城市发展需求不匹配,产业空间与城市空间分割、离散。园区基础设施、配套设施规划建设滞后于园区发展要求,空间布局不够合理,对产业发展及其空间需求定位不准确。园区专业性技术人员和高层次人才比例偏低,高品质住宅、教育及医疗资源不足,一定程度限制了人才引进及园区长期发展。
未来,产业园区仍将承担经济产业主战场、区域发展主引擎、改革开放试验平台的定位与使命,对经济发展以及智慧城市建设的反哺作用将尤为突出。从2012年至今,国家相继颁布了多项政策推进数字园区建设。5G网络、AI人工智能、云技术、边缘计算等新一代信息技术的日渐成熟,为园区数字化转型打开了新的窗口。
发明内容
有鉴于此,本发明提供一种基于人工智能算法的企业迁移园区招商分析方法,其基于人工智能算法对迁移企业特征进行优化和重构,使其从多种不同的角度更好地展现出企业的不同特征,更好地为招商人员提供招商判断依据。
为解决现有技术存在的问题,本发明所采用的技术方案为:一种基于人工智能算法的企业迁移园区招商分析方法,其特征在于:步骤为:
1)整理迁移企业特征数据集,包括成立年限、注册资本数、实缴资本、股东数量、分支机构、对外投资、行政许可数、招聘数量、知识产权数量等;
2)将迁移企业特征数据集进行归一化处理,处理为算法可识别的数值类型特征;
3)将整理好的数据集输入到PCA主成分分析算法中进行特征优化及降维;
4)将经过PCA处理得到的特征集分为训练集与测试集两部分,训练集与测试集的数量比为8:2;
5)将训练集输入到LSSVM分类模型中进行训练,训练出迁移与未迁移企业的区分界限,然后利用测试数据测试LSSVM模型分析的区分界限的准确性,得到迁移与未迁移企业的分类界限,从而预测和判断企业迁移动向。
与现有技术相比,本发明包括以下有益效果:
1)该方法基于传统园区招商模式的基础上,引入人工智能算法对迁移企业进行分析,规避了传统招商人员由于人员判断而造成过多的主观因素,与以往的人为分析方法来确定迁移企业,本方法更具有科学性和准确性。
2)收集大量的招商企业的特征信息,得到多维企业特征集,然后利用PCA算法对多维特征集进行处理,优化特征结构并降低特征维数,从而提高算法分析精度和效率。
附图说明
图1本发明基于PCA-LSSVM的企业迁移分析方法流程图;
图2 LSSVM模型训练精度;
图3 LSSVM模型测试精度;
图4 PCA-LSSVM模型训练精度;
图5 PCA-LSSVM模型测试精度。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明首先综合了企业招商的基础数据,在此基础上引入主成分分析算法(PCA),对多维的企业特征进行整理和降维,接着利用最小二乘支持向量机(LSSVM)算法对企业迁移的情况进行分类和预测,辅助招商人员对企业迁移条件进行判断,从而提高整体园区的招商水平,力求为招商人员提供最新的招商工作参考。
本实施例提供一种基于人工智能算法的企业迁移园区招商分析方法,
首先,随机选取3000家迁移与未迁移的企业,选取59种数据特征(包括成立年限、注册资本数、实缴资本、股东数量、分支机构、对外投资、行政许可数、招聘数量、知识产权数量等)构建出多维特征集;
其中,利用算法分析企业迁移行为的过程中,需要将企业的特征集进行归一化处理,全部表示为数值类型的特征。企业特征的详细表现形式如表所示:
表1企业特征集列表
Figure BDA0003367173900000031
Figure BDA0003367173900000041
Figure BDA0003367173900000051
然后将企业多维特征集用PCA算法进行特征优化及降维操作,并将经过PCA处理得到的特征集分为训练集和测试集两部分,训练集与测试集的数量比为8:2(即训练集有2400条,测试集有600条),
然后将企业多维特征集用PCA算法进行特征优化及降维操作,并将经过PCA处理得到的特征集分为训练集和测试集两部分,训练集与测试集的数量比为8:2,即训练集有2400条,测试集有600条;
PCA算法原理
主成分分析(PCA)是一种以K-L变换为基础的统计分析方法,其基本思想是对一个维数较高、各维变量之间相互关联的数据集进行降维处理,且降维后数据集尽量保留原始信息。PCA通过线性转换,将原始空间转换到低位的主成分空间,转换后的新特征成为主成分,满足各个主成分之间不相关,并按照对应方向的方差贡献率降序排列。
假设特征空间Rn上的样本数据集X,每一个数据x由n维特征变量组成,即(x1,x2,…,xn)。PCA对x进行线性变换,转换到主成分空间Rn内的数据y由m维主成分组成,即(y1,y2,…,ym),有
y=A'x (1)
y中第k个元yk表示第k个主成分,k=1,2,…m,其中m≤n。除非特殊说明,一般要求第1个主成分y1表示在此主成分方向上数据的方差最大,第二个主成分y2表示在此主成分方向上数据的方差次大,且第二主成分y2与第一主成分y1无关。以此类推。
由式(1)中的矩阵A的第k列向量αk可得到
yk=α'kx (2)
根据主成分的要求,考虑第一主成分α'1x满足此方向上的方差最大化要求var[α'1x],则有
var[α'1x]=α'1∑α1 (3)
其中∑表示x的协方差,有时也用互相关代替。由于满足此要求的向量α1不唯一,需要添加一定限制,一般要求α'1α1=1。注意到,其他限制如max|α1|=1得出的结果是不同于主成分的。
利用,拉格朗日因子法求解α1,最大化α'1∑α1-λ(α'1α1-1),可以推导出
(∑-λIn1=0 (4)
其中In是n×n的单位矩阵。因此,λ是此主成分方向α1上的方差,且λ是∑最大的特征值,α1是对应的特征向量。α2的求解与α1类似,再加上一个限制条件,α'1x与α'2x无关,即
cov[α'1x,α'2x]=α'1∑α2=α'2∑α1=α'2λ1α1=λ1α'2α1=0 (4)
即α'2α1=0。利用拉格朗日引资法得到的α2为∑次大的特征值对应的特征向量。以此类推,各个主成分为降序排列的∑的特征值对应的特征向量,因此有
A’∑A=Λ (5)
其中:A是由∑的特征向量为列向量组成的矩阵,Λ使用由∑的特征值组成的对角阵。
在主成分分析前,一般先对数据进行标准化预处理,消除不同量纲之间的影响。经过处理后的数据进行协方差运算等效于进行相关运算,主成分维数由前m个主成分对应特征值之和所占总体特征值之和的比重确定,一般选择85%~95%。
最后输入到LSSVM分类模型中进行训练,将2400条训练数据输入到LSSVM算法中,训练出迁移与未迁移企业的区分界限,然后利用600条测试数据测试LSSVM模型分析的区分界限的准确性,通过主要特征对企业是否迁移进行分类和预测,从而判断企业是否存在迁移意向,对产业园区招商引资进行辅助判断。
LSSVM算法原理
最小二乘支持向量机分类模型(least squares support vector machine,LSSVM)
假设分类样本的模型是{(x1,y1),(x2,y2),······(xl,yl)}的训练集,则存在的最优分类平面需要满足以下条件:
Figure BDA0003367173900000071
式中:ω为超平面的法向量;β为偏置量。则分类决策函数为:
f(xi)=sgn(ωTxi+β) (7)
则最小二乘SVM的分类模型可以通过求解分类模型来得到:
Figure BDA0003367173900000072
式中:C为规则化因子;ei为误差变量。为了容许有一定的错分率,将最少错分样本和最大分类间隔折衷考虑。式(10)需要满足如下的等式约束:
yiTφ(xi)+β)=1-ei (9)
式中φ(xi)为非线性映射,把样本集从输入空间映射到高维的特征空间。构建Lagrange方程为:
Figure BDA0003367173900000081
式中αi为Lagrange乘子。最优化条件为:
Figure BDA0003367173900000082
将式(12)和式(13)联立得到如下的线性方程:
Figure BDA0003367173900000083
式中:矩阵Ω=yiyjφ(xi)φ(xy)=yiyjK(xi,xj),其中K(xi,xj)为支持向量机核函数,j=1,2,…..l;yT=[y1,y2,······yl];I为单位矩阵;α=[α1,α2,······αl],则最小二乘支持向量机的分类决策函数为
Figure BDA0003367173900000084
其中,式中的x为输入的数据样本。
为验证该方法的有效性,将进行PCA特征降维后的数据和未进行处理的原始数据集输入到LSSVM模型中进行分析,采用陕西省高新区的发生企业迁移与未发生企业迁移数据输入到LSSVM算法模型中,其中70%的数据用来训练出迁移与未迁移企业的区分界限并得到训练正确率(精度),30%的数据用来计算此区分界限的正确率(精度),得到分类精度结果如表2所示
表2对比实验故障诊断精度
方法 训练精度 测试精度
未使用PCA 99.8% 65.8%
本发明方法 100% 99.25%
在表2的对比实验结果中可以得出结论,经过PCA特征处理之后得到的特征集输入到LSSVM算法模型中得到的训练精度可以达到100%,测试精度可以达到99.25%,而未经PCA处理的企业特征训练精度为99.8%,测试精度可以达到65.8%,
由此可证明PCA特征结构优化算法能够有效地对特征集结构进行优化,从而提高LSSVM模型的训练与测试精度。
图2所示为原始数据集未经PCA处理直接输入到LSSVM模型中进行分析,2400条训练数据经LSSVM进行训练后得到的结果,如图2所示企业数据分别分布在Y轴Y=1和Y=2处,Y的取值1和2分别表示迁移与未迁移的企业标签。图中共有2400条企业数据,其中有18个企业数据分类错误,2382条数据分类正确,训练精度为99.25%.
图3所示为原始数据集未经PCA处理的测试数据集,验证LSSVM训练出的迁移与未迁移企业分类界限的正确性,Y的取值1和2分别表示迁移与未迁移的企业标签。图中共有600条企业数据,其中有205个企业数据分类错误,395条数据分类正确,测试精度为65.833%,测试结果精度较差。
图4所示的精度结果为数据集经PCA处理后得到的训练集数据输入到LSSVM算法中训练中迁移与未迁移企业的分类界限。图中共2400条数据,全部分类正确,故训练精度为100%,高于未经PCA处理的训练精度。
图5所示的精度结果为数据集经PCA处理后得到的测试集数据对LSSVM算法训练出的迁移与未迁移企业数据的分类界限进行验证。图中共有600条企业数据,其中有1条数据分类错误,故测试精度结果为99.83%,高于未经PCA处理的测试精度,由此可见PCA降维算法的有效性。
所以,该实验证明了PCA算法模型能够对企业特征进行优化处理,并且使得企业迁移分析判断的结果更加准确,由此证明本发明具有有效性和实用性,且可以用于企业园区招商分析中。
本发明的内容不限于实施例所列举,本领域普通技术人员通过阅读本发明说明书而对本发明技术方案采取的任何等效的变换,均为本发明的权利要求所涵盖。

Claims (1)

1.一种基于人工智能算法的企业迁移园区招商分析方法,其特征在于:步骤为:
1)整理迁移企业特征数据集,包括成立年限、注册资本数、实缴资本、股东数量、分支机构、对外投资、行政许可数、招聘数量、知识产权数量等;
2) 将迁移企业特征数据集进行归一化处理,处理为算法可识别的数值类型特征;
3)将整理好的数据集输入到PCA主成分分析算法中进行特征优化及降维;
4)将经过PCA处理得到的特征集分为训练集与测试集两部分,训练集与测试集的数量比为8:2;
5)将训练集输入到LSSVM分类模型中进行训练,训练出迁移与未迁移企业的区分界限,然后利用测试数据测试LSSVM模型分析的区分界限的准确性, 得到迁移与未迁移企业的分类界限,从而预测和判断企业迁移动向。
CN202111386130.XA 2021-11-22 2021-11-22 一种基于人工智能算法的企业迁移园区招商分析方法 Pending CN114091904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111386130.XA CN114091904A (zh) 2021-11-22 2021-11-22 一种基于人工智能算法的企业迁移园区招商分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111386130.XA CN114091904A (zh) 2021-11-22 2021-11-22 一种基于人工智能算法的企业迁移园区招商分析方法

Publications (1)

Publication Number Publication Date
CN114091904A true CN114091904A (zh) 2022-02-25

Family

ID=80302775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111386130.XA Pending CN114091904A (zh) 2021-11-22 2021-11-22 一种基于人工智能算法的企业迁移园区招商分析方法

Country Status (1)

Country Link
CN (1) CN114091904A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117390297A (zh) * 2023-12-13 2024-01-12 天津和光同德科技股份有限公司 一种大规模人才智库信息优化匹配方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117390297A (zh) * 2023-12-13 2024-01-12 天津和光同德科技股份有限公司 一种大规模人才智库信息优化匹配方法
CN117390297B (zh) * 2023-12-13 2024-02-27 天津和光同德科技股份有限公司 一种大规模人才智库信息优化匹配方法

Similar Documents

Publication Publication Date Title
Ding et al. Analysis of feature matrix in machine learning algorithms to predict energy consumption of public buildings
Chiu et al. An intelligent market segmentation system using k-means and particle swarm optimization
CN103632306A (zh) 一种基于聚类分析的配电网供电区域划分方法
CN108428055A (zh) 一种考虑负荷纵向特性的负荷聚类方法
Wu et al. A critical barrier analysis framework to the development of rural distributed PV in China
CN115660170A (zh) 多维指标权重协同优化的数据资产管理成效差异化评估方法和系统
CN111339167A (zh) 基于K-means和主成分线性回归的台区线损率影响因素分析方法
CN116187640A (zh) 一种基于网格多属性画像体系的配电网规划方法及装置
Yiping et al. An improved multi-view collaborative fuzzy C-means clustering algorithm and its application in overseas oil and gas exploration
CN114091904A (zh) 一种基于人工智能算法的企业迁移园区招商分析方法
CN111798333A (zh) 一种用能评估与用电安全分析方法和系统
CN114239962A (zh) 一种基于开源信息的精细化空间负荷预测方法
CN113112177A (zh) 一种基于混合指标的台区线损处理方法及系统
CN114372835B (zh) 综合能源服务潜力客户识别方法、系统及计算机设备
Xiong et al. Supplier selection model based on D numbers and transformation function
Li et al. Optimization method based on big data in business process management
CN114004535A (zh) 一种电网多级一体化管理分类与评价方法
CN114048200A (zh) 一种计及缺失数据补齐的用户用电行为分析方法
Zhuang et al. DyS-IENN: a novel multiclass imbalanced learning method for early warning of tardiness in rocket final assembly process
Szymanowski et al. Foresight of Information Society–the Knowledge-Based Economy. An attempt at measuring with the use of the example of spatial diversity of Poland’s voivodships (2009-2015)
Naseri et al. Online operational budgeting of electricity distribution network based on integration strategic and operational planning by Swot & AHP methods
Ramos et al. Data Mining Techniques Applied to Power Systems
Wang et al. Research on Daily Tourist Flow Prediction of Scenic Spots Based on Similar Day Clustering and LSSVM Model
Yao et al. Analysis on the Establishment and Management of Library Resource Base Based on Modern Information Technology
Liu Rural financial mobile service management system based on big data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination