CN114741600B - 一种产业园区企业招商推荐的方法和装置 - Google Patents
一种产业园区企业招商推荐的方法和装置 Download PDFInfo
- Publication number
- CN114741600B CN114741600B CN202210422465.0A CN202210422465A CN114741600B CN 114741600 B CN114741600 B CN 114741600B CN 202210422465 A CN202210422465 A CN 202210422465A CN 114741600 B CN114741600 B CN 114741600B
- Authority
- CN
- China
- Prior art keywords
- industry
- enterprise
- industrial
- recruiter
- direction dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000007115 recruitment Effects 0.000 title claims abstract description 38
- 238000013507 mapping Methods 0.000 claims abstract description 74
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000009193 crawling Effects 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 5
- 239000000758 substrate Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000012216 screening Methods 0.000 abstract 2
- 238000007726 management method Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 2
- 229910052744 lithium Inorganic materials 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 229910001416 lithium ion Inorganic materials 0.000 description 1
- GELKBWJHTRAYNV-UHFFFAOYSA-K lithium iron phosphate Chemical compound [Li+].[Fe+2].[O-]P([O-])([O-])=O GELKBWJHTRAYNV-UHFFFAOYSA-K 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种产业园区企业招商推荐的方法和装置。该方法通过产业领域名词归类映射表结合词频统计,将产业领域维度值化,生成招商需求、目标企业和招商人员对应的产业领域方向维度值表,然后通过产业领域维度值表之间的关联度计算,实现目标企业的筛选和招商人员的筛选,进而实现招商需求、目标企业和招商人员之间的关联匹配,从而通过计算机实现自动化地为招商人员分配委托招商的目标企业,大大减少了人工负荷,并使得招商目标企业推荐分配标准化。
Description
技术领域
本发明涉及数据分析技术,尤其涉及产业领域维度匹配技术。
背景技术
城市建设产业规划的具体实施需要对应产业的企业支撑。而完全依赖自我孵化形成对应的上规模企业不太现实。因此,企业的招商引进是实施城市产业规划、实现城市快速发展的捷径。企业招商对政府而言存在两个困难:
第一是所招商的企业是政府所管辖区域以外的企业,政府难以知晓有哪些企业可以作为引进的目标企业。为减少风险,政府至少得了解招商目标企业的经营范围、经营状况等信息以及判定招商目标企业的经营范围是否符合城市建设的产业规划。而完成上述工作往往需要耗费巨大的人力资源。
第二是企业经营发展有其自身计划、目标和与之匹配的节奏,贸然入驻一个陌生城市扩大规模,对企业而言可能是灾难性的。因此即便预备了哪些企业准备作为招商的目标企业,但是招商成功与否需要人员去沟通、说服、协调,需要有人为企业解决困难。而这又是一项耗费巨大人力的工作。对于这一困难,现在流行的做法是政府委托第三方人员去处理。这第三方人员也就是招商人员。
然而对于招商人员而言也不是什么企业可以作为其委派招商的目标企业。招商人员需要熟悉相关产业领域的知识。更为具体地,产业规划的目标产业领域需要与招商人员、被招商目标企业保持三方一致。展开来说,城市为实现其产业规划,有其招商需求。招商需求一方面是产业领域需要适配,另一方面,企业经营状况需要符合要求。对于计算机而言,判断企业经营状况是否符合招商要求,具体实施比较简单;但判断产业领域是否三方匹配,则较为困难。如果将产业领域转换成一个向量,那么判断产业领域是否适配不是比较两个向量是否相似,而是看产业领域是否相互包容和具备多少关联。
另一方面,将产业领域转换成一个向量也非常困难,原因如下:
第一是产业领域本身缺少标准而又规范的名词称谓。即便存在标准化的名词定义,但在非正式场合,人们也往往不会使用标准化的名词。
第二是产业领域作为一个名词本身涵盖的内容边界不是很清楚。比如,机器人作为一种产业领域,其名词本身的边界很难描述清楚。比如扫地机器人、工业机器人都是一种机器人,但这些种机器人和具有人工智能的机器人存在很大差距。
第三是产业领域内容边界不清楚也导致了不同的产业领域之间可能存在交集。比如无人驾驶和机器视觉的两个产业领域之间可能存在交集。
第四是同一产业领域可能存在不同的名词定义。比如无人驾驶和自动驾驶很大程度上是指一个意思。
第五是产业领域之间可能存在包容关系。比如半导体的产业领域涵盖了集成电路芯片的产业领域。
第五是产业领域之间存在产业链的上下游关联关系。
第六是很多技术性名词虽然无法作为一个产业领域,但和产业领域具有一定的相关性。比如飞行控制作为一种技术领域名词和无人机这样的产业领域存在着一定的相关性。但无人机的飞行控制和载人飞机的飞行控制又存在很大的区别。
发明内容
本发明所要解决的问题:通过计算机实现自动化地为招商人员分配委托招商的目标企业,分配委托招商的目标企业时,要求目标企业符合招商需求,尤其在产业领域方面,招商需求、目标企业、招商人员之间需要三方满足关联性匹配。
为解决上述问题,本发明采用的方案如下:
根据本发明的一种产业园区企业招商推荐的方法,包括如下步骤:
步骤S1,用于:获取产业领域名词归类映射表、招商需求描述信息和招商人员描述信息;所述产业领域名词归类映射表是产业领域和名词映射关系的表单;所述产业领域和名词映射关系包括产业领域和所映射的名词以及所映射的名词与产业领域的相关度值;所述招商需求描述信息包括招商位置信息和招商产业方向;所述招商人员描述信息包括个人基本信息、个人简历信息和历史招商工作信息;
步骤S2,用于:根据招商产业方向和产业领域名词归类映射表构建相关产业关键词,结合招商位置信息中的相关地域关键词,通过网络爬虫对所述相关产业关键词和相关地域关键词进行关键词搜索,爬取网络上相关的产业发展方向政策信息,然后通过对所述产业发展方向政策信息进行关键词频统计的方式,构建招商需求的产业领域方向维度值表;
步骤S3,用于:根据招商需求的产业领域方向维度值表,通过网络爬虫搜索产业领域相关的企业,并爬取相关企业的描述信息,然后通过对相关企业的描述信息进行关键词频统计的方式,构建各相关企业的产业领域方向维度值表;
步骤S4,用于:根据招商需求的产业领域方向维度值表和企业的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各相关企业和招商需求之间的产业关联度值,并根据该产业关联度值优选K1个企业,组成优选企业表;
步骤S5,用于:就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表;
步骤S6,用于:根据招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各招商人员和招商需求之间的产业关联度值,然后根据该产业关联度值优选K2个招商人员,组成优选招商人员表;
步骤S7,用于:根据招商人员的产业领域方向维度值表和企业的产业领域方向维度值表,计算出优选企业表中各企业和优选招商人员表中各招商人员之间的产业关联度值,从而形成企业和招商人员之间的产业关联度矩阵;
步骤S8,用于:根据预先设定的分配策略和企业和招商人员之间的产业关联度值大小,为招商人员分配企业形成招商人员对应的招商目标企业推荐表;
其中,根据两个产业领域方向维度值表计算产业关联度值采用如下步骤进行计算:
步骤SA1,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
x(p)+y(p)<h1;
步骤SA2,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
abs(x(p)-y(p))/(x(p)+y(p))>h2;
步骤SA3,用于:计算m=∑(x(p)+y(p));
步骤SA4,用于:若m为0,则产业关联度值为0,否则计算产业关联度值:
R(X,Y)=1-∑abs(x(p) -y(p))÷m;
上述各式中,
X和Y分别表示两个产业领域方向维度值表;R(X,Y)表示产业领域方向维度值表X和产业领域方向维度值表Y的产业关联度值;x(p)和y(p)为分别为产业领域方向维度值表X和产业领域方向维度值表Y中产业领域p的产业领域方向维度值;abs为绝对值运算;∑为求和运算;h1和h2分别为两个预先设定的阈值。
进一步,根据本发明的产业园区企业招商推荐的方法,所述步骤S2包括如下步骤:
步骤S21,用于:根据产业领域名词归类映射表在所述招商产业方向搜索与产业领域相关的名词,生成招商需求关联领域关键词表;
步骤S22,用于:以所述招商位置信息中的省份信息、城市信息和县区信息以及所述招商需求关联领域关键词表中的关键词作为网络爬虫搜索的关键词,通过网络爬虫在网络上抓取相关的产业发展方向政策信息;
步骤S23,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述产业发展方向政策信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商需求的产业领域词频表;
步骤S24,用于:以所述招商需求的产业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对所述招商需求的产业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出招商需求的产业领域方向维度值表。
进一步,根据本发明的产业园区企业招商推荐的方法,所述步骤S3包括如下步骤:
步骤S31,用于:根据招商需求的产业领域方向维度值表中的产业领域,从产业领域名词归类映射表找出与产业领域相关的名词作为关键词,通过网络爬虫在网络上抓取相关的企业,组成候选企业表;
步骤S32,用于:根据候选企业表中的企业,通过网络爬虫在网络上抓取相关企业的企业描述信息;
步骤S33,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出相关企业的企业领域词频表;
步骤S34,用于:以所述企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对相关企业的企业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出相关企业的产业领域方向维度值表。
进一步,根据本发明的产业园区企业招商推荐的方法,所述招商需求描述信息还包括被招商企业经营状况的要求;所述步骤S32中抓取到企业描述信息后还包括企业经营状况分析步骤;所述企业经营状况分析步骤,用于:对企业经营状况分析,将不符合所述招商需求描述信息中被招商企业经营状况的要求的企业剔除。
进一步,根据本发明的产业园区企业招商推荐的方法,所述步骤S5包括如下步骤:
步骤S51,用于:从个人简历信息中获取非招商工作所在的工作企业,通过网络爬虫在网络上抓取这些工作企业的企业描述信息;
步骤S52,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述工作企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出工作企业的企业领域词频表;
步骤S53,用于:从历史招商工作信息中获取招商目标企业,通过网络爬虫在网络上抓取这些招商目标企业的企业描述信息;
步骤S54,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述招商目标企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值结合招商是否成功加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商目标企业的企业领域词频表;
步骤S55,用于:以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,分别对工作企业的企业领域词频表和招商目标企业的企业领域词频表中各个产业领域词频做归一化处理,分别得到工作企业的产业领域方向维度值表和招商目标企业的产业领域方向维度值表;
步骤S56,用于:根据个人基本信息的高等教育所接受教育的专业,通过产业领域名词归类映射表中的产业领域相关的名词,映射至相关的产业领域,并以名词与产业领域的相关度值为基础,按毕业年限递减的方式构建受教育专业的产业领域方向维度值表;
步骤S57,用于:将工作企业的产业领域方向维度值表、招商目标企业的产业领域方向维度值表和受教育专业的产业领域方向维度值表进行加权合并,得到招商人员的产业领域方向维度值表。
根据本发明的一种产业园区企业招商推荐的装置,包括如下模块:
模块M1,用于:获取产业领域名词归类映射表、招商需求描述信息和招商人员描述信息;所述产业领域名词归类映射表是产业领域和名词映射关系的表单;所述产业领域和名词映射关系包括产业领域和所映射的名词以及所映射的名词与产业领域的相关度值;所述招商需求描述信息包括招商位置信息和招商产业方向;所述招商人员描述信息包括个人基本信息、个人简历信息和历史招商工作信息;
模块M2,用于:根据招商产业方向和产业领域名词归类映射表构建相关产业关键词,结合招商位置信息中的相关地域关键词,通过网络爬虫对所述相关产业关键词和相关地域关键词进行关键词搜索,爬取网络上相关的产业发展方向政策信息,然后通过对所述产业发展方向政策信息进行关键词频统计的方式,构建招商需求的产业领域方向维度值表;
模块M3,用于:根据招商需求的产业领域方向维度值表,通过网络爬虫搜索产业领域相关的企业,并爬取相关企业的描述信息,然后通过对相关企业的描述信息进行关键词频统计的方式,构建各相关企业的产业领域方向维度值表;
模块M4,用于:根据招商需求的产业领域方向维度值表和企业的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各相关企业和招商需求之间的产业关联度值,并根据该产业关联度值优选K1个企业,组成优选企业表;
模块M5,用于:就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表;
模块M6,用于:根据招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各招商人员和招商需求之间的产业关联度值,然后根据该产业关联度值优选K2个招商人员,组成优选招商人员表;
模块M7,用于:根据招商人员的产业领域方向维度值表和企业的产业领域方向维度值表,计算出优选企业表中各企业和优选招商人员表中各招商人员之间的产业关联度值,从而形成企业和招商人员之间的产业关联度矩阵;
模块M8,用于:根据预先设定的分配策略和企业和招商人员之间的产业关联度值大小,为招商人员分配企业形成招商人员对应的招商目标企业推荐表;
其中,根据两个产业领域方向维度值表计算产业关联度值采用如下模块进行计算:
模块MA1,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
x(p)+y(p)<h1;
模块MA2,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
abs(x(p)-y(p))/(x(p)+y(p))>h2;
模块MA3,用于:计算m=∑(x(p)+y(p));
模块MA4,用于:若m为0,则产业关联度值为0,否则计算产业关联度值:
R(X,Y)=1-∑abs(x(p) -y(p))÷m;
上述各式中,
X和Y分别表示两个产业领域方向维度值表;R(X,Y)表示产业领域方向维度值表X和产业领域方向维度值表Y的产业关联度值;x(p)和y(p)为分别为产业领域方向维度值表X和产业领域方向维度值表Y中产业领域p的产业领域方向维度值;abs为绝对值运算;∑为求和运算;h1和h2分别为两个预先设定的阈值。
进一步,根据本发明的产业园区企业招商推荐的装置,所述模块M2包括如下模块:
模块M21,用于:根据产业领域名词归类映射表在所述招商产业方向搜索与产业领域相关的名词,生成招商需求关联领域关键词表;
模块M22,用于:以所述招商位置信息中的省份信息、城市信息和县区信息以及所述招商需求关联领域关键词表中的关键词作为网络爬虫搜索的关键词,通过网络爬虫在网络上抓取相关的产业发展方向政策信息;
模块M23,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述产业发展方向政策信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商需求的产业领域词频表;
模块M24,用于:以所述招商需求的产业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对所述招商需求的产业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出招商需求的产业领域方向维度值表。
进一步,根据本发明的产业园区企业招商推荐的装置,所述模块M3包括如下模块:
模块M31,用于:根据招商需求的产业领域方向维度值表中的产业领域,从产业领域名词归类映射表找出与产业领域相关的名词作为关键词,通过网络爬虫在网络上抓取相关的企业,组成候选企业表;
模块M32,用于:根据候选企业表中的企业,通过网络爬虫在网络上抓取相关企业的企业描述信息;
模块M33,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出相关企业的企业领域词频表;
模块M34,用于:以所述企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对相关企业的企业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出相关企业的产业领域方向维度值表。
根据权利要求8所述的产业园区企业招商推荐的装置,其特征在于,所述招商需求描述信息还包括被招商企业经营状况的要求;所述模块M32中抓取到企业描述信息后还包括企业经营状况分析模块;所述企业经营状况分析模块,用于:对企业经营状况分析,将不符合所述招商需求描述信息中被招商企业经营状况的要求的企业剔除。
进一步,根据本发明的产业园区企业招商推荐的装置,所述模块M5包括如下模块:
模块M51,用于:从个人简历信息中获取非招商工作所在的工作企业,通过网络爬虫在网络上抓取这些工作企业的企业描述信息;
模块M52,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述工作企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出工作企业的企业领域词频表;
模块M53,用于:从历史招商工作信息中获取招商目标企业,通过网络爬虫在网络上抓取这些招商目标企业的企业描述信息;
模块M54,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述招商目标企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值结合招商是否成功加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商目标企业的企业领域词频表;
模块M55,用于:以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,分别对工作企业的企业领域词频表和招商目标企业的企业领域词频表中各个产业领域词频做归一化处理,分别得到工作企业的产业领域方向维度值表和招商目标企业的产业领域方向维度值表;
模块M56,用于:根据个人基本信息的高等教育所接受教育的专业,通过产业领域名词归类映射表中的产业领域相关的名词,映射至相关的产业领域,并以名词与产业领域的相关度值为基础,按毕业年限递减的方式构建受教育专业的产业领域方向维度值表;
模块M57,用于:将工作企业的产业领域方向维度值表、招商目标企业的产业领域方向维度值表和受教育专业的产业领域方向维度值表进行加权合并,得到招商人员的产业领域方向维度值表。
本发明的技术效果如下:本发明通过产业领域名词归类映射表结合词频统计,将产业领域维度值化,然后通过产业领域维度值表之间的关联度计算,实现招商需求、目标企业和招商人员之间的关联匹配,从而通过计算机实现自动化地为招商人员分配委托招商的目标企业,大大减少了人工负荷,并使得招商目标企业推荐分配标准化。
附图说明
图1是本发明产业园区企业招商推荐方法的整体步骤。
具体实施方式
下面结合附图对本发明做进一步详细说明。
本发明的产业园区企业招商推荐的方法涉及一种计算机系统,该系统包括机器和通过机器执行计算机软件程序。也就是说,本发明的产业园区企业招商推荐的方法是通过机器执行计算机软件程序所实现的方法。
本发明的产业园区企业招商推荐的方法具体思路是将招商产业方向、企业经营业务方向、招商人员的业务领域数值化,形成多维度向量。然后通过多维度向量匹配分析给出相互之间产业领域的相关度值,通过相关度值表示产业领域是否具备包容性,从而优选企业推荐给招商人员。具体来说,如图1所示,该方法大致包括如下步骤:构建招商需求的业务维度的步骤、企业检索分析并构建企业的业务维度的步骤、招商需求和企业之间的业务维度的关联度计算并优选企业的步骤、构建招商人员业务维度的步骤、招商需求和招商人员之间的业务维度的关联度计算并优选招商人员的步骤、优选企业和优选招商人员之间的业务维度关联度计算的步骤以及招商目标企业的推荐分配的步骤。
该方法的输入是一些配置数据和招商需求,输出为招商人员对应的招商目标企业推荐表。配置数据包括产业领域名词归类映射表和招商人员描述信息,招商需求也就是招商需求描述信息。前述步骤S1中获取产业领域名词归类映射表、招商需求描述信息和招商人员描述信息表示本发明的输入包括产业领域名词归类映射表、招商需求描述信息和招商人员描述信息。
产业领域名词归类映射表是产业领域和名词映射关系的表单或者集合。本实施例中,产业领域名词归类映射表通过XML格式定义的文件方式输入。产业领域和名词映射关系包括产业领域和所映射的名词以及所映射的名词与产业领域的相关度值。产业领域和名词映射关系可以表示为:{产业领域,名词相关度表};其中,名词相关度表可以表示为(keyName,relValue)的集合。其中,keyName表示为产业领域所映射的或相关的名词,relValue表示为名词keyName与对应的产业领域的相关度值。相关度值relValue为0~1之间的数值。
本发明上述产业领域名词归类映射表的描述方式可以清楚定义产业领域的边界,也可以表述不同名词的定义、表述产业链之间的上下游关系、产业领域之间的包容关系以及包容技术性名词的相关性。比如以电动汽车动力电池作为一个产业领域,其名词相关度表定义示例如下:{(动力电池,1), (电池管理系统,0.9), (电池包,0.9), (电池模组,0.9), (电池阵列,0.9), (锂离子电池,0.7), (锂电池,0.5), (电动汽车,0.4), (三元锂,0.4), (磷酸铁锂,0.4), (BMS,0.2), (隔膜,0.1), (电解液,0.1), ....,}。其中,电动汽车和动力电池是一个产业链上下游之间的关系。电池管理系统、电池包、电池模组、电池阵列等技术性名词所指代的动力电池的一些相关技术。但是这些名词所涉及的方面只有动力电池中才存在,因此相关度较高。BMS虽然是电池管理系统的英文缩写,但由于BMS在其他领域存在另外的含义,故此BMS的相关度远远小于电池管理系统。
本实施例中,招商人员描述信息来自于预先存储于数据库的信息。招商人员描述信息包括个人基本信息、个人简历信息和历史招商工作信息。个人基本信息包括姓名、出生年月、性别以及学历信息。个人简历信息记载了在哪个时间段在哪个单位从事何种工作的信息。历史招商工作信息记载了招商人员所从事招商工作的历史信息,比如在什么时候为XX负责XX企业的招商事务,最终是否成功招商引进等。
招商需求描述信息包括招商位置信息和招商产业方向。招商位置信息表示招商引进后企业落地所在的地理位置,通常包括省、市和区县等信息。招商产业方向是以文本方式描述的所招商产业需要哪些方向的产业领域。本实施例中,招商需求描述信息还包括被招商企业经营状况的要求。被招商企业经营状况的要求,比如年营业收入不能少于多少、年营业收入的增长性要求、员工数量要求,高等学历员工的比例、发明专利拥有量、是否为高新技术企业、是否具备自己的核心技术等等。
构建招商需求的业务维度的步骤,也就是前述步骤S2,根据招商产业方向和产业领域名词归类映射表构建相关产业关键词,结合招商位置信息中的相关地域关键词,通过网络爬虫对所述相关产业关键词和相关地域关键词进行关键词搜索,爬取网络上相关的产业发展方向政策信息,然后通过对所述产业发展方向政策信息进行关键词频统计的方式,构建招商需求的产业领域方向维度值表。本实施例中,该步骤具体采用如下步骤实现:
步骤S21,根据产业领域名词归类映射表在招商产业方向搜索与产业领域相关的名词,生成招商需求关联领域关键词表;
步骤S22,以招商位置信息中的省份信息、城市信息和县区信息以及招商需求关联领域关键词表中的关键词作为网络爬虫搜索的关键词,通过网络爬虫在网络上抓取相关的产业发展方向政策信息;
步骤S23,以产业领域名词归类映射表中的产业领域相关的名词为关键词,对产业发展方向政策信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商需求的产业领域词频表;
步骤S24,以招商需求的产业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对招商需求的产业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出招商需求的产业领域方向维度值表。
步骤S21换句话也就是,在招商产业方向的文本中进行查找,查找出在产业领域名词归类映射表中定义的名词,组成招商需求关联领域关键词表。产业领域名词归类映射表中定义的名词包括产业领域本身和产业领域所映射的名词。以前述动力电池作为产业领域为例,在招商产业方向的文本中查找有关电池管理系统、电池包、电池模组、电池阵列等名词,然后将找到的名词对应至动力电池这一产业领域中,组成集合作为招商需求关联领域关键词表。由此,假如招商产业方向的文本中存在电池管理系统、电池包、电池模组、电池阵列等名词,则招商需求关联领域关键词表中包含动力电池。
步骤S22中,通过网络爬虫在网络上抓取相关的产业发展方向政策信息时,本实施例仅抓取政府网站上相关的产业发展方向政策信息。这里的政府网站根据招商位置信息中的省份信息、城市信息和县区信息所确定。产业发展方向政策信息包括产业政策、政府工作报告等内容。所抓取到的产业发展方向政策信息可能是HTML格式的,也可能是WORD文档或者PDF文档。
步骤S23中,将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,采用数学公式表示为:V(p)=∑r(t,p)*k(t)*c(t);其中,V(p)表示产业领域p的词频,r(t,p)表示为名词t与与产业领域p的相关度值,k(t)表示名词t是否能够在招商产业方向搜索到的关联参数,c(t)表示名词t的词频。本实施例中,若名词t能够在招商产业方向搜索到,k(t)取值为1.1;若名词t不能在招商产业方向搜索到,k(t)取值为0.7。比如,在前述动力电池这一产业领域的示例中,电动汽车一词出现招商产业方向中,其加成项r(t,p)*k(t)*c(t)=0.4*1.1*c(t);而对于电池包一词未出现在招商产业方向中,其加成项r(t,p)*k(t)*c(t)=0.9*0.7*c(t)。
步骤S24采用数学公式可以表示为:w(p)=V(p)/max(Va)。其中,w(p)表示产业领域p的产业领域方向维度值,V(p)表示产业领域p的词频,max表示最大值函数,Va表示各个产业领域词频数组,max(Va)表示各个产业领域词频的最大值。根据上述公式可以得知,产业领域方向维度值表中,产业领域方向维度值为0~1,最大的产业领域方向维度值为1。
企业检索分析并构建企业的业务维度的步骤,也就是,根据招商需求的产业领域方向维度值表,通过网络爬虫搜索产业领域相关的企业,并爬取相关企业的描述信息,然后通过对相关企业的描述信息进行关键词频统计的方式,构建各相关企业的产业领域方向维度值表。本实施例中,该步骤具体采用如下步骤实现:
步骤S31,根据招商需求的产业领域方向维度值表中的产业领域,从产业领域名词归类映射表找出与产业领域相关的名词作为关键词,通过网络爬虫在网络上抓取相关的企业,组成候选企业表;
步骤S32,根据候选企业表中的企业,通过网络爬虫在网络上抓取相关企业的企业描述信息;
步骤S33,以产业领域名词归类映射表中的产业领域相关的名词为关键词,对企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出相关企业的企业领域词频表;
步骤S34,以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对相关企业的企业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出相关企业的产业领域方向维度值表。
步骤S31中,根据招商需求的产业领域方向维度值表中的产业领域,也就是,产业领域方向维度值大于0的产业领域。通过网络爬虫在网络上抓取相关的企业时,仅在特定的网站上爬取,优选在从工商管理登记部门的网站、或者第三方企业查询机构的网站上抓取有关企业的信息。匹配关键词时,匹配企业的简介和经营范围。第三方企业查询机构,比如天眼查、企查查、爱企查等机构。
步骤S32网络爬虫爬取企业描述信息时,采用全网络爬取的方式。只要涉及相关企业的内容都爬取出来。另外步骤S31爬取企业时,将所爬取企业的相关信息也合并值企业描述信息中。
步骤S33、S34和前述步骤S23、S24类似,所不同的是步骤S33中进行产业领域词频加权合计时,未使用是否为招商产业方向中的关键词进行加权。也就是说,步骤S33中,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,采用数学公式可以表示成:V(p)=∑r(t,p) *c(t);其中,V(p)表示产业领域p的词频,r(t,p)表示为名词t与与产业领域p的相关度值,c (t)表示名词t的词频。
本实施例中,进一步地,步骤S32中抓取到企业描述信息后还包括企业经营状况分析步骤。企业经营状况分析步骤,也就是,对企业经营状况分析,将不符合招商需求描述信息中被招商企业经营状况的要求的企业剔除。
招商需求和企业之间的业务维度的关联度计算并优选企业的步骤,也就是前述步骤S4, 根据招商需求的产业领域方向维度值表和企业的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各相关企业和招商需求之间的产业关联度值,并根据该产业关联度值优选K1个企业,组成优选企业表。这里参数K1与招商需求需要招商的企业数量相关。假设这优选企业表中的企业被招商成功的成功率以5%~10%计算,K1得是招商需求需要招商的企业数量的10~20倍,因此K1值通常通过配置输入。
构建招商人员业务维度的步骤,也就是前述步骤S5,就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表。本实施例中,步骤S5包括如下步骤:
步骤S51,从个人简历信息中获取非招商工作所在的工作企业,通过网络爬虫在网络上抓取这些工作企业的企业描述信息;
步骤S52,以产业领域名词归类映射表中的产业领域相关的名词为关键词,对工作企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出工作企业的企业领域词频表;
步骤S53,从历史招商工作信息中获取招商目标企业,通过网络爬虫在网络上抓取这些招商目标企业的企业描述信息;
步骤S54,以产业领域名词归类映射表中的产业领域相关的名词为关键词,对招商目标企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商目标企业的企业领域词频表;
步骤S55,以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,分别对工作企业的企业领域词频表和招商目标企业的企业领域词频表中各个产业领域词频做归一化处理,分别得到工作企业的产业领域方向维度值表和招商目标企业的产业领域方向维度值表;
步骤S56,根据个人基本信息的高等教育所接受教育的专业,通过产业领域名词归类映射表中的产业领域相关的名词,映射至相关的产业领域,并以名词与产业领域的相关度值为基础,按毕业年限递减的方式构建受教育专业的产业领域方向维度值表;
步骤S57,将工作企业的产业领域方向维度值表、招商目标企业的产业领域方向维度值表和受教育专业的产业领域方向维度值表进行加权合并,得到招商人员的产业领域方向维度值表。
上述过程简单来说,就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表。工作经历所涉及的产业领域是个人简历中曾经工作过的企业以及历史从事招商工作时的目标企业所涉及的产业领域。步骤S52和步骤S54与前述步骤S23类似,步骤S55和步骤S34类似。学校专业所涉及的产业领域也就是高等教育所接受教育的专业所涉及的产业领域。
步骤S57中的产业领域方向维度值表加权合并可以采用如下公式进行计算:VX(p)=V1(p)*c1+V2(p)*c2+V3(p)*c3。其中,VX(p)表示招商人员的产业领域p的产业领域方向维度值;V1(p)表示工作企业的产业领域方向维度值表中产业领域p的产业领域方向维度值;V2(p)表示招商目标企业的产业领域方向维度值表中产业领域p的产业领域方向维度值;V3(p)表示受教育专业的产业领域方向维度值表中产业领域p的产业领域方向维度值;c1,c2,c3为预先设定的系数。本实施例中,c1,c2和c3均为1。而根据前述产业领域方向维度值表中最大的产业领域方向维度值为1,因此,本领域技术人员理解,对通过上述公式得到的产业领域方向维度值表还需要进一步归一化处理,使得产业领域方向维度值表中最大的产业领域方向维度值为1。
招商需求和招商人员之间的业务维度的关联度计算并优选招商人员的步骤,也就是前述步骤S6,根据招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各招商人员和招商需求之间的产业关联度值,然后根据该产业关联度值优选K2个招商人员,组成优选招商人员表。这里参数K2与招商需求需要招商的企业数量相关。假设每个招商人员能够成功谈成一家企业的成功概率为30%~50%计算,K 2得是招商需求需要招商的企业数量的2~3倍。因此K2值通常通过配置输入。
优选企业和优选招商人员之间的业务维度关联度计算的步骤,也就是前述步骤S7,根据招商人员的产业领域方向维度值表和企业的产业领域方向维度值表,计算出优选企业表中各企业和优选招商人员表中各招商人员之间的产业关联度值,从而形成企业和招商人员之间的产业关联度矩阵。
前述步骤S4、S6和步骤S7中均涉及了通过两个产业领域方向维度值表计算出产业关联度值。步骤S4中,两个产业领域方向维度值表分别为招商需求的产业领域方向维度值表和企业的产业领域方向维度值表。步骤S6中,两个产业领域方向维度值表分别为招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表。步骤S7中,两个产业领域方向维度值表分别为招商人员的产业领域方向维度值表和企业的产业领域方向维度值表。本发明中,上述步骤S4、S6和步骤S7中的根据两个产业领域方向维度值表计算产业关联度值的相同,具体包括如下步骤:
步骤SA1,在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
x(p)+y(p)<h1;
步骤SA2,在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
abs(x(p)-y(p))/(x(p)+y(p))>h2;
步骤SA3,计算m=∑(x(p)+y(p));
步骤SA4,若m为0,则产业关联度值为0,否则计算产业关联度值:
R(X,Y)=1-∑abs(x(p) -y(p))÷m。
上述步骤的各式中,X和Y分别表示两个产业领域方向维度值表;R(X,Y)表示产业领域方向维度值表X和产业领域方向维度值表Y的产业关联度值;x(p)和y(p)为分别为产业领域方向维度值表X和产业领域方向维度值表Y中产业领域p的产业领域方向维度值;abs为绝对值运算;∑为求和运算;h1和h2分别为两个预先设定的阈值。h1通常取值为0.55~0.75。h2通常取值0.32~0.48。
产业关联度值表示为两个产业领域方向在核心产业领域上的包容性。步骤SA1的目的是剔除掉两个产业领域方向维度值表中的非核心的产业领域。当x(p)+y(p)<h1的条件被满足时,产业领域p被认定为是非核心产业领域而被剔除。步骤SA2的目的是剔除掉两个产业领域方向维度值表中产业领域方向维度值相差过大的产业领域。产业领域方向维度值相差过大表示两个产业领域方向在该产业领域上缺少包容,故此需要剔除。当abs(x(p)-y(p))/(x(p)+y(p))>h2的条件被满足时,两个产业领域方向在产业领域p上缺少包容。
招商目标企业的推荐分配的步骤,也就是前述步骤S8,根据预先设定的分配策略和企业和招商人员之间的产业关联度值大小,为招商人员分配企业形成招商人员对应的招商目标企业推荐表。本实施例中,预先设定了两种分配策略。具体实施过程中,用户可以选择采用何种分配策略。两种分配策略如下:
第一种分配策略下,按照产业关联度值大小进行排序,按照产业关联度值从大到小的顺序,将该产业关联度值所对应的企业和招商人员进行分配,直到该招商人员对应的招商目标企业数超出限值后退出分配,其他招商人员继续按上述步骤进行分配。
第二种分配策略下,按照产业关联度值大小进行排序,然后每一轮为每个招商人员选择其最大产业关联度值所对应的企业进行分配,分配所对应的产业关联度值退出队列,重复上述步骤指定的轮数后结束。
此外,本实施例具体实施过程中,在按照上述分配策略进行分配前,还会根据招商人员的个人简历信息和历史招商工作信息是否与招商目标企业是否存在关联进行优先分配。最终分配结束后,每个招商人员推荐的招商目标企业数3~10个。通过上述分配,前述步骤S6优选的K2个招商人员均分配有推荐的招商目标企业,但前述步骤S4优选的K1企业并不完全被分配。
此外,需要指出的是,上述步骤中,步骤S3和S4的过程与步骤S5和S6的过程是两个不分先后的过程,本领域技术人员理解,可以先执行步骤S3和S4的过程而后执行步骤S5和S6的过程,也可以先执行步骤S5和S6的过程而后执行步骤S3和S4的过程。
此外,本发明所指的装置与前述方法相对应的虚装置,其包含的模块是与方法对应的步骤,不再赘述。
Claims (10)
1.一种产业园区企业招商推荐的方法,其特征在于,包括如下步骤:
步骤S1,用于:获取产业领域名词归类映射表、招商需求描述信息和招商人员描述信息;所述产业领域名词归类映射表是产业领域和名词映射关系的表单;所述产业领域和名词映射关系包括产业领域和所映射的名词以及所映射的名词与产业领域的相关度值;所述招商需求描述信息包括招商位置信息和招商产业方向;所述招商人员描述信息包括个人基本信息、个人简历信息和历史招商工作信息;
步骤S2,用于:根据招商产业方向和产业领域名词归类映射表构建相关产业关键词,结合招商位置信息中的相关地域关键词,通过网络爬虫对所述相关产业关键词和相关地域关键词进行关键词搜索,爬取网络上相关的产业发展方向政策信息,然后通过对所述产业发展方向政策信息进行关键词频统计的方式,构建招商需求的产业领域方向维度值表;
步骤S3,用于:根据招商需求的产业领域方向维度值表,通过网络爬虫搜索产业领域相关的企业,并爬取相关企业的描述信息,然后通过对相关企业的描述信息进行关键词频统计的方式,构建各相关企业的产业领域方向维度值表;
步骤S4,用于:根据招商需求的产业领域方向维度值表和企业的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各相关企业和招商需求之间的产业关联度值,并根据该产业关联度值优选K1个企业,组成优选企业表;
步骤S5,用于:就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表;
步骤S6,用于:根据招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各招商人员和招商需求之间的产业关联度值,然后根据该产业关联度值优选K2个招商人员,组成优选招商人员表;
步骤S7,用于:根据招商人员的产业领域方向维度值表和企业的产业领域方向维度值表,计算出优选企业表中各企业和优选招商人员表中各招商人员之间的产业关联度值,从而形成企业和招商人员之间的产业关联度矩阵;
步骤S8,用于:根据企业和招商人员之间的产业关联度值大小,以企业和招商人员之间的产业关联度值大的为优先,为招商人员分配企业形成招商人员对应的招商目标企业推荐表;
其中,根据两个产业领域方向维度值表计算产业关联度值采用如下步骤进行计算:
步骤SA1,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
x(p)+y(p)<h1;
步骤SA2,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
abs(x(p)-y(p))/(x(p)+y(p))>h2;
步骤SA3,用于:计算m=∑(x(p)+y(p));
步骤SA4,用于:若m为0,则产业关联度值为0,否则计算产业关联度值:
R(X,Y)=1-∑abs(x(p) -y(p))÷m;
上述各式中,
X和Y分别表示两个产业领域方向维度值表;R(X,Y)表示产业领域方向维度值表X和产业领域方向维度值表Y的产业关联度值;x(p)和y(p)为分别为产业领域方向维度值表X和产业领域方向维度值表Y中产业领域p的产业领域方向维度值;abs为绝对值运算;∑为求和运算;h1和h2分别为两个预先设定的阈值。
2.根据权利要求1所述的产业园区企业招商推荐的方法,其特征在于,所述步骤S2包括如下步骤:
步骤S21,用于:根据产业领域名词归类映射表在所述招商产业方向搜索与产业领域相关的名词,生成招商需求关联领域关键词表;
步骤S22,用于:以所述招商位置信息中的省份信息、城市信息和县区信息以及所述招商需求关联领域关键词表中的关键词作为网络爬虫搜索的关键词,通过网络爬虫在网络上抓取相关的产业发展方向政策信息;
步骤S23,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述产业发展方向政策信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商需求的产业领域词频表;
步骤S24,用于:以所述招商需求的产业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对所述招商需求的产业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出招商需求的产业领域方向维度值表。
3.根据权利要求1所述的产业园区企业招商推荐的方法,其特征在于,所述步骤S3包括如下步骤:
步骤S31,用于:根据招商需求的产业领域方向维度值表中的产业领域,从产业领域名词归类映射表找出与产业领域相关的名词作为关键词,通过网络爬虫在网络上抓取相关的企业,组成候选企业表;
步骤S32,用于:根据候选企业表中的企业,通过网络爬虫在网络上抓取相关企业的企业描述信息;
步骤S33,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出相关企业的企业领域词频表;
步骤S34,用于:以所述企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对相关企业的企业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出相关企业的产业领域方向维度值表。
4.根据权利要求3所述的产业园区企业招商推荐的方法,其特征在于,所述招商需求描述信息还包括被招商企业经营状况的要求;所述步骤S32中抓取到企业描述信息后还包括企业经营状况分析步骤;所述企业经营状况分析步骤,用于:对企业经营状况分析,将不符合所述招商需求描述信息中被招商企业经营状况的要求的企业剔除。
5.根据权利要求1所述的产业园区企业招商推荐的方法,其特征在于,所述步骤S5包括如下步骤:
步骤S51,用于:从个人简历信息中获取非招商工作所在的工作企业,通过网络爬虫在网络上抓取这些工作企业的企业描述信息;
步骤S52,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述工作企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出工作企业的企业领域词频表;
步骤S53,用于:从历史招商工作信息中获取招商目标企业,通过网络爬虫在网络上抓取这些招商目标企业的企业描述信息;
步骤S54,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述招商目标企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值结合招商是否成功加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商目标企业的企业领域词频表;
步骤S55,用于:以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,分别对工作企业的企业领域词频表和招商目标企业的企业领域词频表中各个产业领域词频做归一化处理,分别得到工作企业的产业领域方向维度值表和招商目标企业的产业领域方向维度值表;
步骤S56,用于:根据个人基本信息的高等教育所接受教育的专业,通过产业领域名词归类映射表中的产业领域相关的名词,映射至相关的产业领域,并以名词与产业领域的相关度值为基础,按毕业年限递减的方式构建受教育专业的产业领域方向维度值表;
步骤S57,用于:将工作企业的产业领域方向维度值表、招商目标企业的产业领域方向维度值表和受教育专业的产业领域方向维度值表进行加权合并,得到招商人员的产业领域方向维度值表。
6.一种产业园区企业招商推荐的装置,其特征在于,包括如下模块:
模块M1,用于:获取产业领域名词归类映射表、招商需求描述信息和招商人员描述信息;所述产业领域名词归类映射表是产业领域和名词映射关系的表单;所述产业领域和名词映射关系包括产业领域和所映射的名词以及所映射的名词与产业领域的相关度值;所述招商需求描述信息包括招商位置信息和招商产业方向;所述招商人员描述信息包括个人基本信息、个人简历信息和历史招商工作信息;
模块M2,用于:根据招商产业方向和产业领域名词归类映射表构建相关产业关键词,结合招商位置信息中的相关地域关键词,通过网络爬虫对所述相关产业关键词和相关地域关键词进行关键词搜索,爬取网络上相关的产业发展方向政策信息,然后通过对所述产业发展方向政策信息进行关键词频统计的方式,构建招商需求的产业领域方向维度值表;
模块M3,用于:根据招商需求的产业领域方向维度值表,通过网络爬虫搜索产业领域相关的企业,并爬取相关企业的描述信息,然后通过对相关企业的描述信息进行关键词频统计的方式,构建各相关企业的产业领域方向维度值表;
模块M4,用于:根据招商需求的产业领域方向维度值表和企业的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各相关企业和招商需求之间的产业关联度值,并根据该产业关联度值优选K1个企业,组成优选企业表;
模块M5,用于:就招商人员描述信息中的工作经历和学校专业所涉及的产业领域,分别构建产业领域方向维度值表后加权合并形成各招商人员的产业领域方向维度值表;
模块M6,用于:根据招商需求的产业领域方向维度值表和招商人员的产业领域方向维度值表进行产业领域方向相关性匹配,计算出各招商人员和招商需求之间的产业关联度值,然后根据该产业关联度值优选K2个招商人员,组成优选招商人员表;
模块M7,用于:根据招商人员的产业领域方向维度值表和企业的产业领域方向维度值表,计算出优选企业表中各企业和优选招商人员表中各招商人员之间的产业关联度值,从而形成企业和招商人员之间的产业关联度矩阵;
模块M8,用于:根据企业和招商人员之间的产业关联度值大小,以企业和招商人员之间的产业关联度值大的为优先,为招商人员分配企业形成招商人员对应的招商目标企业推荐表;
其中,根据两个产业领域方向维度值表计算产业关联度值采用如下模块进行计算:
模块MA1,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
x(p)+y(p)<h1;
模块MA2,用于:在两个产业领域方向维度值表中剔除满足以下条件的产业领域:
abs(x(p)-y(p))/(x(p)+y(p))>h2;
模块MA3,用于:计算m=∑(x(p)+y(p));
模块MA4,用于:若m为0,则产业关联度值为0,否则计算产业关联度值:
R(X,Y)=1-∑abs(x(p) -y(p))÷m;
上述各式中,
X和Y分别表示两个产业领域方向维度值表;R(X,Y)表示产业领域方向维度值表X和产业领域方向维度值表Y的产业关联度值;x(p)和y(p)为分别为产业领域方向维度值表X和产业领域方向维度值表Y中产业领域p的产业领域方向维度值;abs为绝对值运算;∑为求和运算;h1和h2分别为两个预先设定的阈值。
7.根据权利要求6所述的产业园区企业招商推荐的装置,其特征在于,所述模块M2包括如下模块:
模块M21,用于:根据产业领域名词归类映射表在所述招商产业方向搜索与产业领域相关的名词,生成招商需求关联领域关键词表;
模块M22,用于:以所述招商位置信息中的省份信息、城市信息和县区信息以及所述招商需求关联领域关键词表中的关键词作为网络爬虫搜索的关键词,通过网络爬虫在网络上抓取相关的产业发展方向政策信息;
模块M23,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述产业发展方向政策信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值以及是否为招商产业方向中的关键词进行加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商需求的产业领域词频表;
模块M24,用于:以所述招商需求的产业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对所述招商需求的产业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出招商需求的产业领域方向维度值表。
8.根据权利要求6所述的产业园区企业招商推荐的装置,其特征在于,所述模块M3包括如下模块:
模块M31,用于:根据招商需求的产业领域方向维度值表中的产业领域,从产业领域名词归类映射表找出与产业领域相关的名词作为关键词,通过网络爬虫在网络上抓取相关的企业,组成候选企业表;
模块M32,用于:根据候选企业表中的企业,通过网络爬虫在网络上抓取相关企业的企业描述信息;
模块M33,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出相关企业的企业领域词频表;
模块M34,用于:以所述企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,对相关企业的企业领域词频表中各个产业领域词频做归一化处理,得到各个产业领域的产业领域方向维度值,从而构建出相关企业的产业领域方向维度值表。
9.根据权利要求8所述的产业园区企业招商推荐的装置,其特征在于,所述招商需求描述信息还包括被招商企业经营状况的要求;所述模块M32中抓取到企业描述信息后还包括企业经营状况分析模块;所述企业经营状况分析模块,用于:对企业经营状况分析,将不符合所述招商需求描述信息中被招商企业经营状况的要求的企业剔除。
10.根据权利要求6所述的产业园区企业招商推荐的装置,其特征在于,所述模块M5包括如下模块:
模块M51,用于:从个人简历信息中获取非招商工作所在的工作企业,通过网络爬虫在网络上抓取这些工作企业的企业描述信息;
模块M52,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述工作企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出工作企业的企业领域词频表;
模块M53,用于:从历史招商工作信息中获取招商目标企业,通过网络爬虫在网络上抓取这些招商目标企业的企业描述信息;
模块M54,用于:以产业领域名词归类映射表中的产业领域相关的名词为关键词,对所述招商目标企业的企业描述信息进行关键词频统计,并将所统计的关键词频根据名词与产业领域的相关度值结合招商是否成功加权后并入关键词所对应的产业领域中,形成产业领域词频,从而构建出招商目标企业的企业领域词频表;
模块M55,用于:以企业领域词频表中最大的产业领域词频对应产业领域方向维度值为1,分别对工作企业的企业领域词频表和招商目标企业的企业领域词频表中各个产业领域词频做归一化处理,分别得到工作企业的产业领域方向维度值表和招商目标企业的产业领域方向维度值表;
模块M56,用于:根据个人基本信息的高等教育所接受教育的专业,通过产业领域名词归类映射表中的产业领域相关的名词,映射至相关的产业领域,并以名词与产业领域的相关度值为基础,按毕业年限递减的方式构建受教育专业的产业领域方向维度值表;
模块M57,用于:将工作企业的产业领域方向维度值表、招商目标企业的产业领域方向维度值表和受教育专业的产业领域方向维度值表进行加权合并,得到招商人员的产业领域方向维度值表。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210422465.0A CN114741600B (zh) | 2022-04-21 | 2022-04-21 | 一种产业园区企业招商推荐的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210422465.0A CN114741600B (zh) | 2022-04-21 | 2022-04-21 | 一种产业园区企业招商推荐的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114741600A CN114741600A (zh) | 2022-07-12 |
CN114741600B true CN114741600B (zh) | 2022-12-27 |
Family
ID=82282628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210422465.0A Expired - Fee Related CN114741600B (zh) | 2022-04-21 | 2022-04-21 | 一种产业园区企业招商推荐的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114741600B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115239298A (zh) * | 2022-07-29 | 2022-10-25 | 中科泰岳(北京)科技有限公司 | 一种基于地理区域划分管理的综合智慧商业招商管理平台 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271798A (ja) * | 2008-05-08 | 2009-11-19 | Nomura Research Institute Ltd | 業界マップ生成システム |
CN106960063A (zh) * | 2017-04-20 | 2017-07-18 | 广州优亚信息技术有限公司 | 一种针对招商引资领域的互联网情报抓取和推荐系统 |
CN108921702A (zh) * | 2018-06-04 | 2018-11-30 | 北京至信普林科技有限公司 | 基于大数据的园区招商方法及装置 |
CN109284500A (zh) * | 2018-08-20 | 2019-01-29 | 张连祥 | 基于招商工作流程和阅读偏好的信息推送系统及方法 |
CN109325678A (zh) * | 2018-09-11 | 2019-02-12 | 张连祥 | 一种招商对象智能优选的方法及系统 |
CN113450008A (zh) * | 2021-07-05 | 2021-09-28 | 深圳智慧园区信息技术有限公司 | 一种基于大数据的产业招商方法、系统、智能终端及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101183933B1 (ko) * | 2010-11-25 | 2012-09-21 | 한국과학기술정보연구원 | 연구개발 기술의 경제성 분석 지원 시스템 및 방법 |
CN110083645A (zh) * | 2019-05-06 | 2019-08-02 | 浙江核新同花顺网络信息股份有限公司 | 一种报告生成的系统和方法 |
CN110336886A (zh) * | 2019-07-11 | 2019-10-15 | 上海企久数据技术有限公司 | 一种多主体、多用户、多终端协同的智慧园区云服务系统 |
CN110310051A (zh) * | 2019-07-11 | 2019-10-08 | 上海企久数据技术有限公司 | 一种自动导入和动态更新企业数据的智慧园区管理方法 |
CN112070344A (zh) * | 2020-07-29 | 2020-12-11 | 广东飞企互联科技股份有限公司 | 一种衡量企业竞争力水平的评分标准方法 |
CN112734458A (zh) * | 2020-12-25 | 2021-04-30 | 珠海大横琴科技发展有限公司 | 一种招商方法、装置、电子设备和可读存储介质 |
-
2022
- 2022-04-21 CN CN202210422465.0A patent/CN114741600B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009271798A (ja) * | 2008-05-08 | 2009-11-19 | Nomura Research Institute Ltd | 業界マップ生成システム |
CN106960063A (zh) * | 2017-04-20 | 2017-07-18 | 广州优亚信息技术有限公司 | 一种针对招商引资领域的互联网情报抓取和推荐系统 |
CN108921702A (zh) * | 2018-06-04 | 2018-11-30 | 北京至信普林科技有限公司 | 基于大数据的园区招商方法及装置 |
CN109284500A (zh) * | 2018-08-20 | 2019-01-29 | 张连祥 | 基于招商工作流程和阅读偏好的信息推送系统及方法 |
CN109325678A (zh) * | 2018-09-11 | 2019-02-12 | 张连祥 | 一种招商对象智能优选的方法及系统 |
CN113450008A (zh) * | 2021-07-05 | 2021-09-28 | 深圳智慧园区信息技术有限公司 | 一种基于大数据的产业招商方法、系统、智能终端及存储介质 |
Non-Patent Citations (2)
Title |
---|
Application of Lean Construction Management;Svetlana N. Kuznetsova等;《Springer》;20220121;全文 * |
大数据推动产业集群发展初探;李旻;《城市建设理论研究》;20171205;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114741600A (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Raj Mishra et al. | Multi-criteria IT personnel selection on intuitionistic fuzzy information measures and ARAS methodology | |
Javed et al. | Bidirectional absolute GRA/GIA model for uncertain systems: application in project management | |
US20160350765A1 (en) | System and interface for viewing modularized and taxonomy-based classification of regulatory obligations qualitative data | |
Calof et al. | Corporate foresight for strategic innovation management: the case of a Russian service company | |
CN110727852A (zh) | 一种推送招聘推荐服务的方法、装置及终端 | |
Arya et al. | A picture fuzzy multiple criteria decision-making approach based on the combined TODIM-VIKOR and entropy weighted method | |
Ardil | Aircraft Selection Problem Using Decision Uncertainty Distance in Fuzzy Multiple Criteria Decision Making Analysis | |
Jin | Selection of virtual team members for smart port development projects through the application of the direct and indirect uncertain TOPSIS method | |
Ardil | Fuzzy Uncertainty Theory for Stealth Fighter Aircraft Selection in Entropic Fuzzy TOPSIS Decision Analysis Process | |
Ardil | Airline Quality Rating Using PARIS and TOPSIS in Multiple Criteria Decision Making Analysis | |
KR20200087037A (ko) | 기업 표준 직무 분류 방법 및 서버 | |
CN114741600B (zh) | 一种产业园区企业招商推荐的方法和装置 | |
Peng et al. | A multi-criteria decision-making approach based on TODIM and Choquet integral within a multiset hesitant fuzzy environment | |
CN114067308A (zh) | 智能匹配方法、装置、电子设备及存储介质 | |
CN117522222A (zh) | 一种基于大数据的教育测评软件实现方法 | |
Sun et al. | Hesitant fuzzy multi-attribute decision making based on TOPSIS with entropy-weighted method | |
Deepa et al. | Integrated ranking algorithm for efficient decision making | |
Zarghi et al. | Evidence-based social sciences: A new emerging field | |
CN112417280A (zh) | 一种基于虚拟现实主持人体系的推荐方法和系统 | |
Ahsan et al. | Optimizing new technology implementation through fuzzy hypersoft set: A framework incorporating entropy, similarity measure, and TOPSIS techniques | |
CN111209403A (zh) | 数据处理方法、装置、介质及电子设备 | |
Barokab et al. | University’s recruitment process using Fermatean fuzzy Einstein prioritized aggregation operators | |
Xie et al. | Evaluating and visualizing QoS of service providers in knowledge-intensive crowdsourcing: a combined MCDM approach | |
CN116703665A (zh) | 一种基于数字化计算的学生智能辅导系统和方法 | |
Poushy et al. | Satisfaction prediction of online education in COVID-19 situation using data mining techniques: Bangladesh perspective |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20221227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |