CN115374170A

CN115374170A - 目标企业筛选方法、装置、设备与计算机可读存储介质

Info

Publication number: CN115374170A
Application number: CN202210593003.5A
Authority: CN
Inventors: 章芳瑚; 蔡宇驰; 葛亚飞
Original assignee: Hangzhou Hangqi Technology Industry Development Co ltd
Current assignee: Hangzhou Hangqi Technology Industry Development Co ltd
Priority date: 2022-05-27
Filing date: 2022-05-27
Publication date: 2022-11-22

Abstract

本申请实施例提供了一种目标企业筛选方法、装置、设备及计算机可读存储介质，其中方法包括：获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表；根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表；根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。本申请的有益效果在于：提供了一种根据行业和相关企业特征进行匹配以帮助用户从海量企业中快速寻找到各指标均有很高符合度的待选企业的目标企业筛选方法、装置、设备及计算机可读存储介质。

Description

目标企业筛选方法、装置、设备与计算机可读存储介质

技术领域

本申请涉及数据处理技术领域，尤其涉及一种目标企业筛选方法、装置、设备与计算机可读存储介质。

背景技术

招商引资、扩大开放是加快经济社会发展的重要手段，是实施战略和加快主导产业建设步伐的重大举措。

产业园区作为产业聚集的载体，既是区域经济发展、产业调整升级的空间承载形式，又是社会经济发展水平的衡量标志，它肩负着聚集创新资源、培育新兴产业和推动城市化建设等重要使命。

在这样的背景下，如何改进产业园区的招商引资工作，实施精准招商，优化产业园区和区域的产业结构，是目前所要研究的重点。如何选择最优，最适合的企业进行招商是产业园区和地方招商部门所最关心的事情。但是因为绩效，信息不对称等因素的影响，会导致各地盲目招商，完全不考虑招商的精准度与产业的契合度；另一方面，一些产业园区或地方招商部门在单向寻找招商目标企业的时候，严重依赖传统的熟人介绍模式，可供筛选的目标企业较少。最终造成招商企业不能带动当地经济的发展，甚至需要政府的扶持，阻碍了当地经济的发展。

现有的招商方法研究往往只是从一两个角度予以考虑，如对于企业的产业契合度、企业具有入驻意向的原因以及高价值性招商企业的筛选等这些重要的要素以及变量常常会忽视，因此招商结果也会相应地打了折扣。同样，传统的方法也面临诸多问题与挑战，例如产业分析难，新兴产业链错综复杂，传统统计数据已经无法进行精准分析定位；精准招商难，信息获取渠道少、成本高、效率低，目标企业投资意愿难判断，目标经营企业情况难了解；找客户难，耗费大量时间寻找客户线索，招商效率低下等问题。

申请内容

有鉴于此，本申请提供了一种目标企业筛选方法、装置、设备与计算机可读存储介质，可以解决如背景技术中产业园区和地方招商部门等用户在筛选目标招商企业时所遇到的问题。

为了实现上述目的，本申请提供如下技术方案：

第一方面，本申请实施例提供了一种目标企业筛选方法，方法包括：获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表；根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表；根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

进一步的，行业结构化数据库中任一企业对应至少两级行业分类。

进一步的，根据企业的价值分数获得第二目标企业列表的方法包括：选取用于评价价值企业的各特征元素，以及预设的各特征元素的权重；获取第一目标行业企业列表中每个企业对应的各特征元素的值，基于各特征元素的值及各特征元素的权重计算每个企业的价值分数；筛选价值分数大于分数阈值的企业为第二目标企业；将第二目标企业加入第二目标企业列表。

进一步的，各特征元素的权重的获取方法包括：采用AHP和专家群体决策对方法确定特征元素的初始权重，通过对同层特征元素的初始权重进行归一化处理，得到各特征元素的权重，各特征元素与位于同层的其他特征元素的权重和为1。

进一步的，筛选具有动因的企业加入第三目标企业列表的方法为：预设至少一个动因标签；获取第二目标企业列表中每个企业的重大事项文本库；采用语义文本分类模型对重大事项文本库中的重大事项文本进行动因标签匹配；将与动因标签匹配的重大事项所属的企业加入第三目标企业列表。

进一步的，每个企业的重大事项为包含重大事项关键词或近义词的文本。

进一步的，将重大事项文本库中的重大事项文本进行动因标签匹配的方法包括：将重大事项文本库中的重大事项文本采用文本分类模型与动因标签进行匹配。

第二方面，本申请实施例提供了一种目标企业筛选装置，包括：第一目标企业列表生成模块：第一目标获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表；第二目标企业列表生成模块：根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表；第三目标企业列表生成模块：根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

第三方面，本申请实施例提供了一种目标企业筛选设备，包括：存储器，用于存储计算机程序；处理器，用于执行计算机程序时实现如上述任一项的目标企业筛选方法的步骤。

第四方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上述任一项的目标企业筛选方法的步骤。

本申请的有益效果在于：提供了一种根据行业和相关企业特征进行匹配以帮助用户从海量企业中快速寻找到各指标均有很高符合度的待选企业的目标企业筛选方法、装置、设备与计算机可读存储介质。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请的一个实施例提供的一种目标企业筛选方法的流程图；

图2为本申请的一个实施例提供的行业结构化数据库的结构示意图；

图3为本申请的一个实施例提供的获得第二目标企业列表的方法的流程图；

图4为本申请的一个实施例提供的获得第三目标企业列表的方法的流程图；

图5为本申请实施例提供的一种目标企业筛选装置的结构示意图；

图6为本申请实施例提供的一种目标企业筛选设备的结构示意图。

具体实施方式

产业园或者地方政府对于招商目标企业的产业契合度、企业具有入驻意向的原因以及高价值性招商企业的筛选等重要指标有较高的要求，并且极为有助于从海量企业中快速寻找到各指标均有很高符合度的待选企业，并且对于有搬迁、对外投资、扩大生产等意愿的公司而言，更加有助于产业园或地方政府主动接洽目标企业，增加最终项目落地的可能性。

为此，本申请提供一种目标企业筛选方法技术方案，以助于产业园或地方政府快速、高效地筛选出待招商的目标企业。

为了使本领域技术人员更清楚地理解本技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

参见图1，其示出了本申请的一个实施例提供的一种目标企业筛选方法的流程图，本申请实施例提供的一种目标企业筛选方法，可以包含以下步骤：

S11：获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表。

在本申请的一个实施例中，目标行业类别关键词可以是基于区域产业布局来确定。比如某医疗器械产业园，其招商的对象更加倾向于医疗领域行业，以形成医疗领域企业的积聚，以寻求产业积聚效应给区域经济带来的最大化效应。对于医疗相关行业而言，其又包含很多二级子行业，以及三级行子行业。比如药品行业作为医疗行业的二级子行业，其分为化学药、生物药、中药、药包材、药用辅料等行业。

如图2所示，在本申请的一个实施例中，行业结构化数据库是一个大型的企业行业分类的数据库，该数据库可以用于将各个企业划分为至少一级行业。比如浙江省***生物医药股份有限公司，其在数据库中被划分为医药行业(一级行业)中的药品行业(二级行业)中的生物医药行业(三级)。这样产业园等招商用户在有企业筛选需求时，可以先基于“生物医药”这一关键词，首先筛选出符合生物医药行业的所有企业，并将这些企业组成第一目标企业列表，即该企业列表中的所有企业的行业是与该产业园区的产业布局是匹配的。

S12：根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表。

本申请的一个实施例中，第一目标行业企业列表中的企业对应着该企业的注册资本、知识产权情况、员工人数等等一系列对外公开数据，通过对这些数据的综合判断，便能够评估出该企业是不是良性发展、企业实力如何、是否有引入某产业园或区域的现实价值性。企业特征元素即企业对应的各个指标以及各指标的赋值情况，如创新指数、规模指数、成长指数、社会效应指数、融资便利指数等五个维度的指标。通过对这五个维度指数得分计算获得该企业的竞争力得分，即企业的价值分数。

进一步的，本实施例中，创新指数基于该企业的申请专利、软件著作权等知识产权情况综合计算出60分；规模指数基于员工人数、对外投资数量、注册资本等综合计算出得分90分；成长指数可以根据企业近年经营收入等计算出100分；社会效应指数可以根据企业获得荣誉情况计算得到90分；融资便利指数可以根据企业获得的融资情况计算得分 100分。可选的，可以以该五个企业特征元素的平均分计算出价值分数为88分。

本申请的一个实施例中，可以预设价值分数阈值为80分，即当某企业的价值分数大于或等于80分时，可将该企业加入第二目标企业列表。

S13：根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

企业的重大事项一般包含公司的经营方针和经营范围的重大变化、公司的重大投资行为和重大的购置财产的决定、公司订立重要合同，可能对公司的资产、负债、权益和经营成果产生重要影响等一系列企业相关事件。其界定规则既可以根据相关法律法规、也可以根据个性化需求进行预先设定。企业公开的重大事项往往会披露该企业的一些经营行为，这些经营行为中有可能就涉及该企业有迁址、在外设立子公司等和区域招商密切相关的动因。在本申请的一个实施例中，根据一般企业的重大事项的归类，可以将动因分类包括但不限于以下几种：1、资金充裕，投资扩大产能、市场份额需求强烈；2、产业化在即，需求强烈；3、生产/销售转化需求强烈；4、存在投资扩建新厂房的需求；5、市场份额稳定，将带来净利润增长和产能需求。

参见图3，其示出了本申请的一个实施例提供的获取第二目标企业列表的流程图。本申请的一个实施例提供的一种目标企业筛选方法，根据企业的价值分数获得第二目标企业列表的方法，可以包括：

S301：选取用于评价价值企业的各特征元素，以及预设的各特征元素的权重。

S302：获取第一目标行业企业列表中每个企业对应的各特征元素的值，基于各特征元素的值及各特征元素的权重计算每个企业的价值分数。

S303：筛选价值分数大于分数阈值的企业为第二目标企业。

S304：将第二目标企业加入第二目标企业列表。

本申请的一个实施例提供了一种目标企业筛选方法，其中，预设各特征元素的权重，可以包括：

将特征元素划分为多个层；除最后一层外其他任一层中的任一特征元素，与其所在层的下一层中多个特征元素相对应；为各特征元素设定初始权重；第一层全部特征元素的初始权重的和为1，其他层中对应于同一特征元素的全部特征元素的初始权重的和为1；对每层特征元素进行归一化处理，得到每个特征元素的权重；同一层特征元素的权重的和为1。

需要说明的是，可以将特征元素划分为多个层，第一层中每个特征元素分别对应第二层中多个特征元素，而第二层中每个特征元素分别对应第三层中多个特征元素，以此类推；其中，当一个特征元素与多个特征元素对应时，该一个特征元素则为对应的多个特征元素的概括信息，而该多个特征元素则为对应的一个特征元素的细化信息；如第一层包括创新指数、规模指数、成长指数、社会效应指数、融资便利指数，第二层中与创新指数对应的申请专利和实用新型专利数量、重大科技项目立项数量，与规模指数对应的特征元素包括注册资本数额、企业员工人数、企业纳税额，其他第一层中各特征元素不做详述。在各特征元素设置相应的初始权重，第一层各特征元素的初始权重的和为1，其它层中对应于同一特征元素的多个特征元素的初始权重的和为1。进而对每层特征元素进行归一化处理，从而使得同一层全部特征元素的权重的和为1。可见，本申请实施例选取影响评估企业竞争力的特征元素，采用AHP(层次分析法)和专家群体决策对方法确定特征元素的初始权重，对同层特征元素的初始权重进行归一化处理，归一化处理后同层中各特征元素的权重和为1。通过这种方式实现各特征元素的权重的有效设置。

本申请的一个实施例中，设置特征元素权重后进一步获得第二目标企业列表的方法包括：

设置个特征元素的评分标准，在上述应用场景下，根据各特征元素的评分标准，可以按照以下公式计算各企业的价值分数：

其中，S⁽ⁱ⁺¹⁾表示特征元素中第i+1层特征元素的评分，

表示第i+1层特征元素的i层特征元素j的评分，n表示第i＝1层属性的i层特征元素的个数，

表示特征元素j的权重。

如果当某企业的级别分数在80分以上时，可确定该企业为第二目标企业，并将第二目标企业加入第二目标企业列表。

参见图4，其示出了本申请一个实施例提供的获取第三目标企业列表的流程图。该实施例中筛选具有动因的企业加入第三目标企业列表的方法为：

S401：预设至少一个动因标签。本申请一个实施例中，动因标签分为5种{“资金充裕，投资扩大产能、市场份额需求强烈”，“产业化在即，需求强烈”，“生产/销售转化需求强烈”，“存在投资扩建新厂房的需求”，“市场份额稳定，将带来净利润增长和产能需求”}，应当说明的是，动因标签的数量可以多于5种，也可以少于5种，其它技术方案中仅有动因标签的数量的不同应当视为该技术方案落入本申请保护的范围。

S402：获取第二目标企业列表中每个企业的重大事项文本库。重大事项为包含有标记公司重大事项的关键词或关键词的近义词。重大事项的文本可以是各公司发布于公开网络服务器的公告、资讯，也包括外部机构对企业的研究报告、新闻报道等。如上市公司的重大事项公告、公司官网资讯以及投资机构发布的公司研究报告、对该公司的新闻分析报道等文本信息。可以理解的是，本实施例重大事项文本既可以通过人工标注筛选出来，也可以基于现有技术中采用语义文本分类模型对企业相关信息的文本进行动因标签匹配，将匹配到对应重大事项关键词的文本作为重大事项文本。进一步的，也可以基于现有技术中的基于深度学习的信息抽取技术，将数据量较大的重大事项原文本抽取出核心信息，并进一步将该核心信息作为该重大事项文本而保存于文本库中，这样可以大大减少后续予以文本分类模型的数据计算量。

S403：采用语义文本分类模型对重大事项文本库中的重大事项文本进行动因标签匹配。

采用语义文本分类模型对重大事项文本库中的重大事项文本进行动因标签匹配。可以理解的是，本申请的一个实施例中的文本分类算法主要是为了将大量文本以隶属类别进行有效分类，将各待筛选企业的重大事项对应到各动因(如有)，这样就能判定企业是否有入驻动因，有动因的企业则为招商目标企业。因此，本实施例的文本分类算法包括但不限于朴素贝叶斯、K近邻、神经网络、SVM(支持向量机)、向量空间模型的Rocchio分类器、最大熵等。

本申请的一个实施例中，以SVM算法作为文本分类算法。然而本申请显然不局限于使用SVM算法。

首先，从重大事项文本库中选择出若干重大事项文本作为训练文本集，并对这些训练文本根据预设的m种类别即动因标签进行人工匹配分类。训练文本的选择需要使得各个类别的文本数量差别不大。具体实现时，可以预先指定每个类别的文本数目，例如100，然后逐条从重大事项文本库中读入重大事项文本，对其进行人工分类。

得到训练文本后，需要提取该训练集文本的特征，并使用向量空间模型 (VectorSpace Model，VSM)将训练文本集中的文本表示为其对应的特征向量。

经过上述处理后，训练数据集可表示如下：

T＝{T_i|T_i＝(W_i，c_i)，c_i∈C}

其中，W_i为训练文本集中第i个训练文本的特征向量，C为该特征向量的人工分类类别集。第i个文本的特征向量W_i表示如下：

W_i＝(w_i1，w_i2，…，w_in)

其中w_ik(k＝1，2，…d)为特征项k对文本i的贡献程度，n为特征向量的维数。人工分类类别集C表示如下：

C＝{c₁，c₂，…，c_m}

其中，m为类别数。

接下来利用MATLAB中的LIBSVM工具进行文本分类模型的训练，其步骤如下：

1)设置系统参数。

该参数可通过LIBSVM软件包提供的svm_parameter方法进行参数设定。本实施例中，选用C_SVC类型的支持向量机，其核函数(Kernel Function)使用径向基函数 (RadicalBase Function，RBF)：

K(x_i，x_j)＝exp(-γ|x_i-x_j|2)

设定RBF核函数的参数γ的初始值为0.5；svm_type(支持向量机类型)属性为C_SVC； C(类别数)属性即为分类的类别数m；kernel_type(内核类型)属性为RBF；shrinking(是否采用启发式收缩方式)属性为1；设置cache_size(缓存大小)为100MB，eps(运算的精度)为0.001。

2)训练属性设置。

设定SVM的参数后，将训练数据集做为SVM的输入，经过训练后产生SVM的分类器的分类模型。在LIBSVM软件包中，使用svm_problem来描述当前的分类问题。设置 svm_problem的1属性为训练数据集T的元素个数，x和y属性分别设置为训练数据集T的训练文本特征向量集和对应的训练文本的类别集。

在使用LIBSVM时，svm_problem的x属性是一个二维的svm_node数组。将其第一维大小设置为训练数据集T的元素个数，第二维设置为训练数据集T中训练文本特征向量的维数。训练数据集T中的每一个元素对应着x中的一行。对于svm_problem的x属性中的第i行j列元素x_[i][j]，设置其index属性为j+1，同时设置其value属性为训练数据集合中第 i个训练文本的特征向量的第j维数值。

vm_problem的y属性是一个一维数组，其大小为训练数据集T中的元素个数。对于y的第i维，设置其值为训练数据集T中的第i个训练文本的类别c_i。

3)训练SVM分类器模型。

在LIBSVM软件包中，调用svm的静态svm_train方法便可以完成SVM分类器的训练工作。该方法使用svm_problem和svm_parameter作为参数，这两个参数在前面的步骤中均已经设置完成。svm_train方法的返回值为svm_model类型的对象，该对象即为SVM分类器模型。

4)文本分类即动因分类。

通过上述步骤就完成了SVM分类器的构造任务，接下来开始重大事项文本分类。在对待分类文本分类之前，需要将文本d按照VSM模型表示为其特征向量：

w_d＝(w_d1,w_d2,…,w_dn)

录入对待分类文本的特征向量后，调用svm的静态svm_predict方法，便可以完成预测工作。该方法使用svm_model和svm_node数组作为参数。svm_model为步骤3)中生成的SVM 分类器模型，svm_node数组则对应着待预测类别的文本的录入数据。svm_predict方法将返回通过svm_model预测的文本的类别。

S404：将与动因标签匹配的重大事项所属的企业加入第三目标企业列表。上述步骤将企业重大事项文本进行分类后，任一企业的任一重大事项文本就匹配到了至少一个动因标签，则将匹配到动因标签的企业加入到第三目标列表中。

本申请的一个实施例根据本申请的目标企业筛选方法对某一企业的重大事项进行了动因匹配，从而确定该企业的动因。如根据***药业集团股份有限公司为A股上市公司，其发布的2021年年报。首先采用基于深度学习的信息抽取技术，对该年报文本进行文本抽取将数据量较大的重大事项原文本抽取出核心信息抽取，得到公告的核心摘要信息：公司连续3年业务稳定增长，平均营业收入增长率为16.29％，平均净利润增长率19.58％。该实施例预设了5种动因标签：“资金充裕，投资扩大产能、市场份额需求强烈”，“产业化在即，需求强烈”，“生产/销售转化需求强烈”，“存在投资扩建新厂房的需求”，“市场份额稳定，将带来净利润增长和产能需求”。通过SVM分类器模型对上述年报的核心摘要信息进行归类，其分类结果为属于“资金充裕，投资扩大产能、市场份额需求强烈”，即***药业集团股份有限公司的一个动因为“资金充裕，投资扩大产能、市场份额需求强烈”。显然，该公司应当被加入第三目标企业列表中。经本申请实施例采用的目标企业筛选方法筛选出的***药业集团股份有限公司，其作为医疗行业的医药流通企业，价值评分较高，并且具有动因，因此对于某医疗行业产业园区而言，***药业集团股份有限公司为一家的目标招商企业。

应当说明的是，本申请一个实施例中，鉴于主要目的是为了筛选出具有动因的企业，因此，对于一个企业的一个重大事件文本，可能会被匹配到多个动因，我们无需对多个动因进行进一步筛选，以确保产业园或者招商部门等用户能够全面快速地评估该企业的意向。

第三目标企业列表中的企业即本申请实施例中对应产业园区或者政府招商部门等有招商需求用户的招商目标企业，用户可以与这些目标企业进行对接洽谈企业入驻意向，从而增加招商的成功率。

本申请的一个实施例还提供了一种目标企业筛选装置，参见图5，其示出了本申请实施例提供的一种目标企业筛选装置的结构示意图，可以包括：

第一目标企业列表生成模块51：用于获取目标行业类别关键词信息，并进一步根据与行业结构化数据库的匹配结果，生成第一目标企业列表；

第二目标企业列表生成模块52：用于根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，并进一步根据企业的价值分数获得第二目标企业列表；

第三目标企业列表生成模块53：用于根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

本申请的一个实施例还提供了一种目标企业筛选设备，参见图3，其示出了本申请实施例提供的一种目标企业筛选设备的结构示意图，可以包括：

存储器61，用于存储计算机程序；

处理器62，用于执行存储器61存储的计算机程序时可实现如下步骤：

获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表；根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表；根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

本申请的一个实施例还提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时可实现如下步骤：

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory， ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请的一个实施例提供的一种目标企业筛选装置、设备及计算机可读存储介质中相关部分的说明可以参见本申请实施例提供的一种目标企业筛选方法中对应部分的详细说明，在此不再赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种目标企业筛选方法，包括：

获取目标行业类别关键词信息，根据与行业结构化数据库的匹配结果，生成第一目标企业列表；

根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，根据企业的价值分数获得第二目标企业列表；

根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

2.根据权利要求1所述的目标企业筛选方法，其特征在于，所述行业结构化数据库中任一企业对应至少两级行业分类。

3.根据权利要求1所述的目标企业筛选方法，其特征在于，所述根据企业的价值分数获得第二目标企业列表的方法包括：

选取用于评价价值企业的各特征元素，以及预设的各特征元素的权重；

获取所述第一目标行业企业列表中每个企业对应的各特征元素的值，基于各特征元素的值及各特征元素的权重计算每个所述企业的价值分数；

筛选所述价值分数大于分数阈值的企业为第二目标企业；

将所述第二目标企业加入第二目标企业列表。

4.根据权利要求3所述的目标企业筛选方法，其特征在于，所述各特征元素的权重的获取方法包括：采用AHP和专家群体决策对方法确定特征元素的初始权重，通过对同层特征元素的初始权重进行归一化处理，得到各特征元素的权重，所述各特征元素与位于同层的其他特征元素的权重和为1。

5.根据权利要求1所述的目标企业筛选方法，其特征在于，所述筛选具有动因的企业加入第三目标企业列表的方法包括：

预设至少一个动因标签；

获取第二目标企业列表中每个企业的重大事项文本库；

将重大事项文本库中的重大事项文本进行动因标签匹配；

将与动因标签匹配的重大事项所属的企业加入第三目标企业列表。

6.根据权利要求1或权利要求5所述的目标企业筛选方法，其特征在于，所述每个企业的重大事项为包含重大事项关键词或近义词的文本。

7.根据权利要求5所述的目标企业筛选方法，其特征在于，所述将重大事项文本库中的重大事项文本进行动因标签匹配的方法包括：

将所述重大事项文本库中的重大事项文本采用文本分类模型与所述动因标签进行匹配。

8.一种目标企业筛选装置，包括：

第一目标企业列表生成模块：用于获取目标行业类别关键词信息，并进一步根据与行业结构化数据库的匹配结果，生成第一目标企业列表；

第二目标企业列表生成模块：用于根据企业特征元素对第一目标行业企业列表中企业元素进行价值打分，并进一步根据企业的价值分数获得第二目标企业列表；

第三目标企业列表生成模块：用于根据第二企业列表中各企业的重大事项判断企业动因，筛选具有动因的企业加入第三目标企业列表。

9.本申请实施例提供了一种目标企业筛选设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如权利要求1至7任意一项所述的目标企业筛选方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的目标企业筛选方法的步骤。