CN110634019A

CN110634019A - 基于企业与地区的匹配方法、电子设备和存储介质

Info

Publication number: CN110634019A
Application number: CN201910840097.XA
Authority: CN
Inventors: 胡洋吉; 宋礼; 张钧波; 郑宇�; 陈顺
Original assignee: Jingdong City Beijing Digital Technology Co Ltd
Current assignee: Beijing Jingdong intelligent city big data research institute
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2019-12-31

Abstract

本申请提供一种基于企业与地区的匹配方法、电子设备和存储介质，其中该方法包括：从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息；将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息；根据各得分信息对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业。客观、准确的分析出企业与地区之间匹配程度；并且，智能推荐方法可以实现自动高效，精准匹配，提高成功率；不需要耗费大量的时间、人力、以及其他资源，降低了成本。

Description

基于企业与地区的匹配方法、电子设备和存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种基于企业与地区的匹配方法、电子设备和存储介质。

背景技术

随着各个地区的发展，各个地区对于经济发展的需求也越来越多；进而，各个地区对于企业的招商的需求也越来越多，进而需要分析企业与地区之间匹配程度。现有技术中，可以采用人工的方式对企业的资质、企业的信息进行分析，并且结合地区的需求，去确定企业与地区之间是否匹配。

然而现有技术中，人工的分析企业与地区之间是否匹配，这样的方式并不客观，并且容易产生舞弊问题，进而无法客观、准确的分析出企业与地区之间匹配程度；并且，人工的分析企业与地区之间是否匹配，这样的方式的效率较低；并且，人工的分析方式，需要耗费大量的时间、人力、以及其他资源，进而成本较高。

发明内容

本申请提供一种基于企业与地区的匹配方法、电子设备和存储介质，用以解决无法客观、准确的分析出企业与地区之间匹配程度，效率较低的问题。

第一方面，本申请提供了一种基于企业与地区的匹配方法，所述方法应用于电子设备，所述电子设备与服务器连接，所述方法包括：

从所述服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，所述第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息；

将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息，其中，所述决策树模型中包括N棵决策树，N为大于等于1的正整数；

根据各所述得分信息，对各所述待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业，其中，M为大于等于1的正整数。

进一步地，在确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业之后，还包括：

将与所述地区匹配的企业，推送给与所述地区对应的终端设备。

进一步地，将与所述地区匹配的企业，推送给与所述地区对应的终端设备，包括：

将与所述地区匹配的企业的企业标识，以以下方式中的任意一种或多种发送给与所述地区对应的终端设备：文字信息、语音信息、图像信息。

向与所述地区匹配的企业所对应的终端设备，发送所述地区的地区信息。

进一步地，在将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息之前，还包括：

对所述每一个待识别企业的第一特征信息进行第一特征预处理，得到所述每一个待识别企业的特征预处理之后的第一特征信息。

进一步地，所述第一特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

进一步地，每一棵决策树中包括多个节点，每一个非叶子节点的节点具有判断规则，其中，所述判断规则用于对待识别企业进行分类。

进一步地，将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息，包括：

将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，得到每一个待识别企业的分数信息，所述分数信息包括了待识别企业在每一棵决策树中被输出的分数；

针对每一个待识别企业，对待识别企业在各棵决策树中被输出的分数进行线性加和处理，得到所述每一个待识别企业的得分信息；

将所述每一个待识别企业的得分信息，发送给与所述地区对应的终端设备进行显示。

进一步地，在从所述服务器中获取多个待识别企业中每一个待识别企业的第一特征信息之前，还包括：

从所述服务器中获取多个待训练企业中的每一个待训练企业的第二特征信息，其中，所述第二特征信息包括第一信息集合、第二信息集合和第三信息集合；所述第一信息集合中包括多个配对集，每一个所述配对集中包括待训练企业的企业信息与地区的地区信息；所述第二信息集合中包括每一个所述配对集的匹配度，所述匹配度用于表征配对集中的待训练企业与地区之间的匹配程度；所述第三信息集合中包括与每一个所述配对集对应的指示信息，所述指示信息用于指示与指示信息对应的配对集中的待训练企业所对应的地区；

将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中，以依次对所述待训练的决策树模型中的每一棵决策树进行训练，以得到具有判断规则的决策树模型，其中，所述判断规则用于对待识别企业进行分类，具有判断规则的决策树模型中还包括每一棵决策树中的每一个叶子节点的分数；

显示具有判断规则的决策树模型。

进一步地，在将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中之前，还包括：

对所述每一个待训练企业的第二特征信息进行第二特征预处理，得到所述每一个待训练企业的特征预处理之后的第二特征信息。

进一步地，所述第二特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

从所述服务器中获取待训练的决策树模型的超参数。

进一步地，所述企业信息包括以下特征中的一种或多种：企业所归属的行业类别、企业的管理者信息、企业的专利信息、企业的奖惩信息。

进一步地，所述地区信息包括以下特征中的一种或多种：人口信息、教育程度信息、消费水平信息、企业结构信息、国内生产总值GDP信息、地区成本信息、交通信息。

第二方面，本申请提供了一种电子设备，所述电子设备与服务器连接，所述电子设备包括：

第一获取单元，用于从所述服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，所述第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息；

第一处理单元，用于将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息，其中，所述决策树模型中包括N棵决策树，N为大于等于1的正整数；

排序单元，用于根据各所述得分信息，对各所述待识别企业进行排序；

确定单元，用于确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业，其中，M为大于等于1的正整数。

进一步地，所述电子设备，还包括：

第一推送单元，用于在所述确定单元确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业之后，将与所述地区匹配的企业，推送给与所述地区对应的终端设备。

进一步地，所述第一推送单元，具体用于：

进一步地，所述电子设备，还包括：

第二推送单元，用于在所述确定单元确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业之后，向与所述地区匹配的企业所对应的终端设备，发送所述地区的地区信息。

进一步地，所述电子设备，还包括：

第二处理单元，用于在所述第一处理单元将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中之前，对所述每一个待识别企业的第一特征信息进行第一特征预处理，得到所述每一个待识别企业的特征预处理之后的第一特征信息；

进一步地，所述第一处理单元，包括：

第一处理模块，用于将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，得到每一个待识别企业的分数信息，所述分数信息包括了待识别企业在每一棵决策树中被输出的分数；

第二处理模块，用于针对每一个待识别企业，对待识别企业在各棵决策树中被输出的分数进行线性加和处理，得到所述每一个待识别企业的得分信息；

发送模块，用于将所述每一个待识别企业的得分信息，发送给与所述地区对应的终端设备进行显示。

进一步地，所述电子设备，还包括：

第二获取单元，用于在所述第一获取单元从所述服务器中获取多个待识别企业中每一个待识别企业的第一特征信息之前，从所述服务器中获取多个待训练企业中的每一个待训练企业的第二特征信息，其中，所述第二特征信息包括第一信息集合、第二信息集合和第三信息集合；所述第一信息集合中包括多个配对集，每一个所述配对集中包括待训练企业的企业信息与地区的地区信息；所述第二信息集合中包括每一个所述配对集的匹配度，所述匹配度用于表征配对集中的待训练企业与地区之间的匹配程度；所述第三信息集合中包括与每一个所述配对集对应的指示信息，所述指示信息用于指示与指示信息对应的配对集中的待训练企业所对应的地区；

第三处理单元，用于将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中，以依次对所述待训练的决策树模型中的每一棵决策树进行训练，以得到具有判断规则的决策树模型，其中，所述判断规则用于对待识别企业进行分类，具有判断规则的决策树模型中还包括每一棵决策树中的每一个叶子节点的分数；

显示单元，用于显示具有判断规则的决策树模型。

进一步地，所述电子设备，还包括：

第四处理单元，用于在所述第三处理单元将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中之前，对所述每一个待训练企业的第二特征信息进行第二特征预处理，得到所述每一个待训练企业的特征预处理之后的第二特征信息。

进一步地，所述电子设备，还包括：

第三获取单元，用于在所述第三处理单元将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中之前，从所述服务器中获取待训练的决策树模型的超参数。

第三方面，本申请提供了一种电子设备，包括用于执行以上第一方面的任一方法各个步骤的单元或者手段(means)。

第四方面，本申请提供了一种电子设备，包括处理器、存储器以及计算机程序，其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现第一方面的任一方法。

第五方面，本申请提供了一种电子设备，包括用于执行以上第一方面的任一方法的至少一个处理元件或芯片。

第六方面，本申请提供了一种计算机程序，该计算程序在被处理器执行时用于执行以上第一方面的任一方法。

第七方面，本申请提供了一种计算机可读存储介质，其上存储有第六方面的计算机程序。

本申请提供的基于企业与地区的匹配方法、电子设备和存储介质，通过电子设备与服务器连接，电子设备可以执行以下过程，从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息；将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息，其中，决策树模型中包括N棵决策树；根据各得分信息，对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业。通过采用决策树模型对每一个待识别企业的第一特征信息进行分析，得到每一个待识别企业的得分信息，将得分较高的待识别企业，作为与待分析的地区之间匹配的企业。从而，采用决策树模型对企业与地区之间的匹配程度进行分析，可以客观、准确的分析出企业与地区之间匹配程度；并且，智能推荐方法可以实现自动高效，精准匹配，提高成功率；并且，本实施例提供的方法考虑到了企业的信息和地区的信息，考虑到了两者的关联性，可以快速得到企业与地区之间的匹配程度、快速的得到与地区之间匹配的企业，效率和准确率较高；不需要耗费大量的时间、人力、以及其他资源，降低了成本。可以从排序最靠前的企业开始招商，进而有利于快速、高效的确定出可以招商至地区的企业，便于地区的发展。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为本申请实施例提供的应用场景的示意图；

图2为本申请实施例提供的一种基于企业与地区的匹配方法的流程示意图；

图3为本申请实施例提供的另一种基于企业与地区的匹配方法的流程示意图；

图4为单个决策树的原理图一；

图5为单个决策树的原理图二；

图6为本申请实施例提供的又一种基于企业与地区的匹配方法的流程示意图；

图7为本申请提供的第一信息集合的示意图一；

图8为本申请提供的第一信息集合的示意图二；

图9为本申请实施例提供的一种电子设备的结构示意图；

图10为本申请实施例提供的另一种电子设备的结构示意图；

图11为本申请实施例提供的又一种电子设备的结构示意图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

需要指出的是，本申请实施例中涉及的名词或术语可以相互参考，不再赘述。

本申请具体的应用场景为：随着各个地区的发展，各个地区对于经济发展的需求也越来越多；进而，各个地区对于企业的招商的需求也越来越多，进而需要分析企业与地区之间匹配程度。

现有技术中，可以采用人工的方式对企业的资质、企业的信息进行分析，并且结合地区的需求，去确定企业与地区之间是否匹配。进而可以依据企业与地区之间是否匹配，去确定是否可以将企业招商至本地区内。

举例来说，现有技术中可以采用人工组团推荐的方式，企业的员工，可以抵达目的地区，对目的地区进行实地考察，并介绍企业的信息，进而人工的分析企业与地区之间是否匹配；以便于确定企业是否可以入驻该目的地区。

再举例来说，现有技术中还可以地区的人员，前往目的企业，对目的企业进行人工的考察和洽谈，进而人工的分析企业与地区之间是否匹配；以便于确定企业是否可以入驻该目的地区。

再举例来说，现有技术中还可以在目的地区长期的驻点，进而人工的为该地区进行地区与企业的匹配程度的分析。

再举例来说，现有技术中还可以在各类展会上，人工的对企业的产品进行观摩，进而企业的人员对产品进行介绍，地区的人员对地区的情况进行介绍，进而双方人工的分析地区与企业的匹配程度。

再举例来说，现有技术中还可以其他人工的方式，对地区与企业的匹配程度进行分析。

然而上述方式中，都是人工的分析企业与地区之间是否匹配，这样的方式并不客观，并且容易产生舞弊问题，并且人工的沟通方式也不客观、时间较长，进而无法客观、准确的分析出企业与地区之间匹配程度；并且，人工的分析企业与地区之间是否匹配，这样的方式的效率较低。并且，人工的分析方式，需要耗费大量的时间、人力、以及其他资源，进而成本较高。

本申请提供的基于企业与地区的匹配方法、电子设备和存储介质，旨在解决现有技术的如上技术问题。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

图1为本申请实施例提供的应用场景的示意图，如图1所示，提供了电子设备01、服务器02、地区所对应的终端设备03；电子设备01与服务器02连接，电子设备01与地区所对应的终端设备03连接。服务器02的个数可以为一个或多个；电子设备01可以从服务器02中获取数据；电子设备01可以向终端设备03发送推荐信息。

图2为本申请实施例提供的一种基于企业与地区的匹配方法的流程示意图。如图2所示，该方法包括：

S101、从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息。

一个示例中，企业信息包括以下特征中的一种或多种：企业所归属的行业类别、企业的管理者信息、企业的专利信息、企业的奖惩信息。

一个示例中，地区信息包括以下特征中的一种或多种：人口信息、教育程度信息、消费水平信息、企业结构信息、国内生产总值(Gross Domestic Product，简称GDP)信息、地区成本信息、交通信息。

在本实施例中，本实施例的执行主体可以为电子设备。

在需要对地区与各个企业之间的匹配程度进行分析，以确定是否可以将企业招商至该地区的时候，这些各个企业可以作为各个待识别企业。

服务器中已经从各个待识别企业的云端服务器中获取到了各个待识别企业各自的第一特征信息，进而电子设备可以向服务器发送获取指令；服务器可以根据获取指令，向电子设备返回各个待识别企业各自的第一特征信息。

或者，服务器为各个待识别企业的云端服务器，进而电子设备可以向各个云端服务器分别发送获取指令；每一个云端服务器可以根据获取指令，向电子设备返回每一个待识别企业各自的第一特征信息。

从而，电子设备可以获取到每一个待识别企业的第一特征信息。其中，每一个待识别企业的第一特征信息由以下信息构成：每一个待识别企业的企业信息、待分析的地区的地区信息。

第一特征信息，包括但不限于以下特征数据：企业经营数据、地区的宏观数据、地区的地方营商环境数据。企业经营数据构成了待识别企业的企业信息。地区的宏观数据、地区的地方营商环境数据构成了地区的地区信息。

举例来说，每一个待识别企业的企业经营数据，包括但不限于：企业的行业类别、管理者信息、企业的专利信息、企业的奖惩信息、企业所归属的行业的行业特征信息。例如，专利信息中包括了专利授权数量、专利被驳回的数量、专利诉讼的数量；行业特征信息为行业的企业数量、行业的地区分布。

例如，企业的行业类别为制药行业、互联网行业、食品行业、物流行业等等。

举例来说，每一个待识别企业对应的地区的宏观数据，包括但不限于：待分析的地区的GDP信息、人口信息、教育程度信息、消费水平信息、企业结构信息。例如，GDP信息为GDP增速信息，人口信息为人口数量和人口结构，消费水平信息为人均消费水平和消费结构，企业结构信息包括地区内的企业类型分布和地区内的企业数量。

举例来说，每一个待识别企业对应的地区的地方营商环境数据，包括但不限于：地区的税收优惠特征、地区成本信息、交通信息、政府服务效率。例如，地区成本信息包括了土地成本、人力成本。例如，交通信息报了交通便利程度、交通类型、交通设备的数量；交通类型为机场、高铁、地铁，交通设备的数量为机场的数量、高铁的数量、地铁的数量。例如，政府服务效率信息为证件办理时间。

一个示例中，电子设备从现有的查询系统的服务器中，获取每一个待识别企业的企业经营数据。例如，A企业的云端服务器，向查询服务器发送A企业的企业经营数据；进而，查询服务器可以存储A企业的企业经营数据；电子设备可以向查询服务器发送查询请求，进而查询服务器根据查询请求向电子设备返回A企业的企业经营数据；其中，A企业的企业经营数据包括了A企业所归属的行业类型、A企业所归属的行业特征、A企业的专利数量、A企业的行政处罚数量、A企业的诉讼数量、等等。

一个示例中，电子设备从现有的查询系统的服务器中，获取每一个待识别企业所对应的待分析地区的地方营商环境特征。例如，待分析地区B的云端服务器，向查询服务器发送待分析地区B的地方营商环境特征；进而，查询服务器可以存储待分析地区B的地方营商环境特征；电子设备可以向查询服务器发送查询请求，进而查询服务器根据查询请求向电子设备返回待分析地区B的地方营商环境特征；其中，待分析地区B的地方营商环境特征包括了地区B的税收优惠特征、地区B的土地成本、地区B的人力成本、地区B的交通便利程度、地区B的政府服务效率、等等。

一个示例中，电子设备从现有的查询系统的服务器中，获取每一个待识别企业所对应的待分析地区的地方宏观特征。例如，待分析地区B的云端服务器，向查询服务器发送待分析地区B的地方宏观特征；进而，查询服务器可以存储待分析地区B的地方宏观特征；电子设备可以向查询服务器发送查询请求，进而查询服务器根据查询请求向电子设备返回待分析地区B的地方宏观特征；其中，待分析地区B的地方宏观特征包括了GDP增速信息、人口结构信息、受教育程度信息、消费水平信息、等等。

S102、将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息，其中，决策树模型中包括N棵决策树，N为大于等于1的正整数。

在本实施例中，电子设备中已经训练好了一个成熟的决策树模型，其中，决策树模型由N棵相互独立的决策树构成。一个示例中，N＝100。每一棵决策树可以对待识别企业进行分析，进而决策树模型可以对每一个待识别企业进行分析，以得到每一个待识别企业的得分信息，得分信息表征了待分析地区与每一个待识别企业之间的匹配程度。

一个示例中，需要S个待识别企业进行分析，可以将S个待识别企业中的每一个待识别企业的第一特征信息，输入到决策树模型中；进而决策树模型可以对待识别企业的第一特征信息进行分析，得到待识别企业的得分信息。通过以上方式，可以得到S个待识别企业各自的得分信息。

一个示例中，决策树模型采用XGboost算法进行实现；其中，XGboost是一种开源算法。

S103、根据各得分信息，对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业，其中，M为大于等于1的正整数。

在本实施例中，由于S个待识别企业各自的得分信息，表征了待分析地区与待识别企业之间的匹配程度，电子设备可以依据得分信息所表征的数值的由高到低，对各待识别企业进行排序，进而得到排序后的各待识别企业。

然后，电子设备确定得分较高的待识别企业，是与待分析的地区之间是匹配的。一个示例中，电子设备确定排名为前M位的待识别企业，为与待分析的地区之间匹配的企业。

本实施例，通过电子设备与服务器连接，电子设备可以执行以下过程，从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息；将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息，其中，决策树模型中包括N棵决策树；根据各得分信息，对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业。通过采用决策树模型对每一个待识别企业的第一特征信息进行分析，得到每一个待识别企业的得分信息，将得分较高的待识别企业，作为与待分析的地区之间匹配的企业。从而，采用决策树模型对企业与地区之间的匹配程度进行分析，可以客观、准确的分析出企业与地区之间匹配程度；并且，智能推荐方法可以实现自动高效，精准匹配，提高成功率；并且，本实施例提供的方法考虑到了企业的信息和地区的信息，考虑到了两者的关联性，可以快速得到企业与地区之间的匹配程度、快速的得到与地区之间匹配的企业，效率和准确率较高；不需要耗费大量的时间、人力、以及其他资源，降低了成本。可以从排序最靠前的企业开始招商，进而有利于快速、高效的确定出可以招商至地区的企业，便于地区的发展。

图3为本申请实施例提供的另一种基于企业与地区的匹配方法的流程示意图。如图3所示，该方法包括：

S201、从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息。

一个示例中，地区信息包括以下特征中的一种或多种：人口信息、教育程度信息、消费水平信息、企业结构信息、GDP信息、地区成本信息、交通信息。

在本实施例中，本实施例的执行主体可以为电子设备。

本步骤可以参见图2所示的步骤S101，不再赘述。

S202、对每一个待识别企业的第一特征信息进行第一特征预处理，得到每一个待识别企业的特征预处理之后的第一特征信息。

一个示例中，第一特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

在本实施例中，电子设备在得到每一个待识别企业的第一特征信息之后，可以对每一个待识别企业的第一特征信息进行特征预处理，以对第一特征信息进行格式处理和数值调整；为了便于与训练过程中的特征预处理过程进行区分，将此时的特征预处理，称为第一特征预处理。

一个示例中，电子设备需要对每一个待识别企业的第一特征信息进行格式调整，使得第一特征信息可以被决策树模型识别；一个示例中，可以将第一特征信息的类型变量，处理成one-hot格式或embedding格式。

一个示例中，电子设备可以对每一个待识别企业的第一特征信息进行分析，以确定第一特征信息中各特征的数值是否缺失，在确定有的数值缺失的时候，电子设备可以对第一特征信息进行缺失值的填充；电子设备可以采用以下方式进行缺失值填充处理：填充默认值、填充均值、填充中位数、填充众数、填充K最近邻(k-Nearest Neighbor，简称KNN)数据、填充模型预测的值。

例如，对于填充默认值的方式，第一特征信息中包括了企业的注册资本信息；电子设备若检测到待识别企业的第一特征信息的注册资本信息中的数值缺失，则电子设备可以将一个预设的默认值，作为该注册资本信息的数值。

再例如，对于填充默认值的方式，第一特征信息中包括了企业的纳税人信息；电子设备若检测到待识别企业的第一特征信息的纳税人信息中的数值缺失，则电子设备可以将一个预设的默认值，作为该纳税人信息的数值。

再例如，对于填充均值的方式，第一特征信息中包括了企业的注册资本信息；电子设备若检测到待识别企业的第一特征信息的注册资本信息中的数值缺失，则电子设备可以计算各待识别企业的注册资本信息的数值的平均值，然后，电子设备将该平均值作为该注册资本信息的数值。

再例如，对于填充中位数的方式，第一特征信息中包括了地区成本信息；电子设备若检测到待识别企业的第一特征信息的地区成本信息中的数值缺失，则电子设备可以获取与待分析的地区相邻的各地区的地区成本信息；然后，电子设备由高到低将各地区的地区成本信息的数值进行排序，取排序为中间位置的地区成本信息的数值，作为待识别企业的第一特征信息的地区成本信息中的数值。

再例如，对于填充众数的方式，第一特征信息中包括了地区中企业个数最多的行业类别；电子设备若检测到待识别企业的企业个数最多的行业类别缺失，则电子设备可以获取与待分析的地区相邻的各地区的上述“企业个数最多的行业类别”；然后，电子设备确定各地区的上述“企业个数最多的行业类别”中出现次数最多的行业类别；然后，电子设备将出现次数最多的行业类别，作为待识别企业的企业个数最多的行业类别。

再例如，对于填充KNN数据的方式，第一特征信息中包括了地区的人口信息；电子设备若检测到待识别企业的第一特征信息的人口信息中的数值缺失，则电子设备可以获取与待分析的地区相邻的各地区的人口信息；然后，电子设备确定各地区的人口信息的数值，进行KNN计算，得到一个数值；然后，电子设备将计算所得到的数值，作为待识别企业的第一特征信息的人口信息的数值。

一个示例中，电子设备可以对每一个待识别企业的第一特征信息进行分析，以确定第一特征信息中各特征的数值是否出现异常，即确定是否出现异常值；在确定具有异常值的时候，电子设备可以对第一特征信息中的异常值进行修正。具体的，电子设备已经确定了各个企业所归属的行业类别，电子设备对每一种行业中的各企业的第一特征信息所包含的各特征进行分析，得到每一种特征的均值、标准差；电子设备判断第一特征信息中各特征的数值是否出现明显的偏离，例如，数值与预设的正常值之间的差距较大；然后，电子设备判断第一特征信息中特征的数值出现明显的偏离的时候，确定该特征的数值为异常值；电子设备已经获知了每一种特征的均值、标准差；从而，电子设备确定该异常值，大于一个第一预设值，该第一预设值为均值与3倍的标准差的和，则电子设备将该异常值，修正为第一预设值；电子设备确定该异常值，小于一个第二预设值，该第二预设值为均值减去3倍的标准差，则电子设备将该异常值，修正为第二预设值。

一个示例中，电子设备还可以对每一个待识别企业的第一特征信息进行分析，将第一特征信息中的低阶特征，处理为高阶特征。例如，可以对第一特征信息中的低阶特征进行以下处理中的任意一种或多种：与运算、或运算、非运算。其中，低阶特征例如为企业信息中的基础信息、地区信息中的基础信息。例如，低阶特征为企业的专利信息、企业的奖惩信息、人口信息、教育程度信息、消费水平信息、企业结构信息、GDP信息、地区成本信息、交通信息、等等。

S203、将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，得到每一个待识别企业的分数信息，分数信息包括了待识别企业在每一棵决策树中被输出的分数；其中，决策树模型中包括N棵决策树，N为大于等于1的正整数。

一个示例中，每一棵决策树中包括多个节点，每一个非叶子节点的节点具有判断规则，其中，判断规则用于对待识别企业进行分类。

在本实施例中，电子设备已经得到了成熟的决策树模型，决策树模型由N棵相互独立的决策树构成。一个示例中，N＝100。一个示例中，决策树为二叉树。

每一棵决策树中包括多个节点。具体的，每一棵决策树具有S层的节点，S为大于等于2的正整数，即，每一棵决策树的深度为S；每一棵决策树的深度可以相同或不同；每一棵决策树具有一个根节点、一个或多个父节点、多个叶子节点，叶子节点为决策树的最底层的节点。可知，每一棵决策树具有多个非叶子节点。决策树中的每一个叶子节点被配置有分数。

为了对待识别企业进行分析，每一棵决策树的每一个非叶子节点的节点上，配置了判断规则；判断规则用于对第一特征信息中的特征进行分析，以将待识别企业分配到各节点上，即，判断规则用于对待识别企业进行分类。

对于每一个待识别企业来说，将待识别企业的第一特征信息，输入预设的决策树模型中；此时，是将待识别企业的第一特征信息，输入到了决策树模型中的每一棵决策树中；每一棵决策树依据决策树中的非叶子节点中的判断规则，对待识别企业的第一特征信息进行分析，进而可以将待识别企业分配到决策树中的某一个叶子节点上；由于决策树中的每一个叶子节点被配置有分数，可以将待识别企业被分配到决策树中的叶子节点的分数，作为了待识别企业在决策树中被输出的分数，即，作为待识别企业的分数。

举例来说，决策树模型由N棵相互独立的决策树构成，每一棵决策树具有S层的节点，即，每一棵决策树的深度为S；每一棵决策树具有多个非叶子节点、多个叶子节点，其中，非叶子节点中包括根节点。待识别企业的第一特征信息输入到决策树模型中，决策树模型中的每一棵决策树可以采用以下方式对待识别企业进行分析。图4为单个决策树的原理图一，如图4所示，将待识别企业的第一特征信息输入到了该决策树中，在根节点A1中具有判断规则a1，判断规则a1为判断第一特征信息中的特征a1、特征b1是否符合一定要求，若符合，则将待识别企业分配至节点B1，若不符合，则将待识别企业分配至节点C1；在节点B1中具有判断规则b1，判断规则b1为判断第一特征信息中的特征b1、特征c1是否符合一定要求，若符合，则将待识别企业分配至叶子节点D1，若不符合，则将待识别企业分配至叶子节点E1；在节点C1中具有判断规则c1，判断规则c1为判断第一特征信息中的特征d1、特征e1是否符合要求a1，或者符合要求b1、或者符合要求b1，若符合要求a1，则将待识别企业分配至叶子节点F1，若符合要求b1，则将待识别企业分配至叶子节点G1，若符合要求c1，则将待识别企业分配至叶子节点H1。在每一个叶子节点中具有分数，即，叶子节点D1的分数为分数d1，叶子节点E1的分数为分数e1，叶子节点F1的分数为分数f1，叶子节点G1的分数为分数g1，叶子节点H1的分数为分数h1；从而在将待识别企业分配至决策树的叶子节点上之后，将叶子节点的分数作为待识别企业的分数。从而，对于每一个待识别企业，可以得到待识别企业的N个分数。

再举例来说，决策树模型由N棵相互独立的决策树构成，每一棵决策树具有S层的节点，即，每一棵决策树的深度为S；每一棵决策树具有多个非叶子节点、多个叶子节点，其中，非叶子节点中包括根节点；每一棵决策树为二叉树。待识别企业的第一特征信息输入到决策树模型中，决策树模型中的每一棵决策树可以采用以下方式对待识别企业进行分析。图5为单个决策树的原理图二，如图5所示，将待识别企业的第一特征信息输入到了该决策树中，在根节点A2中具有判断规则a2，判断规则a2为判断第一特征信息中的特征a2、特征b2是否符合一定要求，若符合，则将待识别企业分配至节点B2，若不符合，则将待识别企业分配至节点C2；在节点B2中具有判断规则b2，判断规则b2为判断第一特征信息中的特征b2、特征c2是否符合一定要求，若符合，则将待识别企业分配至叶子节点D2，若不符合，则将待识别企业分配至叶子节点E2；在节点C2中具有判断规则c2，判断规则c2为判断第一特征信息中的特征d2、特征e2是否一定要求，若符合，则将待识别企业分配至叶子节点F2，若不符合，则将待识别企业分配至叶子节点G2。在每一个叶子节点中具有分数，即，叶子节点D2的分数为分数d2，叶子节点E2的分数为分数e2，叶子节点F2的分数为分数f2，叶子节点G2的分数为分数g2；从而在将待识别企业分配至决策树的叶子节点上之后，将叶子节点的分数作为待识别企业的分数。从而，对于每一个待识别企业，可以得到待识别企业的N个分数。

S204、针对每一个待识别企业，对待识别企业在各棵决策树中被输出的分数进行线性加和处理，得到每一个待识别企业的得分信息。

在本实施例中，由于对于每一个待识别企业，输入到了决策树模型中的N棵决策树中，可以得到待识别企业的N个分数。针对于每一个待识别企业，电子设备需要对待识别企业在各棵决策树中被输出的分数，进行线性加和处理，即，对待识别企业的N个分数进行线性加和处理，从而决策树模型可以输出每一个待识别企业的一个得分信息。可知，每一个待识别企业的一个得分信息是N个分数的线性加和计算的结果。线性加和是一种常用的计算方法。

一个示例中，电子设备可以显示每一个待识别企业的得分信息。

采用本实施例的方法，针对每一个待识别企业，得到每一个待识别企业的得分信息；得分信息表征的数值越高的企业，与地区之间的匹配程度越高。

举例来说，将待识别企业A的第一特征信息，输入到决策树模型中，得到N个分数；然后对N个分数进行线性计算，得到待识别企业A的得分信息；其中，待识别企业A的第一特征信息中包括待识别企业A的企业信息、地区X的地区信息。将待识别企业B的第一特征信息，输入到决策树模型中，得到N个分数；然后对N个分数进行线性计算，得到待识别企业B的得分信息；其中，待识别企业B的第一特征信息中包括待识别企业B的企业信息、地区X的地区信息。以此类推。得到多个待识别企业的得分信息，然后根据得分信息表征的数值的由高到低，对多个待识别企业进行排序；排序越靠前的待识别企业与地区X的匹配程度越高，排序越靠前的待识别企业越有可能被地区X招商成功。

一个示例中，在步骤S204之后，还可以包括步骤S205、将每一个待识别企业的得分信息，发送给与地区对应的终端设备进行显示。

在本实施例中，电子设备可以将得到的每一个待识别企业的得分信息，发送给与地区对应的终端设备；与地区对应的终端设备可以显示每一个待识别企业的得分信息，从而地区的人员可以获知每一个待识别企业的得分信息，进而获知每一个待识别企业与地区之间的匹配程度，得分信息表征的数值越高的企业，与地区之间的匹配程度越高。

S206、根据各得分信息，对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业，其中，M为大于等于1的正整数。

在本实施例中，本步骤可以参见图2所示的步骤S103，不再赘述。

在步骤S206之后，还可以包括以下步骤：

S207、将与地区匹配的企业，推送给与地区对应的终端设备。

一个示例中，步骤S207具体包括：将与地区匹配的企业的企业标识，以以下方式中的任意一种或多种发送给与地区对应的终端设备：文字信息、语音信息、图像信息。

在本实施例中，由于得分信息表征的数值越高的企业，与地区之间的匹配程度越高，从而，电子设备可以将得分信息排名为前M位的待识别企业，为与地区匹配的企业；然后，电子设备将与地区匹配的企业，发送给与地区对应的终端设备，一个示例中，电子设备可以将与地区匹配的企业的企业标识，发送给与地区对应的终端设备。

例如，以文字信息、语音信息、图像信息等方式，将与地区匹配的企业的企业标识，发送给与地区对应的终端设备；进而，与地区对应的终端设备可以以文字信息、语音信息、图像信息等方式，显示企业的企业标识。

在步骤S206之后，还可以包括以下步骤：

S208、向与地区匹配的企业所对应的终端设备，发送地区的地区信息。

在本实施例中，电子设备，还可以将地区的地区信息，发送给与地区匹配的企业所对应的终端设备。一个示例中，电子设备，以文字信息、语音信息、图像信息等方式，将地区的地区信息，发送给与地区匹配的企业所对应的终端设备。

本实施例，在以上实施例的基础上，采用决策树模型对每一个待识别企业的第一特征信息进行分析，得到每一个待识别企业的得分信息，将得分较高的待识别企业，作为与待分析的地区之间匹配的企业。从而，采用决策树模型对企业与地区之间的匹配程度进行分析，可以客观、准确的分析出企业与地区之间匹配程度；并且，智能推荐方法可以实现自动高效，精准匹配，提高成功率；并且，本实施例提供的方法考虑到了企业的信息和地区的信息，考虑到了两者的关联性，可以快速得到企业与地区之间的匹配程度、快速的得到与地区之间匹配的企业，效率和准确率较高；不需要耗费大量的时间、人力、以及其他资源，降低了成本。可以从排序最靠前的企业开始招商，进而有利于快速、高效的确定出可以招商至地区的企业，便于地区的发展。并且，可以将与地区匹配的企业，推送给与地区对应的终端设备，进而与地区对应的终端设备可以获知与地区匹配的企业；并且，还可以将每一个待识别企业的得分信息，发送给与地区对应的终端设备进行显示，从而，与地区对应的终端设备可以从得分信息较高的企业开始招商，可以快速的确定出适合进行招商的企业。

图6为本申请实施例提供的又一种基于企业与地区的匹配方法的流程示意图。如图6所示，该方法包括：

S301、从服务器中获取多个待训练企业中的每一个待训练企业的第二特征信息，其中，第二特征信息包括第一信息集合、第二信息集合和第三信息集合；第一信息集合中包括多个配对集，每一个配对集中包括待训练企业的企业信息与地区的地区信息；第二信息集合中包括每一个配对集的匹配度，匹配度用于表征配对集中的待训练企业与地区之间的匹配程度；第三信息集合中包括与每一个配对集对应的指示信息，指示信息用于指示与指示信息对应的配对集中的待训练企业所对应的地区。

在本实施例中，本实施例的执行主体可以为电子设备。在对每一个待识别企业进行分析之前，需要得到成熟的决策树模型。

首先，电子设备需要每一个待训练企业的第二特征信息。

第二特征信息涵盖了多个待训练企业中的每一个待训练企业的企业信息、多个地区中的每一个地区的地区信息、待训练企业与地区之间的匹配程度、待训练企业与地区之间的对应关系。为了便于决策树的训练、以及对待训练企业与地区进行分析，对第二特征信息中数据的构成进行以下设计。

第二特征信息中包括了第一信息集合、第二信息集合和第三信息集合。

第一信息集合中包括了多个配对集，每一个配对集由待训练企业的企业信息、一个地区的地区信息构成。例如，图7为本申请提供的第一信息集合的示意图一，如图7所示，第一信息集合中包括配对集A、配对集B、配对集C、配对集D和配对集E，其中，配对集A中包括了待训练企业A的企业信息、甲地区的地区信息，配对集B中包括了待训练企业A的企业信息、乙地区的地区信息，配对集C中包括了待训练企业A的企业信息、丙地区的地区信息，配对集D中包括了待训练企业B的企业信息、甲地区的地区信息，配对集E中包括了待训练企业B的企业信息、乙地区的地区信息。从而，可以将每一个配对集构成一个矩阵X的每一行，进而得到一个矩阵X，即，第一信息集合为一个矩阵X.矩阵X的每一行包括了一个待训练企业的企业信息、一个地区的地区信息；矩阵X的每一列为企业信息和地区信息中的一种特征。

例如，图8为本申请提供的第一信息集合的示意图二，如图8所示，矩阵X的列1为企业信息中的特征a，矩阵X的列2为企业信息中的特征b，矩阵X的列3为企业信息中的特征c，矩阵X的列4为地区信息中的特征d，矩阵X的列5为地区信息中的特征e，矩阵X的第一行包括了待训练企业A的特征a、待训练企业A的特征b、待训练企业A的特征c、甲地区的特征d、甲地区的特征e，矩阵X的第二行包括了待训练企业A的特征a、待训练企业A的特征b、待训练企业A的特征c、乙地区的特征d、乙地区的特征e，矩阵X的第三行包括了待训练企业A的特征a、待训练企业A的特征b、待训练企业A的特征c、丙地区的特征d、丙地区的特征e，矩阵X的第四行包括了待训练企业B的特征a、待训练企业B的特征b、待训练企业B的特征c、甲地区的特征d、甲地区的特征e，矩阵X的第五行包括了待训练企业B的特征a、待训练企业B的特征b、待训练企业B的特征c、乙地区的特征d、乙地区的特征e。

第二信息集合中包括上述每一个配对集的匹配度，匹配度表征出配对集中的待训练企业与地区之间的匹配程度。其中，匹配度可以取值为1或0；在匹配度的取值为1时，匹配度表征配对集中的待训练企业与地区之间匹配，即，该地区适合将该待训练企业进行招商；在匹配度的取值为0时，匹配度表征配对集中的待训练企业与地区之间不匹配，即，该地区不适合将该待训练企业进行招商。从而，各个配对集的匹配度可以构成一个向量Y；向量Y的长度，为上述矩阵X的行数；并且，向量Y中的每一个元素，是与矩阵X的每一行所对应的。上述匹配度还可以称为标签；可知，匹配度表征了待训练企业是否可以被成功招商。

例如，对于图8所示的矩阵X，向量Y的第一个元素为匹配度A，匹配度A表征待训练企业A与甲地区之间是否匹配；向量Y的第二个元素为匹配度B，匹配度B表征待训练企业A与乙地区之间是否匹配；向量Y的第三个元素为匹配度C，匹配度C表征待训练企业A与丙地区之间是否匹配；向量Y的第四个元素为匹配度D，匹配度D表征待训练企业B与甲地区之间是否匹配；向量Y的第五个元素为匹配度E，匹配度E表征待训练企业B与乙地区之间是否匹配。

第三信息集合中包括多个指示信息，每一个指示信息与每一个配对集之间一一对应；指示信息用于指示配对集中的待训练企业所对应的地区，或者指示配对集中的地区所对应的企业，即，指示信息指示出了第一信息集合中每一个地区与哪些待训练企业对应，或者指示出了第一信息集合中每一个待训练企业与哪些地区对应。从而，上述各个指示信息可以构成一个向量Z；向量Z的长度与上述向量Y的长度相同；向量Z中的每一个元素为每一个指示信息，向量Z中的每一个元素标识出了矩阵X的每一个行中的地区与哪个待训练企业之间有关联，即，标识出了矩阵X的每一个行中的地区与哪个待训练企业之间对应；或者，向量Z中的每一个元素标识出了矩阵X的每一个行中的待训练企业与哪个地区之间有关联，即，标识出了矩阵X的每一行中的待训练企业与哪个地区之间对应。

一个示例中，可以为每个不同地区分配一个全局唯一的编号，然后根据第一信息集合中配对集中的地区信息，为每一个配对集设置一个组号，该组号为该配对集中的地区的编号。例如，根据图8的示例，总共有甲、乙、丙三个不同的地区，则可以为地区甲分配编号1，地区乙分配编号2，地区丙分配编号3。据此，可以得到一个向量Z＝[1,2,3,1,2,…]，向量Z中的第一元素标识出了矩阵X的第一行中甲地区，属于组1；向量Z中的第二元素标识出了矩阵X的第二行中乙地区，属于组2；向量Z中的第三元素标识出了矩阵X的第三行中丙地区，属于组3；向量Z中的第四元素标识出了矩阵X的第四行中甲地区，属于组1；向量Z中的第五元素标识出了矩阵X的第四行中乙地区，属于组2。

上述样本数据(X，Y，Z)可以被进行特征预处理之后，输入到决策树模型中；样本数据(X，Y，Z)的数据组织方式，符合决策树模型的要求。

服务器中已经从各个待训练企业的云端服务器中获取到了各个待训练企业各自的第二特征信息，进而电子设备可以向服务器发送获取指令；服务器可以根据获取指令，向电子设备返回各个待训练企业各自的第二特征信息。

或者，服务器为各个待训练企业的云端服务器，进而电子设备可以向各个云端服务器分别发送获取指令；每一个云端服务器可以根据获取指令，向电子设备返回每一个待训练企业各自的第二特征信息。

从而，电子设备可以获取到每一个待训练企业的第二特征信息。

第二特征信息中的第一信息集合中的特征，包括但不限于以下特征数据：企业经营数据、地区的宏观数据、地区的地方营商环境数据。企业经营数据构成了待训练企业的企业信息。地区的宏观数据、地区的地方营商环境数据构成了地区的地区信息。

举例来说，每一个待训练企业的企业经营数据，包括但不限于：企业的行业类别、管理者信息、企业的专利信息、企业的奖惩信息、企业所归属的行业的行业特征信息。

举例来说，每一个待训练企业对应的每一个地区的宏观数据，包括但不限于：待分析的地区的GDP信息、人口信息、教育程度信息、消费水平信息、企业结构信息。

举例来说，每一个待训练企业对应的每一个地区的地方营商环境数据，包括但不限于：地区的税收优惠特征、地区成本信息、交通信息、政府服务效率。

S302、对每一个待训练企业的第二特征信息进行第二特征预处理，得到每一个待训练企业的特征预处理之后的第二特征信息。

一个示例中，第二特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

在本实施例中，电子设备在得到每一个待训练企业的第二特征信息之后，可以对每一个待训练企业的第二特征信息进行特征预处理，以对第二特征信息进行格式处理和数值调整。

一个示例中，电子设备需要对每一个待训练企业的第二特征信息进行格式调整，使得第二特征信息可以被决策树模型识别；一个示例中，可以将第二特征信息的类型变量，处理成one-hot格式或embedding格式。

一个示例中，电子设备可以对每一个待训练企业的第二特征信息进行分析，以确定第二特征信息中各特征的数值是否缺失，在确定有的数值缺失的时候，电子设备可以对第二特征信息进行缺失值的填充；电子设备可以采用以下方式进行缺失值填充处理：填充默认值、填充均值、填充中位数、填充众数、填充KNN数据、填充模型预测的值。

一个示例中，电子设备可以对每一个待训练企业的第二特征信息进行分析，以确定第二特征信息中各特征的数值是否出现异常，即确定是否出现异常值；在确定具有异常值的时候，电子设备可以对第二特征信息中的异常值进行修正。

一个示例中，电子设备还可以对每一个待训练企业的第二特征信息进行分析，将第二特征信息中的低阶特征，处理为高阶特征。

本步骤的具体示例，可以参见图3所示的步骤S202，不再赘述。

S303、从服务器中获取待训练的决策树模型的超参数。

一个示例中，超参数包括但不限于以下参数中的一种或多种：待训练的决策树模型中的决策树的个数、每一棵决策树的最大深度、每一棵决策树中的叶子节点的最大个数。

在本实施例中，在对决策树模型进行训练之前，还需要获取到决策树模型的超参数。超参数包括但不限于以下参数中的一种或多种：决策树模型中的决策树的个数、每一棵决策树的最大深度、决策树中的最大叶子节点个数。不同的超参数配置会导致不同的决策树模型效果。

电子设备可以向服务器发送参数获取指令，服务器可以向电子设备发送决策树模型的超参数；或者，用户可以向电子设备中输入决策树模型的超参数。电子设备可以获取到不同的超参数的配置，然后根据不同的超参数对决策树模型进行训练，对训练后的决策树模型进行测试，以得到最佳的超参数配置。

S304、将各待训练企业的第二特征信息，输入至待训练的决策树模型中，以依次对待训练的决策树模型中的每一棵决策树进行训练，以得到具有判断规则的决策树模型，其中，判断规则用于对待识别企业进行分类，具有判断规则的决策树模型中还包括每一棵决策树中的每一个叶子节点的分数。

在本实施例中，电子设备将各待训练企业的第二特征信息，输入至待训练的决策树模型中，决策树模型中配置有上述超参数。

决策树模型包括了N棵决策树，进而电子设备依据各待训练企业的第二特征信息，依次对每一棵决策树进行训练；进而可以得到每一棵成熟的决策树，每一棵成熟的决策树中的非叶子节点中具有判断规则，判断规则用于对待识别企业进行分类；每一棵成熟的决策树中的每一个叶子节点具有分数。在训练过程中，还可以结合N棵决策树为每一个待训练企业所赋予的分数，为每一个待训练企业在N棵决策树上的分数进行线性加和处理，进而可以得到每一个待训练企业的得分信息；在训练之后，也可以得到线性加和处理所采用的参数；其中，每一个待训练企业的分数为每一个待训练企业在决策树上的被分配的叶子节点的分数。在训练过程中，在对一颗决策树进行训练之后，就不再对该决策树进行变化了，进而依次对N棵决策树中的每一棵决策树进行训练；可知，已经训练好的决策树中的叶子节点的分数，不会被后续未训练的决策树所影响。

并且，在训练过程中，可以采用现有的人工智能模型的损失函数，或者设计新的损失函数。一个示例中，决策树为二叉树；决策树模型的训练过程便是构建N棵决策树，并使得预测错误率最低的过程；这里的预测错误率，指的是损失函数，即，需要顺序的构建一系列的二叉树，使得损失函数最小。

通过以上方式，得到成熟的决策树模型，即，得到具有判断规则的决策树模型。

S305、显示具有判断规则的决策树模型。

在本实施例中，电子设备还可以将成熟的决策树模型，显性的显示出来。成熟的决策树模型由N棵成熟的决策树构成。决策树中包括多个非叶子节点和多个叶子节点，每一个非叶子节点上具有判断规则，每一个叶子节点上具有分数。进而，使得用户可以直观的观测到后续的待识别企业的识别过程。

S306、从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息。

在本实施例中，本步骤可以参见图2所示的步骤S101，不再赘述。

S307、将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息，其中，决策树模型中包括N棵决策树，N为大于等于1的正整数。

在本实施例中，本步骤可以参见图2所示的步骤S102，不再赘述。

S308、根据各得分信息，对各待识别企业进行排序，并确定得分信息排名为前M位的待识别企业，为与地区匹配的企业，其中，M为大于等于1的正整数。

在本实施例中，本步骤可以参见图2所示的步骤S103，不再赘述。并且，上述步骤S306-S308，可以参见图3所示的各步骤，不再赘述。

一个示例中，可以将上述特征信息、决策树模型，针对行业进行分析。具体的，针对行业A，可以只采用行业A下的各企业的第二特征信息，对决策树模型进行训练，得到针对于行业A的决策树模型；然后，针对地区X，只获取行业A下的各待识别企业的第一特征信息；将行业A下的各待识别企业的第一特征信息，输入到行业A的决策树模型中，得到行业A下的各待识别企业的得分信息；并且，根据得分信息所表征的数值的由高到低，对行业A下的各待识别企业进行排序。

本实施例，通过将各待训练企业的第二特征信息，输入至待训练的决策树模型中，以依次对待训练的决策树模型中的每一棵决策树进行训练，以得到具有判断规则的决策树模型，其中，判断规则用于对待识别企业进行分类，具有判断规则的决策树模型中还包括每一棵决策树中的每一个叶子节点的分数。进而可以根据具有判断规则的决策树模型，对每一个待识别企业的第一特征信息进行分析，得到每一个待识别企业与地区之间的匹配程度。可以得到待识别企业的得分信息的排序，可以从排序最靠前的企业开始招商，进而有利于快速、高效的确定出可以招商至地区的企业，便于地区的发展。

本申请实施例提供的再一种基于企业与地区的匹配方法，首先，电子设备可以向服务器发送第一获取指令，第一获取指令用于指示获取多个待训练企业中的每一个待训练企业的第二特征信息；服务器根据第一获取指令，向电子设备发送多个待训练企业中的每一个待训练企业的第二特征信息。

然后，电子设备将各待训练企业的第二特征信息，输入至待训练的决策树模型中，得到成熟的决策树模型；电子设备可以显示决策树模型。

然后，电子设备向服务器发送第二获取指令，第二获取指令用于指示获取多个待识别企业中每一个待识别企业的第一特征信息；服务器根据第二获取指令，向电子设备返回多个待识别企业中每一个待识别企业的第一特征信息。

然后，电子设备将每一个待识别企业的第一特征信息，分别输入成熟的决策树模型中，输出每一个待识别企业的得分信息；电子设备可以显示每一个待识别企业的得分信息。

然后，电子设备确定得分信息较高的M个待识别企业，为与地区匹配的企业。

然后，电子设备将与地区匹配的企业的企业标识，发送给与地区对应的终端设备；与地区对应的终端设备采用文字方式、语音方式、图像方式等显示企业标识。并且，电子设备还可以将地区的地区信息，发送给与地区匹配的企业所对应的终端设备。

图9为本申请实施例提供的一种电子设备的结构示意图，如图9所示，电子设备与服务器连接，本实施例的电子设备可以包括：

第一获取单元31，用于从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息，其中，第一特征信息中包括待识别企业的企业信息、与待识别企业对应的地区的地区信息。

第一处理单元32，用于将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出每一个待识别企业的得分信息，其中，决策树模型中包括N棵决策树，N为大于等于1的正整数。

排序单元33，用于根据各得分信息，对各待识别企业进行排序。

确定单元34，用于确定得分信息排名为前M位的待识别企业，为与地区匹配的企业，其中，M为大于等于1的正整数。

本实施例的电子设备可执行上述任一实施例提供的基于企业与地区的匹配方法，其实现原理和技术效果相类似，此处不再赘述。

图10为本申请实施例提供的另一种电子设备的结构示意图，在图9所示实施例的基础上，如图10所示，本实施例的电子设备，还可以包括：

第一推送单元41，用于在确定单元34确定得分信息排名为前M位的待识别企业，为与地区匹配的企业之后，将与地区匹配的企业，推送给与地区对应的终端设备。

第一推送单元41，具体用于：

将与地区匹配的企业的企业标识，以以下方式中的任意一种或多种发送给与地区对应的终端设备：文字信息、语音信息、图像信息。

本实施例提供的电子设备，还包括：

第二推送单元42，用于在确定单元34确定得分信息排名为前M位的待识别企业，为与地区匹配的企业之后，向与地区匹配的企业所对应的终端设备，发送地区的地区信息。

本实施例提供的电子设备，还包括：

第二处理单元43，用于在第一处理单元32将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中之前，对每一个待识别企业的第一特征信息进行第一特征预处理，得到每一个待识别企业的特征预处理之后的第一特征信息。

其中，第一特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

每一棵决策树中包括多个节点，每一个非叶子节点的节点具有判断规则，其中，判断规则用于对待识别企业进行分类。

第一处理单元32，包括：

第一处理模块321，用于将每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，得到每一个待识别企业的分数信息，分数信息包括了待识别企业在每一棵决策树中被输出的分数。

第二处理模块322，用于针对每一个待识别企业，对待识别企业在各棵决策树中被输出的分数进行线性加和处理，得到每一个待识别企业的得分信息。

发送模块323，用于将每一个待识别企业的得分信息，发送给与地区对应的终端设备进行显示。

本实施例提供的电子设备，还包括：

第二获取单元44，用于在第一获取单元31从服务器中获取多个待识别企业中每一个待识别企业的第一特征信息之前，从服务器中获取多个待训练企业中的每一个待训练企业的第二特征信息，其中，第二特征信息包括第一信息集合、第二信息集合和第三信息集合；第一信息集合中包括多个配对集，每一个配对集中包括待训练企业的企业信息与地区的地区信息；第二信息集合中包括每一个配对集的匹配度，匹配度用于表征配对集中的待训练企业与地区之间的匹配程度；第三信息集合中包括与每一个配对集对应的指示信息，指示信息用于指示与指示信息对应的配对集中的待训练企业所对应的地区。

第三处理单元45，用于将各待训练企业的第二特征信息，输入至待训练的决策树模型中，以依次对待训练的决策树模型中的每一棵决策树进行训练，以得到具有判断规则的决策树模型，其中，判断规则用于对待识别企业进行分类，具有判断规则的决策树模型中还包括每一棵决策树中的每一个叶子节点的分数。

显示单元46，用于显示具有判断规则的决策树模型。

本实施例提供的电子设备，还包括：

第四处理单元47，用于在第三处理单元45将各待训练企业的第二特征信息，输入至待训练的决策树模型中之前，对每一个待训练企业的第二特征信息进行第二特征预处理，得到每一个待训练企业的特征预处理之后的第二特征信息。

其中，第二特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

本实施例提供的电子设备，还包括：

第三获取单元48，用于在第三处理单元45将各待训练企业的第二特征信息，输入至待训练的决策树模型中之前，从服务器中获取待训练的决策树模型的超参数。

企业信息包括以下特征中的一种或多种：企业所归属的行业类别、企业的管理者信息、企业的专利信息、企业的奖惩信息。

地区信息包括以下特征中的一种或多种：人口信息、教育程度信息、消费水平信息、企业结构信息、GDP信息、地区成本信息、交通信息。

图11为本申请实施例提供的又一种电子设备的结构示意图，如图11所示，本申请实施例提供了一种电子设备，可以用于执行图2、图3、图6所示实施例中电子设备的动作或步骤，具体包括：处理器2701，存储器2702和通信接口2703。

存储器2702，用于存储计算机程序。

处理器2701，用于执行存储器2702中存储的计算机程序，以实现图2、图3、图6所示实施例中电子设备的动作，不再赘述。

可选的，电子设备还可以包括总线2704。其中，处理器2701、存储器2702以及通信接口2703可以通过总线2704相互连接；总线2704可以是外设部件互连标准(PeripheralComponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture，简称EISA)总线等。上述总线2704可以分为地址总线、数据总线和控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请实施例中，上述各实施例之间可以相互参考和借鉴，相同或相似的步骤以及名词均不再一一赘述。

或者，以上各个模块的部分或全部也可以通过集成电路的形式内嵌于该电子设备的某一个芯片上来实现。且它们可以单独实现，也可以集成在一起。即以上这些模块可以被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，简称ASIC)，或，一个或多个微处理器(Digital Singnal Processor，简称DSP)，或，一个或者多个现场可编程门阵列(FieldProgrammable Gate Array，简称FPGA)等。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器2702，上述指令可由上述电子设备的处理器2701执行以完成上述方法。例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述基于企业与地区的匹配方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、终端设备或数据中心通过有线(例如，同轴电缆、光纤、数字用户线(digitalsubscriber line，DSL))或无线(例如，红外、无线、微波等)方式向另一个网站站点、计算机、终端设备或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的终端设备、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如，固态硬盘(solid state disk，SSD))等。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims

1.一种基于企业与地区的匹配方法，其特征在于，所述方法应用于电子设备，所述电子设备与服务器连接，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业之后，还包括：

3.根据权利要求2所述的方法，其特征在于，将与所述地区匹配的企业，推送给与所述地区对应的终端设备，包括：

4.根据权利要求1所述的方法，其特征在于，在确定得分信息排名为前M位的待识别企业，为与所述地区匹配的企业之后，还包括：

5.根据权利要求1所述的方法，其特征在于，在将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息之前，还包括：

6.根据权利要求5所述的方法，其特征在于，所述第一特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

7.根据权利要求1所述的方法，其特征在于，每一棵决策树中包括多个节点，每一个非叶子节点的节点具有判断规则，其中，所述判断规则用于对待识别企业进行分类。

8.根据权利要求1所述的方法，其特征在于，将所述每一个待识别企业的第一特征信息，分别输入预设的决策树模型中，输出所述每一个待识别企业的得分信息，包括：

9.根据权利要求1-8任一项所述的方法，其特征在于，在从所述服务器中获取多个待识别企业中每一个待识别企业的第一特征信息之前，还包括：

显示具有判断规则的决策树模型。

10.根据权利要求9所述的方法，其特征在于，在将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中之前，还包括：

11.根据权利要求10所述的方法，其特征在于，所述第二特征预处理包括以下任意一种或多种：数据格式处理、缺失值填充处理、异常值修正处理、高阶特征生成处理。

12.根据权利要求9所述的方法，其特征在于，在将各所述待训练企业的第二特征信息，输入至待训练的决策树模型中之前，还包括：

从所述服务器中获取待训练的决策树模型的超参数。

13.根据权利要求1-8任一项所述的方法，其特征在于，所述企业信息包括以下特征中的一种或多种：企业所归属的行业类别、企业的管理者信息、企业的专利信息、企业的奖惩信息。

14.根据权利要求1-8任一项所述的方法，其特征在于，所述地区信息包括以下特征中的一种或多种：人口信息、教育程度信息、消费水平信息、企业结构信息、国内生产总值GDP信息、地区成本信息、交通信息。

15.一种电子设备，其特征在于，所述电子设备与服务器连接，所述电子设备包括：

16.一种电子设备，其特征在于，包括：处理器、存储器以及计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1-14任一项所述的方法。

17.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器执行以实现如权利要求1-14任一项所述的方法。