CN116070019A - 一种基于大数据的智能招商推荐方法、系统和可读存储介质 - Google Patents
一种基于大数据的智能招商推荐方法、系统和可读存储介质 Download PDFInfo
- Publication number
- CN116070019A CN116070019A CN202211702970.7A CN202211702970A CN116070019A CN 116070019 A CN116070019 A CN 116070019A CN 202211702970 A CN202211702970 A CN 202211702970A CN 116070019 A CN116070019 A CN 116070019A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- information
- recruitment
- recommended
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007115 recruitment Effects 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 8
- 238000012163 sequencing technique Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000005065 mining Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000008520 organization Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的一种基于大数据的智能招商推荐方法、系统和可读存储介质,包括:利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;将推荐企业信息与招商项目信息进行比较,并得到相似度信息;将相似度信息与预设相似度阈值进行比较,得到偏差率;判断偏差率是否大于预定偏差率阈值;若大于,则剔除对应的推荐企业;若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;本申请通过大数据处理技术,建设大数据精准招商平台,及时了解企业风险、缩小目标企业的选择范围,提升招商工作效率。
Description
技术领域
本发明涉及大数据领域,更具体的,涉及一种基于大数据的智能招商推荐方法、系统和可读存储介质。
背景技术
精准招商是提升区域经济核心竞争力、适应招商活动规律性的必然选择。如何改进我们的招商引资工作,实施精准招商,优化产业结构,是目前所要研究的重点。其中最重要的就是精准招商问题,如何选择最优细分产业、最适合的企业进行招商是我们所最关心的事情。但是因为绩效、信息不对称等因素的影响,导致各地盲目招商,不充分考虑招商的精准度与产业的契合度,最终造成招商企业不能带动当地经济的发展,甚至需要政府的扶持,阻碍了当地经济的发展。
现有的招商推荐方法无法目标企业的经营状况、资产配置、投资方向、财务舆情、市场口碑进行全方位分析,招商企业盲目发展扩张,造成财务危机,使企业面临破产,从而导致招商项目陷入停滞,造成招商失败。
招商人员面对以上问题主要的解决办法是通过互联网进行查询企业信息、
行业资讯,或者到每一家企业的网站进行财务信息收集,然后人工对这些数据进行整理、分析,这种数据处理方式效率低下,给招商人员日常工作带来了很大的工作负担,并且由于人工对于数据的分析往往存在主观性,对于信息的分析不够全面,将有可能在招商过程对企业筛选产生错误引导,造成招商失误,带来经济损失。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于大数据的智能招商推荐方法、系统和可读存储介质。
本发明第一方面提供了一种基于大数据的智能招商推荐方法,包括如下步骤:
利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
将相似度信息与预设相似度阈值进行比较,得到偏差率;
判断所述偏差率是否大于预定偏差率阈值;
若大于,则剔除对应的推荐企业;
若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
将推荐企业列表按照预定的方式传输至终端。
本发明一个较佳实施例中,利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;具体包括:
利用计算机编程代码,定义特定的规则,通过网络爬虫的方式收集和保存原始网中的网页数据,网络爬虫的使用方法如下:
输入一个初始的网页URL,作为爬虫初始链接,爬虫从该URL开始循环进行网页信息收集;
爬虫开始工作后,根据当前爬取的URL链接加载对应的网页源码内容,按需求提取当前网页URL链接,去重后加至待爬取队列;
利用网页信息提取技术,将网页的噪声信息去除,提取有效信息字段并存储;
若待爬取URL队列为空,则停止运行。
本发明一个较佳实施例中,通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;具体包括:
获取产业园区信息对应数据参数;
通过参数调用特定的模型,启动该模型,并传入参数 ;
根据参数判断招商推荐模型执行训练流程或预测流程;
若为预测流程,则输入被预测的数据集合,进行预测。
若为训练流程,则输入训练参数,执行训练逻辑。
本发明一个较佳实施例中,所述推荐企业信息包括企业基础信息与企业财务信息、企业履约信息、企业市场口碑信息、企业历史信用信息中的多种以上的组合;
其中,企业基础信息包括组织模式、注册资本、公司编码、简介信息。
本发明一个较佳实施例中,将推荐企业信息与招商项目信息进行比较,并得到相似度信息,还包括:
根据推荐企业信息对招商项目的评分计算推荐企业信息之间的相似度,找到和推荐企业信息的相似度大于预设相似度阈值的企业集合,预测推荐企业对招商项目的评分,将预测评分最高的若干企业作为推荐列表;
获取推荐企业对招商项目的评价值构造企业评分矩阵,招商项目评价值通过向量表示,向量由推荐企业、招商项目及推荐企业对该招商项目的评分数值构成。
本发明一个较佳实施例中,生成推荐企业列表具体为:
根据企业的历史融资信息,为每个企业创建融资记录,形成数据库。
通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合 R;
对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合 R;
根据关联规则中的置信度要求,对 W 中所有候选企业排序,返回前 N 项候选企业推荐给招商平台。
本发明一个较佳实施例中,预设相似度阈值包括第一阈值与第二阈值,第一阈值大于第二阈值,
将推荐企业信息与第一阈值进行比较,得到第一偏差率,
将第一偏差率小于预定偏差率阈值对应的推荐企业进行优先推荐,
将推荐企业信息与第二阈值进行比较,得到第二偏差率;
若推荐企业信息大于第二偏差率并小于第一偏差率,则将对应的企业作为候选企业。
本发明第二方面还提供了一种基于大数据的智能招商推荐系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括基于大数据的智能招商推荐方法程序,所述基于大数据的智能招商推荐方法程序被所述处理器执行时实现如下步骤:
利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
通过大数据获取历史招商信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
将相似度信息与预设相似度阈值进行比较,得到偏差率;
判断所述偏差率是否大于预定偏差率阈值;
若大于,则剔除对应的推荐企业;
若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
将推荐企业列表按照预定的方式传输至终端。
本发明一个较佳实施例中,生成推荐企业列表具体为:
根据企业的历史融资信息,为每个企业创建融资记录,形成数据库。
通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合 R;
对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合 R;
根据关联规则中的置信度要求,对 W 中所有候选企业排序,返回前 N 项候选企业推荐给招商平台。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于大数据的智能招商推荐方法程序,所述基于大数据的智能招商推荐方法程序被处理器执行时,实现如上述任一项所述的基于大数据的智能招商推荐方法的步骤。
与现有技术相比,本发明所获得的有益技术效果:
在精准招商中引入大数据处理技术,建设信息化大数据精准招商平台,通过大数据平台中文本挖掘系统对招商工作过程产生的相关数据进行整理和分析,可以帮助招商人员及时了解企业风险、缩小目标企业的选择范围,同时降低人工分析带来的情感主观性,提升招商工作效率,提高对于区域招商引资的精准性。
附图说明
图1示出了本发明一种基于大数据的智能招商推荐方法的流程图;
图2示出了本发明网络爬虫使用方法流程图;
图3示出了本发明推荐企业列表生成方法流程图
图4示出了本发明基于大数据的智能招商推荐系统框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
图1示出了本发明一种基于大数据的智能招商推荐方法的流程图。
如图1所示,本发明第一方面提供了一种基于大数据的智能招商推荐方法,包括如下步骤:
S102,利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
S104,通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
S106,将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
S108,将相似度信息与预设相似度阈值进行比较,得到偏差率;
S110,判断偏差率是否大于预定偏差率阈值;
S112,若大于,则剔除对应的推荐企业;
S114,若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
S116,将推荐企业列表按照预定的方式传输至终端。
进一步的,主体信息包括与招商项目相关联的企业信息,利用网页信息提取技术从原始网页数据中过滤噪声信息,并进行文本数据预处理操作,具体为:去除无意义字符,统一输入特征长度,文本分词等,文本内容中包含了大量的标点,语气词等无意义词汇,这些词汇的存在不仅会消耗计算资源,提高数据处理的时间成本,造成无意义的开销,而且干扰算法提取文本中的有效信息,降低算法的推荐效果,因此需要去除这些字符,常用的方法是使用已经整理好的停用词表;当发现输入本文中含有停用词表中的内容时,就将该词从文本信息中删除,中文文本与英文文本相比,词汇之间不以空格分隔,而文本的信息常常以词的形式表达,因此需要将具有完整表达含义的词汇逐一分 开,然后以词为单位进行下一步的处理,深度学习的模型往往是固定的,因此要求输入的数据长度一致,而每段文本的长度通常不统一。对于这一情况,常常对少于规定长度的文本进行末尾补零,使其达到规定长度,对于多于规定长度的文本则使用机器学习相关库中的相关功能削减其长度,以达到统一长度的目的。
图2示出了本发明网络爬虫使用方法流程图。
进一步的,利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;具体包括:
利用计算机编程代码,定义特定的规则,通过网络爬虫的方式收集和保存原始网中的网页数据,网络爬虫的使用方法如下:
S202,输入一个初始的网页URL,作为爬虫初始链接,爬虫从该URL开始循环进行网页信息收集;
S204,爬虫开始工作后,根据当前爬取的URL链接加载对应的网页源码内容,按需求提取当前网页URL链接,去重后加至待爬取队列;
S206,利用网页信息提取技术,将网页的噪声信息去除,提取有效信息字段并存储;
S208,若待爬取URL队列为空,则停止运行。
进一步的,通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;具体包括:
获取产业园区信息对应数据参数;
通过参数调用特定的模型,启动该模型,并传入参数 ;
根据参数判断招商推荐模型执行训练流程或预测流程;
若为预测流程,则输入被预测的数据集合,进行预测。
若为训练流程,则输入训练参数,执行训练逻辑。
具体的,招商推荐模型生成流程包括:
读取训练数据,并对数据进行预处理,同时提取数据特征;
获取超参数,使用超参数进行模型训练,训练完成后,将模型进行存储,等待系统调用。
进一步的,推荐企业信息包括企业基础信息与企业财务信息、企业履约信息、企业市场口碑信息、企业历史信用信息中的多种以上的组合;
其中,企业基础信息包括组织模式、注册资本、公司编码、简介信息。
进一步的,通过对企业基础信息进行查询,可以得到相关招商企业的登记状态、注册资本、企业类型、所属行业、经营范围等基础信息,判断企业资本实力、所属行业是否与招商项目信息一致,同时对企业发布年报、公告、财务报表、财经新闻等进行分析,通过分析得出企业目前财务情况是否良好、企业管理层是否对于公司经营状况是否保持积极态度,以及市场是否对此家企业持看好心理,以此筛选企业财务舆情负面信息占比过大的企业,将其剔除预招商洽谈企业名单。
进一步的,将推荐企业信息与招商项目信息进行比较,并得到相似度信息,还包括:
根据推荐企业信息对招商项目的评分计算推荐企业信息之间的相似度,找到和推荐企业信息的相似度大于预设相似度阈值的企业集合,预测推荐企业对招商项目的评分,将预测评分最高的若干企业作为推荐列表;
获取推荐企业对招商项目的评价值构造企业评分矩阵,招商项目评价值通过向量表示,向量由推荐企业、招商项目及推荐企业对该招商项目的评分数值构成。
进一步的,还包括预训练模型,通过预训练模型进行智能招商推荐;企业信息与招商信息放入预训练模型进行编码。
预训练模型的训练方法如下:
获取训练样本集,训练样本集包括招商数据与企业数据,将招商数据输入预训练模型得到对应的招商特征向量,企业数据输入预训练模型得到企业特征向量,计算招商特征向量与企业特征向量之间的相似度,按照相似度大小进行确定招商数据对应的候选企业信息,并将候选企业信息进行存储。
进一步的,预训练模型为BERT模型。
图3示出了本发明推荐企业列表生成方法流程图。
进一步的,生成推荐企业列表具体为:
S302,根据企业的历史融资信息,为每个企业创建融资记录,形成数据库。
S304,通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合R;
S306,对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合R;
S308,根据关联规则中的置信度要求,对W中所有候选企业排序,返回前N项候选企业推荐给招商平台。
进一步的,预设相似度阈值包括第一阈值与第二阈值,第一阈值大于第二阈值,
将推荐企业信息与第一阈值进行比较,得到第一偏差率,
将第一偏差率小于预定偏差率阈值对应的推荐企业进行优先推荐,
将推荐企业信息与第二阈值进行比较,得到第二偏差率;
若推荐企业信息大于第二偏差率并小于第一偏差率,则将对应的企业作为候选企业。
实施例二
图4示出了本发明基于大数据的智能招商推荐系统框图。
本发明第二方面还提供了一种基于大数据的智能招商推荐系统,其特征在于,该系统包括:存储器、处理器,存储器中包括基于大数据的智能招商推荐方法程序,基于大数据的智能招商推荐方法程序被处理器执行时实现如下步骤:
利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
通过大数据获取历史招商信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
将相似度信息与预设相似度阈值进行比较,得到偏差率;
判断偏差率是否大于预定偏差率阈值;
若大于,则剔除对应的推荐企业;
若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
将推荐企业列表按照预定的方式传输至终端。
进一步的,生成推荐企业列表具体为:
根据企业的历史融资信息,为每个企业创建融资记录,形成数据库。
通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合 R;
对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合 R;
根据关联规则中的置信度要求,对 W 中所有候选企业排序,返回前 N 项候选企业推荐给招商平台。
进一步的,预设相似度阈值包括第一阈值与第二阈值,第一阈值大于第二阈值,
将推荐企业信息与第一阈值进行比较,得到第一偏差率,
将第一偏差率小于预定偏差率阈值对应的推荐企业进行优先推荐,
将推荐企业信息与第二阈值进行比较,得到第二偏差率;
若推荐企业信息大于第二偏差率并小于第一偏差率,则将对应的企业作为候选企业。
进一步的,推荐企业信息包括企业基础信息与企业财务信息、企业履约信息、企业市场口碑信息、企业历史信用信息中的多种以上的组合;
其中,企业基础信息包括组织模式、注册资本、公司编码、简介信息。
进一步的,通过对企业基础信息进行查询,可以得到相关招商企业的登记状态、注册资本、企业类型、所属行业、经营范围等基础信息,判断企业资本实力、所属行业是否与招商项目信息一致,同时对企业发布年报、公告、财务报表、财经新闻等进行分析,通过分析得出企业目前财务情况是否良好、企业管理层是否对于公司经营状况是否保持积极态度,以及市场是否对此家企业持看好心理,以此筛选企业财务舆情负面信息占比过大的企业,将其剔除预招商洽谈企业名单。
进一步的,将推荐企业信息与招商项目信息进行比较,并得到相似度信息,还包括:
根据推荐企业信息对招商项目的评分计算推荐企业信息之间的相似度,找到和推荐企业信息的相似度大于预设相似度阈值的企业集合,预测推荐企业对招商项目的评分,将预测评分最高的若干企业作为推荐列表;
获取推荐企业对招商项目的评价值构造企业评分矩阵,招商项目评价值通过向量表示,向量由推荐企业、招商项目及推荐企业对该招商项目的评分数值构成。
综上所述,在精准招商中引入大数据处理技术,建设信息化大数据精准招商平台,通过大数据平台中文本挖掘系统对招商工作过程产生的相关数据进行整理和分析,可以帮助招商人员及时了解企业风险、缩小目标企业的选择范围,同时降低人工分析带来的情感主观性,提升招商工作效率,提高对于区域招商引资的精准性。
实施例三
本发明第三方面还提供一种计算机可读存储介质,计算机可读存储介质中包括基于大数据的智能招商推荐方法程序,基于大数据的智能招商推荐方法程序被处理器执行时,实现如上述任一项的基于大数据的智能招商推荐方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于大数据的智能招商推荐方法,其特征在于,包括如下步骤:
利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
将相似度信息与预设相似度阈值进行比较,得到偏差率;
判断所述偏差率是否大于预定偏差率阈值;
若大于,则剔除对应的推荐企业;
若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
将推荐企业列表按照预定的方式传输至终端。
2.根据权利要求1所述的一种基于大数据的智能招商推荐方法,其特征在于,利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;具体包括:
利用计算机编程代码,定义特定的规则,通过网络爬虫的方式收集和保存原始网中的网页数据,网络爬虫的使用方法如下:
输入一个初始的网页URL,作为爬虫初始链接,爬虫从该URL开始循环进行网页信息收集;
爬虫开始工作后,根据当前爬取的URL链接加载对应的网页源码内容,按需求提取当前网页URL链接,去重后加至待爬取队列;
利用网页信息提取技术,将网页的噪声信息去除,提取有效信息字段并存储;
若待爬取URL队列为空,则停止运行。
3.根据权利要求1所述的一种基于大数据的智能招商推荐方法,其特征在于,通过大数据获取产业园区信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;具体包括:
获取产业园区信息对应数据参数;
通过参数调用特定的模型,启动该模型,并传入参数 ;
根据参数判断招商推荐模型执行训练流程或预测流程;
若为预测流程,则输入被预测的数据集合,进行预测;
若为训练流程,则输入训练参数,执行训练逻辑。
4.根据权利要求1所述的一种基于大数据的智能招商推荐方法,其特征在于,所述推荐企业信息包括企业基础信息与企业财务信息、企业履约信息、企业市场口碑信息、企业历史信用信息中的多种以上的组合;
其中,企业基础信息包括组织模式、注册资本、公司编码、简介信息。
5.根据权利要求4所述的一种基于大数据的智能招商推荐方法,其特征在于,将推荐企业信息与招商项目信息进行比较,并得到相似度信息,还包括:
根据推荐企业信息对招商项目的评分计算推荐企业信息之间的相似度,找到和推荐企业信息的相似度大于预设相似度阈值的企业集合,预测推荐企业对招商项目的评分,将预测评分最高的若干企业作为推荐列表;
获取推荐企业对招商项目的评价值构造企业评分矩阵,招商项目评价值通过向量表示,向量由推荐企业、招商项目及推荐企业对该招商项目的评分数值构成。
6.根据权利要求1所述的一种基于大数据的智能招商推荐方法,其特征在于,生成推荐企业列表具体为:
根据企业的历史融资信息,为每个企业创建融资记录,形成数据库;
通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合 R;
对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合 R;
根据关联规则中的置信度要求,对 W 中所有候选企业排序,返回前 N 项候选企业推荐给招商平台。
7.根据权利要求6所述的一种基于大数据的智能招商推荐方法,其特征在于,
预设相似度阈值包括第一阈值与第二阈值,第一阈值大于第二阈值,
将推荐企业信息与第一阈值进行比较,得到第一偏差率,
将第一偏差率小于预定偏差率阈值对应的推荐企业进行优先推荐,
将推荐企业信息与第二阈值进行比较,得到第二偏差率;
若推荐企业信息大于第二偏差率并小于第一偏差率,则将对应的企业作为候选企业。
8.一种基于大数据的智能招商推荐系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括基于大数据的智能招商推荐方法程序,所述基于大数据的智能招商推荐方法程序被所述处理器执行时实现如下步骤:
利用网页信息提取技术从原始网页数据中过滤噪声信息,获取与招商用户需求相关的主体信息;
通过大数据获取历史招商信息,建立招商推荐模型,将主体信息输入招商推荐模型,得到推荐企业信息;
将推荐企业信息与招商项目信息进行比较,并得到相似度信息;
将相似度信息与预设相似度阈值进行比较,得到偏差率;
判断所述偏差率是否大于预定偏差率阈值;
若大于,则剔除对应的推荐企业;
若小于,则根据偏差率大小将推荐企业进行排序,并生成推荐企业列表;
将推荐企业列表按照预定的方式传输至终端。
9.根据权利要求8所述的一种基于大数据的智能招商推荐系统,其特征在于,生成推荐企业列表具体为:
根据企业的历史融资信息,为每个企业创建融资记录,形成数据库;
通过算法对数据库进行关联规则挖掘,将满足最小支持度阈值和最小置信度阈值的所有关联规则,记入关联规则集合 R;
对每个当前企业设置一个候选企业集合W,初始化为空,在 R 中搜索当前企业支持的所有关联规则集合 R;
根据关联规则中的置信度要求,对 W 中所有候选企业排序,返回前 N 项候选企业推荐给招商平台。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于大数据的智能招商推荐方法程序,所述基于大数据的智能招商推荐方法程序被处理器执行时,实现如权利要求1至7中任一项所述的基于大数据的智能招商推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211702970.7A CN116070019A (zh) | 2022-12-29 | 2022-12-29 | 一种基于大数据的智能招商推荐方法、系统和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211702970.7A CN116070019A (zh) | 2022-12-29 | 2022-12-29 | 一种基于大数据的智能招商推荐方法、系统和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116070019A true CN116070019A (zh) | 2023-05-05 |
Family
ID=86170915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211702970.7A Pending CN116070019A (zh) | 2022-12-29 | 2022-12-29 | 一种基于大数据的智能招商推荐方法、系统和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116070019A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116383511A (zh) * | 2023-05-29 | 2023-07-04 | 四川邕合科技有限公司 | 基于产业链分析的园区招商推荐方法、系统、终端及介质 |
CN116563067A (zh) * | 2023-05-15 | 2023-08-08 | 北京融信数联科技有限公司 | 一种基于大数据的毕业生人群就业分析方法、系统及介质 |
CN116993237A (zh) * | 2023-09-21 | 2023-11-03 | 北京上奇数字科技有限公司 | 一种基于余弦相似度算法的企业推荐方法及系统 |
CN118350691A (zh) * | 2024-03-28 | 2024-07-16 | 北京清华同得科技有限公司 | 一种区域智能引入企业的测评方法及系统 |
-
2022
- 2022-12-29 CN CN202211702970.7A patent/CN116070019A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116563067A (zh) * | 2023-05-15 | 2023-08-08 | 北京融信数联科技有限公司 | 一种基于大数据的毕业生人群就业分析方法、系统及介质 |
CN116563067B (zh) * | 2023-05-15 | 2024-03-15 | 北京融信数联科技有限公司 | 一种基于大数据的毕业生人群就业分析方法、系统及介质 |
CN116383511A (zh) * | 2023-05-29 | 2023-07-04 | 四川邕合科技有限公司 | 基于产业链分析的园区招商推荐方法、系统、终端及介质 |
CN116383511B (zh) * | 2023-05-29 | 2023-08-04 | 四川邕合科技有限公司 | 基于产业链分析的园区招商推荐方法、系统、终端及介质 |
CN116993237A (zh) * | 2023-09-21 | 2023-11-03 | 北京上奇数字科技有限公司 | 一种基于余弦相似度算法的企业推荐方法及系统 |
CN118350691A (zh) * | 2024-03-28 | 2024-07-16 | 北京清华同得科技有限公司 | 一种区域智能引入企业的测评方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116070019A (zh) | 一种基于大数据的智能招商推荐方法、系统和可读存储介质 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN111144723A (zh) | 人岗匹配推荐方法及系统、存储介质 | |
CN111125343A (zh) | 适用于人岗匹配推荐系统的文本解析方法及装置 | |
CN113360622B (zh) | 用户对话信息的处理方法、装置及计算机设备 | |
CN109299235B (zh) | 知识库搜索方法、装置及计算机可读存储介质 | |
CN110851729A (zh) | 资源信息推荐方法、装置、设备及计算机存储介质 | |
CN113076735A (zh) | 目标信息的获取方法、装置和服务器 | |
CN113283232A (zh) | 自动解析文本中隐私信息的方法和装置 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN115952800A (zh) | 命名实体识别方法、装置、计算机设备及可读存储介质 | |
CN116702059B (zh) | 一种基于物联网的智能生产车间管理系统 | |
CN113326536A (zh) | 应用程序的合规性判别方法和装置 | |
CN116468271B (zh) | 一种基于大数据的企业风险分析方法、系统及介质 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN115374793B (zh) | 基于服务场景识别的语音数据处理方法及相关装置 | |
CN113095073B (zh) | 语料标签生成方法、装置、计算机设备和存储介质 | |
CN115238676A (zh) | 招标需求热点识别方法、装置、存储介质及电子设备 | |
CN114756665A (zh) | 回复的推荐方法、对话索引库的建立方法、装置及设备 | |
CN113051392A (zh) | 知识推送方法及装置 | |
CN113408263A (zh) | 刑期预测方法、装置、存储介质及电子设备 | |
CN114676679A (zh) | 工单文本内容的分析方法、系统、设备以及存储介质 | |
CN116957738A (zh) | 数据产品推荐方法、装置、设备及存储介质 | |
CN118261613A (zh) | 一种基于ai的智能营销和身份认证方法及装置 | |
CN113987293A (zh) | 数据资产补全方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |