一种科技服务智能匹配平台
技术领域
本发明涉及数据服务技术领域,具体为一种科技服务智能匹配平台。
背景技术
为了促进和支持企事业单位开展技术创新、产业升级和发展,提高产业的核心竞争力,提升企业自主创新能力,改善融资环境,实现社会、经济发展目标,各级相关部门通常会设置相应的专项项目。但是目前,大部分的小微企业、科技型企业由于种种原因,经常会没有意识到或者往往忽视了相关的政策信息发布,错失符合企业自身实际情况的项目申报机会,同时也达不到对企业创新能力发展和产业竞争力发展助力的效果。
一些企业或咨询机构会建立相关项目数据库,以实现不同项目信息的管理,进而可以得知企业适合的项目进行申报。目前项目数据库中针对相关项目以及政策的监控、解析以及判断是否申报通常是由企业人员人工完成的,这就要求相关人员要持续对各个部门的政策进行查看,并通过手工记录相关项目信息,再由人工判断是否能够申报相关项目。但由于项目数量和类型众多,人工操作存在人力成本高,及时性差、容易造成遗漏或错误等问题。
发明内容
本发明意在提供一种科技服务智能匹配平台,能够根据企业自身条件匹配对应的项目,方便企业进行项目管理。
本申请提供如下技术方案:
科技服务智能匹配平台,包括:
企业信息管理模块,包括企业数据库,企业数据库中存储有各个企业的企业数据;
项目信息管理模块,包括项目数据库,项目数据库中存储有各个项目的项目信息,所述项目信息包括项目基本信息和项目要求信息;
项目匹配模块,所述项目匹配模块用于将各个项目的项目要求信息与各个企业的企业数据进行匹配和比对,判断各个企业是否符合各个项目的项目要求信息,形成匹配结果。
本发明技术方案中,通过建立企业数据库以及项目数据库,可以掌握各个企业以及项目的数据,通过项目匹配模块可以根据各个企业自身情况判断其是否符合各个项目的申报要求,进而形成匹配结果,本发明技术方案解决了现有人工操作工作量大、成本高、易出错等问题。
进一步,所述企业信息管理模块,包括企业数据导入模块和企业数据操作模块,所述企业数据导入模块用于批量导入企业数据,所述企业数据操作模块用于添加企业数据,修改企业数据或删除企业数据。
进一步,还包括匹配结果查看模块,所述匹配结果查看模块用于获取用户输入的查看条件,所述匹配结果查看模块还用于从匹配结果中筛选符合查看条件的匹配结果并形成查看数据。
方便对匹配结果进行查看,例如可以查看某一个企业可以申报的项目清单或不可以申报的项目清单,也可以查看可以申报某一个项目的企业清单。
进一步,所述项目匹配模块还用于根据企业数据以及项目要求信息计算项目要求信息中各项要求的符合分数,并根据项目要求信息以及符合分数计算项目成功率并生成改进建议。
生成各个要求的具体的符合分数,方便了解各个要求的符合情况,也便于针对不符合项进行改进。
进一步,还包括项目推送模块,用于根据当前时间以及匹配结果生成各个企业的项目建议,并向各个企业推送项目建议。方便各个企业及时掌握项目申报情况。
进一步,所述项目信息管理模块还包括:
政策获取模块,用于获取政策文本;
项目解析模块,根据政策文本解析项目信息;
所述项目解析模块包括语义识别模块、拆分模块以及解析模块;
所述语义识别模块用于对政策文本进行语义识别;
所述拆分模块用于根据语义识别结果对政策文本进行拆分,得到各个类型的政策片段;
所述解析模块用于根据政策片段的类型对政策片段进行解析,解析模块存储有项目信息识别数据表,所述项目信息识别数据表中存储有若干条识别数据,每条识别数据与一种项目信息对应,所述解析模块根据政策片段的类型获取对应的识别数据,所述识别数据包括解析规则,所述解析模块根据解析规则提取对应的项目信息。
通过政策获取模块自动获取各个部门发布的项目政策文本,通过项目解析模块,采用语义解析技术进行政策文本的识别和解析,并根据解析结果进行分析生成各个项目的项目信息,本发明的科技服务智能匹配平台能够自动获取并解析政策,形成项目信息,解决了现有人工操作工作量大、成本高、易出错、更新不及时等问题,可以帮助企业快速建立项目信息数据库。
进一步,所述项目信息还包括其他辅助信息,所述项目解析模块还包括其他辅助信息解析模块,所述其他辅助信息解析模块包括键名解析模块和键值解析模块,所述键值解析模块根据预设的解析规则提取键值,所述键名解析模块根据语义识别结果以及键值在政策文本的位置获取对应的键名。
通过自动提取键名键值可以将未在项目信息识别数据表中的内容也进行识别和提取,形成其他辅助信息,避免信息遗漏。
进一步,所述项目解析模块还包括识别模型存储模块和模型匹配模块,识别模型存储模块用于根据政策文本的数据来源、拆分模块的拆分结果以及解析模块的解析结果生成识别模型并存储;
模型匹配模块用于根据数据来源匹配识别模型;
模型匹配模块包括模型验证模块,用于根据语义识别结果验证识别模型是否有效;
所述拆分模块以及解析模块根据识别模块还用于根据有效的识别模型进行政策文本的拆分和解析。
每个数据源或网站都要自己惯用的行文格式,通过识别模板可以实现快速拆分和识别。
进一步,所述项目信息管理模块还包括项目信息识别数据表拓展模块,所述项目信息识别数据表拓展模块用于根据其他辅助信息解析模块的解析结果,生成识别数据并添加至项目识别数据表中;项目信息识别数据表拓展模块包括标准化处理模块和解析规则生成模块,标准化处理模块用于根据标准化词汇库对各个信息键名进行标准化处理,解析规则生成模块包括基础规则生成模块和拓展模块,基础规则生成模块用于根据键值和键名生成基础解析规则,所述拓展模块用于对键值和键名进行拓展,所述拓展模块还用于根据键值和键名的拓展结果对基础解析规则进行拓展形成解析规则。
实现项目信息数据表的自动添加和拓展。
进一步,所述项目信息管理模块还包括项目版本匹配模块、对比分析模块以及建议生成模块,所述项目版本匹配模块用于根据项目基本信息匹配项目历史版本,所述对比分析模块用于根据项目历史版本分析项目变更,所述建议生成模块用于根据项目变更,生成变更注意事项以及辅助建议。
帮助用户快速了解项目变更内容。
附图说明
图1为本申请一种科技服务智能匹配平台实施例中的逻辑框图;
图2为本申请一种科技服务智能匹配平台实施例中项目信息管理模块的逻辑框图。
具体实施方式
下面通过具体实施方式对本申请技术方案进行进一步详细说明:
实施例一
如图1所示,本实施例的一种科技服务智能匹配平台,包括企业信息管理模块、项目信息管理模块、项目匹配模块、匹配结果查看模块以及项目推送模块。
企业信息管理模块包括企业数据库,企业数据库中存储有各个企业的企业数据;企业信息管理模块,包括企业数据导入模块和企业数据操作模块,企业数据导入模块用于批量导入企业数据,企业数据操作模块用于添加企业数据,修改企业数据或删除企业数据。
项目信息管理模块包括项目数据库,项目数据库中存储有各个项目的项目信息,项目信息包括:项目基本信息、项目要求信息、项目收益信息以及其他辅助信息;项目基本信息包括项目名称、主办部门、相关联系方式等,项目收益信息包括收益内容,领取方式以及领取时间等;项目要求信息包括时间要求、主体要求以及申报方式要求,时间要求包括启止时间要求、材料报送时间要求、评审结果时间要求以及修改时间要求等,主体要求包括领域要求、地域要求、财务要求、知识产权要求、成立时长、人员要求以及资质要求等,申报方式要求包括申报文档内容要求,申报模板、是否在线申报、是否纸质档申报、申报地址等,其他辅助信息主要是指在项目基本信息、项目要求信息以及项目收益信息中未包含的其他对项目申报有用的数据内容,如联系电话、邮箱、注意事项等信息。
项目匹配模块用于将各个项目的项目要求信息与各个企业的企业数据进行匹配和比对,判断各个企业是否符合各个项目的项目要求信息,形成匹配结果。
匹配结果查看模块用于获取用户输入的查看条件,匹配结果查看模块还用于从匹配结果中筛选符合查看条件的匹配结果并形成查看数据。
项目匹配模块还用于根据企业数据以及项目要求信息计算项目要求信息中各项要求的符合分数,并根据项目要求信息以及符合分数计算项目成功率并生成改进建议。
项目推送模块用于根据当前时间以及匹配结果生成各个企业的项目建议,并向各个企业推送项目建议。
如图2所示,项目信息管理模块还包括政策获取模块和项目解析模块。政策获取模块用于获取政策文本;本实施例中,政策获取模块包括第三方数据获取模块以及网页数据爬取模块,第三方数据获取模块用于连接第三方数据平台,根据第三方数平台的API调取其存储的政策文本或政策数据,网页数据爬取模块内部维护若干网页列表,网页列表中包括网页地址、页面分类等信息,网页数据爬取模块用于根据网页列表爬取相应的网页内容,并得到政策文本,本实施例中,采用基于Scrapy和Redis的分布式技术进行网页数据爬取模块的部署,形成分布式爬虫网络。
项目解析模块用于根据政策文本解析项目信息。项目解析模块包括预处理模块、语义识别模块、拆分模块、解析模块、识别模型存储模块和模型匹配模块。
预处理模块用于对获取的政策文本数据进行格式化预处理,格式化预处理包括去除停用词、去重、乱码矫正等处理,通过上述处理一方面减小数据处理量,另一方面去除干扰,提高语义识别效率和准确率。
语义识别模块用于对政策文本进行语义识别;本实施例中,采用基于LSTM-CRF神经网络模型的语义识别算法进行政策文本的分词、命名实体识别、词性标注、语句和段落关键词提取和标注等。
拆分模块用于根据语义识别结果对政策文本进行拆分,得到各个类型的政策片段;具体的,本实施中,根据每个语句中出现的关键词判断每个语句的对应的类型,这些类型代表了每个政策片段保护的项目信息的类型,即项目基本信息、项目要求信息、项目收益信息或其他辅助信息等。
解析模块用于根据政策片段的类型对政策片段进行解析,解析模块存储有项目信息识别数据表,项目信息识别数据表中存储有若干条识别数据,每条识别数据与一种项目信息对应,每条识别数据均有其适用的政策片段的类型,解析模块根据政策片段的类型获取对应的识别数据,识别数据包括解析规则,解析模块根据解析规则提取对应的项目信息,解析规则包括解析关键词、解析范围、正则表达式等中的一种或多种。
项目解析模块还包括其他辅助信息解析模块,其他辅助信息解析模块包括键名解析模块和键值解析模块,键值解析模块根据预设的解析规则提取键值,本实施中,预设的解析规则包括按照固定类型或格式或正则表达式进行匹配,如电话格式、email格式等,键名解析模块根据语义识别结果以及键值在政策文本的位置获取对应的键名,如当获取到一个邮箱后,向前查找判断邮箱对应的人名或者相关表述。
识别模型存储模块根据政策文本的数据来源、拆分模块的拆分结果以及解析模块的解析结果生成识别模型并存储;模型匹配模块用于根据数据来源匹配识别模型;模型匹配模块包括模型验证模块,用于根据语义识别结果验证识别模型是否有效;拆分模块以及解析模块根据识别模块还用于根据有效的识别模型进行政策文本的拆分和解析。
所述项目信息管理模块还包括项目信息识别数据表拓展模块,项目信息识别数据表拓展模块用于根据其他辅助信息解析模块的解析结果,生成识别数据并添加至项目识别数据表中。
项目信息识别数据表拓展模块包括解析规则生成模块,解析规则生成模块包括基础规则生成模块和拓展模块,基础规则生成模块用于根据键值和键名生成基础解析规则,拓展模块用于对键值和键名进行拓展,拓展模块还用于根据键值和键名的拓展结果对基础解析规则进行拓展形成解析规则。
项目信息识别数据表拓展模块还包括标准化处理模块,根据标准化词汇库对各个信息键名进行标准化处理,如“启动时间”,“开始时间”,“起始时间”等统一标准化为开始时间。
所述项目信息管理模块还包括项目版本匹配模块、对比分析模块以及建议生成模块,项目版本匹配模块用于根据项目基本信息匹配项目历史版本,对比分析模块用于根据项目历史版本分析项目变更,建议生成模块用于根据项目变更,生成变更注意事项以及辅助建议。
实施例二
本实施例与实施例一的区别在于,本实施例中,建议生成模块包括变更建议生成模块,所述变更建议生成模块根据项目变更,判断项目变更内容和所属类型以及变化趋势,若所属类型为项目要求信息且项目要求变严格则生成变更提醒,并根据具体的变更事项匹配对应的建议模型,根据建议模型生成项目变更建议。
实施例三
本实施例与实施例二的区别在于,本实施中,企业数据包括企业基本信息,如名称、地址、识别号等,企业财务信息,如年报、纳税、审计报告等信息,企业资质信息,如企业荣誉、证书、知识产权等,企业人员数据,如人员数量、学历分布、职称分布等,企业历史数据,如历史财务数据、历史人员数据等,对比分析模块还用于根据企业信息和项目要求信息判断企业是否满足申报条件,所述建议生成模块包括培育建议生成模块,所述培育建议生成模块还用于对不满足申报条件的项目生成企业的培育申报建议和培育申报计划。
还包括企业发展模拟模块,用于根据企业信息模拟企业未来三年内的发展数据,发展数据同样包括企业财务信息、企业人员数据、企业资质信息等;本实施中,采用基于人工智能的模拟模型进行发展数据的模拟,具体的,包括BP神经网络模块,用于根据企业历史数据,生成发展数据。BP神经网络模块包括BP神经网络模型,BP神经网络模型使用BP神经网络技术来对企业的发展情况进行模拟,具体的首先构建一个三层的BP神经网络模型,包括输入层、隐层和输出层,本实施例中,以企业基本信息、企业资质信息、企业人员数据、企业历史数据、企业财务数据作为输入层的输入,而输出是对应的数据的预测;本实施例使用了以下公式来确定隐层节点的数量:
其中l为隐层的节点数,n为输入层的节点数,m为输出层的节点数,a为1至10之间的一个数。BP神经网络通常采用Sigmoid可微函数和线性函数作为网络的激励函数。本文选择S型正切函数tansig作为隐层神经元的激励函数。预测模型选取S型对数函数tansig作为输出层神经元的激励函数。在BP网络模型构建完毕后,利用企业历史数据作为样本对模型进行训练,为了提高预测精度,可以按照企业领域建立分类预测模型,训练完成后得到的模型可以取得较为准确的预测结果。
对比分析模块还用于根据企业的发展数据以及不满足的申报条件来判断不满足的申报条件的类型,该类型包括无法实现、可发展以及可配置三种类型,无法实现即基于企业信息判断企业在一定时间阈值内无法实现的条件,当出现这种条件时,则说明企业无法申报相应项目,则无培育申报建议以及培育申报计划。可发展条件指的是在一定时间后可以满足的条件,如财务数据、人员配置等,随着企业发展,可以达到相应的标准;可配置条件指的是企业可以主动改变进而能达到的条件,如制度缺失,认证体系缺失等,企业可以通过优化企业制度,寻求体系认证来达到申报条件。
培育建议生成模块根据可发展类型的申报条件以及可配置类型的申报条件生成培育申报建议,并根据企业发展模拟模块模拟的发展数据生成培育申报计划。
实施例四
本实施例与实施例三的区别在于,还包括服务机构数据库,所述服务机构数据库中存储有各个服务机构的数据,所述培育建议生成模块还用于生成服务合作推荐建议,培育建议生成模块根据可发展类型的申报条件以及可配置类型的申报条件,匹配对应的服务机构,生成推荐列表,培育建议生成模块根据推荐列表生成服务合作推荐建议,如可配置类型的申报条件为知识产权,则推荐相应的代理机构;若可配置类型的申报条件为体系认证,则推荐相应的认证服务机构。
实施例五
本实施例与实施例四的区别在于,本实施例中,还包括互补企业匹配模块以及互补圈子建立模块,所述互补企业匹配模块用于根据各个企业信息以及企业可以申报的项目,对企业进行匹配分组,使得领域相近且有成功项目经验互补的企业分配到同一组内,如A企业有X项目申报成功的经验,其现在可以申报Y项目,而B企业有申报Y项目成功的经验,其现在要申请X项目,则将两个企业分配至一组。互补圈子建立模块用于供组内企业建立沟通圈子,进而可以实现项目上的互相指导,降低各个企业的项目申报成本,提高申报成功率。
以上的仅是本发明的实施例,该发明不限于此实施案例涉及的领域,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。