CN112667825B - 基于知识图谱的智能推荐方法、装置、设备及存储介质 - Google Patents
基于知识图谱的智能推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112667825B CN112667825B CN202110084991.6A CN202110084991A CN112667825B CN 112667825 B CN112667825 B CN 112667825B CN 202110084991 A CN202110084991 A CN 202110084991A CN 112667825 B CN112667825 B CN 112667825B
- Authority
- CN
- China
- Prior art keywords
- policy
- enterprise
- entity
- knowledge graph
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013136 deep learning model Methods 0.000 claims abstract description 28
- 238000013145 classification model Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 14
- 230000006399 behavior Effects 0.000 claims description 10
- 230000007115 recruitment Effects 0.000 claims description 7
- 230000007717 exclusion Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种基于知识图谱的智能推荐方法、装置、设备及存储介质。所述方法包括:从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;接收用户终端输入的查询数据,根据所述查询数据到所述企业知识图谱中查询企业实体,并匹配相应地政策项目实体,从而能够更加准确的为企业匹配政策项目,提高企业申请政策项目的积极性。
Description
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种基于知识图谱的智能推荐方法、装置、设备及存储介质。
背景技术
为促进产业升级,创新驱动发展。各地区、各部门推出促进产业发展政策,如产业发展基金。企业做产业发展的个体,如何快速、精准享受到政策服务,一直是企业服务部门的难题。政策匹配根据企业的注册地、注册资本、经营范围、行业等基本信息匹配相关产业政策项目。基于知识图谱的智能匹配实现从企业找政策项目到政策项目智能匹配企业,提高企业服务部门的服务企业精准,高效的利用产业发展基金,积极落实了产业发展政策。
一般政策推荐系统中,企业需要选择与自身相匹配的项目时需要逐个项目的查看和理解,这降低了企业申报产业资金的意愿,也使产业资金不能充分发挥应有的作用,然而现有的推荐结果存在计算可信度比较低,推荐结果的可解释性不足,难以让用户信服。系统处理对象复杂性高,可扩展性不好。当新用户或新项目增多时,推荐记录会出现不准确的情况等。
发明内容
本发明实施例提供了一种基于知识图谱的智能推荐方法、装置、设备及存储介质,旨在解决现有政策匹配推荐方法不准确的问题。
第一方面,本发明实施例提供了一种基于知识图谱的智能推荐方法,其包括:
从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;
通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;
从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;
接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业;
根据所述查询数据到所述企业知识图谱中查询企业实体;
若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端;
若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。
第二方面,本发明实施例还提供了一种基于知识图谱的智能推荐装置,其包括用于执行上述方法的单元。
第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
本发明实施例提供了一种基于知识图谱的智能推荐方法、装置、计算机设备及存储介质。其中,所述方法包括:从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;接收用户终端输入的查询数据,根据所述查询数据到所述企业知识图谱中查询企业实体,并匹配相应地政策项目实体。通过对政策项目中属性提取,使得匹配粒度更加细化。同时,基于知识图谱的智能推荐,对推荐结果具有很高的解释性,可以让用户信服。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于知识图谱的智能推荐方法的原理图;
图2为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
请参阅图1,本发明实施例提供一种基于知识图谱的智能推荐方法。基于图1的构思,本实施例中,包括如下步骤S1-S7。
S1,从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据。其中,所述政策项目数据包括政策来源、项目说明、支持对象、限制对象以及排除对象。所述企业数据包括基本信息以及行为信息;所述基本信息包括企业的注册地址、上市属性、统计关系以及法人;所述行为信息包括企业的经营信息、招聘信息以及招投标信息。
具体实施中,利用分布式大数据采集技术,从各个政策发布网站抓取政策项目数据,其中包括政策来源、项目说明、支持对象、限制对象以及排除对象等数据,以上数据均为非结构数据(文本)。
进一步地,从企业信息公示网站抓取企业数据,企业数据包括企业的注册地址、上市属性、统计关系、法人等基本信息,以及企业的经营信息、招聘信息以及招投标信息等行为信息。企业数据包括结构数据和非结构数据。
以上抓取到的内容为知识图谱提供原料。
S2,通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别。
具体实施中,行业类别是政策推荐一个重要维度。企业名称和企业经营范围反映了行业类别,同时政策数据也是由相关行业的主管部门制定的。由于国民经济行业分类不能反映准确政策,需要通过制定符合政策推荐的行业类别。
具体地,对企业、政策数据进行行业分类。利用深度学习模型来预测政策项目数据以及企业数据的行业类别。其中,深度学习模型的网络结构是BERT和Softmax。BERT主要用于提取文本特征,Softmax作为输出层。对于企业行业分类的输入为企业名称和企业经营范围。对于政策数据行业分类输入为政策支持对象。
可以理解地,在执行步骤S2之前需要先执行如下步骤:对所述深度学习模型进行训练。具体地,可采用监督式学习的方式进行训练,即采用大量标注过的数据来对深度学习模型进行训练。
S3,从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱。其中,所述企业知识图谱的实体包括企业以及人,所述企业知识图谱的实体的属性包括注册资本,注册日期,人数,地址以及营业收入;所述政策知识图谱的实体包括政策项目;所述政策知识图谱的实体的属性包括政策行业类别以及政策项目条件。
具体实施中,从所述政策项目数据中抽取实体以及属性,并构建政策知识图谱。政策知识图谱是以政策项目为实体,政策项目实体的属性包括政策行业类别、政策项目条件。企业与政策项目直接的关系为已申请。
进一步地,从所述企业数据中抽取实体以及属性,并建立企业知识图谱。企业知识图谱是主要有企业、人等实体,企业实体的属性包括注册资本,注册日期,人数,地址,营业收入等。
以上实体以及属性抽取通过如下方式进行:1、结构化的企业数据按照schema定义入库到图数据库中。2、利用深度学习模型来抽取,其中,该深度学习模型的网络结构是BERT和CRF。BERT用于文本特征提取,CRF进行序列标注。
S4,接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业。
具体实施中,用户终端是指用户使用的终端。接收到用户终端输入的查询数据,查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业,可选项包括成立日期、注册地址、企业人数、营业收入等。
S5,根据所述查询数据到所述企业知识图谱中查询企业实体。
具体实施中,根据用户输入的查询数据,匹配相应的政策项目。匹配方法包括模糊匹配和精准匹配。模糊匹配只有企业名称、企业行业。精准匹配不仅包括企业名称、企业行业,以及其它可选项数据。具体地,根据企业名称、企业行业从知识图谱中,查询企业实体。
S6,若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端。
具体实施中,如果未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端,同时按照政策截至日期进行排序。以上方式为模糊匹配方式。
S7,若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。
具体实施中,若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。以上方式为精准匹配方式。
可以理解地,在执行以上步骤S7之前,所述方法还包括:对所述二分类模型进行训练。具体地,从已经成功申请政策项目的企业中,获取政策项目属性与企业属性。这些共同的属性作为此政策项目推荐依据。对每一个共同属性都建立一个二分类模型。把申请成功政策项目的共同属性值作为正样本,同时把申请过政策项目但没有成功的共同属性值作为负样本,来对二分类模型进行训练。
本发明实施例提出的基于知识图谱的智能推荐方法由智能推荐系统完成,该智能推荐系统包括的模块以及相应模块的功能说明如下:
1,数据抓取模块
利用分布式大数据采集技术,从各个政策发布网站抓取政策项目数据,其中包括政策来源、项目说明、支持对象、限制对象和除外对象等数据,均为非结构数据(文本)。从企业信息公示网站抓取企业数据,包括企业的注册地址、上市属性、统计关系、法人等基本信息,以及企业经营信息、招聘信息、招投标信息等行为信息,包括结构数据和非结构数据。这些内容为知识图谱提供原料。
2,行业分类模块
行业类别是政策推荐一个重要维度。企业名称和企业经营范围反映了行业类别,同时政策数据也是由相关行业的主管部门制定的。由于国民经济行业分类不能反映准确政策,需要通过制定符合政策推荐的行业类别。
对企业、政策数据进行行业分类。具体地,利用深度学习模型进行分类,深度学习模型的网络结构是BERT和Softmax。BERT主要用于提取文本特征,Softmax作为输出层。对于企业行业分类的输入为企业名称和企业经营范围。对于政策数据行业分类输入为政策支持对象。
3,知识图谱抽取模块
3.1知识图谱schema定义。企业知识图谱是主要有企业、人等实体,企业实体的属性包括注册资本,注册日期,人数,地址,营业收入等。政策知识图谱是以政策项目为实体,政策项目实体属性包括政策行业类别、政策项目条件。企业与政策项目直接的关系为已申请。
3.2实体、属性抽取。1、结构化的企业数据按照schema定义入库到图数据库中。2、利用深度学习模型来抽取,深度学习模型的网络结构是BERT和CRF。BERT用于文本特征提取,CRF进行序列标注。
4,知识图谱推理模块
从已经成功申请政策项目的企业,获取政策项目属性与企业属性。这些共同的属性作为此政策项目推荐依据。对每一个共同属性都建立一个二分类模型。把申请成功政策项目的共同属性值作为正样本,同时把申请过政策项目但没有成功的共同属性值作为负样本。
5.1,用户输入模块
用户输入数据有必选项、可选项。必须项有企业名称、企业行业。必选项有成立日期、注册地址、企业人数、营业收入等等
6,政策匹配模块
根据用户输入数据,匹配相应的政策项目。匹配方法包括模糊匹配和精准匹配。模糊匹配只有企业名称、企业行业。精准匹配不仅包括企业名称、企业行业,以及其它可选项数据。
6.1模糊匹配
根据企业名称、企业行业从知识图谱中,查询企业实体。如果查询成功,进入6.2进行精准匹配。如果没有成功,用企业行业信息对政策项目实体的行业属性匹配,同时按照政策截至日期进行排序。
6.2精准匹配
根据知识图谱推理模块建立的属性二分类模型,进行企业属性与政策项目属性预测。当政策项目属性与企业属性预测都一致时,就匹配输出政策项目。
对应于以上基于知识图谱的智能推荐方法,本发明还提供一种基于知识图谱的智能推荐装置。该基于知识图谱的智能推荐装置包括用于执行上述基于知识图谱的智能推荐方法的单元,该装置可以被配置于服务器中。具体地,该基于知识图谱的智能推荐装置包括:
抓取单元,用于从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;
确定单元,用于通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;
建立单元,用于从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;
输入单元,用于接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业;
查询单元,用于根据所述查询数据到所述企业知识图谱中查询企业实体;
第一匹配单元,用于若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端;
第二匹配单元,用于若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。
在一实施例中,所述政策项目数据包括政策来源、项目说明、支持对象、限制对象以及排除对象。
在一实施例中,所述企业数据包括基本信息以及行为信息;所述基本信息包括企业的注册地址、上市属性、统计关系以及法人;所述行为信息包括企业的经营信息、招聘信息以及招投标信息。
在一实施例中,所述深度学习模型的结构包括BERT以及Softmax,其中,BERT用于提取文本特征,Softmax为输出层。
在一实施例中,所述企业知识图谱的实体包括企业以及人,所述企业知识图谱的实体的属性包括注册资本,注册日期,人数,地址以及营业收入;所述政策知识图谱的实体包括政策项目;所述政策知识图谱的实体的属性包括政策行业类别以及政策项目条件。
在一实施例中,所述基于知识图谱的智能推荐装置还包括:
第一训练单元,用于对所述深度学习模型进行训练。
第二训练单元,用于对所述二分类模型进行训练。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述基于知识图谱的智能推荐装置和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述基于知识图谱的智能推荐装置可以实现为一种计算机程序的形式,该计算机程序可以在如图2所示的计算机设备上运行。
请参阅图2,图2是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图2,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种基于知识图谱的智能推荐方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种基于知识图谱的智能推荐方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;
通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;
从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;
接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业;
根据所述查询数据到所述企业知识图谱中查询企业实体;
若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端;
若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。
在一实施例中,所述政策项目数据包括政策来源、项目说明、支持对象、限制对象以及排除对象。
在一实施例中,所述企业数据包括基本信息以及行为信息;所述基本信息包括企业的注册地址、上市属性、统计关系以及法人;所述行为信息包括企业的经营信息、招聘信息以及招投标信息。
在一实施例中,所述深度学习模型的结构包括BERT以及Softmax,其中,BERT用于提取文本特征,Softmax为输出层。
在一实施例中,所述企业知识图谱的实体包括企业以及人,所述企业知识图谱的实体的属性包括注册资本,注册日期,人数,地址以及营业收入;所述政策知识图谱的实体包括政策项目;所述政策知识图谱的实体的属性包括政策行业类别以及政策项目条件。
在一实施例中,所述通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别之前,所述方法还包括:
对所述深度学习模型进行训练。
在一实施例中,所述将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体之前,所述方法还包括:
对所述二分类模型进行训练。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行如下步骤:
从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;
通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;
从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;
接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业;
根据所述查询数据到所述企业知识图谱中查询企业实体;
若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端;
若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端。
在一实施例中,所述政策项目数据包括政策来源、项目说明、支持对象、限制对象以及排除对象。
在一实施例中,所述企业数据包括基本信息以及行为信息;所述基本信息包括企业的注册地址、上市属性、统计关系以及法人;所述行为信息包括企业的经营信息、招聘信息以及招投标信息。
在一实施例中,所述深度学习模型的结构包括BERT以及Softmax,其中,BERT用于提取文本特征,Softmax为输出层。
在一实施例中,所述企业知识图谱的实体包括企业以及人,所述企业知识图谱的实体的属性包括注册资本,注册日期,人数,地址以及营业收入;所述政策知识图谱的实体包括政策项目;所述政策知识图谱的实体的属性包括政策行业类别以及政策项目条件。
在一实施例中,所述通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别之前,所述方法还包括:
对所述深度学习模型进行训练。
在一实施例中,所述将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体之前,所述方法还包括:
对所述二分类模型进行训练。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,尚且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于知识图谱的智能推荐方法,其特征在于,包括:
从预设的政策发布网站抓取政策项目数据,以及从预设的企业信息公示网站抓取企业数据;
通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别;
从所述政策项目数据中抽取实体以及属性以建立政策知识图谱,以及从所述企业数据中抽取实体以及属性以建立企业知识图谱;
接收用户终端输入的查询数据,所述查询数据包括必选项以及可选项,所述必选项包括企业名称以及企业行业;
根据所述查询数据到所述企业知识图谱中查询企业实体;
若未查询到企业实体,根据所述必选项中的企业行业到所述政策知识图谱中对政策项目实体的行业属性进行匹配,并将匹配到的政策项目实体返回给用户终端;
若查询到企业实体,将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体,并将与所述企业实体相匹配的政策项目实体返回给用户终端;
所述深度学习模型的结构包括BERT以及Softmax,其中,BERT用于提取文本特征,Softmax为输出层;
所述企业知识图谱的实体包括企业以及人,所述企业知识图谱的实体的属性包括注册资本,注册日期,人数,地址以及营业收入;所述政策知识图谱的实体包括政策项目;所述政策知识图谱的实体的属性包括政策行业类别以及政策项目条件。
2.根据权利要求1所述的基于知识图谱的智能推荐方法,其特征在于,所述政策项目数据包括政策来源、项目说明、支持对象、限制对象以及排除对象。
3.根据权利要求1所述的基于知识图谱的智能推荐方法,其特征在于,所述企业数据包括基本信息以及行为信息;所述基本信息包括企业的注册地址、上市属性、统计关系以及法人;所述行为信息包括企业的经营信息、招聘信息以及招投标信息。
4.根据权利要求1所述的基于知识图谱的智能推荐方法,其特征在于,所述通过预设的深度学习模型确定所述政策项目数据以及所述企业数据所属的行业类别之前,所述方法还包括:
对所述深度学习模型进行训练。
5.根据权利要求1所述的基于知识图谱的智能推荐方法,其特征在于,所述将企业实体的企业属性以及政策知识图谱中的政策项目实体的政策项目属性输入到预设的二分类模型中,以由所述二分类模型确定与所述企业实体相匹配的政策项目实体之前,所述方法还包括:
对所述二分类模型进行训练。
6.一种基于知识图谱的智能推荐装置,其特征在于,包括用于执行如权利要求1-5任一项所述方法的单元。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110084991.6A CN112667825B (zh) | 2021-01-19 | 2021-01-19 | 基于知识图谱的智能推荐方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110084991.6A CN112667825B (zh) | 2021-01-19 | 2021-01-19 | 基于知识图谱的智能推荐方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667825A CN112667825A (zh) | 2021-04-16 |
CN112667825B true CN112667825B (zh) | 2024-05-14 |
Family
ID=75415908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110084991.6A Active CN112667825B (zh) | 2021-01-19 | 2021-01-19 | 基于知识图谱的智能推荐方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667825B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553400A (zh) * | 2021-07-26 | 2021-10-26 | 杭州叙简科技股份有限公司 | 一种企业知识图谱实体链接模型的构建方法及装置 |
CN114065058B (zh) * | 2022-01-17 | 2022-04-08 | 成都明途科技有限公司 | 城市推荐方法、装置、电子设备及计算机可读存储介质 |
CN114297515B (zh) * | 2022-03-10 | 2022-06-03 | 成都明途科技有限公司 | 信息推荐方法、装置、电子设备和存储介质 |
CN116775900B (zh) * | 2023-06-13 | 2024-02-02 | 南京智绘星图信息科技有限公司 | 一种基于规则知识图谱驱动的政务辅助管理方法及系统 |
CN117708350B (zh) * | 2024-02-06 | 2024-05-14 | 成都草根有智创新科技有限公司 | 企业政策的信息关联方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491438A (zh) * | 2018-02-12 | 2018-09-04 | 陆夏根 | 一种科技政策检索分析方法 |
CN110928922A (zh) * | 2019-11-27 | 2020-03-27 | 开普云信息科技股份有限公司 | 一种基于大数据挖掘的公共政策分析模型部署方法及其系统 |
CN111191853A (zh) * | 2020-01-06 | 2020-05-22 | 支付宝(杭州)信息技术有限公司 | 风险预测方法及装置、风险查询方法及装置 |
KR102158352B1 (ko) * | 2020-03-27 | 2020-09-21 | (주)케이엔랩 | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 |
CN111930966A (zh) * | 2020-10-07 | 2020-11-13 | 杭州实在智能科技有限公司 | 一种用于数字政务的智能政策匹配方法及系统 |
-
2021
- 2021-01-19 CN CN202110084991.6A patent/CN112667825B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491438A (zh) * | 2018-02-12 | 2018-09-04 | 陆夏根 | 一种科技政策检索分析方法 |
CN110928922A (zh) * | 2019-11-27 | 2020-03-27 | 开普云信息科技股份有限公司 | 一种基于大数据挖掘的公共政策分析模型部署方法及其系统 |
CN111191853A (zh) * | 2020-01-06 | 2020-05-22 | 支付宝(杭州)信息技术有限公司 | 风险预测方法及装置、风险查询方法及装置 |
KR102158352B1 (ko) * | 2020-03-27 | 2020-09-21 | (주)케이엔랩 | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 |
CN111930966A (zh) * | 2020-10-07 | 2020-11-13 | 杭州实在智能科技有限公司 | 一种用于数字政务的智能政策匹配方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112667825A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112667825B (zh) | 基于知识图谱的智能推荐方法、装置、设备及存储介质 | |
US11475143B2 (en) | Sensitive data classification | |
US11544273B2 (en) | Constructing event distributions via a streaming scoring operation | |
Petralia et al. | Unveiling the geography of historical patents in the United States from 1836 to 1975 | |
US11693907B2 (en) | Domain-specific negative media search techniques | |
US20190138653A1 (en) | Calculating relationship strength using an activity-based distributed graph | |
US8856229B2 (en) | System and method for social networking | |
US11755585B2 (en) | Generating enriched events using enriched data and extracted features | |
CN112613917B (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
US11436512B2 (en) | Generating extracted features from an event | |
US20200110842A1 (en) | Techniques to process search queries and perform contextual searches | |
US11538005B2 (en) | Long string pattern matching of aggregated account data | |
US11586731B2 (en) | Risk-aware entity linking | |
US11080109B1 (en) | Dynamically reweighting distributions of event observations | |
CN113722611A (zh) | 政务服务的推荐方法、装置、设备及计算机可读存储介质 | |
US11269894B2 (en) | Topic-specific reputation scoring and topic-specific endorsement notifications in a collaboration tool | |
WO2016188334A1 (zh) | 一种用于处理应用访问数据的方法与设备 | |
US11810012B2 (en) | Identifying event distributions using interrelated events | |
CN114297515B (zh) | 信息推荐方法、装置、电子设备和存储介质 | |
US20220269744A1 (en) | Methods and systems for enabling dynamic filters for software search optimization | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN113407859B (zh) | 一种资源推荐方法、装置、电子设备及存储介质 | |
US20230068293A1 (en) | System and method for detecting reputation attacks | |
US20230316325A1 (en) | Generation and implementation of a configurable measurement platform using artificial intelligence (ai) and machine learning (ml) based techniques | |
US20240169195A1 (en) | Machine learning-based systems and methods for identifying and resolving content anomalies in a target digital artifact |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |