CN112184525B - 通过自然语义分析实现智能匹配推荐的系统及方法 - Google Patents
通过自然语义分析实现智能匹配推荐的系统及方法 Download PDFInfo
- Publication number
- CN112184525B CN112184525B CN202011041156.6A CN202011041156A CN112184525B CN 112184525 B CN112184525 B CN 112184525B CN 202011041156 A CN202011041156 A CN 202011041156A CN 112184525 B CN112184525 B CN 112184525B
- Authority
- CN
- China
- Prior art keywords
- enterprise
- items
- recommendation
- item
- policy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000011161 development Methods 0.000 claims abstract description 9
- 238000003058 natural language processing Methods 0.000 claims abstract description 3
- 230000006399 behavior Effects 0.000 claims description 20
- 238000012216 screening Methods 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 230000018109 developmental process Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 6
- 238000007726 management method Methods 0.000 claims description 6
- 238000007621 cluster analysis Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种通过自然语义分析实现智能匹配推荐的系统及方法,包括:自然语义处理模块:接收来自政务网的企业信息、政策信息和企业服务业务办理信息,根据自然语言处理方法进行信息数据抽取和处理;企业画像生成模块:通过抽取的信息数据,分析得到企业对应画像和画像标签;政策分析模块:通过抽取出的信息数据,进行政策的适用范围和评价标准的拆解;推荐模块:根据画像标签、政策范围和评价标准,对企业和对应政策进行匹配和推荐。本发明将企业和政策进行匹配,实现了企业画像与政务事项的智能匹配和推荐,为企业提供更多机会和咨询,促进企业发展。
Description
技术领域
本发明涉及自然语义分析技术领域,具体地,涉及一种通过自然语义分析实现智能匹配推荐的系统及方法。
背景技术
智慧政务作为智慧城市建设中重要的一环,近年来已经逐渐成为一个发展热点。它能提高政府办事效率、缩短居民办事流程,给居民的城市生活带来更好的体验。尤其在智慧政务中的企业服务,智能且高效的服务不仅能方便企业办事人个人的工作,更能促进企业的快速发展,为城市添加更多的活力。
智慧化企业服务带来许多便利和机遇的同时,也是个具有极大挑战性的课题。企业事务和涉及的政策非常多样,更因为不同企业不同的行业、规模、发展状况等衍生出的众多场景,导致企业很难完全掌握自己适用的政策和需要办理的事项。一方面政府需要从被动的协助企业办事转化为主动的向企业推送适用事项,一方面企业需要更多政府扶持和指导,在此背景下,亟需一个能进行智能匹配推荐的企业服务系统来作为桥梁,优化双方效率。本专利正是提供一种通过自然语义分析实现的智能匹配推荐,用以根据企业自身情况个性化推荐企业适用的扶持政策和需要办理事项等,实现企业服务的“千企千面”。
专利文献CN110032637A(申请号:201910302296.5)公开了一种基于自然语义分析技术的简历智能推荐算法,主要是通过自然语义分析来筛选简历,并不适用于企业政务办理,无法适应企业和相关政府部分的需求;
专利文献CN106383876A(申请号:201610815076.9)公开了一种智能化的项目匹配系统,虽然也进行了政策的推送,但是政策本身是通过爬虫获取,有错漏可能,并且需要企业手动填写信息。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种通过自然语义分析实现智能匹配推荐的系统及方法。
根据本发明提供的通过自然语义分析实现智能匹配推荐的系统,包括:
自然语义处理模块:接收来自政务网的企业信息、政策信息和企业服务业务办理信息,根据自然语言处理方法进行信息数据抽取和处理;
企业画像生成模块:通过抽取的信息数据,分析得到企业对应画像和画像标签;
政策分析模块:通过抽取出的信息数据,进行政策的适用范围和评价标准的拆解;
推荐模块:根据画像标签、政策范围和评价标准,对企业和对应政策进行匹配和推荐。
优选的,所述企业画像生成模块包括:
逻辑分析模块:根据预设规则,对提取的信息数据进行规则逻辑判断,得到画像标签;
企业画像管理模块:生成企业画像,并通过画像标签进行权重分析和标记,在应用中进行最优控制。
优选的,所述政策分析模块包括:
条件抽取模块:对政策适用的范围进行分析和必要条件的筛选;
评价抽取模块:对政策评价方式进行分析,进行充分条件和控制条件的筛选。
优选的,所述推荐模块包括:
匹配推荐模块:通过政策的适用条件范围筛选以及评价评估,推荐企业匹配的政策和事项;
同类推荐模块:对企业画像进行聚类分析,得到类似企业,根据类似企业的办理事项,进行部分条件筛选,推荐类似企业感兴趣的事项和政策;
行为推荐模块:通过用户的行为分析和事项关联,围绕企业兴趣点进行推荐;
推荐输出模块:对推荐内容进行整理和输出,生成推荐理由,并对推荐系统进行评价和改进。
根据本发明提供的通过自然语义分析实现智能匹配推荐的方法,包括:
步骤1:建立自然语义处理模型和逻辑规则;
步骤2:根据自然语义处理模型,对政务网数据进行分析,包括企业信息、业务办理信息和政策信息;
步骤3:生成企业画像;
步骤4:对政策进行分析;
步骤5:进行匹配推荐分析;
步骤6:进行同类推荐分析;
步骤7:进行用户行为分析;
步骤8:根据推荐效果进行排序并给出推荐理由;
步骤9:对推荐系统和推荐算法进行评价。
优选的,所述步骤1包括:
步骤1.1:建立语料库,包括企业画像各个维度的语料库、政府政策语料库和政务企业服务事项语料库;
步骤1.2:进行语料清洗,包括实体提取、逻辑规则提取、正则匹配、去重和标注;
步骤1.3:根据语义处理模型,将字序列切分为符合人类语义理解的词汇,采用CRF算法结合词典进行分词;
步骤1.4:进行词性标注,系统采用隐马尔可夫模型,区分不同词性;
步骤1.5:基于独热码,将词转化为稠密向量,以作为自然语义处理模型的特征;
步骤1.6:采用RNN模型训练自然语义处理模型;
步骤1.7:基于企业信息和政策信息规定逻辑分析规则,包括行业分析规则;
步骤1.8:基于企业信息和政策信息制定规则生成框架;
步骤1.9:基于随机森林算法对企业的统计数据进行分类;
步骤1.10:结合三西格玛准则得到数据的理论分布,并依据理论分布辅助进行企业画像分类规则的生成。
优选的,所述步骤3包括:
步骤3.1:从行业维度、企业规模维度、企业发展阶段维度、业务维度、舆情维度、知识产权维度、业务办理历史维度这七个不同维度进行分析,抽取企业关键词;
步骤3.2:依据关键词的来源、关联权重、关联频次对画像标签进行筛选和排序;
所述步骤4包括:
步骤4.1:建立事项与政策、事项与事项、政策与政策之间的关联;
步骤4.2:对每个事项,根据相关事项和政策,获取其适用范围的必要条件和评价标准;
所述步骤5包括:
步骤5.1:将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;
步骤5.2:将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;
步骤5.3:将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;
所述步骤6包括:
步骤6.1:将企业画像进行聚类分析,得到企业的类似企业;
步骤6.2:筛选出类似企业办理的事项,作为当前企业的推荐。
优选的,所述步骤7包括:
步骤7.1:分析用户行为,包括查看事项、询问问题、点击事项频次和停留时间,通过不同行为加权平均得到用户的感兴趣事项;
步骤7.2:根据政策与事项的关联性,推荐用户感兴趣的事项。
优选的,所述步骤8包括:
步骤8.1:对推荐事项进行加权融合与排序,使与用户关联程度更高的推荐事项进行更靠前显示;
步骤8.2:根据推荐事项的生成来源,将推荐事项打上推荐理由标签。
优选的,所述步骤9包括:
步骤9.1:根据准确率、召回率和F1值,对推荐事项进行正确性评价;
步骤9.2:根据平均准确率和归一化折扣增益值,对推荐事项排序进行评价。
与现有技术相比,本发明具有如下的有益效果:
1、本发明利用自然语义处理技术,从七个维度出发对企业的整体情况进行分析,形成了全面的企业画像;梳理政府政策和企业办事事项,抽取事项的必要性、适用范围、评价标准等,将需要人工阅读和处理的文本内容转化为可以进行智能匹配和计算的量化指标;
2、本发明通过计算企业和政策的匹配,实现了企业画像与政务事项的智能匹配和推荐,为企业提供更多机会和咨询,促进企业发展;
3、本发明通过企业画像的聚类分析,计算类似企业,并针对同类企业推送诸如行业新闻、行业活动、同类企业办理事务、最新政策等,增加企业竞争力,使企业不落于人后。
4、本发明通过对企业用户行为的分析,推送企业可能需要关注的事项,辅助企业办理所需事务;对推荐列表智能排序,并配有解释系统,让企业得到最合适的推荐,除此之外,推荐系统还能通过企业反馈评价进行反复改进,使系统越来越适应实际情况。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为系统模块关系示意图;
图2为系统方法流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
如图1,根据本发明提供的通过自然语义分析实现智能匹配推荐的系统,包括:
自然语义处理模块,接收来自政务网的企业信息、政策信息、企业服务业务办理信息等,利用自然语义处理来进行信息的抽取和处理,便于进行后续分析。
企业画像生成模块,通过抽取的数据,分析得到企业对应画像标签;
政策分析模块,利用抽取出的数据,进行政策条件范围和评价标准的拆解;
推荐模块,结合以上模块的输出,通过智能的分析,实现对企业和政策的匹配推荐。
所述企业画像生成模块包括:
逻辑分析模块,用于根据已有规则,提取的信息进行规则逻辑判断以得到画像标签。
企业画像管理模块,进行企业画像的生成,并对生成的画像标签进行权重分析和标记,从而在应用中达到最优效果。
所述政策分析模块包括:
条件抽取模块,对政策适用的范围进行分析,即进行必要条件的筛选。
评价抽取模块,对政策评价方式进行分析,即进行充分条件和加分条件的筛选。
所述推荐模块包括:
匹配推荐模块,基于内容的推荐模块,通过政策的适用条件范围筛选以及评价评估,来推荐企业匹配的政策和事项,包含子模块:条件筛选模块、智能评分模块。
同类推荐模块,基于用户的推荐,通过企业画像的聚类分析,得到类似企业,根据类似企业的办理事项,辅以部分条件筛选,来得到企业可能感兴趣的事项和政策,包含子模块:聚类分析模块、推荐筛选模块。
行为推荐模块,基于隐式用户反馈的推荐模块,通过用户的行为分析,以及事项关联等,围绕企业兴趣点展开推荐,包含子模块:行为分析模块、行为关联模块。
推荐输出模块,对推荐进行整理和输出,主要包括对其他模块推荐的内容进行排序,生成推荐理由,并对推荐系统进行评价,以便进行系统改进,其中包含以下子模块:推荐排序模块、推荐理由模块、推荐评价模块。
如图2,根据本发明提供的通过自然语义分析实现智能匹配推荐的方法,包括:
步骤1:进行预处理,具体是自然语义处理模型的建立和逻辑规则的建立;
步骤2:利用步骤1建立部署的模型对政务网数据进行分析,包括企业信息、业务办理信息、政策信息等;
步骤3:生成企业画像;
步骤4:对政策进行具体分析;
步骤5:进行匹配推荐分析;
步骤6:进行同类推荐分析;
步骤7:进行用户行为分析;
步骤8:对推荐进行排序和解释;
步骤9:推送推荐,进行对系统和算法的评价。
所述步骤1包括:
步骤1.1:自然语义处理模型的建立;
步骤1.2:企业画像判定逻辑规则的建立;
所述步骤1.1包括:
步骤1.1.1:建立语料库,包括但不限于企业画像各个维度的语料库(企业行业、规模、发展、知识产权、业务范围等七个维度)、政府政策语料库、政务企业服务事项语料库等。
步骤1.1.2:进行语料清洗,包括实体提取、逻辑规则提取、正则匹配、部分人工操作(如去重、标注等)等;
步骤1.1.3:分词,即根据语义模型,将字序列切分为符合人类语义理解的词汇,系统采用CRF算法结合词典进行分词。
步骤1.1.4:进行词性标注(Part-of-Speech tagging或POS tagging),系统采用隐马尔可夫模型(HMM),区分不同词性如名词、动词、形容词等。
步骤1.1.5:特征工程,基于One-hot,将词转化为稠密向量,以作为深度学习模型的特征。
步骤1.1.6:训练模型,受限于数据规模,系统采用比较传统的RNN模型。
所述步骤1.2包括:
步骤1.2.1:基于企业相关理论和学习以及国家政策直接规定部分逻辑分析规则,如行业分析规则等。
步骤1.2.2:基于企业相关理论和学习和国家政策制定部分规则生成的框架,为后续步骤提供理论基础;
步骤1.2.3:基于随机森林等方法对企业的统计数据进行分类。
步骤1.2.4:结合三西格玛准则得到的数据的理论分布,并依据理论分布来辅助进行部分企业画像分类规则生成。
所述步骤3包括:
步骤3.1:从行业维度、企业规模维度、企业发展阶段维度、业务维度、舆情维度、知识产权维度、业务办理历史维度等七个不同维度进行分析,抽取企业相关关键词;
步骤3.2:依据关键词的来源、关联权重、关联频次等对画像关键词进行筛选和排序。
所述步骤4包括:
步骤4.1:建立事项与政策、事项与事项、政策与政策之间的关联;
步骤4.2:对每个事项,根据相关事项和政策,抽取其适用范围(必要条件);
步骤4.3:对每个事项,根据相关事项和政策,抽取其评价标准(加分项、评分权重等);
步骤4.4:对每个事项,根据相关事项和政策,抽取其奖励(若有)或其必要性(若有);
所述步骤5包括:
步骤5.1:将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;
步骤5.2:将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;
步骤5.3:将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;
所述步骤6包括:
步骤6.1:将企业画像进行聚类分析,从而得到企业的类似企业;
步骤6.2:筛选出类似企业办理的事项,作为当前企业的推荐;
所述步骤7包括:
步骤7.1:分析用户行为,如查看了哪些事项、询问了哪些问题、点击事项频次和停留时间等,通过不同行为加权平均得到用户的感兴趣事项;
步骤7.2:依据政策与事项分析中得到的关联关系,推荐用户可能感兴趣或需要的其他事项;
所述步骤8包括:
步骤8.1:对各模块产出的推荐进行加权融合与排序,使与用户关联程度更高的推荐更靠前显示;
步骤8.2:根据推荐的生成来源,将推荐打上推荐理由标签,如:通过步骤5.3得到的推荐将被标记为“可能需要完成的事项”,同时通过步骤5.1、5.2得到并且抽取奖励价值高的事项将被标记为“成功率高的事项”和“扶持奖励事项”;
所述步骤9包括:
步骤9.1:对于推荐集合的正确性评价,系统采用准确率(Precision)、召回率(Recall)、F1值(F1-Measure)。精确率计算的是预测结果中多少是正确的正结果预测,它体现的是模型区分负样本的能力;召回率计算的是样本中有多少的正结果被预测正确了,是体现模型对正样本的识别能力;F1值则是两者的综合,体现模型的稳健性。由于推荐栏位固定,系统适用Precision@n(P@n)、Recall@n(R@n)、F1@n来进行度量。
步骤9.2:对于推荐事项排序的评价,系统采用平均准确率(MAP)和归一化折扣增益值(Normalized Discounted Cumulative Gain,NDCG)来进行。
实施例2:
针对政策匹配的推荐:
对于A公司,系统将首先根据A公司信息,通过自然语义处理得到A的企业画像。企业画像为一些含有权重的标签,例如“研究和试验发展”(行业)、“人工智能产品”(经营范围)、“智能制造执行系统软件”(软著标签)、“2009-05-05”(注册时间)等。
而对于政策和事项,系统会分析出政策和事项关联,并给出事项的必要性、适用范围、评价标准。例如对于高新技术企业认定事项,将关联“高新技术企业认定管理办法”、“高新技术企业认定管理工作指引”等政策,“技术合同认定登记”等事项。系统分析该事项为“对于所有企业”的“非必要”事项,适用范围要求包括但不限于:“企业申请认定时须工商注册满一年以上”、“主要产品属于电子信息技术(包括计算机辅助工程管理软件)、生物与新医药技术、航空航天技术等领域(《国家重点支持的高新技术领域》内定义的领域)”等,评价标准包括但不限于企业创新能力评价等。抽取事项的奖励为“享受税收优惠政策”等。
分别进行分析后,系统将为企业与事项进行匹配计算。事项匹配计算发现公司符合高新技术评定要求(注册时间满一年以上,产品属于电子信息技术内的计算机辅助工程管理软件等)。事项成功率计算得出,企业知识产权、研究开发组织管理水平得分很高,科技成果转化能力一般,综合评定为一个成功率较高的事项。必要性分析为事项属于非必要事项。
综上,系统分析后推送高新技术企业认定事项给用户,并将解释为“成功率较高”、“奖励事项”。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (1)
1.一种通过自然语义分析实现智能匹配推荐的方法,其特征在于,采用智能匹配推荐系统进行智能匹配推荐,所述智能匹配推荐系统包括:
自然语义处理模块:接收来自政务网的企业信息、政策信息和企业服务业务办理信息,根据自然语言处理方法进行信息数据抽取和处理;
企业画像生成模块:通过抽取的信息数据,分析得到企业对应画像和画像标签;
政策分析模块:通过抽取出的信息数据,进行政策的适用范围和评价标准的拆解;
推荐模块:根据画像标签、政策范围和评价标准,对企业和对应政策进行匹配和推荐;
所述企业画像生成模块包括:
逻辑分析模块:根据预设规则,对提取的信息数据进行规则逻辑判断,得到画像标签;
企业画像管理模块:生成企业画像,并通过画像标签进行权重分析和标记,在应用中进行最优控制;
所述政策分析模块包括:
条件抽取模块:对政策适用的范围进行分析和必要条件的筛选;建立事项与政策、事项与事项、政策与政策之间的关联;所述事项为企业需要办理的事项;
评价抽取模块:对政策评价方式进行分析,进行充分条件和控制条件的筛选;对每个事项,根据相关事项和政策,获取其适用范围的必要条件和评价标准;
所述推荐模块包括:
匹配推荐模块:通过政策的适用条件范围筛选以及评价评估,推荐企业匹配的政策和事项;将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;
同类推荐模块:对企业画像进行聚类分析,得到类似企业,根据类似企业的办理事项,进行部分条件筛选,推荐类似企业感兴趣的事项和政策;
行为推荐模块:通过用户的行为分析和事项关联,围绕企业兴趣点进行推荐;分析用户行为,包括查看事项、询问问题、点击事项频次和停留时间,通过不同行为加权平均得到用户的感兴趣事项;根据政策与事项的关联性,推荐用户感兴趣的事项;
推荐输出模块:对推荐内容进行整理和输出,生成推荐理由,并对推荐系统进行评价和改进;对推荐事项进行加权融合与排序,使与用户关联程度更高的推荐事项进行更靠前显示;根据推荐事项的生成来源,将推荐事项打上推荐理由标签;根据准确率、召回率和F1值,对推荐事项进行正确性评价;根据平均准确率和归一化折扣增益值,对推荐事项排序进行评价;
智能匹配推荐的具体步骤包括:
步骤1:建立自然语义处理模型和逻辑规则;
步骤2:根据自然语义处理模型,对政务网数据进行分析,包括企业信息、业务办理信息和政策信息;
步骤3:生成企业画像;
步骤4:对政策进行分析;
步骤5:进行匹配推荐分析;
步骤6:进行同类推荐分析;
步骤7:进行用户行为分析;
步骤8:根据推荐效果进行排序并给出推荐理由;
步骤9:对推荐系统和推荐算法进行评价;
所述步骤1包括:
步骤1.1:建立语料库,包括企业画像各个维度的语料库、政府政策语料库和政务企业服务事项语料库;
步骤1.2:进行语料清洗,包括实体提取、逻辑规则提取、正则匹配、去重和标注;
步骤1.3:根据语义处理模型,将字序列切分为符合人类语义理解的词汇,采用CRF算法结合词典进行分词;
步骤1.4:进行词性标注,系统采用隐马尔可夫模型,区分不同词性;
步骤1.5:基于独热码,将词转化为稠密向量,以作为自然语义处理模型的特征;
步骤1.6:采用RNN模型训练自然语义处理模型;
步骤1.7:基于企业信息和政策信息规定逻辑分析规则,包括行业分析规则;
步骤1.8:基于企业信息和政策信息制定规则生成框架;
步骤1.9:基于随机森林算法对企业的统计数据进行分类;
步骤1.10:结合三西格玛准则得到数据的理论分布,并依据理论分布辅助进行企业画像分类规则的生成;
所述步骤3包括:
步骤3.1:从行业维度、企业规模维度、企业发展阶段维度、业务维度、舆情维度、知识产权维度、业务办理历史维度这七个不同维度进行分析,抽取企业关键词;
步骤3.2:依据关键词的来源、关联权重、关联频次对画像标签进行筛选和排序;
所述步骤4包括:
步骤4.1:建立事项与政策、事项与事项、政策与政策之间的关联;
步骤4.2:对每个事项,根据相关事项和政策,获取其适用范围的必要条件和评价标准;
所述步骤5包括:
步骤5.1:将事项必要条件与企业画像进行匹配,计算企业与事项匹配程度;
步骤5.2:将事项评价标准与企业画像进行匹配,计算企业与事项成功可能性;
步骤5.3:将事项必要性与企业画像进行匹配,得到企业是否必须完成该事项;
所述步骤6包括:
步骤6.1:将企业画像进行聚类分析,得到企业的类似企业;
步骤6.2:筛选出类似企业办理的事项,作为当前企业的推荐;
所述步骤7包括:
步骤7.1:分析用户行为,包括查看事项、询问问题、点击事项频次和停留时间,通过不同行为加权平均得到用户的感兴趣事项;
步骤7.2:根据政策与事项的关联性,推荐用户感兴趣的事项;
所述步骤8包括:
步骤8.1:对推荐事项进行加权融合与排序,使与用户关联程度更高的推荐事项进行更靠前显示;
步骤8.2:根据推荐事项的生成来源,将推荐事项打上推荐理由标签;
所述步骤9包括:
步骤9.1:根据准确率、召回率和F1值,对推荐事项进行正确性评价;
步骤9.2:根据平均准确率和归一化折扣增益值,对推荐事项排序进行评价;
针对政策匹配的推荐:
首先根据公司信息,通过自然语义处理得到企业画像,所述企业画像为权重标签,包括行业、经营范围、软著标签和注册时间;
将政策和事项关联,给出事项的必要性、适用范围、评价标准,并分别进行分析;
最好将企业与事项进行匹配计算,得到匹配结果并进行推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041156.6A CN112184525B (zh) | 2020-09-28 | 2020-09-28 | 通过自然语义分析实现智能匹配推荐的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011041156.6A CN112184525B (zh) | 2020-09-28 | 2020-09-28 | 通过自然语义分析实现智能匹配推荐的系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112184525A CN112184525A (zh) | 2021-01-05 |
CN112184525B true CN112184525B (zh) | 2021-11-26 |
Family
ID=73944856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011041156.6A Active CN112184525B (zh) | 2020-09-28 | 2020-09-28 | 通过自然语义分析实现智能匹配推荐的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112184525B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052434A (zh) * | 2021-02-26 | 2021-06-29 | 一智科技(成都)有限公司 | 施工对象画像标签方法及系统 |
CN112990715B (zh) * | 2021-03-22 | 2024-08-20 | 数字浙江技术运营有限公司 | 政策信息的推送方法和装置 |
CN113033685A (zh) * | 2021-04-01 | 2021-06-25 | 安徽理工大学 | 一种航空旅客付费选座意愿画像及分析的方法 |
CN112948565A (zh) * | 2021-04-16 | 2021-06-11 | 北京小米移动软件有限公司 | 人机对话方法、装置、电子设备及存储介质 |
CN113158040A (zh) * | 2021-04-19 | 2021-07-23 | 广州欢网科技有限责任公司 | 智能电视热点标签提炼及相关视频推荐方法、装置和设备 |
CN113034053A (zh) * | 2021-04-29 | 2021-06-25 | 福建引征科技有限公司 | 一种基于政策信息与服务对象之间匹配及评估的建模方法 |
CN113723737A (zh) * | 2021-05-11 | 2021-11-30 | 天元大数据信用管理有限公司 | 一种基于企业画像的政策匹配方法、装置、设备及介质 |
CN113468418A (zh) * | 2021-06-21 | 2021-10-01 | 广州政企互联科技有限公司 | 一种政策数据智能推荐方法及系统 |
CN113421172B (zh) * | 2021-07-09 | 2022-04-05 | 恒瑞通(福建)信息技术有限公司 | 一种政策信息推送方法及装置 |
CN113641903B (zh) * | 2021-08-16 | 2022-05-24 | 中投国信(北京)科技发展有限公司 | 基于人工智能的业务匹配方法及服务器 |
CN113379581B (zh) * | 2021-08-16 | 2021-11-02 | 迅管(深圳)科技有限公司 | 基于用户画像的专项服务推送方法及系统 |
CN116737968B (zh) * | 2023-08-15 | 2023-10-31 | 北京正开科技有限公司 | 基于大数据的政策信息智慧管理平台 |
CN117033801B (zh) * | 2023-10-08 | 2023-12-22 | 太平金融科技服务(上海)有限公司 | 一种业务推荐方法、装置、设备和存储介质 |
CN118014809B (zh) * | 2024-04-10 | 2024-07-12 | 中国科学技术大学 | 一种基于多智能体仿真实验的公共政策生成方法及系统 |
CN118396350A (zh) * | 2024-06-28 | 2024-07-26 | 苔花科迈(西安)信息技术有限公司 | 应用于矿井侧的煤矿安全合规管控方法及系统 |
CN118520176B (zh) * | 2024-07-23 | 2024-09-17 | 成都市数字城市运营管理有限公司 | 一种基于人工智能的精准化推荐方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104375998A (zh) * | 2013-08-13 | 2015-02-25 | 王建平 | 一种智能化的项目匹配分析工具及其实现方法 |
US10057775B2 (en) * | 2009-01-28 | 2018-08-21 | Headwater Research Llc | Virtualized policy and charging system |
CN109726393A (zh) * | 2018-12-17 | 2019-05-07 | 浪潮软件集团有限公司 | 一种基于自然语言处理技术的政策分析系统及方法 |
CN110175730A (zh) * | 2018-07-06 | 2019-08-27 | 深圳市云科产业技术有限公司 | 一种基于大数据的政府政策智能与企业匹配的系统及方法 |
CN111652524A (zh) * | 2020-06-11 | 2020-09-11 | 中力数创(重庆)科技有限公司 | 一种政策智能匹配与引导改善路径的方法与装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457696A (zh) * | 2019-07-31 | 2019-11-15 | 福州数据技术研究院有限公司 | 一种面向档案数据的人才与政策智能匹配系统和方法 |
-
2020
- 2020-09-28 CN CN202011041156.6A patent/CN112184525B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10057775B2 (en) * | 2009-01-28 | 2018-08-21 | Headwater Research Llc | Virtualized policy and charging system |
CN104375998A (zh) * | 2013-08-13 | 2015-02-25 | 王建平 | 一种智能化的项目匹配分析工具及其实现方法 |
CN110175730A (zh) * | 2018-07-06 | 2019-08-27 | 深圳市云科产业技术有限公司 | 一种基于大数据的政府政策智能与企业匹配的系统及方法 |
CN109726393A (zh) * | 2018-12-17 | 2019-05-07 | 浪潮软件集团有限公司 | 一种基于自然语言处理技术的政策分析系统及方法 |
CN111652524A (zh) * | 2020-06-11 | 2020-09-11 | 中力数创(重庆)科技有限公司 | 一种政策智能匹配与引导改善路径的方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112184525A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112184525B (zh) | 通过自然语义分析实现智能匹配推荐的系统及方法 | |
Deepak et al. | A novel firefly driven scheme for resume parsing and matching based on entity linking paradigm | |
CN107491531B (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
US10089581B2 (en) | Data driven classification and data quality checking system | |
CN110457676B (zh) | 评价信息的提取方法及装置、存储介质、计算机设备 | |
KR20200007969A (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
US20050120009A1 (en) | System, method and computer program application for transforming unstructured text | |
US10083403B2 (en) | Data driven classification and data quality checking method | |
Kaur | Incorporating sentimental analysis into development of a hybrid classification model: A comprehensive study | |
CN112163424A (zh) | 数据的标注方法、装置、设备和介质 | |
CN113627797B (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN112862569B (zh) | 基于图像和文本多模态数据的产品外观风格评价方法和系统 | |
US20200356725A1 (en) | System and method for automatically tagging customer messages using artificial intelligence models | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
Mehrbod et al. | Tender calls search using a procurement product named entity recogniser | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
CN113011156A (zh) | 审核文本的质检方法、装置、介质以及电子设备 | |
WO2021042529A1 (zh) | 文章摘要自动生成方法、装置及计算机可读存储介质 | |
Patil et al. | Novel technique for script translation using NLP: performance evaluation | |
CN114742062B (zh) | 文本关键词提取处理方法及系统 | |
Khritankov et al. | Discovering text reuse in large collections of documents: A study of theses in history sciences | |
Haris et al. | Sentiment classification from reviews for tourism analytics | |
CN114417010A (zh) | 面向实时工作流的知识图谱构建方法、装置和存储介质 | |
JP2003036261A (ja) | 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |