CN115687787A - 产业政策目标群画像构建方法、系统及存储介质 - Google Patents

产业政策目标群画像构建方法、系统及存储介质 Download PDF

Info

Publication number
CN115687787A
CN115687787A CN202211450227.7A CN202211450227A CN115687787A CN 115687787 A CN115687787 A CN 115687787A CN 202211450227 A CN202211450227 A CN 202211450227A CN 115687787 A CN115687787 A CN 115687787A
Authority
CN
China
Prior art keywords
enterprise
policy
information
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202211450227.7A
Other languages
English (en)
Inventor
赖晓君
黄焱科
林思远
吴亚东
夏志杰
张耀元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weizheng Intellectual Property Technology Co ltd
Original Assignee
Weizheng Intellectual Property Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weizheng Intellectual Property Technology Co ltd filed Critical Weizheng Intellectual Property Technology Co ltd
Priority to CN202211450227.7A priority Critical patent/CN115687787A/zh
Publication of CN115687787A publication Critical patent/CN115687787A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本申请公开了一种产业政策目标群画像构建方法、系统及存储介质,其涉及企业数据分析技术领域,该方法包括如下步骤:获取所有产业政策信息;获取企业注册用户的用户信息和企业信息,企业信息包括企业领域和企业特征数据;基于企业领域生成企业注册用户的类别标签,并获取具有同一类别标签的所有同行企业注册用户的同行企业信息;结合同行企业信息、用户信息和企业特征数据生成企业注册用户的企业标签;基于企业标签计算所有产业政策信息的政策匹配度;从所有政策匹配度高于预设的匹配度阈值的目标产业政策信息中提取政策标签;结合政策标签和企业标签构建企业注册用户的企业画像。本申请具有生成企业画像有利于政策精准推送的效果。

Description

产业政策目标群画像构建方法、系统及存储介质
技术领域
本申请涉及企业数据分析技术领域,尤其是涉及一种产业政策目标群画像构建方法、系统及存储介质。
背景技术
中小型企业具有数量多,分布广,经营方式灵活等特点,其在缓解就业压力,经济增长以及社会稳定方面凸显出巨大的力量。现今随着小型创业公司的数量越来越多,各地政府对中小创新型企业的扶持力度加大,出台的各项产业政策也逐渐增多,但由于产业政策数量繁多、类型繁杂,且不同类型产业政策的发布渠道和发布平台也各不相同,导致中小型企业难以快速获知产业政策发布的最新信息。
因此在现有技术中,一些企业研发出了可以汇总所有产业政策的APP,建立产业政策数据库,实时抓取各个平台和渠道中所发布的产业政策信息,并存储到产业政策数据库中,企业用户可以注册APP,并通过APP可以查询到所有的产业政策,从而可以及时了解申报适合自己企业的产业政策。
针对上述中的相关技术,发明人认为存在有以下缺陷:当有平台发布新的产业政策信息时,只能将新产业政策信息抓取至数据库中,难以向相关企业用户进行精准推送,企业用户还需要自行搜索才能获知,用户体验感较差。
发明内容
为了改善当有平台发布新的产业政策信息时难以向相关企业用户进行精准推送的缺陷,本申请提供一种产业政策目标群画像构建方法、系统及存储介质。
第一方面,本申请提供一种产业政策目标群画像构建方法,包括如下步骤:
获取所有产业政策信息;
获取企业注册用户的用户信息和企业信息,所述企业信息包括企业领域和企业特征数据;
基于所述企业领域生成所述企业注册用户的类别标签,并获取具有同一所述类别标签的所有同行企业注册用户的同行企业信息;
结合所述同行企业信息、所述用户信息和所述企业特征数据生成所述企业注册用户的企业标签;
基于所述企业标签计算所有所述产业政策信息的政策匹配度;
从所有所述政策匹配度高于预设的匹配度阈值的目标产业政策信息中提取政策标签;
结合所述政策标签和所述企业标签构建所述企业注册用户的企业画像。
通过采用上述技术方案,在企业管理人员通过前端APP注册企业注册用户时,可以从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
可选的,所述用户信息包括用户搜索记录、用户政策需求和用户法人信息。
可选的,所述结合所述同行企业信息、所述用户信息和所述企业特征数据生成所述企业注册用户的企业标签包括如下步骤:
基于所述用户法人信息从预设的企业数据库中调取所述企业注册用户关联企业的关联企业信息;
结合所述同行企业信息、所述关联企业信息和所述企业特征数据生成所述企业注册用户的一级企业标签;
结合所述用户搜索记录、所述用户政策需求和所述企业特征数据生成所述企业注册用户的二级企业标签;
融合所述一级企业标签和所述二级企业标签得到所述企业注册用户的企业标签。
通过采用上述技术方案,通过用户法人信息可以检索调取出企业注册用户关联企业的关联企业信息,关联企业信息中包含关联企业历史申报过的历史产业政策,同行企业信息中也包含同行企业历史申报过的历史产业政策,因此可以结合同行企业信息、关联企业信息和企业特征数据生成企业注册用户的一级企业标签,一级企业标签可以体现出企业注册用户所契合的相关产业政策。而用户搜索记录主要为企业注册用户通过前端APP进行产业政策信息搜索时所产生的文本记录,用户搜索记录可以体现企业注册用户感兴趣的产业政策信息。用户政策需求则是用户通过前端APP注册时所填写的政策需求文本,可以体现企业注册用户预期需求申报的产业政策,因此结合用户搜索记录、用户政策需求和企业特征数据生成企业注册用户的二级企业标签,二级企业标签可以体现出企业注册用户预想申报或感兴趣的产业政策。
可选的,所述结合所述同行企业信息、所述关联企业信息和所述企业特征数据生成所述企业注册用户的一级企业标签包括如下步骤:
获取所述同行企业信息和所述关联企业信息中的政策申报记录;
获取所述政策申报记录中的历史政策信息;
提取所述历史政策信息的第一政策需求;
将满足所述第一政策需求的所述企业特征数据转换为一级企业标签。
通过采用上述技术方案,由于同行企业和关联企业与企业注册用户具有极强的关联关系,因此同行企业和关联企业所申报的产业政策与企业注册用户也具有很强的相关性,所以可以获取同行企业信息和关联企业信息中的政策申报记录,并通过政策申报记录获取到同行企业和关联企业历史申报的历史政策信息,从历史政策信息中提取出历史政策的政策需求,再将满足政策需求的企业特征数据转换为一级企业标签。
可选的,所述结合所述用户搜索记录、所述用户政策需求和所述企业特征数据生成所述企业注册用户的二级企业标签包括如下步骤:
从所述用户政策需求中提取政策关键词;
在所述用户搜索记录中统计所有所述政策关键词的搜索次数;
判断所述搜索次数是否超出预设的次数阈值;
若所述搜索次数超出所述次数阈值,则基于对应的所述政策关键词在所有所述产业政策信息中检索出关键产业政策信息;
提取所述关键产业政策信息的第二政策需求;
将满足所述第二政策需求的所述企业特征数据转换为二级企业标签。
通过采用上述技术方案,从用户政策需求中提取到多个政策关键词,多个政策关键词所对应的产业政策均为企业注册用户预期需求申报的产业政策,再统计出提取到的政策关键词在用户搜索记录中的搜索次数,若用户对某一政策关键词的搜索次数较高,则说明用户更加关注该政策关键词所对应的产业政策,因此可以根据搜索次数对政策关键词进一步筛选,筛选出的政策关键词所对应的产业政策信息即为关键产业政策信息,进而可以提取出关键产业政策信息的第二政策需求,并将满足第二政策需求的企业特征数据转换为二级企业标签。
可选的,所述基于所述企业标签计算所有所述产业政策信息的政策匹配度包括如下步骤:
提取所述产业政策信息中的所有关键政策文本;
分别计算各个所述企业标签与各个所述关键政策文本之间的词向量相似度;
基于所述词向量相似度标记出所有所述企业标签中的匹配企业标签,并统计所有所述匹配企业标签的标签数量;
结合所述标签数量和所有所述企业标签的标签总数计算所述产业政策信息的政策匹配度。
通过采用上述技术方案,将企业标签和关键政策文本均转换为词向量,转换成词向量后便可计算企业标签和关键政策文本之间的词向量相似度,词向量相似度可以体现两个文本内容的相似程度,词向量相似度越高,两个文本内容的相似程度越高。通过预设的相似度阈值对词向量相似度进行筛选,筛选出词向量相似度高的匹配企业标签,并统计匹配企业标签的标签数量,最后通过计算匹配企业标签的标签数量在标签总数中的占比即可计算得到企业注册用户和产业政策信息的政策匹配度。
可选的,所述基于所述词向量相似度标记出所有所述企业标签中的匹配企业标签,并统计所有所述匹配企业标签的标签数量包括如下步骤:
判断所述词向量相似度是否超出预设的相似度阈值;
若所述词向量相似度超出所述相似度阈值,则将对应的所述企业标签标记为匹配企业标签;
筛除所有所述匹配企业标签的重复标签;
统计筛除后的所有所述匹配企业标签的标签数量。
通过采用上述技术方案,词向量相似度可以体现两个文本内容的相似程度,词向量相似度越高,两个文本内容的相似程度越高,因此可以通过预设的相似度阈值筛选出数值较高的词向量相似度,并将数值较高的词向量相似度对应的企业标签标记为匹配企业标签。由于匹配企业标签可能与多个产业政策信息匹配相似而被重复标记,因此在标记之后还需要筛除所有匹配企业标签中的重复标签,再统计所有匹配企业标签的标签数量。
可选的,在所述结合所述政策标签和所述企业标签构建所述企业注册用户的企业画像之后还包括如下步骤:
监控并获取所述企业注册用户的企业风险信息;
从所述企业风险信息中提取企业风险标签;
基于所述企业风险标签更新所述企业画像。
通过采用上述技术方案,部分产业政策中也存在企业风险指标,企业风险指标中明确了对风险企业的申报限制,若获取到的新产业政策信息中包含企业风险指标,则新产业政策信息不会推送至风险企业的企业用户。因此监控获取企业注册用户的企业风险信息,并生成企业风险标签对企业画像进行更新,可以提升新产业政策信息推送过程中的精确性。
第二方面,本申请还提供一种产业政策目标群画像构建系统,包括存储器和处理器,所述存储器储存有能够在处理器上运行的计算机程序,所述处理器加载并执行所述计算机程序时,采用了第一方面中所述的方法。
通过采用上述技术方案,通过程序的调取,可以在企业管理人员通过前端APP注册企业注册用户时,从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
第三方面,本申请还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如第一方面中所述的方法。
通过采用上述技术方案,通过程序的调取,可以在企业管理人员通过前端APP注册企业注册用户时,从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
综上所述,本申请包括以下有益技术效果:
在企业管理人员通过前端APP注册企业注册用户时,可以从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
附图说明
图1是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图2是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图3是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图4是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图5是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图6是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
图7是本申请实施例的产业政策目标群画像构建方法其中一种实施方式的流程示意图。
具体实施方式
以下结合附图1至7对本申请作进一步详细说明。
本申请实施例公开了一种产业政策目标群画像构建方法。
参照图1,产业政策目标群画像构建方法包括如下步骤:
S101.获取所有产业政策信息。
其中,通过爬虫代码从各个政策发布平台或各个政策发布网站中获取实时发布和历史发布的产业政策信息。
S102.获取企业注册用户的用户信息和企业信息,企业信息包括企业领域和企业特征数据。
其中,企业管理人员可以通过前端APP注册账户,所注册的账户即为企业注册用户,在注册账户的过程中需要填写用户信息和企业信息,所填写的用户信息和企业信息将会被存储于预设的用户云数据库中。用户信息主要包括用户搜索记录、用户政策需求和用户法人信息。企业领域为企业注册用户的企业所在的行业领域,如冶金领域、水利工程领域、医药领域等。企业信息包括企业领域和企业特征数据,企业特征数据指能够体现企业特征的数据,如企业人数、企业纳税额等。
S103.基于企业领域生成企业注册用户的类别标签,并获取具有同一类别标签的所有同行企业注册用户的同行企业信息。
其中,所生成的类别标签即可代表企业注册用户的所属领域,基于类别标签在用户云数据库中检索到相同类别标签的所有其他企业注册用户作为企业注册用户的同行企业注册用户,并从用户云数据库中调取同行企业注册用户在账号注册时所输入的企业信息作为同行企业信息。
S104.结合同行企业信息、用户信息和企业特征数据生成企业注册用户的企业标签。
其中,基于同行企业信息可以分析出同行企业历史申报的相同行业领域下的产业政策,通过用户信息可以分析出企业注册用户期望申报的产业政策,再分别提取分析得到的产业政策的政策需求,逐个判断企业特征数据是否满足所提取的各个政策需求,若满足至少一个政策需求,则可以将对应的企业特征数据作为企业注册用户的企业标签。
S105.基于企业标签计算所有产业政策信息的政策匹配度。
其中,可以先提取各个产业政策信息中的关键文本,再分别计算企业标签和同一产业政策信息下所有关键文本之间的文本相似度,结合计算得到的文本相似度计算得到平均文本相似度即为企业标签与该产业政策信息之间的政策匹配度。
S106.从所有政策匹配度高于预设的匹配度阈值的目标产业政策信息中提取政策标签。
其中,匹配度阈值通常预设为80%~90%,通过匹配度阈值所筛选出的产业政策信息即为目标产业政策信息,将目标产业政策信息中的所有关键文本进一步进行关键词简化,得到政策标签。
S107.结合政策标签和企业标签构建企业注册用户的企业画像。
其中,将企业注册用户的政策标签和企业标签融合即构建出了企业注册用户的企业画像,企业画像体现出了企业注册用户的可申报政策类型、期望申报政策类型等信息。
本申请实施例其中一种实施方式的实施原理为:
在企业管理人员通过前端APP注册企业注册用户时,可以从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
在本申请实施例的其中一种实施方式中,参照图2,步骤S104具体包括如下步骤:
S201.基于用户法人信息从预设的企业数据库中调取企业注册用户关联企业的关联企业信息。
其中,用户法人信息主要为企业注册用户所属企业的法人名称,预设的企业数据库中预先存储有所有进行公司注册的企业所公开的企业信息,包括企业名称、法人名称、企业代码、注册资金等信息。因此可以通过法人名称在企业数据库中检索到法人名称所有的关联企业,关联企业指企业管理人或企业负责人中存在上述法人名称的企业,而关联企业的企业信息即为关联企业信息。
S202.结合同行企业信息、关联企业信息和企业特征数据生成企业注册用户的一级企业标签。
其中,从同行企业信息中可以分析获取到同行企业历史申报过的历史产业政策,从关联企业信息中可以分析获取到关联企业历史申报过的历史产业政策,提取出上述所有历史产业政策中的政策需求,并逐一判断企业特征数据是否满足政策需求,若满足,则对应的企业特征根数据作为企业注册用户的一级企业标签。一级企业标签可以体现出企业注册用户所契合的相关产业政策,以及已满足的相关产业政策的政策需求。
S203.结合用户搜索记录、用户政策需求和企业特征数据生成企业注册用户的二级企业标签。
其中,用户搜索记录通过后台数据端获取,用户搜索记录主要为企业注册用户通过前端APP进行产业政策信息搜索时所产生的文本记录。用户政策需求则是用户通过前端APP注册时所填写的政策需求文本,政策需求文本为用户想要申报的产业政策文本名称。检索出文本记录和政策需求文本中所涉及到的相关产业政策,提取出相关产业政策中的政策需求,并逐一判断企业特征数据是否满足政策需求,若满足,则对应的企业特征根数据作为企业注册用户的二级企业标签。二级企业标签可以体现出企业注册用户预想申报的产业政策。
S204.融合一级企业标签和二级企业标签得到企业注册用户的企业标签。
其中,将一级企业标签和二级企业标签合并得到企业标签。
本申请实施例其中一种实施方式的实施原理为:
通过用户法人信息可以检索调取出企业注册用户关联企业的关联企业信息,关联企业信息中包含关联企业历史申报过的历史产业政策,同行企业信息中也包含同行企业历史申报过的历史产业政策,因此可以结合同行企业信息、关联企业信息和企业特征数据生成企业注册用户的一级企业标签,一级企业标签可以体现出企业注册用户所契合的相关产业政策。而用户搜索记录主要为企业注册用户通过前端APP进行产业政策信息搜索时所产生的文本记录,用户搜索记录可以体现企业注册用户感兴趣的产业政策信息。用户政策需求则是用户通过前端APP注册时所填写的政策需求文本,可以体现企业注册用户预期需求申报的产业政策,因此结合用户搜索记录、用户政策需求和企业特征数据生成企业注册用户的二级企业标签,二级企业标签可以体现出企业注册用户预想申报或感兴趣的产业政策。
在本申请实施例的其中一种实施方式中,参照图3,步骤S202具体包括如下步骤:
S301.获取同行企业信息和关联企业信息中的政策申报记录。
其中,通过同行企业信息和关联企业信息中的企业名称可以在政策申报平台查询到同行企业和关联企业的政策申报记录。
S302.获取政策申报记录中的历史政策信息。
其中,政策申报记录中包含历史政策文本附件,下载历史政策文本附件即可获取到历史政策信息。
S303.提取历史政策信息的第一政策需求。
其中,可以通过TF-IDF关键文本提取算法从历史政策信息中提取出第一政策需求,政策需求包含历史政策信息中的历史政策对于申报企业各维度的资质需求,如企业人员数量要求、企业资产要求等。
S304.将满足第一政策需求的企业特征数据转换为一级企业标签。
其中,将同类型的第一政策需求与同类型的企业特征数据进行比对,例如,将第一政策需求中的企业人员数量要求与企业特征数据中的缴纳社保人数进行比对,若缴纳社保人数大于等于企业人员数量要求,则缴纳社保人数这一企业特征数据满足第一政策需求。
本申请实施例其中一种实施方式的实施原理为:
由于同行企业和关联企业与企业注册用户具有极强的关联关系,因此同行企业和关联企业所申报的产业政策与企业注册用户也具有很强的相关性,所以可以获取同行企业信息和关联企业信息中的政策申报记录,并通过政策申报记录获取到同行企业和关联企业历史申报的历史政策信息,从历史政策信息中提取出历史政策的政策需求,再将满足政策需求的企业特征数据转换为一级企业标签。
在本申请实施例的其中一种实施方式中,参照图4,步骤S203具体包括如下步骤:
S401.从用户政策需求中提取政策关键词。
其中,用户所输入的用户政策需求可能包含与产业政策无关的字词,因此可以通过文字识别技术并基于预设的关键词列表从用户政策需求中提取出政策关键词,预设的关键词列表中包含所有历史产业政策的政策名称。
S402.在用户搜索记录中统计所有政策关键词的搜索次数。
其中,基于政策关键词遍历用户搜索记录并进行同步计数,从而统计出政策关键词在用户搜索记录中的出现次数,遍历结束后所统计到的出现次数即为搜索次数。
S403.判断搜索次数是否超出预设的次数阈值,若搜索次数超出次数阈值,则执行步骤S404。
其中,若搜索次数未超出次数阈值,则筛除对应的政策关键词。
S404.基于对应的政策关键词在所有产业政策信息中检索出关键产业政策信息。
其中,由于政策关键词为产业政策标题,因此可以通过文本比对技术对所有产业政策信息的标题进行比对识别,检索出标题相同或高度相似的产业政策信息作为关键产业政策信息。
S405.提取关键产业政策信息的第二政策需求。
其中,可以通过TF-IDF关键文本提取算法从关键产业政策信息中提取出第二政策需求,政策需求包含历史政策信息中的历史政策对于申报企业各维度的资质需求,如企业人员数量要求、企业资产要求等。
S406.将满足第二政策需求的企业特征数据转换为二级企业标签。
其中,将同类型的第二政策需求与同类型的企业特征数据进行比对,例如,将第二政策需求中的企业人员数量要求与企业特征数据中的缴纳社保人数进行比对,若缴纳社保人数大于等于企业人员数量要求,则缴纳社保人数这一企业特征数据满足第二政策需求。
本申请实施例其中一种实施方式的实施原理为:
从用户政策需求中提取到多个政策关键词,多个政策关键词所对应的产业政策均为企业注册用户预期需求申报的产业政策,再统计出提取到的政策关键词在用户搜索记录中的搜索次数,若用户对某一政策关键词的搜索次数较高,则说明用户更加关注该政策关键词所对应的产业政策,因此可以根据搜索次数对政策关键词进一步筛选,筛选出的政策关键词所对应的产业政策信息即为关键产业政策信息,进而可以提取出关键产业政策信息的第二政策需求,并将满足第二政策需求的企业特征数据转换为二级企业标签。
在本申请实施例的其中一种实施方式中,参照图5,步骤S105具体包括如下步骤:
S501.提取产业政策信息中的所有关键政策文本。
其中,通过TF-IDF关键文本提取算法并基于预设的政策关键信息列表提取出产业政策信息中的所有关键政策文本,预设的政策关键信息列表中存储有大量历史政策信息中所提取出有关政策指标的相关关键词。
S502.分别计算各个企业标签与各个关键政策文本之间的词向量相似度。
其中,可以运用Glove模型生成企业标签和关键政策文本的词向量,再计算企业标签和关键政策文本的词向量相似度。
S503.基于词向量相似度标记出所有企业标签中的匹配企业标签,并统计所有匹配企业标签的标签数量。
其中,通过预设的相似度阈值对词向量相似度进行筛选,将高于相似度阈值的词向量相似度对应的企业标签标记为匹配企业标签。
S504.结合标签数量和所有企业标签的标签总数计算产业政策信息的政策匹配度。
其中,政策匹配度=标签数量/标签总数*100%。
本申请实施例其中一种实施方式的实施原理为:
将企业标签和关键政策文本均转换为词向量,转换成词向量后便可计算企业标签和关键政策文本之间的词向量相似度,词向量相似度可以体现两个文本内容的相似程度,词向量相似度越高,两个文本内容的相似程度越高。通过预设的相似度阈值对词向量相似度进行筛选,筛选出词向量相似度高的匹配企业标签,并统计匹配企业标签的标签数量,最后通过计算匹配企业标签的标签数量在标签总数中的占比即可计算得到企业注册用户和产业政策信息的政策匹配度。
在本申请实施例的其中一种实施方式中,参照图6,步骤S503具体包括如下步骤:
S601.判断词向量相似度是否超出预设的相似度阈值,若词向量相似度超出相似度阈值,则执行步骤S602。
其中,预设的相似度阈值为70%~85%,若词向量相似度未超出相似度阈值,则不进行任何标记。
S602.将对应的企业标签标记为匹配企业标签。
S603.筛除所有匹配企业标签的重复标签。
S604.统计筛除后的所有匹配企业标签的标签数量。
本申请实施例其中一种实施方式的实施原理为:
词向量相似度可以体现两个文本内容的相似程度,词向量相似度越高,两个文本内容的相似程度越高,因此可以通过预设的相似度阈值筛选出数值较高的词向量相似度,并将数值较高的词向量相似度对应的企业标签标记为匹配企业标签。由于匹配企业标签可能与多个产业政策信息匹配相似而被重复标记,因此在标记之后还需要筛除所有匹配企业标签中的重复标签,再统计所有匹配企业标签的标签数量。
在本申请实施例的其中一种实施方式中,参照图7,在步骤S107之后具体还包括如下步骤:
S701.监控并获取企业注册用户的企业风险信息。
其中,可以通过工商管理系统监控并获取企业注册用户所属企业的企业风险信息,企业风险信息包括经营风险信息、法律风险信息、管理人员风险信息等。
S702.从企业风险信息中提取企业风险标签。
其中,采用TextRank算法从企业风险信息中提取企业风险标签。
S703.基于企业风险标签更新企业画像。
其中,当企业画像中的企业风险标签数量超过了预设的数量阈值时,企业画像的主体画像将会体现为风险企业。
本申请实施例其中一种实施方式的实施原理为:
部分产业政策中也存在企业风险指标,企业风险指标中明确了对风险企业的申报限制,若获取到的新产业政策信息中包含企业风险指标,则新产业政策信息不会推送至风险企业的企业用户。因此监控获取企业注册用户的企业风险信息,并生成企业风险标签对企业画像进行更新,可以提升新产业政策信息推送过程中的精确性。
本申请实施例还公开一种产业政策目标群画像构建系统,包括存储器和处理器,存储器储存有能够在处理器上运行的计算机程序,处理器加载并执行计算机程序时,采用了如图1至图7中所示的方法。
本实施例的实施原理为:
通过程序的调取,可以在企业管理人员通过前端APP注册企业注册用户时,从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
本申请实施例还公开一种计算机可读存储介质,包括指令,当指令在计算机上运行时,使得计算机执行如图1至图7中所示的方法。
本实施例的实施原理为:
通过程序的调取,可以在企业管理人员通过前端APP注册企业注册用户时,从后台数据端获取到企业注册用户的用户信息和企业信息,通过企业信息中的企业领域可以从后台数据端获取到相同领域企业的同行企业信息,再结合同行企业信息、用户信息和企业信息中的企业特征数据可以生成企业注册用户的企业标签,基于文本相似度计算企业标签与获取到的所有产业政策信息之间的政策匹配度,通过政策匹配度筛选出与企业注册用户关联性强的目标产业政策信息,从目标产业政策信息中提取出包含政策关键词的政策标签,最后同和企业标签和政策标签即可构建出企业注册用户的企业画像。根据企业画像所体现出的企业注册用户可申报政策类型、期望申报政策类型等信息,当再次获取到新发布的产业政策信息时,可以基于企业画像向新产业政策信息面向的目标企业用户群进行精准推送,从而可以提升所有企业注册用户的用户体验感。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (10)

1.一种产业政策目标群画像构建方法,其特征在于,包括如下步骤:
获取所有产业政策信息;
获取企业注册用户的用户信息和企业信息,所述企业信息包括企业领域和企业特征数据;
基于所述企业领域生成所述企业注册用户的类别标签,并获取具有同一所述类别标签的所有同行企业注册用户的同行企业信息;
结合所述同行企业信息、所述用户信息和所述企业特征数据生成所述企业注册用户的企业标签;
基于所述企业标签计算所有所述产业政策信息的政策匹配度;
从所有所述政策匹配度高于预设的匹配度阈值的目标产业政策信息中提取政策标签;
结合所述政策标签和所述企业标签构建所述企业注册用户的企业画像。
2.根据权利要求1所述的产业政策目标群画像构建方法,其特征在于:所述用户信息包括用户搜索记录、用户政策需求和用户法人信息。
3.根据权利要求2所述的产业政策目标群画像构建方法,其特征在于,所述结合所述同行企业信息、所述用户信息和所述企业特征数据生成所述企业注册用户的企业标签包括如下步骤:
基于所述用户法人信息从预设的企业数据库中调取所述企业注册用户关联企业的关联企业信息;
结合所述同行企业信息、所述关联企业信息和所述企业特征数据生成所述企业注册用户的一级企业标签;
结合所述用户搜索记录、所述用户政策需求和所述企业特征数据生成所述企业注册用户的二级企业标签;
融合所述一级企业标签和所述二级企业标签得到所述企业注册用户的企业标签。
4.根据权利要求3所述的产业政策目标群画像构建方法,其特征在于,所述结合所述同行企业信息、所述关联企业信息和所述企业特征数据生成所述企业注册用户的一级企业标签包括如下步骤:
获取所述同行企业信息和所述关联企业信息中的政策申报记录;
获取所述政策申报记录中的历史政策信息;
提取所述历史政策信息的第一政策需求;
将满足所述第一政策需求的所述企业特征数据转换为一级企业标签。
5.根据权利要求4所述的产业政策目标群画像构建方法,其特征在于,所述结合所述用户搜索记录、所述用户政策需求和所述企业特征数据生成所述企业注册用户的二级企业标签包括如下步骤:
从所述用户政策需求中提取政策关键词;
在所述用户搜索记录中统计所有所述政策关键词的搜索次数;
判断所述搜索次数是否超出预设的次数阈值;
若所述搜索次数超出所述次数阈值,则基于对应的所述政策关键词在所有所述产业政策信息中检索出关键产业政策信息;
提取所述关键产业政策信息的第二政策需求;
将满足所述第二政策需求的所述企业特征数据转换为二级企业标签。
6.根据权利要求1所述的产业政策目标群画像构建方法,其特征在于,所述基于所述企业标签计算所有所述产业政策信息的政策匹配度包括如下步骤:
提取所述产业政策信息中的所有关键政策文本;
分别计算各个所述企业标签与各个所述关键政策文本之间的词向量相似度;
基于所述词向量相似度标记出所有所述企业标签中的匹配企业标签,并统计所有所述匹配企业标签的标签数量;
结合所述标签数量和所有所述企业标签的标签总数计算所述产业政策信息的政策匹配度。
7.根据权利要求6所述的产业政策目标群画像构建方法,其特征在于,所述基于所述词向量相似度标记出所有所述企业标签中的匹配企业标签,并统计所有所述匹配企业标签的标签数量包括如下步骤:
判断所述词向量相似度是否超出预设的相似度阈值;
若所述词向量相似度超出所述相似度阈值,则将对应的所述企业标签标记为匹配企业标签;
筛除所有所述匹配企业标签的重复标签;
统计筛除后的所有所述匹配企业标签的标签数量。
8.根据权利要求1所述的产业政策目标群画像构建方法,其特征在于,在所述结合所述政策标签和所述企业标签构建所述企业注册用户的企业画像之后还包括如下步骤:
监控并获取所述企业注册用户的企业风险信息;
从所述企业风险信息中提取企业风险标签;
基于所述企业风险标签更新所述企业画像。
9.一种产业政策目标群画像构建系统,包括存储器和处理器,其特征在于,所述存储器储存有能够在处理器上运行的计算机程序,所述处理器加载并执行所述计算机程序时,采用了权利要求1至8中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至8中任一项所述的方法。
CN202211450227.7A 2022-11-19 2022-11-19 产业政策目标群画像构建方法、系统及存储介质 Withdrawn CN115687787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211450227.7A CN115687787A (zh) 2022-11-19 2022-11-19 产业政策目标群画像构建方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211450227.7A CN115687787A (zh) 2022-11-19 2022-11-19 产业政策目标群画像构建方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN115687787A true CN115687787A (zh) 2023-02-03

Family

ID=85053928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211450227.7A Withdrawn CN115687787A (zh) 2022-11-19 2022-11-19 产业政策目标群画像构建方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN115687787A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188233A (zh) * 2023-04-23 2023-05-30 四川邕合科技有限公司 基于大数据分析的政策信息推送方法、系统、终端及介质
CN116842272A (zh) * 2023-08-29 2023-10-03 四川邕合科技有限公司 政策信息推送方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116188233A (zh) * 2023-04-23 2023-05-30 四川邕合科技有限公司 基于大数据分析的政策信息推送方法、系统、终端及介质
CN116842272A (zh) * 2023-08-29 2023-10-03 四川邕合科技有限公司 政策信息推送方法、装置、设备及存储介质
CN116842272B (zh) * 2023-08-29 2023-11-03 四川邕合科技有限公司 政策信息推送方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US11663254B2 (en) System and engine for seeded clustering of news events
US10025904B2 (en) Systems and methods for managing a master patient index including duplicate record detection
CN111459985B (zh) 标识信息处理方法及装置
CN115687787A (zh) 产业政策目标群画像构建方法、系统及存储介质
US7324998B2 (en) Document search methods and systems
US9390176B2 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
US11941714B2 (en) Analysis of intellectual-property data in relation to products and services
CN112380318A (zh) 基于标签相似度的企业政策匹配方法
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
US20180181646A1 (en) System and method for determining identity relationships among enterprise data entities
US11887201B2 (en) Analysis of intellectual-property data in relation to products and services
US20080147641A1 (en) Method for prioritizing search results retrieved in response to a computerized search query
CN110458324B (zh) 风险概率的计算方法、装置和计算机设备
CN111353014B (zh) 职位关键词提取、岗位需求更新的方法和装置
US11348195B2 (en) Analysis of intellectual-property data in relation to products and services
US20210004919A1 (en) Analysis Of Intellectual-Property Data In Relation To Products And Services
CN111209400A (zh) 一种数据分析的方法及装置
CN111899821A (zh) 处理医疗机构数据的方法、构建数据库的方法和装置
US20220129635A1 (en) Semantic model instantiation method, system and apparatus
CN111612610A (zh) 风险预警方法及系统、电子设备及存储介质
CA2956627A1 (en) System and engine for seeded clustering of news events
CN110825817B (zh) 一种企业疑似关联关系判定方法及系统
KR20220034134A (ko) 제품들 및 서비스들에 관한 지적 재산 데이터의 분석
CN111899822A (zh) 医疗机构数据库构建方法、查询方法、装置、设备和介质
CN108415971B (zh) 采用知识图谱推荐供求信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230203