CN113469645A - 一种政策数据智能入库方法 - Google Patents
一种政策数据智能入库方法 Download PDFInfo
- Publication number
- CN113469645A CN113469645A CN202110685636.4A CN202110685636A CN113469645A CN 113469645 A CN113469645 A CN 113469645A CN 202110685636 A CN202110685636 A CN 202110685636A CN 113469645 A CN113469645 A CN 113469645A
- Authority
- CN
- China
- Prior art keywords
- policy data
- data
- original
- policy
- valid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 238000007477 logistic regression Methods 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims abstract description 9
- 238000012795 verification Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 230000008520 organization Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000013500 data storage Methods 0.000 abstract description 9
- 206010063385 Intellectualisation Diseases 0.000 abstract description 5
- 238000013135 deep learning Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及数据处理技术领域,公开了一种政策数据智能入库方法,该方法包括:获取原始政策数据;对原始政策数据进行有效性分类,得到每一原始政策数据的有效性类型及有效概率值,以进行分流,得到若干政策分组,对原始政策数据进行数据规范化处理,得到最终政策数据并入库。相比传统采用人工进行收录入库的方式,本发明实施例通过深度学习实现了政策数据在收录、分类、规范化处理等流程中的智能化,大幅减少了政策数据入库的人力成本,且逻辑回归分类模型可在线学习针对新型政策数据分类的业务逻辑,从而对政策数据的分类将越来越精准,避免了人工操作时存在的错漏,提高了准确率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种政策数据智能入库方法。
背景技术
为了提高行政效率与透明度,配合简政放权的施政理念,满足用户在信息时代对政策信息的即时获取需求,各地政府及机关单位均将大量政策信息上传至电子政务平台。然而,各地政府所发布的政策信息在数据格式上并不统一,且部分政策信息存在不规范现象,这使得政策信息的检索与入库无法直接进行。对此,现有的方法是针对性地培训收录人员进行政策信息的规范处理与筛选入库,而随着政策数据的数据量日益增大,收录人员的需求量也越来越多,造成人力成本上涨;此外,人工操作始终存在错误、遗漏等情况,难以保证准确率。
发明内容
本发明实施例公开一种政策数据智能入库方法,通过深度学习实现了政策数据在收录、分类、规范化处理等流程中的智能化,大幅减少了政策数据入库的人力成本,且逻辑回归分类模型可在线学习针对新型政策数据分类的业务逻辑,从而对政策数据的分类将越来越精准,避免了人工操作时存在的错漏,提高了准确率。
本发明实施例公开一种政策数据智能入库方法,所述方法包括:
获取原始政策数据;
对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值;
基于所述有效性类型及所述有效概率值分流所述原始政策数据,得到若干政策分组;其中,每一所述政策分组中包含若干原始政策数据;
对所述原始政策数据进行数据规范化处理,得到最终政策数据;
对所述最终政策数据进行入库。
作为一种可选的实施方式,在本发明实施例中,所述获取原始政策数据,包括:
对应于行政区划信息及机构信息设置政策数据来源目录;
基于分布式消息队列以及流式处理框架,针对政策数据来源目录获取批量政策数据;
对所述批量政策数据进行预处理,得到所述原始政策数据。
作为一种可选的实施方式,在本发明实施例中,所述对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值,包括:
基于预设有效性指标建立损失函数;
基于所述损失函数采用逻辑回归分类模型对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值;
其中,所述有效性类型包括有效、待定及无效,且有效性类型为无效的原始政策数据不具备有效概率值。
作为一种可选的实施方式,在本发明实施例中,所述基于所述有效性类型及所述有效概率值分流所述原始政策数据,得到若干政策分组,包括:
设定第一有效阈值及第二有效阈值;
将有效性类型为有效,或有效概率值不低于所述第一有效阈值的原始政策数据分流至政策数据有效库;
对有效性类型为无效,或者有效概率值低于所述第二有效阈值的原始政策数据进行筛除;
将有效性类型为待定,或有效概率值低于所述第一有效阈值且不低于所述第二有效阈值的原始政策数据分流至政策数据有效中介库。
作为一种可选的实施方式,在本发明实施例中,在所述将有效性类型为待定,或有效概率值低于所述第一有效阈值且不低于所述第二有效阈值的原始政策数据分流至政策数据有效中介库之后,所述方法还包括:
基于专家经验对所述政策数据有效中介库中的原始政策数据进行分类,得到有效性类型为有效/无效的再分类原始政策数据;
将有效性类型为有效的所述再分类原始政策数据分流至所述政策数据有效库,以及,将有效性类型为无效的所述再分类原始政策数据进行筛除;
分析所述再分类原始政策数据的数据特征;
基于所述数据特征更新所述损失函数。
作为一种可选的实施方式,在本发明实施例中,所述对所述原始政策数据进行数据规范化处理,得到最终政策数据,包括:
基于行政区划词库建立高斯混合模型,对所述原始政策数据进行区划修正,得到第一中间数据;
以及,基于专家规则构造正则表达式,对所述第一中间数据进行文字格式规范化,得到第二中间数据;
基于公文类型词库,采用中文分词算法对所述第二中间数据进行政策文本分类,得到所述最终政策数据。
作为一种可选的实施方式,在本发明实施例中,在所述对所述原始政策数据进行数据规范化处理,得到最终政策数据之后,以及,在所述对所述最终政策数据进行入库之前,所述方法还包括:
设置规范校验模型,对所述最终政策数据进行规范性校验;
将通过规范性校验的最终政策数据设为规范政策数据,并将所述规范政策数据入库至政策规范数据库;
将未通过规范性校验的最终政策数据设为非标政策数据;
采用预设规范化规则将所述非标政策数据调整为所述规范政策数据,并执行所述将所述规范政策数据入库至政策规范数据库的步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,通过深度学习实现了政策数据在收录、分类、规范化处理等流程中的智能化,大幅减少了政策数据入库的人力成本,且逻辑回归分类模型可在线学习针对新型政策数据分类的业务逻辑,从而对政策数据的分类将越来越精准,避免了人工操作时存在的错漏,提高了准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种政策数据智能入库方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种政策数据智能入库方法,通过深度学习实现了政策数据在收录、分类、规范化处理等流程中的智能化,大幅减少了政策数据入库的人力成本,且逻辑回归分类模型可在线学习针对新型政策数据分类的业务逻辑,从而对政策数据的分类将越来越精准,避免了人工操作时存在的错漏,提高了准确率。
请参阅图1,图1是本发明实施例公开的一种政策数据智能入库方法的流程示意图。如图1所示,该政策数据智能入库方法可以包括以下步骤。
101、获取原始政策数据。
本发明实施例中,原始政策数据可以是政府部门发布于电子政务平台的各类政策文件。
作为一种可选的实施方式,对应于行政区划信息及机构信息设置政策数据来源目录;基于分布式消息队列以及流式处理框架,针对政策数据来源目录获取批量政策数据;对批量政策数据进行预处理,得到原始政策数据。具体地,对应于各级行政区划分别设置有若干职能机构与部门,如市级行政区划对应设置的行政部门有教育局、民政局、财务局、商务局等,在此,整理收录各级行政区划所对应部门机构用以发布政策数据的电子政务平台(如部门官网、业务办理系统等),构建得到政策数据来源目录,在此采用基于Kafka的高吞吐量的分布式消息队列,配合采用基于SparkStream的流式处理框架,在政策数据来源目录所包括的各电子政务平台上实时缓存发布的海量的政策数据,通过采集页面标题、关键字、数据格式等对批量的政策数据进行预处理,筛除数据采集过程中误采集的无关数据,得到原始正常数据。从而无需人力查找、采集,即可海量的政策数据,提高了效率,节省了重复劳动与人力成本。应当理解的是,针对电子政务平台所部署的SparkStream实质上是微批式的处理框架,由于电子政务平台上的政策数据来源固定,抓取稳定,且数据量巨大,在实际应用中达到了近似流式处理框架的效果,因此,在此称SparkStream为流式处理框架。
102、对原始政策数据进行有效性分类,得到每一原始政策数据的有效性类型及有效概率值。
本发明实施例中,原始政策数据通过网络途径从各级部门机构的电子政务平台上采集收录,以企业用户为例,从企业用户的角度来看,原始政策数中的宏观政策可指导企业未来发展,补贴政策则在短期内关系到企业的经营与补贴,此外,还有部分与企业经营发展不存在直接联系的政策,以上各类数据对特定用户的有效性各不相同,因而需要从用户角度对原始政策数据进行有效性分类。
作为一种可选的实施方式,基于预设有效性指标建立损失函数;基于损失函数采用逻辑回归分类模型对原始政策数据进行有效性分类,得到每一原始政策数据的有效性类型及有效概率值;其中,有效性类型包括有效及未知,且有效性类型为未知的原始政策数据不具备有效概率值。具体地,以企业用户为例,假设经营补贴政策对企业的重要性高于行业调控政策,其它类型的政策对企业不具有影响,则对各原始政策数据中的政策类别、补贴项目、补贴额度、补贴要求等以量化指标进行表示,构建损失函数,并基于该损失函数,采用SparkMLlib框架中的逻辑回归分类模型对原始政策数据进行有效性分类,假设存在原始政策数据A、B、C及D,可获知每一原始政策数据的有效性类型及有效概率值:A(有效,90%)、B(待定,70%)、C(待定,50%)、D(无效)。可见,通过有效性类型及有效概率值,即可初步评估得到每一原始政策数据针对用户的有效程度。
103、基于有效性类型及有效概率值分流原始政策数据,得到若干政策分组。
本发明实施例中,每一政策分组中包含若干原始政策数据,分组依据为各政策的有效性及有效概率值。
作为一种可选的实施方式,设定第一有效阈值及第二有效阈值;将有效性类型为有效,或有效概率值不低于第一有效阈值的原始政策数据分流至政策数据有效库;将有效性类型为无效,或者有效概率值低于第二有效阈值的原始政策数据进行筛除;将有效性类型为待定,或有效概率值低于第一有效阈值且不低于第二有效阈值的原始政策数据分流至政策数据有效中介库。具体地,以步骤102中的原始政策数据A(有效,90%)、B(待定,70%)、C(待定,50%)、D(无效)为例,在此设定第一有效阈值为80%,第二有效阈值为60%,则A分流至政策数据有效库中,B分流至政策数据有效中介库中,C与D被筛除。
本发明实施例中,政策时常存在变动与更新,其类型、表述与评价指标等均可能存在变动,造成逻辑回归分类模型分类失败,得到有效性未知的原始政策数据归入待分类库中。
作为另一种可选的实施方式,基于专家经验对政策数据有效中介库中的原始政策数据进行分类,得到有效性类型为有效/无效的再分类原始政策数据;将有效性类型为有效的再分类原始政策数据分流至政策数据有效库或政策数据有效中介库;分析再分类原始政策数据的数据特征;基于数据特征更新损失函数。具体地,假设B(待定,70%)涉及一项新型补贴项目,其量化指标尚未更新至逻辑回归分类模型中,在此基于专家经验对其进行分类并分流入库;进而,分析该原始政策数据的量化指标等数据特征,从而根据数据特征更新损失函数,确保逻辑回归分类模型可在此后对此类原始政策数据进行正确分类。
可见,将原始政策数据分流入库,用户可根据自身实际需求查阅侧重点不同的政策数据库,不会受到海量的无关政策数据的干扰,从而高效获取到有效的政策数据。
104、对原始政策数据进行数据规范化处理,得到最终政策数据。
本发明实施例中,不同原始政策数据在文字格式等方面,可能因发布部门的不同,存在诸多差异,影响智能化批量处理。
作为一种可选的实施方式,基于行政区划词库建立高斯混合模型,对原始政策数据进行区划修正,得到第一中间数据;基于专家规则构造正则表达式,对第一中间数据进行文字格式规范化,得到第二中间数据;基于公文类型词库,采用中文分词算法对第二中间数据进行政策文本分类,得到最终政策数据。具体地,基于行政区划词库建立高斯混合模型,配合TF-IDF(term frequency–inverse document frequency,词频-逆文本频率指数)技术,有效识别原始政策数据中存在的行政区划信息缺失问题,并进行补齐得到第一中间数据;构造对应于标题、正文、文号、发文单位及发文日期等文字格式的专家规则,生成正则表达式,对第一中间数据的文字格式进行格式规范化校正,得到文字格式统一的第二中间数据;最后,基于公文类型词库生成正则表达式,配合隐马尔科夫模型及贝叶斯网络,对第二中间数据进行进一步的政策文本分类,可得最终政策数据。可见,对原始政策数据进行智能化的规范化处理,可高效统一杂乱的数据格式,有利于进行数据整理与发布。
105、对最终政策数据进行入库。
本发明实施例中,受原始政策数据的数据格式影响,步骤104中未能对所有原始政策数据实现规范化处理。
作为一种可选的实施方式,设置规范校验模型,对最终政策数据进行规范性校验;将通过规范性校验的最终政策数据设为规范政策数据,并将规范政策数据入库至政策规范数据库;将未通过规范性校验的最终政策数据设为非标政策数据;采用预设规范化规则将非标政策数据调整为规范政策数据,并执行将规范政策数据入库至政策规范数据库的步骤。具体地,基于步骤104中的行政区划词库、文字格式的专家规则及公文类型词库等,设置规范校验模型,用以对最终政策数据进行规范性校验,通过规范性校验的最终政策数据设为规范政策数据,入库至政策规范数据库;而未通过规范性校验的最终政策数据设为非标政策数据,此时将采用预设规范化规则将非标政策数据调整为规范政策数据,再入库至政策规范数据库,确保政策规范数据库中的数据均为格式规范、内容准确的政策数据,便于用户查看与应用。
综上,通过深度学习实现了政策数据在收录、分类、规范化处理等流程中的智能化,大幅减少了政策数据入库的人力成本,且逻辑回归分类模型可在线学习针对新型政策数据分类的业务逻辑,从而对政策数据的分类将越来越精准,避免了人工操作时存在的错漏,提高了准确率。
以上对本发明实施例公开的一种政策数据智能入库方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种政策数据智能入库方法,其特征在于,所述方法包括:
获取原始政策数据;
对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值;
基于所述有效性类型及所述有效概率值分流所述原始政策数据,得到若干政策分组;其中,每一所述政策分组中包含若干原始政策数据;
对所述原始政策数据进行数据规范化处理,得到最终政策数据;
对所述最终政策数据进行入库。
2.根据权利要求1所述的方法,其特征在于,所述获取原始政策数据,包括:
对应于行政区划信息及机构信息设置政策数据来源目录;
基于分布式消息队列以及流式处理框架,针对政策数据来源目录获取批量政策数据;
对所述批量政策数据进行预处理,得到所述原始政策数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值,包括:
基于预设有效性指标建立损失函数;
基于所述损失函数采用逻辑回归分类模型对所述原始政策数据进行有效性分类,得到每一所述原始政策数据的有效性类型及有效概率值;
其中,所述有效性类型包括有效、待定及无效,且有效性类型为无效的原始政策数据不具备有效概率值。
4.根据权利要求3所述的方法,其特征在于,所述基于所述有效性类型及所述有效概率值分流所述原始政策数据,得到若干政策分组,包括:
设定第一有效阈值及第二有效阈值;
将有效性类型为有效,或有效概率值不低于所述第一有效阈值的原始政策数据分流至政策数据有效库;
将有效性类型为无效,或者有效概率值低于所述第二有效阈值的原始政策数据进行筛除;
将有效性类型为待定,或有效概率值低于所述第一有效阈值且不低于所述第二有效阈值的原始政策数据分流至政策数据有效中介库。
5.根据权利要求4所述的方法,其特征在于,在所述将有效性类型为待定,或有效概率值低于所述第一有效阈值且不低于所述第二有效阈值的原始政策数据分流至政策数据有效中介库之后,所述方法还包括:
基于专家经验对所述政策数据有效中介库中的原始政策数据进行分类,得到有效性类型为有效/无效的再分类原始政策数据;
将有效性类型为有效的所述再分类原始政策数据分流至所述政策数据有效库,以及,将有效性类型为无效的所述再分类原始政策数据进行筛除;
分析所述再分类原始政策数据的数据特征;
基于所述数据特征更新所述损失函数。
6.根据权利要求5所述的方法,其特征在于,所述对所述原始政策数据进行数据规范化处理,得到最终政策数据,包括:
基于行政区划词库建立高斯混合模型,对所述原始政策数据进行区划修正,得到第一中间数据;
基于专家规则构造正则表达式,对所述第一中间数据进行文字格式规范化,得到第二中间数据;
基于公文类型词库,采用中文分词算法对所述第二中间数据进行政策文本分类,得到所述最终政策数据。
7.根据权利要求6所述的方法,其特征在于,在所述对所述原始政策数据进行数据规范化处理,得到最终政策数据之后,以及,在所述对所述最终政策数据进行入库之前,所述方法还包括:
设置规范校验模型,对所述最终政策数据进行规范性校验;
将通过规范性校验的最终政策数据设为规范政策数据,并将所述规范政策数据入库至政策规范数据库;
将未通过规范性校验的最终政策数据设为非标政策数据;
采用预设规范化规则将所述非标政策数据调整为所述规范政策数据,并执行所述将所述规范政策数据入库至政策规范数据库的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685636.4A CN113469645A (zh) | 2021-06-21 | 2021-06-21 | 一种政策数据智能入库方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110685636.4A CN113469645A (zh) | 2021-06-21 | 2021-06-21 | 一种政策数据智能入库方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469645A true CN113469645A (zh) | 2021-10-01 |
Family
ID=77868848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110685636.4A Pending CN113469645A (zh) | 2021-06-21 | 2021-06-21 | 一种政策数据智能入库方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469645A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275935A (zh) * | 2019-05-10 | 2019-09-24 | 平安科技(深圳)有限公司 | 政策信息的处理方法、装置、及存储介质、电子装置 |
CN110516151A (zh) * | 2019-08-27 | 2019-11-29 | 咪咕文化科技有限公司 | 有效行为检测和个性化推荐方法 |
CN110532451A (zh) * | 2019-06-26 | 2019-12-03 | 平安科技(深圳)有限公司 | 针对政策文本的检索方法和装置、存储介质、电子装置 |
CN111325280A (zh) * | 2020-02-27 | 2020-06-23 | 苏宁云计算有限公司 | 一种标签的生成方法及系统 |
CN112800246A (zh) * | 2021-04-09 | 2021-05-14 | 北京智源人工智能研究院 | 一种政策谱系构建方法、装置和电子设备 |
CN112990958A (zh) * | 2021-01-19 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质及计算机设备 |
-
2021
- 2021-06-21 CN CN202110685636.4A patent/CN113469645A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110275935A (zh) * | 2019-05-10 | 2019-09-24 | 平安科技(深圳)有限公司 | 政策信息的处理方法、装置、及存储介质、电子装置 |
CN110532451A (zh) * | 2019-06-26 | 2019-12-03 | 平安科技(深圳)有限公司 | 针对政策文本的检索方法和装置、存储介质、电子装置 |
CN110516151A (zh) * | 2019-08-27 | 2019-11-29 | 咪咕文化科技有限公司 | 有效行为检测和个性化推荐方法 |
CN111325280A (zh) * | 2020-02-27 | 2020-06-23 | 苏宁云计算有限公司 | 一种标签的生成方法及系统 |
CN112990958A (zh) * | 2021-01-19 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、存储介质及计算机设备 |
CN112800246A (zh) * | 2021-04-09 | 2021-05-14 | 北京智源人工智能研究院 | 一种政策谱系构建方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Alam et al. | Processing social media images by combining human and machine computing during crises | |
US8577823B1 (en) | Taxonomy system for enterprise data management and analysis | |
WO2016090197A1 (en) | Automated content classification/filtering | |
Dang et al. | Framework for retrieving relevant contents related to fashion from online social network data | |
US10387805B2 (en) | System and method for ranking news feeds | |
CN112182246A (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
CN109492097B (zh) | 一种企业新闻数据风险分类方法 | |
CN111723256A (zh) | 一种基于信息资源库的政务用户画像构建方法及其系统 | |
CN110990676A (zh) | 一种社交媒体热点主题提取方法与系统 | |
CN114896305A (zh) | 一种基于大数据技术的智慧互联网安全平台 | |
CN115794798B (zh) | 一种市场监管信息化标准管理与动态维护系统及方法 | |
Vanamala et al. | Topic modeling and classification of Common Vulnerabilities And Exposures database | |
CN112149387A (zh) | 财务数据的可视化方法、装置、计算机设备及存储介质 | |
CN110310012B (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN115982429B (zh) | 一种基于流程控制的知识管理方法及系统 | |
CN111104422B (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN113222109A (zh) | 一种基于多源异构数据聚合技术的物联网边缘算法 | |
CN107315807B (zh) | 人才推荐方法和装置 | |
CN116127194A (zh) | 一种企业推荐方法 | |
CN113469645A (zh) | 一种政策数据智能入库方法 | |
CN115618085A (zh) | 一种基于动态标签的接口数据暴露探测方法 | |
CN112182184B (zh) | 一种基于审计数据库的精准匹配搜索方法 | |
CN114036301A (zh) | 政策文件的处理方法及装置 | |
CN114911685A (zh) | 敏感信息标记方法、装置、设备及计算机可读存储介质 | |
CN113920366A (zh) | 一种基于机器学习的综合加权主数据识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |