CN112800246A - 一种政策谱系构建方法、装置和电子设备 - Google Patents

一种政策谱系构建方法、装置和电子设备 Download PDF

Info

Publication number
CN112800246A
CN112800246A CN202110379991.9A CN202110379991A CN112800246A CN 112800246 A CN112800246 A CN 112800246A CN 202110379991 A CN202110379991 A CN 202110379991A CN 112800246 A CN112800246 A CN 112800246A
Authority
CN
China
Prior art keywords
policy
paragraph
information
policy information
idf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110379991.9A
Other languages
English (en)
Other versions
CN112800246B (zh
Inventor
孙会峰
邢婷
冷小萱
魏小敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhiyuan Artificial Intelligence Research Institute
Original Assignee
Beijing Zhiyuan Artificial Intelligence Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyuan Artificial Intelligence Research Institute filed Critical Beijing Zhiyuan Artificial Intelligence Research Institute
Priority to CN202110379991.9A priority Critical patent/CN112800246B/zh
Publication of CN112800246A publication Critical patent/CN112800246A/zh
Application granted granted Critical
Publication of CN112800246B publication Critical patent/CN112800246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种政策谱系构建方法、装置和电子设备,其中方法包括:采集政策信息;对政策信息进行职能分类,获得政策‑职能集合;将政策‑职能集合中的每一条政策信息进行TF‑IDF计算,根据计算结果获得TF‑IDF分类结果,基于TF‑IDF分类结果为政策‑职能集合中的每一条政策信息建立唯一索引;提取政策‑职能集合中的每一条政策信息的段落关键信息;对政策‑职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;基于唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系;该方法能够实现大量政策信息数据政策谱系的自动构建,效率高且准确性高。

Description

一种政策谱系构建方法、装置和电子设备
技术领域
本发明涉及信息处理技术领域,尤其涉及一种政策谱系构建方法、装置和电子设备。
背景技术
各地各级政府及其部门面向社会公开发布的政策数量庞大且来源分散,对于有政策研究需求的机构或企业,短时间内难以全面评估各地、各部门、各行业等维度下政策的异同。政策谱系的构建能够使用户直观、快速了解和对比政策内容。当前主流解决方案主要集中在使用爬虫技术实现政策数据的自动化采集,但采集后的政策数据只能通过人工手段实现谱系的结构化处理,效率低且容易出错。
发明内容
为了解决现有技术中存在的问题,本发明提供了如下技术方案。
本发明一方面提供了一种政策谱系构建方法,包括:
采集政策信息;
对所述政策信息进行职能分类,获得政策-职能集合;
将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
提取所述政策-职能集合中的每一条政策信息的段落关键信息;
对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
进一步地,所述政策信息包括政策标题、政策全文、行政区位、职能部门以及发文时间;
基于所述职能部门对所述政策信息进行职能分类,获得政策-职能集合。
进一步地,将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,包括:
将所述政策-职能集合中的每一条政策信息的政策标题进行分词,并去除包含行政区位、职能部门的词以及常规停用词,之后采用TF-IDF模型计算每个词的TF-IDF值;
对所述政策-职能集合中的每一条政策信息,将TF-IDF值最高的词作为该条政策信息的关键词,根据所述关键词对所述政策-职能集合中的政策信息进行分类,获得TF-IDF分类结果。
进一步地,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引,包括:
获取所述政策信息中的发文时间以及行政区位,并将所述发文时间转换为时间戳;
将所述TF-IDF分类结果、行政区位以及时间戳作为每一条政策信息的唯一索引。
进一步地,提取所述政策-职能集合中的每一条政策信息的段落关键信息,包括:
对所述政策-职能集合中的每一条政策信息,从政策全文中按照段落顺序,去除常规停用词之后进行高频词提取;
按照段落顺序,将各段落的段落索引值和最高频词作为该段落的段落关键信息。
进一步地,对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合,包括:
对所述政策-职能集合中所有政策信息依据段落的最高频词进行处理,获取拥有同一最高频词的其他政策信息的唯一索引和相应段落的段落索引值,建立段落映射集合。
进一步地,所述结果集合包括索引部和内容部,所述内容部包括头部和映射部;
所述索引部包括所述唯一索引;所述头部包括段落关键信息,所述映射部包括段落映射集合。
本发明的另一方面提供了一种政策谱系构建装置,包括:
采集模块,用于采集政策信息;
分类模块,用于对所述政策信息进行职能分类,获得政策-职能集合;
唯一索引建立模块,用于将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
段落关键信息提取模块,用于提取所述政策-职能集合中的每一条政策信息的段落关键信息;
映射处理模块,用于对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
结果建立模块,用于基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
本发明的另一方面提供了一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行上述的方法。
本发明的另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行上述的方法。
本发明的有益效果是:能够实现大量政策信息数据政策谱系的自动构建,效率高且准确性高,有助于用户快速高效获取不同部门、不同区域的政策要点,实现政策的横向对比,提高政策的快速检索与分析能力。
附图说明
图1为本发明实施例提供的一种政策谱系构建方法的流程图。
图2为本发明实施例提供的一种政策谱系构建装置的结构示意图。
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
本发明提供的方法可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的方法。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。
存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。存储器可用于存储指令、程序、代码、代码集或指令。
显示屏用于显示各个应用程序的用户界面。
除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。
实施例一
如图1所示,本发明实施例提供了一种政策谱系构建方法,包括:
S1、采集政策信息;
S2、对所述政策信息进行职能分类,获得政策-职能集合;
S3、将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
S4、提取所述政策-职能集合中的每一条政策信息的段落关键信息;
S5、对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
S6、基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
具体地,步骤S1中,采集的每一条政策信息
Figure 550986DEST_PATH_IMAGE001
包括政策标题
Figure 486581DEST_PATH_IMAGE002
、政策全文
Figure 866746DEST_PATH_IMAGE003
、行政区位
Figure 428047DEST_PATH_IMAGE004
、职能部门
Figure 210058DEST_PATH_IMAGE005
以及发文时间
Figure 67287DEST_PATH_IMAGE006
其中,行政区位
Figure 934748DEST_PATH_IMAGE004
按照中华人民共和国行政区划命名,职能部门
Figure 784893DEST_PATH_IMAGE005
按照中华人民共和国行政机构、中华人民共和国各级行政机构的规范命名;发文时间
Figure 673608DEST_PATH_IMAGE006
格式为“年-月-日时:分:秒”。
进一步地,步骤S2中,基于职能部门
Figure 685426DEST_PATH_IMAGE005
对政策信息
Figure 322075DEST_PATH_IMAGE001
进行职能分类,获得政策-职能集合
Figure 241489DEST_PATH_IMAGE007
进一步地,步骤S3中,将所述政策-职能集合
Figure 981781DEST_PATH_IMAGE007
中的每一条政策信息
Figure 430080DEST_PATH_IMAGE001
进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,包括:
S31、将政策-职能集合
Figure 6555DEST_PATH_IMAGE007
中的每一条政策信息
Figure 949234DEST_PATH_IMAGE001
的政策标题
Figure 294765DEST_PATH_IMAGE002
进行分词,并去除包含行政区位、职能部门的词以及常规停用词,之后采用TF-IDF模型计算每个词的TF-IDF值;
S32、对所述政策-职能集合
Figure 179544DEST_PATH_IMAGE007
中的每一条政策信息
Figure 483794DEST_PATH_IMAGE001
,将TF-IDF值最高的词作为该条政策信息的关键词,根据所述关键词对所述政策-职能集合
Figure 479432DEST_PATH_IMAGE007
中的政策信息进行分类,获得TF-IDF分类结果
Figure 679469DEST_PATH_IMAGE008
词频-逆向文件频率TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的加权技术,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。
进一步地,步骤S3中,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引,包括:
S33、获取所述政策信息中的发文时间
Figure 220303DEST_PATH_IMAGE006
以及行政区位
Figure 771370DEST_PATH_IMAGE004
,并将发文时间
Figure 305119DEST_PATH_IMAGE006
转换为时间戳
Figure 608931DEST_PATH_IMAGE009
S34、将TF-IDF分类结果
Figure 835513DEST_PATH_IMAGE008
、行政区位
Figure 608296DEST_PATH_IMAGE004
以及时间戳
Figure 696469DEST_PATH_IMAGE009
作为每一条政策信息的唯一索引。
唯一索引的格式为:
Figure 136678DEST_PATH_IMAGE010
进一步地,步骤S4中,提取所述政策-职能集合中的每一条政策信息的段落关键信息,包括:
S41、对所述政策-职能集合
Figure 520779DEST_PATH_IMAGE007
中的每一条政策信息
Figure 46439DEST_PATH_IMAGE001
,从政策全文中按照段落顺序,去除常规停用词之后进行高频词提取;
S42、按照段落顺序,将各段落的段落索引值
Figure 921991DEST_PATH_IMAGE011
和最高频词
Figure 967438DEST_PATH_IMAGE012
作为该段落的段落关键信息。
进一步地,基于步骤S4获得的段落关键信息,步骤S5中,对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合,包括:
对政策-职能集合
Figure 270244DEST_PATH_IMAGE007
中所有政策信息依据段落的最高频词进行处理,获取拥有同一最高频词的其他政策信息的唯一索引和相应段落的段落索引值,建立段落映射集合。
进一步地,步骤S6中,所述结果集合包括索引部和内容部,所述内容部包括头部和映射部;
所述索引部包括所述唯一索引;所述头部包括段落关键信息,所述映射部包括段落映射集合。
具体地,政策信息
Figure 283199DEST_PATH_IMAGE001
的结果集合的数据结构如下:
Figure 946130DEST_PATH_IMAGE013
其中,该结果集合的索引部为该条政策信息的唯一索引,结构为:
Figure 95352DEST_PATH_IMAGE010
Figure 116529DEST_PATH_IMAGE008
为TF-IDF分类结果、
Figure 931294DEST_PATH_IMAGE004
为行政区位,与政策信息中的一致,
Figure 148649DEST_PATH_IMAGE009
为时间戳。
内容部
Figure 699847DEST_PATH_IMAGE014
表示政策信息
Figure 344455DEST_PATH_IMAGE001
与其他政策信息的段落映射关系,该元素作为集合包含有若干个子元素,每个子元素表示政策信息
Figure 66423DEST_PATH_IMAGE015
的一个段落,共分为头部和映射部两个部分。
其中,头部为段落关键信息,其数据结构为
Figure 336737DEST_PATH_IMAGE016
Figure 194971DEST_PATH_IMAGE011
表示政策信息
Figure 292371DEST_PATH_IMAGE001
第q段落的段落索引值(以1为起始索引值),
Figure 236057DEST_PATH_IMAGE012
表示第q段落的最高频词。
映射部
Figure 795214DEST_PATH_IMAGE017
用于存储政策信息
Figure 25732DEST_PATH_IMAGE001
某个段落与其他政策信息段落的映射关系,其中
Figure 277721DEST_PATH_IMAGE018
用于标识与政策信息的映射关系,用政策信息的唯一索引表示;
Figure 974282DEST_PATH_IMAGE019
表示与政策信息的段落含有映射关系的政策信息
Figure 87862DEST_PATH_IMAGE018
的段落索引值,以1为起始索引值。
上述实施例提供的政策谱系构建方法,能够实现大量政策信息数据政策谱系的自动构建,效率高且准确性高,有助于用户快速高效获取不同部门、不同区域的政策要点,实现政策的横向对比,提高政策的快速检索与分析能力。
实施例二
参考图2,本发明的另一方面还包括和前述方法流程完全对应一致的功能模块架构,即本发明实施例还提供了一种政策谱系构建装置,包括:
采集模块201,用于采集政策信息;
分类模块202,用于对所述政策信息进行职能分类,获得政策-职能集合;
唯一索引建立模块203,用于将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
段落关键信息提取模块204,用于提取所述政策-职能集合中的每一条政策信息的段落关键信息;
映射处理模块205,用于对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
结果建立模块206,用于基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
具体地,采集模块201采集的政策信息包括政策标题、政策全文、行政区位、职能部门以及发文时间。
分类模块202基于所述职能部门对所述政策信息进行职能分类,获得政策-职能集合。
唯一索引建立模块203还用于将所述政策-职能集合中的每一条政策信息的政策标题进行分词,并去除包含行政区位、职能部门的词以及常规停用词,之后采用TF-IDF模型计算每个词的TF-IDF值;对所述政策-职能集合中的每一条政策信息,将TF-IDF值最高的词作为该条政策信息的关键词,根据所述关键词对所述政策-职能集合中的政策信息进行分类,获得TF-IDF分类结果。
进一步地,唯一索引建立模块203还用于获取所述政策信息中的发文时间以及行政区位,并将所述发文时间转换为时间戳;将所述TF-IDF分类结果、行政区位以及时间戳作为每一条政策信息的唯一索引。
进一步地,段落关键信息提取模块204还用于对所述政策-职能集合中的每一条政策信息,从政策全文中按照段落顺序,去除常规停用词之后进行高频词提取;按照段落顺序,将各段落的段落索引值和最高频词作为该段落的段落关键信息。
映射处理模块205还用于对所述政策-职能集合中所有政策信息依据段落的最高频词进行处理,获取拥有同一最高频词的其他政策信息的唯一索引和相应段落的段落索引值,建立段落映射集合。
结果建立模块206建立的结果集合包括索引部和内容部,所述内容部包括头部和映射部;所述索引部包括所述唯一索引;所述头部包括段落关键信息,所述映射部包括段落映射集合。
上述实施例提供的政策谱系构建装置,能够实现大量政策信息数据政策谱系的自动构建,效率高且准确性高,有助于用户快速高效获取不同部门、不同区域的政策要点,实现政策的横向对比,提高政策的快速检索与分析能力。
参考图3,本发明的另一方面提供了一种电子设备,包括处理器301和存储器302,存储器302存储有多条指令,处理器301用于读取所述指令并执行如实施例一所述的方法。
本发明的另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如实施例一所述的方法。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种政策谱系构建方法,其特征在于,包括:
采集政策信息;
对所述政策信息进行职能分类,获得政策-职能集合;
将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
提取所述政策-职能集合中的每一条政策信息的段落关键信息;
对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
2.根据权利要求1所述的方法,其特征在于,所述政策信息包括政策标题、政策全文、行政区位、职能部门以及发文时间;
基于所述职能部门对所述政策信息进行职能分类,获得政策-职能集合。
3.根据权利要求2所述的方法,其特征在于,将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,包括:
将所述政策-职能集合中的每一条政策信息的政策标题进行分词,并去除包含行政区位、职能部门的词以及常规停用词,之后采用TF-IDF模型计算每个词的TF-IDF值;
对所述政策-职能集合中的每一条政策信息,将TF-IDF值最高的词作为该条政策信息的关键词,根据所述关键词对所述政策-职能集合中的政策信息进行分类,获得TF-IDF分类结果。
4.根据权利要求2所述的方法,其特征在于,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引,包括:
获取所述政策信息中的发文时间以及行政区位,并将所述发文时间转换为时间戳;
将所述TF-IDF分类结果、行政区位以及时间戳作为每一条政策信息的唯一索引。
5.根据权利要求2所述的方法,其特征在于,提取所述政策-职能集合中的每一条政策信息的段落关键信息,包括:
对所述政策-职能集合中的每一条政策信息,从政策全文中按照段落顺序,去除常规停用词之后进行高频词提取;
按照段落顺序,将各段落的段落索引值和最高频词作为该段落的段落关键信息。
6.根据权利要求5所述的方法,其特征在于,对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合,包括:
对所述政策-职能集合中所有政策信息依据段落的最高频词进行处理,获取拥有同一最高频词的其他政策信息的唯一索引和相应段落的段落索引值,建立段落映射集合。
7.根据权利要求1-6任一所述的方法,其特征在于,所述结果集合包括索引部和内容部,所述内容部包括头部和映射部;
所述索引部包括所述唯一索引;所述头部包括段落关键信息,所述映射部包括段落映射集合。
8.一种政策谱系构建装置,其特征在于,包括:
采集模块,用于采集政策信息;
分类模块,用于对所述政策信息进行职能分类,获得政策-职能集合;
唯一索引建立模块,用于将所述政策-职能集合中的每一条政策信息进行TF-IDF计算,根据计算结果获得TF-IDF分类结果,基于所述TF-IDF分类结果为所述政策-职能集合中的每一条政策信息建立唯一索引;
段落关键信息提取模块,用于提取所述政策-职能集合中的每一条政策信息的段落关键信息;
映射处理模块,用于对所述政策-职能集合中的每一条政策信息进行段落映射处理,获得段落映射集合;
结果建立模块,用于基于所述唯一索引、段落关键信息以及段落映射集合,建立结果集合,获得政策谱系。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如权利要求1-7任一所述的方法。
CN202110379991.9A 2021-04-09 2021-04-09 一种政策谱系构建方法、装置和电子设备 Active CN112800246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110379991.9A CN112800246B (zh) 2021-04-09 2021-04-09 一种政策谱系构建方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110379991.9A CN112800246B (zh) 2021-04-09 2021-04-09 一种政策谱系构建方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112800246A true CN112800246A (zh) 2021-05-14
CN112800246B CN112800246B (zh) 2021-08-31

Family

ID=75816683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110379991.9A Active CN112800246B (zh) 2021-04-09 2021-04-09 一种政策谱系构建方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112800246B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469645A (zh) * 2021-06-21 2021-10-01 广州政企互联科技有限公司 一种政策数据智能入库方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043810A1 (en) * 2007-08-06 2009-02-12 Kibler Clare T Method, system, and program product for building hierarchies
CN102779143A (zh) * 2012-01-31 2012-11-14 中国科学院自动化研究所 知识谱系的可视化方法
CN108491438A (zh) * 2018-02-12 2018-09-04 陆夏根 一种科技政策检索分析方法
CN109271523A (zh) * 2018-11-23 2019-01-25 中电科大数据研究院有限公司 一种基于信息检索的政府公文主题分类方法
US20190179958A1 (en) * 2017-12-13 2019-06-13 Microsoft Technology Licensing, Llc Split mapping for dynamic rendering and maintaining consistency of data processed by applications
CN110297961A (zh) * 2019-06-26 2019-10-01 广州博士信息技术研究院有限公司 一种政策信息的快速采集与优化提取方法
CN110298028A (zh) * 2019-05-21 2019-10-01 浙江省北大信息技术高等研究院 一种文本段落的关键句提取方法和装置
CN111949798A (zh) * 2019-05-15 2020-11-17 北京百度网讯科技有限公司 图谱的构建方法、装置、计算机设备和存储介质
CN112214615A (zh) * 2020-10-19 2021-01-12 平安国际智慧城市科技股份有限公司 基于知识图谱的政策文件处理方法、装置和存储介质
US20210012217A1 (en) * 2019-07-10 2021-01-14 International Business Machines Corporation Leveraging entity relations to discover answers using a knowledge graph
CN112364172A (zh) * 2020-10-16 2021-02-12 上海晏鼠计算机技术股份有限公司 一种政务公文领域知识图谱构建方法
CN112541352A (zh) * 2020-12-23 2021-03-23 上海永骁智能技术有限公司 一种基于深度学习的政策解读方法
CN112580348A (zh) * 2020-12-15 2021-03-30 国家工业信息安全发展研究中心 政策文本关联性分析方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043810A1 (en) * 2007-08-06 2009-02-12 Kibler Clare T Method, system, and program product for building hierarchies
CN102779143A (zh) * 2012-01-31 2012-11-14 中国科学院自动化研究所 知识谱系的可视化方法
US20190179958A1 (en) * 2017-12-13 2019-06-13 Microsoft Technology Licensing, Llc Split mapping for dynamic rendering and maintaining consistency of data processed by applications
CN108491438A (zh) * 2018-02-12 2018-09-04 陆夏根 一种科技政策检索分析方法
CN109271523A (zh) * 2018-11-23 2019-01-25 中电科大数据研究院有限公司 一种基于信息检索的政府公文主题分类方法
CN111949798A (zh) * 2019-05-15 2020-11-17 北京百度网讯科技有限公司 图谱的构建方法、装置、计算机设备和存储介质
CN110298028A (zh) * 2019-05-21 2019-10-01 浙江省北大信息技术高等研究院 一种文本段落的关键句提取方法和装置
CN110297961A (zh) * 2019-06-26 2019-10-01 广州博士信息技术研究院有限公司 一种政策信息的快速采集与优化提取方法
US20210012217A1 (en) * 2019-07-10 2021-01-14 International Business Machines Corporation Leveraging entity relations to discover answers using a knowledge graph
CN112364172A (zh) * 2020-10-16 2021-02-12 上海晏鼠计算机技术股份有限公司 一种政务公文领域知识图谱构建方法
CN112214615A (zh) * 2020-10-19 2021-01-12 平安国际智慧城市科技股份有限公司 基于知识图谱的政策文件处理方法、装置和存储介质
CN112580348A (zh) * 2020-12-15 2021-03-30 国家工业信息安全发展研究中心 政策文本关联性分析方法及系统
CN112541352A (zh) * 2020-12-23 2021-03-23 上海永骁智能技术有限公司 一种基于深度学习的政策解读方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贾晓峰等: "科技政策学的理论溯源与内容框架构建", 《科技管理研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113469645A (zh) * 2021-06-21 2021-10-01 广州政企互联科技有限公司 一种政策数据智能入库方法

Also Published As

Publication number Publication date
CN112800246B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
Haustein et al. Tweets vs. Mendeley readers: How do these two social media metrics differ?
WO2017074174A1 (en) A system and method for processing big data using electronic document and electronic file-based system that operates on rdbms
US20150169645A1 (en) Presenting image search results
JP2013541793A (ja) マルチモード検索クエリー入力手法
US8467613B2 (en) Automatic retrieval of object interaction relationships
CN109785691B (zh) 一种通过终端辅助学习的方法和系统
CN108962346A (zh) 医疗检验报告电子化方法、存储设备及移动终端
CN111191012A (zh) 知识图谱产生装置、方法及其计算机程序产品
CN112800246B (zh) 一种政策谱系构建方法、装置和电子设备
CN115455930A (zh) 一种报告文档处理方法、装置、电子设备及存储介质
CN110825805A (zh) 一种数据的可视化方法及装置
CN118093632B (zh) 基于大语言模型和图结构的图数据库查询方法和装置
CN109299238B (zh) 一种数据查询方法和装置
CN103198115B (zh) 一种目标地物数据处理装置
CN107943937B (zh) 一种基于司法公开信息分析的债务人资产监控方法及系统
CN109670183A (zh) 一种文本重要性的计算方法、装置、设备和存储介质
CN105279392A (zh) 一种基于云平台的大数据分析装置
CN110263312B (zh) 文章生成方法、装置、服务器和计算机可读介质
JP2016076115A (ja) 情報処理装置、情報処理方法及びプログラム
JP2010092383A5 (zh)
CN103440261A (zh) 基于内容和结构的生物医疗流程图检索的系统及方法
CN108182216B (zh) 一种病历结构化存储方法及装置
CN111221777B (zh) 一种数据记录的匹配方法及装置
CN114706625A (zh) 构建患者信息全局查询插件的方法、装置及存储介质
CN109657010B (zh) 文档处理方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant