CN109241062A - 一种政务数据目录的生成方法及装置 - Google Patents
一种政务数据目录的生成方法及装置 Download PDFInfo
- Publication number
- CN109241062A CN109241062A CN201811130728.0A CN201811130728A CN109241062A CN 109241062 A CN109241062 A CN 109241062A CN 201811130728 A CN201811130728 A CN 201811130728A CN 109241062 A CN109241062 A CN 109241062A
- Authority
- CN
- China
- Prior art keywords
- catalogue
- data
- government data
- government
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种政务数据目录的生成方法及装置,其中,该方法包括:从各类应用系统中获取政务数据;对所述政务数据进行过滤,得到待构建目录数据;基于预先训练好的目录生成模型,抽取所述待构建目录数据中的知识信息,进行知识计算和知识融合,得到所述待构建目录数据对应的政务数据目录。本申请实施例提高了政务数据生成目录的生成效率。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种政务数据目录的生成方法及装置。
背景技术
信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源,大数据正日益对全球生产、流通、分配、消费活动以及经济运行机制、社会生活方式和国家治理能力产生重要影响。
目前,我国在大数据发展和应用方面已具备一定基础,拥有市场优势和发展潜力,然而在政务数据方面,由于其数据源分散、数据相对割裂、应用及服务碎片化,使得在进行政务数据资源目录的梳理过程中,一方面需要耗费大量人力去获取政务数据,且另一方面由于数据之间匹配度不高造成政务数据资源目录的梳理难,从而最终导致政务数据开放共享不足。
综上,现有技术中,政务数据生成目录的过程存在成本高且效率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种政务数据目录的生成方法及装置,以提高政务数据生成目录的生成效率。
第一方面,本申请实施例提供了一种政务数据目录的生成方法,包括:
从各类应用系统中获取政务数据;
对所述政务数据进行过滤,得到待构建目录数据;
基于预先训练好的目录生成模型,抽取所述待构建目录数据中的知识信息,进行知识计算和知识融合,得到所述待构建目录数据对应的政务数据目录。
可选的,所述从各类应用系统中获取政务数据,包括:
建立与各类所述应用系统进行数据传输的应用程序接口;
通过所述应用程序接口获取各类所述应用系统传输的政务数据。
可选的,所述对所述政务数据进行过滤,包括:对属于同一类别的政务数据进行合并处理,去除重复的数据项。
可选的,所述目录生成模型是按照以下方式进行训练:
将预选的政务数据样本输入至所述目录生成模型进行正向训练,得到与所述政务数据样本对应的样本目录;
基于所述样本目录与所述预选的政务数据样本对应的实际目录确定所述目录生成模型的准确率;
若所述准确率小于设定阈值,将所述预选的政务数据样本对应的实际目录输入所述目录生成模型进行反向训练,以调整所述目录生成模型的中间参数;
重复执行上述训练步骤,直至所述准确率不小于设定阈值或者所述训练次数大于设定次数后结束训练,得到所述目录生成模型。
可选的,在所述得到所述待构建目录数据对应的政务数据目录之后,所述方法还包括:
接收到用户发送的政务数据目录请求,确定所述政务数据目录请求中包含的用户身份信息与所述政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示所述政务数据目录请求对应的政务数据目录下的政务数据。
第二方面,本申请实施例提供了一种政务数据目录的生成装置,包括:
获取模块,用于从各类应用系统中获取政务数据;
过滤模块,用于对所述政务数据进行过滤,得到待构建目录数据;
执行模块,用于基于预先训练好的目录生成模型,抽取所述待构建目录数据中的知识信息,进行知识计算和知识融合,得到所述待构建目录数据对应的政务数据目录。
可选的,所述获取模块,具体用于:
建立与各类所述应用系统进行数据传输的应用程序接口;
通过所述应用程序接口获取各类所述应用系统传输的政务数据。
可选的,所述过滤模块,具体用于:
对属于同一类别的政务数据进行合并处理,去除重复的数据项。
可选的,所述目录生成模型由所述执行模块按照以下方式进行训练:
将预选的政务数据样本输入至所述目录生成模型进行正向训练,得到与所述政务数据样本对应的样本目录;
基于所述样本目录与所述预选的政务数据样本对应的实际目录确定所述目录生成模型的准确率;
若所述准确率小于设定阈值,将所述预选的政务数据样本对应的实际目录输入所述目录生成模型进行反向训练,以调整所述目录生成模型的中间参数;
重复执行上述训练步骤,直至所述准确率不小于设定阈值或者所述训练次数大于设定次数后结束训练,得到所述目录生成模型。
可选的,在所述得到所述待构建目录数据对应的政务数据目录之后,所述执行模块还用于:
接收到用户发送的政务数据目录请求,确定所述政务数据目录请求中包含的用户身份信息与所述政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示所述政务数据目录请求对应的政务数据目录下的政务数据。
本申请实施例提供了一种新的政务数据目录的生成方法,首先从各类应用系统中获取到政务数据,然后对获取到的政务数据进行过滤,得到待构建目录数据,最后基于预先训练好的目录生成模型,抽取待构建目录数据中的知识信息,进行知识计算和知识融合后得到待构建目录数据对应的政务数据目录,与现有技术中先公布目录框架,再将该目录框架发送给各类应用系统,让各类应用系统将所管辖的政务数据填入目录框架相比,本申请实施例给出的方法是通过自动获取到政务数据后,通过政务数据来反向生成的政务数据目录,这样能够根据政务数据的规则进行合理梳理,且不需要各类应用系统通过人力在目录框架中填写政务数据,一方面提高了政务数据目录的生成效率,另一方面节约了人力成本。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种政务数据目录的生成方法流程示意图;
图2示出了本申请实施例所提供的目录生成模型的训练方法流程示意图;
图3示出了本申请实施例所提供的一种政务数据目录的生成装置结构示意图;
图4示出了本申请实施例所提供的一种政务数据目录的生成服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种政务数据目录的生成方法,应用于政务数据目录生成服务器,如图1所示,该生成方法包括以下具体步骤S100~S102:
S100,从各类应用系统中获取政务数据。
其中,这里的应用系统为各类政府部门的服务器,比如公安部门的服务器、户籍部门的服务器、纪检部门的服务器以及环保部门的服务器等,在各类政府部门的服务器中存储有提前录入的政务数据。
这里政务数据即指政府部门录入的数据,包括层级结构以及每个层级的源数据,比如公安部门A-张三-身份信息和户籍部门B-李四-身份信息这两个政务数据,均为三个层级结构的政务数据,每个层级包括一个源数据,即公安部门A、张三、身份信息、户籍部门B和李四等即为源数据。
这里获取的每个政务数据均携带有公开权限属性,标明对哪些用户开放,对哪些用户不开放。
本申请实施例中,各类应用系统均设置有数据接口,政务数据目录生成服务器能够通过设置在各类应用系统上的数据接口获取政务数据。
应用系统中保存的政务数据可以是预先从数据库中获取的,也可以是由该应用系统对应的政府部门的工作人员预先输入的。
具体地,步骤S100中,从各类应用系统中获取政务数据,包括以下步骤S1001~S1002:
S1001,建立与各类应用系统进行数据传输的应用程序接口。
S1002,通过应用程序接口获取各类应用系统传输的政务数据。
政务数据目录生成服务器建立与各类应用系统进行数据传输的应用程序接口,比如公安部门类的应用程序接口、户籍部门类的应用程序接口和环保部门类的应用程序接口等,政务数据目录生成服务器通过这些应用程序接口来获取各类应用系统通过数据接口传输的政务数据。
S101,对政务数据进行过滤,得到待构建目录数据。
从各类应用系统中获取政务数据,有些是重复的数据,需要进行过滤,比如,张三的身份信息,可能在公安部门中进行了存储,在户籍部门B中也进行了存储,则由公安部门的应用系统中获取的政务数据和由户籍部门获取的政务数据中关于张三的身份信息的数据是重复的。
具体地,步骤S101中,对政务数据进行过滤,包括:对属于同一类别的政务数据进行合并处理,去除重复的数据项。
下面给出一种确定重复的数据项的方法:
(1)针对不同的应用系统包含的相同类别,从获取的政务数据中,提取属于同一类别的政务数据。
(2)在属于同一类别的政务数据中,获取任意两个政务数据的相似度。
(3)判断相似度是否大于设定值,若是,将其中一个政务数据确定为重复的数据项。
比如,不同的应用系统分别为公安部门的应用系统和户籍部门的应用系统,当获取到公安部门的应用系统和户籍部门的应用系统传输的政务数据后,从这些政务数据中寻找属于同一类别的政务数据,比如护照类别的政务数据,然后在属于护照类别的政务数据中,获取属于任意两个政务数据,可以通过分词方法对这两个政务数据进行分词,然后计算这两个政务数据的相似度,最后判断这两个政务数据的相似度是否大于设定值,若是,将其中一个政务数据确定为重复的数据项。
比如,公安部门中的护照类别有张三的信息,户籍部门的护照类别中也有张三的信息,且两个张三为同一个人,则将这两个张三的护照信息中的一个确定为重复的数据项。
将重复的数据项去除后,得到待构建目录数据,这里的待构建目录数据包括多个层次,比如公安部门A-张三-身份信息和户籍部门B-李四-身份信息均为待构建目录数据。
S102,基于预先训练好的目录生成模型,抽取待构建目录数据中的知识信息,进行知识计算和知识融合,得到待构建目录数据对应的政务数据目录。
这里的目录生成模型是预选训练好的,使得当待构建目录数据输入该训练好的目录生成模型后,能够得到符合要求的政务数据目录,比如符合正态分布的政务数据目录,这里的政务数据目录包括政务数据中每个源数据,以及每个源数据对应的目录节点。
具体地,目录生成模型中保存有关于政务数据的知识图谱,将待构建目录数据输入到目录生成模型,政务数据目录生成服务器应用目录生成模型抽取待构建目录数据中的知识信息,即抽取待构建目录数据在知识图谱中的节点,然后通过目录生成模型中的隐含层基于待构建目录数据在知识图谱中的节点去分类,将属于同一节点的待构建目录数据进行融合,属于不同节点的待构建目录数据进行分类,最终得到符合设定要求的政务数据目录,比如呈正态分布的政务数据目录。
其中,目录生成模型是按照以下方式进行训练,如图2所示,具体包括以下步骤S200~S203:
S200,将预选的政务数据样本输入至目录生成模型进行正向训练,得到与政务数据样本对应的样本目录。
这里预选的政务数据样本包括大量不同种类的政务数据,这些政务数据样本对应一个符合设定要求的实际目录,比如这个实际目录是呈正态分布的。
将预选的政务数据样本输入到目录生成模型后,应用目录生成模型抽取待构建目录数据中的知识信息,即抽取待构建目录数据在知识图谱中的节点,然后通过目录生成模型中的隐含层基于待构建目录数据在知识图谱中的节点去分类,将属于同一节点的待构建目录数据进行融合,属于不同节点的待构建目录数据进行分类,得到与政务数据样本对应的样本目录。
S201,基于样本目录与预选的政务数据样本对应的实际目录确定目录生成模型的准确率。
将步骤S200中得到的政务数据样本对应的样本目录与政务数据样本对应的符合设定要求的实际目录相比较,确定步骤S200中得到的政务数据样本对应的样本目录的正确率,比如实际目录的层级结构是5层,且各个层级中对应的源数据符合正态分布的目录,而步骤S200中得到的政务数据样本对应的样本目录的层级结构是3层,且各个层级中对应的源数据并不符合正态分布,即该样本目录的正确率较低,则可以确定这样的样本目录并不符合要求,其原因一方面可能是政务数据样本种类不全,另一方面可能是当前的目录生成模型中的隐含层中的参数需要调整,或者这两种原因都存在。
S202,若准确率小于设定阈值,将预选的政务数据样本对应的实际目录输入目录生成模型进行反向训练,以调整目录生成模型的中间参数。
将上述政务数据样本对应的实际目录输入上述目录生成模型,并将调整后的政务数据样本输入该目录生成模型,调整该目录生成模型中的隐含层的参数,继续对目录生成模型进行训练,然后将新的政务数据样本输入训练后的目录生成模型,继续判断得到的样本目录的准确率是否不小于设定阈值。
S203,重复执行上述训练步骤,直至准确率不小于设定阈值或者训练次数大于设定次数后结束训练,得到目录生成模型。
重复步骤S200~S202,直至准确率不小于设定阈值或者训练次数大于设定次数后,不再对目录生成模型进行训练,此时的目录生成模型即为步骤S102中训练好的目录生成模型。
可选地,步骤S102中,在得到待构建目录数据对应的政务数据目录之后,本申请实施例中的政务数据目录的生成方法还包括:
接收到用户发送的政务数据目录请求,确定政务数据目录请求中包含的用户身份信息与政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示政务数据目录请求对应的政务数据目录下的政务数据。
步骤S100中,从各类应用系统中获取的政务数据携带有公开权限属性,比如公安部门下的政务数据仅仅对一些特定的用户开发,对普通用户不开放。
当政务数据目录生成服务器接收到用户发送的政务数据目录请求后,确定政务数据目录请求中包含的用户身份信息和政务数据目录请求对应的政务数据目录,然后比对该政务数据目录中各个政务数据的公开属性以及该用户身份信息是否匹配,然后对该用户仅仅展示该用户匹配的即有权限查看的政务数据目录中的政务数据。
比如用户请求查看政务数据目录,确定该用户身份信息与该政务数据目录中的公安类别的政务数据对应的公开权限并不匹配,与其他类别的政务数据对应的公开权限均匹配,则在对该用户展示政务数据目录时,会展示除了公安类别的政务数据以外的其他类别的政务数据。
本申请实施例还提供了一种政务数据目录的生成装置300,如图3所示,包括:
获取模块301,用于从各类应用系统中获取政务数据。
过滤模块302,用于对政务数据进行过滤,得到待构建目录数据。
执行模块303,用于基于预先训练好的目录生成模型,抽取待构建目录数据中的知识信息,进行知识计算和知识融合,得到待构建目录数据对应的政务数据目录。
可选地,获取模块301,具体用于:
建立与各类应用系统进行数据传输的应用程序接口。
通过应用程序接口获取各类应用系统传输的政务数据。
可选地,过滤模块302,具体用于:
对属于同一类别的政务数据进行合并处理,去除重复的数据项。
可选地,目录生成模型由执行模块303按照以下方式进行训练:
将预选的政务数据样本输入至目录生成模型进行正向训练,得到与政务数据样本对应的样本目录。
基于样本目录与预选的政务数据样本对应的实际目录确定目录生成模型的准确率。
若准确率小于设定阈值,将预选的政务数据样本对应的实际目录输入目录生成模型进行反向训练,以调整目录生成模型的中间参数。
重复执行上述训练步骤,直至准确率不小于设定阈值或者训练次数大于设定次数后结束训练,得到目录生成模型。
可选地,在得到待构建目录数据对应的政务数据目录之后,执行模块303还用于:
接收到用户发送的政务数据目录请求,确定政务数据目录请求中包含的用户身份信息与政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示政务数据目录请求对应的政务数据目录下的政务数据。
可选地,本申请实施例还提供了一种政务数据目录生成服务器400,如图4所示,该政务数据目录生成服务器400包括:处理器401、存储器402和总线403,存储器402存储执行指令,当装置运行时,处理器401与存储器402之间通过总线403通信,处理器401执行存储器402中存储的如下执行指令:
从各类应用系统中获取政务数据。
对政务数据进行过滤,得到待构建目录数据。
基于预先训练好的目录生成模型,抽取待构建目录数据中的知识信息,进行知识计算和知识融合,得到待构建目录数据对应的政务数据目录。
可选地,处理器401执行的执行指令具体包括:
建立与各类应用系统进行数据传输的应用程序接口。
通过应用程序接口获取各类应用系统传输的政务数据。
可选地,处理器401执行的执行指令具体包括:
对属于同一类别的政务数据进行合并处理,去除重复的数据项。
可选地,目录生成模型由处理器401执行以下指令进行训练:
将预选的政务数据样本输入至目录生成模型进行正向训练,得到与政务数据样本对应的样本目录。
基于样本目录与预选的政务数据样本对应的实际目录确定目录生成模型的准确率。
若准确率小于设定阈值,将预选的政务数据样本对应的实际目录输入目录生成模型进行反向训练,以调整目录生成模型的中间参数。
重复执行上述训练步骤,直至准确率不小于设定阈值或者训练次数大于设定次数后结束训练,得到目录生成模型。
可选地,处理器401执行的执行指令还包括:
接收到用户发送的政务数据目录请求,确定政务数据目录请求中包含的用户身份信息与政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示政务数据目录请求对应的政务数据目录下的政务数据。
对应于图1至图2中的政务数据目录的生成方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述政务数据目录的生成方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述政务数据目录的生成方法,从而解决现有技术中政务数据生成目录的过程存在成本高且效率低的问题。
本申请实施例提供了一种新的政务数据目录的生成方法,首先从各类应用系统中获取到政务数据,然后对获取到的政务数据进行过滤,得到待构建目录数据,最后基于预先训练好的目录生成模型,抽取待构建目录数据中的知识信息,进行知识计算和知识融合后得到待构建目录数据对应的政务数据目录,与现有技术中先公布目录框架,再将该目录框架发送给各类应用系统,让各类应用系统将所管辖的政务数据填入目录框架相比,本申请实施例给出的方法是通过自动获取到政务数据后,通过政务数据来反向生成的政务数据目录,这样能够根据政务数据的规则进行合理梳理,且不需要各类应用系统通过人力在目录框架中填写政务数据,一方面提高了政务数据目录的生成效率,另一方面节约了人力成本。
进一步地,本申请实施例给出的政务数据目录的生成方法,直接通过预先建立的应用程序接口,可以很方便地获取各类应用系统中的政务数据,节省时间,提高政务数据的获取效率。
进一步地,最终生成的政务数据目录中的各个政务数据标记有公开权限,只对符合要求的用户开发,保护了政务数据的安全性,也有利于政务数据的共享。
本申请实施例所提供的进行政务数据目录的生成方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的政务数据目录生成装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种政务数据目录的生成方法,其特征在于,包括:
从各类应用系统中获取政务数据;
对所述政务数据进行过滤,得到待构建目录数据;
基于预先训练好的目录生成模型,抽取所述待构建目录数据中的知识信息,进行知识计算和知识融合,得到所述待构建目录数据对应的政务数据目录。
2.根据权利要求1所述的方法,其特征在于,所述从各类应用系统中获取政务数据,包括:
建立与各类所述应用系统进行数据传输的应用程序接口;
通过所述应用程序接口获取各类所述应用系统传输的政务数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述政务数据进行过滤,包括:对属于同一类别的政务数据进行合并处理,去除重复的数据项。
4.根据权利要求1所述的方法,其特征在于,所述目录生成模型是按照以下方式进行训练:
将预选的政务数据样本输入至所述目录生成模型进行正向训练,得到与所述政务数据样本对应的样本目录;
基于所述样本目录与所述预选的政务数据样本对应的实际目录确定所述目录生成模型的准确率;
若所述准确率小于设定阈值,将所述预选的政务数据样本对应的实际目录输入所述目录生成模型进行反向训练,以调整所述目录生成模型的中间参数;
重复执行上述训练步骤,直至所述准确率不小于设定阈值或者所述训练次数大于设定次数后结束训练,得到所述目录生成模型。
5.根据权利要求1所述的方法,其特征在于,在所述得到所述待构建目录数据对应的政务数据目录之后,所述方法还包括:
接收到用户发送的政务数据目录请求,确定所述政务数据目录请求中包含的用户身份信息与所述政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示所述政务数据目录请求对应的政务数据目录下的政务数据。
6.一种政务数据目录的生成装置,其特征在于,包括:
获取模块,用于从各类应用系统中获取政务数据;
过滤模块,用于对所述政务数据进行过滤,得到待构建目录数据;
执行模块,用于基于预先训练好的目录生成模型,抽取所述待构建目录数据中的知识信息,进行知识计算和知识融合,得到所述待构建目录数据对应的政务数据目录。
7.根据权利要求6所述的装置,其特征在于,所述获取模块,具体用于:
建立与各类所述应用系统进行数据传输的应用程序接口;
通过所述应用程序接口获取各类所述应用系统传输的政务数据。
8.根据权利要求6所述的装置,其特征在于,所述过滤模块,具体用于:
对属于同一类别的政务数据进行合并处理,去除重复的数据项。
9.根据权利要求6所述的装置,其特征在于,所述目录生成模型由所述执行模块按照以下方式进行训练:
将预选的政务数据样本输入至所述目录生成模型进行正向训练,得到与所述政务数据样本对应的样本目录;
基于所述样本目录与所述预选的政务数据样本对应的实际目录确定所述目录生成模型的准确率;
若所述准确率小于设定阈值,将所述预选的政务数据样本对应的实际目录输入所述目录生成模型进行反向训练,以调整所述目录生成模型的中间参数;
重复执行上述训练步骤,直至所述准确率不小于设定阈值或者所述训练次数大于设定次数后结束训练,得到所述目录生成模型。
10.根据权利要求6所述的装置,其特征在于,在所述得到所述待构建目录数据对应的政务数据目录之后,所述执行模块还用于:
接收到用户发送的政务数据目录请求,确定所述政务数据目录请求中包含的用户身份信息与所述政务数据目录请求对应的政务数据目录的公开权限属性相匹配后,展示所述政务数据目录请求对应的政务数据目录下的政务数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130728.0A CN109241062A (zh) | 2018-09-27 | 2018-09-27 | 一种政务数据目录的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811130728.0A CN109241062A (zh) | 2018-09-27 | 2018-09-27 | 一种政务数据目录的生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109241062A true CN109241062A (zh) | 2019-01-18 |
Family
ID=65057038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811130728.0A Pending CN109241062A (zh) | 2018-09-27 | 2018-09-27 | 一种政务数据目录的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241062A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111813842A (zh) * | 2020-09-10 | 2020-10-23 | 杭州城市大数据运营有限公司 | 一种数据处理方法、装置、系统、设备和存储介质 |
CN111858836A (zh) * | 2020-08-14 | 2020-10-30 | 连接派(杭州)互联网有限公司 | 数据处理及提供方法、装置、系统及存储介质 |
CN112463985A (zh) * | 2020-12-04 | 2021-03-09 | 北京明略软件系统有限公司 | 政务图谱模型构建方法、装置、设备及计算机可读介质 |
CN112835908A (zh) * | 2021-02-22 | 2021-05-25 | 广东数程科技有限公司 | 一种时序数据存储方法、系统、存储设备和存储介质 |
CN115510204A (zh) * | 2022-09-29 | 2022-12-23 | 河北雄安睿天科技有限公司 | 一种智慧水务数据资源目录管理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102279953A (zh) * | 2011-09-21 | 2011-12-14 | 广东迪科思信息科技有限公司 | 一种构建电子政务信息资源共享平台的方法 |
CN106776731A (zh) * | 2016-11-18 | 2017-05-31 | 山东浪潮云服务信息科技有限公司 | 一种搜索实现方法、装置和系统 |
CN106855962A (zh) * | 2015-12-09 | 2017-06-16 | 星际空间(天津)科技发展有限公司 | 一种构建政务大数据平台的方法 |
CN107633075A (zh) * | 2017-09-22 | 2018-01-26 | 吉林大学 | 一种多源异构数据融合平台及融合方法 |
CN107967267A (zh) * | 2016-10-18 | 2018-04-27 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
-
2018
- 2018-09-27 CN CN201811130728.0A patent/CN109241062A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102279953A (zh) * | 2011-09-21 | 2011-12-14 | 广东迪科思信息科技有限公司 | 一种构建电子政务信息资源共享平台的方法 |
CN106855962A (zh) * | 2015-12-09 | 2017-06-16 | 星际空间(天津)科技发展有限公司 | 一种构建政务大数据平台的方法 |
CN107967267A (zh) * | 2016-10-18 | 2018-04-27 | 中兴通讯股份有限公司 | 一种知识图谱构建方法、装置及系统 |
CN106776731A (zh) * | 2016-11-18 | 2017-05-31 | 山东浪潮云服务信息科技有限公司 | 一种搜索实现方法、装置和系统 |
CN107633075A (zh) * | 2017-09-22 | 2018-01-26 | 吉林大学 | 一种多源异构数据融合平台及融合方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858836A (zh) * | 2020-08-14 | 2020-10-30 | 连接派(杭州)互联网有限公司 | 数据处理及提供方法、装置、系统及存储介质 |
CN111858836B (zh) * | 2020-08-14 | 2024-02-09 | 连接派(杭州)互联网有限公司 | 数据处理及提供方法、装置、系统及存储介质 |
CN111813842A (zh) * | 2020-09-10 | 2020-10-23 | 杭州城市大数据运营有限公司 | 一种数据处理方法、装置、系统、设备和存储介质 |
CN112463985A (zh) * | 2020-12-04 | 2021-03-09 | 北京明略软件系统有限公司 | 政务图谱模型构建方法、装置、设备及计算机可读介质 |
CN112835908A (zh) * | 2021-02-22 | 2021-05-25 | 广东数程科技有限公司 | 一种时序数据存储方法、系统、存储设备和存储介质 |
CN115510204A (zh) * | 2022-09-29 | 2022-12-23 | 河北雄安睿天科技有限公司 | 一种智慧水务数据资源目录管理方法及装置 |
CN115510204B (zh) * | 2022-09-29 | 2024-01-12 | 河北雄安睿天科技有限公司 | 一种智慧水务数据资源目录管理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241062A (zh) | 一种政务数据目录的生成方法及装置 | |
CN105678125B (zh) | 一种用户认证方法、装置 | |
CN111932386B (zh) | 用户账号确定方法及装置、信息推送方法及装置、电子设备 | |
CN111967910A (zh) | 一种用户客群分类方法和装置 | |
Kashyap | Machine Learning, data mining for IOT-based systems | |
CN109600336A (zh) | 存储设备、验证码应用方法和装置 | |
CN110046297A (zh) | 运维违规操作的识别方法、装置和存储介质 | |
CN106778851A (zh) | 基于手机取证数据的社交关系预测系统及其方法 | |
CN112580902B (zh) | 对象数据处理方法、装置、计算机设备和存储介质 | |
CN110909195A (zh) | 基于区块链的图片标注方法、装置及存储介质、服务器 | |
CN107483451A (zh) | 基于串并行结构网络安全数据处理方法及系统、社交网络 | |
CN110675252A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
Bauer et al. | Nonlinear growth: an origin of hub organization in complex networks | |
CN109460299B (zh) | 一种分布式并行多源社交网络数据采集系统和方法 | |
CN103580920B (zh) | 一种基于云计算技术的信息系统运行异常检测方法 | |
CN104618175A (zh) | 网络异常检测方法 | |
CN110222187B (zh) | 保护用户隐私的共同活动检测与数据共享方法 | |
CN116151965B (zh) | 一种风险特征提取方法、装置、电子设备及存储介质 | |
CN112925899A (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
CN108090040A (zh) | 一种文本信息分类方法及系统 | |
JP2021018466A (ja) | ルール抽出装置、情報処理装置、ルール抽出方法及びルール抽出プログラム | |
CN110493044A (zh) | 一种可量化的态势感知的方法和系统 | |
CN110071845A (zh) | 一种对未知应用进行分类的方法及装置 | |
CN111651652B (zh) | 基于人工智能的情感倾向识别方法、装置、设备及介质 | |
Gowda et al. | Real-Time Tweets Streaming and Comparison Using Naïve Bayes Classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co., Ltd Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190118 |
|
RJ01 | Rejection of invention patent application after publication |