CN112527927A - 一种数据起源空间信息管理方法 - Google Patents
一种数据起源空间信息管理方法 Download PDFInfo
- Publication number
- CN112527927A CN112527927A CN201910884880.6A CN201910884880A CN112527927A CN 112527927 A CN112527927 A CN 112527927A CN 201910884880 A CN201910884880 A CN 201910884880A CN 112527927 A CN112527927 A CN 112527927A
- Authority
- CN
- China
- Prior art keywords
- data
- origin
- information
- management
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 160
- 230000006870 function Effects 0.000 claims abstract description 55
- 238000007781 pre-processing Methods 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims description 69
- 238000003860 storage Methods 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 39
- 238000012360 testing method Methods 0.000 claims description 14
- 238000013500 data storage Methods 0.000 claims description 13
- 238000012550 audit Methods 0.000 claims description 11
- 238000011217 control strategy Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000013523 data management Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 9
- 230000000694 effects Effects 0.000 description 33
- 239000003795 chemical substances by application Substances 0.000 description 22
- 230000008520 organization Effects 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013474 audit trail Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Storage Device Security (AREA)
Abstract
本发明实施例提供一种数据起源空间信息管理方法,所述方法包括:设定数据起源空间管理元数据;按照空间管理元数据采集数据起源空间信息;按照空间管理元数据预处理并存储数据起源信息;提供数据起源空间信息管理功能和服务。本发明将空间信息管理技术和数权保护技术应用于数据起源管理,实现了对数据起源进行记录、追踪、溯源、展示、分析,具备管理粒度细、效率高、安全性好、应用方便、支持数权保护数据溯源的优势。
Description
技术领域
本发明涉及信息安全领域,尤其是数据起源空间信息管理领域。
背景技术
数据起源由 “Data Provenance”翻译而来,同义表述有 “Data Lineage”、“DataDerivation”、“Data Pedigree”等。除 “数据起源”外,国内学者在相关研究论文中也使用到“数据世系”、“数据溯源”等其他译名。数据起源(data provenance)记录了数据从产生到消逝的整个生命周期内所发生的变化和经过处理的信息,可以理解为是数据的历史台账档案。数据起源具有以下用途:(1)评估数据质量和可靠性;(2)查询数据来源,在必要时可进行数据来源的审计跟踪(3)再现数据的产生过程,重构数据或者试验过程,有利于数据共享和流程优化;(4)管理数据的版权与知识产权;(5)发生错误时能够快速定位产生错误的位置,分析出错误原因,确定责任人;(6)解释数据现状产生的原因。
2013 年, W3C(the World Wide Web Consortium)工作组定义了起源标准 PROV,高度概括了起源过程中涉及的实体(Entity)、活动(Activity)以及代理(Agent)之间的关系。其中,实体(Entity)是客观上存在的、数字化的、概念性的或其他类型的事物, 起源记录描述的就是实体的起源, 而一个实体的起源可能涉及到其他的一些实体;实体状态或属性的改变会成为一个事件,例如,一篇文章从创建到存档或销毁的整个生命周期中,修改、注释、发布、访问、修订、引用等每一步都可称为一个事件。活动(Activity)是描述实体怎样达到现在的状态,实体的属性如何变化成为新的实体,是现实世界的动态视角,如行动、过程等;例如,引起创建事件的活动有观察、输入、复制、推导、编辑等;引起位置事件的活动包括存储、转移;引起注释事件的活动包括标记、评论;引起存档事件的活动有转移、仿真、更新、翻译等。单个活动组合起来便构成了复杂活动。代理(Agent)是在活动中承担角色,是发起或控制活动的个人或机构,承担活动的责任,可以是人、软件、无生命的物体、某个组织或其他可以赋予责任的实体。实体(Entity)、活动(Activity)以及代理(Agent)之间存在 5种典型的关系,分别是生成、使用、控制、获得、触发。
目前,在起源信息采集和存储技术环节,有些系统收集关于数据修改的信息并且以标注的形式储存起来,附加到数据本身;有些把起源信息存放在一个或多个数据库中。在数据起源的追踪与溯源的技术环节,有标注法和逆查询法,其中:(一)标注法。常用来记录注释、声明等关于数据的辅助信息,以供使用者共享,在标注中记录关于数据出处、作者、时间及其演变历史等重要信息,并使标注可与数据一起传播,用户可直接通过查看目标数据的标注来获得数据的起源信息。标注法其中的一个分支是数字水印技术,在数据外发的环节加上隐蔽标识水印,可以应用于数字图像、音频、视频、打印、文本、条码等数据信息中,可以追踪数据扩散路径。(二)逆查询法。通过逆置函数和相对应的验证函数,由结果追溯到原数据,在需要时才计算;逆查询法只存储少量的元数据就可实现对数据的溯源追踪,不需要存储中间处理信息、全过程的注释信息;逆查询法的关键是要构造出逆向函数,逆向函数构造的好与坏直接影响查询的效果以及算法的性能,与标注法相比,它比较复杂,但需要的存储空间比标注法要小。
空间信息管理系统是一种在计算机硬、软件系统支持下,对有关空间分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。地理信息系统(GIS,GeographicInformation System)是一门应用最广的空间信息管理系统,GIS结合地理学与地图学以及遥感和计算机科学,已经广泛的应用在不同的领域,是用于输入、存储、查询、分析和显示地理数据的计算机系统,随着GIS的发展,也有称GIS为“地理信息科学”(GeographicInformation Science),近年来,也有称GIS为"地理信息服务"(Geographic Informationservice)。
数权是指有一定规律或价值的信息编码集合在全生命周期治理过程中所产生的权利,涉及个人隐私、数据产权、国家主权等权益。数权主体是特定权利人,包含数据所指向的特定对象以及该数据的收集、存储、传输、处理者(包含自然人、法人、非法人组织等),数权客体是数权涉及的有一定规律或价值的数据集合。数权的内容主要包括控制权、使用权、收益权和共享权。控制权是指数权主体对数权客体所享有的支配权,使数权客体处于数权主体合法控制之下,使得数权主体拥有了自由行使、不受他人干涉的合法控制数据客体的权利;使用权是指数权主体利用数权客体实现相应利益的权利;收益权是数权主体使用、共享数权客体而获得收益的权利;共享权是数权主体对数权客体进行最终消费与分享的权利。数权保护,是指数权主体对数权客体所享有的完全支配权,使数权客体处于数权主体合法控制之下,使得数权主体拥有了自由行使、不受他人干涉的合法控制数据客体的权利。数权保护的本质是数权主体对数权客体的控制,为了保障数权主体的权益,数权主体作为施控者,影响和支配数权客体全生命周期所涉及受控对象,包括信源、信道、信宿、编码器、译码器等计算、存储、传输方面的软硬件设施。
自从1948 年诺伯特·维纳发表了著名的《控制论——关于在动物和机器中控制和通讯的科学》一书以来,控制论的思想和方法已经渗透到了几乎所有的自然科学和社会科学领域。控制是指为了“改善”某个或某些对象的功能,需要获得并使用信息,以这种信息为基础而选出的加于该对象的作用。控制是施控者影响和支配受控者的行为过程,一种有目的的活动。施控主体采取一定的策略手段作用于受控对象,力求使其行为状态发生合乎目标的变化,从现在的实有状态转变为期望的未来状态。
当前的数据起源技术存在以下缺陷:
缺陷一:数据起源管理粒度粗、规范性差、数据溯源效率低、数据来源分析易用性差等问题。
缺陷二:缺乏数权保护数据起源管理方面的功能和服务。
发明内容
针对以上技术缺陷,本发明将空间信息管理技术和数权保护技术应用于数据起源管理,提供了一种数据起源空间信息管理方法,用于对数据起源进行记录、追踪、溯源、展示、分析,具备管理粒度细、效率高、安全性好、应用方便、支持数权保护数据溯源的优势。
本发明实施例提供了一种数据起源空间信息管理方法,所述方法包括:
设定数据起源空间管理元数据;
按照空间管理元数据采集数据起源空间信息;
按照空间管理元数据预处理并存储数据起源信息;
提供数据起源空间信息管理功能和服务。
优选的,所述空间管理元数据包含网络安全域、网络IP地址、主机身份标识、网络服务商身份标识、数据类别、数权主体身份标识、数权客体身份标识。
优选的,按照空间管理元数据预处理并存储数据起源信息的方式采取基于GIS系统扩展的方式。
优选的,所述采集数据起源空间信息其内容包括采集数权数据起源信息;所述提供数据起源空间信息管理功能和服务其内容包括:评估数权保护数据质量和可靠性,查询数权保护数据来源和流转轨迹,再现数权保护数据的产生过程,重构数权保护数据或者试验过程,管理数权保护数据的版权与知识产权,数权保护数据错误定位定责,解释数权保护数据现状产生的原因,数权保护历史跟踪,数权保护策略执行安全审计功能和服务。
优选的,所述提供数据起源空间信息管理功能和服务的实现方式为:按照数据起源空间管理元数据进行扩展改造GIS系统数据库结构系统功能和界面,用于提供数据起源信息数据采集与输入、数据编辑与更新、数据存储与管理、空间查询与分析、空间决策支持、数据显示与输出功能和服务。
优选的,通过一种数据起源空间信息管理系统提供数据起源空间信息管理功能和服务,所述数据起源空间信息管理系统包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息采集与存储单元、起源信息库、数据本体随附元数据记录、起源信息安全服务单元、数据起源服务单元,其中:
所述分类编码管理单元,功能包括:起源信息分类元数据设置,分类编码管理。
所述元数据管理单元,功能包括:起源元数据设置和管理;
所述起源信息预处理单元,功能包括:采取基于GIS系统扩展的方式对起源信息进行逻辑预处理;
所述存储方式管理单元,用于设置每个实体(Entity)的数据存储方式,包括起源数据库存储方式或者数据本体随附元数据记录方式;
所述数据格式管理单元,用于设置数据格式,包括XML格式、JSON格式、关系型数据库库表格式、数据本体随附元数据记录格式;
所述起源信息采集与存储单元,用于采集起源信息,并存储到起源数据库或者数据本体随附元数据记录中;
所述起源信息库,是指存储起源信息记录的历史记录档案库;
所述数据本体随附元数据记录,是指部分起源信息作为数据本体的元数据与数据本体一起编码的数据记录;
所述起源信息安全服务单元,执行起源信息库、数据本体随附元数据记录内部存储的安全域、控制维度的安全管控策略信息,并提供安全审计功能;
所述数据起源服务单元,统一为用户提供安全数据起源服务,包括评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因;安全审计功能服务。
优选的,数据起源空间信息管理系统部署为一种数据起源管理装置,所述数据起源管理装置包括数据起源管理平台和起源信息采集软件两个组成部分,其中:
数据起源管理平台包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息库、起源信息安全服务单元、数据起源服务单元;
起源信息采集软件包括起源信息采集与存储单元。
上述技术方案具有如下有益效果:
1、本发明为数权主体,包括自然人、法人、非法人组织,提供了统一的数据起源空间信息管理方法和系统。数权主体可统一管理所有数据客体的数据起源,对数据起源进行记录、追踪、溯源、展示、分析,具备管理粒度细、应用方便的优势。
2、本发明通过管理和设置起源信息分类编码、起源元数据,对起源信息进行标准化,提高了起源信息的记录、追踪、溯源、展示的效率和可靠性。
3、起源信息存储方式支持以XML、JSON等结构化数据作为元数据附加到数据本身,或者存放在一个或多个数据文件或者数据库中等数据存储方式,以便在应用时,可按需选择其中的一种数据存储方式,具备很大的实施灵活性,能够满足多变的应用需求。
4、本发明优选为查询数据来源和流转轨迹、再现数据的产生过程、重构数据或者试验过程、数据错误定位定责等服务提供有向图展示功能,便于用户通过手机软件、浏览器页面、客户端软件可视化查看数据轨迹和状态,提高了系统易用性。
5、本发明将空间信息管理技术和数权保护技术应用于数据起源管理,便于使用GIS系统展示数据起源。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种数据起源空间信息管理方法流程图;
图2为本发明应用实例一种数据起源空间信息管理方法流程图;
图3为本发明应用实例一种数据起源空间信息管理系统结构示意图;
图4为本发明应用实例一种数据起源空间信息管理装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例一种数据起源空间信息管理方法流程图,所述方法包括:
101、设定数据起源空间管理元数据;
102、按照空间管理元数据采集数据起源空间信息;
103、按照空间管理元数据预处理并存储数据起源信息;
104、提供数据起源空间信息管理功能和服务。
优选的,所述空间管理元数据包含网络安全域、网络IP地址、主机身份标识、网络服务商身份标识、数据类别、数权主体身份标识、数权客体身份标识。
优选的,按照空间管理元数据预处理并存储数据起源信息的方式采取基于GIS系统扩展的方式。
优选的,所述采集数据起源空间信息其内容包括采集数权数据起源信息;所述提供数据起源空间信息管理功能和服务其内容包括:评估数权保护数据质量和可靠性,查询数权保护数据来源和流转轨迹,再现数权保护数据的产生过程,重构数权保护数据或者试验过程,管理数权保护数据的版权与知识产权,数权保护数据错误定位定责,解释数权保护数据现状产生的原因,数权保护历史跟踪,数权保护策略执行安全审计功能和服务。
优选的,所述提供数据起源空间信息管理功能和服务的实现方式为:按照数据起源空间管理元数据进行扩展改造GIS系统数据库结构系统功能和界面,用于提供数据起源信息数据采集与输入、数据编辑与更新、数据存储与管理、空间查询与分析、空间决策支持、数据显示与输出功能和服务。
优选的,通过一种数据起源空间信息管理系统提供数据起源空间信息管理功能和服务,所述数据起源空间信息管理系统包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息采集与存储单元、起源信息库、数据本体随附元数据记录、起源信息安全服务单元、数据起源服务单元,其中:
所述分类编码管理单元,功能包括:起源信息分类元数据设置,分类编码管理。
所述元数据管理单元,功能包括:起源元数据设置和管理;
所述起源信息预处理单元,功能包括:采取基于GIS系统扩展的方式对起源信息进行逻辑预处理;
所述存储方式管理单元,用于设置每个实体(Entity)的数据存储方式,包括起源数据库存储方式或者数据本体随附元数据记录方式;
所述数据格式管理单元,用于设置数据格式,包括XML格式、JSON格式、关系型数据库库表格式、数据本体随附元数据记录格式;
所述起源信息采集与存储单元,用于采集起源信息,并存储到起源数据库或者数据本体随附元数据记录中;
所述起源信息库,是指存储起源信息记录的历史记录档案库;
所述数据本体随附元数据记录,是指部分起源信息作为数据本体的元数据与数据本体一起编码的数据记录;
所述起源信息安全服务单元,执行起源信息库、数据本体随附元数据记录内部存储的安全域、控制维度的安全管控策略信息,并提供安全审计功能;
所述数据起源服务单元,统一为用户提供安全数据起源服务,包括评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因;安全审计功能服务。
优选的,数据起源空间信息管理系统部署为一种数据起源管理装置,所述数据起源管理装置包括数据起源管理平台和起源信息采集软件两个组成部分,其中:
数据起源管理平台包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息库、起源信息安全服务单元、数据起源服务单元;
起源信息采集软件包括起源信息采集与存储单元。
上述实施例具有如下有益效果:
1、本发明为数权主体,包括自然人、法人、非法人组织,提供了统一的数据起源空间信息管理方法和系统。数权主体可统一管理所有数据客体的数据起源,对数据起源进行追踪、溯源、展示、分析,具备管理粒度细、应用方便的优势。
2、本发明通过管理和设置起源信息分类编码、起源元数据,对起源信息进行标准化,提高了起源信息的记录、追踪、溯源、展示的效率和可靠性。
3、起源信息存储方式支持以XML、JSON等结构化数据作为元数据附加到数据本身,或者存放在一个或多个数据文件或者数据库中等数据存储方式,以便在应用时,可按需选择其中的一种数据存储方式,具备很大的实施灵活性,能够满足多变的应用需求。
4、本发明优选为查询数据来源和流转轨迹、再现数据的产生过程、重构数据或者试验过程、数据错误定位定责等服务提供有向图展示功能,便于用户通过手机软件、浏览器页面、客户端软件可视化查看数据轨迹和状态,提高了系统易用性。
5、本发明将空间信息管理技术和数权保护技术应用于数据起源管理,便于使用GIS系统展示数据起源。
以下通过应用实例进行详细说明:
如图2所示,为本发明应用实例一种数据起源空间信息管理方法流程图,所述方法按照空间管理元数据标准化、预处理并存储数据起源空间信息的方式采取基于GIS系统扩展的方式,在GIS空间元数据基础上,增加数据起源空间管理元数据,所述数据起源空间管理元数据包括网络安全域、网络IP地址、主机身份标识、网络服务商身份标识、数据类别、数权主体身份标识、数权客体身份标识。所述方法包括:
21、起源信息标准化。设定起源信息分类编码、起源元数据,用于对起源信息进行标准化记录、追踪、溯源、展示,以便被后期起源信息预处理、起源信息存储、起源信息服务等步骤所遵循述,用于提高效率和可靠性。
所述分类编码,是将分类的结果用一种易于被计算机和人识别的符号体系表示出来的过程,是统一认识、统一观点和相互交换信息的一种技术手段,其目的是为了便于计算机存储、编码和检索数据及其起源信息,直接影响到数据及其起源信息的组织、连接、传输和共享,最终影响数据及其起源信息的数据编码质量。
所述起源元数据,是指描述起源信息的数据,它描述起源信息数据集的内容、质量、表示方式、管理方式以及数据集的其它信息,是起源信息数据集正确使用的基础,为起源信息数据集的质量提供了保障。所述起源元数据包括管理元数据和用户元数据。其中,管理元数据是对起源信息的源数据及其内容、主题、数据转换和各种操作信息的描述。用户元数据是指帮助用户查询、理解起源信息,并了解这些起源信息的组织方式方面的描述。
优选的,起源元数据包括what、who、when、where、how、which、why 这七个方面的描述数据。其中,起源元数据what记录了在数权生命周期内各种实体(Entity)及其事件,描述实体(Entity)发生了什么以及实体(Entity)事件主体现在是什么,其他六项都是围绕what 描述它的信息,描述实体(Entity)事件数据的归属权、什么时候在哪儿怎么发生了什么处理过程,处理过程是怎样进行的,这个过程都有哪些要素、哪些主体参与,导致数据成为现在的状态的原因。
22、起源信息预处理。根据起源信息的源数据的数权主体、数权客体所涉及到的全部实体(Entity)、活动(Activity)以及代理(Agent)的相互逻辑关系,从分域、分层、分维度等方面对起源信息进行逻辑预处理,以便于提高数据起源存储、服务的效率、安全性、可靠性。
所述数权,是指有数据在全生命周期治理过程中所产生的权利,涉及个人隐私、数据产权、国家主权等权益。所述数权主体,是指数据控制权所有人,可以是自然人、法人、非法人组织等,往往是数据所指向的特定对象或者该数据的收集、存储、传输、处理者。所述数权客体是指数据本体,即数权涉及的有一定规律或价值的信息编码集合。
所述起源信息预处理,包括以下三方面的工作内容:第一,分域,设定每个安全域的安全访问控制和边界控制策略。第二,分层,在每个安全域内部,按照分类进行构造管理逻辑层。第三,分维度,在每个安全域内部,按照起源元数据构造管理逻辑维度。
所述分域,是指划分安全域。所述安全域,是指一组具有相同安全保护需求、并相互信任的系统组成的逻辑区域,是由在同一工作环境中、具有相同或相似的安全保护需求和保护策略、相互信任、相互关联或相互作用的IT要素的集合,组成具有相同的安全访问控制和边界控制策略的网络或系统。
所述分层,是指按实体(Entity)、活动(Activity)以及代理(Agent)的分类编码组织和管理数据起源信息,同一类别编码的所有实体(Entity)、活动(Activity)以及代理(Agent)构成了一个数据起源信息层。
所述分维度,是指按实体(Entity)、活动(Activity)以及代理(Agent)的起源元数据组织和管理数据起源信息,同一起源元数据的所有实体(Entity)、活动(Activity)以及代理(Agent)构成了一个数据起源信息维度。
所述分域、分层、分维度之间的关系为:分域是第一步骤,分层、分维度是第二步骤,分层、分维度都是基于分域的基础上进行;分层和分维度并行发生、数据纵横交叉。
23、起源信息存储。按照对起源信息的标准化要求和预处理要求,使用对应的数据存储结构和数据存储方式,存储起源信息。
优选的,所述起源信息存储,支持以XML、JSON等结构化数据作为元数据附加到数据本身,或者存放在一个或多个数据文件或者数据库中。
优选的,所述分域起源信息、控制维度起源信息以XML、JSON等结构化数据作为元数据附加到数据本身,以便于数据安全管理和安全控制。
优选的,所述起源信息存储过程中,对实体(Entity)、活动(Activity)以及代理(Agent)之间存在 5 种典型的关系,分别是生成、使用、控制、获得、触发,采取矢量数据模型,存储在关系型数据库中,以便于在数据起源服务阶段提供数据关系溯源有向图。
24、数据起源服务。基于GIS系统扩展的方式,提供数据起源服务,服务内容包括:评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因。
优选的,查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;数据错误定位定责等服务提供有向图展示功能。
上述应用实例具有如下有益效果:
1、便于按照GIS系统的技术规范将数据起源信息进行标准化、预处理、存储、和服务。
2、通过设定起源信息分类编码、起源元数据,对起源信息进行标准化记录、追踪、溯源、展示,方便了后期起源信息预处理、起源信息存储、起源信息服务等步骤,提高了效率和可靠性。
3、根据起源信息的源数据的数权主体、数权客体所涉及到的全部实体(Entity)、活动(Activity)以及代理(Agent)的相互逻辑关系,从分域、分层、分维度等方面对起源信息进行逻辑预处理,提高数据起源存储、服务的效率、安全性、可靠性。
4、起源信息存储过程中,对实体(Entity)、活动(Activity)以及代理(Agent)之间存在 5 种典型的关系,分别是生成、使用、控制、获得、触发,采取矢量数据模型,存储在关系型数据库中,以便于在数据起源服务阶段提供数据关系溯源有向图。
5、便于在GIS地图上查询数据来源和流转轨迹、再现数据的产生过程、重构数据或者试验过程、数据错误定位定责等服务提供有向图展示功能。
如图3所示,为本发明实施例一种数据起源空间信息管理系统结构示意图,所述系统按照空间管理元数据标准化、预处理并存储数据起源空间信息的方式采取基于GIS系统扩展的方式,在GIS空间元数据基础上,增加数据起源空间管理元数据,所述数据起源空间管理元数据包括网络安全域、网络IP地址、主机身份标识、网络服务商身份标识、数据类别、数权主体身份标识、数权客体身份标识;所述系统包括:分类编码管理单元301、元数据管理单元302、起源信息预处理单元303、存储方式管理单元304、数据格式管理单元305、起源信息采集与存储单元306、起源信息库307、数据本体随附元数据记录308、起源信息安全服务单元309、数据起源服务单元310;
所述分类编码管理单元301,提供起源信息分类元数据设置,分类编码管理等方面的功能;
所述元数据管理单元302,提供起源元数据设置和管理功能;
所述起源信息预处理单元303,采取基于GIS系统扩展的方式对起源信息进行逻辑预处理
所述存储方式管理单元304,用于设置每个实体(Entity)的数据存储方式,包括起源数据库存储方式或者数据本体随附元数据记录方式;
所述数据格式管理单元305,用于设置数据格式,包括XML格式、JSON格式、关系型数据库库表格式、数据本体随附元数据记录格式等不同数据格式;
所述起源信息采集与存储单元306,用于采集起源信息,并存储到起源数据库或者数据本体随附元数据记录中;
所述起源信息库307,是指存储起源信息记录的历史记录档案库,可以是数据文件,也可以是关系型数据库;
所述数据本体随附元数据记录308,是指部分起源信息作为数据本体的元数据与数据本体一起编码的数据记录;
所述起源信息安全服务单元309,执行起源信息库、数据本体随附元数据记录内部存储的安全域、控制维度的安全管控策略信息,并提供安全审计功能;
所述数据起源服务单元310,基于GIS系统扩展的方式,统一为用户提供安全数据起源服务,包括评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因;安全审计等方面的功能服务。
上述应用实例具有如下有益效果:
1、提供了对GIS系统主要功能模块的定制改造需求,可用于指导对GIS系统按照数据起源管理的需求和本发明所述一种数据起源空间信息管理方法的要求进行定制。
2、为数权主体,包括自然人、法人、非法人组织,提供了统一的数据起源空间信息管理方法和系统。数权主体可统一管理所有数据客体的数据起源,并按照数据安全要求划分不同安全域、按照数据客体类别不同而划分不同的逻辑数据层、按照起源元数据划分不同的逻辑数据维度,对数据起源分域、分层、分维度进行记录、追踪、溯源、展示、分析,具备管理粒度细、应用方便的优势。
如图4所示,为本发明应用实例一种数据起源空间信息管理装置示意图,所述装置包括:数据起源管理平台和起源信息采集软件,其中:
数据起源管理平台包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息库、起源信息安全服务单元、数据起源服务单元;
起源信息采集软件包括起源信息采集与存储单元。
起源信息统一集中存储在信息起源信息库中。
数据起源管理平台统一为用户提供数据起源服务,服务内容包括评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因;数权保护历史跟踪。
所述起源信息采集软件可使用第三方提供的ETL工具软件,便于用户信息系统利用和降低成本。
上述应用实例具有如下有益效果:
1、所述装置有两个部分组成,具有应用方便,运维简单的优势,便于基于云架构提供数据起源平台服务。
2、起源信息采集软件可使用第三方提供的ETL工具软件,便于与已有的信息系统进行集成,通过已有信息系统利用降低总体成本。
3、为数权主体,包括自然人、法人、非法人组织,提供了统一的数据起源空间信息管理方法和系统。数权主体可统一管理所有数据客体的数据起源,并按照数据安全要求划分不同安全域、按照数据客体类别不同而划分不同的逻辑数据层、按照起源元数据划分不同的逻辑数据维度,对数据起源分域、分层、分维度进行记录、追踪、溯源、展示、分析,具备管理粒度细、应用方便的优势。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种数据起源空间信息管理方法,其特征在于,所述方法包括:
设定数据起源空间管理元数据;
按照空间管理元数据采集数据起源空间信息;
按照空间管理元数据预处理并存储数据起源信息;
提供数据起源空间信息管理功能和服务。
2.根据权利要求1所述的一种数据起源空间信息管理方法,其特征在于,所述空间管理元数据包含网络安全域、网络IP地址、主机身份标识、网络服务商身份标识、数据类别、数权主体身份标识、数权客体身份标识。
3.根据权利要求1所述的一种数据起源空间信息管理方法,其特征在于,按照空间管理元数据预处理并存储数据起源信息的方式采取基于GIS系统扩展的方式。
4.根据权利要求3所述的一种数据起源空间信息管理方法,其特征在于,所述采集数据起源空间信息其内容包括采集数权数据起源信息;所述提供数据起源空间信息管理功能和服务其内容包括:评估数权保护数据质量和可靠性,查询数权保护数据来源和流转轨迹,再现数权保护数据的产生过程,重构数权保护数据或者试验过程,管理数权保护数据的版权与知识产权,数权保护数据错误定位定责,解释数权保护数据现状产生的原因,数权保护历史跟踪,数权保护策略执行安全审计功能和服务。
5.根据权利要求3所述的一种数据起源空间信息管理方法,其特征在于,所述提供数据起源空间信息管理功能和服务的实现方式为:按照数据起源空间管理元数据进行扩展改造GIS系统数据库结构系统功能和界面,用于提供数据起源信息数据采集与输入、数据编辑与更新、数据存储与管理、空间查询与分析、空间决策支持、数据显示与输出功能和服务。
6.根据权利要求3所述的一种数据起源空间信息管理方法,其特征在于,通过一种数据起源空间信息管理系统提供数据起源空间信息管理功能和服务,所述数据起源空间信息管理系统包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息采集与存储单元、起源信息库、数据本体随附元数据记录、起源信息安全服务单元、数据起源服务单元,其中:
所述分类编码管理单元,功能包括:起源信息分类元数据设置,分类编码管理;
所述元数据管理单元,功能包括:起源元数据设置和管理;
所述起源信息预处理单元,功能包括:采取基于GIS系统扩展的方式对起源信息进行逻辑预处理;
所述存储方式管理单元,用于设置每个实体(Entity)的数据存储方式,包括起源数据库存储方式或者数据本体随附元数据记录方式;
所述数据格式管理单元,用于设置数据格式,包括XML格式、JSON格式、关系型数据库库表格式、数据本体随附元数据记录格式;
所述起源信息采集与存储单元,用于采集起源信息,并存储到起源数据库或者数据本体随附元数据记录中;
所述起源信息库,是指存储起源信息记录的历史记录档案库;
所述数据本体随附元数据记录,是指部分起源信息作为数据本体的元数据与数据本体一起编码的数据记录;
所述起源信息安全服务单元,执行起源信息库、数据本体随附元数据记录内部存储的安全域、控制维度的安全管控策略信息,并提供安全审计功能;
所述数据起源服务单元,统一为用户提供安全数据起源服务,包括评估数据质量和可靠性;查询数据来源和流转轨迹;再现数据的产生过程,重构数据或者试验过程;管理数据的版权与知识产权;数据错误定位定责;解释数据现状产生的原因;安全审计功能服务。
7.根据权利要求6所述的一种数据起源空间信息管理方法,其特征在于,数据起源空间信息管理系统部署为一种数据起源管理装置,所述数据起源管理装置包括数据起源管理平台和起源信息采集软件两个组成部分,其中:
数据起源管理平台包括分类编码管理单元、元数据管理单元、起源信息预处理单元、存储方式管理单元、数据格式管理单元、起源信息库、起源信息安全服务单元、数据起源服务单元;
起源信息采集软件包括起源信息采集与存储单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910884880.6A CN112527927B (zh) | 2019-09-19 | 2019-09-19 | 一种数据起源空间信息管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910884880.6A CN112527927B (zh) | 2019-09-19 | 2019-09-19 | 一种数据起源空间信息管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112527927A true CN112527927A (zh) | 2021-03-19 |
CN112527927B CN112527927B (zh) | 2024-06-21 |
Family
ID=74975267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910884880.6A Active CN112527927B (zh) | 2019-09-19 | 2019-09-19 | 一种数据起源空间信息管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112527927B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118153007A (zh) * | 2024-05-10 | 2024-06-07 | 杭州世平信息科技有限公司 | 面向文本型数据的数据库水印嵌入方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050278270A1 (en) * | 2004-06-14 | 2005-12-15 | Hewlett-Packard Development Company, L.P. | Data services handler |
CA2820994A1 (en) * | 2012-07-12 | 2014-01-12 | Open Text S.A. | Systems and methods for in-place records management and content lifecycle management |
WO2018040120A1 (zh) * | 2016-08-30 | 2018-03-08 | 东南大学 | 支持共享共治的内容元数据标识及应用方法 |
CN108717456A (zh) * | 2018-05-22 | 2018-10-30 | 浪潮软件股份有限公司 | 一种数据源无关的数据全生命周期管理平台及方法 |
-
2019
- 2019-09-19 CN CN201910884880.6A patent/CN112527927B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050278270A1 (en) * | 2004-06-14 | 2005-12-15 | Hewlett-Packard Development Company, L.P. | Data services handler |
CA2820994A1 (en) * | 2012-07-12 | 2014-01-12 | Open Text S.A. | Systems and methods for in-place records management and content lifecycle management |
WO2018040120A1 (zh) * | 2016-08-30 | 2018-03-08 | 东南大学 | 支持共享共治的内容元数据标识及应用方法 |
CN108717456A (zh) * | 2018-05-22 | 2018-10-30 | 浪潮软件股份有限公司 | 一种数据源无关的数据全生命周期管理平台及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118153007A (zh) * | 2024-05-10 | 2024-06-07 | 杭州世平信息科技有限公司 | 面向文本型数据的数据库水印嵌入方法、系统及存储介质 |
CN118153007B (zh) * | 2024-05-10 | 2024-07-30 | 杭州世平信息科技有限公司 | 面向文本型数据的数据库水印嵌入方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112527927B (zh) | 2024-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699175B (zh) | 一种数据治理系统及其方法 | |
CN109522312B (zh) | 一种数据处理方法、装置、服务器和存储介质 | |
Lemieux et al. | Meeting Big Data challenges with visual analytics: The role of records management | |
US11494512B2 (en) | Automatic enforcement of data use policy for machine learning applications | |
CN107832392A (zh) | 一种元数据管理系统 | |
CN106951557A (zh) | 日志关联方法、装置和应用其的计算机系统 | |
CN115617776A (zh) | 一种数据管理系统及方法 | |
CN106055546A (zh) | 基于Lucene的光盘库全文检索系统 | |
Gao et al. | Characterizing functionally integrated regions in the Central Yangtze River Megaregion from a city‐network perspective | |
CN112527927A (zh) | 一种数据起源空间信息管理方法 | |
Schlegel et al. | MLflow2PROV: extracting provenance from machine learning experiments | |
CN112506889B (zh) | 一种数权数据起源管理方法和系统 | |
CN116414854A (zh) | 数据资产查询方法、装置、计算机设备和存储介质 | |
CN113704272B (zh) | 一种人机物融合环境下的数字对象状态表达方法及装置 | |
Quoc et al. | A performance study of RDF stores for linked sensor data | |
CN111753000A (zh) | 一种供水管网信息系统 | |
Woodall et al. | A cloud-based system for scraping data from amazon product reviews at scale | |
Nika et al. | A survey of context-aware cross-digital library personalization | |
CN116484054B (zh) | 数据处理方法及相关装置 | |
KR101926165B1 (ko) | 웹 기반 hmi 솔루션의 문서 편집 시스템 및 그 방법 | |
Wang | Construction and Optimization Strategy of University Teaching Management Platform Based on Big Data Technology | |
JP2010250567A (ja) | 環境情報集計分析システム | |
CN117575172A (zh) | 一种多层级统分结合的一体化社会治理信息化系统 | |
Villiers | Clinical data warehouse functionality | |
CN115630170A (zh) | 一种文档推荐方法、系统、终端机及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |