CN117271460B - 基于科研数字对象语用关系的科研数联网服务方法与系统 - Google Patents

基于科研数字对象语用关系的科研数联网服务方法与系统 Download PDF

Info

Publication number
CN117271460B
CN117271460B CN202311558903.7A CN202311558903A CN117271460B CN 117271460 B CN117271460 B CN 117271460B CN 202311558903 A CN202311558903 A CN 202311558903A CN 117271460 B CN117271460 B CN 117271460B
Authority
CN
China
Prior art keywords
digital object
data
scientific research
code
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311558903.7A
Other languages
English (en)
Other versions
CN117271460A (zh
Inventor
杨婧如
黄罡
马郓
黄小龙
景翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202311558903.7A priority Critical patent/CN117271460B/zh
Publication of CN117271460A publication Critical patent/CN117271460A/zh
Application granted granted Critical
Publication of CN117271460B publication Critical patent/CN117271460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/144Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation

Abstract

本申请实施例中提供了一种基于科研数字对象语用关系的科研数联网服务方法与系统,涉及数据共享技术领域,所述方法包括:将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将标识、元数据和数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库;将数字对象之间的关系保存到关系注册表中;基于标准化协议对标识解析系统、关系注册表和数字对象仓库进行访问操作,得到科研数据访问操作结果。通过本申请实施例提供的方法,使得科研数据可以通过标准化的方式被访问,提升了不同平台之间的数据互联互通的能力,同时增强了科研数据之间使用的可追溯性。

Description

基于科研数字对象语用关系的科研数联网服务方法与系统
技术领域
本申请涉及数据共享技术领域,特别涉及一种基于科研数字对象语用关系的科研数联网服务方法与系统。
背景技术
随着大数据时代的到来,数据驱动的研究方法成为科学研究中逐渐兴起的一个重要范式,进而对科研的基础设施提出了新的需求,其中最重要的需求便是网络空间中全量科研数据的开放共享,为了实现科研数据共享,出现了大量的科研数据共享平台。这些科研数据共享平台使得论文的复现更加方便,论文的评审更加公开,同时研究者可以更方便地在自己的研究中应用他人的研究成果,促进世界范围内研究者的协作,从而使得数据驱动科研的效率大大提升。
然而,现有的科研数据共享平台之间并没有统一开放的数据互访问和互操作机制,进而限制了不同平台之间的数据互联互通,抑制了数据驱动科研的发展。同时,现有的科研数据共享平台都没有考虑科研数据之间的关系,即使考虑了科研数据间的关系,因此无法实现数据追溯等问题。因此,亟需一种能够统一访问、且能数据追溯的科研数联网服务方法。
发明内容
鉴于上述问题,本申请实施例提供了一种基于科研数字对象语用关系的科研数联网服务方法与系统,以便克服上述问题或者至少部分地解决上述问题。
本申请实施例的第一方面,公开了一种基于科研数字对象语用关系的科研数联网服务方法,所述方法包括:
将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库;
将所述数字对象之间的关系保存到所述关系注册表中;
基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作。
可选地,将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库,包括:
将所述科研数据的公开信息作为数字对象的元数据,并将所述元数据保存到所述关系注册表,所述公开信息包括:标题、作者和内容描述信息;
将所述科研数据的主体内容作为数字对象的数据实体,并将所述数据实体保存到所述数字对象仓库;
根据所述科研数据的状态信息为所述科研数据指定一个标识,并将所述标识保存到所述标识解析系统,所述状态信息包括:所述元数据保存的对象关系注册表ID和所述数据实体保存的数字对象仓库ID。
可选地,按照以下步骤进行数据搜索:
根据数据搜索请求中的搜索信息确定搜索类型,并根据所述搜索类型确定搜索接口,所述搜索类型包括:基于关键词搜索和基于关系搜索;
将所述搜索信息组装成搜索参数,并将所述搜索参数发送给所述关系注册表;
所述关系注册表根据所述搜索参数和所述搜索接口进行数据搜索,得到与所述数据搜索请求关联的元数据。
可选地,按照以下步骤进行在线执行代码:
从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,所述在线执行代码请求包括:论文在线自动复现和数据集在线操作;
根据所述运行代码和所述使用数据集构建代码执行单元,并为所述代码执行单元分配代码执行ID;
运行所述代码执行单元,并利用所述代码执行ID查看所述代码执行单元的运行状态,得到在线执行代码结果。
可选地,从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,包括:
分别对所述运行代码的标识和所述使用数据集的标识进行解析,得到运行代码状态信息和使用数据集状态信息;
基于所述运行代码状态信息和所述使用数据集状态信息,得到运行代码数字对象仓库ID和使用数据数字对象仓库ID;
分别从所述运行代码数字对象仓库ID对应的数字对象仓库,和所述使用数据数字对象仓库ID对应的数字对象仓库中获取所述运行代码和所述使用数据集。
可选地,在得到在线执行代码结果之后,根据所述在线执行代码结果对数字对象进行维护:
将所述在线执行代码结果封装为新的数据集数字对象;
构建所述新的数据集数字对象和使用数据集数字对象之间的关联关系,并将所述关联关系保存所述关系注册表中。
可选地,所述数据操作包括:修改数字对象和删除数字对象,按照以下步骤执行数据操作:
根据待修改数字对象的标识,获取所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息,并对所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息进行修改;
根据待删除数字对象的标识,获取所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息,并将所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息进行删除。
本申请实施例的第二方面,公开了一种基于科研数字对象语用关系的科研数联网服务系统,用于实现本申请实施例第一方面所述的基于科研数字对象语用关系的科研数联网服务方法,所述系统包括:
服务端,所述服务端将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库;并将所述数字对象之间的关系保存到所述关系注册表中;
客户端,所述客户端显示用户界面,基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作。
本申请实施例的第三方面,公开了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例第一方面所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
本申请实施例的第四方面,公开了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例第一方面所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
本申请实施例包括以下优点:
在本申请实施例中,将科研数据封装为由标识、元数据和数据实体组成的数字对象,并分别保存到标识解析系统、关系注册表和数字对象仓库,同时将数字对象之间的关系作为元数据保存到关系注册表中,进而基于标准化协议对标识解析系统、关系注册表和数字对象仓库进行访问操作,得到科研数据访问操作结果。
通过将科研数据封装为数字对象,解决了科研数据格式异构的问题,使得科研数据可以通过标准化的方式被访问,进而提升了不同平台之间的数据互联互通的能力。同时,还将数字对象之间的关系作为元数据,使得科研数据之间的关系也可以通过标准化的协议被访问和操作,增强了科研数据之间使用的可追溯性。此外,将数字对象的数据实体和元数据分开管理,可以在不访问数据实体的情况下通过元数据进行数字对象的数据发现,实现在保证了数据所有者的权益的同时也使得其他用户可以在不知道数据内容的情况找到自己感兴趣的数据。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务方法的步骤流程图;
图2是本申请实施例提供的一种数字对象架构示意图;
图3是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务系统的结构示意图;
图4是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务系统的用况示意图;
图5是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种基于科研数字对象语用关系的科研数联网服务方法,参照图1所示,图1是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务方法的步骤流程图。如图1所示,所述方法可以包括步骤S110至步骤S130:
步骤S110:将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库。
本申请实施例中,科研数据包括:论文、代码和数据集,为了使科研数据可以通过公开的标准化协议进行访问和操作,对科研数据中常用的三类数据(即论文、代码和数据集)进行建模,将其封装为由标识、元数据和数据实体组成的数字对象。
其中,数字对象的标识是用来表示数字对象的唯一ID(Identity Document,身份标识),根据数字对象的标识能够解析出数字对象的所在位置等相关信息,从而实现对数字对象的访问。通过标识的分配和解析,数字对象架构将数据和服务解耦,使得数据不再依赖于其存储环境和访问环境而存在。数字对象的元数据包含了数字对象的一些公开信息,数字对象的元数据使得对数字对象的公开检索成为可能,通过分离数据的基本信息和数据实体,使得对数据基本信息进行检索的过程不再需要对数据实体的访问,进而在保障了数据实体安全的前提下实现了开放环境下的数据发现。数字对象的数据实体即为数字对象所包含的数据本身,同一个数字对象的数据实体可以包含多个数据元素,通过将一个数字对象的数据实体分为多个元素的方式,可以对一个数字对象中的部分数据进行细粒度的访问和操作。通过将科研数据封装为数字对象,解决了科研数据格式异构的问题,使得科研数据可以通过标准化的方式被访问。
进一步地,将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库,包括步骤S110-1至步骤S110-3:
步骤S110-1:将所述科研数据的公开信息作为数字对象的元数据,并将所述元数据保存到所述关系注册表,所述公开信息包括:标题、作者和内容描述信息。
步骤S110-2:将所述科研数据的主体内容作为数字对象的数据实体,并将所述数据实体保存到所述数字对象仓库。
步骤S110-3:根据所述科研数据的状态信息为所述科研数据指定一个标识,并将所述标识保存到所述标识解析系统,所述状态信息包括:所述元数据保存的对象关系注册表ID和所述数据实体保存的数字对象仓库ID。
具体的,对论文的数字对象进行建模时,将论文标题、作者信息、论文发表的刊物、论文的摘要(内容描述信息)等作为元数据保证到关系注册表;同时将论文的实验元素、内容元素和引用元素作为实体数据保存到数字对象仓库。一篇论文可以有多个实验元素,每个实验元素表示了论文中的一个实验;一篇论文有且仅有一个内容元素,包括完整的论文pdf(pdf为一种文件格式,是指可移植文档格式Portable Document Format)的内容;一篇论文可以有多个引用元素,每个引用元素表示了论文所引用的一篇论文。对于代码的数字对象进行建模时,将代码名称、作者信息、代码的描述信息等作为元数据保证到关系注册表,同时将代码的源代码元素和运行环境元素作为实体数据保存到数字对象仓库。一个代码有且仅有一个源代码元素,表示这个代码对象的代码内容,源代码元素的数据包括一个指向代码的链接。一个代码有且仅有一个运行环境元素,此元素描述了用来运行这个代码的docker镜像、此代码所需的各种数据集的挂载点、以及此代码输出的挂载点。对于数据集的数字对象进行建模时,将数据集名称、作者信息、数据集的描述信息等作为元数据保证到关系注册表,同时将数据集的内容元素作为实体数据保存到数字对象仓库。一个数据集有且仅有一个内容元素,其中包含一个指向该数据集内容的链接。
步骤S120:将所述数字对象之间的关系保存到所述关系注册表中。
本申请实施例中,考虑到科研活动中,论文、代码和数据集这三类数据之间会产生各种各样的关系(例如,论文对论文的引用关系,论文对代码的使用关系等)。因此还需要对数字对象之间的关系(即科研数据之前的关系)进行建模,使得科研数据之间的关系也可以通过标准化的协议被访问和操作,以增强科研数据之间使用的可追溯性。
步骤S130:基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作。
本申请实施例中,数据搜索是指查找感兴趣的科研数据(数字对象)和基于数字对象关系发现与数字对象相关联的数字对象。在线执行代码是指根据数字对象实现代码的线上执行,以实现论文在线复现或数据集在线操作等功能。其中,论文在线复现是指对论文中的实验进行复现;数据集在线操作是指在已有数据集的基础上进行数据集分析和变换处理,以得到新的数据集。关系操作是指对数字对象关系进行修改和删除。数据操作是指对数字对象修改和删除等操作。
标准化协议是指数字对象架构中的通信协议,包括标识解析(IdentifierResolution protocol,IRP)协议和数字对象接口(Digital Object Interface Protocol,DOIP)协议。其中,IRP协议是用来进行数字对象标识的管理和解析的协议,它定义了数字对象标识的类型、格式和客户端与标识解析系统进行交互的方式;DOIP协议是数字对象的核心协议,定义了数字对象仓库、数字对象注册表与客户端进行交互的方式。由于在上述步骤S110和步骤S120将科研数据和科研数据之间的关系建模为数字对象,因此通过该标准化协议能够实现对科研数据进行访问和操作,从而实现不同异构平台之间数据的互通互联。
图2是本申请实施例提供的一种数字对象架构示意图,将科研数据封装为由标识、元数据和数据实体组成的数字对象,分别保存到标识解析系统、关系注册表和数字对象仓库,同时将数字对象之间的关系作为元数据保存到关系注册表中,进而基于IRP协议和DOIP协议对标识解析系统、关系注册表和数字对象仓库进行访问操作,得到科研数据访问操作结果。
因此基于本申请实施例的方法,使得科研数据可以通过标准化的方式被访问,提升了不同平台之间的数据互联互通的能力。同时,将数字对象之间的关系作为元数据,使得科研数据之间的关系也可以通过标准化的协议被访问和操作,增强了科研数据之间使用的可追溯性。此外,将数字对象的数据实体和元数据分开管理,可以在不访问数据实体的情况下通过元数据进行数字对象的数据发现,实现在保证了数据所有者的权益的同时也使得其他用户可以在不知道数据内容的情况找到自己感兴趣的数据。
在一种可选的实施例中,为了查找感兴趣的科研数据和基于数字对象关系发现与数字对象相关联的数字对象。按照以下步骤A1至步骤A3的方法进行数据搜索:
步骤A1:根据数据搜索请求中的搜索信息确定搜索类型,并根据所述搜索类型确定搜索接口,所述搜索类型包括:基于关键词搜索和基于关系搜索。
步骤A2:将所述搜索信息组装成搜索参数,并将所述搜索参数发送给所述关系注册表。
步骤A3:所述关系注册表根据所述搜索参数和所述搜索接口进行数据搜索,得到与所述数据搜索请求关联的元数据。
本申请实施例中,提供了基于关键词搜索和基于关系搜索两种搜索方法,基于关键词搜索的搜索信息是关键字,基于关系搜索的搜索信息是数字对象的标识,因此可以根据搜索请求中的搜索信息来确定具体的搜索方式,以便于基于相应的搜索方式实现数字对象搜索。具体地,搜索操作是基于关系注册表而实现,在关系注册比表中提供了基于关键词的搜索接口和基于关系的搜索接口。1)当基于关键词搜索时,将关键词组装成关系注册表的搜索参数,并将搜索参数发送给关系注册表,以使关系注册表根据搜索参数和基于关键词的搜索接口进行搜索,得到与关键词关联的元数据,以此找到感兴趣的科研数据。2)当基于关系搜索时,将标识组装成关系注册表的搜索参数,并将搜索参数发送给关系注册表,以使关系注册表根据搜索参数和基于关系的搜索接口进行搜索,得到与数字对象相关联的元数据,以实现基于数字关系发现科研数据。
在具体实施时,基于关系搜索具体包括以下几种方式:从论文出发查找其使用的数据集、从论文出发查找其使用的代码、从论文出发查找与其使用相同数据集的其他论文、从代码出发查找使用其的论文、从代码出发查找被用在相同论文上的代码、从数据集出发查找使用其的论文。并且,所有基于关系的搜索方式都需要一个搜索的起点数字对象,因此基于数字关系进行数据发现的一般流程是:先通过基于关键词的搜索找到一个数字对象,再从这个数字对象开始使用基于关系的搜索方式寻找与该起点数字对象相关连的数字对象。
在一种可选的实施例中,按照以下步骤B1至步骤B3进行在线执行代码:
步骤B1:从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,所述在线执行代码请求包括:论文在线自动复现和数据集在线操作。
步骤B2:根据所述运行代码和所述使用数据集构建代码执行单元,并为所述代码执行单元分配代码执行ID。
步骤B3:运行所述代码执行单元,并利用所述代码执行ID查看所述代码执行单元的运行状态,得到在线执行代码结果。
本申请实施例中,运行代码是指实现在线执行代码所需要的代码,使用数据集是指实现在线执行代码所需要的数据集,例如,进行论文在线自动复现时,运行代码是论文中的实验进行实现的代码,而使用数据集是论文中的实验所使用的数据集。当进行在线执行代码时,需要基于关系搜索发现相应的运行代码和使用数据集,进而基于运行代码和使用数据集的标识从数字对象仓库中获取到运行代码和使用数据集。
具体的,步骤B1中从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,包括:分别对所述运行代码的标识和所述使用数据集的标识进行解析,得到运行代码状态信息和使用数据集状态信息;基于所述运行代码状态信息和所述使用数据集状态信息,得到运行代码数字对象仓库ID和使用数据数字对象仓库ID;分别从所述运行代码数字对象仓库ID对应的数字对象仓库,和所述使用数据数字对象仓库ID对应的数字对象仓库中获取所述运行代码和所述使用数据集。
进而,基于获取的运行代码和使用数据集创建代码执行单元,该代码执行单元用于创建代码的运行环境,并根据在线执行代码请求中的运行命令运行代码,在运行时获取代码运行的日志,并在代码开始执行和执行结束时更新代码的运行状态。进而通过运行代码执行单元实现在线执行代码。
在具体实施时,1)论文在线自动复现的过程为:找到需要进行复现的论文,并使用“从论文出发查到其使用的代码”(一种基于关系的搜索方式)找到复现此论文的运行代码,使用“从论文出发查找其使用的数据集”(一种基于关系的搜索方式)找到复现此论文的使用数据集;进而从数字对象仓库中获取对应的运行代码和使用数据集,基于获取到的运行代码和使用数据集构建代码执行单元,并运行代码执行单元,得到论文在线自动复现结果。同时,在运行代码执行单元执行时可以通过代码执行ID查看论文在线自动复现的情况,以及在运行结束后通过代码执行ID查看论文在线自动复现结果。
2)以C4数据集(C4数据集是一种由Google发布的数据集,是基于包含海量无效数据的Common Crawl数据集进行处理得到的)创建过程中去除网页无效内容这一数据集在线操作为例,对数据集在线操作过程做进一步说明。对数据集在线操作的过程为:获取待处理的Common Crawl数据集(若数字对象仓库中存在该数据集的数字对象,则从数学对象仓库中获取该数据集),获取C4数据集数据清洗算法实现去除网页无效内容的运行代码,进而根据该运行代码和Common Crawl数据集创建为代码执行单元,并运行该代码执行单元,实现对Common Crawl数据集进行数据清洗,得到数据集在线操作结果,即得到C4数据集。
进一步地,在得到在线执行代码结果之后,根据所述在线执行代码结果对数字对象进行维护:将所述在线执行代码结果封装为新的数据集数字对象;构建所述新的数据集数字对象和使用数据集数字对象之间的关联关系,并将所述关联关系保存所述关系注册表中。进而,实现对新数据集数字对象和使用数据集数字对象之间的关联关系进行自动维护,这个关联关系可以通标准化的协议(即DOIP协议)被公开访问,为数据溯源等需求提供依据。
本申请实施例中,基于在线执行代码实现论文的自动复现与数据集的在线操作(即数据集分析和变换),同时在进行数据集的操作时,还可以创建新的数据集数字对象与使用数据集数字对象之间的数字对象关系,以实现对数据之间的关系进行自动维护,进一步保证科研数据应用的可追溯性。
在一种可选的实施例中,所述数据操作包括:修改数字对象和删除数字对象,按照以下步骤执行数据操作:
根据待修改数字对象的标识,获取所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息,并对所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息进行修改;
根据待删除数字对象的标识,获取所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息,并将所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息进行删除。
本申请实施例中,通过数字对象进行修改和数字对象删除,以实现数字对象的维护。当科研数据发生变化时,需要对相应的数字对象进行修改,当科研数字失效时,需要将相应的数字对象删除,以保证数字对象的有效性和准确性。由于数字对象的元数据和数据实体分别保证在关系注册表和数字对象仓库中,因此当对数字对象进行修改或删除时,需要根据数字对象标识从关系注册表和数字对象仓库中获取相应的数据实体、元数据和关联的关系信息,以对其进行修改或删除处理。
在一种可选的实施例中,关系操作包括修改数字对象关系和删除数字对象关系,通过对发生变化的数字对象关系和不存在的数字对象关系进行修改和删除,以实现数字对象关系维护。具体地,修改数字对象关系的过程为:根据待修改数字对象关系的ID,从关系注册表中获取待修改数字对象关系,并利用新的数字对象关系替换待修改数字对象关系,以实现数字对象关系修改。删除数字对象关系的过程为:根据待删除数字对象关系的ID,从关系注册表中获取待删除数字对象关系进行删除。
本申请实施例还提供了一种基于科研数字对象语用关系的科研数联网服务系统,用于实现本申请实施例所述的基于科研数字对象语用关系的科研数联网服务方法,参照图3所示,图3是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务系统的结构示意图,所述系统包括:
服务端,所述服务端将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库;并将所述数字对象之间的关系保存到所述关系注册表中;
客户端,所述客户端显示用户界面,基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作。
本申请实施例中,基于科研数字对象语用关系的科研数联网服务系统是在数字对象架构之上搭建的。在该系统中,服务端包括关系注册表、数字对象仓库和标识解析系统,这三个系统相互独立、相互协作,分别维护了数字对象的三要素(标识、元数据和数据实体)。具体地,标识解析系统维护了数字对象的标识并存储了数字对象的状态信息。标识解析系统通过IRP协议对外提供标识解析服务,IRP协议的客户端可通过数字对象的标识解析到该数字对象的状态信息,进而客户端可以从状态信息中获取该数字对象的存储地址、访问方式等信息,并最终使用DOIP协议对该数字对象进行访问和操作。关系注册表维护了数字对象的元数据,通过DOIP协议对外提供对元数据进行数据获取和数据操作的接口,在对外提供元数据的操作接口的同时,关系注册表还提供了基于元数据的数字对象搜索接口,可以在不需要获取数据实体的权限的情况下实现数字对象的发现和检索。数字对象仓库维护了数字对象的数据实体,对数字对象进行安全、可靠的持久性存储,数字对象仓库的存储形式可以是多样化的,例如本地磁盘、云端服务器、数据库等都可以作为数字对象仓库的存储。数字对象仓库的核心是基于DOIP协议对外提供的数据操作接口。
客户端包括数据服务(即数据操作)、关系服务(即关系操作)、搜索服务(即数据搜索)和代码执行服务(即在线执行代码)。客户端基于IRP协议和DOIP协议服务端的对标识解析系统、关系注册表和数字对象仓库进行访问操作,得到相应的科研数据访问操作结果。
示例地,图4是本申请实施例提供的一种基于科研数字对象语用关系的科研数联网服务系统的用况示意图。该系统支持的用况包括:1)创建新的科研数据:在系统中新建一个论文/代码/数据集,在新建论文时需要列出其中的所有实验并可以给每个实验指定使用的代码或数据集。在新建代码或数据集时可以指定其被哪个论文的哪个实验使用。2)修改科研数据:修改系统中已经存在的论文/代码/数据集的内容,包括它的数据实体、元数据与其相关联的关系信息。3)删除科研数据:删除系统中存在的论文/代码/数据集,以及依附于它的所有关系信息。4)查询科研数据:根据DOID协议访问对应的论文/代码/数据集。5)基于关系和元数据的数据发现:对于基于关系的数据发现,从一个论文/代码/数据集出发,通过一定的规则经过一跳或多跳关系查询得到其他论文/代码/数据集。6)在线执行代码:指定一个将要执行的代码执行单元,给出执行代码执行单元所使用的命令,对于代码执行单元运行需要的每一个数据集挂载点给出每一个用于该挂载点的数据集,系统在线运行代码执行单元并为代码执行单元分配一个唯一的代码执行ID。之后通过代码执行ID查看此次代码执行的状态并实时获取代码运行过程中输出的日志。7)根据在线执行代码的结果创建新数据集:系统将代码执行单元输出的文件结果创建为一个新的数据集数字对象,并在这次执行的使用数据集和新的数据集对象之间建立关联关系。
本申请实施例还提供了一种电子设备,参照图5,图5是本申请实施例提供的一种电子设备的结构示意图。如图5所示,电子设备500包括:存储器510和处理器520,存储器510与处理器520之间通过总线通信连接,存储器510中存储有计算机程序,该计算机程序可在处理器520上运行,进而实现本申请实施例所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、系统的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种基于科研数字对象语用关系的科研数联网服务方法与系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种基于科研数字对象语用关系的科研数联网服务方法,其特征在于,所述方法包括:
将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库,包括:将所述科研数据的公开信息作为数字对象的元数据,并将所述元数据保存到所述关系注册表,所述公开信息包括:标题、作者和内容描述信息;将所述科研数据的主体内容作为数字对象的数据实体,并将所述数据实体保存到所述数字对象仓库;根据所述科研数据的状态信息为所述科研数据指定一个标识,并将所述标识保存到所述标识解析系统,所述状态信息包括:所述元数据保存的对象关系注册表ID和所述数据实体保存的数字对象仓库ID;
将所述数字对象之间的关系保存到所述关系注册表中;
基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作,所述标准化协议是指数字对象架构中的通信协议,包括标识解析协议和数字对象接口协议。
2.根据权利要求1所述的方法,其特征在于,按照以下步骤进行数据搜索:
根据数据搜索请求中的搜索信息确定搜索类型,并根据所述搜索类型确定搜索接口,所述搜索类型包括:基于关键词搜索和基于关系搜索;
将所述搜索信息组装成搜索参数,并将所述搜索参数发送给所述关系注册表;
所述关系注册表根据所述搜索参数和所述搜索接口进行数据搜索,得到与所述数据搜索请求关联的元数据。
3.根据权利要求1所述的方法,其特征在于,按照以下步骤进行在线执行代码:
从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,所述在线执行代码请求包括:论文在线自动复现和数据集在线操作;
根据所述运行代码和所述使用数据集构建代码执行单元,并为所述代码执行单元分配代码执行ID;
运行所述代码执行单元,并利用所述代码执行ID查看所述代码执行单元的运行状态,得到在线执行代码结果。
4.根据权利要求3所述的方法,其特征在于,从所述数字对象仓库中获取在线执行代码请求对应的运行代码和使用数据集,包括:
分别对所述运行代码的标识和所述使用数据集的标识进行解析,得到运行代码状态信息和使用数据集状态信息;
基于所述运行代码状态信息和所述使用数据集状态信息,得到运行代码数字对象仓库ID和使用数据数字对象仓库ID;
分别从所述运行代码数字对象仓库ID对应的数字对象仓库,和所述使用数据数字对象仓库ID对应的数字对象仓库中获取所述运行代码和所述使用数据集。
5.根据权利要求3所述的方法,其特征在于,在得到在线执行代码结果之后,根据所述在线执行代码结果对数字对象进行维护:
将所述在线执行代码结果封装为新的数据集数字对象;
构建所述新的数据集数字对象和使用数据集数字对象之间的关联关系,并将所述关联关系保存所述关系注册表中。
6.根据权利要求1所述的方法,其特征在于,所述数据操作包括:修改数字对象和删除数字对象,按照以下步骤执行数据操作:
根据待修改数字对象的标识,获取所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息,并对所述待修改数字对象的数据实体、所述待修改数字对象的元数据和所述待修改数字对象关联的关系信息进行修改;
根据待删除数字对象的标识,获取所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息,并将所述待删除数字对象的数据实体、所述待删除数字对象的元数据、所述待删除数字对象关联的关系信息进行删除。
7.一种基于科研数字对象语用关系的科研数联网服务系统,其特征在于,用于实现权利要求1至6任一项所述的基于科研数字对象语用关系的科研数联网服务方法,所述系统包括:
服务端,所述服务端将科研数据封装为由标识、元数据和数据实体组成的数字对象,并将所述标识、所述元数据和所述数据实体,分别保存到标识解析系统、关系注册表和数字对象仓库,包括:将所述科研数据的公开信息作为数字对象的元数据,并将所述元数据保存到所述关系注册表,所述公开信息包括:标题、作者和内容描述信息;将所述科研数据的主体内容作为数字对象的数据实体,并将所述数据实体保存到所述数字对象仓库;根据所述科研数据的状态信息为所述科研数据指定一个标识,并将所述标识保存到所述标识解析系统,所述状态信息包括:所述元数据保存的对象关系注册表ID和所述数据实体保存的数字对象仓库ID;并将所述数字对象之间的关系保存到所述关系注册表中;
客户端,所述客户端显示用户界面,基于标准化协议对所述标识解析系统、所述关系注册表和所述数字对象仓库进行访问操作,得到科研数据访问操作结果,所述访问操作包括:数据搜索、在线执行代码、关系操作和数据操作,所述标准化协议是指数字对象架构中的通信协议,包括标识解析协议和数字对象接口协议。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-6任一项所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6任一项所述的基于科研数字对象语用关系的科研数联网服务方法的步骤。
CN202311558903.7A 2023-11-22 2023-11-22 基于科研数字对象语用关系的科研数联网服务方法与系统 Active CN117271460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311558903.7A CN117271460B (zh) 2023-11-22 2023-11-22 基于科研数字对象语用关系的科研数联网服务方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311558903.7A CN117271460B (zh) 2023-11-22 2023-11-22 基于科研数字对象语用关系的科研数联网服务方法与系统

Publications (2)

Publication Number Publication Date
CN117271460A CN117271460A (zh) 2023-12-22
CN117271460B true CN117271460B (zh) 2024-02-20

Family

ID=89218156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311558903.7A Active CN117271460B (zh) 2023-11-22 2023-11-22 基于科研数字对象语用关系的科研数联网服务方法与系统

Country Status (1)

Country Link
CN (1) CN117271460B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101880474B1 (ko) * 2018-03-23 2018-08-17 주식회사 비네아 고부가 가치화 콘텐츠 정보서비스를 위한 키워드 기반 서비스 제공 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램
CN116843028A (zh) * 2023-07-05 2023-10-03 重庆建工集团股份有限公司 多模态知识图谱构建方法、系统、存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101880474B1 (ko) * 2018-03-23 2018-08-17 주식회사 비네아 고부가 가치화 콘텐츠 정보서비스를 위한 키워드 기반 서비스 제공 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램
CN116843028A (zh) * 2023-07-05 2023-10-03 重庆建工集团股份有限公司 多模态知识图谱构建方法、系统、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
学位论文资源发现系统多源元数据映射研究;葛梦蕊;杨思洛;李超;;图书情报知识(第03期);全文 *

Also Published As

Publication number Publication date
CN117271460A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
US20200183932A1 (en) Optimizing write operations in object schema-based application programming interfaces (apis)
JP2020091902A (ja) 分散型データストアのバージョン化された階層型データ構造
Labouseur et al. The G* graph database: efficiently managing large distributed dynamic graphs
CN109684701B (zh) Bim模型资源管理系统与bim模型创建方法
US11720631B2 (en) Tool to build and store a data model and queries for a graph database
US20140282370A1 (en) Methods for managing applications using semantic modeling and tagging and devices thereof
CN111901294A (zh) 一种构建在线机器学习项目的方法及机器学习系统
WO2018036324A1 (zh) 一种智慧城市信息共享的方法和装置
CN111026874A (zh) 知识图谱的数据处理方法及服务器
CN107103011B (zh) 终端数据搜索的实现方法和装置
CN109739828B (zh) 一种数据处理方法、设备及计算机可读存储介质
CN112287114A (zh) 一种知识图谱服务处理方法和装置
CN116680040B (zh) 一种容器处理方法、装置、设备、存储介质及程序产品
US10182104B1 (en) Automatic propagation of resource attributes in a provider network according to propagation criteria
CN111737630A (zh) 用于记录用户访问路径的方法
CN110866029A (zh) sql语句构建方法、装置、服务器及可读存储介质
CN112182045A (zh) 元数据管理方法、装置、计算机设备及存储介质
CN113037891A (zh) 边缘计算系统中有状态应用的访问方法、装置及电子设备
CN115705313A (zh) 一种数据处理方法、装置、设备及计算机可读存储介质
CN111625728B (zh) 一种网页文档生成检索目录的方法、装置、设备和介质
US20130191357A1 (en) Managing multiple versions of enterprise meta-models using semantic based indexing
CN117271460B (zh) 基于科研数字对象语用关系的科研数联网服务方法与系统
CN110597827A (zh) 一种接口控制文件数据的存储方法及系统
CN115878860A (zh) 一种菜单的生成方法、装置、服务器设备及介质
CN115293365A (zh) 机器学习模型的管理方法、装置、管理平台和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant