CN110555072A - 数据访问方法、装置、设备和介质 - Google Patents

数据访问方法、装置、设备和介质 Download PDF

Info

Publication number
CN110555072A
CN110555072A CN201910852681.7A CN201910852681A CN110555072A CN 110555072 A CN110555072 A CN 110555072A CN 201910852681 A CN201910852681 A CN 201910852681A CN 110555072 A CN110555072 A CN 110555072A
Authority
CN
China
Prior art keywords
target data
data set
data source
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910852681.7A
Other languages
English (en)
Inventor
聂砂
舒展
邢磊
赵筝
杨美红
贺潇铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN201910852681.7A priority Critical patent/CN110555072A/zh
Publication of CN110555072A publication Critical patent/CN110555072A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据访问方法、装置、设备和介质。所述方法包括:从客户端获取待访问的目标数据集标识,并向服务器发送目标数据集标识,供服务器根据目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;根据目标数据源类型和目标数据源配置信息,构建目标数据源的连接信息;通过构建的目标数据源的连接信息,根据目标数据集属性信息,从目标数据源中获取目标数据集。本发明实施例实现了访问不同数据集时,无需针对不同数据集适配访问方式,以及针对不同数据集所属数据源适配连接方式,减少了基于数据集样本的模型构建的构建周期以及成本。

Description

数据访问方法、装置、设备和介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种数据访问方法、装置、设备和介质。
背景技术
AI(Artificial Intelligence,人工智能),是一种研究以及开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。在构建AI模型时,需要调用多种多样的数据集,而调用这些数据集则需要与不同的数据源进行连接,但是数据源的类型众多,包括NAS、Mysql、HDFS和块存储等等,不同类型数据源的连接方式不同,并且不同数据集的访问方式也不尽相同。
现有方法是对不同数据集的访问方式以及不同数据集所属数据源的连接方式进行单独适配,这样就大大增加了AI模型构建的构建周期以及成本。
发明内容
本发明实施例提供一种数据访问方法、装置、设备和介质,以解决访问数据集时,需要对不同数据集的访问方式以及不同数据集所属数据源的连接方式进行单独适配的问题。
第一方面,本发明实施例提供了一种数据访问方法,所述方法包括:
从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
第二方面,本发明实施例提供了一种数据访问装置,所述装置包括:
目标数据集标识发送模块,用于从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
连接信息构建模块,用于根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
目标数据集获取模块,用于通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的数据访问方法。
第四方面,本发明实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明实施例中任一所述的数据访问方法。
本发明实施例通过根据获取待访问的目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息,根据目标数据源类型以及目标数据源配置信息,构建目标数据源的连接信息,并结合目标数据集属性信息,从目标数据源中获取目标数据集,实现了访问不同数据集时,无需针对不同数据集适配访问方式,以及针对不同数据集所属数据源适配连接方式,减少了基于数据集样本的模型构建的构建周期以及成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一提供的一种数据访问方法的流程图;
图2是本发明实施例二提供的一种数据访问方法的流程图;
图3为本发明实施例三提供的一种数据访问装置的结构示意图;
图4为本发明实施例四提供的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的结构而非全部结构。
实施例一
图1为本发明实施例一提供的一种数据访问方法的流程图。本实施例用于获取目标数据集作为样本构建AI模型的情况。该方法可以由本发明实施例提供的数据访问装置来执行,所述数据访问装置可以由软件和/或硬件的方式来实现。参见图1,该方法具体包括:
步骤101、从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息。
其中,用户通过操控客户端来生成各种指令信息,例如请求登录、数据集查询、数据集读取和导入、数据集元数据登记、服务器存储信息维护等等,并且客户端配置有可视化图形界面,以便于用户使用。服务器存储有用户信息以及所有可用数据集的元数据信息,用户信息包括用户登录名、用户编号、用户密码校验、用户来源等等,可用数据集的元数据信息包括数据集标识、所有者信息、数据集类型、所属数据源类型、所属数据源配置信息、数据集属性信息、管理方式、访问权限等等。
具体的,所述服务器包括一个关系型数据库,即不同的数据集根据其数据集标识,关联有各种对应的元数据信息,所述数据集标识包括数据集名称和数据集编号等。用户想要访问某个目标数据集时,会在客户端选择“数据集访问”功能,并输入待访问目标数据集标识,相应的根据用户输入的目标数据标识,从服务器中确定用于访问目标数据集的元数据信息,可选的包括目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息。
通过根据目标数据集标识,从服务器中确定用于访问目标数据集的目标数据源类型、目标数据源配置信息以及目标数据集属性信息,为后续访问目标数据集奠定了数据基础。
步骤102、根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息。
其中,目标数据源类型包括Mysql、FileSystem、Hdfs以及AliOss等等,目标数据源配置信息表示用于连接目标数据源所需必要的配置参数。
具体的,在连接数据源时需要采用数据源对应的连接方式,即配置流程,连接不同类型数据源时需要采用对应不同的配置流程。确定数据源对应的配置流程后,再根据数据源配置信息,即可实现对数据源的连接。
若连接不同数据源时都相应调整配置流程,则会加重整个数据集访问的工作量。为了能够自适应的与目标数据源连接,步骤102可选的包括:
A、根据所述目标数据源类型,从候选配置流程中选择目标配置流程;
其中,候选配置流程是技术人员根据经验来预设的一些常用配置流程,当确定了目标数据源类型后,则在候选配置流程中选择与该目标数据类型相对应的候选配置流程作为目标配置流程。
B、采用所述目标配置流程,根据所述目标数据源配置信息,构建所述目标数据源的连接信息。
其中,目标数据源配置信息包括如下至少一项:地址、端口、实例名、用户名、密码和表名。目标数据源的连接信息用来实现与目标数据源进行连接,即通过目标数据源的连接信息,就可以与目标数据源建立连接。
通过根据目标数据源类型和目标数据源配置信息,构建所述目标数据源的连接信息,实现了可与目标数据源建立数据连接的技术效果,为后续访问目标数据源中的目标数据集奠定了基础。
步骤103、通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
其中,目标数据集属性信息包括目标数据集的起止位置以及数据读取日志,起止位置用来在目标数据源中定位目标数据集,数据读取日志用来记录目标数据集的数据读取进度。
具体的,通过目标数据源的连接信息,建立与目标数据源的连接,由于目标数据源中包含多个数据集,首先根据目标数据集属性信息中的起止位置实现在目标数据源中对目标数据集的定位,进而再根据目标数据集属性信息中的数据读取日志,对目标数据集进行数据读取。
可选的,通过预先定义的统一数据集访问接口,从目标数据源中获取目标数据集。
通过构建的目标数据源的连接信息,根据目标数据集属性信息,从目标数据源中获取目标数据集,实现了在目标数据源中对目标数据集的定位,进而完成了对目标数据集的获取。
本发明实施例提供的技术方案,通过根据获取待访问的目标数据集标识,在服务器中确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息,根据目标数据源类型以及目标数据源配置信息,构建目标数据源的连接信息,并结合目标数据集属性信息,从目标数据源中获取目标数据集,由于服务器中存储有所有可用数据集的元数据信息,进而只需要根据目标数据集标识,就可以在服务器中获取用于访问目标数据集所需的目标数据源类型、目标数据源配置信息以及目标数据集属性信息,因此无需针对不同数据集适配访问方式,以及针对不同数据集所属数据源适配连接方式,减少了基于数据集样本的模型构建的构建周期以及成本。
在上述实施例的基础上,步骤101中“向服务器发送所述目标数据集标识”之后,“供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息”之前,还包括:
供服务器根据所述目标数据集标识,确定目标数据集的访问权限;根据目标数据集的访问权限确定当前用户是否有权访问该目标数据集。
其中,访问权限包括三类:1)完全私有,即除了所有者以外的其他用户都不可以访问;2)指定人员公开,即在白名单内的用户可以访问,其他用户不可以访问;3)完全公开,即所有人都可以访问。
通过服务器根据目标数据集标识,确定目标数据集的访问权限,进而确定当前用户是否有权访问目标数据集,保证了每个数据集的安全性以及可靠性。
在上述实施例的基础上,所述方法还包括:
将访问的目标数据集添加至缓存队列中,使得用户下次想要访问该目标数据集时可以直接从缓存队列中调取。
通过将访问的目标数据集添加至缓存队列中,方便了用户随时调取该目标数据集。
在上述实施例的基础上,所述方法还包括:
从客户端获取用户的登录请求,并向服务器发送该登录请求,供服务器根据该登录请求与服务器存储的用户密码校验信息进行比对,若比对成功,则准许用户登录客户端。
通过将用户的登录请求与服务器中的用户密码校验信息进行比对,提高了客户端的安全性和可靠性。
在上述实施例的基础上,所述方法还包括:
从客户端获取待查询的目标数据集标识,并向服务器发送该目标数据集标识,供服务器根据目标数据集标识,确定目标数据集的元数据信息,并反馈给客户端。
通过根据待查询的目标数据集标识,从服务器中确定目标数据集的元数据信息,并反馈给客户端,使得用户可以随时获取目标数据集的元数据信息。
在上述实施例的基础上,所述方法还包括:
从客户端获取数据集元数据登记信息,并向服务器发送该数据集元数据登记信息,供服务器根据该数据集元数据登记信息,存储该数据集的元数据信息。
具体的,技术人员通过特有的账号和密码登录客户端,并选择“数据集元数据登记”,进而就可以将新的数据集对应的元数据信息存储至服务器中。
通过获取数据集元数据登记信息,并相应的在服务器中存储该数据的元数据信息,实现了数据集元数据信息的实时更新,避免了用户访问某个数据集时,无法在服务器中获取到相应的元数据信息的问题。
在上述实施例的基础上,所述方法还包括:
从客户端获取待维护的目标数据集标识以及维护操作指令,并向服务器发送目标数据集标识以及维护操作指令,供服务器根据维护操作指令对目标数据集的元数据信息进行更改、添加或删除中的至少一种维护操作。
通过对目标数据集的元数据信息进行维护,保证了数据集元数据信息的准确性。
实施例二
图2是本发明实施例二提供的一种数据访问方法的流程图。本实施例为上述实施例一提供了一种具体实现方式。具体可以包括如下:
步骤201、从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息。
步骤202、根据所述目标数据源类型,从候选配置流程中选择目标配置流程。
步骤203、采用所述目标配置流程,根据所述目标数据源配置信息,构建所述目标数据源的连接信息。
示例性的,若目标配置流程为,访问Mysql数据库中某个地址的某个端口的某个实例,并使用某个用户名和密码访问某个表,目标数据源配置信息包括地址:255.255.1.1,端口号:7001,实例名:DataSet1,用户名:LEE,密码:1234,表名:客户信息,则构建的目标数据源的连接信息可以概括为:访问Mysql数据库中255.255.1.1地址的7001号端口的DataSet1实例,并使用用户名LEE和密码1234访问客户信息表。
步骤204、通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息确定所述目标数据集是否进行过数据读取操作,若未进行过,则执行步骤205,若进行过,则执行步骤206。
具体的,通过构建的所述目标数据源的连接信息,建立与目标数据源的连接,并根据目标数据集属性信息中的起止位置,在目标数据源中定位目标数据集,且根据目标数据集属性信息中的数据读取日志,确定数据读取日志中是否具有日志信息,若有,则确定目标数据集进行过数据读取操作,若没有,则确定目标数据集没有进行过数据读取操作。
步骤205、将所述目标数据集的起点位置作为本次数据读取起点位置,并根据预设的数据读取量对所述目标数据集进行数据读取。
其中,目标数据集的起点位置由目标数据集属性信息中的起止位置确定。
示例性的,假设预设的数据读取量为50,且目标数据集类型是图片,则数据读取时,从数据集的起点位置开始,读取50张图片,相应的还会在数据读取日志中添加如“本次读取到第50张图片,下次从第51张图片开始读取,本次数据读取量为50张图片”的日志信息。
示例性的,假设预设的数据读取量为50,且目标数据集类型是文本,则数据读取时,从数据集的起点位置开始,读取50条文本,相应的还会在数据读取日志中添加如“本次读取到第50条文本,下次从第51条文本开始读取,本次数据读取量为50条文本”的日志信息。
步骤206、根据上次数据读取的数据读取日志以及预设数据读取量,对所述目标数据集进行数据读取。
示例性的,假设预设的数据读取量为50,且目标数据集类型是图片,上次数据读取的数据读取日志中记载着“本次读取到第50张图片,下次从第51张图片开始读取,本次数据读取量为50张图片”,则从第51张图片开始,读取50张图片,相应的还会在数据读取日志中添加如“本次读取到第100张图片,下次从第101张图片开始读取,本次数据读取量为50张图片”的日志信息。
示例性的,假设预设的数据读取量为50,且目标数据集类型是文本,上次数据读取的数据读取日志中记载着“本次读取到第50条文本,下次从第51条文本开始读取,本次数据读取量为50条文本”,则从第51条文本开始,读取50条文本,相应的还会在数据读取日志中添加如“本次读取到第100条文本,下次从第101条文本开始读取,本次数据读取量为50条文本”的日志信息。
步骤207、将获取的目标数据集存到内存中,并从内存向客户端反馈所述目标数据集,供客户端使用所述目标数据集作为样本构建AI模型。
通过将获取的目标数据集存到内存中,使得用户想要再次使用获取的目标数据集时,可直接从内存中获取,相比从缓存队列中获取目标数据集,速度更快效率更高。
本发明实施例提供的技术方案,通过根据目标数据源类型,从候选配置流程中选择目标配置流程,由于预先设置了多种候选配置流程,使得用户无需针对不同的数据源连接再进行单独适配。通过根据预设的数据读取量以及数据读取日志对目标数据集进行数据读取,实现了分批次进行数据读取的效果,满足构建AI模型的特点。通过将获取的目标数据集存到内存中,使得用户想要再次使用获取的目标数据集时,可直接从内存中获取,相比从缓存队列中获取目标数据集,速度更快效率更高。
在上述实施例的基础上,所述方法还包括:
按照预设周期对内存中存储的数据集进行检测,将大于预设门限值的数据集,按存储时间的先后顺序进行清理。
通过对内存中数据集按存储时间的先后进行清理,实现了了内存中数据集的更新。
实施例三
图3为本发明实施例三提供的一种数据访问装置的结构示意图,可执行本发明任一实施例所提供的一种数据访问方法,具备执行方法相应的功能模块和有益效果。如图3所示,该装置可以包括:
目标数据集标识发送模块31,用于从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
连接信息构建模块32,用于根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
目标数据集获取模块33,用于通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
在上述实施例的基础上,所述连接信息构建模块32,具体用于:
根据所述目标数据源类型,从候选配置流程中选择目标配置流程;
采用所述目标配置流程,根据所述目标数据源配置信息,构建所述目标数据源的连接信息。
在上述实施例的基础上,所述目标数据源配置信息包括如下至少一项:地址、端口、实例名、用户名、密码和表名。
在上述实施例的基础上,所述目标数据集获取模块33,具体用于:
若根据所述目标数据集属性信息确定所述目标数据集未进行过数据读取操作,则将所述目标数据集的起点位置作为本次数据读取起点位置,并根据预设的数据读取量对所述目标数据集进行数据读取;
若根据所述目标数据集属性信息确定目标数据集进行过数据读取操作,则根据上次数据读取的数据读取日志以及预设数据读取量,对所述目标数据集进行数据读取。
在上述实施例的基础上,所述装置还包括目标数据集反馈模块,具体用于:
将获取的目标数据集存到内存中,并从内存向客户端反馈所述目标数据集,供客户端使用所述目标数据集作为样本构建AI模型。
本发明实施例所提供的一种数据访问装置,可执行本发明任一实施例所提供的一种数据访问方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任一实施例提供的一种数据访问方法。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备400的框图。图4显示的设备400仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,设备400以通用计算设备的形式表现。设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元401,系统存储器402,连接不同系统组件(包括系统存储器402和处理单元401)的总线403。
总线403表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器402可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)404和/或高速缓存存储器405。设备400可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统406可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线403相连。存储器402可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块407的程序/实用工具408,可以存储在例如存储器402中,这样的程序模块407包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块407通常执行本发明所描述的实施例中的功能和/或方法。
设备400也可以与一个或多个外部设备409(例如键盘、指向设备、显示器410等)通信,还可与一个或者多个使得用户能与该设备400交互的设备通信,和/或与使得该设备400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口411进行。并且,设备400还可以通过网络适配器412与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器412通过总线403与设备400的其它模块通信。应当明白,尽管图中未示出,可以结合设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元401通过运行存储在系统存储器402中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的数据访问方法,包括:
从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种数据访问方法,该方法包括:
从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的一种数据访问方法中的相关操作。本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种数据访问方法,其特征在于,所述方法包括:
从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
2.根据权利要求1所述的方法,其特征在于,根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接配置信息,包括:
根据所述目标数据源类型,从候选配置流程中选择目标配置流程;
采用所述目标配置流程,根据所述目标数据源配置信息,构建所述目标数据源的连接信息。
3.根据权利要求1所述的方法,其特征在于,所述目标数据源配置信息包括如下至少一项:地址、端口、实例名、用户名、密码和表名。
4.根据权利要求1所述的方法,其特征在于,根据所述目标数据集属性信息,从目标数据源中获取目标数据集,包括:若根据所述目标数据集属性信息确定所述目标数据集未进行过数据读取操作,则将所述目标数据集的起点位置作为本次数据读取起点位置,并根据预设的数据读取量对所述目标数据集进行数据读取;
若根据所述目标数据集属性信息确定目标数据集进行过数据读取操作,则根据上次数据读取的数据读取日志以及预设数据读取量,对所述目标数据集进行数据读取。
5.根据权利要求4所述的方法,其特征在于,从目标数据源中获取目标数据集之后,还包括:
将获取的目标数据集存到内存中,并从内存向客户端反馈所述目标数据集,供客户端使用所述目标数据集作为样本构建AI模型。
6.一种数据访问装置,其特征在于,所述装置包括:
目标数据集标识发送模块,用于从客户端获取待访问的目标数据集标识,并向服务器发送所述目标数据集标识,供服务器根据所述目标数据集标识,确定目标数据集所属的目标数据源类型、目标数据源配置信息以及目标数据集属性信息;
连接信息构建模块,用于根据所述目标数据源类型和所述目标数据源配置信息,构建所述目标数据源的连接信息;
目标数据集获取模块,用于通过构建的所述目标数据源的连接信息,根据所述目标数据集属性信息,从目标数据源中获取目标数据集。
7.根据权利要求6所述的装置,其特征在于,所述连接信息构建模块,具体用于:
根据所述目标数据源类型,从候选配置流程中选择目标配置流程;
采用所述目标配置流程,根据所述目标数据源配置信息,构建所述目标数据源的连接信息。
8.根据权利要求6所述的装置,其特征在于,所述目标数据源配置信息包括如下至少一项:地址、端口、实例名、用户名、密码和表名。
9.根据权利要求6所述的装置,其特征在于,所述目标数据集获取模块,具体用于:
若根据所述目标数据集属性信息确定所述目标数据集未进行过数据读取操作,则将所述目标数据集的起点位置作为本次数据读取起点位置,并根据预设的数据读取量对所述目标数据集进行数据读取;
若根据所述目标数据集属性信息确定目标数据集进行过数据读取操作,则根据上次数据读取的数据读取日志以及预设数据读取量,对所述目标数据集进行数据读取。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括目标数据集反馈模块,具体用于:
将获取的目标数据集存到内存中,并从内存向客户端反馈所述目标数据集,供客户端使用所述目标数据集作为样本构建AI模型。
11.一种设备,其特征在于,所述设备还包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的一种数据访问方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的一种数据访问方法。
CN201910852681.7A 2019-09-10 2019-09-10 数据访问方法、装置、设备和介质 Pending CN110555072A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910852681.7A CN110555072A (zh) 2019-09-10 2019-09-10 数据访问方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910852681.7A CN110555072A (zh) 2019-09-10 2019-09-10 数据访问方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN110555072A true CN110555072A (zh) 2019-12-10

Family

ID=68739799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910852681.7A Pending CN110555072A (zh) 2019-09-10 2019-09-10 数据访问方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110555072A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414391A (zh) * 2020-03-25 2020-07-14 平安资产管理有限责任公司 一种访问多数据源的方法及系统
US20210133351A1 (en) * 2019-12-19 2021-05-06 Lynx Md Ltd Ownership Determination in Privacy Firewalls
CN113010587A (zh) * 2019-12-19 2021-06-22 北京金山云网络技术有限公司 数据源配置方法、装置、终端、服务器及介质
CN113127222A (zh) * 2019-12-31 2021-07-16 浙江宇视科技有限公司 数据发送方法、装置、设备和介质
CN113253691A (zh) * 2021-06-18 2021-08-13 武汉科迪智能环境股份有限公司 设备管理方法和装置
CN115098579A (zh) * 2022-08-24 2022-09-23 中关村科学城城市大脑股份有限公司 业务数据发布方法、装置、电子设备和计算机可读介质
CN115185939A (zh) * 2022-09-07 2022-10-14 中航信移动科技有限公司 多源数据的数据处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1826601A (zh) * 2003-08-29 2006-08-30 瑞士银行股份有限公司 多用途数据的无冗余提供
CN104598459A (zh) * 2013-10-30 2015-05-06 阿里巴巴集团控股有限公司 数据库处理、数据访问方法及系统
CN107770170A (zh) * 2017-10-18 2018-03-06 陕西云基华海信息技术有限公司 一种数据共享平台系统
CN108763530A (zh) * 2018-05-31 2018-11-06 中国农业银行股份有限公司 一种数据访问方法、装置及电子设备
CN108874994A (zh) * 2018-06-12 2018-11-23 北京奇虎科技有限公司 一种分块读取数据的方法、装置及计算机存储介质
US20190095498A1 (en) * 2017-09-27 2019-03-28 Oracle International Corporation Reference attribute query processing for a multi-tenant cloud service

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1826601A (zh) * 2003-08-29 2006-08-30 瑞士银行股份有限公司 多用途数据的无冗余提供
CN104598459A (zh) * 2013-10-30 2015-05-06 阿里巴巴集团控股有限公司 数据库处理、数据访问方法及系统
US20190095498A1 (en) * 2017-09-27 2019-03-28 Oracle International Corporation Reference attribute query processing for a multi-tenant cloud service
CN107770170A (zh) * 2017-10-18 2018-03-06 陕西云基华海信息技术有限公司 一种数据共享平台系统
CN108763530A (zh) * 2018-05-31 2018-11-06 中国农业银行股份有限公司 一种数据访问方法、装置及电子设备
CN108874994A (zh) * 2018-06-12 2018-11-23 北京奇虎科技有限公司 一种分块读取数据的方法、装置及计算机存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210133351A1 (en) * 2019-12-19 2021-05-06 Lynx Md Ltd Ownership Determination in Privacy Firewalls
CN113010587A (zh) * 2019-12-19 2021-06-22 北京金山云网络技术有限公司 数据源配置方法、装置、终端、服务器及介质
US11868504B2 (en) * 2019-12-19 2024-01-09 Lynx Md Ltd. Ownership determination in privacy firewalls
CN113127222A (zh) * 2019-12-31 2021-07-16 浙江宇视科技有限公司 数据发送方法、装置、设备和介质
CN113127222B (zh) * 2019-12-31 2024-04-05 浙江宇视科技有限公司 数据发送方法、装置、设备和介质
CN111414391A (zh) * 2020-03-25 2020-07-14 平安资产管理有限责任公司 一种访问多数据源的方法及系统
CN113253691A (zh) * 2021-06-18 2021-08-13 武汉科迪智能环境股份有限公司 设备管理方法和装置
CN113253691B (zh) * 2021-06-18 2021-09-14 武汉科迪智能环境股份有限公司 设备管理方法和装置
CN115098579A (zh) * 2022-08-24 2022-09-23 中关村科学城城市大脑股份有限公司 业务数据发布方法、装置、电子设备和计算机可读介质
CN115185939A (zh) * 2022-09-07 2022-10-14 中航信移动科技有限公司 多源数据的数据处理方法
CN115185939B (zh) * 2022-09-07 2022-11-18 中航信移动科技有限公司 多源数据的数据处理方法

Similar Documents

Publication Publication Date Title
CN110555072A (zh) 数据访问方法、装置、设备和介质
US11663375B2 (en) Configuration of a digital twin for a building or other facility via BIM data extraction and asset register mapping
WO2019140828A1 (zh) 电子装置、分布式系统日志查询方法及存储介质
WO2018120721A1 (zh) 用户界面的测试方法、系统、电子装置及计算机可读存储介质
US10409551B1 (en) Voice-driven monitoring of resources in a service provider network
US10409658B2 (en) Batch processing of messages
JP6595625B2 (ja) 自動再チャージシステム、方法、およびサーバ
US11082514B2 (en) Push notification management
CN112528262A (zh) 基于令牌的应用程序访问方法、装置、介质及电子设备
CN112269799A (zh) 一种数据查询方法、装置、设备和介质
CN113254969B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN110958127B (zh) 一种异常处理方法、装置、设备和计算机存储介质
US20220272130A1 (en) Method and apparatus for matching users, computer device, and storage medium
CN106790171B (zh) 会话控制的方法、装置、计算机可读存储介质和设备
US10180900B2 (en) Recordation of user interface events for script generation
CN114356521A (zh) 任务调度方法、装置、电子设备及存储介质
CN110569266A (zh) 一种数据查询的方法、装置、设备及存储介质
US9356903B2 (en) Dynamically managing social networking groups
US20220083980A1 (en) System and method providing a remote video-based interview
CN109086097B (zh) 一种小程序的启动方法、装置、服务器及存储介质
JP2013030036A (ja) 工程管理システム、工程管理方法、プログラム及び工程管理装置
CN112882863A (zh) 恢复数据的方法、装置、系统和电子设备
CN114968725A (zh) 任务依赖关系校正方法、装置、计算机设备及存储介质
CN112950833B (zh) 一种门禁设备的授权方法、装置、设备及存储介质
CN111176982B (zh) 一种测试界面生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220921

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: No. 25, Financial Street, Dongcheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191210