CN116340411A - 一种数据处理的方法及装置 - Google Patents

一种数据处理的方法及装置 Download PDF

Info

Publication number
CN116340411A
CN116340411A CN202310631546.6A CN202310631546A CN116340411A CN 116340411 A CN116340411 A CN 116340411A CN 202310631546 A CN202310631546 A CN 202310631546A CN 116340411 A CN116340411 A CN 116340411A
Authority
CN
China
Prior art keywords
data table
target
database system
data
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310631546.6A
Other languages
English (en)
Other versions
CN116340411B (zh
Inventor
刘小霞
朱海洋
高杨斌
胡健
朱时俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Products Zhongda Digital Technology Co ltd
Original Assignee
Products Zhongda Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Products Zhongda Digital Technology Co ltd filed Critical Products Zhongda Digital Technology Co ltd
Priority to CN202310631546.6A priority Critical patent/CN116340411B/zh
Publication of CN116340411A publication Critical patent/CN116340411A/zh
Application granted granted Critical
Publication of CN116340411B publication Critical patent/CN116340411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供一种数据处理方法及装置,响应于用户新建工作流的操作,输出工作流编辑界面,在工作流编辑界面中建立对应于第一数据库系统的源数据表以及对应于第二数据库系统的空数据表,确定源数据表和目标数据表的转换关系。基于源数据表、空数据表和转换关系,生成目标工作流,执行目标工作流,将源数据表进行转换之后更新至空数据表中,得到目标数据表。对目标数据表进行更新,以在第二数据库系统中对更新之后的目标数据表进行处理。如此不仅解决了采集数据的第一数据库系统和处理数据的第二数据库系统存在的数据不兼容的问题,而且提升了数据采集的效率。

Description

一种数据处理的方法及装置
技术领域
本说明书一个或多个实施例涉及数据库技术领域,特别涉及一种数据处理的方法及装置。
背景技术
目前来说,很多大型企业因业务的需要,需通过数据库系统采集业务数据。在对业务数据进行处理时,需要将业务数据导入至其它的数据库系统进行处理。例如,可以利用HANA数据库系统对业务数据进行采集,利用ORACLE数据库系统对业务数据进行统计分析。然而,采集数据的数据库系统和处理数据的数据库系统可能存在数据不兼容的问题。
在相关技术中,一般是通过人工提取数据,然后手动转换成符合处理数据的数据库系统能够兼容的数据格式,但是,如果数据量过大,可能会导致数据在转换过程出现错误与乱码、日志显示不全、人工调整难度大等问题。
发明内容
本说明书一个或多个实施例提供一种数据处理方法及装置。
根据第一方面,提供一种数据处理方法,包括:
响应于用户新建工作流的操作,输出工作流编辑界面;
在所述工作流编辑界面中建立源数据表;所述源数据表中的数据来自第一数据库系统;
在所述工作流编辑界面中新建对应于第二数据库系统的空数据表;
确定所述源数据表和目标数据表的转换关系;
响应于用户在所述工作流编辑界面中的触发操作,基于所述源数据表、所述空数据表和所述转换关系,生成目标工作流;
执行所述目标工作流,将所述源数据表进行转换之后更新至所述空数据表中,得到所述目标数据表;
对所述目标数据表进行以下更新,以在所述第二数据库系统中对更新之后的目标数据表进行处理:确定所述目标数据表中的目标列,将所述目标列中的数据对应的字符集类型更新成预设字符集类型,以及将所述目标数据表中指定数据的格式更新为目标格式。
可选地,所述在所述工作流编辑界面中建立源数据表,包括:
通过所述工作流编辑界面,在预先搭建的所述第一数据库系统的数据库环境下,新建源数据库,并在所述源数据库中建立源数据仓;
向所述源数据仓中导入所述第一数据库系统中的指定数据表作为所述源数据表,并向所述源数据仓中添加所述源数据表的表格视图。
可选地,所述在所述工作流编辑界面中新建对应于第二数据库系统的空数据表,包括:
通过所述工作流编辑界面,在预先搭建的所述第二数据库系统的数据库环境下,新建目标数据库,并在所述目标数据库中建立目标数据仓;
在所述目标数据仓中创建所述源数据表对应的空数据表,并向所述目标数据仓中添加所述空数据表的表格视图。
可选地,所述确定所述源数据表和目标数据表的转换关系,包括:
利用SQL查询语句确定所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系;
基于所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定所述源数据表和目标数据表的转换关系。
可选地,所述确定所述目标数据表中的目标列,包括:将预设字段对应的列确定为所述目标数据表中的目标列。
可选地,所述将所述目标列中的数据对应的字符集类型更新成预设字符集类型,包括:
在所述目标数据表中新建临时列;
将所述目标列中的数据更新至所述临时列中,清空所述目标列的数据;
将清空之后的目标列中的字符集类型修改为预设字符集类型;
将更新至所述临时列中的数据迁移回所述目标列中。
根据第二方面,提供一种数据处理装置,包括:
输出模块,用于响应于用户新建工作流的操作,输出工作流编辑界面;
第一建立模块,用于在所述工作流编辑界面中建立源数据表;所述源数据表中的数据来自第一数据库系统;
第二建立模块,用于在所述工作流编辑界面中新建对应于第二数据库系统的空数据表;
确定模块,用于确定所述源数据表和目标数据表的转换关系;
生成模块,用于响应于用户在所述工作流编辑界面中的触发操作,基于所述源数据表、所述空数据表和所述转换关系,生成目标工作流;
执行模块,用于执行所述目标工作流,将所述源数据表进行转换之后更新至所述空数据表中,得到所述目标数据表;
更新模块,用于对所述目标数据表进行以下更新,以在所述第二数据库系统中对更新之后的目标数据表进行处理:确定所述目标数据表中的目标列,将所述目标列中的数据对应的字符集类型更新成预设字符集类型,以及将所述目标数据表中指定数据的格式更新为目标格式。
可选地,所述第一建立模块被配置用于:
通过所述工作流编辑界面,在预先搭建的所述第一数据库系统的数据库环境下,新建源数据库,并在所述源数据库中建立源数据仓;
向所述源数据仓中导入所述第一数据库系统中的指定数据表作为所述源数据表,并向所述源数据仓中添加所述源数据表的表格视图;
其中,所述第二建立模块被配置用于:
通过所述工作流编辑界面,在预先搭建的所述第二数据库系统的数据库环境下,新建目标数据库,并在所述目标数据库中建立目标数据仓;
在所述目标数据仓中创建所述源数据表对应的空数据表,并向所述目标数据仓中添加所述空数据表的表格视图。
可选地,所述确定所述源数据表和目标数据表的转换关系,包括:
利用SQL查询语句确定所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系;
基于所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定所述源数据表和目标数据表的转换关系;
其中,所述确定所述目标数据表中的目标列,包括:将预设字段对应的列确定为所述目标数据表中的目标列。
可选地,所述将所述目标列中的数据对应的字符集类型更新成预设字符集类型,包括:
在所述目标数据表中新建临时列;
将所述目标列中的数据更新至所述临时列中,清空所述目标列的数据;
将清空之后的目标列中的字符集类型修改为预设字符集类型;
将更新至所述临时列中的数据迁移回所述目标列中。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书的实施例提供的数据处理方法和装置,通过工作流编辑界面建立对应于第一数据库系统的源数据表以及对应于第二数据库系统的空数据表,并确定源数据表和目标数据表的转换关系。基于源数据表、空数据表和转换关系,生成目标工作流之后,执行目标工作流,以将源数据表进行转换之后更新至空数据表中,得到目标数据表。再确定目标数据表中的目标列,将目标列中的数据对应的字符集类型更新成预设字符集类型,以及将目标数据表中指定数据的格式更新为目标格式,以在第二数据库系统中对更新之后的目标数据表进行处理。从而不仅解决了采集数据的第一数据库系统和处理数据的第二数据库系统存在的数据不兼容的问题,而且提升了数据采集的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请根据一示例性实施例示出的一种数据处理场景示意图;
图2是本申请根据一示例性实施例示出的一种数据处理方法流程图;
图3是本申请根据一示例性实施例示出的一种数据处理装置框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1,是根据一示例性实施例示出的一种数据处理的场景示意图。
在图1示出的场景中,用户设备安装有HANA系统客户端、中间平台客户端以及Oracle系统客户端。首先,用户可以通过用户设备中安装的中间平台客户端新建工作流,中间平台客户端向用户提供工作流编辑界面。一方面,用户可以通过工作流编辑界面,在新建的工作流中新建源数据库,并在源数据库中建立源数据仓。接着,中间平台客户端可以通过HANA系统客户端,从HANA系统数据库中获取所需数据,并向源数据仓导入上述来自HANA系统数据库的数据,从而生成源数据表。
另一方面,用户可以通过工作流编辑界面,在新建的工作流中新建目标数据库,在目标数据库中建立目标数据仓,并在目标数据仓中创建源数据表对应的空数据表。
然后,用户可以通过工作流编辑界面,利用SQL查询语句匹配HANA系统和Oracle系统中数据集、表格、列和主关键字之间的对应关系,从而建立源数据表和目标数据表的转换关系。接着,用户再进行生成目标工作流的触发操作,从而生成目标工作流。可以通过执行目标工作流,得到目标数据表。
接着,可以将目标数据表导入至Oracle系统客户端,用户可以通过Oracle系统客户端在目标数据表中新建临时列,并确定目标列。将目标列中的数据更新至临时列中,并清空目标列。然后,将清空之后的目标列中字符集类型由nvarchar修改为varchar2。并且,将目标数据表中的数据的日期格式进行更新。例如,若目标数据表中的日期格式为“YYYY-MM-DD”,则可以将日期格式更新为“YYYYMMDD”。
最后,可以将更新至临时列中的数据迁移回已经清空但修改了字符集类型的目标列中,并将临时列删除。可以通过Oracle系统客户端,对更新后的目标数据表进行处理。
下面将结合具体的实施例对本说明书提供的方案进行详细描述。
如图2所示,图2是根据一示例性实施例示出的一种数据处理方法的流程图,该方法可以应用于任何具有计算、处理能力的用户设备。该方法包括以下步骤:
在步骤201中,响应于用户新建工作流的操作,输出工作流编辑界面。
在本实施例中,用户设备中可以安装有第一数据库系统的客户端、第二数据库系统的客户端以及中间平台的客户端。其中,第一数据库系统和第二数据库系统为不同的数据库系统,例如,第一数据库系统可以是HANA数据库系统,第二数据库系统可以是Oracle数据库系统。又例如,第一数据库系统可以是Oracle数据库系统,第二数据库系统可以是HANA数据库系统。中间平台可以是用于从数据库中抽取数据的平台,例如,中间平台可以是DS平台,DS平台是SAP Data Service的简称,可以为从异构源到目标数据库或数据仓库的数据集成、转换、数据质量、数据分析和文本数据处理提供单一企业级解决方案。可以理解,中间平台还可以是其它用于抽取数据的平台,例如SLT(SAP Landscape Transformation)等。
在本实施例中,第一数据库系统的客户端用于从第一数据库系统的服务端获取待处理的数据。中间平台的客户端用于基于待处理的数据,生成源数据表,并基于源数据表进行转换处理,得到适配于第二数据库系统的目标数据表。第二数据库系统的客户端用于对目标数据表进行更新,从而得到待处理的目标数据表。
具体来说,首先,可以预先在中间平台的客户端中分别搭建第一数据库系统和第二数据库系统的数据库环境,并分别配置第一数据库系统和第二数据库系统的服务器信息。其中,配置的服务器信息可以包括但不限于数据库的IP ,数据库名,用户账号,用户密码等。
然后,用户可以通过中间平台的客户端进行新建工作流的操作,响应于用户新建工作流的操作,中间平台的客户端输出工作流编辑界面,用户可以在工作流编辑界面中编辑工作流。
在步骤202中,在工作流编辑界面中建立源数据表,以及在步骤203中,在工作流编辑界面中新建对应于第二数据库系统的空数据表。
在本实施例中,一方面,用户可以通过工作流编辑界面,基于预先搭建的第一数据库系统的数据库环境,新建源数据库,并在源数据库中建立源数据仓。然后,从第一数据库系统的客户端获取第一数据库系统中的指定数据表,并将该指定数据表导入至源数据仓中,得到源数据表,同时,向源数据仓中添加源数据表的表格视图。其中,指定数据表可以是包括待处理数据的数据表。
另一方面,用户可以通过工作流编辑界面,基于预先搭建的第二数据库系统的数据库环境,新建目标数据库,并在目标数据库中建立目标数据仓。然后,在目标数据仓中创建源数据表对应的空数据表,并向目标数据仓中添加空数据表的表格视图。
在步骤204中,确定源数据表和目标数据表的转换关系。在步骤205中,响应于用户在工作流编辑界面中的触发操作,基于源数据表、空数据表和转换关系,生成目标工作流。以及在步骤206中,执行目标工作流,将源数据表进行转换之后更新至空数据表中,得到目标数据表。
在本实施例中,可以利用SQL查询语句对第一数据库系统和第二数据库系统中的数据进行匹配,以确定第一数据库系统和第二数据库系统中数据集、表格、列和主关键字之间的对应关系。然后,基于第一数据库系统和第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定源数据表和目标数据表的转换关系。该转换关系可以用于对源数据表进行转换,以生成目标数据表。
接着,用户可以在工作流编辑界面中进行预设的触发操作,以触发目标工作流的生成。中间平台的客户端响应于用户在工作流编辑界面中的触发操作,基于源数据表、空数据表和转换关系,生成目标工作流。通过执行目标工作流,可以将源数据表进行转换之后更新至空数据表中,得到目标数据表。
步骤207中,确定目标数据表中的目标列,将目标列中的数据对应的字符集类型更新成预设字符集类型,以及将目标数据表中指定数据的格式更新为目标格式。
在本实施例中,可以将目标数据表传入第二数据库系统的客户端中,首先,确定目标数据表中的目标列,例如,可以将预设字段对应的列确定为目标数据表中的目标列。然后,将目标列中的数据对应的字符集类型更新成预设字符集类型,具体地,一方面,可以在目标数据表中新建临时列,将目标列中的数据复制到临时列中,并清空目标列的数据。接着将清空之后的目标列中的字符集类型修改为预设字符集类型,再将复制到临时列中的数据迁移回目标列中,并删除临时列。
例如,目标列可以是字段为XX的列,可以在目标数据表中新建一个临时列,将字段为XX的列中的数据通过复制和粘贴更新至临时列中。然后,删除目标列中的数据,然而目标列中的数据对应的字符集类型还是原来的类型nvarchar,可以将目标列中的数据对应的字符集类型更新成预设字符集类型varchar2。
需要说明的是,目标列可以包括一列,也可以包括多列,如果目标列包括多列,可以针对每个目标列创建相应的临时列,并同时将每个目标列中的数据更新至相应的临时列中,对每个目标列进行字符集类型更新。也可以只创建一列临时列,然后依次对每个目标列进行字符集类型更新,在全部目标列完成更新之后,再删除该一列临时列。
另一方面,还可以将目标数据表中指定数据的格式更新为目标格式。例如,若目标数据表中的日期格式为“YYYY-MM-DD”,则可以将日期格式更新为“YYYYMMDD”。其中,目标数据表中指定数据的格式可以是第一数据库系统支持的格式,目标格式可以是第二数据库系统支持的格式,可以理解,本实施例对上述格式的具体类型方面不限定。
最后,在对目标数据表进行上述更新之后,可以在第二数据库系统中对更新之后的目标数据表进行处理。例如,在第二数据库系统中对目标数据表进行统计和解析等。
本说明书的上述实施例提供的数据处理方法,通过工作流编辑界面建立对应于第一数据库系统的源数据表以及对应于第二数据库系统的空数据表,并确定源数据表和目标数据表的转换关系。基于源数据表、空数据表和转换关系,生成目标工作流之后,执行目标工作流,以将源数据表进行转换之后更新至空数据表中,得到目标数据表。再确定目标数据表中的目标列,将目标列中的数据对应的字符集类型更新成预设字符集类型,以及将目标数据表中指定数据的格式更新为目标格式,以在第二数据库系统中对更新之后的目标数据表进行处理。从而不仅解决了采集数据的第一数据库系统和处理数据的第二数据库系统存在的数据不兼容的问题,而且提升了数据采集效率。
应当注意,尽管在上述的实施例中,以特定顺序描述了本说明书实施例的方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。
与前述数据处理方法实施例相对应,本说明书还提供了数据处理装置的实施例。
如图3所示,图3是本说明书根据一示例性实施例示出的一种数据处理装置框图,该装置可以包括:输出模块301,第一建立模块302,第二建立模块303,确定模块304,生成模块305,执行模块306和更新模块307。
其中,输出模块301,用于响应于用户新建工作流的操作,输出工作流编辑界面。
第一建立模块302,用于在工作流编辑界面中建立源数据表,源数据表中的数据来自第一数据库系统。
第二建立模块303,用于在工作流编辑界面中新建对应于第二数据库系统的空数据表。
确定模块304,用于确定源数据表和目标数据表的转换关系。
生成模块305,用于响应于用户在工作流编辑界面中的触发操作,基于源数据表、空数据表和转换关系,生成目标工作流。
执行模块306,用于执行目标工作流,将源数据表进行转换之后更新至空数据表中,得到目标数据表。
更新模块307,用于对目标数据表进行以下更新,以在第二数据库系统中对更新之后的目标数据表进行处理:确定目标数据表中的目标列,将目标列中的数据对应的字符集类型更新成预设字符集类型,以及将目标数据表中指定数据的格式更新为目标格式。
在一些实施方式中,第一建立模块302被配置用于:通过工作流编辑界面,在预先搭建的第一数据库系统的数据库环境下,新建源数据库,并在源数据库中建立源数据仓,向源数据仓中导入第一数据库系统中的指定数据表作为源数据表,并向源数据仓中添加源数据表的表格视图。
第二建立模块303被配置用于:通过工作流编辑界面,在预先搭建的第二数据库系统的数据库环境下,新建目标数据库,并在目标数据库中建立目标数据仓,在目标数据仓中创建源数据表对应的空数据表,并向目标数据仓中添加空数据表的表格视图。
在另一些实施方式中,确定模块304通过如下方式确定源数据表和目标数据表的转换关系:利用SQL查询语句确定第一数据库系统和第二数据库系统中数据集、表格、列和主关键字之间的对应关系。基于第一数据库系统和第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定源数据表和目标数据表的转换关系。
其中,更新模块307通过如下方式确定目标数据表中的目标列:将预设字段对应的列确定为目标数据表中的目标列。
在另一些实施方式中,更新模块307通过如下方式将目标列中的数据对应的字符集类型更新成预设字符集类型:在目标数据表中新建临时列,将目标列中的数据更新至临时列中,并清空目标列的数据,将清空之后的目标列中的字符集类型修改为预设字符集类型,将更新至临时列中的数据迁移回目标列中。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书一个或多个实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。其中,软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据处理方法,所述方法包括:
响应于用户新建工作流的操作,输出工作流编辑界面;
在所述工作流编辑界面中建立源数据表;所述源数据表中的数据来自第一数据库系统;
在所述工作流编辑界面中新建对应于第二数据库系统的空数据表;
确定所述源数据表和目标数据表的转换关系;
响应于用户在所述工作流编辑界面中的触发操作,基于所述源数据表、所述空数据表和所述转换关系,生成目标工作流;
执行所述目标工作流,将所述源数据表进行转换之后更新至所述空数据表中,得到所述目标数据表;
对所述目标数据表进行以下更新,以在所述第二数据库系统中对更新之后的目标数据表进行处理:确定所述目标数据表中的目标列,将所述目标列中的数据对应的字符集类型更新成预设字符集类型,以及将所述目标数据表中指定数据的格式更新为目标格式。
2.根据权利要求1所述的方法,其中,所述在所述工作流编辑界面中建立源数据表,包括:
通过所述工作流编辑界面,在预先搭建的所述第一数据库系统的数据库环境下,新建源数据库,并在所述源数据库中建立源数据仓;
向所述源数据仓中导入所述第一数据库系统中的指定数据表作为所述源数据表,并向所述源数据仓中添加所述源数据表的表格视图。
3.根据权利要求1所述的方法,其中,所述在所述工作流编辑界面中新建对应于第二数据库系统的空数据表,包括:
通过所述工作流编辑界面,在预先搭建的所述第二数据库系统的数据库环境下,新建目标数据库,并在所述目标数据库中建立目标数据仓;
在所述目标数据仓中创建所述源数据表对应的空数据表,并向所述目标数据仓中添加所述空数据表的表格视图。
4.根据权利要求1所述的方法,其中,所述确定所述源数据表和目标数据表的转换关系,包括:
利用SQL查询语句确定所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系;
基于所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定所述源数据表和目标数据表的转换关系。
5.根据权利要求1所述的方法,其中,所述确定所述目标数据表中的目标列,包括:将预设字段对应的列确定为所述目标数据表中的目标列。
6.根据权利要求1所述的方法,其中,所述将所述目标列中的数据对应的字符集类型更新成预设字符集类型,包括:
在所述目标数据表中新建临时列;
将所述目标列中的数据更新至所述临时列中,并清空所述目标列的数据;
将清空之后的目标列中的字符集类型修改为预设字符集类型;
将更新至所述临时列中的数据迁移回所述目标列中。
7.一种数据处理装置,所述装置包括:
输出模块,用于响应于用户新建工作流的操作,输出工作流编辑界面;
第一建立模块,用于在所述工作流编辑界面中建立源数据表;所述源数据表中的数据来自第一数据库系统;
第二建立模块,用于在所述工作流编辑界面中新建对应于第二数据库系统的空数据表;
确定模块,用于确定所述源数据表和目标数据表的转换关系;
生成模块,用于响应于用户在所述工作流编辑界面中的触发操作,基于所述源数据表、所述空数据表和所述转换关系,生成目标工作流;
执行模块,用于执行所述目标工作流,将所述源数据表进行转换之后更新至所述空数据表中,得到所述目标数据表;
更新模块,用于对所述目标数据表进行以下更新,以在所述第二数据库系统中对更新之后的目标数据表进行处理:确定所述目标数据表中的目标列,将所述目标列中的数据对应的字符集类型更新成预设字符集类型,以及将所述目标数据表中指定数据的格式更新为目标格式。
8.根据权利要求7所述的装置,其中,所述第一建立模块被配置用于:
通过所述工作流编辑界面,在预先搭建的所述第一数据库系统的数据库环境下,新建源数据库,并在所述源数据库中建立源数据仓;
向所述源数据仓中导入所述第一数据库系统中的指定数据表作为所述源数据表,并向所述源数据仓中添加所述源数据表的表格视图;
其中,所述第二建立模块被配置用于:
通过所述工作流编辑界面,在预先搭建的所述第二数据库系统的数据库环境下,新建目标数据库,并在所述目标数据库中建立目标数据仓;
在所述目标数据仓中创建所述源数据表对应的空数据表,并向所述目标数据仓中添加所述空数据表的表格视图。
9.根据权利要求7所述的装置,其中,所述确定所述源数据表和目标数据表的转换关系,包括:
利用SQL查询语句确定所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系;
基于所述第一数据库系统和所述第二数据库系统中数据集、表格、列和主关键字之间的对应关系,确定所述源数据表和目标数据表的转换关系;
其中,所述确定所述目标数据表中的目标列,包括:将预设字段对应的列确定为所述目标数据表中的目标列。
10.根据权利要求7所述的装置,其中,所述将所述目标列中的数据对应的字符集类型更新成预设字符集类型,包括:
在所述目标数据表中新建临时列;
将所述目标列中的数据更新至所述临时列中,并清空所述目标列的数据;
将清空之后的目标列中的字符集类型修改为预设字符集类型;
将更新至所述临时列中的数据迁移回所述目标列中。
CN202310631546.6A 2023-05-31 2023-05-31 一种数据处理的方法及装置 Active CN116340411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310631546.6A CN116340411B (zh) 2023-05-31 2023-05-31 一种数据处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310631546.6A CN116340411B (zh) 2023-05-31 2023-05-31 一种数据处理的方法及装置

Publications (2)

Publication Number Publication Date
CN116340411A true CN116340411A (zh) 2023-06-27
CN116340411B CN116340411B (zh) 2024-02-27

Family

ID=86880865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310631546.6A Active CN116340411B (zh) 2023-05-31 2023-05-31 一种数据处理的方法及装置

Country Status (1)

Country Link
CN (1) CN116340411B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077215A2 (en) * 2003-01-30 2004-09-10 Vaman Technologies (R & D) Limited System and method for data migration and conversion
CN103440273A (zh) * 2013-08-06 2013-12-11 北京航空航天大学 一种数据跨平台迁移方法及装置
CN105844421A (zh) * 2016-03-30 2016-08-10 上海赞越软件服务中心 基于流程编辑器的流程表和流程图转换机制
US20190220548A1 (en) * 2018-01-17 2019-07-18 Actian Corporation Maintaining character set compatibility in database systems
CN110674083A (zh) * 2019-10-10 2020-01-10 深圳前海微众银行股份有限公司 工作流迁移方法、装置、设备及计算机可读存储介质
CN112749157A (zh) * 2019-10-30 2021-05-04 北京国双科技有限公司 数据表的处理方法、装置、存储介质和设备
CN113901031A (zh) * 2021-10-21 2022-01-07 掌阅科技股份有限公司 数据库迁移方法、电子设备及存储介质
CN115994127A (zh) * 2022-12-16 2023-04-21 浪潮通用软件有限公司 一种基于不同类型字符集的数据无损迁移方法及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077215A2 (en) * 2003-01-30 2004-09-10 Vaman Technologies (R & D) Limited System and method for data migration and conversion
CN103440273A (zh) * 2013-08-06 2013-12-11 北京航空航天大学 一种数据跨平台迁移方法及装置
CN105844421A (zh) * 2016-03-30 2016-08-10 上海赞越软件服务中心 基于流程编辑器的流程表和流程图转换机制
US20190220548A1 (en) * 2018-01-17 2019-07-18 Actian Corporation Maintaining character set compatibility in database systems
CN110674083A (zh) * 2019-10-10 2020-01-10 深圳前海微众银行股份有限公司 工作流迁移方法、装置、设备及计算机可读存储介质
CN112749157A (zh) * 2019-10-30 2021-05-04 北京国双科技有限公司 数据表的处理方法、装置、存储介质和设备
CN113901031A (zh) * 2021-10-21 2022-01-07 掌阅科技股份有限公司 数据库迁移方法、电子设备及存储介质
CN115994127A (zh) * 2022-12-16 2023-04-21 浪潮通用软件有限公司 一种基于不同类型字符集的数据无损迁移方法及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ROCHA, LEONARDO ET AL.: "A Framework for Migrating Relational Datasets to NoSQL", INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE, ICCS 2015 COMPUTATIONAL SCIENCE AT THE GATES OF NATURE, 1 June 2015 (2015-06-01), pages 2593 - 2602 *
沈凤仙;朱巧明;刘钊;刘辉;: "基于JDBC和XML的数据库系统迁移方法", 计算机工程与设计, no. 20, 28 October 2008 (2008-10-28), pages 5376 - 5382 *

Also Published As

Publication number Publication date
CN116340411B (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
CN110908997B (zh) 数据血缘构建方法、装置、服务器及可读存储介质
CN110032604B (zh) 数据存储装置、转译装置及数据库访问方法
CN109829011B (zh) 一种分布式异构数据库的数据同步方法及装置
US9229971B2 (en) Matching data based on numeric difference
CN112825069B (zh) 数据库数据的分析方法、设备、系统及存储介质
CN103577394B (zh) 一种基于双数组搜索树的机器翻译方法和装置
EP3617896A1 (en) Method and apparatus for intelligent response
CN114036119A (zh) 一种基于kettle和数据库日志的数据同步方法
CN112988601B (zh) 测试脚本开发方法及装置
US20070073675A1 (en) Database query translation
CN106777142A (zh) 基于移动互联网海量数据的服务层系统及其方法
US20170024447A1 (en) System, method, and apparatus for collaborative editing of common or related computer based software output
US7559048B1 (en) System and method for managing objects between projects
CN114398188A (zh) 模型管理方法、模型管理服务、客户端及存储介质
CN111125045B (zh) 一种轻量级etl处理平台
CN116340411B (zh) 一种数据处理的方法及装置
JP7346332B2 (ja) データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム
US7712088B2 (en) Method and system for a batch parser
CN112699118A (zh) 数据同步方法及相应的装置、系统、存储介质
WO2023164294A1 (en) Query splitter for an inverted index datastore
CN116069859A (zh) 数据库的增量数据同步方法、存储介质与计算机设备
CN106599244B (zh) 通用的原始日志清洗装置及方法
US11442758B2 (en) Integration flow execution renew
CN114676152A (zh) 一种工单管理方法、装置和电子设备
CN111782608B (zh) 文件自动生成方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant