CN111367889A - 基于网页界面的跨集群数据迁移方法和装置 - Google Patents

基于网页界面的跨集群数据迁移方法和装置 Download PDF

Info

Publication number
CN111367889A
CN111367889A CN202010159783.3A CN202010159783A CN111367889A CN 111367889 A CN111367889 A CN 111367889A CN 202010159783 A CN202010159783 A CN 202010159783A CN 111367889 A CN111367889 A CN 111367889A
Authority
CN
China
Prior art keywords
data
data table
migration
target
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010159783.3A
Other languages
English (en)
Other versions
CN111367889B (zh
Inventor
张世瑛
赵吉昆
梁晔华
杨嘉欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010159783.3A priority Critical patent/CN111367889B/zh
Publication of CN111367889A publication Critical patent/CN111367889A/zh
Application granted granted Critical
Publication of CN111367889B publication Critical patent/CN111367889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种基于网页界面的跨集群数据迁移方法,包括:响应于用户请求,展示网页界面,网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框,响应于用户触发执行迁移按钮,从迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息,基于源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表,以及将源数据表中的数据迁移至目标数据表中,并在结果展示框中展示源数据表中的数据的迁移进度。

Description

基于网页界面的跨集群数据迁移方法和装置
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种基于网页界面的跨集群数据迁移方法、装置、计算机系统和计算机可读介质。
背景技术
随着网络时代的快速发展,大数据越来越多地应用于工作和生活等诸多场景,为了更好的存储大数据,各种各样的数据库应运而生。例如,Hbase数据库是一种高可靠性、高性能、面向列、可伸缩的分布式列式存储系统。利用Hbase技术可以在服务器上搭建大规模结构化的存储集群,由于Hbase技术在处理大数据问题上具有较大的优势,越来越多地企业机构选用Hbase数据库集群对数据进行存储和处理。
在实现本发明构思的过程中,发明人发现相关技术中至少存在如下问题:对于数据库的操作通常需要业务人员熟练掌握数据库的使用语句,对业务人员的技术背景要求过高,且操作不够便捷。
发明内容
有鉴于此,本公开提供了一种基于网页界面的跨集群数据迁移方法、装置、计算机系统和计算机可读介质。
本公开的一个方面提供了一种基于网页界面的跨集群数据迁移方法,包括:响应于用户请求,展示网页界面,所述网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框,响应于用户触发所述执行迁移按钮,从所述迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息,基于所述源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表,以及将所述源数据表中的数据迁移至所述目标数据表中,并在所述结果展示框中展示所述源数据表中的数据的迁移进度。
根据本公开的实施例,所述将所述源数据表中的数据迁移至所述目标数据表中,包括:从所述源数据表中读取数据并写入中间节点中,以及从所述中间节点中读取数据并写入目标数据表中。
根据本公开的实施例,所述从所述中间节点中读取数据并写入目标数据表中,包括:按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,以及将通过所述校验的数据写入所述目标数据表中。
根据本公开的实施例,所述将通过所述校验的数据写入所述目标数据表中,包括:将通过所述校验的数据存储在至少一个分组中,将所述至少一个分组中的数据写入所述目标数据表中。
根据本公开的实施例,通过多个校验线程中的每个校验线程并发执行:所述按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,将通过所述校验的数据存储在至少一个分组中的操作。
根据本公开的实施例,所述将所述至少一个分组中的数据写入所述目标数据表中,包括:通过至少一个入库线程将所述至少一个分组中的数据导入所述目标数据表的接口,通过所述接口将所述通过校验的数据写入所述目标数据表中。
根据本公开的实施例,其中,所述网页界面中还包括迁移秘钥输入框。所述方法还包括:对所述迁移秘钥输入框中的秘钥进行校验,在所述秘钥通过校验的情况下,将所述源数据表中的数据迁移至所述目标数据表中。
根据本公开的实施例,所述迁移进度包括以下至少一种:所述源数据表中的数据总行数,已完成迁移的数据行数,迁移失败的数据行数,已执行时长,或者剩余执行时长。
本公开的另一个方面提供了一种基于网页界面的跨集群数据迁移装置,该装置包括展示模块、获取模块、确定模块和迁移模块。其中,展示模块用于响应于用户请求,展示网页界面,所述网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框。获取模块用于响应于用户触发所述执行迁移按钮,从所述迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息。确定模块用于基于所述源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表。迁移模块用于将所述源数据表中的数据迁移至所述目标数据表中,并在所述结果展示框中展示所述源数据表中的数据的迁移进度。
根据本公开的实施例,所述将所述源数据表中的数据迁移至所述目标数据表中,包括:从所述源数据表中读取数据并写入中间节点中,以及从所述中间节点中读取数据并写入目标数据表中。
根据本公开的实施例,所述从所述中间节点中读取数据并写入目标数据表中,包括:按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,以及将通过所述校验的数据写入所述目标数据表中。
根据本公开的实施例,所述将通过所述校验的数据写入所述目标数据表中,包括:将通过所述校验的数据存储在至少一个分组中,将所述至少一个分组中的数据写入所述目标数据表中。
根据本公开的实施例,通过多个校验线程中的每个校验线程并发执行:所述按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,将通过所述校验的数据存储在至少一个分组中的操作。
根据本公开的实施例,所述将所述至少一个分组中的数据写入所述目标数据表中,包括:通过至少一个入库线程将所述至少一个分组中的数据导入所述目标数据表的接口,通过所述接口将所述通过校验的数据写入所述目标数据表中。
根据本公开的实施例,所述网页界面中还包括迁移秘钥输入框。所述装置还包括:校验模块,用于对所述迁移秘钥输入框中的秘钥进行校验。
根据本公开的实施例,所述迁移进度包括以下至少一种:所述源数据表中的数据总行数,已完成迁移的数据行数,迁移失败的数据行数,已执行时长,或者剩余执行时长。
本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器,存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的方法。
本公开的另一方面提供了一种计算机可读介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,可以至少部分地解决相关技术中对于数据库的操作需要业务人员熟练掌握数据库语句,对业务人员的技术背景要求过高,且操作不够便捷的问题,并因此可以实现提高数据库操作的便捷性,并且无技术背景的业务人员也可以独立完成对数据库的灵活操作,大大降低了数据库的使用门槛的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移方法和装置的应用场景;
图2示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移方法的流程图;
图3示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移装置的框图;以及
图4示意性示出了根据本公开实施例的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
本公开的实施例提供了一种基于网页界面的跨集群数据迁移方法,包括:响应于用户请求,展示网页界面,网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框,响应于用户触发执行迁移按钮,从迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息,基于源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表,以及将源数据表中的数据迁移至目标数据表中,并在结果展示框中展示源数据表中的数据的迁移进度。
图1示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移方法和装置的应用场景100。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103,网络104、服务器105、第一数据库集群106和第二数据库集群107。网络104可以是用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
第一数据库集群106中可以包括一个或者多个数据库。第一数据库集群106中可以存储有多个数据表。
第二数据库集群107中可以包括一个或者多个数据库。第二数据库集群107中可以存储有多个数据表。
根据本公开实施例,服务器105可以与第一数据库集群106和第二数据库集群107进行交互。
需要说明的是,本公开实施例所提供的基于网页界面的跨集群数据迁移方法一般可以由服务器105执行。相应地,本公开实施例所提供的基于网页界面的跨集群数据迁移装置一般可以设置于服务器105中。本公开实施例所提供的基于网页界面的跨集群数据迁移方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的基于网页界面的跨集群数据迁移装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
例如,用户可以通过终端设备101、102、103中的任意一个(例如,终端设备101,但不限于此)向服务器105发起请求,服务器105可以响应于用户请求,将网页界面发送给终端设备101,以供终端设备101展示该网页界面。服务器105还可以响应于用户通过终端设备101触发网页界面中的执行迁移按钮,从该网页界面中的迁移信息输入框中获取源数据库集群信息(例如,第一数据库集群106)、目标数据库集群信息(例如,第二数据库集群107)以及表名称信息,基于表名称信息在第一数据库集群106中确定源数据表,在第二数据库集群107中确定目标数据表,然后将第一数据库集群106中的源数据表中的数据迁移至第二数据库集群107的目标数据表中,并在该网页界面的结果展示框中展示迁移进度。因此,用户仅需要通过终端设备在相应的网页界面中输入信息以及触发执行迁移按钮,即可实现数据的跨集群迁移,并且能够在该网页界面中及时掌握迁移进度,操作便捷,且不需要用户熟练掌握数据库语句,降低门槛,提高工作效率。
应该理解,图1中的终端设备、网络、服务器和数据库集群的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、服务器和数据库集群。
图2示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移方法的流程图。
如图2所示,该方法包括操作S201~S204。
在操作S201,响应于用户请求,展示网页界面,该网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框。
根据本公开实施例,可以响应于用户请求,展示网页界面,网页界面可以方便用户操作,减少安装软件的繁琐程序。
在本公开实施例中,网页界面可以包括迁移信息输入框,该迁移信息输入框可以用于接收用户的输入信息。迁移信息输入框可以是选择下拉框或者也可以是文字输入框等。
例如,迁移信息输入框可以包括源环境选择下拉框,以供用户选择待迁移的数据所在的源数据库集群。
例如,迁移信息输入框还可以包括目标环境选择下拉框,以供用户选择待迁移的数据将要迁移到的目标数据库集群。
例如,迁移信息输入框还可以包括表名称输入框,以供用户输入待迁移数据所在的数据表的表名称信息。
在本公开一实施例中,若源数据库集群与目标数据库集群中的数据表相对应,则迁移信息输入框可以近包含一个表名称输入框。例如,用户输入表名称A,则源数据库集群中包含表名称为A的数据表,目标数据库集群中也包含表名称为A的数据表。
在本公开另一实施例中,表名称输入框也可以包含源数据表表名称输入框和目标数据表表名称输入框。用户可以在源数据表表名称输入框和目标数据表表名称输入框中输入相同或者不同的表名称。
可以理解,本公开不限制网页界面中迁移信息输入框的设置,本领域技术人员可以根据实际需求决定如何设置迁移信息输入框,以使通过迁移信息输入框中的信息可以确定待迁移数据的原始位置和目标位置,从而实现数据迁移。
根据本公开实施例,用户可以在迁移信息输入框中选择或者输入迁移信息,然后点击执行迁移按钮,以实现数据迁移。
在本公开实施例中,网页界面还可以包括结果展示框,结果展示框中可以展示数据的迁移进度。从而,用户通过在网页界面中输入简单的迁移信息,即可实现数据迁移,无需直面数据库,减少学习成本,并且网页界面中还展示数据的迁移进度,以使用户及时掌握情况。
在操作S202,响应于用户触发执行迁移按钮,从迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息。
根据本公开实施例,响应于用户触发执行迁移按钮,可以从网页界面中的源环境选择下拉框中获取源数据库集群信息,从网页界面中的目标环境选择下拉框中获取目标数据库集群信息,从网页界面中的表名称输入框中获得表名称信息。
在操作S203,基于源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表。
根据本公开实施例,在表名称信息包括一个表名称的情况下(例如,网页界面仅包含一个表名称输入框),可以根据源数据库集群信息和该表名称信息确定源数据表,根据目标数据库集群信息和该表名称信息确定目标数据表。例如,表名称信息为A,则源数据库集群中表名称为A的数据表为源数据表,目标数据库集群中表名称为A的数据表为目标数据表。
根据本公开实施例,在表名称信息包括一个表名称的情况下(例如,网页界面仅包含一个表名称输入框),可以根据源数据库集群信息和该表名称信息确定源数据表,将目标数据库集群信息中满足条件的数据表确定目标数据表,或者在目标数据库集群中创建新数据表作为目标数据表。例如,表名称信息为A,则源数据库集群中表名称为A的数据表为源数据表。目标数据表例如可以是目标数据库集群中默认的数据表,或者存储数据量小于阈值的数据表,或者与源数据表表结构相似的数据表等。
根据本公开实施例,表名称信息可以包括源数据表表名称信息和目标数据表表名称信息(例如,网页界面中包含源数据表表名称输入框和目标数据表表名称输入框),可以根据源数据库集群信息和源数据表表名称信息确定源数据表,根据目标数据库集群信息和目标数据表表名称信息确定目标数据表。例如,源数据表表名称信息为A,则源数据库集群中表名称为A的数据表为源数据表。目标数据表表名称信息为B,则目标数据库集群中表名称为B的数据表为目标数据表。
可以理解,本公开不限制迁移信息和迁移数据的粒度。例如,如果从迁移信息输入框中仅获取到源数据库集群信息和目标数据库集群信息,可以将源数据库集群中的所有数据迁移到目标数据库集群中。又例如,如果从迁移信息输入框中获取到源数据库集群信息、目标数据库集群信息、表名称信息,可以将源数据表中的所有数据迁移到目标数据库集群中。再例如,如果从迁移信息输入框中获取到源数据库集群信息、目标数据库集群信息、表名称信息和主键信息,可以将源数据表中的与该主键信息相关的数据迁移到目标数据库集群中。本公开对此不做限定,本领域技术人员可以根据实际情况设置网页界面中的迁移信息输入框的内容,根据迁移信息输入框中的内容确定待迁移的数据以及迁移的目的地。
在操作S204,将源数据表中的数据迁移至目标数据表中,并在结果展示框中展示源数据表中的数据的迁移进度。
根据本公开实施例,将源数据表中的数据迁移至目标数据表中可以包括:从源数据表中读取数据并写入中间节点中,以及从中间节点中读取数据并写入目标数据表中。本公开实施例先将待迁移的数据导入到中间节点,可以不占用源数据库集群的资源,源数据库集群可以继续处理其他业务。
在本公开实施例中,从源数据表中读取数据并写入中间节点中也可以通过“实例化一个ResultScanner对象,创建配置实例,实例化一个get对象,设置缓存大小,提交scan请求,并输出结果至中间节点,然后关闭scanner对象,关闭Htable对象”来实现。
根据本公开实施例,从中间节点中读取数据并写入目标数据表中,包括:按行读取中间节点中的数据,基于目标数据表的表结构对读取的每行数据进行校验,以及将通过校验的数据写入目标数据表中。
在本公开实施例中,可以调用getTableDescriptor方法获取目标数据表的表结构,例如,目标数据表的字段和字段类型。将从中间节点中读取出来的每一行数据与目标数据表的表结构进行校验,例如,该行数据是否符合目标数据表的字段类型,字段长度等。
根据本公开实施例,校验通过的数据行可以写入到目标数据表中,校验未通过的数据行无法写入到目标数据表中。因此,可以将校验未通过的数据行写入到丢弃文件中,以便后续处理。
在本公开实施例中,可以将校验通过的数据行依次写入到目标数据表中。也可以先将通过校验的数据存储在至少一个分组中,然后将至少一个分组中的数据写入目标数据表中,从而可以先在至少一个分组中聚齐所有通过校验的数据,以便后续目标数据表的接口可以批量写入。
根据本公开实施例,为了加快处理速度,可以采用多线程并发处理的方法。通过多个校验线程中的每个校验线程并发执行:按行读取中间节点中的数据,基于目标数据表的表结构对读取的每行数据进行校验,将通过校验的数据存储在至少一个分组中的操作。
在本公开实施例中,可以包括一个分组或者多个分组。在包含多个分组的情况下,可以将具有相同主键的数据存储在同一分组中。
根据本公开实施例,可以通过至少一个入库线程将至少一个分组中的数据导入目标数据表的接口,然后通过接口将通过校验的数据写入目标数据表中。
在本公开实施例中,为了加快处理速度,可以设置多个分组,并为每个分组配置一个入库线程,多个入库线程可以并发执行将其对应的分组中的数据导入目标数据表的接口的操作。例如,入库线程可以分批从分组队列中获取数据(例如,1000条),若本次完整地拿到1000条,则在完成之后立即执行下一轮,若未拿到完整1000条,则将本批次处理完成后睡100(仅为示例)毫秒再拿。
根据本公开实施例,可以通过SDK提供的批量接口将数据写入目标数据库。因此,多个入库线程可以并发执行将其对应的分组中的数据导入到SDK提供的批量接口的操作,以便该接口将所有校验通过的数据批量写入目标数据库。本公开实施例可以在SDK中增加一个参数或接口,表示不需要对这些数据进行并发控制,以提高批量数据导入时的性能。
根据本公开实施例,可以在结果展示框中实时展示数据的迁移进度,也可以每隔预设时间更新一次当前的迁移进度。例如,每隔10秒在结果展示框中展示当前的迁移进度。
在本公开实施例中,迁移进度包括以下至少一种:源数据表中的数据总行数,已完成迁移的数据行数,迁移失败的数据行数,已执行时长,或者剩余执行时长。
在本公开实施例中,网页界面中还可以包括迁移秘钥输入框。可以理解,为了保护数据库集群的安全性,在数据迁移之前,用户可以先获得迁移秘钥,并在迁移秘钥输入框中输入该秘钥。本公开实施例可以对迁移秘钥输入框中的秘钥进行校验,校验成功则允许此次迁移操作,否则禁止此次迁移操作。
在本公开实施例中,为了数据格式统一,可以将待迁移的数据转换为dataobject格式。
本公开实施例可以向用户展示网页界面,用户可以在网页界面的迁移信息输入框的引导下输入源数据库集群、目标数据库集群的信息和表名称信息,然后点击网页界面中的执行迁移按钮,即可实现数据的跨集群迁移,并且能在当前界面及时掌握迁移进度,操作方便,可以为用户提供良好的体验感,避免了用户直面数据库操作,用户不必掌握数据库的操作语言,从而降低了数据库的使用门槛,提高了工作效率。
本公开实施例先将源数据表中的数据导入到中间节点,可以不占用源数据库集群的资源,源数据库集群可以继续处理其他业务。
本公开实施例对每一行待迁移的数据进行校验,剔除不符合目标数据表的表结构的数据,避免该些数据由于格式结构不符合在写入目标数据表的过程中重复报错,耽误进度。
本公开实施例将通过校验的数据先存放在分组中,等待全部数据或者部分数据校验完成后,统一导入到SDK接口,批量写入目标数据库,可以提高处理速度,避免了通过检验的数据分别写入导致的多次调用写入命令造成的处理速度慢的问题。
本公开实施例通过多个校验线程并发执行“按行读取中间节点中的数据,基于目标数据表的表结构对读取的每行数据进行校验,将通过校验的数据存储在至少一个分组中”的操作,和通过多个入库线程并发执行“将多个分组中的数据导入目标数据表的接口”的操作,可以快处理速度。
图3示意性示出了根据本公开实施例的基于网页界面的跨集群数据迁移装置300的框图。
如图3所示,该装置300包括展示模块310、获取模块320、确定模块330和迁移模块340。
展示模块310用于响应于用户请求,展示网页界面。该网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框。根据本公开实施例,展示模块310例如可以执行上文参考图2描述的操作S201,在此不再赘述。
获取模块320用于响应于用户触发执行迁移按钮,从迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息。根据本公开实施例,获取模块320例如可以执行上文参考图2描述的操作S202,在此不再赘述。
确定模块330用于基于源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表。根据本公开实施例,确定模块330例如可以执行上文参考图2描述的操作S203,在此不再赘述。
迁移模块340用于将源数据表中的数据迁移至目标数据表中,并在结果展示框中展示源数据表中的数据的迁移进度。根据本公开实施例,迁移模块340例如可以执行上文参考图2描述的操作S204,在此不再赘述。
根据本公开实施例,所述将所述源数据表中的数据迁移至所述目标数据表中,可以包括:从所述源数据表中读取数据并写入中间节点中,以及从所述中间节点中读取数据并写入目标数据表中。
根据本公开实施例,所述从所述中间节点中读取数据并写入目标数据表中,可以包括:按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,以及将通过所述校验的数据写入所述目标数据表中。
根据本公开实施例,所述将通过所述校验的数据写入所述目标数据表中,可以包括:将通过所述校验的数据存储在至少一个分组中,以及将所述至少一个分组中的数据写入所述目标数据表中。
根据本公开实施例,通过多个校验线程中的每个校验线程并发执行:所述按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,将通过所述校验的数据存储在至少一个分组中的操作。
根据本公开实施例,所述将所述至少一个分组中的数据写入所述目标数据表中,可以包括:通过至少一个入库线程将所述至少一个分组中的数据导入所述目标数据表的接口,通过所述接口将所述通过校验的数据写入所述目标数据表中。
根据本公开实施例,所述网页界面中还包括迁移秘钥输入框。所述装置300还可以包括:校验模块,用于对所述迁移秘钥输入框中的秘钥进行校验。
根据本公开实施例,所述迁移进度包括以下至少一种:所述源数据表中的数据总行数,已完成迁移的数据行数,迁移失败的数据行数,已执行时长,或者剩余执行时长。
本公开实施例可以向用户展示网页界面,用户可以在网页界面的迁移信息输入框的引导下输入源数据库集群、目标数据库集群的信息和表名称信息,然后点击网页界面中的执行迁移按钮,即可实现数据的跨集群迁移,并且能在当前界面及时掌握迁移进度,操作方便,可以为用户提供良好的体验感,避免了用户直面数据库操作,用户不必掌握数据库的操作语言,从而降低了数据库的使用门槛,提高了工作效率。
本公开实施例先将源数据表中的数据导入到中间节点,可以不占用源数据库集群的资源,源数据库集群可以继续处理其他业务。
本公开实施例对每一行待迁移的数据进行校验,剔除不符合目标数据表的表结构的数据,避免该些数据由于格式结构不符合在写入目标数据表的过程中重复报错,耽误进度。
本公开实施例将通过校验的数据先存放在分组中,等待全部数据或者部分数据校验完成后,统一导入到SDK接口,批量写入目标数据库,可以提高处理速度,避免了通过检验的数据分别写入导致的多次调用写入命令造成的处理速度慢的问题。
本公开实施例通过多个校验线程并发执行“按行读取中间节点中的数据,基于目标数据表的表结构对读取的每行数据进行校验,将通过校验的数据存储在至少一个分组中”的操作,和通过多个入库线程并发执行“将多个分组中的数据导入目标数据表的接口”的操作,可以快处理速度。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,展示模块310、获取模块320、确定模块330和迁移模块340中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,展示模块310、获取模块320、确定模块330和迁移模块340中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,展示模块310、获取模块320、确定模块330和迁移模块340中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图4示意性示出了根据本公开实施例的计算机系统的方框图。图4示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,根据本公开实施例的计算机系统400包括处理器401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。处理器401例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器401还可以包括用于缓存用途的板载存储器。处理器401可以包括用于执行参考图2描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 403中,存储有系统400操作所需的各种程序和数据。处理器401、ROM 402以及RAM 403通过总线404彼此相连。处理器401通过执行ROM 402和/或RAM 403中的程序来执行以上参考图2描述的各种操作。需要注意,所述程序也可以存储在除ROM 402和RAM 403以外的一个或多个存储器中。处理器401也可以通过执行存储在所述一个或多个存储器中的程序来执行以上如上所述的方法。
根据本公开的实施例,系统400还可以包括输入/输出(I/O)接口405,输入/输出(I/O)接口405也连接至总线404。系统400还可以包括连接至I/O接口405的以下部件中的一项或多项:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被处理器401执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读介质可以包括上文描述的ROM 402和/或RAM 403和/或ROM 402和RAM 403以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行:响应于用户请求,展示网页界面,所述网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框;响应于用户触发所述执行迁移按钮,从所述迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息;基于所述源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表;以及将所述源数据表中的数据迁移至所述目标数据表中,并在所述结果展示框中展示所述源数据表中的数据的迁移进度。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (18)

1.一种基于网页界面的跨集群数据迁移方法,包括:
响应于用户请求,展示网页界面,所述网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框;
响应于用户触发所述执行迁移按钮,从所述迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息;
基于所述源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表;以及
将所述源数据表中的数据迁移至所述目标数据表中,并在所述结果展示框中展示所述源数据表中的数据的迁移进度。
2.根据权利要求1所述的方法,其中,所述将所述源数据表中的数据迁移至所述目标数据表中,包括:
从所述源数据表中读取数据并写入中间节点中;以及
从所述中间节点中读取数据并写入目标数据表中。
3.根据权利要求2所述的方法,其中,所述从所述中间节点中读取数据并写入目标数据表中,包括:
按行读取所述中间节点中的数据;
基于所述目标数据表的表结构对读取的每行数据进行校验;以及
将通过所述校验的数据写入所述目标数据表中。
4.根据权利要求3所述的方法,其中,所述将通过所述校验的数据写入所述目标数据表中,包括:
将通过所述校验的数据存储在至少一个分组中;
将所述至少一个分组中的数据写入所述目标数据表中。
5.根据权利要求4所述的方法,其中,通过多个校验线程中的每个校验线程并发执行:
所述按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,将通过所述校验的数据存储在至少一个分组中的操作。
6.根据权利要求4所述的方法,其中,所述将所述至少一个分组中的数据写入所述目标数据表中,包括:
通过至少一个入库线程将所述至少一个分组中的数据导入所述目标数据表的接口;
通过所述接口将所述通过校验的数据写入所述目标数据表中。
7.根据权利要求1所述的方法,其中,
所述网页界面中还包括迁移秘钥输入框;
所述方法还包括:对所述迁移秘钥输入框中的秘钥进行校验,在所述秘钥通过校验的情况下,将所述源数据表中的数据迁移至所述目标数据表中。
8.根据权利要求1所述的方法,其中,所述迁移进度包括以下至少一种:
所述源数据表中的数据总行数;
已完成迁移的数据行数;
迁移失败的数据行数;
已执行时长;或者
剩余执行时长。
9.一种基于网页界面的跨集群数据迁移装置,包括:
展示模块,用于响应于用户请求,展示网页界面,所述网页界面中包括迁移信息输入框、执行迁移按钮和结果展示框;
获取模块,用于响应于用户触发所述执行迁移按钮,从所述迁移信息输入框中获取源数据库集群信息、目标数据库集群信息以及表名称信息;
确定模块,用于基于所述源数据库集群信息、目标数据库集群信息以及表名称信息,确定源数据表和目标数据表;以及
迁移模块,用于将所述源数据表中的数据迁移至所述目标数据表中,并在所述结果展示框中展示所述源数据表中的数据的迁移进度。
10.根据权利要求9所述的装置,其中,所述将所述源数据表中的数据迁移至所述目标数据表中,包括:
从所述源数据表中读取数据并写入中间节点中;以及
从所述中间节点中读取数据并写入目标数据表中。
11.根据权利要求10所述的装置,其中,所述从所述中间节点中读取数据并写入目标数据表中,包括:
按行读取所述中间节点中的数据;
基于所述目标数据表的表结构对读取的每行数据进行校验;以及
将通过所述校验的数据写入所述目标数据表中。
12.根据权利要求11所述的装置,其中,所述将通过所述校验的数据写入所述目标数据表中,包括:
将通过所述校验的数据存储在至少一个分组中;
将所述至少一个分组中的数据写入所述目标数据表中。
13.根据权利要求12所述的装置,其中,通过多个校验线程中的每个校验线程并发执行:
所述按行读取所述中间节点中的数据,基于所述目标数据表的表结构对读取的每行数据进行校验,将通过所述校验的数据存储在至少一个分组中的操作。
14.根据权利要求12所述的装置,其中,所述将所述至少一个分组中的数据写入所述目标数据表中,包括:
通过至少一个入库线程将所述至少一个分组中的数据导入所述目标数据表的接口;
通过所述接口将所述通过校验的数据写入所述目标数据表中。
15.根据权利要求9所述的装置,其中,
所述网页界面中还包括迁移秘钥输入框;
所述装置还包括:校验模块,用于对所述迁移秘钥输入框中的秘钥进行校验。
16.根据权利要求9所述的装置,其中,所述迁移进度包括以下至少一种:
所述源数据表中的数据总行数;
已完成迁移的数据行数;
迁移失败的数据行数;
已执行时长;或者
剩余执行时长。
17.一种计算机系统,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~8中任一项所述的方法。
18.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。
CN202010159783.3A 2020-03-09 2020-03-09 基于网页界面的跨集群数据迁移方法和装置 Active CN111367889B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010159783.3A CN111367889B (zh) 2020-03-09 2020-03-09 基于网页界面的跨集群数据迁移方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010159783.3A CN111367889B (zh) 2020-03-09 2020-03-09 基于网页界面的跨集群数据迁移方法和装置

Publications (2)

Publication Number Publication Date
CN111367889A true CN111367889A (zh) 2020-07-03
CN111367889B CN111367889B (zh) 2023-08-04

Family

ID=71209709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010159783.3A Active CN111367889B (zh) 2020-03-09 2020-03-09 基于网页界面的跨集群数据迁移方法和装置

Country Status (1)

Country Link
CN (1) CN111367889B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000292A (zh) * 2020-08-21 2020-11-27 北京金山云网络技术有限公司 数据迁移的方法、装置、电子设备和计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN109783472A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 表数据的迁移方法、装置、计算机设备和存储介质
CN110297813A (zh) * 2019-05-22 2019-10-01 平安银行股份有限公司 数据迁移方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239493A (zh) * 2014-09-09 2014-12-24 北京京东尚科信息技术有限公司 跨集群数据迁移方法和系统
CN109783472A (zh) * 2018-12-14 2019-05-21 深圳壹账通智能科技有限公司 表数据的迁移方法、装置、计算机设备和存储介质
CN110297813A (zh) * 2019-05-22 2019-10-01 平安银行股份有限公司 数据迁移方法、装置、计算机设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000292A (zh) * 2020-08-21 2020-11-27 北京金山云网络技术有限公司 数据迁移的方法、装置、电子设备和计算机存储介质

Also Published As

Publication number Publication date
CN111367889B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
US11119812B2 (en) Method and device for processing application program page according to a common interface container
US11216587B2 (en) Log tokenization in an integration platform
CN109697055B (zh) 生成移动App页面的方法及系统
CN113946425A (zh) 业务处理方法及装置、电子设备和计算机可读存储介质
CN112395027B (zh) 微件界面生成方法、装置、存储介质与电子设备
CN109656799B (zh) 测试方法和装置
CN111045653B (zh) 系统生成方法、装置、计算机可读介质及电子设备
CN111125107A (zh) 数据处理方法、装置、电子设备和介质
US10235223B2 (en) High-performance computing framework for cloud computing environments
CN112347169A (zh) 基于php框架的用户请求处理方法、装置及电子设备
CN113553123B (zh) 数据处理方法、装置、电子设备及存储介质
CN112965916A (zh) 页面测试方法、页面测试装置、电子设备及可读存储介质
CN111367889B (zh) 基于网页界面的跨集群数据迁移方法和装置
CN110795331A (zh) 软件测试的方法和装置
JP2022542203A (ja) ミニプログラムのバッチ処理方法、装置、電子機器及び可読記憶媒体
US20210141845A1 (en) Page content ranking and display
CN110888583B (zh) 页面显示方法、系统、装置和电子设备
CN113656041A (zh) 数据处理方法、装置、设备及存储介质
CN111881025B (zh) 一种自动化测试任务调度方法、装置及系统
US10691418B1 (en) Process modeling on small resource constraint devices
CN113064987A (zh) 数据处理方法、装置、电子设备、介质和程序产品
CN113377376A (zh) 数据包生成方法、数据包生成装置、电子设备及存储介质
CN112131095A (zh) 压力测试方法和装置
US20230419047A1 (en) Dynamic meeting attendee introduction generation and presentation
US10664378B2 (en) Visualizing a user-centric stack frame graph

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant