CN110618996A - 一种应用于分布式数据库的函数库热更新方法 - Google Patents

一种应用于分布式数据库的函数库热更新方法 Download PDF

Info

Publication number
CN110618996A
CN110618996A CN201910723388.0A CN201910723388A CN110618996A CN 110618996 A CN110618996 A CN 110618996A CN 201910723388 A CN201910723388 A CN 201910723388A CN 110618996 A CN110618996 A CN 110618996A
Authority
CN
China
Prior art keywords
function
distributed database
zookeeper
configuration file
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910723388.0A
Other languages
English (en)
Other versions
CN110618996B (zh
Inventor
杨力
周伟
周群年
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BONC TECHNOLOGY Co Ltd
Original Assignee
BEIJING BONC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BONC TECHNOLOGY Co Ltd filed Critical BEIJING BONC TECHNOLOGY Co Ltd
Priority to CN201910723388.0A priority Critical patent/CN110618996B/zh
Publication of CN110618996A publication Critical patent/CN110618996A/zh
Application granted granted Critical
Publication of CN110618996B publication Critical patent/CN110618996B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明涉及一种应用于分布式数据库的函数库热更新方法,包括以下步骤:将动态库存放到hadoop分布式文件系统上;将所需信息写入配置文件中;将配置文件同步到指定的zookeeper配置监听目录;当所述指定的zookeeper配置监听目录下有修改,通知各节点;所述各节点接收到zookeeper的消息后,更新配置文件,同时重新加载配置文件,完成函数库的更新。本发明实现了应用于分布式数据库的可即插即用函数库技术,无需重新编译,无需重新启动,无需对每个节点冗余更新。

Description

一种应用于分布式数据库的函数库热更新方法
技术领域
本发明涉及分布式数据库技术领域,具体来说,涉及一种应用于分布式数据库的函数库热更新方法。
背景技术
数据库管理系统(英语:Database Management System,简称DBMS)是为管理数据库而设计的电脑软件系统,具有存储、截取、安全保障、备份等基础功能。一般通过SQL语句进行增加、修改、查询数据,而为了能够获取所需的数据或结果,在查询数据的过程中,使用不同功能函数对数据进行加工处理也是必不可少的。由于经常需要增加一些新的需求功能,故在数据库管理系统的设计中,函数库的设计应当具备高可扩展性。
现有函数库设计方式主要有以下两种:
1、将函数直接编译成静态库.a
这是最基本的实现方式,实现起来最为简单,但弊端也很明显,每次增加新函数,必须重新编译,生成可执行程序。
2、将函数编译成动态库.so
为了避免重新编译这一弊端,已有采用动态函数库的方式,这样新增一个功能函数时,不需要重新编译,只需重新加载配置文件(用于运行时读取函数的信息)。
现有的动态函数库这种方式,仍存在一些缺点:
缺点1:虽然解决了重新编译的问题,但对于分布式数据库来说,需要对各个节点进行更新配置文件、添加动态库的操作,这一操作是繁琐冗余的。
缺点2:采用一次读取配置文件,即配置文件在程序运行时只会被读取一次,这样就导致每次更新配置文件后,需要重启程序,无法实现热更新。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种应用于分布式数据库的函数库热更新方法,能够避免以上两个缺点,实现应用于分布式数据库的可即插即用函数库技术,无需重新编译,无需重新启动,无需对每个节点冗余更新。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种应用于分布式数据库的函数库热更新方法,其特征在于,包括以下步骤:
S1、将动态库存放到hadoop分布式文件系统上;
S2、将所需信息写入配置文件中;
S3、将配置文件同步到指定的zookeeper配置监听目录;
S4、当所述指定的zookeeper配置监听目录下有修改,通知各节点;
S5、所述各节点接收到zookeeper的消息后,更新配置文件,同时重新加载配置文件,完成函数库的更新。
进一步的,所述S1步骤中的动态库为在linux下使用编译指令将新增函数编译成的.so动态库。
进一步的,所述.so动态库存放在hadoop分布式文件系统上的任意位置。
进一步的,所述S2步骤中的所需信息包括函数的基本信息及动态库在hadoop分布式文件系统上的存放路径。
进一步的,所述S3步骤具体为:将配置文件保存到zookeeper的任一目录节点下,分布数据库的所有节点都对该目录节点进行监听。
进一步的,所述S4步骤具体为:当配置文件被更改时,zookeeper会通知分布数据库的各节点。
进一步的,所述S5步骤具体为:分布数据库的各节点接收zookeeper的消息后,获取最新的配置文件内容,同时重新加载配置文件中的函数信息,完成函数库的更新。
进一步的,还包括S6步骤:当函数调用时,从hadoop分布式文件系统上动态加载并调用。
进一步的,所述S6步骤具体为:当调用函数时,根据已加载的函数信息和.so动态库存放路径,从hadoop分布式文件系统上读取,然后动态加载函数库并调用相应函数。
本发明的有益效果:函数库支持多节点共享的基础上,在新增函数功能时,分布式数据库的所有节点不需要重新编译、重新启动,实时进行更新、应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例所述的一种应用于分布式数据库的函数库热更新方法的流程图。
图2是根据本发明实施例所述的设计概念图。
图3是根据本发明实施例所述的配置更新图。
其中,hdfs为hadoop分布式文件系统的缩写。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明实施例所述的一种应用于分布式数据库的函数库热更新方法,包括以下步骤:S1、函数实现编译成动态库;S2: 将动态库存放到hdfs;S3: 修改配置文件;S4: 将配置文件同步到指定的zookeeper配置监听目录;S5: 当指定的zookeeper配置监听目录下有修改,通知各节点;S6: 各节点接收到zookeeper的消息后,更新配置文件,同时重新加载配置文件;S7: 函数调用时,从hdfs上动态加载并调用。
在本优选实施例中,上述方法具体过程如下:
连接zookeeper:zk = new zookeeper(ip:port, time_out, 监听事件处理watcher)。
S1:在linux下,使用编译指令将新增函数编译成.so动态库。
S2:将该.so动态库存放到hdfs上的指定位置(随意):存放hadoop fs -put /{本地文件路径} /{目标文件路径}。
S3:将函数的基本信息及在hdfs上的存放路径写入配置文件中。
S4:将配置文件保存到zookeeper的某一目录节点(随意)下:创建目录zk.create(目录路径”/conf”,,初始数据”data0”)、修改配置zk.setData(目录路径”/conf”,待写入数据”data1”)。
分布数据库的所有节点都对该目录节点进行监听:监听配置zk.exist(目录路径”/conf”,是否监控true)。
S5:当配置文件被更改时,zookeeper会通知分布数据库的各节点。
S6:分布数据库的各节点接收zookeeper的消息后,获取最新的配置文件内容,同时重新加载配置文件中的函数信息。
在监听事件处理watcher中添加:获取数据zk.getData(目录路径“/conf”,是否监控false,null)。
S7:当调用函数时,根据已加载的函数信息和.so动态库存放路径,从hdfs上读取,然后动态加载函数库并调用相应函数。
为了方便理解本发明的上述技术方案,以下通过具体设计思路与原理上对本发明的上述技术方案进行详细说明。
在具体设计时,为弥补现有技术的不足,本发明提供一种应用于分布式数据库的函数库热更新方法,分布式数据库主要使用hdfs(Hadoop分布式文件系统)提供文件管理,使用zookeeper(一个分布式应用程序协调服务)提供配置管理、集群管理、分布式锁、队列管理。
分布数数据库启动的每个节点都会在zookeeper中注册一个临时目录用于集群管理(zookeeper原理);将动态函数库存放在hdfs上;将配置文件存放在zookeeper,分布式数据库的各个节点通过zookeeper进行配置管理,始终获取最新的配置文件,从配置文件中获取函数的描述信息以及其在hdfs上的存放路径,然后动态加载函数,进行调用。
从而增加新函数功能时,只需要添加动态函数库到hdfs上,更改配置文件,其分布式数据库的各节点实现实时更新、应用。
设计概念图如图2所示;配置更新图如图3所示。
以下为HDFS与Zookeeper的基本说明
HDFS:Hadoop分布式文件系统
HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。集群中的Datanode一般是一个节点一个,负责管理它所在节点上的存储。HDFS暴露了文件系统的名字空间,用户能够以文件的形式在上面存储数据。从内部看,一个文件其实被分成一个或多个数据块,这些块存储在一组Datanode上。Namenode执行文件系统的名字空间操作,比如打开、关闭、重命名文件或目录。它也负责确定数据块到具体Datanode节点的映射。Datanode负责处理文件系统客户端的读写请求。在Namenode的统一调度下进行数据块的创建、删除和复制。
Zookeeper文件系统:
每个子目录项如 NameService 都被称作为znode,和文件系统一样,我们能够自由的增加、删除znode,在一个znode下增加、删除子znode,唯一的不同在于znode是可以存储数据的。
最基本的有四种类型znode:
1、PERSISTENT-持久化目录节点
客户端与zookeeper断开连接后,该节点依旧存在。
2、PERSISTENT_SEQUENTIAL-持久化顺序编号目录节点
客户端与zookeeper断开连接后,该节点依旧存在,只是Zookeeper给该节点名称进行顺序编号。
3、EPHEMERAL-临时目录节点
客户端与zookeeper断开连接后,该节点被删除。
4、EPHEMERAL_SEQUENTIAL-临时顺序编号目录节点
客户端与zookeeper断开连接后,该节点被删除,只是Zookeeper给该节点名称进行顺序编号。
Zookeeper通知机制:
客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、被删除、子目录节点增加删除)时,zookeeper会通知客户端。
综上所述,本发明以函数库共享为基础,以函数配置信息文件实时热更新为核心,采用zookeeper为分布式应用提供配置管理,从而使数据库新增函数功能时,方便快捷。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种应用于分布式数据库的函数库热更新方法,其特征在于,包括以下步骤:
S1、将动态库存放到hadoop分布式文件系统上;
S2、将所需信息写入配置文件中;
S3、将配置文件同步到指定的zookeeper配置监听目录;
S4、当所述指定的zookeeper配置监听目录下有修改,通知各节点;
S5、所述各节点接收到zookeeper的消息后,更新配置文件,同时重新加载配置文件,完成函数库的更新。
2.根据权利要求1所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S1步骤中的动态库为在linux下使用编译指令将新增函数编译成的.so动态库。
3.根据权利要求2所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述.so动态库存放在hadoop分布式文件系统上的任意位置。
4.根据权利要求3所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S2步骤中的所需信息包括函数的基本信息及动态库在hadoop分布式文件系统上的存放路径。
5.根据权利要求4所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S3步骤具体为:将配置文件保存到zookeeper的任一目录节点下,分布数据库的所有节点都对该目录节点进行监听。
6.根据权利要求5所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S4步骤具体为:当配置文件被更改时,zookeeper会通知分布数据库的各节点。
7.根据权利要求6所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S5步骤具体为:分布数据库的各节点接收zookeeper的消息后,获取最新的配置文件内容,同时重新加载配置文件中的函数信息,完成函数库的更新。
8.根据权利要求7所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,还包括S6步骤:当函数调用时,从hadoop分布式文件系统上动态加载并调用。
9.根据权利要求8所述的一种应用于分布式数据库的函数库热更新方法,其特征在于,所述S6步骤具体为:当调用函数时,根据已加载的函数信息和.so动态库存放路径,从hadoop分布式文件系统上读取,然后动态加载函数库并调用相应函数。
CN201910723388.0A 2019-08-07 2019-08-07 一种应用于分布式数据库的函数库热更新方法 Active CN110618996B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910723388.0A CN110618996B (zh) 2019-08-07 2019-08-07 一种应用于分布式数据库的函数库热更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910723388.0A CN110618996B (zh) 2019-08-07 2019-08-07 一种应用于分布式数据库的函数库热更新方法

Publications (2)

Publication Number Publication Date
CN110618996A true CN110618996A (zh) 2019-12-27
CN110618996B CN110618996B (zh) 2023-08-22

Family

ID=68921598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910723388.0A Active CN110618996B (zh) 2019-08-07 2019-08-07 一种应用于分布式数据库的函数库热更新方法

Country Status (1)

Country Link
CN (1) CN110618996B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111736874A (zh) * 2020-06-28 2020-10-02 深圳前海微众银行股份有限公司 一种应用更新方法及装置
CN113296822A (zh) * 2021-05-27 2021-08-24 北京思特奇信息技术股份有限公司 一种基于动态库的数据库系统在线升级方法和系统
CN115563183A (zh) * 2022-09-22 2023-01-03 北京百度网讯科技有限公司 查询方法、装置及程序产品

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473287A (zh) * 2013-08-30 2013-12-25 中国科学院信息工程研究所 一种自动分发、运行和更新可执行程序的方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN105320527A (zh) * 2014-06-12 2016-02-10 中兴通讯股份有限公司 基于zookeeper分布式搜索引擎的配置文件更新方法、装置及系统
CN105703940A (zh) * 2015-12-10 2016-06-22 中国电力科学研究院 一种面向多级调度分布式并行计算的监控系统及监控方法
US20160321308A1 (en) * 2015-05-01 2016-11-03 Ebay Inc. Constructing a data adaptor in an enterprise server data ingestion environment
CN106126671A (zh) * 2016-06-27 2016-11-16 安徽科成信息科技有限公司 一种网络日志的更新方法
CN106155749A (zh) * 2016-07-28 2016-11-23 浪潮(北京)电子信息产业有限公司 一种监控插件扩展方法及装置
CN106603281A (zh) * 2016-12-07 2017-04-26 乐视控股(北京)有限公司 配置文件管理方法及系统
CN107835232A (zh) * 2017-10-19 2018-03-23 国云科技股份有限公司 一种分布式系统在线更新的方法
CN107908708A (zh) * 2017-11-09 2018-04-13 北京锐安科技有限公司 一种集群文件同步的方法、系统、设备和存储介质
US20190146884A1 (en) * 2017-11-15 2019-05-16 Zscaler, Inc. Systems and methods for service replication, validation, and recovery in cloud-based systems
CN109815248A (zh) * 2019-01-15 2019-05-28 科大国创软件股份有限公司 一种基于Zookeeper的分布式架构数据一致性方法
US20190171650A1 (en) * 2017-12-01 2019-06-06 Chavdar Botev System and method to improve data synchronization and integration of heterogeneous databases distributed across enterprise and cloud using bi-directional transactional bus of asynchronous change data system

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473287A (zh) * 2013-08-30 2013-12-25 中国科学院信息工程研究所 一种自动分发、运行和更新可执行程序的方法及系统
CN103716182A (zh) * 2013-12-12 2014-04-09 中国科学院信息工程研究所 一种面向实时云平台的故障检测与容错方法及系统
CN105320527A (zh) * 2014-06-12 2016-02-10 中兴通讯股份有限公司 基于zookeeper分布式搜索引擎的配置文件更新方法、装置及系统
US20160321308A1 (en) * 2015-05-01 2016-11-03 Ebay Inc. Constructing a data adaptor in an enterprise server data ingestion environment
CN105703940A (zh) * 2015-12-10 2016-06-22 中国电力科学研究院 一种面向多级调度分布式并行计算的监控系统及监控方法
CN106126671A (zh) * 2016-06-27 2016-11-16 安徽科成信息科技有限公司 一种网络日志的更新方法
CN106155749A (zh) * 2016-07-28 2016-11-23 浪潮(北京)电子信息产业有限公司 一种监控插件扩展方法及装置
CN106603281A (zh) * 2016-12-07 2017-04-26 乐视控股(北京)有限公司 配置文件管理方法及系统
CN107835232A (zh) * 2017-10-19 2018-03-23 国云科技股份有限公司 一种分布式系统在线更新的方法
CN107908708A (zh) * 2017-11-09 2018-04-13 北京锐安科技有限公司 一种集群文件同步的方法、系统、设备和存储介质
US20190146884A1 (en) * 2017-11-15 2019-05-16 Zscaler, Inc. Systems and methods for service replication, validation, and recovery in cloud-based systems
US20190171650A1 (en) * 2017-12-01 2019-06-06 Chavdar Botev System and method to improve data synchronization and integration of heterogeneous databases distributed across enterprise and cloud using bi-directional transactional bus of asynchronous change data system
CN109815248A (zh) * 2019-01-15 2019-05-28 科大国创软件股份有限公司 一种基于Zookeeper的分布式架构数据一致性方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖迎元 等: ""一种实时动态数据库故障恢复策略"", 《软件学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111736874A (zh) * 2020-06-28 2020-10-02 深圳前海微众银行股份有限公司 一种应用更新方法及装置
CN113296822A (zh) * 2021-05-27 2021-08-24 北京思特奇信息技术股份有限公司 一种基于动态库的数据库系统在线升级方法和系统
CN113296822B (zh) * 2021-05-27 2023-11-03 北京思特奇信息技术股份有限公司 一种基于动态库的数据库系统在线升级方法和系统
CN115563183A (zh) * 2022-09-22 2023-01-03 北京百度网讯科技有限公司 查询方法、装置及程序产品
CN115563183B (zh) * 2022-09-22 2024-04-09 北京百度网讯科技有限公司 查询方法、装置及程序产品

Also Published As

Publication number Publication date
CN110618996B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN111656340B (zh) 在数据库系统中的数据复制和数据故障转移
US7254578B2 (en) Concurrency classes for shared file systems
US10831720B2 (en) Cloud storage distributed file system
US7526479B2 (en) Configuration manager in enterprise computing system
US11562001B2 (en) Reliable hierarchical storage management with data synchronization
US10817498B2 (en) Distributed transactions in cloud storage with hierarchical namespace
KR20180021679A (ko) 일관된 데이터베이스 스냅샷들을 이용한 분산 데이터베이스에서의 백업 및 복원
CN110618996B (zh) 一种应用于分布式数据库的函数库热更新方法
JP6621470B2 (ja) 分散コンピューティング環境において実行可能コードの動的配置をサポートするシステムおよび方法
US8244682B2 (en) Saving snapshot of a knowledge base without blocking
US11599514B1 (en) Transactional version sets
GB2494867A (en) Scalable distributed transaction processing method
US11100129B1 (en) Providing a consistent view of associations between independently replicated data objects
US11709809B1 (en) Tree-based approach for transactionally consistent version sets
US10127270B1 (en) Transaction processing using a key-value store
CN105989049A (zh) 一种数据中间层实现方法及系统
CN114691307A (zh) 事务处理方法及计算机系统
Lev-Ari et al. Quick: a queuing system in cloudkit
Li et al. Serverless Data Pipelines
US11886422B1 (en) Transactional protocol for snapshot isolation without synchronized clocks
US20210248108A1 (en) Asynchronous data synchronization and reconciliation
Marques Oliveira et al. Distributed Caching at Cloud Scale with Apache Ignite for the C2MON Framework
Tao Thanh Ensuring availability and managing consistency in geo-replicated file systems
Timothy et al. Polyglot Persistence in Distributed Databases for Point in Time Recovery and Failure Handling in MySQL Replicated Environment
Camilleri et al. D-Thespis: A Distributed Actor-Based Causally Consistent DBMS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant