CN108874950A - 一种基于er关系的数据分布存储方法及装置 - Google Patents

一种基于er关系的数据分布存储方法及装置 Download PDF

Info

Publication number
CN108874950A
CN108874950A CN201810569439.4A CN201810569439A CN108874950A CN 108874950 A CN108874950 A CN 108874950A CN 201810569439 A CN201810569439 A CN 201810569439A CN 108874950 A CN108874950 A CN 108874950A
Authority
CN
China
Prior art keywords
data
tables
library
key
major key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810569439.4A
Other languages
English (en)
Other versions
CN108874950B (zh
Inventor
孙德东
喻晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN201810569439.4A priority Critical patent/CN108874950B/zh
Publication of CN108874950A publication Critical patent/CN108874950A/zh
Application granted granted Critical
Publication of CN108874950B publication Critical patent/CN108874950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于ER关系的数据分布存储方法及装置,通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,进而根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。满足具有ER关系的表之间任意复杂度的关联查询,避免数据查询的跨库操作,提高了关联查询的效率。

Description

一种基于ER关系的数据分布存储方法及装置
技术领域
本发明涉及分布式存储技术领域,更具体的,涉及一种基于ER关系的数据分布存储方法及装置。
背景技术
在分布式环境下的海量数据处理过程中,通常采用分库分表存储技术将数据库按照业务拆分规则分到不同的数据库服务器上,对于存在强关联关系的表单,即使子表与父表拆分规则类似,仍需重新按照拆分规则进行一次拆分分配到不同的表、不同的数据库上。
现有方案在执行了分库分表之后,将原本逻辑关联性很强的数据划分到不同的表、不同的库上,经常会出现对分布式环境下跨库且跨分片存储的任意多个表的数据进行联合查询。如在日志数据库log_db有一份记录表Order,里面有用户信息ID;而关联表的详细信息在Orader_detail,里面有用户ID以及用户的详细信息表如用户名(username)、登录时间(log_time)、注册时间(reg_time)、会员等级等等。如果只是按用户名查找充值记录,那可以很简单地分两次查询即可。但是更复杂的需求,比如按注册时间排序,按会员等级统计等等,稍微复杂一点的功能,分次查询就相当难以做到了。如果在同一个库里,我们可以很方便的使用join关键字实现这些功能,但是在不同的数据库里,并没有跨库查询的SQLJOIN语句,要分俩次查询之后,通过表复制同步等手段进行二次加工才可实现,增加了查询的难度。
发明内容
有鉴于此,本发明提供了一种基于ER关系的数据分布存储方法及装置,满足ER关系的数据表之间任意复杂度的关联查询,提升了关联查询的效率。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种基于ER关系的数据分布存储方法,包括:
通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键;
根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
优选的,在所述通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库之前,所述方法还包括:
创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库。
优选的,在所述创建数据库配置文件之前,所述方法还包括:
创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键。
优选的,所述方法还包括:
当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句,并根据所述联合查询语句在同一数据库进行查询,
一种基于ER关系的数据分布存储装置,包括:
获取单元,用于通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
确定单元,用于根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键;
存储单元,用于根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
优选的,所述装置还包括:
第一创建单元,用于创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库。
优选的,所述装置还包括:
第二创建单元,用于创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键。
优选的,所述装置还包括:
查询单元,用于当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句,并根据所述联合查询语句在同一数据库进行查询,得到所述待查询字段的值。
相对于现有技术,本发明的有益效果如下:
本发明公开的一种基于ER关系的数据分布存储方法及装置,通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,进而根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。满足具有ER关系的表之间任意复杂度的关联查询,避免数据查询的跨库操作,提高了关联查询的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种基于ER关系的数据分布存储方法流程图;
图2为本发明实施例公开的另一种基于ER关系的数据分布存储方法流程图;
图3为本发明实施例公开的又一种基于ER关系的数据分布存储方法流程图;
图4为本发明实施例公开的一种基于ER关系的数据分布存储装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明公开了一种基于ER关系的数据分布存储方法,具体包括以下步骤:
S101:通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
需要说明的是,多个主键值对应的数据可能存储在同一个数据库中。
S102:根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键;
S103:根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
当需要存储第二数据表的数据时,首先,获取待存储数据的外键值,再根据待存储数据的外键值得到第一数据表中的主键值,通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库,确定待存储数据存储的数据库。
以第一数据表为Order,第二数据表为Order_detail为例,Order中包括两个字段ID和字段username,其中,ID为Order的主键,数据库配置文件中定义字段ID值为1~100的数据存储在数据库A中,字段ID值为101~200的数据存储在数据库B中;Order_detail中包括字段:ID、Order_ID和address,其中,Order_ID为外键。则Order_detail中字段Order_ID值为1~100的数据存储在数据库A中,字段Order_ID值为101~200的数据存储在数据库B中。
本实施例公开的一种基于ER关系的数据分布存储方法,通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,进而根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。满足具有ER关系的表之间任意复杂度的关联查询,避免数据查询的跨库操作,提高了关联查询的效率。
请参阅图2,本实施例公开了另一种基于ER关系的数据分布存储方法,具体包括以下步骤:
S201:创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键;
S202:创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库;
S203:通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
S204:根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键。
S205:根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
本实施例公开的基于ER关系的数据分布存储方法,在建立数据表时定义数据表之间的主外键关系,便于后续根据主外键关系进行分布存储。同时,创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库,以配置文件的形式定义主表,即第一数据表分布存储规则,即每个主键值对应数据的存储数据库。便于后续在第二数据表中插入数据时,确定插入数据的存储位置。
请参阅图3,本实施例公开了另一种基于ER关系的数据分布存储方法,具体包括以下步骤:
S301:通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
S302:根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键。
S303:根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中;
S304:当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句;
所述查询请求中的字段值为查询条件,例如,查询ID为5的用户的家庭地址,其中,5为字段ID的值,家庭地址为待查询字段。
S305:根据所述联合查询语句在同一数据库进行查询,得到所述待查询字段的值。
可以理解的是,由于使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,因此,查询不需要跨库进行。
以第一数据表为Order,第二数据表为Order_detail为例,Order中包括两个字段ID和字段username,其中,ID为Order的主键;Order_detail中包括字段:ID、Order_ID和address,其中,Order_ID为外键。当查询请求中的字段值为ID=1,待查询字段为address时,生成联合查询语句:Select address fromOrder_detail where ID=1。根据该联合查询语句在同一数据库进行查询,得到待查询字段address的值。避免了跨库操作导致的内存中的过多计算,简化了多数据关联查询的复杂度。
基于上述实施例公开的一种基于ER关系的数据分布存储方法,请参阅图4,本实施例对应公开了一种基于ER关系的数据分布存储装置,具体包括:
获取单元401,用于通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
确定单元402,用于根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键。
存储单元403,用于根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
优选的,所述装置还包括:
第一创建单元,用于创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库。
优选的,所述装置还包括:
第二创建单元,用于创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键。
优选的,所述装置还包括:
查询单元,用于当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句,并根据所述联合查询语句在同一数据库进行查询,得到所述待查询字段的值。
本实施例公开的一种基于ER关系的数据分布存储装置,通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,进而根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。满足具有ER关系的表之间任意复杂度的关联查询,避免数据查询的跨库操作,提高了关联查询的效率。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种基于ER关系的数据分布存储方法,其特征在于,包括:
通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键;
根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
2.根据权利要求1所述的方法,其特征在于,在所述通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库之前,所述方法还包括:
创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库。
3.根据权利要求2所述的方法,其特征在于,在所述创建数据库配置文件之前,所述方法还包括:
创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句;
根据所述联合查询语句在同一数据库进行查询,得到所述待查询字段的值。
5.一种基于ER关系的数据分布存储装置,其特征在于,包括:
获取单元,用于通过调用数据库配置文件,获取第一数据表中每个主键值对应数据的存储数据库;
确定单元,用于根据所述第一数据表中每个主键值对应数据的存储数据库,确定第二数据表中每个外键值对应数据的存储数据库,使同一数据库中存储的所述第二数据表中的外键值与存储的所述第一数据表中的主键值相同,所述第一数据表的主键为所述第二数据表的外键;
存储单元,用于根据第二数据表中每个外键值对应数据的存储数据库,将第二数据表中具有相同外键值的数据存储在同一数据库中。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一创建单元,用于创建数据库配置文件,所述数据库配置文件中定义了所述第一数据表中每个主键值对应数据的存储数据库。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二创建单元,用于创建第一数据表和第二数据表,所述第一数据表的主键为所述第二数据表的外键。
8.根据权利要求5所述的装置,其特征在于,所述装置还包括:
查询单元,用于当接收到查询请求时,根据所述查询请求中的字段值和待查询字段,生成联合查询语句,并根据所述联合查询语句在同一数据库进行查询,得到所述待查询字段的值。
CN201810569439.4A 2018-06-05 2018-06-05 一种基于er关系的数据分布存储方法及装置 Active CN108874950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810569439.4A CN108874950B (zh) 2018-06-05 2018-06-05 一种基于er关系的数据分布存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810569439.4A CN108874950B (zh) 2018-06-05 2018-06-05 一种基于er关系的数据分布存储方法及装置

Publications (2)

Publication Number Publication Date
CN108874950A true CN108874950A (zh) 2018-11-23
CN108874950B CN108874950B (zh) 2022-04-12

Family

ID=64336504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810569439.4A Active CN108874950B (zh) 2018-06-05 2018-06-05 一种基于er关系的数据分布存储方法及装置

Country Status (1)

Country Link
CN (1) CN108874950B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112799872A (zh) * 2021-02-19 2021-05-14 上海交通大学 一种基于键值对存储系统的纠删码编码方法及装置
CN112947207A (zh) * 2021-02-26 2021-06-11 王继凡 一种基于物联网的地热源节能方法及系统
CN113535857A (zh) * 2021-08-04 2021-10-22 阿波罗智联(北京)科技有限公司 数据同步方法及装置
CN113722293A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于人工智能的防火墙维护方法、装置、电子设备及介质
CN117690562A (zh) * 2023-12-11 2024-03-12 银川宜善互联网医院有限公司 一种医疗档案管理方法、系统、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376025A (zh) * 2013-08-16 2015-02-25 华为技术有限公司 分布式数据库的数据存储方法和装置
CN104871153A (zh) * 2012-10-29 2015-08-26 华为技术有限公司 用于灵活的分布式大规模并行处理(mpp)数据库的系统和方法
US20180075077A1 (en) * 2015-05-31 2018-03-15 Huawei Technologies Co., Ltd. Method and Device for Partitioning Association Table in Distributed Database

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871153A (zh) * 2012-10-29 2015-08-26 华为技术有限公司 用于灵活的分布式大规模并行处理(mpp)数据库的系统和方法
CN104376025A (zh) * 2013-08-16 2015-02-25 华为技术有限公司 分布式数据库的数据存储方法和装置
US20180075077A1 (en) * 2015-05-31 2018-03-15 Huawei Technologies Co., Ltd. Method and Device for Partitioning Association Table in Distributed Database

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112799872A (zh) * 2021-02-19 2021-05-14 上海交通大学 一种基于键值对存储系统的纠删码编码方法及装置
CN112947207A (zh) * 2021-02-26 2021-06-11 王继凡 一种基于物联网的地热源节能方法及系统
CN113535857A (zh) * 2021-08-04 2021-10-22 阿波罗智联(北京)科技有限公司 数据同步方法及装置
CN113722293A (zh) * 2021-08-31 2021-11-30 平安科技(深圳)有限公司 基于人工智能的防火墙维护方法、装置、电子设备及介质
CN113722293B (zh) * 2021-08-31 2023-06-09 平安科技(深圳)有限公司 基于人工智能的防火墙维护方法、装置、电子设备及介质
CN117690562A (zh) * 2023-12-11 2024-03-12 银川宜善互联网医院有限公司 一种医疗档案管理方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN108874950B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN108874950A (zh) 一种基于er关系的数据分布存储方法及装置
CN103729471B (zh) 数据库查询方法和装置
WO2021068549A1 (zh) 一种数据处理方法、平台及系统
CN106227894B (zh) 一种数据分页查询方法和装置
US9747349B2 (en) System and method for distributing queries to a group of databases and expediting data access
US20010049676A1 (en) Method and system for retrieving data from multiple data sources using a search routing database
KR20170010844A (ko) 원격 데이터베이스에 대한 뮤테이션들의 프로세싱
CN106415534B (zh) 一种分布式数据库中关联表分区的方法和设备
CN109783543B (zh) 数据查询方法、装置、设备和存储介质
CN106991112B (zh) 信息查询方法及装置
CN110674247A (zh) 弹幕信息的拦截方法、装置、存储介质及设备
JP6975153B2 (ja) データ格納サービス処理方法及び装置
US20190354516A1 (en) Single-level, multi-dimension, hash-based table partitioning
CN106202440B (zh) 数据处理方法、装置及设备
US20220374406A1 (en) KV Database Configuration Method, Query Method, Device, and Storage Medium
US20190332588A1 (en) Adaptive query processor for query systems with limited capabilities
CN114443770A (zh) 数据同步方法、装置、介质及电子设备
CN115062027A (zh) 哈希连接方法、计算节点、存储介质及程序产品
CN111400301B (zh) 一种数据查询方法、装置及设备
CN107644025B (zh) 分布式数据库的wal记录的分发方法和装置
US8825698B1 (en) Showing prominent users for information retrieval requests
CN102193988A (zh) 一种图形数据库节点数据的检索方法及系统
CN105574010B (zh) 数据查询方法及装置
US7890494B2 (en) System and/or method for processing events
CN112579709A (zh) 一种数据表识别方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant