JP6816072B2 - 分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム - Google Patents
分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム Download PDFInfo
- Publication number
- JP6816072B2 JP6816072B2 JP2018157983A JP2018157983A JP6816072B2 JP 6816072 B2 JP6816072 B2 JP 6816072B2 JP 2018157983 A JP2018157983 A JP 2018157983A JP 2018157983 A JP2018157983 A JP 2018157983A JP 6816072 B2 JP6816072 B2 JP 6816072B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- storage
- storage device
- data
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0617—Improving the reliability of storage systems in relation to availability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0631—Configuration or reconfiguration of storage systems by allocating resources to storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0685—Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/085—Retrieval of network configuration; Tracking network configuration history
- H04L41/0853—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
- H04L41/0856—Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information by backing up or archiving configuration information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
- H04L43/0888—Throughput
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mathematical Physics (AREA)
Description
Claims (12)
- クライアント計算機が利用する管理対象データを記憶装置に格納可能なノード計算機を複数備える分散データベースシステムであって、
前記記憶装置には、入出力性能の高い第1種記憶装置と、入出力性能の低い第2種記憶装置とがあり、
前記クライアント計算機からの管理対象データの読み出し要求に対して応答するために必要とされる同一の前記管理対象データを読み出すべきノード計算機の数を示す応答数情報を含む管理情報を記憶する管理情報記憶部と、
前記クライアント計算機から新たな管理対象データの書き込み要求を受け取った場合に、前記複数のノード計算機から、前記応答数情報が示す数のノード計算機であって、前記第1種記憶装置に対して管理対象データを格納可能なノード計算機を、前記管理対象データの格納先として決定する格納先決定部と、
決定された前記ノード計算機に対して、前記管理対象データを格納させる格納制御部と、
を備える分散データベースシステム。 - 前記管理情報は、前記管理対象データの可用性を確保するために前記管理対象データを格納するために必要とされるノード計算機の数を示す冗長数情報をさらに含み、
前記格納先決定部は、前記冗長数情報が示す数と前記応答数情報が示す数との差の数のノード計算機であって、前記第2種記憶装置に対して管理対象データを格納可能なノード計算機を、前記管理対象データの格納先に追加する
請求項1に記載の分散データベースシステム。 - 前記記憶装置が前記第1種記憶装置であるか前記第2種記憶装置であるかを示す種別情報を取得する種別取得部をさらに有し、
前記格納先決定部は、取得した種別情報に基づいて、前記ノード計算機が前記第1種記憶装置に対して管理対象データを格納可能か否かを識別する
請求項1又は請求項2に記載の分散データベースシステム。 - 前記記憶装置が前記第1種記憶装置であるか前記第2種記憶装置であるかを、前記記憶装置に対する実際のデータの入出力の結果から特定する種別特定部をさらに有する
請求項1又は請求項2に記載の分散データベースシステム。 - 前記記憶装置を備え、前記記憶装置の記憶領域を、前記管理対象データを格納する論理ボリュームとして前記ノード計算機に提供する1以上のストレージノードと、
前記ストレージノードにおける前記記憶装置の論理ボリュームを提供するノード計算機と前記記憶装置の種類とを示す論理ボリューム情報を管理する管理サーバと、
を備え、
前記種別取得部は、前記管理サーバから、前記ノード計算機に提供される論理ボリュームを提供する記憶装置の種別を取得する
請求項3に記載の分散データベースシステム。 - 前記ストレージノードの入出力処理が所定の閾値を超えているか否か、及び前記ストレージノードのプロセッサの利用率が所定の閾値を超えているか否かを判定するノード状態判定部と、
前記ストレージノードの入出力処理が所定の閾値を超え、且つ前記ストレージノードのプロセッサの利用率が所定の閾値を超えていない場合に、前記ストレージノードに対してボリュームを追加する設定を行うボリューム設定部と
をさらに備える
請求項5に記載の分散データベースシステム。 - 前記ストレージノードの入出力処理が所定の閾値を超えているか否か、及び前記ストレージノードのプロセッサの利用率が所定の閾値を超えているか否かを判定するノード状態判定部と、
前記ストレージノードの入出力処理が所定の閾値を超えておらず、且つ前記ストレージノードのプロセッサの利用率が所定の閾値を超えている場合に、応答数情報を低下させる応答数調整部と、
をさらに備える
請求項5に記載の分散データベースシステム。 - 前記ノード計算機同士を接続するクラスタネットワークにおける帯域利用率が所定の閾値を超過しているか否か、前記ストレージノード同士を接続するストレージノードクラスタネットワークにおける帯域利用率が所定の閾値を超過しているか否かを判定する帯域判定部と、
前記クラスタネットワークにおける帯域利用率が閾値を超過し、且つ前記ストレージノードクラスタネットワークにおける帯域利用率が閾値を超過しない場合に、管理対象データにおける冗長数情報を下げ、前記ストレージノード間で前記管理対象データをミラーリングする設定を行う冗長設定部と、
をさらに備える
請求項5に記載の分散データベースシステム。 - 前記冗長設定部は、前記冗長数情報が示す数と前記応答数情報が示す数との差の数が2以上である場合に、前記冗長数情報を下げて、前記ストレージノード間で前記管理対象データをミラーリングする設定を行う
請求項8に記載の分散データベースシステム。 - クライアント計算機が利用する管理対象データを記憶装置に格納可能なノード計算機を複数備える分散データベースシステムであって、
前記クライアント計算機からの管理対象データの読み出し要求に対して応答するために必要とされる同一の前記管理対象データを読み出すべきノード計算機の数を示す応答数情報と、前記管理対象データの可用性を確保するために前記管理対象データを格納するために必要とされるノード計算機の数を示す冗長数情報とを含む管理情報を記憶する管理情報記憶部と、
前記クライアント計算機から新たな管理対象データの書き込み要求を受け取った場合に、前記複数のノード計算機から、前記応答数情報が示す数のノード計算機に対して、前記管理対象データを非圧縮で格納させ、前記冗長数情報が示す数と前記応答数情報が示す数との差の数のノード計算機に対して、前記管理対象データを圧縮して格納させる圧縮格納制御部と、
を備える分散データベースシステム。 - クライアント計算機が利用する管理対象データを記憶装置に格納可能なノード計算機を複数備える分散データベースシステムによる分散データベース管理方法であって、
前記記憶装置には、入出力性能の高い第1種記憶装置と、入出力性能の低い第2種記憶装置とがあり、
前記クライアント計算機からの管理対象データの読み出し要求に対して応答するために必要とされる同一の前記管理対象データを読み出すべきノード計算機の数を示す応答数情報を含む管理情報を記憶し、
前記クライアント計算機から新たな管理対象データの書き込み要求を受け取った場合に、前記複数のノード計算機から、前記応答数情報が示す数のノード計算機であって、前記第1種記憶装置に対して管理対象データを格納可能なノード計算機を、前記管理対象データの格納先として決定し、
決定された前記ノード計算機に対して、前記管理対象データを格納させる
分散データベース管理方法。 - クライアント計算機が利用する管理対象データを記憶装置に格納可能なノード計算機を複数備える分散データベースシステムにおける前記ノード計算機に実行させるための分散データベース管理プログラムであって、
前記記憶装置には、入出力性能の高い第1種記憶装置と、入出力性能の低い第2種記憶装置とがあり、
前記ノード計算機には、
前記クライアント計算機からの管理対象データの読み出し要求に対して応答するために必要とされる同一の前記管理対象データを読み出すべきノード計算機の数を示す応答数情報を含む管理情報が記憶され、
前記ノード計算機を
前記クライアント計算機から新たな管理対象データの書き込み要求を受け取った場合に、前記複数のノード計算機から、前記応答数情報が示す数のノード計算機であって、前記第1種記憶装置に対して管理対象データを格納可能なノード計算機を、前記管理対象データの格納先として決定する格納先決定部と、
決定された前記ノード計算機に対して、前記管理対象データを格納させる格納制御部と、して機能させる分散データベース管理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157983A JP6816072B2 (ja) | 2018-08-27 | 2018-08-27 | 分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム |
US16/288,490 US11204941B2 (en) | 2018-08-27 | 2019-02-28 | Distributed database system, distributed database management method, and distributed database management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157983A JP6816072B2 (ja) | 2018-08-27 | 2018-08-27 | 分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020034961A JP2020034961A (ja) | 2020-03-05 |
JP6816072B2 true JP6816072B2 (ja) | 2021-01-20 |
Family
ID=69587070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018157983A Active JP6816072B2 (ja) | 2018-08-27 | 2018-08-27 | 分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11204941B2 (ja) |
JP (1) | JP6816072B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11120082B2 (en) | 2018-04-18 | 2021-09-14 | Oracle International Corporation | Efficient, in-memory, relational representation for heterogeneous graphs |
US11687363B2 (en) * | 2019-07-15 | 2023-06-27 | Micron Technology, Inc. | Internal management traffic regulation for memory sub-systems |
KR102476271B1 (ko) * | 2020-11-30 | 2022-12-13 | 한국전자통신연구원 | 자율 관리(semi-managed) DHT 구성 방법 및 시스템 |
CN112860694B (zh) * | 2021-02-04 | 2024-05-17 | 京东科技控股股份有限公司 | 业务数据的处理方法、装置及设备 |
CN113377780A (zh) * | 2021-07-07 | 2021-09-10 | 杭州网易云音乐科技有限公司 | 一种数据库分片方法、装置、电子设备和可读存储介质 |
CN115499449A (zh) * | 2022-07-28 | 2022-12-20 | 阿里巴巴(中国)有限公司 | 镜像加速系统、方法及装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8571882B1 (en) * | 2006-07-05 | 2013-10-29 | Ronald J. Teitelbaum | Peer to peer database |
US20080235746A1 (en) * | 2007-03-20 | 2008-09-25 | Michael James Peters | Methods and apparatus for content delivery and replacement in a network |
US9448730B2 (en) * | 2009-09-30 | 2016-09-20 | International Business Machines Corporation | Method and apparatus for dispersed storage data transfer |
US8984027B1 (en) * | 2011-07-28 | 2015-03-17 | Symantec Corporation | Systems and methods for migrating files to tiered storage systems |
WO2013046352A1 (ja) | 2011-09-28 | 2013-04-04 | 株式会社日立製作所 | 計算機システム、データ管理方法及びデータ管理プログラム |
JP6131907B2 (ja) * | 2014-04-24 | 2017-05-24 | カシオ計算機株式会社 | 分散データベース、データ共有方法、プログラム、装置 |
US9454306B2 (en) * | 2014-09-16 | 2016-09-27 | Netapp, Inc. | Capturing demand on storage capacity and performance capability |
KR101661930B1 (ko) * | 2015-08-03 | 2016-10-05 | 주식회사 코인플러그 | 블록체인을 기반으로 하는 공인인증서 발급시스템 |
US20180260190A1 (en) * | 2017-03-10 | 2018-09-13 | Microsoft Technology Licensing, Llc | Split and merge graphs |
-
2018
- 2018-08-27 JP JP2018157983A patent/JP6816072B2/ja active Active
-
2019
- 2019-02-28 US US16/288,490 patent/US11204941B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020034961A (ja) | 2020-03-05 |
US20200065316A1 (en) | 2020-02-27 |
US11204941B2 (en) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6816072B2 (ja) | 分散データベースシステム、分散データベース管理方法、及び分散データベース管理プログラム | |
US10496669B2 (en) | System and method for augmenting consensus election in a distributed database | |
US9977746B2 (en) | Processing of incoming blocks in deduplicating storage system | |
US7506101B2 (en) | Data migration method and system | |
WO2018001110A1 (zh) | 一种基于纠删码的存储数据重构方法和装置、存储节点 | |
US11119860B2 (en) | Data profiler | |
US9984139B1 (en) | Publish session framework for datastore operation records | |
Niazi et al. | Size matters: Improving the performance of small files in hadoop | |
CN110908589A (zh) | 数据文件的处理方法、装置、系统和存储介质 | |
US20180107408A1 (en) | Read and Write Load Sharing in a Storage Array Via Partitioned Ownership of Data Blocks | |
US9262289B2 (en) | Storage apparatus and failover method | |
US10579433B2 (en) | Storage system and information management method having a representative node and a plurality of general nodes including a plurality of resources | |
US20190020716A1 (en) | Method and system for recovering data in distributed computing system | |
CN114253936A (zh) | 分布式数据库的缩容方法、装置、设备和介质 | |
WO2017168578A1 (ja) | データ処理システム及びデータ処理方法 | |
US10990313B2 (en) | Multi-storage node system and capacity management method of multi-storage node system | |
US11579910B2 (en) | Policy enforcement and performance monitoring at sub-LUN granularity | |
KR101980320B1 (ko) | Gpu기반의 빅데이터 검색 질의 병렬 분산처리 방법 | |
US10685046B2 (en) | Data processing system and data processing method | |
CN110674099A (zh) | 副本平衡方法、装置、存储介质及电子设备 | |
JP7458610B2 (ja) | データベースシステム、及びクエリ実行方法 | |
US20230273728A1 (en) | Storage control apparatus and method | |
US11861423B1 (en) | Accelerating artificial intelligence (‘AI’) workflows | |
US20210223966A1 (en) | Storage system and control method of storage system | |
Weng et al. | The Integration of Shared Storages with the CephFS and Rados Gateway for Big Data Accessing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200721 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6816072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |