JP7174372B2 - Data management method, device and program in distributed storage network - Google Patents

Data management method, device and program in distributed storage network Download PDF

Info

Publication number
JP7174372B2
JP7174372B2 JP2020027917A JP2020027917A JP7174372B2 JP 7174372 B2 JP7174372 B2 JP 7174372B2 JP 2020027917 A JP2020027917 A JP 2020027917A JP 2020027917 A JP2020027917 A JP 2020027917A JP 7174372 B2 JP7174372 B2 JP 7174372B2
Authority
JP
Japan
Prior art keywords
data
storage
information processing
evaluation value
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020027917A
Other languages
Japanese (ja)
Other versions
JP2021131796A (en
Inventor
操 片岡
博史 野口
卓万 磯田
勉 村瀬
智稀 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Tokai National Higher Education and Research System NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Tokai National Higher Education and Research System NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2020027917A priority Critical patent/JP7174372B2/en
Publication of JP2021131796A publication Critical patent/JP2021131796A/en
Application granted granted Critical
Publication of JP7174372B2 publication Critical patent/JP7174372B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、データをネットワーク上の複数のストレージに分散して記憶する分散ストレージネットワークの技術に関する。 The present invention relates to distributed storage network technology for distributing and storing data in a plurality of storages on a network.

近年、IoT(Internet of Things)技術の急速な発展によりIoT機器が時々刻々生成する大量のデータがネットワークに流入してきている。このような大量のデータの一例としては、10fps監視カメラ映像のデータが挙げられる。これらのデータはリアルタイムで処理するだけでなくサーバのストレージに蓄積・保管することにより、例えばAIの学習データとして用いるなど有効な活用が期待されている。そこで、サービス充実を目的としてこれらの蓄積データをオープン化するOpenIoTというプラットフォームが提唱されている。 In recent years, due to the rapid development of IoT (Internet of Things) technology, a large amount of data generated by IoT devices is flowing into networks. An example of such a large amount of data is 10 fps surveillance camera video data. It is expected that these data will not only be processed in real time, but will also be accumulated and stored in the storage of servers for effective utilization, such as use as learning data for AI, for example. Therefore, a platform called OpenIoT has been proposed for making such accumulated data open for the purpose of enhancing services.

ところで、従来の通信アーキテクチャでは、ストレージに保管されているデータを取得するためには、データが保管されているサーバのアドレス情報を取得し、このサーバにアクセスする必要がある。これに対して、近年、データそのものを示す識別子(コンテンツ名など)を利用し、この識別子を指定することによりネットワークからデータを取得する情報指向ネットワーク技術(ICN:Information-Centric Networking)というアーキテクチャが提案されている(非特許文献1参照)。 By the way, in the conventional communication architecture, in order to obtain the data stored in the storage, it is necessary to obtain the address information of the server in which the data is stored and to access this server. On the other hand, in recent years, an architecture called Information-Centric Networking (ICN) has been proposed, which uses an identifier (such as a content name) that indicates the data itself, and acquires data from the network by specifying this identifier. (See Non-Patent Document 1).

このようなアーキテクチャは、あらゆるデータを、ひとつの仮想的なストレージ(=仮想ストレージネットワーク)で収容するという思想に基づくものである。非特許文献1ではMobilityFirstと呼ばれる技術が提案されている。 Such an architecture is based on the idea of accommodating all data in one virtual storage (=virtual storage network). Non-Patent Document 1 proposes a technology called Mobility First.

MobilityFirstでは、ネットワークを構成する各ノードであるルータは、それぞれストレージを備えている。Publisherと呼ばれるデータ送信端末がデータをネットワークに投入すると、当該データはネットワークの何れかのノードのストレージに保存される。データを取得する際には、Subscriberと呼ばれるデータ要求端末が、データの識別子を指定して管理サーバに当該データの位置情報を問い合わせ、取得した位置情報を用いてネットワーク内のノードからデータを取得する。ここで、ネットワーク内においてデータ要求端末に提供されるデータの通信経路上の各ノードは、データの中継処理を行うとともに自身のストレージに当該データをキャッシュとして記憶する。各ノードでは、LRU(Least Recently Used)などのキャッシュ管理アルゴリズムにより、自身のストレージに記憶しているキャッシュを管理する。このような構成により、仮想ストレージネットワークには同一の多数のデータが分散して保管される。そして、あるデータについて利用頻度の高いデータ要求端末とネットワーク的距離が近いノードに当該データがキャッシュされている可能性が高いので、低遅延を実現できる。 In MobilityFirst, routers, which are nodes constituting a network, each have a storage. When a data transmission terminal called Publisher inputs data into the network, the data is stored in the storage of any node of the network. When acquiring data, a data requesting terminal called a Subscriber designates the identifier of the data and inquires of the management server about the location information of the data, and acquires the data from the nodes in the network using the acquired location information. . Here, each node on the communication path of data provided to the data requesting terminal in the network relays the data and stores the data as a cache in its own storage. Each node manages the cache stored in its own storage by a cache management algorithm such as LRU (Least Recently Used). With such a configuration, a large number of identical data are distributed and stored in the virtual storage network. Since there is a high possibility that certain data is cached in a node that is close in terms of network to the data requesting terminal that uses the data with high frequency, low delay can be realized.

なお、同一データを複数のノードに分散して記憶するという技術に関しては、非特許文献2に記載されたWebプロキシキャッシュという技術も知られている。Webプロキシキャッシュでは、明示的あるいは暗示的に指定したストレージを経由する経路を構成し、経路上の全てのストレージにキャッシュを置く。これにより、データ要求端末は自身の近くのサーバからデータを取得することができる。 As for the technique of distributing and storing the same data in a plurality of nodes, a technique called Web proxy cache described in Non-Patent Document 2 is also known. A Web proxy cache constructs a route via explicitly or implicitly specified storages, and places caches in all the storages on the route. This allows the data requesting terminal to acquire data from a server near itself.

Dipankar Raychaudhuri, 他2名, "MobilityFirst: a robust and trustworthy mobility-centric architecture for the future Internet", ACM SIGMOBILE Mobile Computing and Communications Review, 2012.Dipankar Raychaudhuri, et al., "MobilityFirst: a robust and trustworthy mobility-centric architecture for the future Internet", ACM SIGMOBILE Mobile Computing and Communications Review, 2012. Nikolaos Laoutaris, 他2名, "Meta Algorithms for Hierarchical Web Caches", [online], [令和2年1月8日検索], インターネット<URL: http://cgi.di.uoa.gr/~laoutar/lcdt.pdf>Nikolaos Laoutaris, 2 others, "Meta Algorithms for Hierarchical Web Caches", [online], [searched on January 8, 2020], Internet<URL: http://cgi.di.uoa.gr/~laoutar /lcdt.pdf>

仮想ストレージネットワークに格納するデータの数及び容量は増加する一方であるが、従来の技術では、上述のようにデータの通信経路上にある全てのノードにおいてデータのキャッシュを記憶するので、ネットワーク全体でのストレージの利用効率が低いという問題がある。 Although the number and capacity of data to be stored in a virtual storage network is increasing, in the conventional technology, as described above, data caches are stored in all nodes on the data communication path. There is a problem that the utilization efficiency of the storage is low.

すなわち、従来の技術では、人気がなく将来的なアクセスが期待されないデータであっても、データの通信経路上にある全てのノードにおいてデータのキャッシュが記憶される。このため、人気があり将来的なアクセスが期待されるデータを記憶するための領域が実質的に小さくなってしまう。また、各ノードにおけるキャッシュ管理では、あるデータについて仮想ストレージネットワーク全体での同一データの保管数は考慮されていない。この保管数が多いデータは実質的に記憶容量を無駄にしている無駄なデータであると考えられる。したがって、この無駄なデータが多数存在することにより、人気があり将来的なアクセスが期待されるデータを記憶するための領域が実質的に小さくなってしまう。そして、人気があり将来的なアクセスが期待されるデータについてキャッシュのヒット率を維持するには、より大きな容量のストレージが必要になるという問題がある。 That is, in the conventional technology, even data that is not popular and is not expected to be accessed in the future is cached in all nodes on the data communication path. This effectively reduces the area for storing data that is popular and expected to be accessed in the future. Moreover, cache management in each node does not consider the number of identical data stored in the entire virtual storage network for certain data. This data with a large number of storages is considered to be useless data that substantially wastes the storage capacity. Therefore, the presence of this large amount of wasted data effectively reduces the area for storing data that is popular and expected to be accessed in the future. Then there is the problem that a larger storage capacity is required to maintain a cache hit rate for data that is popular and expected to be accessed in the future.

ところで、仮想ストレージネットワークに格納するデータの数及び容量の増加に伴い、ストレージとして、応答速度は早いが容量が相対的に小さく費用コストも高いストレージと、応答速度は遅いが容量が相対的に大きく費用コストも低いストレージとを併用することが考えられている。前者は例えばSSD(Solid State Drive)や高速なHDD(Hard Disk Drive)が相当する。後者は例えば低速なHDDやテープや光学ディスクなどが相当する。本明細書では、前者をホットストレージと呼び、後者をコールドストレージと呼ぶものとする。 By the way, with the increase in the number and capacity of data stored in the virtual storage network, there are two types of storage: storage with fast response speed but relatively small capacity and high cost, and storage with slow response speed but relatively large capacity. It is being considered to use it together with a storage whose cost is also low. The former corresponds to SSDs (Solid State Drives) and high-speed HDDs (Hard Disk Drives), for example. The latter corresponds to, for example, slow HDDs, tapes, optical discs, and the like. In this specification, the former is called hot storage, and the latter is called cold storage.

従来の技術においてこのようなストレージ構成を採用した場合、各ノードはホットストレージをキャッシュとして利用し、LRUなどのキャッシュ管理によりホットストレージから削除すべきデータはコールドストレージに保管する処理を行う。ここで、コールドストレージに保管されたデータへのアクセスは、ホットストレージに保管されたデータへのアクセスよりも応答時間が遅いものとなる。このため、データが何れかのノードのコールドストレージに保管されているが、何れのノードのホットストレージにも保管されていない場合には、コールドストレージにアクセスする必要がある。このため、応答時間が遅いものとなるだけでなく、許容時間内にデータ取得できないものとして、その補償として経済的損失が発生することが考えられる。 When such a storage configuration is adopted in the conventional technology, each node uses the hot storage as a cache and stores data to be deleted from the hot storage in the cold storage by cache management such as LRU. Here, access to data stored in cold storage has a slower response time than access to data stored in hot storage. Therefore, if data is stored in the cold storage of any node, but is not stored in the hot storage of any node, it is necessary to access the cold storage. For this reason, not only is the response time slow, but it is also possible that data cannot be acquired within the allowable time, resulting in financial loss as compensation.

本発明は上記事情に鑑みてなされたものであり、その目的とするところは、分散ストレージネットワークにおいて、ストレージの利用効率及び応答速度が良好なデータ管理方法、装置、プログラムを提供することにある。 SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and its object is to provide a data management method, apparatus, and program with good storage utilization efficiency and response speed in a distributed storage network.

上記目的を達成するために、本願発明は、第1のストレージと、前記第1のストレージよりも応答速度が低い第2のストレージと、前記第1のストレージ及び前記第2のストレージに格納するデータの配置を制御するデータ配置制御手段とを備えた複数の情報処理装置を相互にネットワークで接続して仮想的なストレージを形成した分散ストレージネットワークにおけるデータ管理方法であって、分散ストレージネットワーク内のデータに対するユーザ端末からのアクセスに対して、前記ユーザ端末から前記データが格納された情報処理装置に至る通信経路上にある複数の情報処理装置のデータ配置制御手段が、前記通信経路上にある複数の情報処理装置を複数のクラスタに分割するとともに、各クラスタにおいて当該クラスタに属する情報処理装置の何れか1つの第1のストレージに前記データをキャッシュとして記憶するキャッシュ記憶ステップと、各情報処理装置のデータ配置制御手段が、第1のストレージに記憶されている各データについて所定の規則に基づき評価値を算出し、最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されている場合は前記最低評価値のデータを第1のストレージから削除し、前記最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されていない場合は前記最低評価値のデータを第1のストレージから第2のストレージ又は他の情報処理装置の第1のストレージに移動させるデータ配置ステップとを備えたことを特徴とする。 In order to achieve the above object, the present invention provides a first storage, a second storage having a response speed lower than that of the first storage, and data to be stored in the first storage and the second storage. A data management method in a distributed storage network in which a plurality of information processing devices are interconnected via a network to form a virtual storage, the method comprising data placement control means for controlling the placement of data in the distributed storage network data arrangement control means of a plurality of information processing devices on a communication path from the user terminal to the information processing device in which the data is stored, in response to access from the user terminal to the plurality of information processing devices on the communication route a cache storage step of dividing an information processing device into a plurality of clusters and storing the data as a cache in a first storage of any one of the information processing devices belonging to the cluster in each cluster; and data of each information processing device. The arrangement control means calculates an evaluation value for each data stored in the first storage based on a predetermined rule, and the same data as the data with the lowest evaluation value is distributed to the other information processing devices in the distributed storage network. If the data with the lowest evaluation value is stored in the first storage, the data with the lowest evaluation value is deleted from the first storage, and the same data as the data with the lowest evaluation value is stored in the first storage of another information processing device in the distributed storage network. and a data arrangement step of moving the data with the lowest evaluation value from the first storage to the second storage or the first storage of another information processing apparatus if it is not stored in the storage. .

また、本願発明は、第1のストレージと、前記第1のストレージよりも応答速度が低い第2のストレージと、前記第1のストレージ及び前記第2のストレージに格納するデータの配置を制御するデータ配置制御手段とを備えた複数の情報処理装置を相互にネットワークで接続して仮想的なストレージを形成した分散ストレージネットワークにおける情報処理装置であって、前記データ配置制御手段は、分散ストレージネットワーク内のデータに対するユーザ端末からのアクセスに対して、前記ユーザ端末から前記データが格納された情報処理装置に至る通信経路上にある複数の情報処理装置を複数のクラスタに分割する分割処理手段と、各クラスタについて当該クラスタに属する情報処理装置のうち前記データをキャッシュとして記憶する1つの情報処理装置を決定するとともに自身に前記データを記憶すると決定した場合には第1のストレージに前記データをキャッシュとして記憶する配置先決定処理手段と、第1のストレージに記憶されている各データについて所定の規則に基づき評価値を算出する評価値算出手段と、最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されている場合は前記最低評価値のデータを第1のストレージから削除し、前記最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されていない場合は前記最低評価値のデータを第1のストレージから第2のストレージ又は他の情報処理装置の第1のストレージに移動させるデータ配置処理手段とを備えたことを特徴とする。 Further, the present invention provides a first storage, a second storage whose response speed is lower than that of the first storage, and data for controlling the arrangement of data to be stored in the first storage and the second storage. an information processing device in a distributed storage network in which a virtual storage is formed by interconnecting a plurality of information processing devices, each of which includes an arrangement control means; division processing means for dividing a plurality of information processing devices on a communication path from the user terminal to an information processing device storing the data into a plurality of clusters in response to access to data from the user terminal; determines one of the information processing devices belonging to the cluster to store the data as a cache, and if it determines to store the data in itself, stores the data as a cache in the first storage. allocation destination determination processing means; evaluation value calculation means for calculating an evaluation value based on a predetermined rule for each data stored in the first storage; If the data with the lowest evaluation value is stored in the first storage of another information processing device, the data with the lowest evaluation value is deleted from the first storage, and the same data as the data with the lowest evaluation value is stored in another information processing device in the distributed storage network. data placement processing means for moving the data with the lowest evaluation value from the first storage to a second storage or to a first storage of another information processing device if it is not stored in the first storage of the information processing device; characterized by comprising

本発明によれば、ユーザ端末がアクセスしたデータは、その通信経路上にある全ての情報処理装置ではなく、通信経路上にある情報処理装置が複数のクラスタに分割され、各クラスタ内の1つの情報処理装置のストレージにキャッシュとして記憶されるので、ストレージの利用効率が向上する。また、本発明によれば、分散ストレージネットワークの全ての第1のストレージに1つだけ存在するデータ(以下「ラストワンデータ」と呼ぶ)については、当該データを保管している情報処理装置においてキャッシュ管理の評価値が低いものであっても、所定の条件で他の情報処理装置の第1のストレージに移動する。これにより、応答速度の遅い第2のストレージにアクセスする機会が減り、全体として応答速度が向上する。 According to the present invention, data accessed by a user terminal is divided into a plurality of clusters by the information processing apparatuses on the communication path, not by all the information processing apparatuses on the communication path, and one cluster in each cluster. Since it is stored as a cache in the storage of the information processing device, the utilization efficiency of the storage is improved. Further, according to the present invention, data that exists in only one piece in all first storages of the distributed storage network (hereinafter referred to as "last one data") is cached in the information processing device that stores the data. Even if the management evaluation value is low, it is moved to the first storage of another information processing apparatus under a predetermined condition. This reduces the chances of accessing the second storage, which has a slow response speed, and improves the response speed as a whole.

前提となる仮想ストレージネットワークのシステム構成図System configuration diagram of the prerequisite virtual storage network 仮想ストレージネットワークにおけるデータ管理方法の概要を説明する図A diagram explaining the outline of the data management method in the virtual storage network キャッシュ数とコストの相関グラフCorrelation graph of number of caches and cost データ配置に係る動作を説明するフローチャートFlowchart for explaining operations related to data placement 経路上ノードクラスタリングを説明する図Diagram explaining route node clustering 変形LRUの動作を説明するフローチャートFlowchart explaining the operation of the modified LRU 変形LRUを説明する図Diagram explaining modified LRU 変形LRUを説明する図Diagram explaining modified LRU 実施例に係る情報処理装置の機能ブロック図Functional block diagram of an information processing apparatus according to an embodiment 他の実施形態に係る仮想ストレージネットワークのシステム構成図System configuration diagram of a virtual storage network according to another embodiment 他の実施形態の実施例に係る情報処理装置の機能ブロック図Functional block diagram of an information processing apparatus according to an example of another embodiment

本発明の一実施の形態に係る仮想ストレージネットワークについて説明する。本発明では、最適なコスト・利便性性能を提供するデータ保存先の決定を目標としており、以下の4点を性能指標とする(ただし後述するネットワークインパクトは制約とする)。 A virtual storage network according to one embodiment of the present invention will be described. In the present invention, the goal is to determine a data storage destination that provides optimal cost/convenience performance, and the following four points are used as performance indicators (however, network impact, which will be described later, is a constraint).

(1)ストレージ間のデータ移動の通信コスト(データ移動通信コスト)
これは、後述するようにデータ配置を変更するとき、物理ストレージ間でデータを移動するために発生する通信距離・サイズに応じた通信コストである。なお、このデータ移動通信コストは電力コストの一種でもある。
(1) Communication cost for data transfer between storages (data transfer communication cost)
This is the communication cost according to the communication distance and size, which is incurred for moving data between physical storages when changing the data arrangement as described later. Note that this data mobile communication cost is also a kind of power cost.

(2)Subscriberのデータ取得の通信コスト(データ取得通信コスト)
これは、ホットストレージにアクセスしたとき、ホットストレージからSubscriberにデータを転送するために発生する通信距離・サイズに応じた通信コストである。なお、このデータ取得通信コストは電力コストの一種でもある。
(2) Subscriber data acquisition communication cost (data acquisition communication cost)
This is the communication cost corresponding to the communication distance and size that is incurred for transferring data from the hot storage to the subscriber when the hot storage is accessed. Note that this data acquisition communication cost is also a kind of power cost.

(3)データを許容時間内に取得できないときの経済的損失(コールドペナルティ)
これは、応答速度が遅いコールドストレージにアクセスすると、許容時間内にデータ取得できないものとし、その補償として発生するものと仮定した経済的損失である。なお、このコールドペナルティは運用コストの一種である。
(3) Economic loss when data cannot be obtained within the allowable time (cold penalty)
This is an economic loss assuming that data cannot be obtained within the allowable time when cold storage with a slow response speed is accessed, and that it is assumed to occur as compensation. Note that this cold penalty is a kind of operating cost.

(4)データ配置を変更時のトラヒックが引き起こすネットワークへの悪影響(ネットワークインパクト)
これは、他サービスとのネットワーク共用を前提とすると、ネットワークに対して及ぼす、背景トラヒックの通信品質の劣化や、ネットワークの回線容量の不足等の悪影響である。
(4) Network impact caused by traffic when data allocation is changed (network impact)
Assuming that the network is shared with other services, this has adverse effects on the network, such as degradation of communication quality of background traffic and insufficient network line capacity.

本実施の形態において前提となる仮想ストレージネットワークのシステム構成について図1を参照して説明する。図1は前提となる仮想ストレージネットワークのシステム構成図である。本実施の形態における仮想ストレージネットワークはICNのアーキテクチャを採用する。 A system configuration of a virtual storage network, which is a premise in this embodiment, will be described with reference to FIG. FIG. 1 is a system configuration diagram of a premise virtual storage network. The virtual storage network in this embodiment adopts the ICN architecture.

図1に示すように、ネットワーク10はノードとして複数の情報処理装置100を含む。各情報処理装置100は、ホットストレージ210とコールドストレージ220とを備えている。本発明では複数の情報処理装置100のうち何れか1つ又は複数の情報処理装置100のホットストレージ210又はコールドストレージ220にデータが保管される。すなわち、ネットワーク10が1つの仮想的なストレージとして機能する。なお、ネットワーク10は、他サービスと共用することができる。 As shown in FIG. 1, network 10 includes a plurality of information processing devices 100 as nodes. Each information processing device 100 comprises a hot storage 210 and a cold storage 220 . In the present invention, data is stored in the hot storage 210 or the cold storage 220 of any one or a plurality of information processing apparatuses 100 among the plurality of information processing apparatuses 100 . That is, the network 10 functions as one virtual storage. Note that the network 10 can be shared with other services.

情報処理装置100は、他の情報処理装置100とネットワーク回線(リンク)を介して通信可能に接続する。ネットワーク10における情報処理装置100の接続形態に係るネットワークトポロジーは不問である。情報処理装置100は、ネットワーク10においてデータを中継するルータとして実装することができる。情報処理装置100の具体的な構成例については実施例として後述する。 The information processing device 100 is communicably connected to other information processing devices 100 via network lines (links). The network topology related to the form of connection of the information processing apparatus 100 in the network 10 is irrelevant. The information processing device 100 can be implemented as a router that relays data in the network 10 . A specific configuration example of the information processing apparatus 100 will be described later as an embodiment.

Publisherと呼ばれるデータ送信端末1がデータをネットワーク10に投入(store)すると、当該データはネットワーク10の何れかの情報処理装置100のホットストレージ210に保存される。 When a data transmission terminal 1 called a publisher stores data in the network 10 , the data is stored in the hot storage 210 of any information processing device 100 on the network 10 .

仮想ストレージネットワーク内においてデータは、所定のデータ配置制御処理により複数の情報処理装置100に保存される。ここで、データは、データ送信端末1が保存したオリジナルのデータと、データ配置制御処理においてキャッシュとして複製された1以上のデータ(レプリカとも言う)とは同一のものであり両者は区別されない。また、情報処理装置100に保存されているデータは、所定のデータ配置制御処理により他の情報処理装置100に移動することができる。ネットワーク10内のどの情報処理装置100にデータが保存されているかの対応情報は、GNRS(Global Name Resolution Service)と呼ばれる管理サーバ3により管理される。 Within the virtual storage network, data is stored in a plurality of information processing apparatuses 100 by predetermined data placement control processing. Here, the original data stored by the data transmission terminal 1 and the one or more pieces of data (also referred to as replicas) replicated as a cache in the data allocation control process are the same, and the two are indistinguishable. Data stored in the information processing apparatus 100 can be moved to another information processing apparatus 100 by a predetermined data arrangement control process. Correspondence information as to which information processing apparatus 100 in the network 10 stores data is managed by a management server 3 called GNRS (Global Name Resolution Service).

Subscriberと呼ばれるデータ要求端末2がデータを取得するには、まず、データの識別子(ID)を指定して管理サーバ3に当該データの位置情報(locations)を問い合わせる。管理サーバ3は当該データの位置情報を回答する。データ要求端末2は、当該位置情報を参照してネットワーク10にアクセスすることにより所望のデータを取得(retrive)する。ここで、データが仮想ストレージネットワーク内において複数の情報処理装置100に保存されている場合、管理サーバ3は各データについての位置情報をデータ要求端末2に回答する。データ要求端末2は、複数の位置情報から任意の位置情報を選択して、当該位置情報を参照してデータを取得することができる。例えば、データ要求端末2は、ネットワーク距離が最も近い情報処理装置100からデータを取得することができる。 In order for the data requesting terminal 2 called a Subscriber to acquire data, first, it specifies the identifier (ID) of the data and inquires of the management server 3 about the location information (locations) of the data. The management server 3 replies with the location information of the data. The data requesting terminal 2 retrieves desired data by accessing the network 10 with reference to the location information. Here, when data is stored in a plurality of information processing apparatuses 100 within a virtual storage network, the management server 3 replies to the data request terminal 2 with location information about each data. The data requesting terminal 2 can select arbitrary position information from a plurality of position information and obtain data by referring to the position information. For example, the data requesting terminal 2 can acquire data from the information processing device 100 with the closest network distance.

次に、本願発明の概要について図2を参照して説明する。図2は本発明に係る仮想ストレージネットワークにおけるデータ管理方法の概要を説明する図である。なお各図において、例えば情報処理装置など、複数存在する同一の構成要素を個別に識別するために参照符号の末尾に添え字を付すものとして、複数存在する同一の構成要素を総称する際には添え字を取り除いた参照符号を用いるものとする。また、ホットストレージに格納されているデータのうちラストワンデータについてはハッチングを付している。 Next, the outline of the present invention will be described with reference to FIG. FIG. 2 is a diagram for explaining the outline of the data management method in the virtual storage network according to the present invention. In each figure, a subscript is added to the end of the reference numeral to individually identify a plurality of identical constituent elements, such as an information processing device. Reference signs with subscripts removed shall be used. Also, the last one data among the data stored in the hot storage is hatched.

従来の技術では遠くからアクセスされると経路上に大量のキャッシュが作成されることになるが、前述したように、「遠くからアクセスされたデータ=ホットストレージに大量にキャッシュを残すべきデータ」ではない。本願発明はこの点に注目し、(1)経路上の全ノードのストレージにキャッシュを置くことはせず、経路上のノードをアクセス頻度等によってまびく、(2)ラストワンデータは仮想ストレージネットワーク内のホットストレージ全体で管理、その他のキャッシュは各ストレージ内で管理し、ラスタワンデータがコールドストレージへ降格されにくくする、という2つの特徴点を有している。 With conventional technology, when accessed from a distance, a large amount of cache is created on the path. do not have. The present invention pays attention to this point, and (1) does not put caches in the storage of all nodes on the path, but spreads the nodes on the path according to the access frequency, etc. (2) Last one data is a virtual storage network It has two features: it manages the hot storage as a whole, manages other caches in each storage, and makes it difficult for raster one data to be demoted to cold storage.

前述した特徴点(1)について図2を例として説明する。ここでは、データ要求端末2が、情報処理装置100aのホットストレージ210aに保存されているデータを取得することを考える。取得するデータはラストワンデータであってもそれ以外のデータであってもよい。データ要求端末2と情報処理装置100aとの間の通信経路上には複数の情報処理装置100b~100eが存在する。 The aforementioned characteristic point (1) will be described with reference to FIG. 2 as an example. Here, it is assumed that the data request terminal 2 acquires data stored in the hot storage 210a of the information processing device 100a. The data to be acquired may be last-one data or other data. A plurality of information processing devices 100b to 100e exist on the communication path between the data request terminal 2 and the information processing device 100a.

図2の例では、情報処理装置100aのホットストレージ210aに格納されておりデータ要求端末2の所望するデータが情報処理装置100b~100eにより中継される際に、経路上にある全てのホットストレージ210b~210eを2つの仮想ストレージと捉え、各仮想ストレージに1つずつ当該データをキャッシュとして記憶する。換言すれば、通信経路上にある複数の情報処理装置100b~100eを複数のクラスタ400a,400bに分割するとともに、各クラスタ400a,400bにおいて当該クラスタ400a,400bに属する情報処理装置100b~c,100d~eの何れか1つのホットストレージ210b又は210c,ホットストレージ210d又は210eに前記データをキャッシュとして記憶する。 In the example of FIG. 2, when the data requested by the data requesting terminal 2 stored in the hot storage 210a of the information processing device 100a is relayed by the information processing devices 100b to 100e, all the hot storages 210b on the route 210e are treated as two virtual storages, and the data is stored as a cache in each virtual storage. In other words, the plurality of information processing apparatuses 100b to 100e on the communication path are divided into a plurality of clusters 400a and 400b, and the information processing apparatuses 100b to 100d belonging to the clusters 400a and 400b are divided into the clusters 400a and 400b. The data is stored as a cache in one of the hot storages 210b or 210c and the hot storage 210d or 210e.

前述した特徴点(2)について図2を例として説明する。各情報処理装置100では、ホットストレージ210のすべての格納データは、有用性に関する後述する評価値に基づき降順に整列されたリスト構造で保持するものとする。そして、各情報処理装置100では、ラストワンデータを他にも同一データがあるデータより優先する。また、ラストワンデータについては、自ホットストレージ210から追い出され他ホットストレージ210にもいれさせてもらえない場合はコールドストレージ220に降格する。 The characteristic point (2) described above will be described with reference to FIG. 2 as an example. In each information processing apparatus 100, all data stored in the hot storage 210 are held in a list structure arranged in descending order based on evaluation values regarding usefulness, which will be described later. Then, in each information processing apparatus 100, the last one data is prioritized over other data having the same data. Last-one data is demoted to the cold storage 220 if it is expelled from its own hot storage 210 and cannot be stored in another hot storage 210 .

以上のような本願発明の特徴点と従来技術の差違について説明する。前述のMobilityFirstではホットストレージ/コールドストレージの違いはなく、「キャッシュがユーザからいかに近いか」を重要視している。一方、本願発明で前提としている仮想ストレージネットワークではホットストレージとコールドストレージを備えており、ラストワンデータが、コスト、利便性が大きく異なるどちらのストレージにデータが存在するかも重要視している。すなわち、ラストワンデータを気軽にコールドストレージに降格できないので従来技術ほど気軽に新規キャッシュを置くとコストがかかることに注目している。ホットストレージにおけるキャッシュ数とコストとの相関性はおおよそ図3に示すような曲線を示す。本願発明では図3の曲線の底部付近を狙うものである。なお、コストとは、費用コストだけでなく、通信コスト、電力コストなどを含む総合的なコストを意味する点に留意されたい。 The features of the present invention as described above and the differences between the conventional techniques will be described. MobilityFirst does not distinguish between hot storage and cold storage, and emphasizes "how close the cache is to the user." On the other hand, the virtual storage network premised in the present invention has hot storage and cold storage, and it is important to consider in which storage the last-one data resides, which is significantly different in cost and convenience. In other words, since the last-one data cannot be easily demoted to cold storage, it will be costly if a new cache is installed as easily as in the conventional technology. The correlation between the number of caches in hot storage and the cost roughly exhibits a curve as shown in FIG. The present invention aims at the vicinity of the bottom of the curve in FIG. It should be noted that the cost means not only the expense cost but also the total cost including communication cost, power cost, and the like.

次に、上述した本願発明の特徴点についてより詳細に説明する。まず、上記特徴点(1)の具体例である経路上ノードクラスタリングについて図4及び図5を参照して説明する。図4はデータ配置に係る動作を説明するフローチャート、図5は経路上ノードクラスタリングを説明する図である。 Next, the features of the present invention described above will be described in more detail. First, route node clustering, which is a specific example of feature point (1), will be described with reference to FIGS. 4 and 5. FIG. FIG. 4 is a flow chart for explaining operations related to data arrangement, and FIG. 5 is a diagram for explaining on-route node clustering.

本願発明では、まず、あるデータx(x,…x,…xは仮想ストレージネットワーク内のホットストレージ210に格納された同一データ)へのアクセス頻度によって、クラスタ数を決定する(図4のステップS1)。クラスタ数の計算例としては次式(1)が挙げられる。 In the present invention, first , the number of clusters is determined according to the frequency of access to certain data xn (x1, ... xn , ... xN is the same data stored in the hot storage 210 in the virtual storage network) (Fig. 4 step S1). A calculation example of the number of clusters is the following formula (1).

1/(ω*データx全体へのアクセス頻度+ω*データxへのアクセス頻度) …式(1)
ここで、ω及びωは定数である。図5の例では、クラスタ数は2である。
1/(ω 1 * frequency of access to entire data x + ω 2 * frequency of access to data x n ) Equation (1)
where ω 1 and ω 2 are constants. In the example of FIG. 5, the number of clusters is two.

次に、情報処理装置100間のリンク帯域が小さい順にクラスタの分割ポイントとし、決定したクラスタ数で分割する(図4のステップS2)。図5の例では、情報処理装置100cと情報処理装置100dの間のリンク帯域が、他の情報処理装置100間のリンク帯域よりも小さいものとする。この場合、情報処理装置100cと情報処理装置100dの間が分割ポイントとなる。これにより、情報処理装置100b及び100cからなるクラスタ400aと、情報処理装置100d及び100dからなるクラスタ400bが設定される。 Next, cluster division points are set in ascending order of the link bandwidth between the information processing apparatuses 100, and division is performed by the determined number of clusters (step S2 in FIG. 4). In the example of FIG. 5, the link band between the information processing device 100c and the information processing device 100d is assumed to be smaller than the link band between the other information processing devices 100. In the example of FIG. In this case, the division point is between the information processing device 100c and the information processing device 100d. As a result, a cluster 400a consisting of the information processing devices 100b and 100c and a cluster 400b consisting of the information processing devices 100d and 100d are set.

次に、各クラスタ400の中においては、クラスタ400に属する各情報処理装置100について評価値P1(x)を算出し、当該評価値P1(x)を最大とする情報処理装置100のホットストレージ210にデータを配置する(図4のステップS3)。評価値P1(x)は、データの各種属性情報に基づき算出することができる。例えば、次式(2)により評価値P1(x)を算出する。 Next, in each cluster 400, the evaluation value P1(x) is calculated for each information processing apparatus 100 belonging to the cluster 400, and the hot storage 210 of the information processing apparatus 100 having the maximum evaluation value P1(x) is calculated. (step S3 in FIG. 4). The evaluation value P1(x) can be calculated based on various attribute information of the data. For example, the evaluation value P1(x) is calculated by the following equation (2).

P1(x)=ω*(アクセス頻度)/(ユーザからの平均アクセス距離)+ω*残ストレージ容量 …式(2)
ここで、ω及びωは定数である。図5の例では、クラスタ400aについては情報処理装置100cのホットストレージ210cにデータを保存するとともに、クラスタ400bについては情報処理装置100eのホットストレージ210eにデータを保存する。
P1(x)=ω3* ( access frequency)/( average access distance from users)+ω4*remaining storage capacity Equation (2)
where ω3 and ω4 are constants. In the example of FIG. 5, data for the cluster 400a is stored in the hot storage 210c of the information processing device 100c, and data for the cluster 400b is stored in the hot storage 210e of the information processing device 100e.

次に、上記特徴点(2)の具体例である変形LRUについて図6~図8を参照して説明する。図6は変形LRUの動作を説明するフローチャート、図7及び図8は変形LRUを説明する図である。 Next, a modified LRU, which is a specific example of feature (2), will be described with reference to FIGS. 6 to 8. FIG. FIG. 6 is a flowchart for explaining the operation of the modified LRU, and FIGS. 7 and 8 are diagrams for explaining the modified LRU.

本発明に係る変形URLでは、ホットストレージ210に格納するデータは有用性に関する評価値P2(x)に基づき降順に整列されたリスト構造で保持する。この評価値P2(x)は逐次更新される値であり、削除や強制移動などを決めるためのデータxのポイントを意味する。評価値P2(x)はデータの各種属性情報に基づき算出することができる。例えば、次式により評価値P2(x)を算出する。 In the modified URL according to the present invention, the data stored in the hot storage 210 is held in a list structure arranged in descending order based on the evaluation value P2(x) regarding usefulness. This evaluation value P2(x) is a value that is sequentially updated, and means a point of data x for determining deletion, forced movement, or the like. The evaluation value P2(x) can be calculated based on various attribute information of the data. For example, the evaluation value P2(x) is calculated by the following equation.

P2(x)=ω/(同一データ数)+ω*(アクセス頻度)/(ユーザからの平均アクセス距離)-ω(現在アクセス時刻-最終アクセス時刻) …式(3)
ここで、ω,ω及びびωは定数である。
P2(x)= ω5 /(number of identical data)+ω6*(access frequency)/(average access distance from user) −ω7 (current access time last access time) Equation (3)
where ω 5 , ω 6 and ω 7 are constants.

情報処理装置100は、当該情報処理装置100にとって新規のデータをホットストレージ210に保存する際には、評価値P2(x)を算出し、この評価値P2(x)に基づく順序となるようホットストレージ210に保存する(図6のステップS11,S13、図7(a))。すなわち、新たなデータを変形LRUの中間に挿入するために、その新規データの有用性に応じて、リスト構造の適切な位置のポインタを繋ぎ変える。ここで、新規のデータの保存に必要な空き容量がホットストレージ210にない場合、以下のアルゴリズムにより空き容量を確保する(図6のステップS12,S14~S18)。 The information processing apparatus 100 calculates an evaluation value P2(x) when storing data new to the information processing apparatus 100 in the hot storage 210, and performs hot data processing so that the order is based on the evaluation value P2(x). It saves in the storage 210 (steps S11 and S13 in FIG. 6, FIG. 7(a)). That is, in order to insert new data in the middle of the modified LRU, the pointers at the appropriate positions in the list structure are spliced according to the usefulness of the new data. Here, if the hot storage 210 does not have enough free space for storing new data, free space is secured by the following algorithm (steps S12, S14 to S18 in FIG. 6).

情報処理装置100は、ホットストレージ210に格納されたデータのうち前記評価値P2(x)が最低のデータがラストワンデータでない場合、当該データは他の情報処理装置100のホットストレージに格納されているので、自身のホットストレージ210から削除する(図6のステップS14~S15、図7(b))。 If the data with the lowest evaluation value P2(x) among the data stored in the hot storage 210 is not the last one data, the information processing apparatus 100 stores the data in the hot storage of another information processing apparatus 100. Therefore, it deletes it from its own hot storage 210 (steps S14 and S15 in FIG. 6, FIG. 7(b)).

一方、前記評価値P2(x)が最低のデータがラストワンデータである場合、情報処理装置100は、仮想ストレージネットワーク内のホットストレージ210全体で強制移動するかどうかの判断を行う(図6のステップS16)。強制移動するか否かの判断には各情報処理装置100における前記評価値P2(x)を用いることができる。具体的には、他の情報処理装置100に前記ラストワンデータの評価値P2(x)よりも低い評価値P2(x)のデータが格納されていたら、当該他の情報処理装置100に強制移動すると判断する。情報処理装置100は、強制移動すると判断した場合、他の情報処理装置100にラストワンデータを移動させる(図6のステップS16,S18、図7(d))。ここで、移動先の他の情報処理装置100では、前記ラストワンデータの評価値P2(x)よりも低い評価値P2(x)のデータは当該情報処理装置100のコールドストレージ220に追い出す。一方、強制移動しないと判断した場合、情報処理装置100は、ラストワンデータを自身のコールドストレージ220に移動させる(図6のステップS16,S7、図7(c))。なお、データをホットストレージ210からコールドストレージ220に移動させることを、「降格させる」や「アーカイブする」とも言う。 On the other hand, if the data with the lowest evaluation value P2(x) is the last-one data, the information processing apparatus 100 determines whether to forcibly migrate the entire hot storage 210 in the virtual storage network (see FIG. 6). step S16). The evaluation value P2(x) in each information processing apparatus 100 can be used to determine whether or not to forcibly move. Specifically, if data with an evaluation value P2(x) lower than the evaluation value P2(x) of the last-one data is stored in another information processing apparatus 100, the data is forcibly moved to the other information processing apparatus 100. Then judge. When the information processing apparatus 100 determines to forcibly move, the information processing apparatus 100 moves the last-one data to another information processing apparatus 100 (steps S16 and S18 in FIG. 6, FIG. 7(d)). Here, in the other information processing apparatus 100 of the moving destination, the data with the evaluation value P2(x) lower than the evaluation value P2(x) of the last one data is expelled to the cold storage 220 of the information processing apparatus 100 concerned. On the other hand, if it is determined not to forcibly move, the information processing apparatus 100 moves the last-one data to its own cold storage 220 (steps S16 and S7 in FIG. 6, FIG. 7(c)). Note that moving data from the hot storage 210 to the cold storage 220 is also called "demoting" or "archiving."

上述のクラスタ分割数の算出、クラスタ内におけるデータ配置先の決定で用いる評価値P1(x)の算出、ホットストレージ210におけるデータの有用性に関する評価値P2(x)の算出で必要な各パラメータは、自身が保有しているもの、換言すれば自ノードで閉じたものであるならば、当該パラメータを用いる。各パラメータが自ノードに閉じない場合には、各ノード間で互いに情報をやりとりすることで取得する。なお、データがどの情報処理装置100に格納されているか否かは管理サーバ3が管理している。そこで、例えば他のホットストレージ210におけるデータのアクセス頻度を取得するには、まず管理サーバ3に当該データの位置情報を取得し、この位置情報に基づき当該データを格納している情報処理装置100に問い合わせればよい。 Each parameter necessary for calculating the number of cluster divisions, calculating the evaluation value P1(x) used in determining the data allocation destination in the cluster, and calculating the evaluation value P2(x) regarding the usefulness of the data in the hot storage 210 is , if it is owned by itself, in other words, if it is closed in its own node, the parameter is used. If each parameter is not closed to its own node, it is acquired by exchanging information between each node. The management server 3 manages which information processing apparatus 100 stores the data. Therefore, for example, in order to acquire the access frequency of data in the other hot storage 210, the location information of the data is first acquired by the management server 3, and based on this location information, the information processing device 100 storing the data is Please inquire.

情報処理装置100の一実施例について図9を参照して説明する。図9は実施例に係る情報処理装置の機能ブロック図である。 An embodiment of the information processing apparatus 100 will be described with reference to FIG. FIG. 9 is a functional block diagram of the information processing device according to the embodiment.

情報処理装置100は、ホットストレージ210とコールドストレージ220とを備えたデータ蓄積部200と、データ配置制御部300とを備えている。 The information processing apparatus 100 includes a data storage unit 200 having a hot storage 210 and a cold storage 220 and a data allocation control unit 300 .

データ蓄積部200は、他の情報処理装置100からのデータをさらに他の情報処理装置100に中継する機能を有する。また、データ蓄積部200は、データ要求端末2から自身のホットストレージ210又はコールドストレージ220に保存されているデータのアクセス要求があると、当該データをデータ要求端末2に送信する機能を有する。また、データ蓄積部200は、中継するデータを、データ配置制御部300からの指示によりホットストレージ210に保存する機能を有する。 The data storage unit 200 has a function of relaying data from another information processing device 100 to another information processing device 100 . The data storage unit 200 also has a function of transmitting the data to the data requesting terminal 2 when the data requesting terminal 2 requests access to data stored in its own hot storage 210 or cold storage 220 . The data storage unit 200 also has a function of storing relayed data in the hot storage 210 according to an instruction from the data placement control unit 300 .

ホットストレージ210は、応答速度は早いが容量が相対的に小さく費用コストも高い不揮発性の記憶媒体である。ホットストレージ210としては、例えばSSDや高速なHDDが挙げられる。コールドストレージ220は、応答速度は遅いが容量が相対的に大きく費用コストも低い不揮発性の記憶媒体である。コールドストレージ220としては、例えば低速なHDDやテープや光学ディスクなどが相当する。なおコールドストレージ220は、メディアを自動又は手動で着脱自在な構成としてもよい。 The hot storage 210 is a nonvolatile storage medium that has a fast response speed, a relatively small capacity, and a high cost. Examples of the hot storage 210 include SSDs and high-speed HDDs. The cold storage 220 is a non-volatile storage medium with a slow response speed, relatively large capacity, and low cost. The cold storage 220 corresponds to, for example, a low-speed HDD, tape, or optical disk. Note that the cold storage 220 may have a configuration in which media can be automatically or manually detachable.

データ配置制御部300は、アクセス偏在性評価部310と、変形LRUベース有用性評価部320と、制御操作実行部330とを備えている。制御操作実行部330は、キャッシュ配置操作実行部331と、強制移動操作実行部332と、削除操作実行部333と、アーカイブ操作実行部334とを備えている。 The data placement control unit 300 includes an access unevenness evaluation unit 310 , a modified LRU-based utility evaluation unit 320 , and a control operation execution unit 330 . The control operation execution unit 330 includes a cache allocation operation execution unit 331 , a forced migration operation execution unit 332 , a deletion operation execution unit 333 and an archive operation execution unit 334 .

アクセス偏在性評価部310は、仮想ストレージネットワーク内に保存されている各データに対するデータ要求端末2からのアクセスについて、そのアクセス情報を取得・評価する。アクセス情報は、自身の情報処理装置100に対するアクセスについては自身で収集し、他の情報処理装置100に対するアクセスについては当該他の情報処理装置100から収集する。 The access maldistribution evaluation unit 310 acquires and evaluates access information regarding access from the data request terminal 2 to each data saved in the virtual storage network. The access information is collected by itself for access to its own information processing apparatus 100 and is collected from the other information processing apparatus 100 for access to another information processing apparatus 100 .

変形LRUベース有用性評価部320は、前述した有用性に関する評価値P2(x)を算出する。 The modified LRU-based utility evaluation unit 320 calculates the evaluation value P2(x) regarding utility described above.

キャッシュ配置操作実行部331は、データ蓄積部200に対するデータのキャッシュ操作及び管理を行うものであり、前述した特徴点(1)及び(2)の機能を有する。キャッシュ配置操作実行部331は、クラスタ分割部331aと、クラスタ内配置先ストレージ決定部331bを備える。 The cache placement operation execution unit 331 performs cache operation and management of data in the data storage unit 200, and has the functions of the features (1) and (2) described above. The cache placement operation execution unit 331 includes a cluster division unit 331a and an intra-cluster placement destination storage determination unit 331b.

クラスタ分割部331aは、前述したように経路上にある情報処理装置100を複数のクラスタ400に分割する処理を行う。クラスタ内配置先ストレージ決定部331bは、前述したように分割した各クラスタ400内においてデータを配置する情報処理装置100を決定する。 The cluster dividing unit 331a performs processing for dividing the information processing apparatuses 100 on the route into a plurality of clusters 400 as described above. The intra-cluster placement destination storage determination unit 331b determines the information processing apparatus 100 in which data is to be placed in each cluster 400 divided as described above.

強制移動操作実行部332は、自身のホットストレージ210から他の情報処理装置100のホットストレージ210にデータを強制移動させる処理の実行を行う。削除操作実行部333は、自身のホットストレージ210からデータを削除する処理の実行を行う。アーカイブ操作実行部334は、自身のホットストレージ210からコールドストレージ220へデータを移動させる処理の実行を行う。 The forced migration operation execution unit 332 executes a process of forcibly migrating data from its own hot storage 210 to the hot storage 210 of another information processing apparatus 100 . The deletion operation execution unit 333 executes processing for deleting data from its own hot storage 210 . The archive operation execution unit 334 executes processing for moving data from its own hot storage 210 to the cold storage 220 .

情報処理装置100は、主演算装置、メモリ、ネットワークインタフェース等を備えた周知の情報処理装置からなる。ここで情報処理装置100の実装形態は不問である。例えば、情報処理装置100の各部を分散して複数の装置により実装してもよい。また、情報処理装置100の各部は汎用のコンピュータにプログラムをインストールすることにより実装してもよいし、専用のハードウェアとして実装してもよいし、これらを組み合わせてもよい。 The information processing device 100 is a well-known information processing device including a main processing unit, memory, network interface, and the like. Here, the implementation form of the information processing apparatus 100 does not matter. For example, each part of the information processing device 100 may be distributed and implemented by a plurality of devices. Also, each part of the information processing apparatus 100 may be implemented by installing a program in a general-purpose computer, may be implemented as dedicated hardware, or may be combined.

以上のように本発明によれば、データ要求端末2がアクセスしたデータは、その通信経路上にある全ての情報処理装置100ではなく、通信経路上にある情報処理装置100が複数のクラスタ400に分割され、各クラスタ400内の1つの情報処理装置100のホットストレージ210にキャッシュとして記憶されるので、ストレージの利用効率が向上する。また、本発明によれば、ラストワンデータについては、当該データを保管している情報処理装置100においてキャッシュ管理の評価値が低いものであっても、所定の条件で他の情報処理装置100のホットストレージ210に移動する。これにより、応答速度の遅いコールドストレージ220にアクセスする機会が減り、全体として応答速度が向上する。 As described above, according to the present invention, the data accessed by the data requesting terminal 2 is distributed to the plurality of clusters 400 by the information processing apparatuses 100 on the communication path, not by all the information processing apparatuses 100 on the communication path. Since it is divided and stored as a cache in the hot storage 210 of one information processing apparatus 100 in each cluster 400, storage utilization efficiency is improved. Further, according to the present invention, even if the cache management evaluation value of the last-one data is low in the information processing apparatus 100 that stores the data, it can be transferred to another information processing apparatus 100 under a predetermined condition. Move to hot storage 210 . This reduces the chances of accessing the cold storage 220, which has a slow response speed, and improves the response speed as a whole.

以上、本発明の一実施の形態について詳述したが、本発明は上記実施の形態に限定されるものではなく、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよい。 Although one embodiment of the present invention has been described in detail above, the present invention is not limited to the above-described embodiment, and various improvements and modifications may be made without departing from the gist of the present invention. .

例えば、上記実施の形態では、経路上ノードクラスタリングや変形LRUの処理において必要な情報は、自身の情報処理装置100又は他の情報処理装置100から取得していたが、これらの情報を他の情報管理装置で統括的に管理するとともに、各情報処理装置100は前記情報管理装置から前記情報を取得するようにしてもよい。また、経路上ノードクラスタリングや変形LRUにおける処理における一部を、他の情報管理装置で実施するようにしてもよい。この場合、当該一部の処理に必要な情報は、各情報処理装置100から取得するようにすればよい。情報管理装置10の配備位置は各情報処理装置100と通信可能であればよくネットワーク的な位置は不問である。このような実施形態の一例について図10及び図11を参照して説明する。 For example, in the above-described embodiment, information necessary for on-route node clustering and modified LRU processing was obtained from the own information processing device 100 or another information processing device 100, but such information is obtained from other information processing devices. Each information processing apparatus 100 may be configured to acquire the information from the information management apparatus while performing overall management by the management apparatus. In addition, part of the processes in on-route node clustering and modified LRU may be performed by another information management device. In this case, the information necessary for the partial processing may be acquired from each information processing apparatus 100 . The information management apparatus 10 may be installed at any position as long as it can communicate with each information processing apparatus 100, regardless of the network position. An example of such an embodiment will be described with reference to FIGS. 10 and 11. FIG.

本実施形態では、図10に示すように、前述の情報管理装置に相当する強制移動候補決定装置5を各情報処理装置100と通信可能に配備する。強制移動候補決定装置5は、各情報処理装置100のホットストレージ210における強制移動候補のランキングを統合的に管理するものであり、より具体的には、各ノードで最もコールドストレージ降格する又はキャッシュ削除されやすいデータのもつポイントを管理する機能を有する。各情報処理装置100は、強制移動候補決定装置5に問い合わせることによりデータを他の情報処理装置100に強制移動する否かを判定することができる。このような実施形態における情報処理装置100の実施例を図11に示す。 In this embodiment, as shown in FIG. 10, a forced migration candidate determination device 5 corresponding to the information management device described above is arranged so as to be communicable with each information processing device 100 . The forced migration candidate determination device 5 comprehensively manages the ranking of the forced migration candidates in the hot storage 210 of each information processing device 100. It has a function to manage the points of data that are likely to be stolen. Each information processing device 100 can determine whether or not to forcibly migrate data to another information processing device 100 by inquiring of the forced migration candidate determination device 5 . FIG. 11 shows an example of an information processing apparatus 100 in such an embodiment.

また、上記の各実施の形態において、例えば、上述のクラスタ分割数の算出、クラスタ内におけるデータ配置先の決定で用いる評価値P1(x)の算出、ホットストレージ210におけるデータの有用性に関する評価値P2(x)の算出で用いた数式は一例であり、他の数式やパラメータを用いることができる。パラメータは、例えば、リンク帯域、リンク利用率やQoS、メインパスからストレージまでの離れ具合(距離)、ストレージ容量、ストレージ存在地のユーザ数、これまでの歴史、以前にレプリカを作ったとかの歴史、Age of Informationの大小、レプリカ数の増減率、ストレージに繋がっているPublisher数、ストレージにストアされるオリジナルデータのスループット、データサイズ、トポロジ分岐数(隣接ノード数)、累計(過去)のアクセス回数、推定(将来)のアクセス回数、アクセス頻度、直近アクセス間隔、ストレージ容量に占める重複配置データの割合、生成元Publisherの最新データであるか否か(AoIがデータ生成間隔を下回っているか否か)、被利用データが重複配置データであるとき同じデータが現時点でどこに配置されているかなどの、リンク状況、データ特性、キャッシュ配置先のストレージ状況、ネットワークトポロジー、といった各種データ属性を任意に用いることができる。 Further, in each of the above embodiments, for example, the calculation of the number of cluster divisions, the calculation of the evaluation value P1(x) used in determining the data allocation destination in the cluster, and the evaluation value regarding the usefulness of the data in the hot storage 210 The formula used for calculating P2(x) is an example, and other formulas and parameters can be used. Parameters include, for example, link bandwidth, link utilization rate and QoS, distance (distance) from main path to storage, storage capacity, number of users in storage location, past history, history of making replicas before , Age of Information size, increase/decrease rate of number of replicas, number of Publishers connected to storage, throughput of original data stored in storage, data size, number of topology branches (number of adjacent nodes), cumulative (past) access count , estimated (future) number of accesses, access frequency, most recent access interval, ratio of redundantly arranged data to storage capacity, whether it is the latest data of the source publisher (whether AoI is less than the data generation interval) Various data attributes such as link status, data characteristics, cache location destination storage status, network topology, etc., such as where the same data is currently located when the data to be used is redundantly allocated data, can be used arbitrarily. can.

1…データ送信端末
2…データ要求端末
3…管理サーバ
10…ネットワーク
100…情報処理装置
210…ホットストレージ
220…コールドストレージ
300…データ配置制御部
400…クラスタ
DESCRIPTION OF SYMBOLS 1... Data transmission terminal 2... Data request terminal 3... Management server 10... Network 100... Information processing apparatus 210... Hot storage 220... Cold storage 300... Data arrangement control part 400... Cluster

Claims (6)

第1のストレージと、前記第1のストレージよりも応答速度が遅い第2のストレージと、前記第1のストレージ及び前記第2のストレージに格納するデータの配置を制御するデータ配置制御手段とを備えた複数の情報処理装置を相互にネットワークで接続して仮想的なストレージを形成した分散ストレージネットワークにおけるデータ管理方法であって、
分散ストレージネットワーク内のデータに対するユーザ端末からのアクセスに対して、前記ユーザ端末から前記データが格納された情報処理装置に至る通信経路上にある複数の情報処理装置のデータ配置制御手段が、前記通信経路上にある複数の情報処理装置を複数のクラスタに分割するとともに、各クラスタにおいて当該クラスタに属する情報処理装置の何れか1つの第1のストレージに前記データをキャッシュとして記憶するキャッシュ記憶ステップと、
各情報処理装置のデータ配置制御手段が、第1のストレージに記憶されている各データについて所定の規則に基づき評価値を算出し、最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されている場合は前記最低評価値のデータを第1のストレージから削除し、前記最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されていない場合は前記最低評価値のデータを第1のストレージから第2のストレージ又は他の情報処理装置の第1のストレージに移動させるデータ配置ステップとを備えた
ことを特徴とする分散ストレージネットワークにおけるデータ管理方法。
a first storage; a second storage having a response speed slower than that of the first storage; and data placement control means for controlling the placement of data stored in the first storage and the second storage. A data management method in a distributed storage network in which a plurality of information processing devices are connected to each other via a network to form a virtual storage,
In response to access from a user terminal to data in a distributed storage network, data arrangement control means of a plurality of information processing devices on a communication path from the user terminal to the information processing device in which the data is stored performs the communication. a cache storage step of dividing a plurality of information processing apparatuses on a path into a plurality of clusters and storing the data as a cache in a first storage of any one of the information processing apparatuses belonging to the cluster in each cluster;
The data arrangement control means of each information processing device calculates an evaluation value for each data stored in the first storage based on a predetermined rule, and the same data as the data with the lowest evaluation value is distributed to other data in the distributed storage network. is stored in the first storage of the information processing device, the data with the lowest evaluation value is deleted from the first storage, and the same data as the data with the lowest evaluation value is stored in other information in the distributed storage network and a data placement step of moving the data with the lowest evaluation value from the first storage to a second storage or the first storage of another information processing device if it is not stored in the first storage of the processing device. A data management method in a distributed storage network, characterized by:
前記キャッシュ記憶ステップは、前記クラスタの分割数を算出するステップと、前記通信経路上にある複数の情報処理装置間のリンク情報及び前記分割数に基づき前記のクラスタの分割位置を算出するステップとを含む
ことを特徴とする請求項1記載の分散ストレージネットワークにおけるデータ管理方法。
The cache storage step comprises: calculating the division number of the cluster; and calculating the division position of the cluster based on link information between a plurality of information processing apparatuses on the communication path and the division number. The data management method in a distributed storage network of claim 1, comprising:
前記データ配置ステップは、他の情報処理装置の第1のストレージに前記最低評価値よりも評価値が低いデータが記憶されている場合、前記最低評価値のデータを第1のストレージから前記他の情報処理装置の第1のストレージに移動させ、他の情報処理装置の第1のストレージに前記最低評価値よりも評価値が低いデータが記憶されていない場合、前記最低評価値のデータを第1のストレージから第2のストレージに移動させるステップを含む
ことを特徴とする請求項1又は2記載の分散ストレージネットワークにおけるデータ管理方法。
In the data arrangement step, when data having an evaluation value lower than the lowest evaluation value is stored in a first storage of another information processing device, the data having the lowest evaluation value is transferred from the first storage to the other information processing device. If data with an evaluation value lower than the lowest evaluation value is not stored in the first storage of another information processing device, the data with the lowest evaluation value is transferred to the first storage of the information processing device. 3. The method of managing data in a distributed storage network according to claim 1 or 2, further comprising the step of moving the data from the first storage to the second storage.
データ配置制御手段が、他の情報処理装置からデータが移動されてきた場合、前記データの評価値よりも低い評価値のデータを第1のストレージから第2のストレージに移動させるステップを含む
ことを特徴とする請求項3記載の分散ストレージネットワークにおけるデータ管理方法。
the data allocation control means, when data is moved from another information processing device, moving data with an evaluation value lower than the evaluation value of the data from the first storage to the second storage. 4. A data management method in a distributed storage network according to claim 3.
第1のストレージと、前記第1のストレージよりも応答速度が遅い第2のストレージと、前記第1のストレージ及び前記第2のストレージに格納するデータの配置を制御するデータ配置制御手段とを備えた複数の情報処理装置を相互にネットワークで接続して仮想的なストレージを形成した分散ストレージネットワークにおける情報処理装置であって、
前記データ配置制御手段は、
分散ストレージネットワーク内のデータに対するユーザ端末からのアクセスに対して、前記ユーザ端末から前記データが格納された情報処理装置に至る通信経路上にある複数の情報処理装置を複数のクラスタに分割する分割処理手段と、
各クラスタについて当該クラスタに属する情報処理装置のうち前記データをキャッシュとして記憶する1つの情報処理装置を決定するとともに自身に前記データを記憶すると決定した場合には第1のストレージに前記データをキャッシュとして記憶する配置先決定処理手段と、
第1のストレージに記憶されている各データについて所定の規則に基づき評価値を算出する評価値算出手段と、
最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されている場合は前記最低評価値のデータを第1のストレージから削除し、前記最低評価値のデータと同一のデータが分散ストレージネットワーク内の他の情報処理装置の第1のストレージに保存されていない場合は前記最低評価値のデータを第1のストレージから第2のストレージ又は他の情報処理装置の第1のストレージに移動させるデータ配置処理手段とを備えた
ことを特徴とする分散ストレージネットワークにおける情報処理装置。
a first storage; a second storage having a response speed slower than that of the first storage; and data placement control means for controlling the placement of data stored in the first storage and the second storage. An information processing device in a distributed storage network in which a plurality of information processing devices are interconnected via a network to form a virtual storage,
The data arrangement control means is
Division processing for dividing a plurality of information processing devices on a communication path from the user terminal to the information processing device storing the data into a plurality of clusters in response to access from the user terminal to data in the distributed storage network. means and
For each cluster, one of the information processing devices belonging to the cluster is determined to store the data as a cache, and when it is determined to store the data in itself, the data is stored in a first storage as a cache. placement destination determination processing means for storing;
Evaluation value calculation means for calculating an evaluation value based on a predetermined rule for each data stored in the first storage;
If the same data as the data with the lowest evaluation value is stored in the first storage of another information processing device in the distributed storage network, the data with the lowest evaluation value is deleted from the first storage, and the data with the lowest evaluation value is deleted. If the same data as the value data is not stored in the first storage of another information processing device in the distributed storage network, the data of the lowest evaluation value is transferred from the first storage to the second storage or other information An information processing device in a distributed storage network, comprising data arrangement processing means for moving data to a first storage of the processing device.
コンピュータを、前記請求項5記載のデータ配置制御手段として機能させることを特徴とするプログラム。 A program that causes a computer to function as the data arrangement control means according to claim 5.
JP2020027917A 2020-02-21 2020-02-21 Data management method, device and program in distributed storage network Active JP7174372B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020027917A JP7174372B2 (en) 2020-02-21 2020-02-21 Data management method, device and program in distributed storage network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020027917A JP7174372B2 (en) 2020-02-21 2020-02-21 Data management method, device and program in distributed storage network

Publications (2)

Publication Number Publication Date
JP2021131796A JP2021131796A (en) 2021-09-09
JP7174372B2 true JP7174372B2 (en) 2022-11-17

Family

ID=77551085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020027917A Active JP7174372B2 (en) 2020-02-21 2020-02-21 Data management method, device and program in distributed storage network

Country Status (1)

Country Link
JP (1) JP7174372B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117348820A (en) * 2023-12-04 2024-01-05 浪潮云信息技术股份公司 Data processing method, system, equipment and storage medium of distributed system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157042A1 (en) 2012-04-20 2013-10-24 株式会社日立製作所 Distributed application and data hosting system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157042A1 (en) 2012-04-20 2013-10-24 株式会社日立製作所 Distributed application and data hosting system

Also Published As

Publication number Publication date
JP2021131796A (en) 2021-09-09

Similar Documents

Publication Publication Date Title
US6542967B1 (en) Cache object store
KR101228230B1 (en) Methods and apparatus for self-organized caching in a content delivery network
US8463846B2 (en) File bundling for cache servers of content delivery networks
CN112822050B (en) Method and apparatus for deploying network slices
US11886732B2 (en) Data storage server with multi-memory migration
Dutta et al. Caching scheme for information‐centric networks with balanced content distribution
CN108366089B (en) CCN caching method based on content popularity and node importance
Ardelius et al. On the effects of caching in access aggregation networks
US20030236885A1 (en) Method for data distribution and data distribution system
JP7174372B2 (en) Data management method, device and program in distributed storage network
JP4573732B2 (en) Servant device
Lal et al. A popularity based content eviction scheme via betweenness-centrality caching approach for content-centric networking (CCN)
CN114651433A (en) Access pattern driven data placement in cloud storage
JP5192506B2 (en) File cache management method, apparatus, and program
CN114095573B (en) Content copy placement method of CDN-P2P network based on edge cache
Ling et al. An adaptive caching algorithm suitable for time-varying user accesses in VOD systems
Mishra et al. An efficient content replacement policy to retain essential content in information-centric networking based internet of things network
KR20220078244A (en) Method and edge server for managing cache file for content fragments caching
Ait-Oucheggou et al. When iot data meets streaming in the fog
CN113992653B (en) CDN-P2P network content downloading, pre-storing and replacing method based on edge cache
CN114124971B (en) Content copy placement method of CDN-P2P network based on edge cache
JP2004264956A (en) Method for managing cache, and cache server capable of using this method
CN116633921A (en) CDN-P2P network based on edge cache, cache method and cache placement method
KR101690944B1 (en) Method and apparatus for managing distributed cache in consideration of load distribution in heterogeneous computing environment
Lee et al. Dtstorage: Dynamic tape-based storage for cost-effective and highly-available streaming service

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20200225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221026

R150 Certificate of patent or registration of utility model

Ref document number: 7174372

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150