JP7014233B2 - 情報処理装置、制御方法、及びプログラム - Google Patents

情報処理装置、制御方法、及びプログラム Download PDF

Info

Publication number
JP7014233B2
JP7014233B2 JP2019562855A JP2019562855A JP7014233B2 JP 7014233 B2 JP7014233 B2 JP 7014233B2 JP 2019562855 A JP2019562855 A JP 2019562855A JP 2019562855 A JP2019562855 A JP 2019562855A JP 7014233 B2 JP7014233 B2 JP 7014233B2
Authority
JP
Japan
Prior art keywords
data
representative data
representative
threshold value
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019562855A
Other languages
English (en)
Other versions
JPWO2019130926A1 (ja
Inventor
諭史 吉田
健一郎 石川
祥治 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019130926A1 publication Critical patent/JPWO2019130926A1/ja
Application granted granted Critical
Publication of JP7014233B2 publication Critical patent/JP7014233B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0643Management of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はデータの分散記憶に関する。
複数の計算資源にデータを分散させるシステムが開発されている。例えば特許文献1には、複数の計算資源に対してデータを分散させる際に、各計算資源に割り振るデータをほぼ均等にしつつ、同一の計算資源に配置するデータの類似度が大きくならないようにする技術を開示している。
特開2016-45850号公報
本発明者は、複数の記憶領域に対してデータを分散して記憶させる新たな技術を見出した。本発明の目的の一つは、複数の記憶領域に対してデータを分散して記憶させる新たな技術を提供することである。
本発明の情報処理装置は、1)対象データを取得し、取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価手段と、2)代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする対象データの評価値がその代表データに対応する閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする対象データの評価値がその代表データに対応する閾値と前記所定の関係を満たす場合に、その代表データに対応する記憶領域に対象データを記憶させる割当手段と、3)代表データに対応する記憶領域に記憶されているデータの合計サイズ、又は代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する閾値を更新する更新手段と、を有する。
本発明の制御方法は、コンピュータによって実行させる制御方法である。当該制御方法は、1)対象データを取得し、取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価ステップと、2)代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする対象データの評価値がその代表データに対応する閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする対象データの評価値がその代表データに対応する閾値と所定の関係を満たす場合に、その代表データに対応する記憶領域に対象データを記憶させる割当ステップと、3)代表データに対応する記憶領域に記憶されているデータの合計サイズ、又は代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する閾値を更新する更新ステップと、を有する。
本発明のプログラムは、コンピュータに、本発明の制御方法が有する各ステップを実行させる。
本発明によれば、複数の記憶領域に対してデータを分散して記憶させる新たな技術が提供される。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
実施形態1の情報処理装置の概要を説明するための図である。 実施形態1の情報処理装置の機能構成を例示する図である。 情報処理装置を実現するための計算機を例示する図である。 情報処理装置の利用環境を例示する図である。 実施形態1の情報処理装置によって実行される処理の流れを例示するフローチャートである。 実施例1の類似度木を例示する図である。 実施例1の分散システムを例示する図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。また、特に説明する場合を除き、各ブロック図において、各ブロックは、ハードウエア単位の構成ではなく、機能単位の構成を表している。
[実施形態1]
<概要>
図1は、実施形態1の情報処理装置(図2に示す情報処理装置2000)の概要を説明するための図である。以下で説明する情報処理装置2000の動作は、情報処理装置2000の理解を容易にするための例示であり、情報処理装置2000の動作は以下の例に限定されるわけではない。情報処理装置2000の動作の詳細やバリエーションについては後述する。
情報処理装置2000は、記憶領域に記憶させるデータ(以下、対象データ)を、複数の記憶領域のいずれに記憶させるかを決定する装置である。各記憶領域は、代表データと対応づけられている。また代表データには、後述する判定処理で利用する閾値も対応づけられている。以下、代表データに対して記憶領域と閾値とを対応づけている情報を、管理情報と呼ぶ。
情報処理装置2000は、対象データを取得すると、その対象データと各代表データとの間で評価値(例えば対象データと代表データとの類似度)を算出する。さらに情報処理装置2000は、代表データごとに、その代表データと対象データとの間で算出した評価値が、その代表データに対応する閾値と所定の関係を満たすか否かを判定する。評価値として対象データと代表データとの類似度を算出する場合、所定の関係は、例えば、「対象データと代表データとの類似度が、その代表データに対応する閾値以上である」という関係である。
対象データと或る代表データとの間で算出された評価値が、その代表データにする閾値と所定の関係を満たすと判定された場合、情報処理装置2000は、その代表データに対応する記憶領域に対象データを記憶させる。なお、評価値と閾値が所定の関係を満たすと判定される代表データが複数存在するケースについては後述する。
さらに情報処理装置2000は、各代表データに対応する閾値を更新する機能を有する。或る代表データに対応する閾値の更新は、その代表データに対応する記憶領域に記憶されているデータの合計サイズ若しくは合計数、又はその代表データに対応する記憶領域の空き容量に基づいて行われる。
<作用・効果>
本実施形態の情報処理装置2000によれば、代表データを基準とする対象データの評価値がその代表データに対応する閾値と所定の関係を満たす場合に、対象データが、その代表データに対応する記憶領域に記憶される。そして、代表データに対応する閾値は、その代表データに対応する記憶領域に記憶されているデータの合計サイズ若しくは合計数、又はその代表データに対応する記憶領域の空き容量に基づいて更新される。
概念的には、情報処理装置2000は、代表データに対応する記憶領域10に記憶されているデータの量が多くなるほど、その代表データを基準とした対象データの評価値とその代表データに対応する閾値との間で、前述した所定の関係が満たされる蓋然性が低くなるように、その代表データに対応する閾値を更新する。こうすることで、代表データに対応する記憶領域10に記憶されているデータの量が多くなるほど、その代表データに対応する記憶領域10に対象データが記憶される蓋然性を低くすることができる。このように情報処理装置2000は、閾値を更新することで各記憶領域10に対象データが記憶される蓋然性を調整することにより、記憶領域10に記憶されるデータの量が複数の記憶領域10の間でバランスするようにする。よって、閾値の更新という簡易な方法で各記憶領域に記憶されるデータの量をバランスさせることができるようになる。
この方法によれば、新たな記憶領域10を容易に追加できるという利点もある。代表データに対応する記憶領域10に記憶されているデータの量が多いほどその記憶領域10に対象データが記憶される蓋然性が低いということは、新たに追加されたために記憶されているデータの量が少ない記憶領域10に対して対象データが記憶される蓋然性が高くなるということである。そのため、情報処理装置2000によれば、新たに追加した記憶領域10も含めて、記憶領域10間のデータ量がバランスしていく。そのため、新たに追加した記憶領域10へ既存の記憶領域10からデータを移動することで記憶領域10間のデータ量をバランスさせるという作業が不要となる。すなわち、新たな記憶領域10を追加することが容易である。
以下、本実施形態の情報処理装置2000についてさらに詳細に説明する。
<情報処理装置2000の機能構成の例>
図2は、実施形態1の情報処理装置2000の機能構成を例示する図である。情報処理装置2000は、評価部2020、割当部2040、及び更新部2060を有する。評価部2020は、対象データを取得する。評価部2020は、取得した対象データについて、複数の代表データそれぞれを基準とした評価値を算出する。割当部2040は管理情報を取得する。割当部2040は、管理情報を利用して、各代表データを基準として算出した対象データの評価値が、その代表データに対応する閾値と所定の関係を満たすか否かを判定する。評価値が或る代表データに対応する閾値と所定の関係を満たす場合、割当部2040は、その代表データに対応する記憶領域10に対象データを格納させる。更新部2060は、代表データに対応する記憶領域10に記憶されているデータの合計サイズ若しくは合計数、又は代表データに対応する記憶領域10の空き容量に基づいて、その代表データに対応する閾値を更新する。
<情報処理装置2000のハードウエア構成>
情報処理装置2000の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、情報処理装置2000の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図3は、情報処理装置2000を実現するための計算機1000を例示する図である。計算機1000は任意の計算機である。例えば計算機1000は、Personal Computer(PC)やサーバマシンなどである。計算機1000は、情報処理装置2000を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。
計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース1100は、計算機1000と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。
ネットワークインタフェース1120は、計算機1000をネットワークに接続するためのインタフェースである。この通信網は、例えば LAN(Local Area Network)や WAN(Wide Area Network)である。ネットワークインタフェース1120がネットワークに接続する方法は、無線接続であってもよいし、有線接続であってもよい。図4において、記憶領域10は、ネットワークを介して計算機1000と接続されている。
ストレージデバイス1080は、情報処理装置2000の各機能構成部を実現するプログラムモジュールを記憶している。プロセッサ1040は、これら各プログラムモジュールをメモリ1060に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
<記憶領域10について>
記憶領域10は、データを記憶させることができる任意の記憶領域である。例えば記憶領域10は、1つの物理的な記憶装置である。その他にも例えば、記憶領域10は、1つの仮想的な記憶装置である。ここで、仮想的な記憶装置は、1つの物理的な記憶装置の一部であってもよいし、複数の物理的な記憶装置を組み合わせたものであってもよい。なお、1つの物理的な記憶装置の一部を仮想的に1つの記憶装置として扱う技術や、複数の物理的な記憶装置を組み合わせて仮想的に1つの記憶装置として扱う技術には、既存の技術を利用することができる。
<情報処理装置2000の利用例>
情報処理装置2000の理解を容易にするため、情報処理装置2000の利用環境を例示する。図4は、情報処理装置2000の利用環境を例示する図である。図4では、情報処理装置2000及び複数の記憶領域10によって、分散記憶システム3000が構築されている。情報処理装置2000は、分散記憶システム3000のゲートウェイサーバとして機能する。具体的には、情報処理装置2000は、分散記憶システム3000を利用するクライアント50から、記憶領域10へデータを書き込むリクエスト(以下、書き込みリクエスト)や、記憶領域10からデータを読み込むリクエスト(以下、読み込みリクエスト)を受信する。
図4では、クライアント50から書き込みリクエストが送信されている。書き込みリクエストには、前述した対象データが含まれる。情報処理装置2000は、書き込みリクエストに含まれる対象データについて前述した各処理を行うことにより、その対象データを記憶させる記憶領域10を決定し、その記憶領域10に対象データを記憶させる。図4において、情報処理装置2000は、記憶領域10-nを、対象データを記憶させる記憶領域10として決定している。そのため、対象データが記憶領域10-nへ送信されている。
<処理の流れ>
図5は、実施形態1の情報処理装置2000によって実行される処理の流れを例示するフローチャートである。評価部2020は対象データを取得する(S102)。割当部2040は管理情報を取得する(S104)。S106からS112は、複数の代表データそれぞれについて実行されるループ処理である。S106において、情報処理装置2000は、既に全ての代表データを対象にループ処理Aを実行したか否かを判定する。既に全ての代表データを対象にループ処理Aを実行した場合、図5の処理は終了する。一方、まだループ処理Aの対象としていない代表データがある場合、情報処理装置2000は、そのうちの1つを対象にループ処理Aを実行する。ここでループ処理Aの対象とする代表データを、代表データiと表記する。
評価部2020は、代表データiを基準として対象データの評価値を算出する(S108)。割当部2040は、代表データiを基準として算出された評価値が、代表データiに対応する閾値と所定の関係を満たすか否かを判定する(S110)。代表データiを基準として算出された評価値が代表データiに対応する閾値と所定の関係を満たさない場合(S110:NO)、図5の処理はS106に進む(S112)。
代表データiを基準として算出された評価値が代表データiに対応する閾値と所定の関係を満たす場合(S110:YES)、割当部2040は、代表データiに対応する記憶領域10に対象データを格納させる(S114)。更新部2060は、代表データiに対応する記憶領域10に記憶されているデータの合計サイズ若しくは合計数、又は代表データiに対応する記憶領域10の空き容量に基づいて、代表データiに対応する閾値を更新する(S116)。
なお、図5は、情報処理装置2000によって実行される処理の流れの一例であり、情報処理装置2000によって実行される処理の流れは図5の例に限定されない。例えば図5では、或る1つの代表データを基準として算出された評価値が閾値と所定の関係を満たしたら、その代表データに対応する記憶領域10に対象データが記憶される。しかし情報処理装置2000は、全ての代表データそれぞれを基準として算出された評価値が閾値と所定の関係を満たすか否かを判定した後に、評価値が閾値と所定の関係を満たすと判定された代表データの中から1つを選択し、選択した代表データに対応する記憶領域10に対象データを記憶させてもよい。
<対象データの取得:S102>
評価部2020は対象データを取得する(S102)。ここで、情報処理装置2000が記憶領域10に記憶させる対象データを取得する方法は様々である。例えば情報処理装置2000は、他のコンピュータから送信される対象データを取得する。他のコンピュータから送信される対象データは、例えば前述した書き込みリクエストに含まれる対象データである。その他にも例えば、情報処理装置2000は、情報処理装置2000に接続されている入力デバイスを用いて入力されたデータを、対象データとして取得する。
<管理情報の取得:S104>
割当部2040は管理情報を取得する(S104)。管理情報は、割当部2040からアクセス可能な記憶装置(例えばストレージデバイス1080)に予め記憶させておく。割当部2040は、この記憶装置にアクセスすることで管理情報を取得する。
<評価値の算出:S108>
評価部2020は、代表データを基準とした対象データの評価値を算出する(S108)。評価値の算出方法は様々である。例えば評価部2020は、代表データと対象データとの類似度を算出し、算出した類似度を、代表データを基準とする対象データの評価値とする。ここで、データ間の類似度を算出する手法には、種々の既存の手法を利用することができる。例えば代表データと対象データがいずれも、画像データであるとする。この場合、例えば評価部2020は、代表データから抽出される特徴量と、対象データから抽出される特徴量との類似度を、代表データと対象データとの類似度として算出する。なお、代表データから抽出される特徴量は予め管理情報に含めておくことが好適である。
その他にも例えば、評価部2020は、代表データと対象データとの距離を算出し、この距離を、代表データを基準とする対象データの評価値としてもよい。例えば代表データと対象データがいずれも多次元データであるとする。この場合、評価部2020は、代表データと対象データとについて多次元空間上の距離を算出し、この距離を評価値とする。なお、データ間の距離を算出する技術には既存の技術を利用することができる。
<対象データの格納:S114>
割当部2040は、評価値が閾値と所定の関係を満たすと判定された代表データに対応する記憶領域10に、対象データを記憶させる(S114)。なお、所望の記憶領域にデータを記憶させる技術には、既存の技術を利用することができる。
ここで、上記所定の関係は、評価値の定め方に依存する。例えば、代表データと対象データとの類似度を、その代表データを基準とする対象データの評価値とする。この場合、例えば「代表データを基準とする対象データの評価値が、その代表データに対応する閾値以上である」という関係を、所定の関係として用いる。すなわち、割当部2040は、図4のS114において、代表データiと対象データとの類似度が、対象データiに対応する閾値以上であるか否かを判定する。そして、代表データiと対象データとの類似度が、対象データiに対応する閾値以上である場合に、代表データiについて、評価値が閾値と所定の関係を満たすと判定される。
その他にも例えば、代表データと対象データとの距離を、その代表データを基準とする対象データの評価値とする。この場合、例えば「代表データを基準とする対象データの評価値が、その代表データに対応する閾値以下である」という関係を、所定の関係として用いる。すなわち、割当部2040は、図4のS114において、代表データiと対象データの距離が、対象データiに対応する閾値以下であるか否かを判定する。そして、代表データiと対象データの距離が、対象データiに対応する閾値以下である場合に、代表データiについて、評価値が閾値と所定の関係を満たすと判定される。
ここで、評価値が閾値と所定の関係を満たす代表データが、複数存在する可能性がある。この場合、割当部2040は、評価値が閾値と所定の関係を満たす代表データのうち、いずれか1つの代表データに対応する記憶領域10に対して対象データを記憶させる。例えば割当部2040は、各代表データについて、逐次的に、評価値が閾値と所定の関係を満たすか否かを判定していく(図5参照)。割当部2040は、或る代表データについて評価値が閾値と所定の関係を満たすと判定されたら、その代表データに対応する記憶領域10に対象データを記憶させる。複数の代表データについての処理が逐次的に行われるため、最初に評価値が閾値と所定の関係を満たすと判定された代表データに対応する記憶領域10に、対象データが記憶される。
ここで、代表データの処理順を決める方法は様々である。例えば割当部2040は、管理情報に示されている順に代表データを処理する。その他にも例えば、割当部2040は、対応する記憶領域10に記憶されているデータの合計数が少ない順に代表データを処理する。その他にも例えば、割当部2040は、対応する記憶領域10に記憶されているデータの合計サイズが小さい順に、代表データを処理する。その他にも例えば、割当部2040は、代表データに対応する記憶領域10の空き容量が大きい順に、代表データを処理する。
評価値が閾値と所定の関係を満たす代表データのいずれか1つに対応する記憶領域10に対して対象データを記憶させる方法は上述の方法には限定されない。例えば割当部2040は、評価値が閾値と所定の関係を満たす代表データ間で評価値の比較を行うことで、対象データを記憶させる記憶領域10を決定する。例えば評価値が、対象データと代表データの類似度として定められるとする。この場合、例えば割当部2040は、対象データとの類似度が閾値以上である代表データのうち、対象データとの類似度が最大である代表データに対応する記憶領域10に、対象データを記憶させる。また、評価値が、対象データと代表データの距離として定められるとする。この場合、例えば割当部2040は、対象データとの距離が閾値以下である代表データのうち、対象データとの距離が最小である代表データに対応する記憶領域10に、対象データを記憶させる。
その他にも例えば、割当部2040は、評価値が閾値と所定の関係を満たす各代表データについて、評価値と閾値との乖離度(例えば、評価値と閾値の差分の絶対値を、閾値で除算した値)を算出し、その乖離度が最も大きい代表データに対応する記憶領域10に、対象データを記憶させる。その他にも例えば、割当部2040は、評価値が閾値と所定の関係を満たす各代表データに対応する記憶領域10のうち、記憶されているデータの合計数が最小の記憶領域10に対象データを記憶させる。その他にも例えば、割当部2040は、評価値が閾値と所定の関係を満たす各代表データに対応する記憶領域10のうち、記憶されているデータの合計サイズが最小の記憶領域10に対象データを記憶させる。その他にも例えば、割当部2040は、評価値が閾値と所定の関係を満たす各代表データに対応する記憶領域10のうち、空き容量が最大の記憶領域10に対象データを記憶させる。
<評価値が閾値以上となる代表データが存在しない場合について>
評価値が閾値と所定の関係を満たす代表データが存在しないこともある。すなわち、全ての代表データについて、代表データを基準とする対象データの評価値が、その代表データに対応する閾値と所定の関係を満たさないケースである。
この場合、例えば割当部2040は、対象データを新たな代表データとして扱う。すなわち割当部2040は、対象データを、新たな代表データとして管理情報に追加する。この際、割当部2040は、新たな代表データとする対象データに対し、記憶領域10と閾値を対応づける。
新たな代表データに対応づける記憶領域10を決定する方法は様々である。例えば割当部2040は、いずれの代表データにも対応づけられていない記憶領域10を、新たな代表データに対応づける。その他にも例えば、割当部2040は、既に他の代表データに対応する記憶領域10のうち、記憶されているデータの合計数が最も少ない記憶領域10、記憶されているデータの合計サイズが最も小さい記憶領域10、又は空き容量が最も多い記憶領域10を、新たな代表データに対応づける。
新たな代表データに対応づける閾値を決定する方法は様々である。例えば、予めデフォルトの閾値を定めておき、新たな代表データにはこのデフォルトの閾値を対応づける。その他にも例えば、割当部2040は、新たな代表データに対応づける記憶領域10に記憶されているデータの合計数若しくは合計サイズ、又はその記憶領域10の空き容量に基づいて、新たな代表データに対応づける閾値を算出してもよい。ここで、代表データに対応する記憶領域10に記憶されているデータの合計数若しくは合計サイズ、又はその記憶領域10の空き容量に基づいて、その代表データに対応づける閾値を算出する具体的な方法には、それらに基づいて閾値を更新する後述の方法と同様の方法を採用できる。
なお、評価値が閾値と所定の関係を満たす代表データが存在しない場合において、必ずしも代表データを新たな代表データとする必要はない。例えば割当部2040は、評価値が閾値と所定の関係を満たす代表データが存在しない場合、対象データを破棄してもよい。この場合、対象データは、いずれの記憶領域10にも記憶されず、管理情報にも追加されない。
対象データを破棄する場合、その旨の通知が行われることが好適である。例えば図5に示すように情報処理装置2000がゲートウェイサーバとして機能する場合において対象データが破棄された場合、情報処理装置2000は、書き込みリクエストに対するレスポンスとして、対象データが破棄されたことを示す通知を送信する。
<閾値の更新:S116>
割当部2040は、代表データに対応する記憶領域10に記憶されているデータの合計サイズ若しくは合計数、又はその記憶領域10の空き容量に基づいて、その代表データに対応する閾値を更新する(S116)。以下、記憶領域10に記憶されているデータの合計サイズ、記憶領域10に記憶されているデータの合計数、及び記憶領域10の空き容量を総称して、記憶領域10の更新指標値と呼ぶ。
前述したように、概念的には、割当部2040は、代表データに対応する記憶領域10に記憶されているデータの量が多くなるほど、その代表データを基準とした対象データの評価値とその代表データに対応する閾値との間で、前述した所定の関係が満たされる蓋然性が低くなるように、その代表データに対応する閾値を更新する。例えば、代表データを基準とする対象データの評価値を、その代表データと対象データの類似度として定めるとする。この場合、更新部2060は、代表データに対応する記憶領域10に記憶されているデータの量が多くなるほど、その代表データに対応する閾値を大きくする。こうすることで、「評価値が閾値以上である」という所定の関係が満たされる蓋然性が低くなる。その他にも例えば、代表データを基準とする対象データの評価値を、その代表データと対象データの距離として定めるとする。この場合、更新部2060は、代表データに対応する記憶領域10に記憶されているデータの量が多くなるほど、その代表データに対応する閾値を小さくする。こうすることで、「評価値が閾値以下である」という所定の関係が満たされる蓋然性が低くなる。
代表データに対応する閾値を更新する具体的な方法は様々である。例えば、代表データに対応する記憶領域10の更新指標値から、その代表データに対応する閾値を算出する関数を予め定めておく。代表データを基準とする対象データの評価値をその代表データと対象データの類似度として定める場合、この関数は、代表データに対応する記憶領域10に記憶されているデータの合計サイズ若しくは合計数が増加するほど単調非減少する関数、又は代表データに対応する記憶領域10の空き容量が減少するほど単調非減少する関数として定義する。代表データを基準とする対象データの評価値をその代表データと対象データの距離として定める場合、この関数は、代表データに対応する記憶領域10に記憶されているデータの合計サイズ若しくは合計数が増加するほど単調非増加する関数、又は代表データに対応する記憶領域10の空き容量が減少するほど単調非増加する関数として定義する。割当部2040は、閾値を更新する代表データの記憶領域10の更新指標値をこの関数に適用することで、その代表データの新たな閾値を算出し、算出した閾値で管理情報を更新する。
その他にも例えば、記憶領域10の更新指標値の複数の範囲それぞれに対応づけて閾値を示すテーブルを予め定義しておいてもよい。割当部2040は、閾値を更新する代表データに対応する記憶領域10の更新指標値が、このテーブルに示されている複数の範囲のいずれに含まれるのかを特定する。そして割当部2040は、特定した範囲に対応する閾値を、その代表データに対応する新たな閾値とする。
割当部2040が代表データに対応する閾値を更新するタイミングは様々である。例えば割当部2040は、或る代表データに対応する記憶領域10に対象データを記憶させた場合に、その代表データに対応する閾値を更新する。ただし、前述した各方法で得られた閾値が現在の閾値と同じである場合、更新部2060は、閾値を更新しなくてもよい。
閾値の更新は、必ずしも対象データが記憶される度に行われる必要はない。例えば更新部2060は、代表データに対応する記憶領域10に対して所定の回数対象データを記憶させる度に、その代表データに対応する閾値の更新を行う。
[実施例]
情報処理装置2000のより具体的な実現方法を、実施例として説明する。実施例1では、情報処理装置2000が類似度木を分散管理する。類似度木の詳細は国際公開第2014/109127号に開示されている。
図6は、実施例1の類似度木20を例示する図である。類似度木20は、複数のノードを有する木構造のデータ構造である。本実施例において、各ノードは顔画像を含む。また、最下層以外のノードは直下のノードへのポインタをさらに含む。ルートノードが示す顔画像は、前述した代表データに相当する。以下、ルートノードが示す顔画像を、代表顔画像とも呼ぶ。
類似度木20は、3階層となっている。ルートノードが位置する層を第1層、第1層の下の層を第2層、第2層の下の層を第3層とそれぞれ表記する。第1層に位置する各ノード(ルートノード)は、互いにあまり似ていない顔画像を示す。第2層において、同一のルートノードの直下に位置する各ノードは、互いにある程度似ている(類似度合いが中程度)の顔画像を示す。第3層において、同一の第2層のノードの直下に位置する各ノードは、互いによく似ている(類似度合いが大きい)顔画像を示す。例えば、第3層において、同一の第2層のノードの直下に位置する各ノードは、同一人物の顔を表す顔画像を示す。
図7は、実施例1の分散記憶システム3000を例示する図である。分散記憶システム3000は、ゲートウェイサーバ30と複数のストレージサーバ40を有する。ゲートウェイサーバ30は情報処理装置2000として機能し、ストレージサーバ40は記憶領域10として機能する。
類似度木20において、ルートノードが示す顔画像は代表データに相当する。以下、ルートノードが示す顔画像を、代表顔画像とも表記する。ゲートウェイサーバ30が利用する管理情報は、代表顔画像に対応づけて、閾値及びストレージサーバ40の識別子を示す。
ゲートウェイサーバ30は、或るルートノードの下位にある全てのノードを、そのルートノードが示す代表顔画像に対応するストレージサーバ40に記憶させる。すなわち、ルートノードの下位にぶら下がる木構造を構成する全てのデータはいずれも、同一のストレージサーバ40に記憶される。なお、複数のルートノードにぶら下がる木構造、すなわち複数の木構造を1つのストレージサーバ40に記憶させてもよい。
ゲートウェイサーバ30は、類似度木に新たに加える対象データを示す書き込みリクエストを受信する。以下、対象データとして取得した顔画像を対象顔画像とも表記する。ゲートウェイサーバ30は、代表顔画像を基準とする対象顔画像の評価値として、その代表顔画像と対象顔画像との類似度を算出する。ゲートウェイサーバ30は、対象顔画像と代表顔画像との類似度が、その代表顔画像に対応する閾値以上である場合に、その代表顔画像を示すルートノードよりも下の層に、その対象顔画像を示すノードを追加する。すなわちこのノードは、その代表顔画像に対応するストレージサーバ40に記憶される。
ゲートウェイサーバ30は、代表顔画像に対応する閾値を、その代表顔画像を示すルートノードの下位に存在するノードの合計数若しくは合計データサイズ、又はその代表顔画像に対応するストレージサーバ40の空き容量に基づいて、その代表顔画像に対応する閾値を更新する。例えばルートノードの下位に存在するノードの合計数を利用する場合、ルートノードの下位に存在するノードの合計数が多くなるほど、そのルートノードが示す代表顔画像に対応する閾値が大きい値に更新される。
対象顔画像と代表顔画像の類似度が閾値以上となる代表顔画像が存在しない場合、ゲートウェイサーバ30は、対象顔画像を新たな代表顔画像として扱う。そのため、ゲートウェイサーバ30は、その新たな代表顔画像を示すルートノードを新たに生成する。またゲートウェイサーバ30は、新たな代表顔画像に対して閾値とストレージサーバ40を対応づけた管理情報を生成する。
ここで、ストレージサーバ40が足りなくなった場合、分散記憶システム3000に対して新たにストレージサーバ40が追加される。この際、既存のノードの移動は不要である。なぜなら、追加したストレージサーバ40は、今後新たなルートノードが生成された場合に、そのルートノードの下位ノードを記憶するための記憶領域として利用すればよいためである。
ゲートウェイサーバ30は、類似度木から顔画像を読み込むための読み込みリクエストも処理する。例えばゲートウェイサーバ30は、読み込みリクエストに示されている顔画像と類似する1つ以上の顔画像を類似度木から読み出し、読み出した1つ以上の顔画像を含めたレスポンスを送信する。そのためにゲートウェイサーバ30は、読み込みリクエストに示される顔画像をストレージサーバ40に送信する。この顔画像を受信したストレージサーバ40は、その顔画像との類似度が高い(例えば類似度が所定値以上である)顔画像を読み出してゲートウェイサーバ30に送信する。こうすることで、読み込みリクエストに示される顔画像との類似度が高い顔画像が、各ストレージサーバ40から収集される。
ただしゲートウェイサーバ30は、読み込みリクエストに示される顔画像を全てのストレージサーバ40に送信するのではなく、その顔画像と類似する顔画像を記憶している蓋然性が高いストレージサーバ40のみに送信することが好ましい。具体的にはゲートウェイサーバ30は、読み込みリクエストが示す顔画像と各代表顔画像との類似度を算出し、その類似度が所定の閾値以上である代表顔画像に対応するストレージサーバ40へ、読み込みリクエストが示す顔画像を送信する。ここで利用される所定の閾値は、これまでに代表顔画像に対応づけられたいずれの閾値よりも小さい値とする。さもないと、ストレージサーバ40から読み出せない顔画像が存在するようになってしまうためである。
上述した実施例によれば、類似度木を構成するノードを複数のストレージサーバ40に分散して記憶させる際に、代表顔画像に対応する閾値を更新するという簡易な方法により、各ストレージサーバ40に記憶されるノードの量をストレージサーバ40間でバランスさせることができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
1. 対象データを取得し、前記取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価手段と、
代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と前記所定の関係を満たす場合に、その代表データに対応する前記記憶領域に前記対象データを記憶させる割当手段と、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズ若しくは合計数、又は前記代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する前記閾値を更新する更新手段と、を有する情報処理装置。
2. 前記更新手段は、前記代表データに対応する記憶領域に記憶されているデータの量が多いほど、その代表データに対応する閾値とその代表データを基準とする前記対象データとが前記所定の関係を満たす蓋然性が低くなるように、その対象データに対応する閾値を更新する、1.に記載の情報処理装置。
3. 前記割当手段は、全ての代表データについて、前記評価値がその代表データに対応する閾値との間で前記所定の関係を満たさないと判定された場合に、前記対象データを新たな代表データとする前記管理情報を生成する、1.又は2.に記載の情報処理装置。
4. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データの類似度を表し、
前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以上であることである、1.乃至3.いずれか一つに記載の情報処理装置。
5. 前記更新手段は、
前記代表データに対応する記憶領域に記憶されているデータの合計数が多くなるほど、その代表データに対応する閾値を大きくするか、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を大きくするか、又は、
前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を大きくする、4.に記載の情報処理装置。
6. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データとの間の距離を表し、
前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以下であることである、1.乃至3.いずれか一つに記載の情報処理装置。
7. 前記更新手段は、
前記代表データに対応する記憶領域に記憶されているデータの合計数が多くなるほど、その代表データに対応する閾値を小さくするか、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を小さくするか、又は、
前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を小さくする、6.に記載の情報処理装置。
8. 各前記記憶領域は、ストレージシステムを構成するストレージサーバであり、
前記評価手段は、他の装置から、前記対象データを前記ストレージシステムに記憶させるリクエストを受信し、前記リクエストに示されている対象データを取得し、
前記割当手段は、前記対象データを記憶させる前記ストレージサーバに対して前記対象データを送信する、1.乃至7.いずれか一つに記載の情報処理装置。
9. コンピュータによって実行させる制御方法であって、
対象データを取得し、前記取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価ステップと、
代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たす場合に、その代表データに対応する前記記憶領域に前記対象データを記憶させる割当ステップと、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズ若しくは合計数、又は前記代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する前記閾値を更新する更新ステップと、を有する制御方法。
10. 前記更新ステップにおいて、前記代表データに対応する記憶領域に記憶されているデータの量が多いほど、その代表データに対応する閾値とその代表データを基準とする前記対象データとが前記所定の関係を満たす蓋然性が低くなるように、その対象データに対応する閾値を更新する、9.に記載の制御方法。
11. 前記割当ステップにおいて、全ての代表データについて、前記評価値がその代表データに対応する閾値との間で前記所定の関係を満たさないと判定された場合に、前記対象データを新たな代表データとする前記管理情報を生成する、9.又は10.に記載の制御方法。
12. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データの類似度を表し、
前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以上であることである、9.乃至11.いずれか一つに記載の制御方法。
13. 前記更新ステップにおいて、
前記代表データに対応する記憶領域に記憶されているデータの合計数が多くなるほど、その代表データに対応する閾値を大きくするか、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を大きくするか、又は、
前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を大きくする、12.に記載の制御方法。
14. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データとの間の距離を表し、
前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以下であることである、9.乃至11.いずれか一つに記載の制御方法。
15. 前記更新ステップにおいて、
前記代表データに対応する記憶領域に記憶されているデータの合計数が多くなるほど、その代表データに対応する閾値を小さくするか、
前記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を小さくするか、又は、
前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を小さくする、14.に記載の制御方法。
16. 各前記記憶領域は、ストレージシステムを構成するストレージサーバであり、
前記評価ステップにおいて、他の装置から、前記対象データを前記ストレージシステムに記憶させるリクエストを受信し、前記リクエストに示されている対象データを取得し、
前記割当ステップにおいて、前記対象データを記憶させる前記ストレージサーバに対して前記対象データを送信する、9.乃至15.いずれか一つに記載の制御方法。
17. 9.乃至16.いずれか一つに記載の制御方法の各ステップをコンピュータに実行させるプログラム。
この出願は、2017年12月25日に出願された日本出願特願2017-247545号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (10)

  1. 対象データを取得し、前記取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価手段と、
    代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と前記所定の関係を満たす場合に、その代表データに対応する前記記憶領域に前記対象データを記憶させる割当手段と、
    前記代表データに対応する記憶領域に記憶されているデータの合計サイズ、又は前記代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する前記閾値を更新する更新手段と、を有する情報処理装置。
  2. 前記更新手段は、前記代表データに対応する記憶領域に記憶されているデータの量が多いほど、その代表データに対応する閾値とその代表データを基準とする前記対象データとが前記所定の関係を満たす蓋然性が低くなるように、その対象データに対応する閾値を更新する、請求項1に記載の情報処理装置。
  3. 前記割当手段は、全ての代表データについて、前記評価値がその代表データに対応する閾値との間で前記所定の関係を満たさないと判定された場合に、前記対象データを新たな代表データとする前記管理情報を生成する、請求項1又は2に記載の情報処理装置。
  4. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データの類似度を表し、
    前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以上であることである、請求項1乃至3いずれか一項に記載の情報処理装置。
  5. 前記更新手段は
    記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を大きくするか、又は、
    前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を大きくする、請求項4に記載の情報処理装置。
  6. 前記代表データを基準とする前記対象データの前記評価値は、その代表データと対象データとの間の距離を表し、
    前記所定の関係は、前記代表データを基準とする前記対象データの前記評価値が、その代表データに対応する前記閾値以下であることである、請求項1乃至3いずれか一項に記載の情報処理装置。
  7. 前記更新手段は
    記代表データに対応する記憶領域に記憶されているデータの合計サイズが大きくなるほど、その代表データに対応する閾値を小さくするか、又は、
    前記代表データに対応する記憶領域の空き容量が少なくなるほど、その代表データに対応する閾値を小さくする、請求項6に記載の情報処理装置。
  8. 各前記記憶領域は、ストレージシステムを構成するストレージサーバであり、
    前記評価手段は、他の装置から、前記対象データを前記ストレージシステムに記憶させるリクエストを受信し、前記リクエストに示されている対象データを取得し、
    前記割当手段は、前記対象データを記憶させる前記ストレージサーバに対して前記対象データを送信する、請求項1乃至7いずれか一項に記載の情報処理装置。
  9. コンピュータによって実行させる制御方法であって、
    対象データを取得し、前記取得した対象データについて、複数の代表データそれぞれを基準とする評価値を算出する評価ステップと、
    代表データに対応づけて閾値及び記憶領域を示す管理情報を取得し、各代表データについて、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たすか否かを判定し、その代表データを基準とする前記対象データの前記評価値がその代表データに対応する前記閾値と所定の関係を満たす場合に、その代表データに対応する前記記憶領域に前記対象データを記憶させる割当ステップと、
    前記代表データに対応する記憶領域に記憶されているデータの合計サイズ、又は前記代表データに対応する記憶領域の空き容量に基づいて、その代表データに対応する前記閾値を更新する更新ステップと、を有する制御方法。
  10. 請求項9に記載の制御方法の各ステップをコンピュータに実行させるプログラム。
JP2019562855A 2017-12-25 2018-11-22 情報処理装置、制御方法、及びプログラム Active JP7014233B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017247545 2017-12-25
JP2017247545 2017-12-25
PCT/JP2018/043166 WO2019130926A1 (ja) 2017-12-25 2018-11-22 情報処理装置、制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2019130926A1 JPWO2019130926A1 (ja) 2020-12-17
JP7014233B2 true JP7014233B2 (ja) 2022-02-01

Family

ID=67063421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019562855A Active JP7014233B2 (ja) 2017-12-25 2018-11-22 情報処理装置、制御方法、及びプログラム

Country Status (3)

Country Link
US (1) US20210072909A1 (ja)
JP (1) JP7014233B2 (ja)
WO (1) WO2019130926A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012124178A1 (ja) 2011-03-16 2012-09-20 日本電気株式会社 分散記憶システムおよび分散記憶方法
WO2012127988A1 (ja) 2011-03-18 2012-09-27 日本電気株式会社 情報処理装置、分散ファイルシステム、クライアント装置、情報処理方法、および、コンピュータ・プログラム
JP2014215839A (ja) 2013-04-25 2014-11-17 富士通株式会社 検索システム、情報処理装置および検索方法
WO2016006276A1 (ja) 2014-07-10 2016-01-14 日本電気株式会社 インデックス生成装置及びインデックス生成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090204636A1 (en) * 2008-02-11 2009-08-13 Microsoft Corporation Multimodal object de-duplication

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012124178A1 (ja) 2011-03-16 2012-09-20 日本電気株式会社 分散記憶システムおよび分散記憶方法
WO2012127988A1 (ja) 2011-03-18 2012-09-27 日本電気株式会社 情報処理装置、分散ファイルシステム、クライアント装置、情報処理方法、および、コンピュータ・プログラム
JP2014215839A (ja) 2013-04-25 2014-11-17 富士通株式会社 検索システム、情報処理装置および検索方法
WO2016006276A1 (ja) 2014-07-10 2016-01-14 日本電気株式会社 インデックス生成装置及びインデックス生成方法

Also Published As

Publication number Publication date
US20210072909A1 (en) 2021-03-11
JPWO2019130926A1 (ja) 2020-12-17
WO2019130926A1 (ja) 2019-07-04

Similar Documents

Publication Publication Date Title
KR102290527B1 (ko) 파워 사용량에 대한 실측을 통해 가상 머신을 선별적으로 제공하는 방법, 장치 및 시스템
US10409649B1 (en) Predictive load balancer resource management
US10922316B2 (en) Using computing resources to perform database queries according to a dynamically determined query size
US9774665B2 (en) Load balancing of distributed services
US9805140B2 (en) Striping of directed graphs and nodes with improved functionality
JPWO2008102739A1 (ja) 仮想サーバシステム及び物理サーバ選択方法
TW201423425A (zh) 資料分塊儲存至分散式伺服器的系統及方法
US10541936B1 (en) Method and system for distributed analysis
WO2015001850A1 (ja) タスク割り当て判定装置、制御方法、及びプログラム
CN110753112A (zh) 云服务的弹性伸缩方法和装置
CN109710406B (zh) 数据分配及其模型训练方法、装置、及计算集群
JP6129290B1 (ja) 分散計算におけるアプリケーションパラメータ設定およびシステム仕様設定を推奨する方法およびシステム
US10866934B1 (en) Token-based data flow control in a clustered storage system
JP6972714B2 (ja) データ取得プログラム、装置、及び方法
JP2016024612A (ja) データ処理制御方法、データ処理制御プログラムおよびデータ処理制御装置
US20150365474A1 (en) Computer-readable recording medium, task assignment method, and task assignment apparatus
US10579676B2 (en) Highly scalable fine grained rate limiting
EP2940587A1 (en) Computer, control device for computer system, and recording medium
CN114564313A (zh) 负载调整方法、装置、电子设备及存储介质
JP7014233B2 (ja) 情報処理装置、制御方法、及びプログラム
CN111510479A (zh) 一种异构缓存系统的资源分配方法及装置
JP2014167713A (ja) 情報処理装置、情報処理システム、情報処理装置管理プログラム及び情報処理装置管理方法
JP2021105772A (ja) リソース利用量の予測管理システム、リソース利用量の予測管理方法
US20190121894A1 (en) Parallel map and reduce on hash chains
JP6321559B2 (ja) アクセス制御装置、アクセス制御方法及びアクセス制御プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220103