JP7355622B2

JP7355622B2 - エンコーダを有するストレージシステム

Info

Publication number: JP7355622B2
Application number: JP2019217442A
Authority: JP
Inventors: 彬史鈴木; 貴洋成子; 弘明圷
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-11-29
Filing date: 2019-11-29
Publication date: 2023-10-03
Anticipated expiration: 2039-11-29
Also published as: US11934353B2; JP2021087198A; US20210165764A1

Description

本発明は、概して、圧縮を含む記憶制御に関する。

データ量を削減するストレージシステムが知られている（例えば特許文献１）。その種のストレージシステムは、一般に、圧縮によりデータ量を削減する。既存の圧縮方法の１つとして、ランレングス法のように、所定のブロック単位内で出現頻度の高い文字列を辞書化し、より小さなサイズの符号に置換する方法が知られている。

特開2007-199891号公報

近年、こうした汎用的なデータ圧縮手法以外に、学習型の非可逆圧縮技術が登場している。

例えば、ニューラルネットワークを有するエンコーダとデコーダを構築し、特定分野のデータを入力としてエンコーダとデコーダの学習をすることで、学習データと同一分野のデータの圧縮と伸張に特化したエンコーダとデコーダの作成が可能になる。このようなエンコーダ及びデコーダは、人手にて設計されたエンコーダ及びデコーダに比べて、非可逆圧縮によるデータ損失が少なく、データの削減量も多い（圧縮率が高い）。このため、データ保持コスト（消費する記憶容量に従うコスト）を削減できる。

しかし、ニューラルネットワークを有するエンコーダ及びデコーダは、圧縮及び伸張の計算処理負荷が高い。故に、圧縮及び伸張の処理に、多くの時間が必要となる場合、コア数の多いCPU（Central Processing Unit）やGPU（Graphics Processing Unit）等の高価な計算資源が必要となる場合、又は消費電力が増加する場合が生じる。このため、圧縮及び伸張に必要な計算コストが増加し、計算コストとデータ保持コストの合計としてのシステムコストの低減を果たせない場合がある。

本願発明者の検討結果によれば、ニューラルネットワークを有するエンコーダ及びデコーダの計算処理負荷が高い原因の１つが、データ全体を一様に処理するという一般的なエンコーダ及びデコーダの構造にある。このため、変化に乏しい単調なデータ部分（写真データの例としては「青空」が写っている部分を表すデータ部分）にも、変化の激しい複雑なデータ部分（写真データの例としては「規則性のない細かな模様の壁」が写っている部分を表すデータ部分）と同一の処理が適用される。これが、全体として計算処理負荷が高くなる原因の１つと考えられる。

また、本願発明者の検討結果によれば、ニューラルネットワークを有するエンコーダ及びデコーダの計算処理負荷が高い他の原因として、多様なデータを圧縮及び伸張可能とするため、大規模な（学習対象である結合係数の多い）ニューラルネットワークを用いる必要があることが考えられる。

そこで、本発明の一つの目的は、圧縮及び伸張の少なくも１つについて、少ないデータ損失量を実現しつつ全体として計算処理負荷を低減することにある。

前述の課題に関し、例えば圧縮に関する課題の解決のため、本発明では、ストレージシステムが、データから取得される複数のデータの各々について、当該データの特徴を基に、当該データの圧縮演算規模を決定し、決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、且つ、当該エンコードデータ又はそれの圧縮データを記憶装置に格納する。

本発明によれば、複雑なデータについては、比較的計算処理負荷の高い規模にて圧縮がなされ、一方で、単純なデータについては、比較的計算処理負荷の低い規模にて圧縮がなされる。この結果、少ないデータ損失量を実現しつつ全体として計算処理負荷を低減できる。

実施例１におけるシステム構成図。実施例１における圧縮処理。実施例１におけるエンコーダと可逆圧縮器とを示す図。実施例１におけるデコーダと可逆伸張器とを示す図。実施例１におけるセレクタの構成図。実施例１における学習処理の概要図。実施例１における学習処理のフロー図。実施例１における管理画面の図。実施例２におけるデコーダと可逆伸張器とを示す図。実施例２における学習処理のフロー図。実施例１における学習と推論の概要図。実施例１又は実施例２に係るエンコーダを有するストレージシステムの概要図。実施例１又は実施例２に係るデコーダを有するストレージシステムの概要図。

以下の説明では、「インターフェース装置」は、１つ以上のインターフェースデバイスでよい。当該１つ以上のインターフェースデバイスは、下記のうちの少なくとも１つでよい。
・１つ以上のＩ／Ｏ（Input/Output）インターフェースデバイス。Ｉ／Ｏ（Input/Output）インターフェースデバイスは、Ｉ／Ｏデバイスと遠隔の表示用計算機とのうちの少なくとも１つに対するインターフェースデバイスである。表示用計算機に対するＩ／Ｏインターフェースデバイスは、通信インターフェースデバイスでよい。少なくとも１つのＩ／Ｏデバイスは、ユーザインターフェースデバイス、例えば、キーボード及びポインティングデバイスのような入力デバイスと、表示デバイスのような出力デバイスとのうちのいずれでもよい。
・１つ以上の通信インターフェースデバイス。１つ以上の通信インターフェースデバイスは、１つ以上の同種の通信インターフェースデバイス（例えば１つ以上のＮＩＣ（Network Interface Card））であってもよいし２つ以上の異種の通信インターフェースデバイス（例えばＮＩＣとＨＢＡ（Host Bus Adapter））であってもよい。

また、以下の説明では、「メモリ」は、１つ以上のメモリデバイスであり、典型的には主記憶デバイスでよい。メモリにおける少なくとも１つのメモリデバイスは、揮発性メモリデバイスであってもよいし不揮発性メモリデバイスであってもよい。

また、以下の説明では、「永続記憶装置」は、１つ以上の永続記憶デバイスである。永続記憶デバイスは、典型的には、不揮発性の記憶デバイス（例えば補助記憶デバイス）であり、具体的には、例えば、ＨＤＤ（Hard Disk Drive）又はＳＳＤ（Solid State Drive）である。

また、以下の説明では、「記憶装置」は、メモリと永続記憶装置の少なくともメモリでよい。

また、以下の説明では、「プロセサ」は、１つ以上のプロセサデバイスである。少なくとも１つのプロセサデバイスは、典型的には、ＣＰＵ（Central Processing Unit）のようなマイクロプロセサデバイスであるが、ＧＰＵ（Graphics Processing Unit）のような他種のプロセサデバイスでもよい。少なくとも１つのプロセサデバイスは、シングルコアでもよいしマルチコアでもよい。少なくとも１つのプロセサデバイスは、プロセサコアでもよい。少なくとも１つのプロセサデバイスは、処理の一部又は全部を行うハードウェア回路（例えばＦＰＧＡ（Field-Programmable Gate Array）又はＡＳＩＣ（Application Specific Integrated Circuit））といった広義のプロセサデバイスでもよい。

また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセサによって実行されることで、定められた処理を、適宜に記憶装置及び／又はインターフェース装置等を用いながら行うため、処理の主語が、プロセサ（或いは、そのプロセサを有するコントローラのようなデバイス）とされてもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバ又は計算機が読み取り可能な（例えば非一時的な）記録媒体であってもよい。また、以下の説明において、２つ以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２つ以上のプログラムとして実現されてもよい。

また、以下の説明において、学習モジュール、推論モジュール、設定モジュール、ストレージコントローラ、デコーダ及びエンコーダ、可逆圧縮器、可逆伸張器といった機能は、１つ以上のコンピュータプログラムがプロセサによって実行されることで実現されてよい。プログラムがプロセサによって実行されることで機能が実現される場合、定められた処理が、適宜に記憶装置及び／又はインターフェース装置等を用いながら行われるため、機能はプロセサの少なくとも一部とされてもよい。機能を主語として説明された処理は、プロセサあるいはそのプロセサを有する装置が行う処理としてもよい。プログラムは、プログラムソースからインストールされてもよい。プログラムソースは、例えば、プログラム配布計算機又は計算機が読み取り可能な記録媒体（例えば非一時的な記録媒体）であってもよい。各機能の説明は一例であり、複数の機能が１つの機能にまとめられたり、１つの機能が複数の機能に分割されたりしてもよい。

また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号のうちの共通部分を使用し、同種の要素を区別する場合は、参照符号を使用することがある。例えば、センササーバを区別しない場合には、「センササーバ１０２Ｓ」と言い、センササーバを区別する場合には、「センササーバ１０２ＳＡ」、「センササーバ１０２ＳＢ」のように言うことがある。

次に、本発明の幾つかの実施例を図面に基づいて説明する。尚、本発明は、以下に説明する実施例に限定されるものではない。

（１－１）システム構成

まず、本実施例におけるシステム構成について図１を用いて説明する。

図１は、実施例１におけるシステム構成を示す。

複数（又は１つ）のストレージノード１００により構成されるストレージシステム１１０に、ネットワーク１０１を介して、複数（又は１つ）のセンササーバ１０２Ｓといったデータソース１０２と、クライアントサーバ１０３とが接続されている。

ストレージノード１００は、一次記憶領域であるDRAM１１１、ソフトウェアに従って様々な処理を実施するプロセサ１１２、１つ以上の記憶媒体１１４に接続されるバックエンドインターフェースデバイス（BE-IF）１１３、二次記憶領域となる永続記憶装置１１５（一例として、１つ以上の記憶媒体１１４）、及び、ネットワーク１０１に接続されるフロントエンドインターフェース（FE-IF）１１６を備える。BE-IF１１３及びFE-IF１１６が、インターフェース装置の一例である。DRAM１１１が、メモリの一例である。プロセサ１１２に、DRAM１１１、BE-IF１１３及びFE-IF１１６が接続されている。

DRAM１１１は、プロセサ１１２から短時間でアクセス可能な接続にてプロセサ１１２と接続されており、プロセサ１１２が実行するプログラムや処理対象データを格納する領域である。

プロセサ１１２は、プログラムに従って動作し、データを処理する装置である。プロセサ１１２は、内部に複数のプロセサコアを持ってよく、プロセサコアは各自独立して又は協調してプログラムを実行してよい。また、プロセサ１１２は、内部にDRAMコントローラを持ち、DRAMコントローラが、プロセサコアからのリクエストに応じてDRAM１１１よりデータを取得、又はDRAM１１１にデータを格納する。また、プロセサ１１２は、外部I/Oインターフェースを持ち、外部I/OインターフェースがBE-IF１１３に接続する。また、プロセサ１１２は、BE-IF１１３を経由して記憶媒体１１４に指示を出す事が可能である。プロセサ１１２は、データの圧縮及び伸張に関連する後述の各種処理を行う。

プロセサ１１２では、データの圧縮及び伸張のためのプログラム以外に、例えば、SDS（Software Defined Storage）やＤＢ（DataBase）といったストレージ関連ソフトウェアが動作してよい。ストレージ関連ソフトウェアのようなプログラムがプロセサ１１２により実行されることで、ストレージコントローラとしての機能が実現されてよい。プロセサ１１２は、受領したデータを圧縮後、１つ又は複数のストレージノード１００に圧縮データを分散して格納する。このとき、プロセサ１１２は、SDSやDBのようなストレージ関連ソフトウェアによる制御に従って、記憶媒体１１４にデータを格納する。

BE-IF１１３は、SATA（Serial ATA）ドライブやSAS（Serial Attached SCSI）ドライブといった記憶媒体１１４と通信する為のインターフェースである。BE-IF１１３は、ライト時には、プロセサ１１２からの指示に基づき、ライト対象データをDRAM１１１より取得し記憶媒体１１４に転送する。また、BE-IF１１３は、リード時には、プロセサ１１２からの指示に基づき、リード対象データを記憶媒体１１４より取得しDRAM１１１に転送する。尚、本実施例では、BE-IF１１３が記憶媒体１１４より独立して存在するが、それに代えて又は加えて、記憶媒体１１４中にプロセサ１１２から直接指示を受けるインターフェース（例えばNVMe（Non-Volatile Memory Host Controller Interface））が搭載されてもよい。

記憶媒体１１４は、データを格納する二次記憶デバイスである。記憶媒体１１４は、プロセサ１１２にて制御されたBE-IF１１３より送信されたデータを受領し永続的に格納する。

FE-IF１１６は、ストレージノード１００を、他のストレージノード１００やデータソース１０２と接続されるネットワーク１０１に接続するためのインターフェースである。図１の例では、ストレージノード１００は、ネットワーク１０１を介して他ストレージノード１００との通信を行う。

ストレージノード１００とネットワーク１０１を介して接続されるセンササーバ１０２Ｓが、データソース１０２の一例としてある。センササーバ１０２ＳＡ及び１０２ＳＢは、ビデオカメラ１２０Ｖや静止画用カメラ１２０Ｃを含む複数のセンサ１２０を管理し、各センサ１２０にて測定されたセンサデータ（動画、静止画を含んでよい）をネットワーク１０１を介してストレージノード１００に転送する。センサデータをセンササーバ１０２Ｓより受領したストレージノード１００は、プロセサ１１２の制御により、後述する圧縮処理を経て、圧縮されたセンサデータを永続記憶装置１１５に格納する。

クライアントサーバ１０３は、ユーザがストレージノード１００に蓄えたセンサデータを利用する際にストレージノード１００にセンサデータを要求する。クライアントサーバ１０３より要求を受けたストレージノード１００は、プロセサ１１２の制御により、後述の伸張処理を経て、伸張されたセンサデータをクライアントサーバ１０３に転送する。クライアントサーバ１０３が、データソース１０２の一例として機能してもよい。例えば、クライアントサーバ１０３が、静止画像データや動画データのライト要求をストレージノード１００に送信してもよい。

以上、本実施例のシステム構成について説明した。

（１－２）本実施例における圧縮処理の概要

本実施例では、センサデータから複数のデータ部分が取得（例えば分割）され、複数のデータ部分の各々について、最適な圧縮経路及び最適な伸張経路が選択される。これにより、圧縮及び伸張の計算処理負荷が軽減される。

以下の説明では、本実施例の理解を容易にするために、圧縮及び伸張の対象となるセンサデータは、静止画像を表す静止画像データであるとする。静止画像データは、静止画用カメラ１２０Ｃにより撮影された写真のデータでもよいし、ビデオカメラ１２０Ｖにより撮影された動画のデータから抽出されたフレームのデータでもよい。本発明において、圧縮又は伸張の対象になり得るデータは、静止画像データに代えて又は加えて、静止画像データ以外のセンサデータ（例えば、動画のデータでもよいし、気温や湿度といった測定値の時系列データ）でもよいし、センサデータ以外のデータでもよい。

また、以下の説明では、静止画像データを「静止画像」と言い、静止画像データから取得される複数の画像データ部分の各々を、「部分画像」と言う。

図２は、本実施例における静止画像データの圧縮を概念的に示した図である。

図２が示す例によれば、静止画像２００が、よりデータ量の少ない（要素数が少ない又は情報エントロピーが小さい）特徴量マップ２１０に変換される。

静止画像２００は、例えばカラー画像データの場合、３次元（色、幅、高さ）の整数データである。図２に例においては、説明の簡略化のため、静止画像２００は、色の次元が１つの白黒画像のデータである。

静止画像２００は、後述のエンコーダにより、特徴量マップ２１０に変換（エンコード）される。

一比較例によれば、静止画像２００がそのまま特徴量マップ２１０に変換される。

一方で、本実施例では、エンコーダが、静止画像２００から場所（画像領域）の異なる複数の部分画像２０１（図２の例では、四つの部分画像２０１Ａ～２０１Ｄ）を取得する。静止画像２００も部分画像２０１も、典型的には矩形画像である。各部分画像２０１について、当該部分画像２０１がカバーする場所（画像領域）の一部が、少なくとも１つの他の部分画像２０１がカバーする場所の一部と重なる。なお、静止画像２００から複数の部分画像２０１を取得することは、静止画像２００を複数の部分画像２０１に分割することでもよい。言い換えれば、部分画像同士の一部が重ならない複数の部分画像が静止画像から取得されてもよい。

エンコーダは、圧縮負荷が異なる複数の圧縮経路を有する。エンコーダは、部分画像２０１毎に、カーネルを用いて、当該部分画像２０１を１つ以上の部分特徴量マップ２１１に変換する。この時、部分画像２０１Ａは、部分画像２０１Ａを圧縮するのに最適な圧縮経路によって部分特徴量マップ２１１Ａに変換される。また、部分画像２０１Ｂも同様に、部分画像２０１Ｂを圧縮するに最適な圧縮経路によって部分特徴量マップ２１１Ｂに変換される。このように部分画像２０１Ａ～２０１Ｄは、それぞれ、複数の圧縮経路のうち最適な圧縮経路によって部分特徴量マップ２１１Ａ～２１１Ｄに変換される。

例えば、部分画像２０１Ａの大半が「青空」のような単調なデータであった場合、圧縮負荷の相対的に低い圧縮経路を後述のセレクタ３１１（例えば、図３及び図５参照）が最適と判断し、圧縮負荷の相対的に低い圧縮経路にて、部分画像２０１Ａが部分特徴量マップ２１１に変換される。また、例えば、部分画像２０１Ｂが複雑な画像であった場合、圧縮負荷の相対的に高い圧縮経路をセレクタ３１１が最適と判断し、圧縮負荷の相対的に高い圧縮経路にて、部分画像２０１Ｂが部分特徴量マップ２１１Ｂに変換される。

このように、圧縮負荷の高い圧縮経路での圧縮が不要な部分画像２０１については、より圧縮負荷の低い圧縮経路にて圧縮を行うことで、一比較例に比べて、静止画像２００をより低い負荷にて（言い換えれば、静止画像２００をより高速に）圧縮処理することができる。尚、本実施例においては１つの静止画像２００から複数の部分画像２０１を取得した例について記すが、本発明はこの例に限定されるものではない。例えば、１つの静止画像２００を分割せずに圧縮するケース、すなわち、１つの静止画像２００に好適な圧縮経路を複数の圧縮経路から選択するエンコーダが採用されてもよい。

（１－３）圧縮処理

次に、図３を用いて、本実施例におけるストレージノード１００が行う圧縮処理をについて説明する。

図３は、ストレージノード１００におけるエンコーダ３００と可逆圧縮器３０１を示す。

エンコーダ（学習型エンコーダ）３００は、畳み込み層３１２－１、複数の圧縮経路３１４（図３の例では、３つの圧縮経路３１４Ａ～３１４Ｃ）、セレクタ３１１、分配器３１９及び量子化器３１８を備える。

複数の圧縮経路３１４Ａ～３１４Ｃの各々は、非可逆圧縮を行う。複数の圧縮経路３１４Ａ～３１４Ｃは、データ損失量は同じであるが圧縮負荷が異なる。「データ損失量」とは、圧縮前のデータと伸張後のデータの誤差に相当する量である。「データ損失量が同じ」とは、データ損失量が完全に同じであることに加えて、データ損失量が許容範囲（データ損失量が実質的に同じであるとみなせる範囲）で異なっていてもよいこと、具体的には、例えば、圧縮負荷が最も高い圧縮経路３１４Ａのデータ損失量と同じか当該データ損失量との差が許容差分以下であることを意味してよい。

複数の圧縮経路３１４Ａ～３１４Ｃの各々は、１段又は多段の畳み込み層３１２（図３の例では、畳み込み層３１２－２及び３１２－３）を有する畳み込みニューラルネットワークである。

図３によれば、静止画像がネットワーク１０１を介してストレージノード１００に転送されてきたときにエンコーダ３００が開始される。尚、図３の例では、いずれの圧縮経路３１４を経由しても３段の畳み込み層３１２－１、３１２－２及び３１２－３をデータが経由するが、本発明はこの例に限定されるものではない。例えば、複数の圧縮経路３１４のうち、２段又は４段の畳み込み層を通る経路があるとしてもよい。また、例えば、圧縮経路３１４が異なれば、データが経由する畳み込み層３１２の数が異なっていてもよい（言い換えれば、複数の圧縮経路３１４において、畳み込み層３１２の数は異なっていてもよい）。また、図３の例においては、説明の簡略化のために畳み込み層の間に活性化関数がされていないが、活性化関数（例えば、Relu関数やSigmoid関数）が畳み込み層の間にあるとしてもよい。また、図３の例では、非可逆圧縮を例として記載しているが、本発明はこの例に限定されるものではない。例えば、可逆圧縮でもよく、画像を畳み込み層に入力し、エンコーダの出力として画像のピクセルごとの出現確率を取得し、その出現確率を用いてRange-Coder等のエントロピーコーディングにて圧縮するとした構成でもよい。

静止画像を受領したエンコーダ３００は、１段目の畳み込み層３１２－１にて、静止画像データとしての３次元（色、幅、高さ）の画像データに畳み込み演算を適用する。このとき、畳み込み演算結果である中間ベクトルは、３次元（出力ｃｈ、幅、高さ）のデータである（「ｃｈ」はチャネルを意味する）。本実施例では、１段目の畳み込み層３１２－１の畳み込み演算によれば、幅及び高さは、入力された画像より小さく、出力ｃｈは、入力された画像より多い。しかし、畳み込み演算は、本発明においてこの例に限定されるものではない。例えば、幅や高さについては入力された画像と同一であってもかまわないし、あるいは増加していてもよい。また、出力ｃｈについては、２以上の値であればよい。中間ベクトルは、静止画像から取得された複数の部分画像の各々について、取得される。

尚、本実施例において、この出力データの３次元の形状は、クライアントサーバ１０３を介してユーザが選択可能である。

また、本実施例において、各畳み込み層３１２における畳み込み演算はプロセサ１１２が実施するが、プロセサ１１２は、ＣＰＵに代えて又は加えて、ＧＰＵ、ＦＰＧＡ及びＡＳＩＣの少なくとも１つを含んでよく、各畳み込み層３１２における畳み込み演算は、ＧＰＵ、ＦＰＧＡ或いはＡＳＩＣが行ってもよい。

畳み込み層３１２－１から出力された中間ベクトルは、セレクタ３１１に入力される。セレクタ３１１を詳細に示したのが図５である。図５に示すように、セレクタ３１１は、内部にニューラルネットワーク５２１（例えば、全結合ニューラルネットワーク又は畳み込みニューラルネットワーク）と最大値検出器５２２とを持つ。

セレクタ３１１に入力された３次元の中間ベクトルは、ニューラルネットワーク５２１に入力される。ニューラルネットワーク５２１は、中間ベクトルのｃｈ０の２次元データ（幅、高さ）から、当該中間ベクトルに対応した部分画像の圧縮に適した圧縮経路３１４を選択するために、圧縮経路３１４毎の確率を出力する。尚、図５の例によれば、図３に例示の３つの圧縮経路３１４Ａ～３１４Ｃの各々について確率が出力されるが、本発明は、圧縮経路の数は３に限定されない。圧縮経路は少なくとも２つあればよい。また、本実施例では、１段目の畳み込み層３１２－１の出力を用いセレクタ３１１によって圧縮経路３１４が選択されるが、本発明はこの例に限定されるものではない。例えば、１段目の畳み込み層３１２－１が圧縮経路３１４毎に分かれておりセレクタ３１１に部分画像が直接入力されてもよい。また、１段目の畳み込み層３１２－１が圧縮経路３１４に含まれてもよい。また、本実施例では、セレクタ３１１は、中間ベクトルのｃｈ０の２次元データを用いて圧縮経路３１４を選択するが、本発明はこの例に限定されるものではない。例えば、ｃｈ０とｃｈ１の２つのｃｈを併せた３次元データが圧縮経路３１４の選択に用いられるとしてもよい。また、本実施例では、圧縮経路３１４を選択するのに用いられるニューラルネットワーク５２１は、上述したように、畳み込みニューラルネットワークでよい。ニューラルネットワーク５２１は、後述する学習処理によって適切な圧縮経路の選択の能力を獲得するための学習能力を有していてよい。

最大値検出器５２２は、ニューラルネットワーク５２１の出力である複数の確率（複数の圧縮経路３１４についてそれぞれ算出された複数の確率）の中で最も高い確率を検出する。最大値検出器５２２は、検出した確率に対応した圧縮経路３１４を選択し、当該圧縮経路３１４を示す値である経路値（例えば、スカラ値）を出力する。

出力された経路値は、図３に示すように、分配器３１９に入力される。また、分配器３１９には、当該経路値が得られた中間ベクトルに対応した部分画像が、畳み込み層３１２－１から入力される。分配器３１９は、複数の圧縮経路３１４Ａ～３１４Ｃのうち、セレクタ３１１から入力された経路値が示す圧縮経路３１４（つまり、セレクタ３１１により選択された圧縮経路３１４）に、入力された部分画像を出力する。図３が示す黒く太い矢印によれば、３つの圧縮経路３１４Ａ～３１４Ｃがある中で、圧縮経路３１４Ｃが選択されている。圧縮経路３１４Ｃにおける２段目の畳み込み層３１２－２Ｃは、圧縮経路３１４Ａにおける２段目の畳み込み層３１２－２Ａよりも出力ｃｈの数が少ない。これは、入力された部分画像についてセレクタ３１１が軽量な圧縮を選択したことを意味する。

また、圧縮経路３１４Ｃにおける２段目の畳み込み層３１２－２Ｃは、圧縮経路３１４Ｂにおける２段目の畳み込み層３１２－２Ｂと出力ｃｈの数が同等であり、故に、圧縮負荷は同等である。しかし、入力された部分画像の圧縮については、セレクタ３１１により、圧縮経路３１４Ｃが圧縮経路３１４Ｂよりも好適であると判断されている。本実施例では、複数の部分画像のうち類似の部分画像群について同一の圧縮経路３１４が選択されるようにセレクタ３１１が構成される。「類似の部分画像群」は、例えば部分画像の特徴が類似していて、故に、セレクタ３１１において算出される確率が類似する一つ以上の画像でよい。これにより、特定の部分画像（例えば森が写っている範囲が大部分を占める部分画像）にのみ特化した圧縮負荷の少ない効率的な圧縮経路３１４（１つい以上の畳み込み層３１２）を構築できる。このため、単一の汎用的な圧縮能力を持つ大規模な畳み込み層を有する一比較例に係るエンコーダ（具体的には、単調な画像も複雑な画像も少ないデータ損失量で圧縮する能力を持つエンコーダ）より、静止画像の圧縮処理の負荷を軽減できる。

さて、２段目の畳み込み層３１２－２から出力された中間ベクトルは、同一圧縮経路３１４内の３段目の畳み込み層３１２－３に入力される。３段目の畳み込み層３１２－３は、出力ｃｈ数がＸである畳み込み層であり、他の圧縮経路３１４における３段目の畳み込み層３１２－３と出力の形状が同一となるように畳み込み演算を行う。尚、本発明は、この例に限定されるものではなく、例えば、圧縮経路３１４Ａ～３１４Ｃの３段目の畳み込み層３１２－３Ａ～３１２－３Ｃについて出力ｃｈ数は異なっていてもよい。

図３に示した圧縮経路３１４Ｃが選択される例では、圧縮経路３１４Ｃは、圧縮経路３１４Ａと比べて、２段目の畳み込み層３１２－２Ｃの出力ｃｈ数が小さいために、２段目の畳み込み演算の負荷と３段目の畳み込み演算の負荷が圧縮経路３１４Ａと比べて小さい。このため、入力された部分画像を圧縮経路３１４Ａにて処理するより、高速に圧縮することが可能となる。尚、本実施例では、複雑な部分画像については、セレクタ３１１が圧縮経路３１４Ａを選択するが、圧縮経路３１４Ｃを例に説明する処理と同様の処理が実施されるため、圧縮経路３１４Ａが選択される例についての動作説明については省略する。

３段目の畳み込み層３１２－３による畳み込み演算により、中間ベクトルが作成され出力される。出力された中間ベクトルは、量子化器３１８に入力される。量子化器３１８は、入力された中間ベクトルの量子化を行う。ここで言う量子化は、中間ベクトルの各要素が浮動小数点等である場合、各要素を、整数値や比較的少数のシンボルに変換することを意味する。本実施例では、量子化器３１８は、中間ベクトルを整数値に変換する量子化を行う。

この量子化器３１８の出力が、部分特徴量マップである。部分特徴量マップは、整数の要素で構成されており、ハフマン符号化や算術符号化に適した形式となっている。

図２の例によれば、１つの静止画像２００から４つの部分画像２０１Ａ～２０１Ｄが取得され、４つの部分画像２０１Ａ～２０１Ｄの各々について、エンコーダ３００が部分特徴量マップ２１１を作成する。エンコーダ３００が、例えば特徴量マップ作成器３３９を有していて、特徴量マップ作成器３３９が、すべての部分特徴量マップ２１１を３次元の幅と高さの次元において結合することで、圧縮対象の静止画像２００についての特徴量マップ２１０を作成してよい。尚、本実施例では、静止画像２００から４つの部分画像２０１が取得されるが、本発明はこの例に限定されるものではなく、例えば、静止画像のようなデータから任意の個数のデータ部分が取得されてよい。

全ての部分画像の各々について部分特徴量マップが作成され、全ての部分特徴量マップが結合された特徴量マップが作成された後、圧縮処理の最後に、可逆圧縮器３０１が、この特徴量マップを算術符号化により可逆圧縮を行うことで、圧縮データを作成する。尚、本発明はこの例に限定されるものではなく、例えば、ハフマン符号化にて圧縮することが採用されてもよい。また、エンコーダ３００の構成要素としてのニューラルネットワークとは別に、特徴量マップの値のコンテキスト予測器をニューラルネットワークにて構築し、このコンテキスト予測器の出力する確率予測（特徴量マップの要素ごとの確率予測）に基づいて算術符号化によるデータ量の削減効果を高めるという例についても本発明は適用される。

作成された圧縮データは、例えばストレージ関連ソフトウェアにより、永続記憶装置１１５に格納される。

（１－４）伸張処理

次に、図４を用いて、本実施例におけるストレージノード１００が行う伸張処理をについて説明する。

図４は、ストレージノード１００におけるデコーダ４００と可逆伸張器４０１を示す。

デコーダ（学習型デコーダ）４００は、逆畳み込み層４１２－１、複数の伸張経路４１４、セレクタ４１１及び分配器４１９を備える。

複数の伸張経路４１４Ｄ～４１４Ｆの各々は、伸張を行う。複数の伸張経路４１４Ｄ～４１４Ｆは、複数の圧縮経路３１４Ａ～３１４Ｃにそれぞれ対応してよい。例えば、圧縮経路３１４Ｃにより圧縮された部分画像は、圧縮経路３１４Ｃに対応する伸張経路４１４Ｆによって伸張されてよい。複数の伸張経路４１４Ｄ～４１４Ｆは、伸張負荷が異なる。

複数の伸張経路４１４Ｄ～４１４Ｆの各々は、１段又は多段の逆畳み込み層４１２（図４の例では、逆畳み込み層４１２－２及び４１２－３）で構成される。

図４に示す例によれば、伸張処理は、クライアントサーバ１０３より静止画像の取得要求がストレージノード１００に通知されたことによって開始する。

クライアントサーバ１０３より要求された静止画像の圧縮データが、例えばストレージ関連ソフトウェアにより、永続記憶装置１１５から読み出される。読み出された圧縮データは、可逆伸張器４０１に入力される。この可逆伸張器４０１が、圧縮データを伸張することで特徴量マップ２１０を取得する。そして、この特徴量マップ２１０が分割され、複数の部分特徴量マップ２１１が得られる。例えば、デコーダ４００が、特徴量マップ分割器４３９を有していて、特徴量マップ分割器４３９が、特徴量マップ２１０を分割することで複数の部分特徴量マップ２１１を取得してよい。尚、図４の例では、いずれの伸張経路４１４においても３段の逆畳み込み層４１２－１、４１２－２及び４１２－３をデータが経由するが、本発明はこの例に限定されるものではない。例えば、複数の伸張経路４１４のうち、２段又は４段の逆畳み込み層を通る経路があるとしてもよい。また、例えば、伸張経路４１４が異なれば、データが経由する逆畳み込み層４１２の数が異なっていてもよい（言い換えれば、複数の伸張経路４１４において、逆畳み込み層４１２の数は異なっていてもよい）。

デコーダ４００は、この部分特徴量マップから部分画像を復元する。デコーダ４００の最初の処理として、逆畳み込み層４１２－１が逆畳み込み演算を行う。逆畳み込み演算結果である中間ベクトルは、３次元（出力ｃｈ、幅、高さ）のデータである。本実施例では、幅及び高さは入力した特徴量マップより大きくなるように畳み込み演算を行うが、本発明はこの例に限定されるものではない。例えば、幅や高さについては入力した画像と同一であってもかまわない。また、出力ｃｈ数については、２以上の値であればよい。

尚、本実施例において、この出力データの３次元の形状は、クライアントサーバ１０３よりユーザが選択可能である。

また、本実施例において、各逆畳み込み層４１２における逆畳み込み演算は、プロセサ１１２が実施するが、プロセサ１１２は、ＣＰＵに代えて又は加えて、ＧＰＵ、ＦＰＧＡ及びＡＳＩＣの少なくとも１つを含んでよく、各逆畳み込み層４１２における逆畳み込み演算は、ＧＰＵ、ＦＰＧＡ或いはＡＳＩＣが行ってもよい。

逆畳み込み層４１２－１から出力された中間ベクトルは、セレクタ４１１に入力される。セレクタ４１１は、前述の図５に示すセレクタ３１１と同一の構造をしているため、詳細な説明は省略する。

セレクタ４１１に入力された３次元の中間ベクトルにおけるｃｈ０の２次元（幅、高さ）のデータが、セレクタ４１１内のニューラルネットワークに入力される。当該ニューラルネットが、中間ベクトルのｃｈ０の２次元データから、当該中間ベクトルに対応した部分画像の伸張に適した伸張経路を選択するために、伸張経路毎の確率を出力する。最大値検出器が、ニューラルネットワークから出力された複数の確率の中で最も高い確率を検出し、当該確率に対応した伸張経路４１４を選択し、当該伸張経路４１４を示す値である経路値（例えば、スカラ値）を出力する。尚、図５においては、経路が３つの例について示しており、３つの経路毎の確率を出力した例について記すが、本発明はこの経路数に限定されるものではない。２つ以上の複数の経路があればよい。また、本実施例では、１段目の逆畳み込み層４１２－１の出力を用いてセレクタ４１１によって伸張経路が選択されるが、本発明はこの例に限定されるものではない。例えば、１段目の逆畳み込み層４１２－１が伸張経路４１４毎に分かれておりセレクタ４１１に部分特徴量マップが直接入力されて伸張経路４１４が選択されてもよい。また、前述の伸張処理において、あらかじめ伸張処理における伸張経路を決定しておき、その情報を特徴量マップの中に格納するとしてもよい。この場合、特徴量マップに含まれる経路情報に基づいて伸張経路が選択される。

セレクタ４１１から経路値が分配器４１９に入力される。また、分配器４１９には、当該経路値が得られた中間ベクトルに対応した部分特徴量マップが、逆畳み込み層４１２－１から入力される。分配器４１９は、複数の伸張経路４１４Ｄ～４１４Ｆのうち、セレクタ４１１から入力された経路値が示す伸張経路４１４に、入力された部分特徴量マップを出力する。図４が示す黒く太い矢印によれば、３つの伸張経路４１４Ｄ～４１４Ｆがある中で、伸張経路４１４Ｆが選択されている。伸張経路４１４Ｆにおける２段目の逆畳み込み層４１２－２Ｆは、伸張経路４１４Ｄの２段目の逆畳み込み層４１２－２Ｄよりも出力ｃｈの数が少ない。これは、入力された部分特徴量マップについてセレクタ４１１が軽量な伸張経路４１４Ｆを選択したことを意味する。

また、伸張経路４１４Ｆにおける２段目の逆畳み込み層４１２－２Ｆは、伸張経路４１４Ｅの２段目の逆畳み込み層４１２－２Ｅと出力ｃｈ数が同等であり、故に、伸張負荷は同等である。しかし、入力された部分特徴量マップの伸張については、セレクタ４１１により、伸張経路４１４Ｆが伸張経路４１４Ｅよりも好適であると判断されている。本実施例では、複数の部分特徴量マップのうち類似した部分特徴量マップ群（例えば、特徴が類似した一つ以上の部分特徴量マップ）について同一の伸張経路４１４が選択されるようにセレクタ４１１が構成される。これにより、特定の部分特徴量マップにのみ特化した伸張負荷の少ない効率的な伸張経路４１４を構築できる。このため、単一の汎用的な伸張能力を持つ大規模な逆畳み込み層を有する一比較例に係るデコーダより、圧縮データの伸張処理の負荷を軽減できる。

２段目の逆畳み込み層４１２－２から出力された中間ベクトルは、同一伸張経路４１４内の３段目の逆畳み込み層４１２－３に入力される。３段目の逆畳み込み層４１２－３は、出力ｃｈ数がもとの静止画像と同一のｃｈ（例としてカラー画像であればＹ=３）となる逆畳み込み演算を行う層である。

図４に示した伸張経路４１４Ｆが選択される例では、伸張経路４１４Ｆは、伸張経路４１４Ｄと比べて２段目の逆畳み込み層４１２－２Ｆの出力ｃｈ数が小さいために、２段目の逆畳み込み演算の負荷と３段目の逆畳み込み演算の負荷が伸張経路４１４Ｄと比べて小さい。このため、入力された部分特徴量マップを伸張経路４１４Ｄにて処理するより、高速に伸張することが可能となる。尚、本実施例では、複雑な部分特徴量マップについては、セレクタ４１１が伸張経路４１４Ｄを選択するが、伸張経路４１４Ｆを例に説明する処理と同様の処理が実施されるため、伸張経路４１４Ｄが選択される例についての動作説明については省略する。

３段目の逆畳み込み層４１２－３の出力である部分画像を全て取得した後、全ての部分画像を組み合わせて、クライアントサーバ１０３より要求された静止画像が作成される。例えば、デコーダ４００が、データ作成器４４９を有していて、データ作成器４４９が、複数の部分画像から静止画像を作成してもよい。この静止画像を、例えばストレージ関連ソフトウェアが、クライアントサーバ１０３に転送してよい。これにより、ユーザは要求した静止画像の取得が可能となる。

（１－５）エンコーダ及びデコーダの学習処理の概要

これまで、圧縮処理及び伸張処理について説明した。この圧縮処理及び伸張処理をそれぞれ行うエンコーダ３００及びデコーダ４００の各々は、ニューラルネットワークを持ち、学習処理により、圧縮処理及び伸張処理に関わる値が最適化され、故に、最適な圧縮処理及び伸張処理が可能となる。具体的には、例えば、エンコーダ３００及びデコーダ４００内の畳み込み演算及び逆他畳み込み演算におけるカーネルの量（例えば、カーネル数及びカーネルサイズの少なくとも一方）は学習処理により決定される。また、エンコーダ３００のセレクタ３１１が持つニューラルネットワークのパラメータ、及び、デコーダ４００のセレクタ４１１が持つニューラルネットワークのパラメータも学習処理により決定される。

次に、こうしたニューラルネットワークの各パラメータの学習を含む学習処理の概要について図６を用いて説明する。

これまで述べた圧縮処理及び伸張処理においては、エンコーダ３００及びデコーダ４００の中の複数の経路のうち、入力されたデータ（部分画像及び部分特徴量マップ）は、セレクタ３１１及び４１１により選ばれた１つの経路のみを通過するものであった。学習処理においては、エンコーダ３００及びデコーダ４００の全通りの経路組合せが使用される。１つの経路組合せは、１つの圧縮経路３１４と１つの伸張経路４１４との組合せである。

図６の例においては、エンコーダ３００が３つの経路、デコーダ４００が３つの経路有するため、エンコーダ３００の圧縮経路３１４とデコーダ４００の伸張経路４１４の組み合わせは９通りある。このため、部分画像毎に９種類のデコード部分画像を作成する。

図６が示す黒く太い矢印は、次の例を示す。すなわち、部分画像が、エンコーダ３００における圧縮経路３１４Ｃを通過することで部分特徴量マップが作成される。作成された部分特徴量マップが、デコーダ４００における全ての伸張経路４１４Ｄ～４１４Ｆをそれぞれ経由することで、３つのデコード部分画像が取得される。つまり、この例では、３つの経路組合せ（経路３１４Ｃ及び４１４Ｄの組合せ、経路３１４Ｃ及び４１４Ｅの組合せ、及び、経路３１４Ｃ及び４１４Ｆの組合せ）が使用される。

部分画像は、圧縮経路３１４Ｃの他、圧縮経路３１４Ａ及び３１４Ｂの各々にも入力され、故に、圧縮経路３１４Ａ及び３１４Ｂの各々について、３つの伸張経路４１４Ｄ～４１４Ｆからそれぞれ出力された３つのデコード部分画像が取得される。つまり、１つの部分画像について、圧縮経路３１４の数と伸張経路４１４の数の積と同数のデコード部分画像が得られる。この全通りの経路組合せにおけるデコード部分画像と元の部分画像との誤差を小さくする学習処理により、エンコーダ３００及びデコーダ４００のニューラルネットワークのパラメータ（例えば、重み、全結合係数、カーネル量）が決定される。

学習と、学習の結果を使用する推論は、例えば、図１１に示す通りである。図１１において、破線矢印が、学習でのデータ流れを示しており、実線矢印が、推論でのデータ流れを示している。

すなわち、ストレージノード１００が、学習モジュール１１０１と、推論モジュール１１０２と、設定モジュール１１６０と、学習記憶領域１１５２と、推論記憶領域１１５３とを有する。学習記憶領域１１５２及び推論記憶領域１１５３の各々は、永続記憶装置１１５に基づく論理的な記憶領域（例えば、ボリューム）でよい。

学習モジュール１１０１が、学習制御器１１１１、学習対象のエンコーダ３００及びデコーダ４００を有する。ストレージコントローラ１１４０が、データソース１０２から教師静止画像（学習用の静止画像）を受信し、当該教師静止画像を学習記憶領域１１５２に格納する（典型的には、複数の教師静止画像が一つ以上のデータソース１０２から受信され学習記憶領域１１５２に格納される）。学習制御器１１１１が、教師静止画像を学習記憶領域１１５２から読み出し、読み出した教師静止画像に基づく部分画像毎に、当該部分画像をエンコーダ３００の圧縮経路３１４Ａ～３１４Ｃの各々に入力することで３種類の部分特徴量マップを取得したり、各部分特徴量マップをデコーダ４００の伸張経路４１４Ｄ～４１４Ｆの各々に入力することで９種類のデコード部分画像を取得したりする。学習制御器１１１１が、教師静止画像における複数の元の部分画像の各々について、元の部分画像と当該元の部分画像についての９種類のデコード部分画像とを基に、エンコーダ３００及びデコーダ４００の学習を行う。

推論モジュール１１０２のエンコーダ３００及びデコーダ４００が、学習後のエンコーダ３００及びデコーダ４００である。ストレージコントローラ１１４０が、例えば、データソース１０２からの静止画像をエンコーダ３００に入力することで圧縮データを取得し、取得した圧縮データを推論記憶領域１１５３に格納する。また、ストレージコントローラ１１４０が、例えば、クライアントサーバ１０３からの要求に応答して、推論記憶領域１１５３から圧縮データを読み出し、読み出した圧縮データをデコーダ４００に入力することでデコード静止画像を取得し、取得した静止画像をクライアントサーバ１０３に転送する。

学習処理の詳細を次に説明する（なお、設定モジュール１１６０については、後に図８を参照して説明する）。

（１－６）エンコーダ及びデコーダの学習処理のフロー

続いて、図７を用いてエンコーダ３００及びデコーダ４００の学習処理について説明する。図７は、本実施例におけるエンコーダ３００及びデコーダ４００の学習処理のフロー図である。尚、本発明は、この例に限定されるものではなく、前述のエンコーダ３００及びデコーダ４００内のセレクタ３１１及び４１１を適切に学習できればよい。学習処理には、大量の静止画像（とそれより生成される大量の部分画像）を用いるが、学習処理に使用する画像に圧縮対象の画像を含む必要はない。図７に例示の各ステップは、例えば学習制御器１１１１により行われてよい。

大量の静止画像を学習する中で、エンコーダ３００は、軽量の負荷にて圧縮が可能な部分画像の特徴を認識する能力を獲得する。また、エンコーダ３００は、その部分画像に類似した圧縮対象の部分画像が入力されたときに、負荷が軽量な圧縮経路３１４でよいと判断すれば負荷が軽量な圧縮経路３１４を選択する能力を獲得する。また、エンコーダ３００内のある圧縮経路３１４に属する畳み込み層３１２は、セレクタ３１１によりその圧縮経路３１４に割り当てられた類似の部分画像群のみに特化した圧縮処理の能力を獲得する。

また、デコーダ４００も同様に、学習処理により軽量の負荷にて伸張が可能な部分特徴量マップの特徴を認識する能力を獲得する。また、デコーダ４００は、その部分特徴量マップに類似した伸張対象の部分特徴量マップが入力されたときに、同一の伸張経路４１４を選択する能力を獲得する。また、デコーダ４００内のある伸張経路４１４に属する逆畳み込み層４１２は、セレクタ４１１によりその伸張経路４１４に割り当てられた類似の部分特徴量マップ群のみに特化した伸張処理の能力を獲得する。

図７に示す学習処理のフローは、一つの部分画像についてのフローである。教師静止画像（学習用の静止画像）毎に、当該静止画像に基づく複数の部分画像の各々について、図７に示すフローが行われる。以下、一つの部分画像を例に取る。また、以下の説明では、説明を簡単にするために、圧縮経路３１４α（図６の例では、α＝Ａ、Ｂ又はＣ）と伸張経路４１４β（図６の例では、β＝Ｄ、Ｅ又はＦ）との経路組合せを、「α＋β」と表記する。

最初のステップであるＳ７０１は、部分画像について、全通りの経路組合せを通じて、全種類のデコード結果である全種類のデコード部分画像を作成するステップである。

ステップＳ７０１より続くステップＳ７０２は、ステップＳ７０１にて作成したデコード部分画像毎に、デコード部分画像と元の部分画像との差である誤差を算出するステップである。つまり、各経路組合せについて、誤差が算出される。本実施例では、この誤差は、画像のピクセル毎の値の差の二乗の平均値であるMSE（Mean Squared Error）として算出される。尚、本発明は誤差としてMSEに限定されるものではなく、Multi-Scale SSIM（Structural Similarity）といったデコード結果を元データとの類似度を示す何らかの誤差であればよい。また、各経路組合せについて、Ｓ７０２で算出される誤差は、デコード部分画像と元の部分画像との誤差に、当該経路組合せにおける圧縮経路３１４を通じて出力された部分特徴量マップの情報エントロピーが加えられた値でもよい。これにより、エンコーダ３００の圧縮経路３１４は、誤差を小さくするだけでなく、可逆圧縮器３０１にて可逆圧縮によるデータ削減量が増えるような変換を行うように学習することが可能となる。

ステップＳ７０２より続くステップＳ７０３は、全経路組合せのうち、低負荷経路組合せ（図６の例では、Ｂ＋Ｅ、Ｂ＋Ｆ、Ｃ＋Ｅ及びＣ＋Ｆが該当）の中で、誤差が閾値以下となる経路組合せの有無を判断するステップである。「低負荷経路組合せ」とは、処理負荷が比較的低い経路組合せであり、例えば、圧縮経路３１４の出力ｃｈ数も伸張経路４１４の出力ｃｈ数も“Low”である経路組合せである。誤差が閾値以下となる低負荷経路組合せがある場合、エンコーダ３００とデコーダ４００がともに軽量の計算で実施可能と判断可能であるため、処理がＳ７０４に遷移する。一方で、誤差が閾値以下となる低負荷経路組合せがない場合、エンコーダ３００及びデコーダ４００のいずれか一方又は両方で高負荷の処理が必要と判断可能であるため、処理がＳ７０７に遷移する。

ステップＳ７０３より遷移するステップＳ７０４は、低負荷処理経路の中で最も誤差の小さい経路組合せを特定するステップである。

ステップＳ７０４より続くステップＳ７０５は、エンコーダ３００のセレクタ３１１とデコーダ４００のセレクタ４１１内のニューラルネットワークについて、Ｓ７０４で特定された低負荷処理経路が選択されるように学習を行うステップである。より具体的には、例えば、圧縮経路３１４Ｃを選択するように学習がされる場合、セレクタ３１１内のニューラルネットワーク５２１の出力のうち、圧縮経路３１４Ｃの確率が“１”となり、圧縮経路３１４Ａ及び３１４Ｂの各々の確率が“０”となるように、ニューラルネットワーク５２１のパラメータが更新される。

ステップＳ７０５より続くステップＳ７０６は、Ｓ７０４で特定された経路組合せの学習を行うステップである。より具体的には、例えば、Ｓ７０４で特定された経路組合せがＣ＋Ｆであった場合、エンコーダ３００については、圧縮経路３１４Ｃに属する畳み込み層３１２－２Ｃ及び３１２－３Ｃと１段目の畳み込み層３１２－１のみが学習され、デコーダ４００については、伸張経路４１４Ｆに属する逆畳み込み層４１２－２Ｆ及び４１２－３Ｆと１段目の逆畳み込み層４１２－１のみが学習される。この処理にて、この部分画像に対する１回の学習は終了となる。なお、ステップＳ７０６の学習は、元の部分画像と、経路組合せＣ＋Ｆに対応したデコード部分画像との誤差に基づいてよい。例えば、当該元の部分画像についての誤差が、別の部分画像に関し経路組合せＣ＋Ｆについて得られた誤差よりも大きい場合、学習は、誤差をより小さくするため畳み込み層３１２や逆畳み込み層４１２のパラメータを調整することを含んでよい。

ステップＳ７０３より遷移するステップＳ７０７は、ランダムに遷移するステップである。図７に示す例では、１％の確率でステップＳ７０８に、残りの９９％の確率でステップＳ７０９に処理が遷移する。本発明はこの遷移確率の組み合わせに限定されるものではない。例えば、一般的に、Ｓ７０８に遷移する確率がＳ７０９に遷移する確率より十分に小さければ、学習は収束する。また、ステップＳ７０７は、部分画像を圧縮する圧縮経路３１４が早期に固定化されないために設けられたステップであり、部分画像の各圧縮経路への割り当てが安定したら、１００％の確率でＳ７０９に処理が遷移するとしてもよい。

ステップＳ７０７より遷移するステップＳ７０８は、全ての経路組合せを学習するステップである。学習の過渡的な状態において、現時点で誤差が最も小さい経路組合せよりも、好適な経路組合せが学習により出現する可能性がある。このような経路組合せを探索するために、全経路組合せを平等に学習することが実施される。この処理にて、部分画像に対する１回の学習は終了となる。

ステップＳ７０７より遷移するステップＳ７０９は、Ｓ７０３にて低負荷経路組合せにて誤差が十分に減少できなかったため、低負荷経路組合せ以外の経路組合せを含む複数の経路組合せから最適な処理経路を探索し、最も誤差の小さな経路組合せを特定するステップである。

ステップＳ７０９より続くステップＳ７１０は、エンコーダ３００のセレクタ３１１とデコーダ４００のセレクタ４１１内のニューラルネットワークについて、Ｓ７０９で特定した経路組合せが選択されるように学習を行うステップである。より具体的な学習の内容は、前述のＳ７０５について述べた内容と実質的に同一のため、説明は省略する。

ステップＳ７１０より続くステップＳ７１１は、Ｓ７０９で特定した経路組合せのみを学習するステップである。学習の詳細は、前述のＳ７０６について述べた詳細と同様のため、説明は省略する。この処理にて、部分画像に対する１回の学習は終了となる。

ここまで述べた図７のフローを部分画像毎に十分な回数繰り返すことで、エンコーダ３００及びデコーダ４００におけるニューラルネットワークの学習は完了する。

以上が、本実施例における学習処理のフローである。なお、本実施例では、デコーダ４００に複数の伸張経路４１４があるが、伸張経路４１４は一つでもよい。この場合、同一の部分画像について、圧縮経路３１４Ａ～３１４Ｃにそれぞれ対応した３種類のデコード部分画像が得られることになる。

（１－７）ユーザインターフェース

続いて本実施例におけるユーザインターフェースについて図８を用いて説明する。図８は、ストレージノード１００がネットワーク１０１を介してクライアントサーバ１０３に提供するユーザインターフェースの一例として管理画面の例を示す。本実施例においてユーザは、クライアントサーバ１０３を用いて圧縮の設定を行うことが可能である。

図８に示す管理画面８００（例えばＧＵＩ（Graphical User Interface））は、設定モジュール１１６０により提供される。管理画面８００は、エンコーダ３００及びデコーダ４００の少なくとも一つについての属性値の指定を受け付ける画面である。管理画面８００は、エンコーダ３００の設定に関する６つの入力フィールド８０１～８０６と、デコーダ４００の設定に関する５つの入力フィールド８１１～８１５を持つ。各入力フィールドは、ＵＩの一例である。

エンコーダ３００に関して、入力フィールドは次の通りである。入力フィールド８０１は、先頭の畳み込み層（例えば、畳み込み層３１２－１）の出力ｃｈ数の指定を受け付ける入力フィールドである。入力フィールド８０２及び８０３の各々は、出力ｃｈ数が可変である中間の畳み込み層（例えば、畳み込み層３１２－２）について出力ｃｈ数のグレード（例えば、“High”又は“Low”）に対応した圧縮経路３１４の数（当該グレードの畳み込み層３１２を持つ圧縮経路３１４の数）の指定を受け付ける入力フィールドである。入力フィールド８０４及び８０５の各々は、出力ｃｈ数のグレードに対応した出力ｃｈ数の指定を受け付ける入力フィールドである。入力フィールド８０６は、末尾の畳み込み層（例えば、畳み込み層３１２－３）の出力ｃｈ数の指定を受け付ける入力フィールドである。

デコーダ４００に関して、入力フィールドは次の通りである。入力フィールド８１１は、先頭の逆畳み込み層（例えば、逆畳み込み層４１２－１）の出力ｃｈ数の指定を受け付ける入力フィールドである。入力フィールド８１２及び８１３の各々は、出力ｃｈ数が可変である中間の逆畳み込み層（例えば、逆畳み込み層４１２－２）について出力ｃｈ数のグレードに対応した伸張経路４１４の数（当該グレードの逆畳み込み層４１２を持つ伸張経路４１４の数）の指定を受け付ける入力フィールドである。入力フィールド８１４及び８１５の各々は、出力ｃｈ数のグレードに対応した出力ｃｈ数の指定を受け付ける入力フィールドである。

入力フィールド８０２、８０３、８１２及び８１３によれば、出力ｃｈ数のグレード別に、経路の増減が可能である。これにより、経路毎に、あるデータに特化した圧縮及び伸張が可能となり、以って、圧縮率の向上と、圧縮によるデータ損失の軽減との両立が期待される。

また、入力フィールド８０４、８０５、８１４及び８１５によれば、適切な処理負荷を設定可能となる。

管理画面８００を通じて入力された値に従う構成のエンコーダ３００及びデコーダ４００が設定モジュール１１６０により構築される。例えば、入力フィールド８０３に“３”が入力された場合、３つの低負荷圧縮経路を持つエンコーダ３００が構築される。ここで言う低負荷圧縮経路は、畳み込み層３１２－２の出力ｃｈ数が“Ｌｏｗ”である圧縮経路である。

尚、本発明はこの管理画面８００に限定されるものではない。例えば、２段目の畳み込み演算の出力ｃｈ数をHighとLowの２段階に分けるのはなく、より多くの段階に分割するとしてもよい。

以上が本実施例における管理画面８００である。

続いて実施例２について説明する。その際、実施例１との相違点を主に説明し、実施例１との共通点については説明を省略又は簡略する。

実施例１においては、エンコーダ３００（及びデコーダ４００）内に複数の圧縮経路３１４（複数の伸張経路４１４）と圧縮経路３１４（伸張経路４１４）を選択するセレクタ３１１（セレクタ４１１）がある。対象となる部分画像（部分特徴量マップ）毎に最適な圧縮経路（部分特徴量マップ）を選択して圧縮（及び伸張）が行われる。

一方、実施例２では、複数の圧縮経路（複数の伸張経路）が用意されることに代えて、畳み込み演算（逆畳み込み演算）のチャネル数や、畳み込み演算おけるカーネル量、等を、部分画像及び部分特徴量マップ毎に最適な値に設定することで、処理負荷の軽減（言い換えれば、処理の高速化）が図られる。

実施例２におけるシステム構成は実施例１と同様なため説明を省略する。

実施例２に係るエンコーダ９００を、図９を用いて説明する。

エンコーダ９００は、畳み込み層９１２－１及び９１２－２と、セパレータ９２０と、ニューラルネットワーク（例えば全結合ニューラルネットワーク）９１０とを有する。

エンコーダ９００の最初の処理は、１段目の畳み込み層９１２－１の処理であり、実施例１の処理と同様の処理がなされてよい。尚、本実施例では、１段目の畳み込み層９１２－１の出力する三次元（ｃｈ、幅、高さ）の中間ベクトルのｃｈ数を６として説明するが、本発明はこのｃｈ数に限定されるものではない。

次に、１段目の畳み込み層９１２－１の処理結果である中間ベクトルがセパレータ５２０に入力される。セパレータ９２０は、３次元（ｃｈ、幅、高さ）の中間ベクトルのうちｃｈ０とｃｈ１～５の２つに分割する。

セパレータ９２０で分割した中間ベクトルのｃｈ０が、ニューラルネットワーク９１０に入力される。ニューラルネットワーク９１０は、セパレータ９２０で分離した中間ベクトルのチャネル数と同数の出力を有している。図９の例では、チャネルはｃｈ１～５と５つあるため、５つの出力がある。この５つの出力の各々は、当該出力に対応したチャネルの利用する確率（０以上１以下の値）を出力するものである。

本実例においては、０．５以下の確率の出力に対応するｃｈは、２段目の畳み込み演算にて計算に用いられない。一方で、０．５より大きく１．０以下の確率の出力に対応するｃｈについては、２段目の畳み込み演算で処理される。このようにすることで、部分画像の複雑度に応じて必要な最小のチャネルのみを計算すればよく、処理負荷を軽減できる。

また、ニューラルネットワーク９１０は、次の畳み込み演算で使用されるカーネルの量も出力する。これは、部分画像の複雑度に応じて必要なカーネル量（カーネル数及びカーネルサイズの少なくとも一つ）を増減させるものであり、単純な部分画像であれば、カーネル量が減少するように制御される。尚、本実施例では、入力する部分画像に応じ、次の畳み込み演算におけるカーネル量や入力のチャネル数を変更する制御について記すが、本発明はこの例に限定されるものではない。例えば、畳み込み演算のストライド数やパディング数等の畳み込み演算の計算量、計算の間引き方法等、計算に依存する様々なパラメータが出力されるとしてもよい。

また、本実施例において、ニューラルネットワーク９１０は、１段目の畳み込み演算の結果である中間ベクトルを入力する例について示しているが、本発明はこの例に限定されるものではない。例えば、エンコーダ９００への入力である部分画像を入力するとし、１段目の畳み込み演算のカーネル量やストライプ数などが制御されるとしてもよい。また、畳み込み層９１２の段数は限定されないでよい。カーネル量やｃｈ毎の確率を出力する指定するニューラルネットワーク９１０は、所定の畳み込み層９１２毎に存在してよい。

ニューラルネットワーク９１０は、例えば、畳み込み演算によるニューラルネットワークでもよい。学習によって適切なｃｈやカーネル量等、畳み込み演算の計算量に関わるパラメータを算出な可能な、学習能力のあるいずれかの処理方法があればよい。

さて、ニューラルネットワーク９１０は、セパレータ９２０で分割した中間ベクトルのｃｈ０の２次元データ（幅、高さ）を入力とし、ｃｈ１～ｃｈ５の各々の確率と、カーネル量とを出力とする。ｃｈ１～ｃｈ５は、畳み込み層９１２－２の入力ｃｈである。

ニューラルネットワーク９１０からｃｈとカーネル量を受領した２段目の畳み込み層９１２－２が、ｃｈ１～５のうち計算に用いるｃｈ（確率が０．５より大きいｃｈ）のみを用いて、指定されたカーネル量の範囲で畳み込み演算を行い、部分画像の部分特徴量マップを作成する。この方法により単純な部分画像については、より少ないｃｈやカーネル量で軽量に計算し、高速化が可能となる。

作成した部分特徴量マップを含む特徴量マップが、実施例１と同様に作成され、当該特徴量マップが可逆圧縮器３０１に入力されることで、静止画像の圧縮データが作成される。

以上が、実施例２におけるエンコーダ９００の処理である。このエンコーダ９００内のニューラルネットワーク９１０による計算ｃｈの選択は、デコーダにおける逆畳み込み層における逆畳み込み演算に用いるｃｈの選択についても同様に適用可能であるため、実施例２のデコーダに関する説明は省略する。

続いて実施例２におけるエンコーダ及びデコーダの学習処理のフローを、図１０を用いて説明する。なお、図１０のフローは、部分画像毎に行われる。一つの部分画像を例に取る。また、図１０の各ステップは、例えば、学習モジュール（例えば学習制御器）により行われてよい。

ステップＳ１００１にて、デコード部分画像が取得される。具体的には、部分画像がエンコーダにより部分特徴量マップに変換され、当該部分特徴量マップがデコーダによりデコード部分画像に変換される。

続くステップＳ１００２にて、Ｚ（入力した部分画像とデコード部分画像との誤差（言い換えれば、データ損失量））が算出される。

続くステップＳ１００３では、Ｘ（エンコーダ９００内のニューラルネットワーク９１０の出力値の合計）が算出される。前述のとおり、ニューラルネットワーク９１０のｃｈについての出力は、中間ベクトルのｃｈごとに０～１の値を出し、また、カーネル量を出す。これらの出力の値の合計値が高いほど計算に用いられるチャネル数が増加し、またカーネル量が増加することを示している。また、本実施例では、この値をＳ１００２にて求めた誤差と同時に小さくなるように学習することで、圧縮によるデータ損失と計算量のトレードオフが図られる。尚、本実施例では、ニューラルネットワーク９１０の出力値が小さくなるように学習するが、本発明はこの例に限定されるものではない、例えば、カーネル量とチャネル数から推測される畳み込み演算の計算量が算出され、その計算量が小さくなるように学習が図られるとしてもよい。

続くステップＳ１００４では、Ｙ（デコーダ内のニューラルネットワークの出力値の合計）が算出される。

続くステップＳ１００５では、最小化目標値＝Ｃ_Ａ・Ｘ＋Ｃ_Ｂ・Ｙ＋Ｚが算出される。Ｃ_Ａ及びＣ_Ｂの各々は、係数である。

この最小化目標値を用いることで、Ｚを最小化するのに必要なエンコーダとデコーダにおけるｃｈ数が最も少なくなるように出力がなされる。また、画質を犠牲にして性能を向上させたい場合、最小化目標値のＣ_ＡとＣ_Ｂの値を増加させることで、計算に用いるｃｈ数が少なくなるように学習が進展する。一方で、最小化目標値のＣ_ＡとＣ_Ｂを減少させて、学習することで、より多くのｃｈを用いるように学習が進展する。

Ｃ_Ａを大きくして学習した場合には、同一品質において圧縮の性能が優先され、Ｃ_Ｂを大きくして学習した場合には、同一品質において伸張の性能が優先される。

続くステップＳ１００６では、Ｓ１００５にて算出した学習目標値が小さくなるように学習が行われる。

以上が実施例２における学習処理のフローである。なお、実施例２の学習処理では、上述の最小化目標値に代えて又は加えて、最小化目標値＝Ｃ_Ｋ・Ｐ＋Ｃ_Ｌ・（－Ｑ）＋Ｒが最小となるような学習がニューラルネットワーク９１０についてされてよい。Ｒが、入力した部分画像とデコード部分画像との誤差（言い換えれば、データ損失量）である。Ｐが、カーネル量である。Ｑが、マスクされるｃｈの数である。Ｃ_Ｋ及びＣ_Ｌの各々は、係数である。マスク対象のチャネルの数が少ないほど、計算負荷が大きい。また、カーネル量が多いほど、計算負荷が大きい。

実施例１及び実施例２の説明を基に、例えば下記のように総括をすることができる。下記総括は、上述の説明の補足又は変形例を含んでもよい。

図１２に例示するように、ストレージシステム１１０が、記憶装置１２５０（例えば少なくともメモリ）と記憶装置１２５０に接続されたプロセサ１２６０とを備える。記憶装置１２５０およびプロセサ１２６０は、例えば、１つ以上のストレージノード１００における１つ以上の記憶装置（例えばＤＲＡＭ１１１及び永続記憶装置１１５）と１つ以上のプロセサ１１２でよい。

プロセサ１２６０が、データ２２００から取得される複数のデータ部分２２０１（例えば２２０１Ａ～２２０１Ｄ）の各々について、当該データ部分２２０１の特徴を基に、当該データ部分２２０１の圧縮演算規模７１を決定し、決定された圧縮演算規模７１に従う非可逆の圧縮演算を行うことで、当該データ部分２２０１をエンコードデータ部分２１に変換する。プロセサ１２６０が、複数のデータ部分２２０１について作成された複数のエンコードデータ部分２１を基に、データ２２００のエンコードデータ１０を作成し、エンコードデータ１０又はそれの圧縮データを記憶装置１２５０に格納する。複雑なデータ部分については、比較的計算処理負荷の高い規模７１（例えば７１Ａ）にて圧縮がなされ、一方で、単純なデータ部分については、比較的計算処理負荷の低い規模７１（例えば７１Ｃ）にて圧縮がなされる。この結果、少ないデータ損失量を実現しつつ全体として圧縮演算負荷を低減できる。なお、複数のデータ部分２２０１は、複数のデータの一例である。また、圧縮演算は、非可逆の圧縮演算に限られないでよい（つまり、可逆の圧縮演算が採用されてよい）。例えば、プロセサ１２６０が、複数のデータの各々について、当該データの特徴を基に、当該データの圧縮演算規模を決定し、決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、エンコードデータ又はそれの圧縮データを記憶装置１２５０に格納してよい。以下では、データの一例として、データ部分２２０１を採用し、圧縮演算として、非可逆圧縮演算を採用するが、データ部分２２０１は「データ」と読み替えられてよいし、圧縮演算は非可逆の圧縮演算に限られないでよい。

データ２２００の一例が、静止画像２００であり、データ部分２２０１の一例が、部分画像２０１でよい。また、エンコードデータ部分２１の一例が、部分特徴量マップ２１１であり、エンコードデータ１０の一例が、特徴量マップ２１０でよい。

データ２２００は、上述したように、静止画像２００以外のデータ、例えば、動画データ、時系列のセンサデータでもよい。データ部分２２０１の特徴は、データ２２００の種類に依存してよい。

プロセサ１２６０が、例えば、エンコーダ１２００と、ストレージコントローラ３０として機能してよい。エンコーダ１２００が、圧縮規模決定部１２０１と、エンコードデータ作成部１２０２とを有してよい。ストレージコントローラ３０が、ストレージコントローラ１１４０を含んでよい。ストレージコントローラ３０が、データ２２００を圧縮規模決定部１２０１に入力してよい。圧縮規模決定部１２０１が、入力されたデータ２２００から取得される複数のデータ部分２２０１の各々について、当該データ部分２２０１の特徴を基に、当該データ部分２２０１の圧縮演算規模７１を決定し、決定された圧縮演算規模７１に従う非可逆の圧縮演算を行うことで、当該データ部分２２０１をエンコードデータ部分２１に変換してよい。エンコードデータ作成部１２０２が、複数のデータ部分２２０１について作成された複数のエンコードデータ部分２１を基に、データ２２００のエンコードデータ１０を作成してよい。ストレージコントローラ３０が、エンコードデータ１０又はそれの圧縮データを記憶装置１２５０に格納してよい。

圧縮規模決定部１２０１が、例えば、図３に示したセレクタ３１１、分配器３１９及び複数の圧縮経路３１４のうち少なくともセレクタ３１１を含んでよい。エンコードデータ作成部１２０２が、例えば、図３に示した量子化器３１８及び特徴量マップ作成器３３９のうち少なくとも特徴量マップ作成器３３９を含んでよい。エンコーダ１２００は、例えば、エンコードデータ１０を可逆圧縮することにより圧縮データを出力する可逆圧縮器（図示せず）を含んでもよい。

また、圧縮規模決定部１２０１が、例えば、図９に示したセパレータ９２０及びニューラルネットワーク９１０のうち少なくともニューラルネットワーク９１０を含んでよい。

複数のデータ部分２２０１の各々について、圧縮演算規模７１の決定は、圧縮演算規模７１が異なりそれぞれが非可逆の圧縮演算を行う複数の圧縮経路（例えば、複数の圧縮経路３１４）から、圧縮経路を選択することでよい。当該選択された圧縮経路が、当該データ部分２２０１をエンコードデータ部分２１に変換してよい。データ部分群（類似したデータ部分の集合）毎に特化した個別の圧縮経路にて圧縮することで、汎用的な能力を持つ大規模な圧縮経路（例えばニューラルネットワーク）ではなく比較的小規模の圧縮経路（例えばニューラルネットワーク）で同様の圧縮効果が得られる。

圧縮演算は、非可逆の圧縮演算であってよい。教師データが入力された場合、プロセサ１２６０が、教師データから取得される複数の教師データ部分の各々について、複数の圧縮経路の各々について、当該教師データ部分と、当該教師データ部分を当該圧縮経路により圧縮することで取得されたエンコード教師データ部分の伸張後のデータであるデコード教師データ部分を取得してよい。プロセサ１２６０が、各教師データ部分について、当該教師データ部分と、当該教師データについて取得された複数のデコード教師データ部分の各々との誤差を算出てよい。プロセサ１２６０が、複数のデコード教師データ部分の各々について算出された誤差と、複数の圧縮経路の各々の圧縮演算規模とを基に、圧縮経路の選択を学習してよい。これにより、最適な圧縮経路の選択を実現することができる。なお、複数の教師データ部分の各々について、算出された複数の誤差が、圧縮演算規模が相対的に小さい圧縮経路について閾値以下の誤差である該当誤差を含んでいる場合、プロセサ１２６０は、当該教師データ部分の特徴に該当する特徴を持ったデータ部分については最小の該当誤差に対応した圧縮経路を選択することを学習してよい。これにより、圧縮演算規模と誤差の両方を低減することが期待できる。

複数の圧縮経路の各々は、それぞれ順次畳み込み演算を行う１つ以上の畳み込み層で構成された畳み込みニューラルネットワークでよい。畳み込みニューラルネットワークの規模を、データ部分２２０１の特徴に応じて小さくすることが可能である。

プロセサ１２６０は、ユーザインターフェース（例えば管理画面８００）を提供してよい。ユーザインターフェースは、下記のうちの少なくとも一つ、
・少なくとも１つの圧縮演算規模について、当該圧縮演算規模の圧縮経路の数、
・少なくとも１つの圧縮演算規模の定義（例えば、圧縮演算規模と出力チャネル数との関係）、
を受け付けるインターフェースでよい。プロセサ１２６０は、ユーザインターフェースを介して入力された値に基づき複数の圧縮経路を構築してよい。これにより、ユーザ任意の構成のエンコーダ１２００を、少ないデータ損失量を実現しつつ全体として計算処理負荷を低減できるエンコーダとすることができる。

プロセサ１２６０が、複数のデータ部分２２０１の各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた畳み込み演算を行うようになっていてよい。複数のデータ部分２２０１の各々について、圧縮演算規模の決定は、畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することでよい。これにより、複数のデータ部分２２０１の複数の特徴に圧縮経路が共通でも、少ないデータ損失量を実現しつつ全体として圧縮演算負荷を低減できる。

圧縮演算は、非可逆の圧縮演算であってよい。複数のデータ部分２２０１の各々について、プロセサ１２６０が、ニューラルネットワーク（例えばニューラルネットワーク９１０）を実行することで、複数の入力チャネルのうちのマスク対象の入力チャネルとカーネル量とを表す複数の出力値を当該データ部分２２０１の特徴に基づき出力してよい。教師データが入力された場合、プロセサ１２６０が、教師データから取得される複数の教師データ部分の各々について、カーネル量と、マスク対象チャネル数と、誤差とを基に、ニューラルネットワークを学習してよい。これにより、データ部分２２０１の特徴に最適なカーネル量及びマスク対象チャネル数のうちの少なくとも１つが期待できる。例えば、複数の入力チャネルの全通りの組合せの各々をマスク対象として教師データ部分の圧縮と伸張を行うことを含む学習が行われてよい。いずれの組合せがマスク対象とされた場合に誤差が最も小さいかがに応じた学習が行われてよい。なお、複数の教師データ部分の各々について、ニューラルネットワークの学習は、最小化目標値＝第１係数・カーネル量＋第２の係数・（－１・マスク対象チャネル数）＋誤差における最小化目標値が最小となる学習でよい。これにより、誤差と、カーネル量及びマスク対象チャネル数に依存する計算処理規模とを両立することが期待できる。

図１３に例示するように、プロセサ１２６０（例えば、ストレージコントローラ３０）が、記憶装置１２５０からエンコードデータ１０を取得し、又は、記憶装置１２５０から取得した圧縮データをエンコードデータ１０に伸張してよい。プロセサ１２６０が、エンコードデータ１０から取得される複数のエンコードデータ部分２１の各々について、当該エンコードデータ部分２１の特徴を基に、当該エンコードデータ部分の伸張演算規模８１を決定してよい。プロセサ１２６０が、決定された伸張演算規模８１に従う伸張演算を行うことで、当該エンコードデータ部分２１をデコードデータ部分２２８１に変換してよい。プロセサ１２６０が、複数のエンコードデータ部分２１について作成された複数のデコードデータ部分２２８１を基に、データ２２００のデコードデータ２２８０を作成してよい。少ないデータ損失量を実現しつつ全体として伸張演算負荷を低減できる。

エンコードデータ部分２１の特徴は、エンコードデータ部分２１それ自体の特徴でもよいし、エンコードデータ部分２１がいずれの圧縮演算規模７１で圧縮されたかを示してもよい。後者の場合、当該圧縮演算規模７１に対応する伸張演算規模８１が決定されてもよい。

プロセサ１２６０が、例えば、デコーダ１３００として機能してよい。デコーダ１３００が、エンコードデータ部分取得部１３０２と、伸張規模決定部１３０１とを有してよい。ストレージコントローラ３０が、エンコードデータ１０をエンコードデータ部分取得部１３０２に入力してよい。エンコードデータ部分取得部１３０２が、エンコードデータ１０から複数のエンコードデータ部分２１を取得してよい。伸張規模決定部１３０１が、複数のエンコードデータ部分２１の各々について、当該エンコードデータ部分２１の特徴を基に、当該エンコードデータ部分の伸張演算規模８１を決定してよい。伸張規模決定部１３０１が、決定された伸張演算規模８１に従う伸張演算を行うことで、当該エンコードデータ部分２１をデコードデータ部分２２８１に変換してよい。伸張規模決定部１３０１が、複数のエンコードデータ部分２１について作成された複数のデコードデータ部分２２８１を基に、データ２２００のデコードデータ２２８０を作成してよい。ストレージコントローラ３０が、デコードデータ２２８０を出力してよい。

エンコードデータ部分取得部１３０２が、例えば、図４に示した特徴量マップ分割器４３９を含んでよい。伸張規模決定部１３０１が、例えば、図４に示したセレクタ４１１、分配器４１９、複数の伸張経路４１４及びデータ作成器４４９のうち少なくともセレクタ４１１を含んでよい。デコーダ１３００は、圧縮データを可逆伸張することによりエンコードデータ１０を出力する可逆伸張器（図示せず）を含んでもよい。

また、伸張規模決定部１３０１が、例えば、逆畳み込み演算に用いられるカーネルのカーネル量と当該逆畳み込み演算におけるマスク対象チャネルとのうちの少なくとも１つを出力するニューラルネットワーク（図示せず）を含んでもよい。

複数のエンコードデータ部分２１の各々について、伸張演算規模８１の決定は、伸張演算規模が異なりそれぞれが伸張演算を行う複数の伸張経路（例えば、複数の伸張経路４１４）から、伸張経路を選択することでよい。当該選択された伸張経路が、当該エンコードデータ部分をデコードデータ部分に変換してよい。エンコードデータ部分群（類似したエンコードデータ部分の集合）毎に特化した個別の伸張経路にて伸張することで、汎用的な能力を持つ大規模な伸張経路（例えばニューラルネットワーク）ではなく比較的小規模の伸張経路（例えばニューラルネットワーク）で同様の伸張効果が得られる。

教師データが入力された場合、プロセサ１２６０が、教師データから取得される複数の教師データ部分の各々について、各圧縮経路に関し、当該教師データ部分と、当該教師データ部分を当該圧縮経路により圧縮することで取得されたエンコード教師データ部分を複数の伸張経路に伸張させることで複数のデコード教師データ部分を取得してよい。プロセサ１２６０が、当該教師データ部分と、当該教師データについて取得された複数のデコード教師データ部分の各々との誤差を算出してよい。プロセサ１２６０が、複数のデコード教師データ部分の各々について算出された誤差と、複数の経路組合せの圧縮演算規模及び伸張演算規模とを基に、経路組合せの選択を学習してよい（複数の経路組合せの各々は、いずれかの圧縮経路といずれかの伸張経路との組合せでよい）。これにより、最適な圧縮経路と最適な伸張経路の選択を実現することができる。

プロセサ１２６０が、複数のエンコードデータ部分２１の各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた逆畳み込み演算を行うようになっていてよい。複数のエンコードデータ部分２１の各々について、伸張演算規模８１の決定は、逆畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該逆畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することでよい。これにより、複数のエンコードデータ部分２１の複数の特徴に伸張経路が共通でも、少ないデータ損失量を実現しつつ全体として伸張演算負荷を低減できる。

１００：ストレージノード、１２００：エンコーダ、１３００：デコーダ

Claims

記憶装置と前記記憶装置に接続されたプロセサとを備えるストレージシステムであって、
前記プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを前記記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記圧縮演算は、非可逆の圧縮演算であり、
教師データが入力された場合、前記プロセサが、複数の教師データの各々について、
前記複数の圧縮経路の各々について、当該教師データと、当該教師データを当該圧縮経路により圧縮することで取得されたエンコード教師データの伸張後のデータであるデコード教師データを取得し、
当該複数の教師データと、複数のデコード教師データの各々との誤差を算出し、
前記複数のデコード教師データの各々について算出された誤差と、前記複数の圧縮経路の各々の圧縮演算規模とを基に、圧縮経路の選択を学習する、
ストレージシステム。
前記複数の教師データの各々について、算出された複数の誤差が、圧縮演算規模が相対的に小さい圧縮経路について閾値以下の誤差である該当誤差を含んでいる場合、前記プロセサは、当該教師データの特徴に該当する特徴を持ったデータについては最小の該当誤差に対応した圧縮経路を選択することを学習する、
請求項１に記載のストレージシステム。
前記複数の圧縮経路の各々は、それぞれ順次畳み込み演算を行う１つ以上の畳み込み層で構成された畳み込みニューラルネットワークである、
請求項１に記載のストレージシステム。
前記プロセサは、ユーザインターフェースを提供し、
前記ユーザインターフェースは、下記のうちの少なくとも一つを受け付けるインターフェースであり、
少なくとも１つの圧縮演算規模について、当該圧縮演算規模の圧縮経路の数、及び、
少なくとも１つの圧縮演算規模の定義、
前記プロセサは、前記ユーザインターフェースを介して入力された値に基づき前記複数の圧縮経路を構築する、
請求項１に記載のストレージシステム。
記憶装置と前記記憶装置に接続されたプロセサとを備えるストレージシステムであって、
前記プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを前記記憶装置に格納し、
前記プロセサが、前記複数のデータの各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた畳み込み演算を行うようになっており、
前記複数のデータの各々について、圧縮演算規模の決定は、畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することであり、
前記圧縮演算は、非可逆の圧縮演算であり、
前記複数のデータの各々について、前記プロセサが、ニューラルネットワークを実行することで、前記複数の入力チャネルのうちのマスク対象の入力チャネルと前記カーネル量とを表す複数の出力値を当該データの特徴に基づき出力し、
教師データが入力された場合、前記プロセサが、複数の教師データの各々について、カーネル量と、マスク対象チャネル数と、誤差とを基に、前記ニューラルネットワークを学習する、
ストレージシステム。
前記複数の教師データの各々について、前記ニューラルネットワークの学習は、最小化目標値＝第１係数・カーネル量＋第２の係数・（－１・マスク対象チャネル数）＋誤差における前記最小化目標値が最小となる学習である、
請求項５に記載のストレージシステム。
記憶装置と前記記憶装置に接続されたプロセサとを備えるストレージシステムであって、
前記プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを前記記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、前記エンコードデータから取得される複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換し、
前記プロセサが、前記複数のエンコードデータについて作成された複数のデコードデータを基に、前記データのデコードデータを作成し、
前記複数のエンコードデータの各々について、
伸張演算規模の決定は、伸張演算規模が異なりそれぞれが伸張演算を行う複数の伸張経路から、伸張経路を選択することであり、
当該選択された伸張経路が、当該エンコードデータをデコードデータに変換する、
ストレージシステム。
前記圧縮演算は、非可逆の圧縮演算であり、
教師データが入力された場合、前記プロセサが、複数の教師データの各々について、
前記複数の圧縮経路の各々について、当該教師データと、当該教師データを当該圧縮経路により圧縮することで取得されたエンコード教師データを前記複数の伸張経路に伸張させることで複数のデコード教師データを取得し、
当該教師データと、当該教師データについて取得された前記複数のデコード教師データの各々との誤差を算出し、
前記複数のデコード教師データの各々について算出された誤差と、複数の経路組合せの圧縮演算規模及び伸張演算規模とを基に、経路組合せの選択を学習し、
前記複数の経路組合せの各々は、いずれかの圧縮経路といずれかの伸張経路との組合せである、
請求項７に記載のストレージシステム。
記憶装置と前記記憶装置に接続されたプロセサとを備えるストレージシステムであって、
前記プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを前記記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換し、
前記プロセサが、前記複数のエンコードデータについて作成された複数のデコードデータを基に、前記データのデコードデータを作成し、
前記プロセサが、前記複数のエンコードデータの各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた逆畳み込み演算を行うようになっており、
前記複数のエンコードデータの各々について、伸張演算規模の決定は、逆畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該逆畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することである、
ストレージシステム。
記憶装置と前記記憶装置に接続されたプロセサとを備えるストレージシステムであって、
前記プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを前記記憶装置に格納し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、前記エンコードデータから取得される複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換する、
ストレージシステム。
プロセサが、
複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記複数のデータについて作成された複数のエンコードデータを基に、前記データのエンコードデータを作成し、
前記エンコードデータ又はそれの圧縮データを記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記圧縮演算は、非可逆の圧縮演算であり、
教師データが入力された場合、前記プロセサが、複数の教師データの各々について、
前記複数の圧縮経路の各々について、当該教師データと、当該教師データを当該圧縮経路により圧縮することで取得されたエンコード教師データの伸張後のデータであるデコード教師データを取得し、
当該複数の教師データと、複数のデコード教師データの各々との誤差を算出し、
前記複数のデコード教師データの各々について算出された誤差と、前記複数の圧縮経路の各々の圧縮演算規模とを基に、圧縮経路の選択を学習する、
記憶制御方法。
プロセサが、
複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記複数のデータについて作成された複数のエンコードデータを基に、前記データのエンコードデータを作成し、
前記エンコードデータ又はそれの圧縮データを記憶装置に格納し、
前記プロセサが、前記複数のデータの各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた畳み込み演算を行うようになっており、
前記複数のデータの各々について、圧縮演算規模の決定は、畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することであり、
前記圧縮演算は、非可逆の圧縮演算であり、
前記複数のデータの各々について、前記プロセサが、ニューラルネットワークを実行することで、前記複数の入力チャネルのうちのマスク対象の入力チャネルと前記カーネル量とを表す複数の出力値を当該データの特徴に基づき出力し、
教師データが入力された場合、前記プロセサが、複数の教師データの各々について、カーネル量と、マスク対象チャネル数と、誤差とを基に、前記ニューラルネットワークを学習する、
記憶制御方法。
プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、前記エンコードデータから取得される複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換し、
前記プロセサが、前記複数のエンコードデータについて作成された複数のデコードデータを基に、前記データのデコードデータを作成し、
前記複数のエンコードデータの各々について、
伸張演算規模の決定は、伸張演算規模が異なりそれぞれが伸張演算を行う複数の伸張経路から、伸張経路を選択することであり、
当該選択された伸張経路が、当該エンコードデータをデコードデータに変換する、
記憶制御方法。
プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを記憶装置に格納し、
前記複数のデータの各々について、
圧縮演算規模の決定は、圧縮演算規模が異なりそれぞれが圧縮演算を行う複数の圧縮経路から、圧縮経路を選択することであり、
当該選択された圧縮経路が、当該データをエンコードデータに変換し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換し、
前記プロセサが、前記複数のエンコードデータについて作成された複数のデコードデータを基に、前記データのデコードデータを作成し、
前記プロセサが、前記複数のエンコードデータの各々について、複数の入力チャネルのうちマスク対象の入力チャネル以外の入力チャネルと、所定のカーネル量のカーネルとを用いた逆畳み込み演算を行うようになっており、
前記複数のエンコードデータの各々について、伸張演算規模の決定は、逆畳み込み層の複数の入力チャネルのうちのマスク対象の入力チャネルと、当該逆畳み込み層において使用されるカーネルのカーネル量とのうちの少なくとも一つを決定することである、
ストレージシステム。
プロセサが、複数のデータの各々について、
当該データの特徴を基に、当該データの圧縮演算規模を決定し、
決定された圧縮演算規模に従う圧縮演算を行うことで、当該データをエンコードデータに変換し、
前記エンコードデータ又はそれの圧縮データを記憶装置に格納し、
前記プロセサが、前記記憶装置からエンコードデータを取得し、又は、前記記憶装置から取得した圧縮データをエンコードデータに伸張し、
前記プロセサが、前記エンコードデータから取得される複数のエンコードデータの各々について、
当該エンコードデータの特徴を基に、当該エンコードデータの伸張演算規模を決定し、
決定された伸張演算規模に従う伸張演算を行うことで、当該エンコードデータをデコードデータに変換する、
記憶制御方法。