JP2020166690A - ストレージシステム、及び、データ記録方法 - Google Patents

ストレージシステム、及び、データ記録方法 Download PDF

Info

Publication number
JP2020166690A
JP2020166690A JP2019067988A JP2019067988A JP2020166690A JP 2020166690 A JP2020166690 A JP 2020166690A JP 2019067988 A JP2019067988 A JP 2019067988A JP 2019067988 A JP2019067988 A JP 2019067988A JP 2020166690 A JP2020166690 A JP 2020166690A
Authority
JP
Japan
Prior art keywords
data
sensor data
sensor
sensors
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019067988A
Other languages
English (en)
Other versions
JP7140705B2 (ja
Inventor
彬史 鈴木
Akifumi Suzuki
彬史 鈴木
弘明 圷
Hiroaki Akutsu
弘明 圷
貴洋 成子
Takahiro Naruko
貴洋 成子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019067988A priority Critical patent/JP7140705B2/ja
Priority to US16/810,615 priority patent/US11256422B2/en
Priority to EP20161353.6A priority patent/EP3716489A1/en
Publication of JP2020166690A publication Critical patent/JP2020166690A/ja
Application granted granted Critical
Publication of JP7140705B2 publication Critical patent/JP7140705B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3057Distributed Source coding, e.g. Wyner-Ziv, Slepian Wolf
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3068Precoding preceding compression, e.g. Burrows-Wheeler transformation
    • H03M7/3077Sorting
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6064Selection of Compressor
    • H03M7/607Selection between different types of compressors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】記憶資源を浪費することなく、多種、大量のセンサデータを、的確に圧縮しながら、格納できるストレージシステムを提供する。【解決手段】複数のセンサから出力されたセンサデータを記録するストレージと、ストレージへのセンサデータの記録を制御するプロセッサと、を備えるストレージシステム1であって、複数のセンサ夫々のパラメータを記録するメモリを備える。プロセッサは、センサデータを出力するセンサに割り当てられたパラメータをメモリから読み出し、パラメータに基いて、センサデータを正規化させ、正規化されたセンサデータを圧縮させ、圧縮されたセンサデータをストレージに記録させる。【選択図】図1

Description

本発明は、ストレージシステムに関わり、詳しくは、多数のセンサから出力された、多種、かつ、大量のセンサデータを記録するのに適したストレージシステムに関する。
近年、様々な分野、用途にIoTが導入されている。IoTのためのシステムは、多種、多様なセンサであって、センサから出力される大量の時系列データを格納し、格納された大量のデータを分析するのに適したものでなければならない。そこで、ストレージシステムは、大量のセンサデータを圧縮して、データサイズを小さくしながら、限られたストレージ資源を有効利用している(例えば、下記の特許文献1)。データ圧縮方法の1つとして、ランレングス法のように、所定のブロック単位内で出現頻度の高い文字列を辞書化してより小さなサイズの符号に置換することが知られている。
特開2007−199891号公報
センサデータは、そもそも、画像データと異なり、センサの種類によって、センサデータの値域が大きく変動する。さらに、センサデータの値は外乱や異常値を多く含む等、既存の圧縮方法には本来不向きであった。その一方で、IoTの拡大に伴ってセンサの数が益々増え、これに伴いセンサデータ量が飛躍的に増大し、大量の記憶資源を割り当てなければならないという課題がある。
そこで、本発明は、記憶資源を浪費することなく、多種、大量のセンサデータを、的確に圧縮しながら、格納できるストレージシステムを提供することを目的とする。
前記目的を達成するために、本発明は、複数のセンサから出力されたセンサデータを記録するストレージと、当該ストレージへのセンサデータの記録を制御するプロセッサと、を備える、ストレージシステムであって、前記複数のセンサのパラメータを記録するメモリを備え、前記プロセッサは、前記センサデータを出力するセンサに割り当てられたパラメータに基いて、複数の前記センサをグループ化して、前記グループごとに前記センサデータを正規化させ、当該正規化されたセンサデータを前記グループで纏めて圧縮させ、圧縮されたセンサデータを前記ストレージに記録させる、というものである。
さらに、本発明は、複数のセンサから出力されたセンサデータをストレージに記録させるデータ記録方法であって、当該ストレージへのセンサデータの記録を制御するプロセッサが、前記センサデータを出力するセンサに割り当てられたパラメータに基いて、複数の前記センサをグループ化して、前記グループごとに前記センサデータを正規化させ、当該正規化されたセンサデータを前記グループで纏めて圧縮させ、圧縮されたセンサデータを前記ストレージに記録させる、というものである。
本発明によれば、記憶資源を浪費することなく、多種、大量のセンサデータを、的確に圧縮しながら、格納できるストレージシステムを提供することができる。
ストレージシステムを含む計算機システムのハードウェアのブロック図である。 ストレージノードがセンサデータを圧縮するための機能ブロック図である。 データ圧縮器の詳細を説明するための機能ブロック図である。 ストレージシステムに於ける、圧縮データの伸張処理を説明するための機能ブロック図である。 データ伸張器の詳細を説明するための機能ブロック図である。 正規化パラメータテーブル、そして、圧縮グループ管理テーブルの一例である。 プロセッサが複数のセンサを圧縮グループに分類するための実施態様の一例を示すフローチャートである。 サイドシグナルを決定するための実施態様の一例を示すフローチャートである。
次に、本発明の実施形態を図面に基づいて説明する。図1は、ストレージシステムを含む計算機システムのハードウェアのブロック図である。計算機システムは、ストレージシステム1と、複数のセンササーバ102A〜102B、クライアントサーバ103と、を備えている。これらは、ネットワーク101によって、互いに、接続されている。ストレージシステム1は、複数のストレージノード100A〜100Dから構成されている。センササーバ102AにはセンサA、センサBが、センササーバ102Bには、センサC、センサD、センサEが、それぞれ接続されている。センサ120A〜120Eとしては、温度センサ、湿度センサ、加速度センサ、歪センサ、画像センサ等、いかなるタイプのものであってよい。
ストレージノード100Aは、ストレージコントローラ10、そして、ストレージ(記憶資源)12と、を備える。ストレージコントローラ10は、一次記憶領域であるメインメモリ(DRAM)111、ソフトウェアを実行して、データ圧縮・データ伸張の処理を実行て、データをストレージ12に格納するプロセッサ112、二次記憶領域となるストレージ12に接続するバックエンドインターフェース(BE IF)113、ネットワーク101に接続するフロントエンドインターフェース(FE IF)116と、を備えて構成される。これは、ストレージノード100B〜100Dも同じである。ストレージ12は、記憶媒体としてのHDD、SDD114を備える。
DRAM111は、プロセッサ112が短時間でアクセスできる接続によって、プロセッサ112と接続されており、プロセッサ112が実行するプログラムや、データを格納する。プロセッサ112は、プログラムに従って動作し、データを処理する。プロセッサ112は複数のコアを持ち、夫々のコアは独立して、または、他のコアと協調してプログラムを処理するものでもよい。
プロセッサ112は、DRAMコントローラを持ち、DRAMコントローラは、DRA111からデータを取得、または、これにデータを格納する。プロセッサ112は、外部IOインターフェースを持ち、これを介して、BE IF113に接続する。プロセッサ112は、BE IF113を介して、圧縮データをストレージ12にライトし、圧縮データをリードする。後述の各種処理を行う。
プロセッサ112は、SDS(Software Defined Storage)、DB(DataBase)等のストレージ関連ソフトウェアを実行しながら、データの圧縮・圧縮データの伸張を行う。複数のストレージノード100A〜100Dの夫々の物理ストレージ12は統合されて仮想化され、仮想ボリューム140として構成されている。プロセッサ12は圧縮されたデータを、仮想ボリューム140に書き込むと、圧縮データは、複数のストレージノード夫々のストレージ12に分散して格納される。
BE IF113は、SATA(Serial ATA)やSAS(Serial Attached SCSI)といった記憶媒体と通信する為のインターフェースである。BE IF113は、ライト時には、プロセッサ112からの指示に基づき、ライト対象データをDRAM111より取得し、ストレージ12に転送する。リード時には、リード対象データを、ストレージ12からリードしてDRAM111に転送する。なお、BE IF113は、ストレージ12に搭載されるインターフェース、例えば、NVMe(Non-Volatile Memory Host Controller Interface)でもよい。
FE IF116は、ストレージノード100をネットワーク101に接続させる。センササーバ102A,102Bは、夫々に接続されたセンサを管理し、センサから出力されるセンサデータを、ネットワーク101を介して、既述の仮想ボリュームに転送する。
クライアントサーバ103は、ユーザに、ストレージノード100A〜100Dに蓄えたセンサデータを参照させる。クライアントサーバ103から要求を受けたストレージノードは、プロセッサ112によって、圧縮されたセンサデータを伸張してクライアントサーバ103に転送する。
IoTの進展により、センサデータの飛躍的な増大が予測されている。こうした大量のセンサデータを低コストに格納するために、ニューラルネットワークにて構築したエンコーダを用いて、データを非可逆圧縮するストレージが検討されている。
既述のとおり、センサデータは、汎用の圧縮方法には適さないものであったが、人工知能はセンサデータ毎の特性、特徴、性質、属性、又は、性能等を学習することができるので、いかなる類のセンサデータであっても、データの特性に特化させて、センサデータの圧縮効率を高めることができる。
高い圧縮率のエンコーダを作成するには、ニューラルネットワークが複数のセンサのデータを纏めて学習する必要がある。しかしながら、センサデータの値域は、センサによって、大きく異なるために、ニューラルネットワークが複数のセンサのデータを纏めて学習しようとすると、センサデータの値域が大きなセンサほど、センサデータが優先的に保持され、センサデータの値域が小さなセンサは非可逆圧縮にて、情報を大きく失うことになる。センサデータの値域が違うという課題を解決する一般的な対策は、センサデータを正規化することである。即ち、センサデータの平均値、分散、最大値、最小等を算出し、その値を用いて、センサデータを正規化すればよい。
ところが、平均値や分散値等正規化のためのパラメータを得ようとすると、ストレージシステムは、センサデータを非圧縮状態で大量に保持するためのバッファを備えなければならず、ストレージシステムにおけるデータの圧縮率は大きく低下する。
そこで、ストレージシステムは、センサデータを正規化するパラメータを有する管理情報(データベース)を予め作成し、センサデータを圧縮する際に、データベースのパラメータを参照してセンサデータを正規化することによって、センサデータの圧縮前に大量のセンサデータを格納しなくてもよいようにした。
次に、ストレージノード100A〜100Dのセンサデータの圧縮処理について説明する。図2はその機能ブロック図である。圧縮処理は、正規化器201、正規化パラメータDB202、分配器203、データ圧縮器204A〜204C、そして、データ記録レイヤ205A〜205Cとから達成される。ストレージノードのプロセッサ112は、プログラムを実行することによって、正規化器201、分配器203、そして、データ圧縮器204A〜204Cを実現する。これらを、「手段」、「機能」、「部」などと言い換えてもよい。さらに、これらをハードウェア、又は、ハードウェアとソフトウェアの協同によって実現させてもよい。プロセッサ112は、センササーバ102からセンサデータがネットワーク101を介して転送されると、センサデータを正規化した上で圧縮する。
正規化器201には、センササーバ102から、センサデータの時系列が継続的に入力される。正規化器201は、センサデータを受領したタイミングで、正規化パラメータDB202に正規化のためのパラメータをリクエストし、正規化パラメータDB202から、センサデータに対応するパラメータを取得する。正規化器201は、正規化パラメータに基づいてセンサデータを正規化する。正規化は、センサデータの値を一定の範囲、例えば、0〜1に収めるため、下記の演算を実行する。
正規化後の値=(正規化前のセンサデータの値−正規化パラメータ(最小値))÷(正規化パラメータ(最大値)−正規化パラメータ(最小値))
これは一例であり、Max−Min法と呼ばれるものである。正規化は、z−scoreと呼ばれる方式でよい。これはは、センサ毎の値の平均値と分散値を算出し、正規化されたセンサデータを、「(センサデータ―平均値)÷分散値」によって定義するというものである。
センサデータには、センサの異常や通信経路の障害等により異常な値が含まれるおそれがある。異常値は、ニューラルネットワークの学習を失敗させる要因になる。そこで、正規化器201は、センサデータから異常値を排除する。正規化器201は、センサデータを前後のタイミングのセンサデータと比較して、極端に小さい、又は、大きな値のセンサデータを異常と判断する。
又は、正規化器201が、正規化パラメータDB202から異常値の基準としての閾値を参照して、センサデータの異常な値を判断してもよい。正規化器201は、この異常値と判断されたセンサデータを、前後のタイミング(ポイント)でのセンサデータの値の平均値に置換してよい。
又は、異常な値のセンサデータを前のタイミングのデータの値にしてもよい。正規化パラメータDB202の情報は、複数のストレージノード100A〜100Dに分散して、夫々の記憶媒体114に格納されてよい。複数のストレージノード夫々プのロセッサ112は、分散を管理する情報に基づいて、センサに対応するパラメータをリードする。
正規化器201はセンサデータを正規化すると、正規化済みセンサデータとして、これを、分配器203に伝達する。分配器203は、正規化パラメータに含まれる情報に基づいて、正規化済みセンサデータを、複数あるデータ圧縮器204A〜204Cのいずれかに分配する。図2は、正規化されたセンサデータA,Bがデータ圧縮器204Aに伝達され、正規化されたセンサデータCがデータ圧縮器204Bに伝達され、正規化されたセンサデータD,Eがデータ圧縮器204Cに伝達されることを示している。
データ圧縮器を複数存在させるのは次の理由からである。ニューラルネットワークが、センサデータを高い圧縮率で圧縮器するには、複数のセンサのセンサデータを纏めて学習しながら圧縮することが好ましい。すなわち、出力値の変化の傾向が類似した複数センサのデータを纏めて圧縮することによって、データ量がより削減される。
例えば、1,2,2,4のごとくセンサデータが変化するセンサAと3,6,6,12のごとくセンサデータが変化するセンサBとを想定して、2つのセンサデータを纏めると、圧縮器から2,4,4,8という圧縮データが出力される。そして、プロセッサ112が、センサAのセンサデータを圧縮データの1/2、センサBのセンサデータを圧縮データの3/2として再現する伸張器を構築すると、1系列の圧縮データと伸張器のパラメータをストレージに記録するだけで、2つのセンサデータを復元でき、データ量が削減できる。このように、圧縮効果を高めるためには、複数センサのデータ系列を同時に圧縮器に入力すればよい。
しかしながら、特性が異なる複数のセンサのセンサデータを纏めて圧縮すると、データの圧縮が正確に行われないおそれがある。例えば、精度が要求されるセンサとしての温度センサのセンサデータと、精度が要求されないセンサとしての湿度センサのセンサデータとを纏めて、ニューラルネットワークが非可逆圧縮すると、センサが高精度か否かに拘わらず、平均的に情報が失われてしまい、精度の高いセンサのセンサデータを精度が低いセンサのセンサデータに対して優先させて保管することができない。
そこで、ストレージシステムは、センサの特性、又は、センサデータの特性に基づいて、同じ、又は、類似の特性毎に、センサをグループ分けし、グループ毎にデータ圧縮をすることとした。センサA,Bは特性が似かよったセンサであり、センサD,Eも同様である。センサCは他のセンサと特性が異なるセンサである。
データ圧縮器204Aは、正規化されたセンサデータA,Bを圧縮して、圧縮済みセンサデータA,Bをデータ記録レイヤ205Aに記録する。データ圧縮器204Bは、正規化されたセンサデータCを圧縮して、圧縮済みセンサデータCをデータ記録レイヤ205Bに記録する。データ圧縮器204Cは、正規化されたセンサデータD,Eを圧縮して、圧縮済みセンサデータD,Eをデータ記録レイヤ205Cに記録する。
複数のセンサ夫々のセンサデータ同士に依存関係、又は、相関関係が存在する場合、例えば、温度と湿度とのように、相互に依存関係があり、一つのセンサのセンサデータを圧縮するのに、他のセンサのセンサデータを利用することによって、当該一つのセンサのセンサデータの圧縮率を向上させることができる。圧縮器は、気温データと湿度データとを纏めて圧縮するのではなく、圧縮器が湿度データを非可逆圧縮する際、気温データを補足情報として用いることで、湿度データの圧縮率を向上できる。あるデータの圧縮に他のデータを利用することをサイドシグナルという。サイドシグナルは一つのセンサデータに限られず、複数でもよい。
データ圧縮器204Bが正規化されたセンサデータCを圧縮し、次いで、これをデータ伸張器204B−1が伸張してデータ圧縮器204Aに送る。データ圧縮器204Aは、圧縮された後伸張された、正規化されたセンサデータC(サイドシグナル)を利用して、正規化されたセンサデータA,Bを圧縮する。このように、複数のデータ同士の間に依存関係があり、一方のデータを利用して他方のデータを圧縮する場合には、複数の圧縮器は、データを圧縮する順番を調整して、データ圧縮を実行する。
プロセッサ112は、あるデータを圧縮する場合、当該データにサイドシグナルがあると、サイドシグナルの圧縮を先に行う。圧縮されたセンサデータCが伸張されてから、データ圧縮器204Aがデータを圧縮する理由は、圧縮されたセンサデータA,Bを伸張する際、圧縮されたセンサデータCの伸張後のデータが利用されるためである。プロセッサ112は、センサデータA,BとセンサデータCとの圧縮の順番とは関係なく、センサデータD,Eを圧縮すればよい。
データ保持レイヤ205A〜205Cは、圧縮データを複数のストレージノード100A〜100Dに分散することで保持するものであり、分散ストレージソフトウェア(例えばCeph)により構成される。データ保持レイヤ205A〜205Cは、データの保護のためにデータを冗長化して複数のストレージノードに分散配置する。
次に、データ圧縮器204Aを例として、データ圧縮器の詳細な機能ブロックを図3に基づいて説明する。データ圧縮器204Aは、エンコーダ301、量子化器302、コンテクスト適応型符号化器303を備える。エンコーダ301は、分配器203から、正規化済みのセンサデータA,Bを受領し、変換する。エンコーダ301は、複数のセンサデータ参照し、類似した冗長なデータを纏め、高周波のデータを除去するなどの変換処理を行い、よりデータ量の少ない形式に変換する。エンコーダ301はニューラルネットワークから構成される。
量子化器302は、エンコーダ301の出力であるエンコード済みデータを量子化する。この処理は、例えば、エンコーダ301の出力値がfloat32形式の実数値であったものをflot16形式の実数値シンボルや、int8形式の整数値シンボルに変換する。これ以外にも、シンボルに対して一意に実数値、例えば、SymbolA: 31.4,SymbolB:-4.5を決定しておき、エンコード済みの実数値が最も近い実数値のシンボルに置き換えられるという処理、35.1→SymbolA,2.0→SymbolB、でもよい。量子化器により値の情報は不正確となるが、データ量を大幅に削減することが可能になる。尚、量子化器302は、センサデータの圧縮のタイプが可逆圧縮(Lossless)である場合には無効にされる。
コンテクスト適応型符号化器303は、量子化器302の出力値である量子化済みセンサデータを解析し、センサデータがセンサから出力されるタイミング、ポイントと言い換えてもよいが、ポイント毎のシンボルの出現確率を予測する。正規化パラメータテーブル610(図6:正規化パラメータDB)に、同じ圧縮器で圧縮される、複数のセンサデータのグループ(圧縮グループ)にサイドシグナルが設定されている場合、サイドシグナルを用いてさらに高精度にシンボルの出現確率を予測する。サイドシグナルに基づいて、シンボルの出現確率を予測することを、具体的に説明すると以下のとおりである。
「A,B,A,B,A,A,B」というシンボル列があるセンサデータが量子化器302から出力されたことを想定する。コンテクストを考慮した圧縮の方式(例えば、CABAC:Context-based Adaptive Binary Arithmetic Coding)によれば、BはAの次に現れる確率が高く、Aが現れると3/4の確率で次がBになり、1/4の確率でAになることが判定される。この方式では、1ポイント前のシンボル以外のポイントのシンボルも用いてシンボルの発生確率を取得して圧縮を行う。
コンテクスト適応型符号化器303は、さらにサイドシグナルを用いて、ポイント毎のシンボルの出現確率を予測する。例えば、「A,B,A,B,A,A,B」というシンボル列を圧縮するのに用いるサイドシグナルが「C,C,C,C,C,D,C」というシンボル列であった場合、一つ前のポイントがシンボルAとであり、サイドシグナルの同じポイントのシンボルがCのときはBとなる確立が100%である。
同様に一つ前のポイントがシンボルAであり、サイドシグナルの同じポイントのシンボルがDのときはAとなる確率が100%となる。このように適切なサイドシグナルを用いることで、ポイント毎のシンボルの出現確率がより高精度に予測可能である。コンテクスト適応型符号化器303は、シンボルの出現確率を予測した後、その出現確率を用いて量子化後のセンサデータを算術圧縮する。サイドシグナルが登録されていない圧縮グループに対して、コンテクスト適応型符号化器303は、量子化されたデータのみを用いてポイント毎のシンボルの出現確率を予測する。
次に、ストレージシステムに於ける、圧縮データの伸張処理について説明する。図4に、その機能ブロック図を示す。プロセッサ112によって実行される伸張処理は、逆正規化器401、正規化パラメータDB202、収集器403、データ伸張器404A〜404Cそして、データ記録レイヤ205A〜205Cによって実現される。
プロセッサ112は、クライアントサーバ103からセンサデータを取得する要求を受信するとデータ伸張を開始する。逆正規化器401は、正規化パラメータデータベース202に、クライアントサーバ103から要求があったセンサの正規化パラメータをリクエストし、正規化パラメータを取得し、その情報を収集器403に通知する。
プロセッサ112は、データ記録レイヤ205Aから圧縮されたセンサデータA,Bをリードして、データ伸張器404Aに圧縮データを伸張させる。プロセッサ112は、データ記録レイヤ205Bから圧縮されたセンサデータCをリードして、データ伸張器404Bに圧縮データを伸張させる。
そして、プロセッサ112は、データ記録レイヤ205Cから圧縮されたセンサデータD,Eをリードして、データ伸張器404Cに圧縮データを伸張させる。収集器403は、データ伸張器404Aから、正規化されたセンサデータA,Bを収集し、データ伸張器404Bから、正規化されたセンサデータCを収集し、データ伸張器404Cから、正規化されたセンサデータD,Eを収集し、これらを纏めて、逆正規化器401に出力する。
プロセッサ112は、正規化パラメータに基づいて、圧縮データの伸張処理の順序を決定する。すなわち、要求があったセンサにサイドシグナルが存在する場合には、サイドシグナルのセンサデータを先に伸張させる。プロセッサ112は、センサA,Bの圧縮データを伸張させる前にセンサCの圧縮データを伸張させて、これを利用して、センサA,Bの圧縮データを伸張させる。
プロセッサ112は、センサデータCの圧縮データを伸張することは、順番に関係なく、任意のタイミングでよい。複数のデータ記録レイヤ205A〜205Cの夫々は、複数のストレージノードに分散して格納されている、特定のセンサ圧縮データを集めて結合して、これを自身に対応するデータ伸張器404A〜404Cの何れかに渡す。
逆正規化器401は、収集器403から受領した、正規化されTセンサデータを正規化パラメータを用いてもとの値域に戻す。これは、0〜1に正規化されたデータに、次の演算処理を適用することによって達成される。
逆正規化後のセンサデータの値=正規化後のセンサデータの値×(正規化パラメータの最大値−正規化パラメータの最小値)+正規化パラメータの最小値
逆正規化器401は、逆正規化処理によって、値域が正規化前に戻されたセンサデータをクライアントサーバ104に提供する。
次に、データ伸張器404Aの詳細を、図5のブロック図に基づいて説明する。データ伸張器404Aは、デコーダ501とコンテクスト適応型逆符号化器503とから構成されている。他のデータ伸張器も同じである。
データ伸張器404Aは、非可逆圧縮された、センサA及びセンサBのデータを伸張する際に、サイドシグナルである、センサCのデータを必要とする。このセンサCのデータは、非可逆圧縮された後伸張されたデータであり、非可逆圧縮によって一部のデータが失われているが、正規化されたデータと同じである。そこで、データ伸張器404Bは、データ伸張器404Aが圧縮データを伸張するよりも先に、センサCの圧縮データを先に伸張する。
コンテクスト適応型逆符号化器503は、センサA及びセンサBの圧縮データとセンサCの伸張データを用いて算術圧縮されたデータを伸張する。コンテクスト適応型逆符号化器503は、あるポイントより前に伸張された、センサA及びセンサBの圧縮データと、センサCのデータと、を用いてそのポイントでのシンボルの出現確率を算出し、その出現確率を用いてシンボル値を伸張する。コンテクスト適応型逆符号化器503は、この動作を繰り替えすことで、センサA及びセンサBの圧縮データの全データを伸張する。コンテクスト適応型逆符号化器503は伸張データをデコーダ501に転送する。
デコーダ501は、伸張されたデータを、正規化されたセンサデータに近い形式に変換し、変換後のデータを収集器403に転送する。このデコーダ501はニューラルネットワークにて構成される。なお、データ伸張器404Bは、センサCのセンサデータにはサイドシグナルが設定されていないので、センサCの圧縮データのみを伸張し、データ伸張器404Cも、サイドシグナルを利用することなく、センサDの圧縮データと、センサEの圧縮データと、を伸張する。
次に、正規化パラメータデータベース202について説明する。正規化パラメータデータベース202は、正規化パラメータと圧縮グループとを管理する。既述のとおり、センサの特性に基づいて、特性が似かよったセンサをグループとしてまとめ、ストレージシステムは、グループ毎に圧縮を実行する。このグループを圧縮グループと称することとした。正規化パラメータデータベース202は、図6に示す様に、正規化パラメータテーブル610と、圧縮グループ管理テーブル620とを含む。正規化パラメータテーブル610は、センサ名611と、センサに対して設定された正規化パラメータ612〜615、センサに対する圧縮グループの対応情報616〜617を備える。ここでの正規化は、MAX−MIN法である。正規化パラメータテーブル610は、センサ名611、MAX値612、MIN値613、センサ精度614、異常値判定閾値615、圧縮グループ616、サイドシグナル617のフィールドを含む。
センサ名611は、センサの名称を文字列として格納するフィールドである。正規化器201は、クライアントサーバ103から送られたセンサ名に基いて、正規化パラメータを取得することができる。センサ名はユーザによって設定されてよい。
MAX値612は、センサ名611に指定されたセンサの測定可能な最大値であり、MIN値613は、その最小値である。これらは、センサの種類やスペックによって変化する。正規化器201がセンサデータの正規化のため、そして、逆正規化器401が伸張データを逆正規化するために、MAX値、そして、MIN値を利用する。逆正規化とは、正規化されたデータを正規化される以前の姿に戻すことをいう。これらの値はユーザによって設定されてよい。
センサ精度614は、センサ名611で特定されたセンサの測定精度である。ユーザによって設定されてよい。
異常値判定閾値615は、センサ名611によって特定されたセンサの測定データのうち、異常な値を識別するための閾値である。正規化器201は、閾値に基いて、閾値外のデータを削除するか、或いは閾値内のデータ置き換えてもよい。閾値は、ユーザによって入力されてよい。又は、センササーバ101A〜101C、又は、ストレージノード100A〜100Dが、センサデータに基いて、算出してもよい。例えば、センサデータの平均値と分散とを算出し、
平均値±(分散×3)
を閾値としてもよい。
圧縮グループ616は、センサ名611で特定されたンサが属する圧縮グループの識別情報である。ニューラルネットワークにて構成されたエンコーダ301が、特性が互いに複数する複数のセンサ夫々のセンサデータを纏めてエンコードして、データ量の少ない効率的な形式に変換して、圧縮を行う。センサ、或いは、センサデータの特性が類似するほど、エンコーダ301は効率的な形式へに変換できる。互いに、特性が類似しない複数のセンサの間では、このような変換はできないので、複数のセンサは別々に、複数の圧縮器で圧縮、そして、複数の伸張器で伸張されることがよい。
即ち、同一の圧縮グループに属するセンサのデータを非可逆圧縮することによる情報の損失は、その圧縮グループに属するセンサに同様に生じるため、例えば、センサの特性の一例としての精度について、精度が高いセンサと精度が低いセンサが同一グループに属すると、精度が高いセンサのデータの方が非可逆圧縮による情報損失の量が多くなるため、精度が高いセンサと精度が低いセンサとは別の圧縮グループに分類した方が好適である。プロセッサ112は、圧縮グループ616を利用してセンサデータの圧縮、伸張を管理する。圧縮グループ616はユーザによって設定されてもよいし、ストレージノードのプロセッサ112によって決定、判定、又は、設定されてもよい。
サイドシグナル617は、センサ名611で特定されたセンサがサイドシグナルとして適用される圧縮グループの番号である。サイドシグナルは、既述のとおり、圧縮グループに属するセンサデータの圧縮率を向上させるのに用いる、他のセンサデータのことである。サイドシグナル617の設定値はストレージノードにセンサデータを格納する前にユーザが入力するか、ストレージノードが処理する後述のサイドシグナルの自動決定により自動的に設定される。サイドシグナル617はユーザによって設定されてもよいし、ストレージノードのプロセッサ112によって設定されてもよい。
正規化パラメータデータベース202は、圧縮グループ管理テーブル620を備える。圧縮グループ管理テーブル620は、圧縮グループごとの圧縮方式を管理する。分配器203は、正規化器201を介して、圧縮グループごとの圧縮方式を参照し、これをデータ圧縮器204A〜204Cに通知する。圧縮グループ管理テーブル620は、圧縮グループ621、圧縮種別622、圧縮オプション623を備える。圧縮グループ621は、正規化パラメータテーブル610の圧縮グループ616に対応している。
圧縮種別622は、圧縮グループ番号621に指定された圧縮グループに対する圧縮種別を格納するフィールドである。このフィールドは、可逆圧縮の複数のアルゴリズムと非可逆圧縮の複数のアルゴリズムの中から、好適な圧縮方式が設定されればよい。圧縮種別622はユーザによって設定されてよい。あるいは、ストレージノードが設定してもよい。LossyA,LossyDは、非可逆圧縮の例である。LosslessDは、可逆圧縮の一例である。
圧縮オプション623は、圧縮グループ番号621に指定された圧縮グループに対する圧縮のためのオプションを指定するフィールドである。これには、例えば、量子化器302の量子化粒度がある。正規化パラメータテーブル601、圧縮グループ管理テーブル620には、データの圧縮前に、情報が登録される。
次に、ストレージシステムが圧縮グループを決定する一例を、図7に示すフローチャートに基いて説明する。なお、自動分類は、例えば、K-Meansクラスタリングに基いて達成されてもよい。ストレージシステムは、センササーバから、大量のセンサデータのうち一部のデータをテストデータとして受け入れ、テストデータに基いて、圧縮グループを決定してよい。ストレージシステムは、センサの精度を判定して、センサをグループ分けする。ストレージシステムは、複数のセンサ夫々について、図7のフローチャートを実施する。
プロセッサ112は、正規化パラメータテーブル601から、複数のセンサ夫々の正規化パラメータを取得して、測定段階数を求める(S701)。測定段階数は、センサの測定範囲(Max〜Min:612,613)を測度精度614で割った値である。例えば、−1から+1の値域の±0.001の精度のセンサは、測定段階数が2000であり、−10から+10の値域の±0.001の精度をセンナは、測定段階数が20000である。この値が大きいセンサほど、センサデータの段階が多く、センサデータを高い精度で保存する理由がある。
測定段階数が大きいセンサが属するグループは、量子化器302における量子化精度が細かくされることにより、センサデータは低い圧縮率で非可逆圧縮され、情報の損失が少ないものの圧縮によるデータ削減率は低下する。一方、この測定段階数が低いセンサが属するグループは、量子化精度が粗くされることにより、センサデータは高い圧縮率で非可逆圧縮され、情報の損失が多いものの圧縮によるデータ削減率は上昇する。
続いて、プロセッサ112は、測定段階数を基準値で分割して、測定段階グループを作成する(S702)。例えば、基準値が100、1000であるとしたとき、測定段階数が50で基準値100までのセンサは測定段階数グループ1に、測定段階数が340で基準値1000までのセンサは測定段階数グループ2に、測定段階数が2000で基準値1000を越えるセンサは、測定段階数グループ3に分類される。
続いて、プロセッサ112は、測定段階グループ毎に、同一の測定段階グループに属する複数のセンサのセンサデータに基いて、互いの相関係数を算出する(S703)。2つのセンサのセンサデータについて、相関係数の絶対値が大きいほど、その2つのセンサは特性が類似した傾向があるといえる。
次いで、プロセッサ112は、相関係数に基いて、複数のセンサを圧縮グループに分類する(S704)。プロセッサ112は、相関係数の絶対値が、例えば、0.4より大きい、一つ又は複数のセンサを同一の圧縮グループに分類する。これにより、同一圧縮グループには測定段階数が近く、類似した傾向を持つセンサが集められる。尚、相関係数が閾値以上となるセンサが複数の圧縮グループに存在する場合、最も相関係数が大きなセンサが所属する圧縮グループに属することにすればよい。一つの圧縮グループには、少なくとも一つのセンサが含まれる。
次いで、プロセッサ112は、圧縮グループを正規化パラメータテーブル610に登録する(S705)。
次に、ストレージシステムがサイドシグナル決定する一例を、図8に示すフローチャートに基いて説明する。このフローチャートは、測定段階数が異なり、同一の圧縮グループに分類できないが、ストレージシステムは、互いに、依存関係にあるセンサについて、一方のセンサを他方のセンサのサイドシグナルとし、他方のセンサのセンサデータを、一方のセンサのセンサデータを利用して圧縮する。例えば、気温センサと湿度センサは精度が相違するため、同一のグループに分類できないが、気温と湿度とは依存関係があって、相関しているため、一方が他方のサイドシグナルとして、設定されてよい。
図8のフローチャートは、図7のフローチャートが完了したのち、または、ユーザが圧縮グループを手動で設定した後、スタートする。S701、S702は、図7の同番号のものと同じである。
プロセッサ112は、異なる測定段階グループのセンサ同士で相関係数を算出する(S803)。次いで、プロセッサ112は、S803で算出した相関係数に基いて、圧縮グループのセンサと、この圧縮グループ外のセンサとの間の相関係数の絶対値の平均値を算出する(S804)。
例えば、圧縮グループ1が属する測定段階グループと異なる測定段階グループに属するセンサCと、圧縮グループ1に属するセンサA及びセンサBとの相関係数について、プロセッサ112は、センサCとセンサAの相関係数の絶対値とセンサCとセンサBの相関係数の絶対値との平均値を算出する。圧縮グループ1の属する測定段階グループと異なる測定段階グループに属するセンサDやセンサEについても、同様にセンサAとセンサBとの相関係数の絶対値を算出し、その平均値を算出する。
次いで、プロセッサ112は、平均値が閾値、例えば、0.6以上か否かを判断し、これが肯定されるセンサを、圧縮グループに対するサイドシグナルに決定する(S805)。次いで、プロセッサ112は、正規化パラメータテーブル610において、サイドシグナルに決定されたセンサ名に、圧縮グループ名(グループ1)を登録する(S806)。
本発明によれば、複数のセンサ夫々のパラメータを予め記録し、プロセッサは、センサデータを受信すると、センサデータを出力するセンサに割り当てられたパラメータを読み出し、当該パラメータに基いて、センサデータを正規化できるために、圧縮前の大量のセンサデータを記録するバッファをストレージシステムの記憶資源から割り当てなくてもよいため、記憶資源を浪費することなく、多種、大量のセンサデータを、的確に圧縮しながら、格納できるストレージシステムを提供することができる。
既述の実施形態は、本発明の例であって、適宜変更されてよい。例えば、センサデータの正規化、圧縮、そして、伸張の一部、又は、全部をサーバが実施してもよい。また、センサのグループ化のためのフローチャート(図7)、そして、サイドシグナルを決定するためのフローチャート(図8)は、いずれも一例であって、適宜変更可能である。さらに、センサデータの圧縮のためのサイドシグナルは、一つに限らず複数でもよい。さらにまた、サイドシグナルを、複数のセンサに対して、多層的に設定するようにしてよい。

Claims (10)

  1. 複数のセンサから出力されたセンサデータを記録するストレージと、
    当該ストレージへのセンサデータの記録を制御するプロセッサと、
    を備える、ストレージシステムであって、
    前記複数のセンサのパラメータを記録するメモリを備え、
    前記プロセッサは、
    前記センサデータを出力するセンサに割り当てられたパラメータに基いて、複数の前記センサをグループ化して、前記グループごとに前記センサデータを正規化させ、
    当該正規化されたセンサデータを前記グループで纏めて圧縮させ、
    圧縮されたセンサデータを前記ストレージに記録させる、
    ストレージシステム。
  2. 前記プロセッサは、
    前記センサデータを学習するニューラルネットワークに、前記正規化されたセンサデータを圧縮させる、
    請求項1記載のストレージシステム。
  3. 前記プロセッサは、
    センサデータに含まれる異常値を用いずに正規化させる
    請求項1記載のストレージシステム。
  4. 前記プロセッサは、前記センサデータの値域及び前記センサの精度に基づいて、前記センサをグループに分類し、前記パラメータに登録する
    請求項1記載のストレージシステム。
  5. 前記プロセッサは、さらに、前記センサデータの相関性に基づいて、前記センサをグループに分類する、
    請求項1記載のストレージシステム。
  6. 前記プロセッサは、センサの精度あたりの値域が大きいグループに、圧縮率の低い圧縮方式を設定する、
    請求項4記載のストレージシステム。
  7. 前記プロセッサは、
    前記センサデータを圧縮するためのエンコーダを、前記ニューラルネットワークから、構成させる、
    請求項2記載のストレージシステム。
  8. 前記プロセッサは、
    前記メモリから読み出したパラメータに基づいて、前記複数のセンサのうち、互いに依存関係にあるセンサを決定し、
    当該依存関係にある複数のセンサのうち、一つのセンサのセンサデータを正規化して圧縮した後、当該圧縮したデータを利用して、他のセンサのセンサデータを正規化及び圧縮し、
    前記依存関係は、前記怨嗟データ同士の相関により決定されたものである
    請求項1記載のストレージシステム。
  9. 前記プロセッサは、
    前記一つのセンサのセンサデータを正規化して非可逆圧縮し、
    当該非可逆圧縮されたセンサデータを伸張し、
    当該伸張されたセンサデータを利用して、前記他のセンサのセンサデータを正規化して圧縮する、
    請求項8記載のストレージシステム。
  10. 複数のセンサから出力されたセンサデータをストレージに記録させるデータ記録方法であって、
    当該ストレージへのセンサデータの記録を制御するプロセッサが、
    前記センサデータを出力するセンサに割り当てられたパラメータに基いて、複数の前記センサをグループ化して、前記グループごとに前記センサデータを正規化させ、
    当該正規化されたセンサデータを前記グループで纏めて圧縮させ、
    圧縮されたセンサデータを前記ストレージに記録させる、
    データ記録方法。
JP2019067988A 2019-03-29 2019-03-29 ストレージシステム、及び、データ記録方法 Active JP7140705B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019067988A JP7140705B2 (ja) 2019-03-29 2019-03-29 ストレージシステム、及び、データ記録方法
US16/810,615 US11256422B2 (en) 2019-03-29 2020-03-05 Storage system and compressed sensor data recording method for sensors grouped based on parameters
EP20161353.6A EP3716489A1 (en) 2019-03-29 2020-03-06 Storage system and data recording method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019067988A JP7140705B2 (ja) 2019-03-29 2019-03-29 ストレージシステム、及び、データ記録方法

Publications (2)

Publication Number Publication Date
JP2020166690A true JP2020166690A (ja) 2020-10-08
JP7140705B2 JP7140705B2 (ja) 2022-09-21

Family

ID=69844382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019067988A Active JP7140705B2 (ja) 2019-03-29 2019-03-29 ストレージシステム、及び、データ記録方法

Country Status (3)

Country Link
US (1) US11256422B2 (ja)
EP (1) EP3716489A1 (ja)
JP (1) JP7140705B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113625971A (zh) * 2021-08-17 2021-11-09 咪咕数字传媒有限公司 数据存储方法、装置、设备以及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017098673A (ja) * 2015-11-19 2017-06-01 日本電信電話株式会社 データ圧縮収集システムおよび方法
JP2018061091A (ja) * 2016-10-03 2018-04-12 株式会社Preferred Networks データ圧縮装置、データ再現装置、データ圧縮方法、データ再現方法及びデータ転送方法
JP2018077757A (ja) * 2016-11-11 2018-05-17 横河電機株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP2018147172A (ja) * 2017-03-03 2018-09-20 日本電信電話株式会社 異常検知装置、異常検知方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4757038B2 (ja) 2006-01-25 2011-08-24 株式会社日立製作所 ストレージシステム及び記憶制御装置
US20200348662A1 (en) * 2016-05-09 2020-11-05 Strong Force Iot Portfolio 2016, Llc Platform for facilitating development of intelligence in an industrial internet of things system
US9875747B1 (en) 2016-07-15 2018-01-23 Google Llc Device specific multi-channel data compression
US10893296B2 (en) * 2018-10-26 2021-01-12 EMC IP Holding Company LLC Sensor data compression in a multi-sensor internet of things environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017098673A (ja) * 2015-11-19 2017-06-01 日本電信電話株式会社 データ圧縮収集システムおよび方法
JP2018061091A (ja) * 2016-10-03 2018-04-12 株式会社Preferred Networks データ圧縮装置、データ再現装置、データ圧縮方法、データ再現方法及びデータ転送方法
JP2018077757A (ja) * 2016-11-11 2018-05-17 横河電機株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP2018147172A (ja) * 2017-03-03 2018-09-20 日本電信電話株式会社 異常検知装置、異常検知方法及びプログラム

Also Published As

Publication number Publication date
US20200310655A1 (en) 2020-10-01
JP7140705B2 (ja) 2022-09-21
EP3716489A1 (en) 2020-09-30
US11256422B2 (en) 2022-02-22

Similar Documents

Publication Publication Date Title
JP7296197B2 (ja) 損失データ圧縮方法
US9048862B2 (en) Systems and methods for selecting data compression for storage data in a storage system
CN107682016B (zh) 一种数据压缩方法、数据解压方法及相关系统
CN109716658B (zh) 一种基于相似性的重复数据删除方法和系统
US11797204B2 (en) Data compression processing method and apparatus, and computer-readable storage medium
US11030050B2 (en) Method and device of archiving database and method and device of retrieving archived database
US20220365699A1 (en) Storage system and storage cost optimization method
CN104918046A (zh) 一种局部描述子压缩方法和装置
EP3885889A1 (en) Storage device and method thereof
WO2021012162A1 (zh) 存储系统数据压缩的方法、装置、设备及可读存储介质
CN102197599A (zh) 用于将数据记录压缩和解压缩的方法和设备
CN115483935A (zh) 一种数据处理方法及装置
JP7140705B2 (ja) ストレージシステム、及び、データ記録方法
CN102270262A (zh) 集成电路仿真模拟波形压缩和解压缩方法及装置
KR101842420B1 (ko) 정보 처리 장치 및 데이터 관리 방법
WO2021140867A1 (ja) ストレージシステム、及び、記憶制御方法
US9479195B2 (en) Non-transitory computer-readable recording medium, compression method, decompression method, compression device, and decompression device
KR20210113297A (ko) 컴퓨터 메모리 내의 복제 및 밸류 중복성을 제거하기 위한 시스템, 방법, 및 장치
KR102263609B1 (ko) 데이터 압축 장치 및 방법
US10687062B1 (en) Compression across multiple images
CN113537447A (zh) 多层神经网络的生成方法、装置、应用方法及存储介质
CN113242041A (zh) 数据混合压缩方法及其系统
CN113377391A (zh) 镜像文件的制作和烧录的方法、装置、设备和介质
KR102502162B1 (ko) 특징 맵을 컴프레싱하는 장치 및 방법
JP7461330B2 (ja) データ圧縮処理システム及びデータ圧縮処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220506

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220908

R150 Certificate of patent or registration of utility model

Ref document number: 7140705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150