JP4808721B2

JP4808721B2 - データ圧縮方法

Info

Publication number: JP4808721B2
Application number: JP2007533745A
Authority: JP
Inventors: ウィリアムズ，ジョージ・エドワード
Original assignee: General Electric Co
Current assignee: General Electric Co
Priority date: 2004-09-28
Filing date: 2005-09-27
Publication date: 2011-11-02
Anticipated expiration: 2025-09-27
Also published as: CN101069353B; WO2006036988A1; EP1797643A1; CN101069353A; US7076402B2; JP2008515295A; US20060074605A1

Description

本発明は、一般的にはデータ管理システムに関し、より詳細には、データ管理システムにおける効率的なデータ圧縮およびデータ記憶のためのシステムおよび方法に関する。

様々な業界において、特定の設備、プロセスなどに関連するデータを効率的に監視し、サンプリングし、記憶し、授受し、処理し、さらに分析する場合に、データ管理システムが重要である。例えば、いくつかのデータ管理システムは、動作に関するデータまたはパラメータを収集することによって、様々なプロセスを様々な時間と場所で監視するのに有効である。これは、監視したプロセスを後で分析する場合に便利である。特定のプロセスにおいて、動作に関するデータまたはパラメータには、圧力、温度、音声、速度、流量、あるいは他の任意の測定可能な物理的、化学的、または生物学的パラメータが含まれる。後の分析には、性能評価、誤差解析、コスト分析、障害予測、もしくは平均寿命分析、または様々なプロセスに関する他の所望の評価を含めてもよい。

こうした分析の多くでは、データサンプリングレート、データストレージ容量、データ圧縮率、およびそれ以外のボトルネックに基づいてデータ管理システムが制限される。このような分析の精度は、データサンプリング度数に基づくことが多い。すなわち、データサンプリングレベルが高いほど分析の精度も向上する。残念ながら、多くの場合にデータストレージ容量、データ圧縮率の制限によって、望ましいデータサンプリングレートに十分に対応できず、そのことによって特定の分析の精度が低下する。例えば、プロセス制御アプリケーションでは、１つまたは複数の並行プロセスから非常に頻回な時間間隔（例えば、１秒間に１回または１分間に１回）でデータが収集されると、膨大な量のデータが収集されることになる。結果として、こうして収集されたデータによるストレージの消費を抑えるとともに、所望の分析で使用する収集されたデータの重要な部分を保持するために、データの圧縮が重要になる。

既存のデータ圧縮技術も収集されたデータによるストレージ消費を抑えてはいるものの、このような技術ではストレージの簡便さを実現するためにデータの精度が犠牲になる。例えば、１つの既存のデータ圧縮技術には、連続的なデータのグループを組み合わせて平均し、１つの平均データポイントを作成するステップが含まれる。しかし、平均することによって、データ管理システムは平均データポイントの上下の変動を失い、結果として平均されたデータに基づく正確さを欠いた予測が得られる可能性がある。同様に、他の既存のデータ圧縮技術は有効で重要なデータを廃棄して、後から入ってくるデータ用にストレージ容量を節約または解放する可能性がある。
米国特許第４，６６９，０９７号

したがって、正確なデータ分析および予測を可能にする効率的なデータ圧縮技術が求められている。

本技術のいくつかの実施形態により、データポイントのセットを圧縮するシステムが提供される。本システムには、データポイントのセットから１つまたは複数のデータポイントを廃棄するように構成されたクリティカルアパーチャ（ｃｒｉｔｉｃａｌａｐｅｒｔｕｒｅ）圧縮モジュールが含まれる。廃棄された１つまたは複数のデータポイントは、廃棄された１つまたは複数のデータポイントの傾向を表す直線の周辺の許容帯域（ｔｏｌｅｒａｎｃｅｂａｎｄ）内にある。データポイントのセットの残りは、圧縮されたデータポイントのセットを表す。

本技術の別のいくつかの実施形態により、データの圧縮を実現する方法が提供される。本方法には、アーカイブされたデータポイントから始まり、保持されたデータポイントまで延びる上側勾配および下側勾配を有するクリティカルアパーチャを提供するステップが含まれる。上側勾配および下側勾配は、保持されたデータポイントの許容帯域と、アーカイブされたデータポイントと保持されたデータポイントとの間にある中間ポイントに基づいて求められる。本方法には、アーカイブされたデータポイントから始まり、後続の新しいデータポイントまで延びる線の勾配がクリティカルアパーチャ内にある場合は保持されたデータポイントを廃棄するステップがさらに含まれる。

本技術のさらに別の態様により、工業用ユニットからサンプリングされたデータポイントのセットを圧縮するシステムが提供される。工業用ユニットは、工業用ユニットの任意の測定可能なアクティビティを表すデータポイントのセットを提供する１つまたは複数のセンサによって監視される。本システムには、１つまたは複数のセンサからデータポイントのセットを受け取り、データポイントのセットから１つまたは複数のデータポイントを廃棄するように構成されたデータ管理システムも含まれる。

上記およびそれ以外の本発明の機能、態様、および利点については、添付の図面を参照しながら以下の詳細な説明を読むことでより深く理解されるであろう。こうしたすべての図面では、類似の要素を類似の文字で表現している。

例示的なデータ管理システムによって収集された情報用のストレージの削減を可能にするシステムおよび方法の様々な実施形態を以下に開示する。このような実施形態は、例示的な工業用プラントから記録された１つまたは複数の測定可能な動作パラメータを表すデータポイントのセットを効果的に削減する。例えば、以下でさらに詳しく説明するように、本技術のいくつかの実施形態は、以前にアーカイブされたデータポイントに関連するクリティカルアパーチャ（例えば上側勾配および下側勾配）を定義する。後続の新しいデータポイントがこのクリティカルアパーチャの内部にある場合は廃棄され、後続の新しいデータポイントがこのクリティカルアパーチャの外部にある場合は保持される。このようにして、以下に示す実施形態により、ストレージ使用容量を削減する効率的で費用対効果の高いデータ圧縮技術が提供される。

ここで図について説明する。まず図１を参照すると、データポイントのセット内の１つまたは複数のデータポイントを圧縮する例示的なデータ管理システム１０が示されている。データ管理システム１０を使用して、工業用ユニット１２から複数のセンサ１４を経由してデータ１６を収集する。データ管理システム１０には、センサ１４からデータ１６を取得するデータ収集モジュール１８、データ１６をフィルタリングまたは圧縮するクリティカルアパーチャ圧縮モジュール２０、フィルタリングまたは圧縮されたデータを保持するデータストレージモジュール２２、システム１０にインターフェース接続してシステム１０にユーザ入力２６を提供するユーザインターフェースモジュール２４が含まれる。以下で説明するいくつかの実施形態では、クリティカルアパーチャ圧縮モジュール２０によって前にアーカイブされたデータポイントに関連するクリティカルアパーチャ（例えば上側勾配および下側勾配）内にあるデータポイントを廃棄することにより、データ１６によるストレージ消費の削減が促進される。換言すれば、クリティカルアパーチャ圧縮モジュール２０は、後続のデータポイントがクリティカルアパーチャの外部に出るまでクリティカルアパーチャ内にある一連のデータポイントを廃棄する。この外部に出たデータポイントで、クリティカルアパーチャ圧縮モジュール２０はこの外部のデータポイントを次のアーカイブされたデータポイントとして記憶、記憶、または一般的に保存する。さらにこのプロセスが繰り返される。前述の各モジュール（クリティカルアパーチャ圧縮モジュール２０を含む）については、以下の各節でより詳細に説明する。

工業用ユニット１２には、工業上のタスクを実行または支援する様々なデバイスが含まれる。工業用ユニット１２の例には、流体圧縮ユニット、発電設備（ガスタービン、蒸気タービン、発電機（ｇｅｎｅｒａｔｏｒｓ）、ガスタービン航空エンジンなど）、熱交換設備（ボイラー、空気予熱器（ａｉｒｐｒｅ−ｈｅａｔｅｒｓ）、過熱器（ｓｕｐｅｒｈｅａｔｅｒｓ）、もしくはその他の熱交換デバイス）、および熱生成設備（炉など）、プラント運転監視（製紙工場など）、および／または生産施設（自動車組立工場など）が含まれる。センサ１４は、工業用ユニット１２の動作パラメータの変化を監視するように構成されている。

動作パラメータには、温度、圧力、体積、重さ、質量、数量、速度（例えば線形または回転）、加速度、流量（例えば燃料流または気流など）、位置、張力、電流、電圧、電力、生産高、時間、色、硬度、粘度、湿気／湿度などを含めてもよい。これに応じて、センサ１４には様々な感知回路および感知メカニズム、例えば、アクチュエータ、スイッチ、ゲージ、メータ、光学装置、温度測定装置（例えば、温度計、熱電対、サーミスタ、パイロメータなど）、圧力測定装置（例えば、気圧計、マノメータなど）、スケール、カウンタ、タイマ、変位測定装置、スピードメータ、周波数測定装置、流量計、動力計、電圧計、電流計、抵抗計、ポテンショメータ、タコメータ、比色計、分光光度計、ひずみゲージ、粘度計、反射率計、濁度計、湿度計、熱量計などが含まれる。この例示的な実施形態では、センサ１４は、工業用ユニット１２の監視、データ収集、サンプリング、分析、および応答制御の機能を促進する。例えば、センサ１４が速度、温度、またはその他の動作パラメータの望ましくない状態または変化を識別すると、システム１０は適切な動作パラメータに調整することによって応答できる。他の例示的な実施形態では、センサは送信されたデータを直接提供しなくてもよい。感知されたデータは、代わりに、感知されたデータを信号ゲインの調整やノイズの軽減によって変更したり、感知されたデータを特定の測定基準に基づいて変換したりするように構成されたアーカイブシステムまたはデータ収集システムから取得されてもよい。変更済みの感知されたデータは、クリティカルアパーチャ圧縮モジュールによって実際に感知されたデータから同時に処理しても別に処理してもよい。

データ管理システム１０により、複数のセンサ１４からデータ１６の動作中の監視、データ収集、圧縮、記憶、分析が促進される。例えば、データ収集モジュール１８はセンサ１４と対話し、様々な動作パラメータに対応するデータ１６を指定された時間間隔で監視および取得（またはサンプリング）する。データ収集モジュール１８の実施形態は、サンプリングレート、データタイプ、工学測定ユニットなどの制御を可能にする。いくつかの実施形態では、システム１０からデータストレージモジュール２２にデータ１６をデータポイントのセットまたはストリーム２８として送信する。

いくつかの例示的な実施形態では、システム１０はデータ１６をアパーチャ圧縮モジュール２０に送信し、ここで以下により詳細に説明するデータフィルタリングアルゴリズムに基づいてデータを分析し、圧縮する。クリティカルアパーチャ圧縮モジュール２０は、動作中に、このデータフィルタリングアルゴリズムを使用してデータポイントのセット２８を縮小し、それによってデータポイント２８のストレージ消費を削減する。データフィルタリングアルゴリズムの動作メカニズムについては、以下でより詳細に説明する。いくつかの実施形態では、データ収集モジュール１８はクリティカルアパーチャ圧縮モジュール２０にデータポイントのセット２８を実質的にリアルタイムで提供するように構成してもよい。クリティカルアパーチャ圧縮モジュール２０は、データ収集モジュール１８からデータを受け取ると、データのフィルタリングまたは圧縮を実行する。この方法では、データポイントのセット２８がデータストレージモジュール２２に記憶されるときにフィルタリングまたは圧縮が行われる。他の実施形態では、クリティカルアパーチャ圧縮モジュール２０がデータポイントのセット２８を以前に記録したデータとして受け取ってもよい。このようなシナリオでは、データ収集モジュール１８はデータポイントのセット２８をデータストレージモジュール２２に提供でき、クリティカルアパーチャ圧縮モジュール２０がデータポイントのセット２８にアクセスして後続の分析および圧縮を行うことができる。

データストレージモジュール２２は、サンプリングされたデータポイントのセット２８および／またはクリティカルアパーチャ圧縮モジュール２０のデータフィルタリングアルゴリズムのアプリケーションに従って圧縮されたデータポイントのセットのための信頼できるストレージスペースを提供する。いくつかの実施形態では、データストレージモジュール２２はローカルストレージデバイス、リモートストレージデバイス、コンピュータまたはデータストレージデバイスのネットワーク、または他の適切なストレージ構成を備えている。さらに、データストレージモジュール２２には、１つまたは複数の磁気媒体ドライブ、ハードディスクドライブ、光学式ドライブ、またはそれらの組合せを含めてもよい。いくつかの実施形態では、データストレージモジュール２２に冗長ハードディスクドライブなどのＲＡＩＤ（ＲｅｄｕｎｄａｎｔＡｒｒａｙｏｆＩｎｄｅｐｅｎｄｅｎｔ（またはＩｎｅｘｐｅｎｓｉｖｅ）Ｄｉｓｋｓ）を含めてもよい。

ユーザインターフェースモジュール２４は、システムオペレータが入力２６と対話しクリティカルアパーチャ圧縮モジュール２０に入力２６を提供するために使用する。入力２６には、クリティカルアパーチャ圧縮モジュール２０が行うフィルタリングまたは圧縮の量を左右する様々な基準が含まれる。例えば、入力２６には、クリティカルアパーチャ圧縮モジュール２０がデータポイントを保持するかまたはデータポイントのセット２８から廃棄するかを判断するために使用する許容帯域または偏差の限界を含めてもよい。いくつかの実施形態では、許容帯域または偏差の限界には、上限および下限、例えば、データポイントのセット２８内で最後にアーカイブされたポイントに関連する勾配の上限と勾配の下限が含まれる。以下で詳述するように、こうした上側勾配および下側勾配は最後にアーカイブされたポイントに関連するクリティカルアパーチャを定義する。クリティカルアパーチャ圧縮モジュール２０のフィルタリングアルゴリズムは、以下で説明するように、このクリティカルアパーチャを使用してデータポイントのセット２８に含まれる後続のポイントを保持する場合と廃棄する場合を判断する。ユーザインターフェースは、データの圧縮の有効化または無効化、タイムアウトが発生する前の最小の時間間隔の設定と最大の時間間隔の設定にも使用できる。

図２は、本技術のいくつかの実施形態による、図１に示すクリティカルアパーチャ圧縮モジュール２０を備えるシステム３０を示す図である。図示されたシステム３０では、クリティカルアパーチャ圧縮モジュール２０には、プロセッサアセンブリ３２、クリティカルアパーチャ計算モジュール３４、およびクリティカルアパーチャ比較モジュール３６が含まれている。プロセッサモジュール３２は、動作中にデータおよび制御信号３８、４０、および４２を、それぞれデータストレージモジュール２２、クリティカルアパーチャ計算モジュール３４、およびクリティカルアパーチャ比較モジュール３６との間で受信、処理、交換、および送信する。さらに、プロセッサアセンブリ３２は、データ収集モジュール１８が図１に示す工業用ユニット１２の複数のセンサ１４から取得するデータポイントのセット２８を圧縮するためのデータフィルタリングアルゴリズムを実行する。プロセッサアセンブリ３２は、システムオペレータ（図示せず）からユーザインターフェースモジュール２４を介してユーザ入力２６を受け取るように、さらに構成されている。この場合も、ユーザ入力２６には、クリティカルアパーチャ圧縮モジュール２０のクリティカルアパーチャを定義する様々な圧縮基準（例えば、許容帯域の上限および下限または偏差の上限および下限）を含めてもよい。

クリティカルアパーチャ圧縮モジュール２０の動作中に、データポイントのセットまたは列２８がクリティカルアパーチャ（例えば、前にアーカイブされたデータポイントに関連する上側勾配および下側勾配）の観点から次々に評価される。前にアーカイブされたポイントの次のポイントは、保持されたポイントとして一時的に記憶される。保持されたポイントの次のポイントがクリティカルアパーチャの外部にある場合は、クリティカルアパーチャ圧縮モジュール２０は、この保持されたポイントを次のアーカイブされたポイントとして永久に記憶する。一方、保持されたポイントの次のポイントがクリティカルアパーチャの内部にある場合は、クリティカルアパーチャ圧縮モジュール２０は、既存の保持されたポイントを廃棄し、この次のポイントを新しい保持されたポイントとして一時的に記憶する。モジュール２０は、次のポイントがクリティカルアパーチャの外部になるまで、一時的に保持されたポイントを次のポイントで置き換える操作を継続する。次のポイントがクリティカルアパーチャの外部になった場合に、モジュール２０は保持されたポイントを次のアーカイブされたポイントとして永久に記憶し、さらにこの次のポイントを新しい保持されたポイントとして一時的に記憶する。以下でさらに詳細に説明するように、このプロセスを繰り返してデータポイントのセット２８内のポイントをフィルタリングし、その結果としてデータポイント２８によるストレージ消費を削減する。

前述のプロセスの各ステージで、クリティカルアパーチャ計算モジュール３４は、前のアーカイブされたデータポイント、現在の保持されたデータポイント、および次のデータポイントに関する許容可能な偏差の分析に基づいて次のデータポイントのクリティカルアパーチャを計算する。いくつかの実施形態では、クリティカルアパーチャ圧縮モジュール２０は、各データポイントの許容可能な偏差の上限および下限を提供し、クリティカルアパーチャ計算モジュール３４は、事前にアーカイブされたデータポイントから始まり各データポイントの偏差の上限および下限まで延びる上側勾配および下側勾配として各データポイントのアパーチャを定義する。換言すると、アーカイブされたデータポイントと次のデータポイントとの間にある各データポイントは、アパーチャに含まれている。さらに、クリティカルアパーチャ計算モジュール３４は、アーカイブされたデータポイントと次のデータポイントとの間にあるすべてのアパーチャの交差すなわち共通部分として次のデータポイントのクリティカルアパーチャを定義する。結果として、クリティカルアパーチャ計算モジュール３４が後続の新しいポイントを分析するにつれて、一般的にクリティカルアパーチャは縮小される。クリティカルアパーチャという用語は、ここで使用する限り、事前に計算されたすべてのアパーチャに共通の勾配のセットとして定義してもよい。クリティカルアパーチャの計算については、図４を参照しながら以下でさらに詳しく説明する。

次に、クリティカルアパーチャ比較モジュール３６について説明する。このモジュールは、クリティカルアパーチャを次のデータポイントと比較するように構成されている。より具体的には、クリティカルアパーチャ圧縮モジュール３６の実施形態は、アーカイブされたデータポイントと次のデータポイントの間の勾配を計算し、この勾配をクリティカルアパーチャの上側勾配および下側勾配と比較する。この勾配がクリティカルアパーチャの上側勾配および下側勾配の外部にあるとクリティカルアパーチャ比較モジュール３６が判断した場合は、これがトリガイベントとなって事前に保持されたポイントがアーカイブされ、次のデータポイントが保持されたポイントになる。アーカイブされたデータポイントのそれぞれは、この例示的なデータフィルタリングプロセスに従って圧縮されたデータを記憶する４４データストレージモジュール２２に送信される。

例として、データポイントの列を示すグラフ（図３を参照）について考察する。データポイントの列は、一般的に参照番号４８〜６２で示されている。クリティカルアパーチャ圧縮モジュール２０は、データポイント４８（通常はアーカイブされたデータポイント）から開始して順次各データポイントの圧縮可能性について考察する。許容帯域６３がポイント４８と後続のデータポイント（例えばポイント６２）を結ぶ直線と交差する任意のポイントは、指定された限界内の線形補間によって再構成できる。これは、データポイント６０には当てはまらない。ポイント６０の再構成された値と実際の値との差は許容誤差を超えている。したがって、ポイント６２はアーカイブされた線のエンドポイントになることができない。データポイント６０は、ポイント４８に接続し、それまで延びる直線が間にあるすべての許容帯域と交差する最後のポイントなので、データポイント６０はこの線の終点を定義し、アーカイブされる。先行する許容帯域のそれぞれがアーカイブされたデータポイント（データポイント４８）と新しく導入されたデータポイントを結ぶ後続のすべての線と交差することを確認するために、このデータの列は通常は最後のデータポイントが特定されるまで保存する必要があるが、後述するクリティカルアパーチャの技術を使用すると、複数の保持されたデータポイントを保存しなくても最後のデータポイントを検出できる。本技術は、各データポイントを単独で評価し、結果が得られるまでデータポイントのグループをバッファして比較する必要がないので、データを圧縮する上できわめて効果的である。

このコンテキストにおいて、図４は本技術の実施形態による、アーカイブされたデータポイントＡ、後続の新しいデータポイントＣ、許容可能な偏差に基づいてデータポイントＢを保持する場合を識別するためのアパーチャを示すグラフである。図示された実施形態では、ポイントＢ、Ａ、およびＣは、座標（ｘ_１，ｙ_１）をとる保持されたデータポイント６４、座標（ｘ_０，ｙ_０）をとるアーカイブされたデータポイント６６、座標（ｘ_２，ｙ_２）をとる後続の次のデータポイント６８によって表されている。許容可能な偏差ｅは、許容可能な偏差７０として表されている。これには、前節で説明した許容帯域の上限および下限または偏差の上限および下限を含んでいる。図示されるように、保持されたポイント６４のアパーチャ７２には、アーカイブされたデータポイント６６、許容可能な偏差７０の上限のエンドポイント７４、許容可能な偏差７０の下限のエンドポイント７６で形成された三角形で囲まれる斜線の領域が含まれる。数学的には、保持されたポイント６４のアパーチャ７２は、その境界を線７８と８０で表されており、この勾配は次の式で計算される。

線７８の勾配＝（ｙ１＋ｅ−ｙ０）／（ｘ１−ｘ０）
線８０の勾配＝（ｙ１−ｅ−ｙ０）／（ｘ１−ｘ０）
座標（ｘ_２，ｙ_２）をとるデータポイント６８では、データポイント６８とアーカイブされたデータポイント６６を結ぶ線８２の勾配を次のようにして求めることができる。

線８２の勾配＝（ｙ２−ｙ０）／（ｘ２−ｘ０）
いくつかの例示的な実施形態では、保持されたデータポイント６４について計算されたアパーチャ７２は、唯一存在する計算されたアパーチャであり、アパーチャ７２がクリティカルアパーチャになる。また、現在の実施形態では、線８２の勾配がクリティカルアパーチャ７２の上側勾配および下側勾配の内部にある、すなわち線７８と８０との間にある場合は、保持されたデータポイント６４を廃棄してデータポイント６８が新しい保持されたデータポイントになることができる。ここで、新しい保持されたデータポイント６８について新しいアパーチャを計算できる。線７８の勾配が線８２の勾配以上であり、線８２の勾配が線８０の勾配以上である場合は、線８２がクリティカルアパーチャ内にある。線８２がクリティカルアパーチャ７２内にない場合は、保持されたデータポイント６４がアーカイブされ、新しいアーカイブされたデータポイントになる。また、保持されたデータポイント６４は、ユーザが指定したタイムアウトの最大値を経過してもそのタイムアウトの最大値との間にアーカイブされるポイントがない場合にアーカイブしてもよい。

図５は、本技術の実施形態による、図４に示すようにクリティカルアパーチャを定義するプロセス８４を示す流れ図である。プロセス８４には、入力として、最後のアーカイブされたデータポイント（Ａ）の座標、保持されたデータポイント（Ｂ）の座標、および許可される偏差（ｅ）を提供するステップ（ステップ８６）が含まれる。ステップ８８で、提供された入力に基づいて、上限のエンドポイント（Ｕ）と下限のエンドポイント（Ｌ）は、許可される偏差（ｅ）を保持されたデータポイント（Ｂ）の座標に補外することによって計算される。ステップ９０で、上限の線ＡＵと下限の線ＡＬ（図４の線７８と８０で表される）の勾配が計算され、こうした勾配によってアパーチャを定義する。ステップ９２で、プロセス８４はこのアパーチャ（例えば上側勾配および下側勾配）と事前に保持されたデータポイントについて事前に計算されたすべてのアパーチャの共通部分を決定する。換言すると、プロセス８４のステップ９２は、最新のアーカイブされたデータポイント（Ａ）から現在の保持されたデータポイントを特定（Ｂ）までのすべてのアパーチャの共通部分を特定する。結果として、ステップ９２はすべてのアパーチャに共通する上側勾配および下側勾配を特定する。これらは、事前のクリティカルアパーチャと現在のアパーチャの２つに関する勾配の上限の小さい方と、直前のクリティカルアパーチャと現在のクリティカルアパーチャの２つに関する勾配の下限の大きい方になる。ステップ９２で決定された勾配の共通の上限および下限は、ブロック９４に示すクリティカルアパーチャを定義する。

図６は、本技術の実施形態による、図１に示すクリティカルアパーチャ圧縮モジュール２０のデータフィルタリングプロセス９６を示す流れ図である。データフィルタリングプロセス９６は、１つまたは複数のクリティカルアパーチャのセットを計算し、クリティカルアパーチャのそれぞれに基づいてデータポイントのセット２８から１つまたは複数のデータポイントを廃棄することによって、データ圧縮を実行するように構成されている。データフィルタリングアルゴリズムは、１つまたは複数のデータポイントを廃棄するにもかかわらず、アーカイブされたデータポイントについて記憶された情報に基づく線形補間によって、廃棄されたデータポイントを再構成できる再構成メカニズムも促進することに留意されたい。

図６に示すように、プロセス９６には、入力として、最後のアーカイブされたデータポイント、保持されたデータポイント、許容帯域の情報を受け取るステップ（ステップ９８）が含まれる。プロセス９６には、図４と５に示し、上記の節で説明した例示的な技術によってクリティカルアパーチャを計算するステップ（ステップ１００）が含まれる。クリティカルアパーチャが決定されると、ステップ１０２で新しいデータポイントに関する情報が提供される。ステップ１０４で、最後のアーカイブされたデータポイントから新しいデータポイントへの勾配が計算される。ステップ１０６で、ステップ１００で計算されたクリティカルアパーチャがステップ１０４で決定された新しいデータポイントの勾配と比較される。

判断のステップ１０６で、プロセス９６は新しいデータポイントの勾配（ステップ１０４）をクリティカルアパーチャ（ステップ１００）と比較する。比較によって、互いに排反する２つの結果、つまり、（１）新しいデータポイントの勾配がクリティカルアパーチャの上側勾配および下側勾配内にあるか、または（２）新しいデータポイントの勾配がクリティカルアパーチャの上側勾配および下側勾配の外部に出るかのいずれかが得られる。新しいデータポイントに関して計算された勾配がクリティカルアパーチャの勾配の範囲内に入る場合は、ステップ１０８に進む。この時点で、保持されたデータポイントが廃棄される。ステップ１１０で、新しいデータポイントは新しい保持されたポイントになる。ステップ１１２で、プロセス９６は上で詳述したように新しいアパーチャを計算する。さらに、プロセス９６は上で詳述したようにステップ１１４で新しいクリティカルアパーチャを計算する。すべてのデータポイントについて考察されるまで、一連のステップ１０８から１１４を繰り返すことができる。

判断のステップ１０６で、新しいデータポイントの勾配がクリティカルアパーチャ内にない場合に、プロセス９６はステップ１１６に進む。このイベントを共通部分のない（ｄｉｓｊｏｉｎｔ）アパーチャと定義してもよい。このステップ１１６で、保持されたデータポイントがアーカイブされ、新しいアーカイブされたデータポイントになる。新しいデータポイントは、ステップ１１８で新しい保持されたデータポイントになり、ステップ１２０で新しいクリティカルアパーチャが計算される。同様に、データポイントのセット２８からのすべてのデータポイントについて考察が完了するまで、さらに後続の新しいデータポイントについて前述の一連のステップ１１６から１２０を繰り返すことができる。このように、本方法を一定の時間にわたって繰り返し、図１に示す工業用ユニット１２からサンプリングされたデータポイントのセット２８に含まれる１つのデータポイントから別のデータポイントに進むことによって、データストレージモジュール２２（図１を参照）から多くのデータポイントを廃棄できる。したがって、データポイントのセット２８で消費するストレージスペースが削減される。

図７は、図６に示すデータフィルタリングプロセスの例示的な実施形態を示すグラフである。この例示的な実施形態では、データポイント１２２〜１３６はデータフィルタリングプロセス９６で圧縮するかどうかが考察される。データポイント１２２はアーカイブされたデータポイントであり、データポイント１２４〜１３２は中間のデータポイントである。こうしたデータポイントは、その勾配がクリティカルアパーチャ１３８の勾配内にあるため、データフィルタリングプロセス９６によって廃棄される。前述のように、中間のデータポイント１２６とアーカイブされたデータポイント１２２を結ぶ線が事前のデータポイント１２４までについて計算されたクリティカルアパーチャ１３８を通過するため、データポイント１２６は破棄される。同様に、中間のデータポイント１２８〜１３２のそれぞれとアーカイブされたデータポイント１２２を結ぶ線がそれぞれの中間のデータポイントまでについて計算されたクリティカルアパーチャを通過するため、中間のデータポイントが破棄される。特定のデータポイントのクリティカルアパーチャ１３８は、その特定のデータポイントまでについて計算された各々のアパーチャに完全に包含されることにも留意されたい。ただし、データポイント１３６とアーカイブされたデータポイント１２２を結ぶ線がクリティカルアパーチャの外部に出た場合は、データポイント１３４が新しいアーカイブされたデータポイントになり、ポイント１３６が新しい保持されたポイントになる。データポイント１３４とアーカイブされたデータポイント１２２を結ぶ線がデータポイント１３２までについて計算されたクリティカルアパーチャ１３８を通過することに留意されたい。さらに、図示されたグラフで、中間のデータポイント１２２〜１３２はデータポイント１３４とアーカイブされたデータポイント１２２を結ぶ直線内またはその周辺にあり、廃棄された各データポイントの許容帯域はこの直線と交差するような位置にある。したがって、アーカイブされたデータポイント１２２と保持されたデータポイント１３４を結ぶ直線は、廃棄されたデータポイント１２４〜１３２の傾向を適切に表しており、廃棄されたデータポイントは必要に応じて直線の座標の線形補間によって指定された誤差限界（ｅ）の範囲内で再構成できる。

図８は、本技術の実施形態による別の例示的なデータフィルタリングプロセスを示すグラフである。データポイント１４０〜１５８のセットには、アーカイブされたデータポイント１４０と中間のデータポイント１４２〜１５０が含まれている。この例示的な実施形態では、一般的に番号１６０、１６２、および１６４で表される１つまたは複数の仮想データポイントが、この例示的なケースでは番号１５６で表される実際のデータポイントの許容帯域内にあるように選択される。ここで、保持されたデータポイント１５２は、実際のデータポイントでなく仮想データポイントに基づいて選択される。クリティカルアパーチャ１６６は、まずアーカイブされたデータポイント１４０について計算され、データポイント１４２〜１５６について繰り返し計算される。しかし、データポイント１５８の上限のエンドポイントと下限のエンドポイントを結ぶ線がクリティカルアパーチャ１６６と交差しないので、データポイント１５８はクリティカルアパーチャの外部に位置する。したがって、１つまたは複数の仮想データポイントが、この例示的なケースでは番号１５６で表される実際のデータポイントの許容帯域内にあり、クリティカルアパーチャ１６６と交差するように選択される。この例示的な実施形態により提供される利点は、互いに近接するいくつかのデータポイントを廃棄することによって、離れた位置にあるデータポイントを適切に考慮できることである。この結果、シミュレーションで示されるように、より大きなデータポイントのセットの高レベルの圧縮がさらに可能になる。

前述の節で説明した様々な実施形態と態様には、様々な論理関数を実装する実行可能な命令（例えば、順次コードまたはオブジェクト指向のコード）を含めてもよい。実行可能な命令は、任意のコンピュータ可読媒体として具体化し、命令を取得して実行できるコンピュータベースのシステムによって、あるいはこうしたシステムに接続して使用できる。このアプリケーションのコンテキストでは、コンピュータ可読媒体は、命令を保存、記憶、伝達、伝搬、送信、または搬送できる任意の手段でよい。コンピュータ可読媒体は、電子、磁気、光学、電磁気、または赤外線によるシステム、装置、もしくはデバイスのいずれでもよい。説明のための有体媒体例には、１つまたは複数の配線を伴う電気接続（電子）、ポータブルコンピュータディスケット（磁気）、ランダムアクセスメモリ（ＲＡＭ：ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）（磁気）、読み出し専用メモリ（ＲＯＭ：ｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）（磁気）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭ：ｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙまたはフラッシュメモリ）（磁気）、光ファイバ（光学）、およびポータブルコンパクトディスク読み出し専用メモリ（ＣＤＲＯＭ：ｃｏｍｐａｃｔｄｉｓｃｒｅａｄ−ｏｎｌｙｍｅｍｏｒｙ）（光学）などが含まれるが、これに限定はされない。有形媒体には、紙または別の適切な媒体に機械的および電気的手段で命令を印刷したものまたは手書きしたものをさらに含めてもよい。例えば、紙または他の媒体の光学的なスキャンによって電子装置で命令を取り込んでからコンパイルし、解読するかまたは必要に応じて適切な方法で処理し、さらにコンピュータ可読のメモリに記憶してもよい。

当業者には言うまでもないが、前述のデータ管理システムおよび技術では、データポイントのセットから１つまたは複数のデータポイントを廃棄するにもかかわらず、記憶されたデータポイントからの情報を使用した線形補間によって廃棄されたデータポイントを容易に再構築できるので、効率的なデータ圧縮が可能になる。廃棄されたデータポイントの再構築は、後で行う任意の種類のデータ分析または計算に利用できるので、本データ管理システムはデータポイントのセットで表される工業用ユニットの動作パラメータに関して高い精度を維持できる。また、本データ管理システムは、平均などの方法においても、データポイントのセットに含まれる個々のデータポイントを考慮し、特定のデータポイントを廃棄すべきかどうかを評価することによって、データフィルタリングアルゴリズムを使用してデータポイントのセットを評価する上で、高い精度を維持している。本データ管理システムでは、このようにしてデータセットを記憶するためのストレージ容量を削減できる。さらに、本データ管理システムでは、所定のストレージ容量に対してより長時間にわたってデータポイントを記憶できるので、コスト節約が促進される。さらに、この種のデータ圧縮では多くのデータのビット数は減少されない。再構成可能なデータを廃棄し、線形補間を使用したポイント再構成の方法で使用することができる線のエンドポイントのみを残しているにすぎない。また、本データ圧縮技術ではデータの圧縮を常に実行できるとは限らない。データの圧縮を実行できない例示的なシナリオには、いかなる傾向またはパターンによってデータポイントを定義できないシナリオが含まれる。

本発明のいくつかの機能についてのみ本明細書で図示し、説明してきたが、当業者によって様々な変更および変形が実施されるであろう。したがって、添付の特許請求の範囲には、こうした本発明の真の精神を逸脱しない変更および変形のすべてが含まれるものとすることを理解されたい。

複数のセンサと本技術の実施形態によるクリティカルアパーチャ圧縮モジュールとを備える例示的なシステムを示す図である。図１に示すクリティカルアパーチャ圧縮モジュールの例示的な実施形態を示す図である。データポイントのセットを評価するときのクリティカルアパーチャ圧縮モジュールの例示的な動作を示すグラフである。本技術の実施形態による、アーカイブされたデータポイント、後続の新しいデータポイント、許容可能な偏差に基づいてデータポイントを保持する場合を識別するためのアパーチャを示すグラフである。本技術の実施形態による、図４に示すクリティカルアパーチャを定義するプロセスを示す流れ図である。本技術の実施形態による、図１に示すクリティカルアパーチャ圧縮モジュール２０のデータフィルタリングプロセスを示す流れ図である。図６に示すデータフィルタリングプロセスの例示的な実施形態を示すグラフである。図６に示すデータフィルタリングプロセスの別の例示的な実施形態を示すグラフである。

Claims

データ圧縮の方法であって、
保持されたデータポイント（６４）の許容帯域（６３、７０，７０）およびアーカイブされたデータポイント（６６）と前記保持されたデータポイント（６４）との間にある中間ポイントの許容帯域（６３、７０，７０）に基づいて、前記アーカイブされたデータポイント（６６）から始まり、前記保持されたデータポイント（６４）についての偏差の上限（７４）および下限（７６）まで延びる上側勾配（７８）および下側勾配（８０）を有するクリティカルアパーチャ（７２）を提供するステップ（８４、１００）であって、前記アーカイブされたデータポイント（６６）と後続の新しいデータポイント（６８）との間にあるデータポイントのすべてのアパーチャの共通部分（７２）を特定（９２，９４）するクリティカルアパーチャ提供ステップ（８４、１００）と、
前記アーカイブされたデータポイント（６６）から始まり、後続の新しいデータポイント（６8）まで延びる線の勾配（８２）が前記クリティカルアパーチャ（７２）内にある場合、前記保持されたデータポイント（６４）を廃棄するステップ（１０８）と
を備えることを特徴とするデータ圧縮方法。
前記中間にある全てのデータポイントのアパーチャのそれぞれは、前記アーカイブされたデータポイント（６６）から始まり、それぞれのポイントの前記許容帯域の上限（７４）および下限（７６）まで延びる上側勾配（７８）および下側勾配（８０）を備えることを特徴とする請求項１記載のデータ圧縮方法。
仮想データポイント（１６０，１６２，１６４）を新しい保持されたデータポイントとして設定するステップと、前記新しい保持されたデータポイント（１６０，１６２，１６４）に基づいて新しいクリティカルアパーチャを計算するステップとをさらに備えており、前記仮想データポイントは実際のデータポイントとは異なっており、前記仮想データポイントは前記事前に計算されたクリティカルアパーチャの内部と前記実際のデータポイントの許容帯域内にある請求項１または２に記載のデータ圧縮方法。