JP2019046469A - 多変数データの画像化 - Google Patents

多変数データの画像化 Download PDF

Info

Publication number
JP2019046469A
JP2019046469A JP2018158460A JP2018158460A JP2019046469A JP 2019046469 A JP2019046469 A JP 2019046469A JP 2018158460 A JP2018158460 A JP 2018158460A JP 2018158460 A JP2018158460 A JP 2018158460A JP 2019046469 A JP2019046469 A JP 2019046469A
Authority
JP
Japan
Prior art keywords
image
variables
data
variable
data subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018158460A
Other languages
English (en)
Inventor
タウンセンド・ジョゼフ
Townsend Joseph
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2019046469A publication Critical patent/JP2019046469A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

【課題】少なくともN個の変数を有する多変数データセットにおいてデータを表現する画像を生成し記憶する方法を提供する。【解決手段】方法は、N個の変数のうちのN−1個の連続した変数を夫々表すN−1個の軸を有するN−1次元画像属性領域を、N−1個の変数に関連したN個の変数のうちの1つの異なる値に夫々対応するM個のサブ領域に分けることと、データセットの各データサブセットについて、N−1個の変数の値を、関連する1つの変数の値に対応する画像属性領域のサブ領域のうちの1つにおける対応する位置にマッピングし、そのデータサブセットに対して、画像属性領域におけるそのデータサブセットの位置に対応する画像属性を割り当てることと、データサブセットに割り当てられた画像属性を用いて画像を生成することと、自動画像処理システムでの使用のために画像をコンピュータストレージに記憶することとを有する。【選択図】図6

Description

本発明は、多変数データの画像化(imagification)に関する。
画像化(imagification)は、データの記録を又は複数の記録のウィンドウを順に画像として描画して、夫々の記録又はウィンドウが、自動画像認識技術を用いてその記録又はウィンドウを分類したり、あるいは、その記録又はウィンドウに基づき予測を行ったりするために使用され得る対応する画像と一対一の関係を共有するようにする処理である。特に、画像化は、通常必要とされるよりも相当に少ないデータで正確な自動分類を可能にする、畳み込みニューラル・ネットワークに基づいた転移学習と組み合わされるよう設計された。
ニューラル・ネットワークは、人工ユニットの階層化ネットワークであり、ユニット間のエッジ上の数値重みに従って入力ベクトル(入力層にある。)を出力ベクトル(出力層にある。)へマッピングする。重みは、訓練アルゴリズムに従って調整される。多層のニューラル・ネットワークは、ディープ・ニューラル・ネットワーク(DNN)として知られている。畳み込みニューラル・ネットワーク(CNN)は、DNNの特定の種類であり、各層に含まれるニューロンがフィルタに分けられ、各フィルタは、入力データにおいて、種々の重複する特徴の有無を検出する。DNN、及び特にCNNは、画像を分類することが極めて正確であると多くのタスクで証明されている。非画像データを画像に変換することによって、そのようなネットワークの分類精度は利用され、任意のデータセットに適用され得る。
更に、分類に加えて、CNNは、画像から特徴ベクトル(各画像を一意に識別する数のベクトル)を抽出するために使用され得る。2つの類似した画像は2つの類似したベクトルを有しうるので、k最近傍モデル(又は何らかのベクトルに基づいた分類器)は、そのモデルによって既に見られた画像のベクトルに対するクエリされた画像のベクトルの類似度に基づき、画像を分類し得る。そのような方法で特徴ベクトルを抽出するための訓練されたCNNの能力は、異なる主題領域からでさえ、CNNが未だ見たことがない画像にまで及ぶ。訓練されたニューラル・ネットワーク(又は実際には何らかのモデル)を、異なるが類似している領域の問題に適用する処理は、‘転移学習’と呼ばれており、その新しい問題に対する解決法が、さもなければ必要とされうるよりも相当に少ないデータで訓練されることを可能にする。従って、任意の画像に対して訓練されたCNNによる転移学習は、画像化されたデータサンプルを、比較的に小さいデータセットからとられる場合でさえ分類する方法を提供する。
多変数データを画像に変換して、そのようなデータが、直接分類を実行するCNNを用いて、CNNに基づいた転移学習を用いて、又は何らかの他の画像分類方法を用いて分類され得るようにすることが必要である。
多変数データに適用される1つの以前に提案された画像化技術において、多変量時系列における各記録について、異なる色チャネル(例えば、赤、緑、青)は夫々、その記録における異なる連続した変数にマッピングされ、それらの変数のベクトルは、プロットの振幅にマッピングされる。
すなわち、多変数データは、各データ点からの座標を順に何らかの色空間における値にマッピングすることによって、画像化される。例えば、添付の図面の図1(b)に示されるように、加速度についてのx、y(図示せず。)及びz値(例えば、手首に装着された加速度計によって測定される。)は、RGB色空間における赤、緑及び青の色値に夫々マッピングされる。各データ点について順に、x、y、z値のベクトルは、異なる色が異なる種類のハッチングで表されている添付の図面の図1(a)に示されるように、画像化ウィンドウを生成するよう、このマッピングによって生成された色によりプロットされる。パターン、サイズ、形又は透明度のような多の属性が、色の代わりに、データ値をマッピングするために使用されてよい。
次いで、そのような画像から特徴ベクトルが抽出され、それにより、いずれか2つの画像間の、従って、それらが導出されたデータ点間の類似度が計算され得る。特徴は、CNN又は何らかの他の適切な特徴抽出方法を用いて抽出されてよく、類似度は、コサイン距離又は何らかの他の適切な距離メトリックに基づいてよい。クエリされた未分類画像と先に分類されている画像との間の類似度に基づき、分類及び異常検出(anomaly detection)はいずれも、類似度に基づき分類するk最近傍法のような方法を用いて可能である。添付の図面の図2(a)に示されるように、分類のために、クエリされたデータ点は、メンバーが特徴空間においてそのクエリされた点に最も近い分類に属すると分類される(例えば、“歩行”よりもむしろ“走行”)。添付の図面の図2(b)に示されるように、異常検出のために、クエリされたデータ点は、それがいずれかの知られた分類から特徴空間において一定の距離である(すなわち、十分に異なる)場合に異常と見なされる。
しかし、上記の以前に提案された画像化技術は、それが表すことができる変数の数に限りがあり、更には、カテゴリ値(離散又は質的変数としても知られている、必ずしも順序付けられていない2つ以上のカテゴリ又は分類(例えば、性別:男性又は女性)のうちの1つに属し得る値)を表すよう設計されていない。これは、技術が適用され得るデータセットを制限する。
例えば、データロギングの処理において、計算ログは、ハードウェア又はソフトウェアシステム(例えば、オペレーティングシステム、個別アプリケーション又はサービス、など)の状態に関するタイムスタンプ付きメッセージ及び/又は情報を記録する。ログは、連続変数(すなわち、数値連続体に沿った値であり、量的変数としても知られている。)及びカテゴリ変数の両方を含み、通常は、タイムスタンプ付きメッセージ、そのメッセージの重要性を示すカテゴリ的‘レベル’、及び所与のタイムスタンプについてのシステム又はアプリケーション状態に関する様々な他の統計値(例えば、CPU温度、ファン速度、ネットワーク接続性、など)のうちの1つ又は組み合わせを与えることができる。
例えば、次のログエントリについて:
[Wednesday, July 26, 2017 2:53:59 PM][WARNING][Fan speed insufficient for maintaining temperature][CPU usage: 48%, Network: Connected, CPU Temperature: 80%, HDD Temperature: 20%, Fan Speed: 20%]

・ [Wednesday, July 26, 2017 2:53:59 PM]は、タイムスタンプである。
・ [WARNING]は、メッセージレベルである。
・ [Fan speed insufficient for maintaining temperature]は、メッセージである。
・ CPU Usage: 48%は、利用可能な処理能力のうち使用されている割合である。
・ Network: Connectedは、コンピュータがネットワークに接続されているか否かを示す。
・ CPU/HDD Temperature: 80%/20%は、デバイス上で正常であると見なされる何らかの閾値(例えば、50%で正常)に対するCPU及びハードディスクの相対温度である。
・ Fan Speed: 20%は、最大速度に対するCPUファンの速度である。
上記はほんの一例である点に留意されたい。フォーマット、シンタックス及びセマンティクスは、同様の適用のためでさえ異なってよい。従って、データを整え、更には、異なるソースからのメッセージを、更なる処理の前に、一様なフォーマットにマッピングする準備段階が存在してよい。
それらのログを記録する目的には、(制限なしに)監視、既存の故障の診断、デバッギング、潜在的な将来の故障の予測、異常検出、科学捜査、又はそれらの組み合わせが含まれ得る。それらのタスクを自動化するよう、データ分析論が必要とされ、実際にしばしば使用されている。特定の事象は、パターン認識技術を用いてログエントリをそれらの事象の既知のインスタンスのテンプレートと比較することで、識別され得る。例えば、特定のウィルスによってトリガされると知られているエントリの以前に遭遇された連続は、起こり得るウィルス攻撃をアナリストに警告するために、将来の連続と比較され得るテンプレートを形成し得る。如何なる既知のパターンとも一致しない事象又は一連の事象は異常と見なされ得る。これらはまた、起こり得る新たなウィルス、潜在的な将来の機能不良、又は何らかの他の問題のサインとしてフラグを立てられる必要があり得る。
ログデータを視覚化するための方法が存在し、一方で、それらは人間であるアナリストのために存在し、畳み込みニューラル・ネットワーク又は他の深層学習アプローチに基づくものを含む自動画像分類システムのためには設計されていない。
データログシーケンスの分類又はその中での異常検出の精度は、自動画像分類の機能を利用することによって更に改善され得る。
第1の態様の実施形態に従って、コンピュータにより実施される画像生成及び記憶方法であって、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成し記憶する方法が提供される。多変数データセットは、複数のデータサブセットを含み、且つ、Nが整数であるとして少なくともN個の変数を有している。方法は、N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分けることであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記分けることと;前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングし、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を当該データサブセットに割り当てることと;前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成することと;自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することとを有する。
第1の態様の実施形態において、前記関連する1つの変数は、カテゴリ変数であってよい。
第1の態様の実施形態において、前記画像属性は、色、パターン、サイズ、形、及び透明度のうちの1つ又は組み合わせを有してよい。
第1の態様の実施形態は、前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分けることを更に有してよく、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり;前記多変数データセットにおいて前記データを表す画像を生成することは、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成することを含み、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される。前記3つの変数のうちの前記選択された1つの変数は、カテゴリ変数である。
第2の態様の実施形態に従って、コンピュータにより実施される画像生成及び記憶方法であって、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成し記憶する方法が提供される。多変数データセットは、複数のデータサブセットを含み、且つ、3つの変数を有している。方法は、画像領域を、mが整数であるとしてm個のサブ領域に分けることであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記分けることと;前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成することと、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することとを有する。
第2の態様の実施形態において、前記選択された1つの変数は、カテゴリ変数であってよい。
第3の態様の実施形態に従って、コンピュータで実行される場合に、該コンピュータに、第1又は第2の態様を具現化する方法を実行させるコンピュータプログラムが提供される。
第4の実施形態に従って、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成する画像生成装置が提供される。多変数データセットは、複数のデータサブセットを含み、且つ、Nが整数であるとして少なくともN個の変数を有している。画像生成装置は、N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分ける画像属性領域パーティショナーであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記画像属性領域パーティショナーと;前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングするマッパーと;各データサブセットに対して、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を割り当てる画像属性割り当て部と;前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成する画像生成部とを有し;当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する。
第4の態様の実施形態において、前記関連する1つの変数は、カテゴリ変数であってよい。
第4の態様の実施形態において、前記画像属性は、色、パターン、サイズ、形、及び透明度のうちの1つ又は組み合わせを有してよい。
第4の態様の実施形態は、前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーを更に有し、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり;前記画像生成部は、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成し、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される。
第5の態様の実施形態に従って、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成する画像生成装置が提供される。多変数データセットは、複数のデータサブセットを含み、且つ、3つの変数を有している。当該が造成性装置は、画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記画像領域パーティショナーと;前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成する画像生成部とを有し;当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する。
第4又は第5の態様の実施形態において、前記選択された1つの変数は、カテゴリ変数であってよい。
第1乃至第5の態様の実施形態において、前記画像処理システムは、画像認識のために訓練されたディープ・ニューラル・ネットワークを有してよい。
第1乃至第5の態様の実施形態において、前記画像処理システムは、故障検出又は故障予測における使用のために、データ分類及び比較のうちの少なくとも一方を目的として前記生成された画像を処理してよい。
第1乃至第5の態様の実施形態は、1つの画像に多数の変数を含むことによって、画像化されるべきデータの記録毎に必要とされる画像がより少なくて済み、よって、計算リソースの需要が下げられるので、画像処理システムの効率が高められることを可能にし得る。すなわち、画像においてより多くの変数を表現することによって、データの表現はより圧縮され、データをその画像化された形で扱うために必要とされる記憶及び処理要件は低減される。
上記の以前に提案された画像化技術のように、画像属性空間(例えば、色空間)の次元は、データにおける異なる次元を表すために使用される。しかし、これより提案される画像化技術の実施形態は、画像属性空間及び/又は画像空間の異なるサブ領域がカテゴリ変数の異なる値に対応し得る点で、以前に提案されたものをより良いものにする。
特に、第1、第3又は第4の態様の実施形態は、画像属性空間内の位置がカテゴリ情報を決定するために使用され得るように、画像属性空間を分割してよい。同様に、第2、第3、又は第5の態様の実施形態は、画像空間内の位置がカテゴリ情報を決定するために使用され得るように、画像空間を分割してよい。
更に、実施形態は、カテゴリ変数及び連続変数が1つの画像において一緒に表現されることを可能にし得る。
実施形態は、カテゴリデータ及び連続データの両方を含むデータセット(データログエントリを含むがこれに限られない。)の画像化を可能にするので、そのようなデータに対する分類、予測、異常検出又は他のタスクは、この場合に、自動画像認識/処理方法と統合され得る。そのような方法の高い性能を鑑み、それらの方法は、データセットが画像化される場合にそれらのデータセットの精度を高めることができる。
実施形態に従って画像化されるデータは、次いで、分類、異常検出、又は何らかの他の適切なタスクのために、例えば、以前に提案された技術を参照して上述されたように、又は他の適切な手段によって、処理されてよい。
一般に、実施形態は、(制限なしに)金融、医学、科学全般、マーケティング、及びビジネスマネージメントを含め、データが、カテゴリ変数及び連続変数の両方を含むシーケンシャルデータを含み得る如何なる分野においても、あるいは、多変数データシーケンスが発生する如何なる他の分野においても、適用されてよい。
数ある分野の中でも、実施形態は、データログ分析論の分野に適用可能である。この分野では、目標はしばしば、ログに含まれる情報に基づき、マシン及び/又はソフトウェアの現在の状態を分類し、且つ/あるいは将来の状態を予測することである。実施形態は、例えば、故障検出/保守予測のためのデータログ分析の問題に適用されてよい。この問題に対する画像化に基づいたアプローチは、そのようなログ分析論が、より少ない訓練サンプルで実行されることを可能にし得る。
他の例として、実施形態は、身体活動を測定する分野において適用されてよい。この場合に、RGB色値(又は他の画像属性)は、手首に装着されたセンサによって測定されたx、y、及びz次元における加速度に対応してよく、画像及び画像属性空間の分割は、どちらの手首にセンサが装着されているか(左又は右)、又はどのような活動が行われているかといった、更なるカテゴリ値を加えるために使用されてよい。
これより、一例として、添付の図面が参照される。
(a)及び(b)は、以前に提案された画像化技術を説明するために使用される図である。 (a)及び(b)は、画像を用いた分類及び異常検出を夫々説明するために使用される図である。 (a)、(b)及び(c)は、第1の態様を具現化する画像生成及び記憶方法に従って如何にして画像属性空間がサブ領域に分割され得るかを表す図である。 (a)及び(b)は、第1の態様を具現化する画像生成及び記憶方法の適用を表す図である。 図4(a)及び4(b)に対応する、例となるデータの表である。 第1の態様を具現化する画像生成及び記憶方法のフローチャートである。 (a)、(b)及び(c)は、第2の態様を具現化する画像生成及び記憶方法に従って如何にして画像空間がサブ領域に分割され得るかを表す図である。 図7(a)乃至7(c)に対応する、例となるデータの表である。 第2の態様を具現化する画像生成及び記憶方法のフローチャートである。 (a)及び(b)は、第1及び第2の態様に従う方法が如何にして一緒に使用され得るかを表す図である。 図10(a)及び10(b)に対応する、例となるデータの表である。 第1及び第2の態様を具現化する画像生成及び記憶方法のフローチャートである。 (a)及び(b)は、第1及び第2の態様を具現化する画像生成及び記憶方法の特定の適用を説明するために使用される図である。 図13(a)及び13(b)に対応する、例となるデータの表である。 図13(a)、13(b)及び14に関係がある特定の適用について画像による異常検出を説明するために使用される図である。 本発明の第4の態様に従う装置のブロック図である。 本発明の第5の態様に従う装置のブロック図である。 画像処理システムのブロック図である。 第1及び/又は第2の態様に従う方法を実行するのに適したコンピュータデバイスのブロック図である。
これより、実施形態は、画像属性空間、画像空間、又は両方の分割を用いるものについて記載される。
[画像属性空間の分割]
図3(a)、3(b)及び3(c)は、画像属性空間(本例では、色空間)がサブ領域に分割され得る方法を説明する図である。2次元の文書において3次元(又はそれよりも高い次元)の空間を表現する難しさにより、図は、赤値及び青値のみを含む色モデルに適用される分割モデルの結果を表すが、同じ原理は3次元RGB色モデル、又は実際には如何なる次元の如何なる色モデル(例えば、CMYK)にも当てはまる。各サブ領域(図3(a)及び3(b)ではA、B、C及びDとラベルを付された4つ、及び図3(c)ではA、B、C、D、E、F、G、H及びIとラベルを付された9つ)は、座標の組、例えば:
A=[(ax0,ax1),(ay0,ay1)]
B=[(bx0,bx1),(by0,by1)]
C=[(cx0,cx1),(cy0,cy1)]
D=[(dx0,dx1),(dy0,dy1)]
によって定義される。2つの連続変数x及びy並びに1つのカテゴリ変数qが表現されるべきであるとすれば、(i,j)を、分割されていない色空間内の位置を表すものとする。関数f(x,y,q)→(i,j)は、連続変数x及びyに対応するi及びjの値を返し、カテゴリ変数qについて:
・ Iが、サブ領域qにあるx軸に沿って最小値を返す関数である(例えば、I(A)=ax0)として、iは値i=x+I(q)をとる。
・ Jが、サブ領域qにあるy軸に沿って最小値を返す関数である(例えば、J(A)=ay0)として、jは値j=y+J(q)をとる。
同様の関数は、連続数がいくつであっても(例えば、f(x,y,z,q)→(i,j,k))、且つ、RGBのような3次元色空間のために、定義されてよい。
サブ領域内で、1つの次元におけるサブ領域のサイズ(例えば、高さ、幅)は、必ずしも他の次元におけるそのサイズに等しくなくてよい(例えば、その幅は、必ずしもその高さに長さが等しくなくてよい。)。しかし、ほとんどの場合に、全てのサブ領域は、表現される全ての変数の範囲及び細かさが全てのサブ領域にわたって一貫していることを確かにするために、お互いにサイズが等しい。例えば、図3におけるサブ領域Bの幅がサブ領域Aのそれより小さかった場合に、サブ領域Bは、xがq(カテゴリ変数)と無関係であるにもかかわらず、Aと同じ数だけxを表すことができない。しかし、全てのサブ領域について等しい量だけ画像属性空間の幅を狭めることは、全てのサブ領域にわたって一貫してyを表すための方法の能力には影響がない。
それらの条件を満足し且つ色空間内に収まるサブ領域はいくつでも使用されてよく(例えば、図3(a)に示されるような2×2のサブ領域、及び図3(c)に示されるような3×3のサブ領域)、サブ領域は、それらの間にいくらかの空間又はマージンが存在するように画定されてよい(例えば、図3(b)を参照。)。マージンを含める目的は、境界位置での値間の差を強調することである。例えば、図3(a)において、サブ領域A内のy0は、サブ領域Cのy1と接触し、故に、この境界に沿った変数値は、対応する画像を分類しようとする画像認識方法によって読み間違えられる可能性があり、場合により誤分類をもたらす。それらのサブ領域間の色空間内のマージン(図3(b))は、そのような出来事の可能性を減らす。
画像は、次いで、画像属性空間においてマッピングされた位置に基づき生成されてよい。例えば、図4(b)は、図5に示された表のtについてのx、yデータが、qの対応する値に従って色空間内で4つのサブ領域A乃至Dのうちの1つへマッピングされる方法を示す。tについての対応するsの値は、次いで、このマッピングによって生成された色により図4(a)の画像においてプロットされる。
実施形態は、色空間の分割を参照して上述されてきたが、分割される空間は、色と1つ以上の他の画像属性との組み合わせ、例えば、色と透明度との組み合わせに対応してよく、あるいは、画像の透明度、画像に適用されているパターン、画像の形、及び/又は画像のサイズのような、1つ以上の他の画像属性に対応する非色空間であってよい。
図6のフローチャートは、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成し記憶する画像生成及び記憶方法であって、第1の態様を具現化する方法に対応する。多変数データセットは、複数のデータサブセットを有し、且つ、Nが整数であるとして、少なくともN個の変数を有しており、方法のステップS61で、多変数データセットのために必要とされる画像属性領域の次元の数はN−1に設定される。画像属性領域のN−1個の軸は、1つの他の変数に関連したN−1個の連続変数を夫々表す。その、他の変数は、カテゴリ変数であってよい。代替的に、他の変数は連続変数であってよい。これは、その連続変数の全てのとり得る(又は関連する)値を列挙することが可能である場合にそのようである(例えば、1から5の間の整数は5つのとり得る値を有しており、これは、一定レベルの精度が使用される限り実数にも当てはまり得る。例えば、1.0、1.5、2.0、2.5、など。)。ステップS62で、その、他の変数の異なる値の個数Mが決定される。ステップS63で、N−1次元の画像属性領域は、Mが整数であるとして、M個のサブ領域に分けられる。M個のサブ領域は、N−1個の変数に関連した変数の異なる値に夫々対応する。ステップS64で、データサブセットのうちの1つについて、1つの変数に関連したN−1個の変数の値が、そのデータサブセットにおける関連する1つの変数の値に対応するN−1次元の画像属性領域のサブ領域のうちの1つにおける対応する位置にマッピングされ、画像属性領域におけるそのデータサブセットの位置に対応する画像属性が、そのデータサブセットに割り当てられる。ステップS65で、方法は、いずれかの未処理のデータサブセットが存在するかどうかをチェックする。未処理のデータサブセットが存在する(ステップS65の‘はい’)場合には、方法は、未処理のデータサブセットに対してステップS64を実行する。そうでない(ステップS65の‘いいえ’)場合には、方法はステップS66に進み、画像は、データサブセットに割り当てられた画像データ属性を用いて生成される。ステップS67で、ステップS66で生成された画像は、自動画像処理システムでの使用のためにコンピュータストレージに記憶される。
[画像空間の分割]
図7(a)、7(b)及び7(c)は、画像空間がサブ領域に分割され得る方法を説明する図である。所与のt(時間又は何らかの他の連続体を表し得る。)について、対応する値sは、tのその値についてのカテゴリ変数pの値に対応する画像空間のサブ領域においてプロットされる。図7(a)は、例えば、pの2つの異なる値に対応する画像空間のサブ領域A及びBを示す。サブ領域は、例えば、図7(b)及び7(c)に示されるように、異なる向きで延在してよく、サブ領域はいくつでも使用されてよい(例えば、図7(a)及び7(b)に示される2つ、又は図7(c)に示されるA、B、C及びDの4つ)。サブ領域は、全ての場合においてt軸を共有する。なお、t軸は複数回描かれてよい。例えば、図7(c)では、t軸は、領域A及びBのために一度、そして、C及びDのために再び描かれている。図8は、s及びpの値がtとともにどのように変化するかを示す表であり、図7(c)に示されているものに対応する。
図9のフローチャートは、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成し記憶する画像生成及び記憶方法であって、第2の態様を具現化する方法に対応する。多変数データセットは、複数のデータサブセットを有し、且つ、3つの変数を有しており、そのうち少なくとも2つの変数は連続変数である(第3の変数はカテゴリ変数又は、上述された一定の環境では、連続変数であってよい。)。方法のステップS91で、変数の中から1つが選択され、その選択された変数の異なる値の個数が決定される。選択された変数は、変数のうちの2つのみが連続する場合にカテゴリ変数である。ステップS92で、画像領域は、mが整数であるとして、m個のサブ領域に分けられる。画像領域は、選択された1つの変数以外の、3つの変数のうちの2つの変数を夫々表す2つの軸を有する。ステップS93で、データサブセットのうちの1つにおけるその2つの変数の値は、その1つのデータサブセットについての予め選択された1つの変数の値に対応する画像領域のサブ領域のうちの1つにおいてプロットされる。ステップS94で、方法は、いずれかの未処理のデータサブセットが存在するかどうかをチェックする。未処理のデータサブセットが存在する(ステップS94の‘はい’)場合には、方法は、未処理のデータサブセットに対してステップS93を実行する。そうでない(ステップS94の‘いいえ’)場合には、方法はステップS95に進み、画像領域内のデータサブセットのプロットを用いて生成された画像が、自動画像処理システムでの使用のためにコンピュータストレージに記憶される。
[画像属性及び画像空間の分割]
図10(a)及び10(b)は、画像属性空間分割技術及び画像空間分割技術の両方が一緒に使用され得る方法を説明する図である。画像属性、例えば、色は、図10(b)に示されるような、分割された色空間からの対応する画像属性(色)を用いて、図10(a)で使用される種々のタイプのハッチングによって示されるように、分割された画像空間においてなされたプロットに割り当てられてよい。例えば、図10(a)における時間tでの各バーの色は、時間tでのx、y及びq、又はより多くのチャネルを有する色モデルのためのより多くの変数(例えば、RGBモデルのためのx、y、z及びq)の値を表してよい。図11は、t(時間又は何らかの他の連続体を表し得る。)が変化するにつれて種々の変数がどのように変化するかを示す表である。
図12のフローチャートは、自動画像処理システムでの使用のために、多変数データセットにおいてデータを表す画像を生成し記憶する画像生成及び記憶方法であって、第1及び第2の態様を具現化する方法に対応する。多変数データセットは、複数のデータサブセットを有し、且つ、Nが整数であるとして、N+3個の変数を有しており、方法のステップS121で、多変数データセットのために必要とされる画像属性領域の次元の数はN−1に設定される。画像属性領域のN−1個の軸は、1つの他の変数に関連したN−1個の連続変数を夫々表す。その、他の変数は、カテゴリ変数又は、上述された一定の環境では、連続変数であってよい。ステップS122で、その、他の変数の異なる値の個数Mが決定され、N−1次元の画像属性領域は、Mが整数であるとして、M個のサブ領域に分けられる。M個のサブ領域は、N−1個の変数に関連した変数の異なる値に夫々対応する。ステップS123で、残り3つの変数の中から1つが選択され、その選択された変数の異なる値の個数が決定される。選択された変数は、残りの変数のうちの2つのみが連続する場合にカテゴリ変数である。画像領域は、次いで、mが整数であるとして、m個のサブ領域に分けられる。画像領域は、選択された1つの変数以外の、3つの変数のうちの2つの変数を夫々表す2つの軸を有する。ステップS124で、データサブセットのうちの1つについて、1つの変数に関連したN−1個の変数の値が、そのデータサブセットにおける関連する1つの変数の値に対応するN−1次元の画像属性領域のサブ領域のうちの1つにおける対応する位置にマッピングされ、画像属性領域におけるそのデータサブセットの位置に対応する画像属性が、そのデータサブセットに割り当てられる。ステップS125で、選択された変数以外の、データサブセットのうちの1つにおける残り2つの変数の値が、その1つのデータサブセットに割り当てられた画像属性を用いて、そのデータサブセットについての予め選択された1つの変数の値に対応する画像領域のサブ領域のうちの1つにおいてプロットされる。
ステップS126で、方法は、いずれかの未処理のデータサブセットが存在するかどうかをチェックする。未処理のデータサブセットが存在する(ステップS126の‘はい’)場合には、方法は、未処理のデータサブセットに対してステップS124及びS125を実行する。そうでない(ステップS126の‘いいえ’)場合には、方法はステップS127に進み、画像領域内のデータサブセットのプロットを用いて生成された画像が、自動画像処理システムでの使用のためにコンピュータストレージに記憶される。
上述されたように、このような形式の画像化のための1つの適切な適用は、ログ(例えば、コンピュータオペレーティングシステム、個別アプリケーション又はサービスの、スマートデバイスからの、など)が連続変数及びカテゴリ変数の両方を含み得るデータログ分析論である。
この適用の例が、上述されたログの例を参照してこれより記載される。画像化に適した形でこれを表すよう:
・ タイムスタンプ(Timestamp)は、ユニックス時間(例えば、1501080839)、すなわち、整数に変換される。
・ レベル(Level)は、値WARING、INFO、DEBUG及びERRORのうちの1つを有するカテゴリ変数である。
・ メッセージ(Message)は除かれる。
・ ネットワーク(Network)は、バイナリ整数(例えば、接続については1、切断については0)に変換される。
・ 全ての残りの数値は、0から1の間の値に正規化される。
提案されている、画像空間分割及び画像属性空間分割を組み合わせた技術を用いて、ログへの夫々のそのようなエントリは、次いで、図13(a)及び13(b)に示されるように、画像において表現されてよい。画像空間(図13(a))において、tはタイムスタンプを表し、sはCPU使用量を表す。画像空間の上半分(1と表記)は、システムがネットワークに接続される場合に使用され、下半分(0と表記)は、そうでない場合に使用される。この例において、画像属性は色であるから、バーは、図13(b)における分割された色空間に従って決定された赤、緑(図示せず。)及び青の値を有しているRGB色モデルにおいて着色される(異なるタイプのハッチングによって表される)。色空間は、レベルについての値のうちの1つに夫々対応する4つのサブ領域に分けられる。各サブ領域内で、赤、緑及び青チャネルの相対値は、CPU温度、HDD温度及びファン速度に夫々対応する(本文書の制限された次元により、HDD温度を表す緑チャネルの変化は描写されない。)。図14は、図13(a)及び13(b)の画像に対応するデータの表である(すなわち、画像化モデルで使用される変数への列名のマッピングとともに、1つの画像へと画像化されるデータログエントリの時間窓)。
以前に提案された方法と同様に、データの窓が上記の実施形態に従って画像化された後、特徴ベクトルが抽出され、それにより、特徴ベクトルは、例えば、コサイン距離又は何らかの他の距離メトリックに従って、以前に経験された時間窓についての既存の画像と比較され得る。
例えば、図15に示される図で説明されるように、クエリされている画像の特徴ベクトルを他の全ての既知の画像と比較した後、その画像が全ての既知のクラス(“システム更新”及び“印刷”と示された例において分類される。)の全てのインスタンスから(特徴空間において)離れていると認められる場合には、対応する時間窓は異常とフラグを立てられる。
これは、次いで、例えば、エンジニアにハードウェア又はソフトウェアを点検するよう、起こり得る機能不良を予期するよう、又はシステムに関与する者によって必要とされる何らかの他のアクションを行うよう指示するために、アラートを引き起こしてよい。
図16は、第4の態様を具現化する画像生成装置10であって、第1の態様を具現化する方法を実行するよう構成される装置10のブロック図である。装置10は、自動画像処理システム30での使用のために、多変数データセットにおいてデータを表す画像を生成するよう構成される。多変数データセットは、複数のデータサブセットを有し、且つ、Nが整数であるとして、少なくともN個の整数を有している。装置10は、画像属性領域パーティショナー1、マッパー2、画像属性割り当て部3、及び画像生成部4を有する。画像属性領域パーティショナー1は、N−1次元の画像属性領域を、Mが整数であるとしてM個のサブ領域に分けるよう構成される。M個のサブ領域は、N個の変数のうちのN−1個の変数に関連するN個の変数のうちの1つの変数の異なる値に夫々対応する。N−1次元の画像属性領域は、1つの変数に関連するN−1個の連続変数を夫々表すN−1個の軸を有する。マッパー5は、多変数データセットに含まれる各データサブセットについて、1つの変数に関連する当該データサブセットにおけるN−1個の変数の値を、当該データサブセットにおける関連する1つの変数の値に対応するN−1次元の画像属性領域のM個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングするよう構成される。画像属性割り当て部3は、各データサブセットに対して、N−1次元の画像属性領域における当該データサブセットの位置に対応する画像属性を割り当てるよう構成される。画像生成部4は、データサブセットに割り当てられた画像属性を用いて、多変数データセットにおいてデータを表す画像を生成するよう構成される。画像生成部4は、自動画像処理システムでの使用のために、生成された画像をコンピュータストレージ20へ出力するよう動作可能である。
装置10は、多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーを更に有する。m個のサブ領域は、N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応する。画像領域は、3つの変数のうちの選択された1つの変数以外の、3つの変数のうちの残り2つの連続変数を夫々表す2つの軸を有する。この場合に、画像生成部4は、多変数データセットに含まれる各データサブセットについて、3つの変数のうちの選択された1つの変数の値に対応する画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける残り2つの変数の値のプロットを形成するよう構成される。各プロットは、当該データサブセットに割り当てられた画像属性を用いて形成される。
図17は、第5の態様を具現化する画像生成装置100であって、第2の態様を具現化する方法を実行するよう構成される装置100のブロック図である。装置100は、自動画像処理システム30での使用のために、多変数データセットにおいてデータを表す画像を生成するよう構成される。多変数データセットは、複数のデータサブセットを有し、且つ、3つの変数を有している。装置100は、画像領域パーティショナー50及び画像生成部60を有する。画像領域パーティショナー50は、画像領域を、mが整数であるとしてm個のサブ領域に分けるよう構成される。m個のサブ領域は、3つの変数のうちの選択された1つの変数の異なる値に夫々対応する。画像領域は、選択された1つの変数以外の、3つの変数のうちの残り2つの連続変数を夫々表す2つの軸を有する。画像生成部60は、多変数データセットに含まれる各データサブセットについて、予め選択されている1つの変数の値に対応する画像領域のサブ領域のうちの1つにおいてデータサブセットにおける残り2つの変数の値をプロットすることによって、画像を生成するよう構成される。画像生成部60は、自動画像処理システム30での使用のために、生成された画像をコンピュータストレージ20へ出力するよう動作可能である。
データの窓が上記の分割技術のうちの1つを用いて画像化された後、それは、図2を参照して上述されたように、又はそのようなタスクが可能な何らかの他の画像処理技術を使用することによって、異常について分類及び/又はテストされてよい。画像は、例えば、図18を参照して記載される画像処理システム30を用いて処理されてよい。
図18は、画像ストレージ20から画像(画像1及び画像2)を受信するよう構成される画像処理システム30のブロック図である。画像1は、既に分類されているデータの窓に対応してよく、一方、画像2は、分類を要するデータの窓に対応してよい。各画像は、それらの画像の特徴を表す各々の特徴ベクトル(特徴ベクトル1及び特徴ベクトル2)を画像から抽出するために、特徴抽出部31、本例では、畳み込みニューラル・ネットワーク(CNN)に入力される。特徴ベクトルは、類似判定デバイス32に入力される。類似判定デバイス32は、コサイン距離又は何らかの他の適切な距離メトリックに基づき、特徴ベクトル、よって、データの各々の対応する窓の間の類似度を決定する。未分類の画像と既に分類されている1つ以上の画像との間の類似度に基づき、分類及び異常検出は、類似度に基づき分類するk最近傍法のような方法を用いて、その後に実行されてよい。
図19は、本発明を具現化し、且つ、本発明を具現化する方法のステップの一部又は全てを実装し、実施形態の装置のタスクの一部又は全てを実行するために使用され得る、データストレージサーバのようなコンピュータデバイスのブロック図である。例えば、図19のコンピュータデバイスは、図12に表される画像生成及び記憶方法の全てのステップを実装し、図16に示される画像生成装置10の全てのタスクを実行するために、あるいは、図9の方法を実装するためだけに、且つ、図17の画像生成装置100のタスクを実行するためだけに使用されてよい。
コンピュータデバイスは、プロセッサ993及びメモリ994を有する。任意に、コンピュータデバイスは、他のそのようなコンピュータデバイスとの、例えば、本実施形態の他のコンピュータデバイスとの通信のためのネットワークインターフェイス997を更に含む。
例えば、実施形態は、そのようなコンピュータデバイスのネットワークから構成されてよい。任意に、コンピュータデバイスは、キーボード及びマウスのような1つ以上の入力機構996と、1つ以上のモニタのような表示ユニット995とを更に含む。コンポーネントは、バス992を介してお互いに接続可能である。
メモリ994は、例えば、コンピュータストレージ20のタスクを実行してよく、コンピュータ読出可能な媒体を含んでよい。この語は、コンピュータ実行可能命令を搬送し、あるいは、データ構造が記憶されるよう構成された単一の媒体又は複数の媒体(例えば、中央集権型又は分散型データベース及び/又は関連するキャッシュ及びサーバ)を指してよい。コンピュータ実行可能命令には、例えば、汎用のコンピュータ、特別目的のコンピュータ、又は特別目的の処理デバイス(例えば、1つ以上のプロセッサ)によってアクセス可能であって、それらに1つ以上の機能又は動作を実行させる命令及びデータが含まれ得る。よって、語「コンピュータ読出可能な記憶媒体」には、機械による実行のための命令の組を記憶、符号化又は搬送することが可能であって、機械に本開示の方法のいずれか1つ以上を実行させる如何なる媒体も含まれ得る。語「コンピュータ可読記憶媒体」は、然るに、制限なしに、ソリッドステートメモリ、光学媒体及び磁気媒体を含むと解され得る。一例として、制限なしに、そのようなコンピュータ読出可能な媒体には、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、電気的消去可能なプログラム可能リードオンリーメモリ(EEPROM)、コンパクトディスク・リードオンリーメモリ(CD−ROM)若しくは他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気記憶デバイス、フラッシュメモリデバイス(例えば、ソリッドステートメモリデバイス)を含む非一時的なコンピュータ読出可能な記憶媒体が含まれ得る。
プロセッサ993は、コンピュータデバイスを制御し、そして、処理動作、例えば、図6、9及び/又は12を参照して記載され、特許請求の範囲で定義されている方法を実装するよう、メモリ994に記憶されているコンピュータプログラムコードを実行すること、を実行するよう構成される。メモリ994は、プロセッサ993によって読み出され書き込まれるデータを記憶する。ここで言及されるように、プロセッサは、マイクロプロセッサ、中央演算処理装置、などのような、1つ以上の汎用の処理デバイスを含んでよい。プロセッサは、複数命令セットコンピューティング(CISC)マイクロプロセッサ、縮小命令セットコンピューティング(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、又は他の命令セットを実装するプロセッサ若しくは命令セットの組み合わせを実装するプロセッサを含んでよい。プロセッサは、特定用途向け集積回路(AISC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、ネットワークプロセッサ、などのような、1つ以上の特別目的の処理デバイスを更に含んでよい。1つ以上の実施形態において、プロセッサは、ここで説明されている動作及びステップを実行するための命令を実行するよう構成される。
表示ユニット995は、コンピュータデバイスによって記憶されているデータの表現を表示し、コンピュータデバイスに記憶されているプログラム及びデータとユーザとの間のインタラクションを可能にするカーソル並びにダイアログボックス及び画面も表示し得る。例えば、表示ユニット995は、画像化されるべき多変数データと、結果として得られる画像とを表示し得る。入力機構996は、ユーザが、画像化されるべき多変数データのようなデータと、命令とをコンピュータデバイスに入力することを可能にし得る。
ネットワークインターフェイス(ネットワークI/F)997は、インターネットのようなネットワークに接続されてよく、ネットワークを介して画像処理システム30のような他のこのようなコンピュータデバイスへ接続可能である。ネットワークI/F997は、ネットワークを介して他の装置との間で入出力されるデータを制御し得る。
マイクロホン、スピーカ、プリンタ、電源ユニット、ファン、ケース、スキャナ、トラックボールなどのような他の周辺機器が、コンピュータデバイスに含まれてよい。
本発明を具現化する方法は、図19に表されるもののようなコンピュータデバイスで実行されてよい。そのようなコンピュータデバイスは、図19に表されるあらゆるコンポーネントを有する必要はなく、それらのコンポーネントの一部から構成されてよい。本発明を具現化する方法は、ネットワークを介して1つ以上のストレージサーバと通信する単一のコンピュータデバイスによって実行されてよい。コンピュータデバイスは、データの少なくとも一部を記憶するデータストレージ自体であってよい。
本発明を具現化する方法は、お互いに協調して動作する複数のコンピュータデバイスによって実行されてよい。複数のコンピュータデバイスのうちの1つ以上は、データの少なくとも一部を記憶するデータストレージサーバであってよい。
本発明の上記の実施形態は、有利なことには、如何なる他の実施形態からも独立して、又は1つ以上の他の実施形態との如何なる実行可能な組み合わせにおいても、使用されてよい。
上記の実施形態に加えて、以下の付記を開示する。
(付記1)
コンピュータにより実施される画像生成及び記憶方法であって、複数のデータサブセットを含み且つNが整数であるとして少なくともN個の変数を有している多変数データセットにおいてデータを表現する画像を生成し記憶する前記方法において、
N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分けることであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記分けることと、
前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングし、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を当該データサブセットに割り当てることと、
前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成することと、
自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することと
を有する、前記方法。
(付記2)
前記関連する1つの変数は、カテゴリ変数である、
付記1に記載の方法。
(付記3)
前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分けることを更に有し、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり、
前記多変数データセットにおいて前記データを表す画像を生成することは、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成することを含み、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される、
付記1又は2に記載の方法。
(付記4)
前記3つの変数のうちの前記選択された1つの変数は、カテゴリ変数である、
付記3に記載の方法。
(付記5)
コンピュータにより実施される画像生成及び記憶方法であって、複数のデータサブセットを含み且つ3つの変数を有している多変数データセットにおいてデータを表現する画像を生成し記憶する前記方法において、
画像領域を、mが整数であるとしてm個のサブ領域に分けることであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記分けることと、
前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成することと、
自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することと
を有する、前記方法。
(付記6)
前記選択された1つの変数は、カテゴリ変数である、
付記5に記載の方法。
(付記7)
複数のデータサブセットを含み且つNが整数であるとして少なくともN個の変数を有している多変数データセットにおいてデータを表現する画像を生成する画像生成装置であって、
N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分ける画像属性領域パーティショナーであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記画像属性領域パーティショナーと、
前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングするマッパーと、
各データサブセットに対して、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を割り当てる画像属性割り当て部と、
前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成する画像生成部と
を有し、
当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する、
前記画像生成装置。
(付記8)
前記関連する1つの変数は、カテゴリ変数である、
付記7に記載の画像生成装置。
(付記9)
前記画像属性は、色、パターン、サイズ、形、及び透明度のうちの少なくとも1つを含む、
付記1若しくは2に記載の方法、又は付記7若しくは8に記載の画像生成装置。
(付記10)
前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーを更に有し、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり、
前記画像生成部は、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成し、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される、
付記7乃至9のうちいずれか一つに記載の画像生成装置。
(付記11)
複数のデータサブセットを含み且つ3つの変数を有している多変数データセットにおいてデータを表現する画像を生成する画像生成装置であって、
画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記画像領域パーティショナーと、
前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成する画像生成部と
を有し、
当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する、
前記画像生成装置。
(付記12)
前記選択された1つの変数は、カテゴリ変数である、
付記10又は11に記載の画像生成装置。
(付記13)
前記画像処理システムは、画像認識のために訓練されたディープ・ニューラル・ネットワークを有する、
付記1乃至6のうちいずれか一つに記載の方法、又は付記7乃至12のうちいずれか一つに記載の画像生成装置。
(付記14)
前記画像処理システムは、故障検出又は故障予測における使用のために、データ分類及び比較のうちの少なくとも一方を目的として前記生成された画像を処理する、
付記1乃至13のうちいずれか一つに記載の方法又は装置。
(付記15)
コンピュータで実行される場合に、該コンピュータに、付記1乃至6、13又は14のうちのいずれか一つに記載の方法を実行させるコンピュータプログラム。
1 画像属性領域パーティショナー
2 マッパー
3 画像属性割り当て部
4,60 画像生成部
5,50 画像領域パーティショナー
10,100 画像生成装置
20 コンピュータストレージ
30 画像処理システム
31 畳み込みニューラル・ネットワーク
32 類似判定デバイス
993 プロセッサ
994 メモリ

Claims (14)

  1. コンピュータにより実施される画像生成及び記憶方法であって、複数のデータサブセットを含み且つNが整数であるとして少なくともN個の変数を有している多変数データセットにおいてデータを表現する画像を生成し記憶する前記方法において、
    N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分けることであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記分けることと、
    前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングし、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を当該データサブセットに割り当てることと、
    前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成することと、
    自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することと
    を有する、前記方法。
  2. 前記関連する1つの変数は、カテゴリ変数である、
    請求項1に記載の方法。
  3. 前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分けることを更に有し、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり、
    前記多変数データセットにおいて前記データを表す画像を生成することは、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成することを含み、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される、
    請求項1又は2に記載の方法。
  4. 前記3つの変数のうちの前記選択された1つの変数は、カテゴリ変数である、
    請求項3に記載の方法。
  5. 前記画像属性は、色、パターン、サイズ、形、及び透明度のうちの少なくとも1つを含む、
    請求項1若しくは2に記載の方法。
  6. コンピュータにより実施される画像生成及び記憶方法であって、複数のデータサブセットを含み且つ3つの変数を有している多変数データセットにおいてデータを表現する画像を生成し記憶する前記方法において、
    画像領域を、mが整数であるとしてm個のサブ領域に分けることであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記分けることと、
    前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成することと、
    自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージに記憶することと
    を有する、前記方法。
  7. 前記選択された1つの変数は、カテゴリ変数である、
    請求項6に記載の方法。
  8. 複数のデータサブセットを含み且つNが整数であるとして少なくともN個の変数を有している多変数データセットにおいてデータを表現する画像を生成する画像生成装置であって、
    N−1次元画像属性領域を、Mが整数であるとしてM個のサブ領域に分ける画像属性領域パーティショナーであり、該M個のサブ領域は、前記N個の変数のうちのN−1個の変数に関連する前記N個の変数のうちの1つの変数の異なる値に夫々対応し、前記N−1次元画像属性領域は、前記1つの変数に関連する前記N−1個の変数を夫々表すN−1個の軸を有し、前記N−1個の変数は連続変数である、前記画像属性領域パーティショナーと、
    前記多変数データセットに含まれる各データサブセットについて、前記1つの変数に関連する当該データサブセットにおける前記N−1個の変数の値を、当該データサブセットにおける前記関連する1つの変数の値に対応する前記N−1次元画像属性領域の前記M個のサブ領域のうちの1つのサブ領域における対応する位置にマッピングするマッパーと、
    各データサブセットに対して、前記N−1次元画像属性領域における当該データサブセットの位置に対応する画像属性を割り当てる画像属性割り当て部と、
    前記データサブセットに割り当てられた前記画像属性を用いて、前記多変数データセットにおいて前記データを表す画像を生成する画像生成部と
    を有し、
    当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する、
    前記画像生成装置。
  9. 前記関連する1つの変数は、カテゴリ変数である、
    請求項8に記載の画像生成装置。
  10. 前記画像属性は、色、パターン、サイズ、形、及び透明度のうちの少なくとも1つを含む、
    請求項8若しくは9に記載の画像生成装置。
  11. 前記多変数データセットがN+3個の変数を有している場合に、画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーを更に有し、前記m個のサブ領域は、前記N個の変数以外の3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記3つの変数のうちの前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数であり、
    前記画像生成部は、前記多変数データセットに含まれる各データサブセットについて、前記3つの変数のうちの前記選択された1つの変数の値に対応する前記画像領域のサブ領域のうちの1つのサブ領域において当該データサブセットにおける前記残り2つの変数の値のプロットを形成し、各プロットは、当該データサブセットに割り当てられた前記画像属性を用いて形成される、
    請求項8乃至10のうちいずれか一項に記載の画像生成装置。
  12. 複数のデータサブセットを含み且つ3つの変数を有している多変数データセットにおいてデータを表現する画像を生成する画像生成装置であって、
    画像領域を、mが整数であるとしてm個のサブ領域に分ける画像領域パーティショナーであり、該m個のサブ領域は、前記3つの変数のうちの選択された1つの変数の異なる値に夫々対応し、前記画像領域は、前記選択された1つの変数以外の前記3つの変数のうちの残り2つの変数を夫々表す2つの軸を有し、前記残り2つの変数は連続変数である、前記画像領域パーティショナーと、
    前記多変数データセットに含まれる各データサブセットについて、前記選択された1つの変数の値に対応する前記画像領域の前記サブ領域のうちの1つにおいて当該データサブセットにおける前記残り2つの変数の値をプロットすることによって、画像を生成する画像生成部と
    を有し、
    当該画像生成装置は、自動画像処理システムでの使用のために、前記生成された画像をコンピュータストレージへ出力する、
    前記画像生成装置。
  13. 前記選択された1つの変数は、カテゴリ変数である、
    請求項11又は12に記載の画像生成装置。
  14. コンピュータで実行される場合に、該コンピュータに、請求項1乃至7のうちのいずれか一項に記載の方法を実行させるコンピュータプログラム。
JP2018158460A 2017-08-31 2018-08-27 多変数データの画像化 Pending JP2019046469A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17188832.4A EP3451231A1 (en) 2017-08-31 2017-08-31 Imagification of multivariate data
EP17188832.4 2017-08-31

Publications (1)

Publication Number Publication Date
JP2019046469A true JP2019046469A (ja) 2019-03-22

Family

ID=59772434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018158460A Pending JP2019046469A (ja) 2017-08-31 2018-08-27 多変数データの画像化

Country Status (2)

Country Link
EP (1) EP3451231A1 (ja)
JP (1) JP2019046469A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022097310A1 (ja) * 2020-11-06 2022-05-12 オムロン株式会社 作業推定装置、作業推定装置の制御方法、情報処理プログラム、および記録媒体

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3109690B1 (fr) * 2020-04-27 2022-06-03 Aptimiz Système et procédé informatisé d’interprétation de données de localisation d’au moins un travailleur agricole, et programme d’ordinateur
WO2022162246A1 (fr) * 2021-02-01 2022-08-04 Aptimiz Système et procédé informatisé d'interprétation de données de localisation d'au moins un travailleur agricole, et programme d'ordinateur
FR3119474A1 (fr) * 2021-02-01 2022-08-05 Aptimiz Procédé d’interprétation de données par image

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07284090A (ja) * 1994-04-08 1995-10-27 Olympus Optical Co Ltd 画像分類装置
WO2017054004A1 (en) * 2015-09-24 2017-03-30 California Instutute Of Technology Systems and methods for data visualization using tree-dimensional displays

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10417529B2 (en) * 2015-09-15 2019-09-17 Samsung Electronics Co., Ltd. Learning combinations of homogenous feature arrangements
GB2547712A (en) * 2016-02-29 2017-08-30 Fujitsu Ltd Method and apparatus for generating time series data sets for predictive analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07284090A (ja) * 1994-04-08 1995-10-27 Olympus Optical Co Ltd 画像分類装置
WO2017054004A1 (en) * 2015-09-24 2017-03-30 California Instutute Of Technology Systems and methods for data visualization using tree-dimensional displays

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
小林 弘明 外2名: "色による特徴表現を用いた高次元データの可視化", 情報処理学会研究報告, vol. Vol.2013-HCI-152, No.23, JPN6022019599, 14 March 2013 (2013-03-14), JP, pages 1 - 8, ISSN: 0004919855 *
斉藤 康彦: "多変量データ系列における規則性を発見するための可視化手法", 情報処理学会論文誌 データベース, vol. Vol.40, No.SIG 6(TOD 3), JPN6022019598, 15 August 1999 (1999-08-15), JP, pages 1 - 11, ISSN: 0004778599 *
飯塚 裕一 外2名: "データのカテゴライズと特徴に基づく視覚化形式の検討", 情報処理学会研究報告, vol. 99, no. 6, JPN6022019596, 22 January 1999 (1999-01-22), JP, pages 7 - 12, ISSN: 0004778600 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022097310A1 (ja) * 2020-11-06 2022-05-12 オムロン株式会社 作業推定装置、作業推定装置の制御方法、情報処理プログラム、および記録媒体

Also Published As

Publication number Publication date
EP3451231A1 (en) 2019-03-06

Similar Documents

Publication Publication Date Title
US11954568B2 (en) Root cause discovery engine
Gil et al. Review of the complexity of managing big data of the internet of things
JP2019046469A (ja) 多変数データの画像化
Liu et al. Graph pooling for graph neural networks: Progress, challenges, and opportunities
JP6555061B2 (ja) クラスタリングプログラム、クラスタリング方法、および情報処理装置
JP6219428B2 (ja) マルチセンサーデータ要約
Xu et al. Big data analytics framework for system health monitoring
Luna-Romera et al. An approach to validity indices for clustering techniques in big data
US10019681B2 (en) Multidimensional recursive learning process and system used to discover complex dyadic or multiple counterparty relationships
Paliwal et al. Digitize-PID: Automatic digitization of piping and instrumentation diagrams
Schuh et al. Methodology for the derivation of a digital shadow for engineering management
WO2021099938A1 (en) Generating training data for object detection
US9489472B2 (en) Method and apparatus for detecting interference in design environment
Betke et al. Footprinting parallel I/O–machine learning to classify application’s I/O behavior
US20210056347A1 (en) Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results
JP7103987B2 (ja) 情報処理装置、情報処理方法、及びプログラム
Alghawli Computer Vision Technology for Fault Detection Systems Using Image Processing.
Pal et al. Random partition based adaptive distributed kernelized SVM for big data
CN117539948B (zh) 基于深度神经网络的业务数据检索方法及装置
US11947504B1 (en) Multi-cloud data processing and integration
WO2015141157A1 (ja) 情報処理装置、及び、クラスタリング方法
Héroux et al. Datasets for the evaluation of substitution-tolerant subgraph isomorphism
Kriksciuniene et al. Process optimization and monitoring along big data value chain
Gill et al. ProvFL: Client-Driven Interpretability of Global Model Predictions in Federated Learning
US20240144144A1 (en) Machine-generated process transformation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220524

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221115