JP6602013B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP6602013B2
JP6602013B2 JP2015006910A JP2015006910A JP6602013B2 JP 6602013 B2 JP6602013 B2 JP 6602013B2 JP 2015006910 A JP2015006910 A JP 2015006910A JP 2015006910 A JP2015006910 A JP 2015006910A JP 6602013 B2 JP6602013 B2 JP 6602013B2
Authority
JP
Japan
Prior art keywords
feature
similarity
axes
vector
chart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015006910A
Other languages
English (en)
Other versions
JP2016133899A (ja
Inventor
将史 瀧本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015006910A priority Critical patent/JP6602013B2/ja
Publication of JP2016133899A publication Critical patent/JP2016133899A/ja
Application granted granted Critical
Publication of JP6602013B2 publication Critical patent/JP6602013B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
人がデータ解析を行う際、数字の羅列をそのまま眺めるのではなくデータを人が把握しやすい形態で表示するための視覚表現として多様なグラフ(graph)又はチャート(chart)による表現方法を使うのが一般的である。対象となるデータや把握したい情報の性質によって適切に採用された可視化方法でデータを把握しやすくすることにより単なる数字の羅列では気付かないデータの傾向や情報を読み取ることが可能となる。ビッグデータの活用によって新しい問題解決方法や付加価値を提供することが昨今の技術領域のメインストリームになりつつある。例えば、多変量のデータを効果的に可視化して人の目による分析をサポートすることが重要となっている。
一般的に、データを複数の項目で分析する場合、円グラフ(Pie Chart)や棒グラフ(Bar Chart、Bar Graph)等が用いられる。また、レーダチャート(Radar Chart)や平行座標プロット(Parallel Coordinate Plot)等が用いられる。これらのうち、棒グラフやレーダチャート、平行座標プロットは、多変量データの関係をそのまま知ることができる方法である。これら3種のグラフは、さまざまな評価に使用できるデータ可視化方法であり、一般的には多変量を比較するのに使用される。また、グラフ内の複数の項目同士を比較することもでき、同じ項目で評価値を出した他のグラフを比較することもできる。
棒グラフや平行座標プロット、レーダチャートは、多変量解析に利用されるデータ可視化法である一方、変量の数の増加とともに軸数が増えてグラフ形状が複雑化していくため、人が一度に全体を把握することが困難となるということが知られている。認知神経科学で良く知られた事実として『マジック・ナンバー 7±2 説』(非特許文献1)というものがある。これは、人が情報を認識する際、7±2のチャンクに納まる情報であればうまく認識できるが、それ以上になると難しくなるという説である。この説によると、例えばグラフ形状の直感的な比較に優れているレーダチャートであっても、複数のグラフ形状比較をする際、隣り合う軸同士の意味的なまとまり(チャンク)のない一般的なレーダチャートの場合は各軸が1チャンクとなる。そのため、軸数が7±2を超えたレーダチャートは人の形状認識能力を超えている可能性が高いことになる。
下記特許文献1には、多変量データの可視化の際にデータを表現する特徴量の数の増加とともに横方向に伸びていく平行座標プロットにおいて、部分的な平行座標プロットを取り出して配置し、人の認識しやすいグラフを作成する技術が提案されている。また、下記非特許文献2には、レーダチャートの軸に割りつける変数の順番が重要であると説き、これらをPCAによって近くなったものをレーダチャート上での軸で近くになるように設定することが説明されている。
特開2013−161226号公報
"The Magical Number Seven, Plus or Minus Two: Some Limits on Our Capacity for Processing Information", George A. Miller, The Psychological Review , 1956 『多変量解析事例集第1集』(吉澤・芳賀編,日科技連,1992)
ここで、レーダチャート、平行座標プロット、棒グラフや棒グラフを折れ線表示したものすべてにおいて言える課題は、データ可視化を形状として把握しやすく可視化している傍ら、軸の相対的な位置や間隔(幅や角度)に情報価値がないことである。これらのグラフは、多変量の項目間を連結した線によって(棒グラフの場合は棒の並びによって)形状が構成されるにも関わらず、偶然隣り合った項目を結ぶことによって形状が確定する。そのため、可視化によって得られる情報において人の認識にとっては隣り合う軸同士の関係性を重点的に認識することになる。例えば、棒グラフでは遠くの棒同士の高さの差は近くの棒同士の差に比べて直感的な大小把握が難しくなり、平行座標プロットでは隣同士の変数間に相関があるかどうかしか判らない。よって、詳細にスコアの差を比較する必要のない項目を離したり、微小な差異を詳細に比較すべき項目を近くにしたりするといった、多変量データを効果的に可視化する際の工夫が必要となってくる。
前記特許文献1に記載の平行座標プロットを部分的に取り出して配置する方法では、人が注目すべき部分が絞られるため、部分的な平行座標プロットに関して比較しやすくなる。しかし、グラフ全体を俯瞰してデータを把握するような場合には、多変量の部分的組合せを複数可視化して一つのグラフとするため、一瞥して情報を直感的に把握するのには不向きなグラフになったり、見落としが発生しやすくなったりする可能性がある。また、前記非特許文献2のレーダチャートの変数の順序決定方法によっても、近くにまとめるべき変数成分の見当がつくだけであり、それら変数を表す軸間の類似度等を反映したチャートを得ることができない。
本発明は、このような事情に鑑みてなされたものであり、構成する軸同士の関連性や類似性が考慮された比較認識を容易に行うことが可能になるチャート(グラフ)を生成できるようにすることを目的とする。
本発明に係る情報処理装置は、画像中の所定個の特徴量間の類似度を算出する算出手段と、前記所定個の特徴量の各々について、自身及び他の特徴量との前記類似度を要素とするベクトルを生成し、前記特徴量間の類似度に基づいて前記ベクトルに対応する点が原点から等距離に並ぶように当該ベクトルの次元数を削減する次元削減手段と、前記特徴量間の類似度を基に、前記所定個の特徴量のそれぞれに対応する軸の配置を決定する形状決定手段と、前記形状決定手段により決定した軸の配置に従って前記画像から抽出した特徴量を描画した図を出力する出力手段とを有することを特徴とする。
本発明によれば、一瞥しただけでは把握しにくい多変量データであっても直感的に把握しやすい表現形態にて表示することができ、データ分析がしやすくなる効果が得られる。
本実施形態における情報処理装置としての多変量データ可視化装置の構成例を示す図である。 本実施形態における処理動作の例を示すフローチャートである。 異常パターン毎にレーダチャートの形状が異なる例を示す図である。 異なる性質のデータの判別に不向きなレーダチャートの例を示す図である。 図4に示したレーダチャートを、異なる性質のデータを判別しやすく変換を施した例を示す図である。 第1の実施形態に係るレーダチャートの生成手順の例を示す図である。 第1の実施形態によるグラフの例を示す図である。 第1の実施形態に係るレーダチャートの生成手順の他の例を示す図である。 第1の実施形態に係るレーダチャートの生成手順の他の例を示す図である。 第1の実施形態に係る表示形式を選択可能なGUIの例を示す図である。 本実施例における情報処理装置を実現可能なコンピュータ機能を示す図である。
以下、本発明の実施形態を図面に基づいて説明する。
(第1の実施形態)
本発明の第1の実施形態について説明する。第1の実施形態は、複数の特徴量で表現される複数のデータが有り、各々のデータがそれらの中でどのような傾向にあるかを分析したい場合に、人が見て直感的に判り易い形でのレーダチャートやそれに類するチャートを生成する方法である。
一例として、入力画像から複数の特徴量を抽出して自動で検査を行う外観検査でのユースケースを挙げて説明する。入力画像の正常・異常を自動で判定する外観検査では、入力画像から判定に必要な特徴量を複数抽出し、それらのスコア(評価値)を総合的に判断して正常画像か欠陥画像かを判定する。抽出される特徴量の示す各スコアと検出される異常の種類には相関があり、生産現場では判定結果である正常・異常のラベル以外にも判定スコアや元の抽出特徴軸におけるスコアにより測定の難しい欠陥の傾向を分析することができる。これによって、例えば生産ライン設計にフィードバックをかけることができる。
特に、人の目による官能目視検査を自動化した外観検査装置では複雑なパターンかつ多様なレベルの異常データが存在するため、異常と判定した画像だけを見ても何を根拠に異常と判定したのか分析するのが難しい。そこで、抽出特徴を一覧性の高いチャート(グラフ)によって可視化することで、画像を見るだけではわかりにくかった傾向の把握を容易にすることができる。
図3に一例として、各々の入力画像から抽出した特徴量のスコアの傾向の違いを直感的に知ることができる例としてレーダチャートの形状の違いが異常パターン毎に異なる様子を示した。抽出特徴の数が5個である場合を示しており、各々の抽出特徴にはIDが番号によって付与されている。図3(A)は、入力画像としての正常画像及びそれに対応するレーダチャートの例を示しており、図3(B)は、入力画像としてのムラ欠陥画像及びそれに対応するレーダチャートの例を示している。また、図3(C)は、入力画像としてのキズ欠陥画像及びそれに対応するレーダチャートの例を示しており、図3(D)は、入力画像としての異物欠陥画像及びそれに対応するレーダチャートの例を示している。図3(A)〜図3(D)に示すように、それぞれのレーダチャートの形状は異なっている。
このように、適切なレーダチャートが設定されると、ユーザがレーダチャートの形状を見るだけで欠陥の傾向を直感的に把握するのに役立つ。ここでは見易さのために各欠陥の事例は画像だけを見て判る入力画像を示したが、生産現場で発生する欠陥サンプルには人の目には正常サンプルとほとんど外観の変わらないようなものも存在する。そのような場合に、そのサンプルが何の異常の傾向を持つのか、といった確認や分析の際にもレーダチャートの形状を見るだけで直感的に理解することが可能となる。その他、こういった情報の可視化によって複雑な判定処理アルゴリズム自体をユーザが理解していなくとも、アルゴリズムがどのように画像を判定しているかを直感的にチェックすることができるため、検査装置の信頼度の向上や不具合の早期発見に役立つ。
しかし、図3に示したような抽出特徴の種類が5個程度と少なく、それぞれが各欠陥の傾向を把握するのに充分であるならば良いが、一般的に多様な異常パターンに対応することを前提とした識別器では抽出特徴の数は数十から数百まで増加することが多い。このような場合に何の工夫も無くレーダチャートを作ると、図3に示したように一瞥して異常の傾向を把握できるようなチャートとは異なるチャートが生成されることが多い。
例として、抽出特徴の数が35個である場合に、単純に抽出した特徴量を抽出特徴順に時計回りに軸を配しただけのレーダチャートを描画したことによって欠陥の傾向によるグラフの形状の違いを把握しにくくなる典型例を図4に示す。図4(A)〜図4(D)に示すレーダチャートは、それぞれ異なる理由で欠陥とされた検査対象の画像を入力としたときに生成されたグラフである。生産現場において1日に大量の検査対象がラインを流れていく中で人がこれら4つの形状の違いを一瞥して把握し、瞬時にそれぞれがどういった欠陥を意味しているのかを理解するのは困難である。
そこで、本実施形態では、グラフに対して以降で説明する処理を施すことによって直感的に形状の違いを把握しやすいグラフに変換する。図5(A)〜図5(D)に、図4(A)〜図4(D)を各軸が示すスコアはそのまま保存しながら、それぞれ認識しやすい形状になるように軸の順を並べ替えたレーダチャートを示す。これによると図4(A)〜図4(D)においては、不明瞭であった性質がよく判るようになる。例えば、図5(A)、図5(B)、図5(C)はそれぞれ異なる欠陥の種類を示す画像に対応するチャートであったこと、図5(D)は、図5(A)及び図5(B)に示される2つの欠陥種が複合している可能性が高いこと等が即座に理解しやすい。
つまり、たとえ抽出特徴の数が増えたとしても、図5(A)〜図5(D)に示すように同じ欠陥信号に反応する特徴量を表す軸をそれぞれ近くに配置するだけで、形状を見るだけで欠陥の傾向を把握できるレーダチャートを作成することができるようになる。以下では、見やすいレーダチャート生成アルゴリズムの例を詳細に説明する。
前述したとおり、見やすいレーダチャートを生成するためには、関連性の高い軸を近くに配置することが好ましい。決まった傾向の入力欠陥信号に対して決まった反応をする特徴量があれば、それらの軸が近くに配置されたレーダチャートでは該当の箇所がグラフの形状としていつも連動して変形する。そのため、ひとまとまりの領域に同じ意味付けをすることで数少ない部分領域を人は意識してグラフを読み取れば良いことになるためである。逆に、連動して反応する軸が散在したレーダチャートでは同じような意味を持つ特徴量の集合をまとめて認識することが人にとって困難となる。
ここで処理の流れに関して、図1の本実施形態における情報処理装置としての多変量データ可視化装置の構成例を示すブロック図、及び図2のフローチャートを用いて説明する。多変量データ入力部101にて、画像等の対象となるサンプルからn個の特徴量が抽出されたデータが入力される(S201)。そして、入力されたn個の特徴量を基に特徴量間距離算出部102にて各々の特徴量同士の類似度(距離)を計算し(S202)、得られた特徴量間の類似度を尺度とする特徴空間で表現された各特徴量を代表するn個のベクトルが獲得される。
このn個のベクトルを次元削減部103にて原点から等距離に点が並ぶように2次元(又は3次元)に次元削減を行う(S203)。このとき、データ可視化時に必要となる次元削減数やどの特徴量同士を近付けたい(又は遠ざけたい)等のパラメータ類をユーザが指定したい場合、これらの変更を結果に反映させるため、データ可視化パラメータ入力部104から入力することも可能である。
そして、求まった原点から等距離に並んだn個の特徴量を代表するベクトルやユーザがデータ可視化パラメータ入力部104により入力したパラメータを基にしてチャート形状決定部106にてチャートの軸の配置が決定(S204)される(S204)。この配置にならって多変量データ入力部101から入力されたデータのそれぞれが各軸毎に評価値をプロットされてチャートが完成し、ディスプレイ等の出力部105にて出力される(表示される)。
また、チャート形状決定部106にて決定したチャートの軸配置をチャート形状記憶部108で記憶しておく。そして、チャートの軸配置に使われなかった多変量データを多変量データ追加入力部107にて受付け、チャート形状記憶部108で保持されているチャートの軸の上にプロットすることで新たなチャートを作成して出力部105に出力する。
次に、図2に示したステップS202での具体的な特徴量間の類似度(距離)の算出例について説明する。特徴量同士の関連が高いかどうかは、例えばカルバック・ライブラー情報量で定義することができる。カルバック・ライブラー情報量によって特徴量同士の類似性を計算する場合、各特徴量が示すデータの分布をカーネル密度推定(KDE)等のアルゴリズムによって推定し、推定された分布間の距離によって定義する。特徴量IDがiとjの2つの特徴量FiとFjのそれぞれが示すデータバラつきから推定した確率分布をPiとPjとすると、2つの分布間の類似度は下記式(1)で定義される。
Figure 0006602013
ただし、分布間の距離は式(1)で示した以外にも、2つの確率分布が多次元正規分布であると仮定して、Bhattacharyya距離を用いたり、相互情報量によって定義する等、他の指標で算出しても良いことは言うまでもない。また、各確率分布推定と分布間の距離算出を同時に行う密度比推定と呼ばれる方法によっても同様の結果を得ることができる。その他、分布間の距離算出に使える指標としては、特徴量毎が示すデータのスコアランキングの差の2乗和の総和を使う方法がある。この場合にもスコアが大きい程、特徴量同士が似ていないものとして扱える。
以上のようにして、全n個の入力特徴量F={Fin i=1同士の類似度を算出する。これにより、全n個の入力特徴量は同じく自身を含めてn個の特徴量との類似度を要素とするベクトルが獲得される。このとき得られたベクトルを式(2)で表す。
Figure 0006602013
次に、ステップS203に続くステップS203で行う処理について具体的な算出法の例について説明する。ステップS203では、2次元のレーダチャートの軸としてn個の特徴量を表す軸は2次元へ次元削減を行うため、次元削減後に対応する軸の描画のための点の座標を式(3)で表す。式(3)ではm次元に次元削減する場合を示しているが、通常のレーダチャートではm=2とすれば良い。また、式(3)においてBはレーダチャート生成のための埋め込み行列であり、定義は式(4)に示したとおりである。
Figure 0006602013
Figure 0006602013
ここで、埋め込み行列Bを求めるためのいくつかの方法を以下に示す。求めるべき埋め込み行列BをB*と呼ぶことにし、また、近付けるべき特徴量同士の規則を記述した類似度行列Wによって式(5)で埋め込み行列を定義する。
Figure 0006602013
ここで、類似度行列Wの要素であるWi,jは、特徴量同士を近付ける規則を記述した行列であり、i番目の特徴とj番目の特徴を近付ける場合には1に、遠ざける場合には0になるような関数として設定されれば何でも良い。つまり、類似度Wi,jが1の場合には式(5)で次元削減後の距離が最小化対象となり、0の場合には無視されるようにしてB*を求めることになる。当然のことながら、近付ける優先度を対象によって変えたい場合には、Wi,jとして0〜1の間の値を設定しても良い。類似度Wi,jの例として使える式の例を式(6)、式(7)に示す。
Figure 0006602013
Figure 0006602013
式(6)は、n次元特徴空間でのGiがGjのk近傍にあるかどうかで0か1かを決定する方式であり、式(7)は、定数γによって定義される距離ベースで算出される値をセットする方式である。その他のWi,jの例として、抽出特徴量に関する事前知識を反映させた値をセットしても良い。また、抽出特徴の性質上、ユーザの都合によりデータ可視化の際に近付けたくない特徴量が存在する場合には、ユーザによる該当特徴量ID指定の後、該特徴量同士の類似度Wi,jを0にセットすることでユーザ希望の結果を得ることができる。逆に、ユーザの希望で近付けたい特徴があれば同様の入力により、該当する特徴量間のWi,jを1にセットすれば良い。
これらの指標に基き次元削減を行うが、式(5)にある次元削減後の原点からの距離が1になるという制約条件により、各特徴量IDを代表する点が原点からの距離1の円上に並ぶ結果を得る。このときの処理前と処理後のイメージ図、及びそのとき得られるチャートの例を図6に示す。
図6(A)は、前述した全入力特徴量をカルバック・ライブラー情報量によって類似度ベースの距離により定義された10次元空間内に10個の各特徴量を代表するベクトルGiが分布している様子を表している。図6(B)は、前述した方法にて算出された次元削減用の埋め込み行列によって2次元に次元削減された各特徴量を代表するベクトルgiが原点周りの距離1の円上に分布していることを示している。これが、レーダチャートで各軸をどの位置関係に描画するかの指標になる。
この円上の点giが各特徴量を表す特徴量IDのi番目の軸を設定するための位置指標となるため、原点から全10個の点に向かって軸を設定し描画することによって、図6(C)に示したようなチャートを得ることができる。このチャートはレーダチャートのように軸を等間隔に配していないが、各軸の類似度が各軸の間の角度として表現されているため、意味的なまとまりを把握しやすくなっており、一般的なレーダチャートよりも理解しやすくなる場合がある。このように、軸の相対的な位置と角度に情報価値が無かったレーダチャートの欠点を補った、新しいチャートをClumsy Spider Chart(CSC)と称する。
このチャート上に任意のデータの各軸スコアをプロットして描画したCSCの例を図6(D)に示す。図6(D)は説明を簡易にするために軸の数が少ない場合のCSCとして表現しているが、CSCが便利になるのはより高次元の多変量を扱うときである。高次元になっても、連動してスコアが変わる軸が近く配置されているために、局所に注目する場合は近い軸同士のスコア変動をまとめて観察すればよく、全体のグラフ形状を見ると局所のまとまりを持ったスコアの動きのバランスを俯瞰して把握することができる。
以上説明したように、軸同士の関連性や類似性を考慮して軸の配置(並びや間隔)を設定してチャート(グラフ)を生成することによって、全体を俯瞰した際に複数の軸同士の意味的なまとまりを直感的に把握することが可能となる。これにより、巨視的な視点で見たときのグラフ全体の形状比較がし易くかつ微視的な視点では軸の近い関連性の高い物同士の差異に注目して比較することのできる、人の認識にやさしいチャート(グラフ)を生成することが可能となる。
図7(A)、図7(B)に高次元(108次元)の多変量データの比較が直感的に優れていることがわかるCSCの例を示した。図7(A)、図7(B)によると、一般的なレーダチャートよりも、どの軸が相関が強く連動して動くことが直感的にわかるため、グラフの注目ポイントが暗に示されており、高次元になっても形状の認識がしやすいことがわかる。図7(A)と図7(B)に示したチャートを比較するときも全体的な形状の傾向は変わらないが、局所的な形状としての右上部分、左上部分の形状に違いがあるということが判り易い。軸の並びが適切な順になっていない一般的なレーダチャートであると、108本もの軸の上のグラフを一瞥して傾向を把握するのは困難になるのは言うまでもない。
また、通常のレーダチャートのように軸の間の角度が等しい表示を好むユーザのために外観だけを一般的なレーダチャートに合わせるように軸の並びはそのままにしながら軸間角度を等間隔になるようにしても良い。その場合の変換過程の概念は、図8(A)〜図8(D)に示しており、図6(D)に対応するグラフを図8(E)に示している。
詳細な分析ではなく、より短時間で直感的にデータの傾向を把握するためには、できるだけ冗長な情報になる可能性の高い部分は取り除いてユーザに提示した方が良い場合がある。そのため、さらに簡易チャート表示モード等を選択できるようにし、特徴量同士の類似度が所定の値より高い軸同士を1つの軸にまとめて表示しても良い。その際の処理手順を図9(A)〜図9(D)に示す。例えば、次元削減後の軸の間の角度が設定した閾値以下であった場合にそれらの軸をまとめて1つの軸で表し、その軸で表されるスコアは元の複数の軸のスコアの平均値にする等により算出する方法がある。または次元削減前に近傍関係にある点の平均を取る等して1つの点にまとめ、その後に次元削減をしても良い。図9(E)は、図6(D)や図8(E)に示したデータを同様に図9(D)のチャート上に表示した例であるが、図9(E)をさらに一般的なレーダチャートの形式にして見たいユーザのために全軸間の角度を等間隔になるように調整して表示しても良い。
なお、前述した各種チャートの表示切り替えは、例えば図10に示すように複数の画像に対応するチャートを表示させ、チャートを見ながらユーザが好みの表示形式をボタンをクリックするだけで簡単に選択できるようにしてもよい。これによりデータによって適した分析が容易になる。
また、前述した説明では、すべて一般的なレーダチャートに近い表示形態を想定したため、次元削減時の次元数を2次元とした例を用いて説明したが、より複雑な分析が必要な場合等は次元削減時の次元数を3次元としても良い。削減後の次元数が3である場合、前述したチャートの3次元表現となり、よりそれぞれの特徴量の関係が直感的に表現されたグラフを作成することができる。ただし、3次元のチャートを確認するディスプレイが2次元表示の場合等は2次元のチャートよりも形状の把握が難しくなる場合がある。そのために3次元化したチャートの際は、緯度や経度によってRGB(表示色)の値を変化させながらカラーで表示するなどすれば良い。なお、本実施形態は外観検査を例として説明したが複数の特徴量を扱った場合のデータ可視化全般に利用できる方法であることは言うまでもない。
(第2の実施形態)
次に、本発明の第2の実施形態について説明する。第2の実施形態は、第1の実施形態で説明したチャート生成のための次元削減時において次元削減する前後において特徴量間の距離関係の保持度合いを基準にして次元削減を行い、人が見て直感的に判り易い形でのレーダチャート等を生成する方法である。以下では、第2の実施形態において、前述した第1の実施形態と異なる点について説明する。
次元削減する前後において特徴量間の距離関係の保持度合いを基準にして次元削減を行う場合、最小化すべきは次元削減する前後で距離関係が変わることによる誤差である。このときの誤差2乗和を例えば式(8)に示した方法で定義すると良い。
Figure 0006602013
ただし、次元削減前の特徴量Gやgは、第1の実施形態で示したものと同じであり、Δijは式(9)のように定義し、Gi、Gjの間の距離を表す。
Figure 0006602013
また、δijは同様に次元削減後のgi、gjの距離を表す。ただし、δijには2次元平面に次元削減した後に原点からの距離が等しくなるように式(10)に示す制約を加える。
Figure 0006602013
以上のようにした後、最急降下法により解を求めることができる。これによって求まった解は、2次元平面の上で原点周辺の同心円上に配置された点として次元削減後の特徴量の代表点を得る。この点を基にして以降のチャートを獲得する手順は、第1の実施形態と同様である。なお、式(8)以外の誤差2乗和関数の例を式(11)、式(12)に示す。これらはどれも多次元尺度法等で利用されている関数である。
Figure 0006602013
Figure 0006602013
その他、式(8)、式(11)、式(12)に記した最小化すべき誤差2乗和関数は、次元削減前の特徴量Gのすべての関係性を保持するための誤差となっている。k近傍までを近付けるといったパラメータを追加するとISOMAPと同様な手順で次元削減を行うことができる。以上手順によって得られた次元削減後の各特徴量を表す代表点であるgを基にしてチャートを生成する手順は、第1の実施形態と同様手順によって実現でき、適切なチャートを得ることができる。
(第3の実施形態)
次に、本発明の第3の実施形態について説明する。第3の実施形態は、高次元の特徴量で表現される複数のデータがあり、各々のデータがそれらの中でどのような傾向にあるかを分析したい場合に人が見て直感的に判り易い表示に平行座標プロットや棒グラフを表示する方法である。第1の実施形態又は第2の実施形態で説明した方法によって、レーダチャートの軸同士の間隔や順番を決定するアルゴリズムを用いることによって、同様に平行座標プロットや棒グラフの項目の順番と間隔を決定することができる。また、レーダチャートでは円形状になるように軸を配することができたため、平行座標プロットや棒グラフでもn個の項目にてグラフを生成する際、末端であるn個目の項目の隣に1個目の項目からのグラフをさらに描画しても良い。
(本発明の他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、前述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
例えば、前述した各実施形態における情報処理装置は、図11に示すようなコンピュータ機能1100を有し、そのCPU1101により各実施形態での動作が実施される。コンピュータ機能1100は、図11に示すように、CPU1101と、ROM1102と、RAM1103とを備える。また、操作部(CONS)1109のコントローラ(CONSC)1105と、LCD等の表示部としてのディスプレイ(DISP)1110のディスプレイコントローラ(DISPC)1106とを備える。さらに、ハードディスク(HD)1111、及びフレキシブルディスク等の記憶デバイス(STD)1112のコントローラ(DCONT)1107と、ネットワークインタフェースカード(NIC)1108とを備える。それら機能部1101、1102、1103、1105、1106、1107、1108は、システムバス1104を介して互いに通信可能に接続された構成としている。
CPU1101は、ROM1102又はHD1111に記憶されたソフトウェア、又はSTD1112より供給されるソフトウェアを実行することで、システムバス1104に接続された各構成部を総括的に制御する。すなわち、CPU1101は、前述したような動作を行うための処理プログラムを、ROM1102、HD1111、又はSTD1112から読み出して実行することで、各実施形態での動作を実現するための制御を行う。RAM1103は、CPU1101の主メモリ又はワークエリア等として機能する。
CONSC1105は、CONS1109からの指示入力を制御する。DISPC1106は、DISP1110の表示を制御する。DCONT1107は、ブートプログラム、種々のアプリケーション、ユーザファイル、ネットワーク管理プログラム、及び各実施形態における動作を実現するための処理プログラム等を記憶するHD1111及びSTD1112とのアクセスを制御する。NIC1108はネットワーク1113上の他の装置と双方向にデータをやりとりする。
なお、前記実施形態は、何れも本発明を実施するにあたっての具体化のほんの一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
101:多変量データ入力部 102:特徴量間距離算出部 103:次元削減部 104:データ可視化パラメータ入力部 105:出力部 106:チャート形状決定部 107:多変量データ追加入力部 108:チャート形状記憶部

Claims (7)

  1. 画像中の所定個の特徴量間の類似度を算出する算出手段と、
    前記所定個の特徴量の各々について、自身及び他の特徴量との前記類似度を要素とするベクトルを生成し、前記特徴量間の類似度に基づいて前記ベクトルに対応する点が原点から等距離に並ぶように当該ベクトルの次元数を削減する次元削減手段と、
    前記特徴量間の類似度を基に、前記所定個の特徴量のそれぞれに対応する軸の配置を決定する形状決定手段と、
    前記形状決定手段により決定した軸の配置に従って前記画像から抽出した特徴量を描画した図を出力する出力手段とを有することを特徴とする情報処理装置。
  2. 前記算出手段は、前記画像に含まれる各特徴量が示すデータの分布を基に前記特徴量間の類似度を算出することを特徴とする請求項1記載の情報処理装置。
  3. 前記形状決定手段は、前記所定個の特徴量のそれぞれに対応する軸を、前記特徴量間の類似度に応じた角度をなすように配置することを特徴とする請求項1又は2記載の情報処理装置。
  4. 前記所定個の特徴量のそれぞれに対応する軸の配置をユーザからの入力に応じて変更することを特徴とする請求項1〜3の何れか1項に記載の情報処理装置。
  5. 前記特徴量間の類似度が所定の値よりも高い特徴量に対応する軸を1つにまとめて配置することを特徴とする請求項1〜4の何れか1項に記載の情報処理装置。
  6. 画像中の所定個の特徴量間の類似度を算出する算出工程と、
    前記所定個の特徴量の各々について、自身及び他の特徴量との前記類似度を要素とするベクトルを生成し、前記特徴量間の類似度に基づいて前記ベクトルに対応する点が原点から等距離に並ぶように当該ベクトルの次元数を削減する次元削減工程と、
    前記特徴量間の類似度を基に、前記所定個の特徴量のそれぞれに対応する軸の配置を決定する形状決定工程と、
    決定した軸の配置に従って前記画像から抽出した特徴量を描画した図を出力する出力工程とを有することを特徴とする情報処理方法。
  7. 画像中の所定個の特徴量間の類似度を算出する算出ステップと、
    前記所定個の特徴量の各々について、自身及び他の特徴量との前記類似度を要素とするベクトルを生成し、前記特徴量間の類似度に基づいて前記ベクトルに対応する点が原点から等距離に並ぶように当該ベクトルの次元数を削減する次元削減ステップと、
    前記特徴量間の類似度を基に、前記所定個の特徴量のそれぞれに対応する軸の配置を決定する形状決定ステップと、
    決定した軸の配置に従って前記画像から抽出した特徴量を描画した図を出力する出力ステップとをコンピュータに実行させるためのプログラム。
JP2015006910A 2015-01-16 2015-01-16 情報処理装置、情報処理方法、及びプログラム Active JP6602013B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015006910A JP6602013B2 (ja) 2015-01-16 2015-01-16 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015006910A JP6602013B2 (ja) 2015-01-16 2015-01-16 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016133899A JP2016133899A (ja) 2016-07-25
JP6602013B2 true JP6602013B2 (ja) 2019-11-06

Family

ID=56438119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015006910A Active JP6602013B2 (ja) 2015-01-16 2015-01-16 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6602013B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220055503A (ko) * 2020-09-25 2022-05-04 주식회사 디쓰리디 원단의 물성 측정 시스템 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6736450B2 (ja) * 2016-10-25 2020-08-05 株式会社日立製作所 データ分析支援装置及びデータ分析支援システム
CN111780936A (zh) * 2020-05-22 2020-10-16 广东省建筑科学研究院集团股份有限公司 一种桥梁多参数融合可视化监测方法
JP7189277B1 (ja) 2021-06-17 2022-12-13 ヤフー株式会社 提供装置、提供方法、および提供プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003869A (ja) * 2006-06-22 2008-01-10 Matsushita Electric Ind Co Ltd 検索装置
JP5436871B2 (ja) * 2009-01-16 2014-03-05 Kddi株式会社 楽曲可視化装置、楽曲可視化方法および楽曲可視化プログラム
JP2010250022A (ja) * 2009-04-14 2010-11-04 Shunji Nishikawa 経営戦略シミュレーションゲームシステム及びそのプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220055503A (ko) * 2020-09-25 2022-05-04 주식회사 디쓰리디 원단의 물성 측정 시스템 및 방법
KR102496992B1 (ko) 2020-09-25 2023-02-07 주식회사 디쓰리디 원단의 물성 측정 시스템 및 방법

Also Published As

Publication number Publication date
JP2016133899A (ja) 2016-07-25

Similar Documents

Publication Publication Date Title
JP6555061B2 (ja) クラスタリングプログラム、クラスタリング方法、および情報処理装置
US9342579B2 (en) Visual analysis of multidimensional clusters
JP6602013B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6654119B2 (ja) プラントデータ表示処理装置及びプラント制御システム
JP2018142097A (ja) 情報処理装置、情報処理方法及びプログラム
JP6737884B2 (ja) 臨床データの特性を解析して患者コホートを生成するためのパターン発見視覚的解析システム
Cho et al. Stroscope: Multi-scale visualization of irregularly measured time-series data
WO2018163488A1 (ja) プラントデータ分類装置、プラントデータ表示処理装置及びプラント制御システム
JP2019036186A (ja) 異常検知モデル構築装置、異常検知モデル構築方法及びプログラム
Tam et al. Visualization of time‐series data in parameter space for understanding facial dynamics
US7420561B2 (en) Diagnostic visual tools and methods for graphical comparison of data point and historical data density
KR102054500B1 (ko) 설계 도면 제공 방법
JP5746480B2 (ja) 解析結果表示装置および解析結果表示方法
US20240169105A1 (en) Layout simulation device and layout simulation method
Burch Dynamic graph visualization with multiple visual metaphors
JP6529688B2 (ja) 選択装置、選択方法、および選択プログラム
US20220130135A1 (en) Data generation method, data generation device, and program
Costa Topological data analysis and applications
JP6993081B2 (ja) 支援装置および支援方法
JP7309134B2 (ja) 可視化方法、これに用いるプログラム、および、可視化装置、並びに、これを備える判別装置
JP7052914B1 (ja) 異常診断システム、異常診断装置、異常診断方法、及びプログラム
WO2022269815A1 (ja) 可視化表示装置、可視化表示方法および可視化表示プログラム
EP3608742B1 (en) Apparatus for alarm information determination
Elen et al. Automatic detection of petiole border in plant leaves
JP2021131578A (ja) 情報表示システム、情報表示方法及び情報表示プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191008

R151 Written notification of patent or utility model registration

Ref document number: 6602013

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151