JP2017076287A - データ解析装置、データ解析方法及びプログラム - Google Patents

データ解析装置、データ解析方法及びプログラム Download PDF

Info

Publication number
JP2017076287A
JP2017076287A JP2015204016A JP2015204016A JP2017076287A JP 2017076287 A JP2017076287 A JP 2017076287A JP 2015204016 A JP2015204016 A JP 2015204016A JP 2015204016 A JP2015204016 A JP 2015204016A JP 2017076287 A JP2017076287 A JP 2017076287A
Authority
JP
Japan
Prior art keywords
data
likelihood
input data
label
presentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015204016A
Other languages
English (en)
Other versions
JP6679266B2 (ja
Inventor
大佑 和泉
Daisuke Izumi
大佑 和泉
裕輔 御手洗
Hirosuke Mitarai
裕輔 御手洗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015204016A priority Critical patent/JP6679266B2/ja
Priority to US15/290,573 priority patent/US20170109427A1/en
Publication of JP2017076287A publication Critical patent/JP2017076287A/ja
Application granted granted Critical
Publication of JP6679266B2 publication Critical patent/JP6679266B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】4次元以上の特徴量を用いた場合においても、データの属性情報を提示することができるデータ解析装置、データ解析方法及びプログラムを提供することを課題とする。【解決手段】データ解析装置は、複数の入力データから特徴量をそれぞれ抽出する特徴量抽出手段(201)と、前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出手段(203)と、前記特徴量と前記尤度に基づいて、前記入力データの属性情報を提示する提示手段(206)とを有することを特徴とする。【選択図】図2

Description

本発明は、データ解析装置、データ解析方法及びプログラムに関する。
特許文献1では、複数種類の欠陥を分類する識別基準の算出にニューラルネットワークを利用している。特許文献1では、ユーザが決定した2つの特徴量によって構成される空間で、欠陥の種類を教示するデータを自動で抽出し、抽出したデータに対して、ユーザが欠陥種類を教示し、識別基準を更新する。
特開2010−54346号公報
特許文献1では、少数の欠陥種類のラベルが付与されたデータから識別基準を算出し、ユーザが決定した2つの特徴量で構成する特徴空間のデータ分布と、その特徴空間における欠陥を分類する識別基準をユーザに提示する。しかし、ユーザに提示した場合に、ユーザが理解できる空間は3次元までである。そのため、4つ以上の特徴量を用いて、識別基準を算出した場合は、特徴空間におけるデータの分布を表示することができないという課題がある。
本発明の目的は、4次元以上の特徴量を用いた場合においても、データの属性情報を提示することができるデータ解析装置、データ解析方法及びプログラムを提供することである。
本発明のデータ解析装置は、複数の入力データから特徴量をそれぞれ抽出する特徴量抽出手段と、前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出手段と、前記特徴量と前記尤度に基づいて、前記入力データの属性情報を提示する提示手段とを有することを特徴とする。
本発明によれば、4次元以上の特徴量を用いた場合においても、データの属性情報を提示することができる。
本発明の第1の実施形態による提示結果の一例を示す図である。 本発明の第1の実施形態によるデータ解析装置の構成例を示す図である。 本発明の第1の実施形態による処理方法を示すフローチャートである。 本発明の第1の実施形態による入力データの記録方法を示す図である。 本発明の第1の実施形態による尤度の記録方法を示す図である。 本発明の第2の実施形態によるデータ解析装置の構成例を示す図である。 本発明の第2の実施形態による処理方法を示すフローチャートである。 本発明の第2の実施形態によるクラスタリング結果を示す図である。 本発明の第3の実施形態によるデータ解析装置の構成例を示す図である。 本発明の第3の実施形態による処理方法を示すフローチャートである。 本発明の第3の実施形態によるクラスタリングを示す図である。
(第1の実施形態)
本発明の第1の実施形態では、特定の検査対象物体を撮影し、その撮影した画像に基づいて検査対象物体が正常であるか否かを識別する。本実施形態では、画像から正常と異常を識別する要素となる特徴量を算出し、複数の正常画像と複数の異常画像のそれぞれから算出した特徴量に基づいて、正常と異常を識別する基準となる正常らしさを表す尤度を算出する。
ここで、特徴空間上でのデータ分布の可視化の際、特徴空間上でのデータ分布のみの可視化では、識別基準となるデータの尤度が考慮されない。そのため、可視化結果で近傍にある2つのデータの尤度が全く異なる可能性があるにも関わらず、ユーザは可視化結果で近傍にあるデータは近い尤度を持つと誤って判断する可能性がある。そこで、本実施形態では、特徴空間上での距離関係に加え、尤度を考慮した可視化を行う。これにより、特徴空間上でのデータ分布と、識別基準による識別性能を同時に表現することが可能となる。
図1は、本発明の第1の実施形態によるデータ解析装置の提示結果の例を示す図である。データ解析装置は、複数の特徴量によって構成される特徴空間におけるデータの分布と、正常と異常の識別基準となる尤度を同時に可視化することを目的とする。図1では、可視化空間の軸105と可視化空間の軸106は、可視化した結果を表示するための基底を表す。この基底の詳細については、後述する。そして、各データ間の距離は、特徴空間上での位置関係を反映しており、等高線103は、尤度が同じである位置座標を示している。データ解析装置は、図1のように表示することで、正常データ100と異常データ101の特徴空間上での位置関係と、尤度を同時に表現することができる。特許文献1は、特徴空間とその空間上での分類基準を表示するため、特徴空間が、そのまま提示可能な次元数を超えた場合に、表示できない。
図2は、本実施形態によるデータ解析装置の構成例を示す図である。データ解析装置は、データ記録部200、特徴量抽出部201、識別モデル学習部202、尤度算出部203、尤度記録部204、データ解析処理部205、及び提示部206を有する。
図3は、本実施形態によるデータ解析装置のデータ解析方法を示すフローチャートである。まず、ステップS300では、データ記録部200は、図4に示すように、正常な検査対象物体と異常な検査対象物体を撮影した複数の画像データを画像番号に対応付けて保持する。その際、データ記録部200は、正常な検査対象物体を撮影した画像であることを示す正常ラベルと、異常な検査対象物体を撮影した画像であることを示す異常ラベルを各画像データに対応付けて保持する。特徴量抽出部201は、特徴量抽出手段であり、データ記録部200から画像データを入力データとして読み出す。本実施形態では、画像を例に説明するが、正常な検査対象物体と異常な検査対象物体で異なる傾向を持つデータであれば、音響データやその他のセンサにより得られるデータを用いてもよい。
次に、ステップS301では、特徴量抽出部201は、データ記録部200に保持されている全ての画像データから、正常と異常を識別する要素となる特徴量をそれぞれ算出する。特徴量としては、様々なものが挙げられるが、本実施形態では、画像の輝度値の平均、分散、歪度、尖度、最頻値、エントロピー等の統計量を用いる。その他、Co-occurrence Matrixを用いたテクスチャ特徴量や、SIFTを用いた局所特徴量などを用いることも可能である。特徴量抽出部201は、データ記録部200に保持されている全ての正常画像と異常画像に対して、N次元の特徴量をそれぞれ抽出する。
次に、ステップS302では、識別モデル学習部202は、識別モデル学習手段であり、事前に与えられた正常データと異常データを分離するための識別モデルと、特徴量抽出部201によって算出された特徴量を用いて、識別モデルのパラメータを算出する。すなわち、識別モデル学習部202は、特徴量を用いて、複数の画像データの各々が正常ラベル及び異常ラベルのうちのいずれに属するかを識別する識別モデルの学習(生成)を行う。本実施形態では、この識別モデルとして、マハラノビス距離を用いる。識別モデル学習部202は、データ記録部200に保持されている正常ラベルの画像から抽出された特徴量を用いて平均と分散共分散行列を求める。これにより、任意の画像から抽出した特徴量を用いて算出したマハラノビス距離が小さいほど、正常画像であると識別することができる。反対に、マハラノビス距離が大きいほど、異常画像であると識別することができる。ここで、特徴量抽出部201がデータ記録部200に保持されている画像から抽出したN次元特徴量をci(iは画像番号)とし、正常ラベルの画像から抽出された特徴量のみを用いて算出した平均値と分散共分散行列をそれぞれμとσとする。識別モデル学習部202は、平均値μと分散共分散行列σを識別モデルパラメータとして算出する。なお、本実施形態では、識別モデルとしてマハラノビス距離を利用したが、正常と異常を識別可能な識別モデルであれば、One-class SVMやk-Nearest Neighborなどを用いてもよい。
次に、ステップS303では、尤度算出部203は、尤度算出手段であり、識別モデル学習部202により算出された識別モデルを用いて、データ記録部200に保持されている画像が、どの程度正常らしいかを表す尤度L(ci)を算出する。具体的には、まず、尤度算出部203は、次式(1)に示すように、識別モデル学習部202により算出された正常画像の平均値μと分散共分散行列σを用いて、N次元特徴量ciに対するマハラノビス距離D(ci)を算出する。ここで、Tは行列の転置を表し、σ-1は分散共分散行列σの逆行列を表す。
Figure 2017076287
次に、尤度算出部203は、次式(2)に示すように、マハラノビス距離D(ci)を用いて尤度L(ci)を算出する。ここで、Zは正規化係数を表す。すなわち、尤度算出部203は、第1のラベルである正常ラベルに属するデータの特徴量の平均値μと特徴量ciを用いて、複数のデータの各々が第1のラベルである正常ラベルに属することの尤度L(ci)を算出する。
Figure 2017076287
次に、尤度記録部204は、図5に示すように、特徴量抽出部201により算出された特徴量ciに対して算出した尤度L(ci)を、図4のデータ記録部200の画像番号に関連付けて保持する。尤度記録部204は、尤度L(ci)をデータ記録部200とは別に保持しているが、特徴量ciと尤度L(ci)の関係を対応付けて保持していれば、どのように記録してもよい。
次に、ステップS304では、データ解析処理部205は、データ解析処理手段であり、特徴量ciと尤度L(ci)が3次元より多い次元のデータである場合には、次元を削減し、3次元以下の空間上での位置座標を算出する。具体的には、データ解析処理部205は、特徴空間上でのデータ間の関係と識別基準の尤度L(ci)を同時に可視化するために、複数のデータの各々の可視化空間上での位置座標を算出する。例えば、データ解析処理部205は、特徴量抽出部201により算出された特徴量ciと、尤度記録部204に保持されている尤度L(ci)を結合した統合ベクトルui=[ci,L(ci)]を用いて、可視化空間上でのデータの位置座標を算出する。
例えば、データ解析処理部205は、次式(3)に示すストレスと呼ばれる指標Sが最小になるように可視化する。
Figure 2017076287
ここで、Mは可視化するデータ数を表す。d1ijは、次式(4)に示すように、可視化した空間におけるi番目のデータとj番目のデータの間の距離を表す。
Figure 2017076287
データ解析処理部205は、図1に示すように、可視化空間を2次元とし、可視化空間におけるi番目のデータとj番目のデータの間の距離d1ijは、ユークリッド距離で算出する。ここで、可視化空間におけるi番目のデータの座標がvi=[xi,yiTであり、j番目のデータの座標がvj=[xj,yjTである。この場合、可視化空間の軸105がxi及びxjの位置であり、可視化空間の軸106がyi及びyjの位置である。
また、dijは、i番目のデータとj番目のデータの間の非類似度を表す。非類似度dijは、一般的に、特徴空間上での位置関係を用いて算出するため、i番目のデータの特徴量ciと、j番目のデータの特徴量cjを用いて算出する。しかし、特徴空間上での位置関係のみを用いて非類似度dijを算出した場合、可視化空間に表現されるデータ間の位置関係に識別基準の尤度L(ci)が反映されない。そこで、データ解析処理部205は、非類似度dijの算出の際に、識別基準の尤度L(ci)を考慮した算出を行う。本実施形態では、データ解析処理部205は、次式(5)に示すように、尤度L(ci)と特徴量ciを統合した統合ベクトルui=[ci,L(ci)]を用いて、ユークリッド距離により非類似度dijを算出する。
Figure 2017076287
以上のように、データ解析処理部205は、上式(3)の指標Sが最小になるように、可視化空間でのデータの座標vi及びvjを算出する。すなわち、データ解析処理部205は、特徴量ciと尤度L(ci)についての2個のデータの間の距離と、空間上での2個のデータの位置座標の間の距離との誤差が最小になるように、複数のデータの各々の位置座標vi及びvjを算出する。この際、データ解析処理部205は、統合ベクトルui及びujを用いてデータ間の非類似度dijを算出することにより、可視化空間におけるデータ間の位置関係に、識別基準の尤度L(ci)によるデータ間の位置関係も同時に反映されることができる。
なお、本実施形態では、2つのデータ間の可視化空間での距離d1ijと、非類似度dijをユークリッド距離を用いて算出したが、2つのデータ間の関係を定義できれば、マハラノビス距離、市街地距離、又はピアソン距離を用いてもよい。また、上式(3)の指標Sは、他の指標を用いてもよい。
また、本実施形態では、統合ベクトルui及びujを用いることにより、識別基準の尤度L(ci)による影響を可視化空間でのデータ間の位置関係に反映したが、これに限定されない。上式(3)の指標Sが識別基準の尤度L(ci)による影響を与えるような指標になるようにしてもよい。その場合、例えば、上式(3)の指標Sの代わりに、次式(6)の指標S1を用いてもよい。
Figure 2017076287
ここで、d2ijは、2つのデータの特徴量ciとcjの間の非類似度であり、ui=ciとした場合の非類似度dijに等しい。pijは、2つのデータの尤度L(ci)と尤度L(cj)の間の非類似度であり、pij={L(ci)−L(cj)}2により求める。非類似度d2ij及びpijは、マハラノビス距離やピアソン距離などを用いて算出することができる。また、αは、特徴空間上での非類似度とマハラノビス距離による非類似度による影響の強さを決定するパラメータである。αが0に近くなるほど、尤度L(ci)及びL(cj)による影響が小さくなり、特徴空間上での非類似度d2ijが保たれる。これに対し、αが大きくなるほど、尤度L(ci)及びL(cj)による非類似度pijが保たれた可視化空間となる。
本実施形態では、上記の方法により可視化空間におけるデータの位置関係を決定したが、これに限定されない。次元削減が可能な方法であれば、Principal Component AnalysisやFisher's Discriminant Analysisなどの方法を用いてもよい。
次に、ステップS305では、提示部206は、提示手段であり、データ解析処理部205により算出された可視化空間でのデータの座標viを用いて、データの位置関係と識別基準の尤度L(ci)を含む属性情報を提示する。具体的には、提示部206は、図1に示すように、正常データ100と異常データ101の各々の2次元空間上での位置座標の位置を表示する。また、提示部206は、識別基準となる尤度L(ci)が同じである位置座標に等高線103を表示する。
提示部206は、図1の等高線103を表示するためには、尤度L(ci)が等しい点をつなぐ必要がある。ここで、データ解析処理部205により算出されたデータ点の座標viは、等間隔に存在するわけではないため、提示部206は、尤度L(ci)が等しい点を補間する必要がある。そこで、提示部206は、データ解析処理部205により算出されたデータ点の座標viの尤度L(ci)を用いて、3次内挿補間により尤度L(ci)の補間を行い、可視化空間における尤度L(ci)が等しい点をつなぐことで、図1の等高線103を表示する。なお、本実施形態では、3次内挿補間により、可視化空間の尤度L(ci)が等しい点を補間したが、そのような補間ができれば、線形補間などを用いてもよい。
以上のように、本実施形態によれば、正常と異常の識別基準である尤度L(ci)と、正常と異常の識別の要素となる情報である特徴量を同時に表現することが可能となる。なお、本実施形態では、1クラス識別問題による正常と異常を識別する例を示したが、2クラス以上の識別問題にも適用可能である。例えば、多クラス識別問題の場合、尤度L(ci)は全てのクラスに対して算出される。そのため、統合ベクトルuiは、全てのクラスへの尤度L1(ci)〜Ln(ci)を結合し、ui=[ci,L1(ci),L2(ci),・・・,Ln(ci)]とすることで実現できる。また、尤度による制約を加える場合、ユークリッド距離、マハラノビス距離、又はピアソン距離などを用いて、尤度ベクトル間の非類似度を演算すればよい。
(第2の実施形態)
本発明の第2の実施形態によるデータ解析装置について説明する。第1の実施形態では、データ解析装置は、対象のデータから特徴量ciを抽出し、抽出した特徴量ciを用いて正常と異常を識別する識別モデルの学習を行った。本実施形態では、入力データ中に、あらかじめ与えられた正常と異常のラベルの信頼性が低いデータを含んでいる場合を想定する。識別モデルの学習に、誤ったラベルのデータを利用した場合、正常と異常の識別境界が適切に求められず、識別精度が低下する可能性がある。そこで、あらかじめ与えられたラベルをユーザが修正し、適切なラベルを付与し直す。付与し直したラベルを用いて識別モデルの学習を行うことで、より識別性能の高い識別モデルの学習を行うことができる。
そこで、本実施形態では、特徴量ciと尤度L(ci)を用いて、ラベルが誤っている可能性のあるデータをユーザに提示し、適切なラベルの付与を促す。このとき、ラベルが誤っている可能性のあるデータのみではなく、その他のラベル修正に参考となるデータもユーザに提示することで、適切なラベルの付与が可能となる。本実施形態では、正常ラベルと異常ラベルの2種類で行うが、それ以外の複数のラベルが付与されている場合にも適用可能である。以下、本実施形態が第1の実施形態と異なる点を説明する。
図6は、本発明の第2の実施形態によるデータ解析装置の構成例を示す図である。データ解析装置は、データ記録部200、特徴量抽出部201、識別モデル学習部202、尤度算出部203、尤度記録部204、クラスタリング部905、提示データ決定部906、表示部907、及びラベル修正部908を有する。データ記録部200、特徴量抽出部201、識別モデル学習部202、尤度算出部203、及び尤度記録部204は、第1の実施形態(図2)と同様である。
図7は、本実施形態によるデータ解析装置のデータ解析方法を示すフローチャートである。ステップS300〜S303では、データ解析装置は、第1の実施形態(図3)と同様の処理を行う。すなわち、ステップS300では、特徴量抽出部201は、データ記録部200に保持されているデータを入力する。次に、ステップS301では、特徴量抽出部201は、データ記録部200に保持されているデータに対して、特徴量ciを算出する。次に、ステップS302では、識別モデル学習部202は、その算出した特徴量ciを用いて、正常と異常を識別する識別モデルを学習する。次に、ステップS303では、尤度算出部203は、その識別モデルを用いて、 特徴量抽出部201により算出された特徴量ciに対して、尤度L(ci)を算出する。尤度記録部204は、その尤度L(ci)を保持する。
次に、ステップS1004では、クラスタリング部905は、クラスタリング手段であり、図2のデータ解析処理部205と同様に、特徴量ciと尤度L(ci)に基づいて、複数のデータの各々の空間上での位置座標を算出する。次に、クラスタリング部905は、特徴量抽出部901により算出された特徴量ciと、尤度記録部904に保持されている尤度L(ci)を用いて、データのクラスタリングを行う。例えば、クラスタリング部905は、予め決められたk個のクラスタB1〜Bkに複数のデータを分類する。具体的には、クラスタリング部905は、次式(7)に示すように、クラスタBiの重心wiと、クラスタBiに含まれる統合ベクトルujとの誤差が最小となるように、全てのデータが属するクラスタB1〜Bkを決定する。
Figure 2017076287
ここで、統合ベクトルujは、第1の実施形態と同様に、特徴量cjと尤度L(cj)を結合したベクトルであり、uj=[cj,L(cj)]である。これにより、クラスタリング結果に、特徴量cjと識別モデルによる尤度L(cj)を反映させることができる。
なお、クラスタ数kは、予めユーザが決定しておいてもよいし、第1の実施形態のようにデータを表示し、ユーザに入力させてもよい。また、クラスタ数をBayesian Information Criterion(BIC)基準に基づいて決定するx-means手法や、その他の方法で決定してもよい。また、上記のクラスタリング方法の他、階層的クラスタリング方法など、他の方法を用いてもよい。
次に、ステップS1005〜S1007では、提示データ決定部906は、提示データ決定手段であり、クラスタリング部905により算出されたクラスタB1〜Bkを用いて、ユーザにラベルを再確認してもらうデータを決定する。まず、ステップS1005では、提示データ決定部906は、ラベル確認候補として、ラベルの信頼度が低いデータを抽出する。提示データ決定部906は、低信頼データを抽出するために、クラスタリング結果の各クラスタB1〜Bkが、どのようなデータを含むクラスタか決定する必要がある。そこで、提示データ決定部906は、各クラスタB1〜Bk内に最も多く含まれるラベルを、そのクラスタのラベルとして割り当てる。そして、提示データ決定部906は、各クラスタB1〜Bkに割り当てられたラベルと異なるラベルを持つデータを低信頼度データとして抽出する。
図8は、クラスタリング結果の例を示す図である。クラスタリング部905は、例えば、複数のデータを複数のクラスタ1100〜1103に分類する。提示データ決定部906は、例えば、正常データ100が多いクラスタ1100には正常ラベルを割り当て、異常データ101が多いクラスタ1101、クラスタ1102及びクラスタ1103には異常ラベルを割り当てる。このとき、正常ラベルのクラスタ1100には、少数の異常データ1104が含まれている。提示データ決定部906は、このような少数の異常データ1104をラベル確認候補として抽出する。すなわち、提示データ決定部906は、クラスタ1100に属するデータのうちで他の正常ラベルに対してデータの数が少ない異常ラベルに属するデータ1104をラベル確認候補として抽出する。
次に、ステップS1006では、提示データ決定部906は、ステップS1005で抽出されたラベル確認候補があるか否かを判定し、ラベル確認候補がある場合にはステップS1007に処理を進める。これに対し、提示データ決定部906は、ラベル確認候補がない場合には、ステップS1010に処理を進め、図7の処理を終了する。
ステップS1007では、提示データ決定部906は、ステップS1005でラベル確認候補として抽出された異常データ1104を、提示データとして決定する。ここで、ユーザに異常データ1104のみを提示しても、ユーザは、どのラベルを異常データ1104に付与すべきか判断することが難しい。そこで、ラベル確認候補である異常データ1104に加えて、現在のクラスタに属するデータや、周囲のクラスタに属するデータも同時に提示することが必要となる。例えば、提示データ決定部906は、異常データ1104の近傍に位置する正常データ1105や、異常データ1104が属するクラスタ1100の近傍に位置する異常ラベルのクラスタ1103に属する異常データ1106等を、提示データとして決定する。
提示データ決定部906は、近傍データの探索において、特徴空間における近傍のデータを探索するのではなく、特徴空間と尤度を考慮して近傍にあるデータを探索することで、学習した識別モデルが近傍にあると判定しているデータを提示することができる。ラベル確認候補の異常データ1104と共に、近傍データを提示することにより、ユーザにより適切なラベルの入力を促すことが可能となる。
次に、ステップS1008では、表示部907は、提示部であり、提示データ決定部906により決定されたラベル確認候補のデータを含む提示データの空間上での位置座標の位置をユーザに表示(提示)する。
次に、ステップS1009では、ラベル修正部908は、ラベル修正手段であり、ユーザが表示部907の表示に基づいてラベルの再判定を行い、ユーザの指示に基づいてラベル確認候補のデータのラベルの修正を行う。ラベル修正部908は、表示部907により表示された提示データが属するラベルの修正が指示されると、提示データが属するラベルを修正する。
その後、データ解析装置は、その修正されたラベルを用いて、ステップS302からの処理を繰り返す。ステップS302では、識別モデル学習部202は、ラベル修正部908により修正されたラベルの提示データを含むデータを用いて、識別モデルの再学習を行うことにより、より適切な識別モデルの学習を行うことができる。
以上のように、本実施形態によれば、識別基準の尤度L(ci)を考慮してラベルの信頼度が低いデータを抽出し、ユーザにラベル確認候補を提示することができる。
(第3の実施形態)
本発明の第3の実施形態によるデータ解析装置について説明する。第1の実施形態では、データ解析装置は、対象のデータから特徴量ciを抽出し、その抽出した特徴量ciを用いて正常と異常を識別する識別モデルの学習を行った。そして、データ解析装置は、識別モデルを用いてデータの尤度L(ci)を算出し、特徴空間におけるデータ分布と尤度L(ci)の等高線103を同時に表示した。本実施形態では、入力データに付与されたラベルは信頼できるが、データ数が十分ではない場合を想定する。例えば、異常データ中に、複数種類の異常パターンが存在するような状態である。異常データに複数種類の異常パターンがある場合、ある異常パターンのデータ数は十分にあるが、別の異常パターンではデータ数が極端に少ないといった場合がある。このような場合には、データ数が少ない異常パターンは、識別性能が低下する。
そこで、本実施形態では、データ解析装置は、特徴空間のデータ分布と尤度L(ci)を用いて、識別性能の向上に必要なデータの追加をユーザに促す。データ解析装置は、図1に示すように、ユーザが可視化された結果から、正常データに近い異常データ104を選択し、追加すべきデータを確認することができる。また、データ解析装置は、ユーザの選択を必要とせずに、追加データと、そのデータの傾向を表示することができる。以下、本実施形態が第2の実施形態と異なる点を説明する。
図9は、本発明の第3の実施形態によるデータ解析装置の構成例を示す図である。図9のデータ解析装置は、図6のデータ解析装置に対し、ラベル修正部908の代わりに、追加データ入力部608及び追加データ記録部609を設けたものである。
図10は、本実施形態によるデータ解析装置のデータ解析方法を示すフローチャートである。ステップS300〜S303及びS1004では、データ解析装置は、第2の実施形態(図7)と同様の処理を行う。すなわち、ステップS300では、特徴量抽出部201は、データ記録部200に保持されているデータを入力する。次に、ステップS301では、特徴量抽出部201は、データ記録部200に保持されているデータに対して、特徴量ciを算出する。次に、ステップS302では、識別モデル学習部202は、その算出した特徴量ciを用いて、正常と異常を識別する識別モデルを学習する。次に、ステップS303では、尤度算出部203は、その識別モデルを用いて、 特徴量抽出部201により算出された特徴量ciに対して、尤度L(ci)を算出する。尤度記録部204は、その尤度L(ci)を保持する。次に、ステップS1004では、クラスタリング部905は、尤度L(ci)と特徴量ciを用いて、データのクラスタリングにより、k個のクラスタB1〜Bkに複数のデータを分類する。
次に、ステップS705では、提示データ決定部906は、各クラスタB1〜Bk内に最も多く含まれるラベルを、そのクラスタのラベルとして割り当てる。そして、提示データ決定部906は、クラスタリング部905によるクラスタリングの結果から、識別モデルの学習にデータが不足しているクラスタを決定する。そして、提示データ決定部906は、データが不足しているクラスタの中から、データ不足クラスタの類似データとしてユーザに提示するデータを決定する。
図11(a)は、クラスタリング結果の例を示す図である。クラスタリング部905は、例えば、クラスタ800〜803に複数のデータを分類する。提示データ決定部906は、例えば、正常データ100が多いクラスタ800には正常ラベルを割り当て、異常データ101が多いクラスタ801、クラスタ802及びクラスタ803には異常ラベルを割り当てる。
提示データ決定部906は、識別モデルの学習にデータが不足しているクラスタを決定する。例えば、提示データ決定部906は、正常ラベルが割り当てられたクラスタ800であって、かつ異常データ804を有するクラスタ800をデータ不足クラスタとして決定する。このようなクラスタ800では、正常と異常の識別ができておらず、識別精度が低下する要因となっている異常データ804が存在する。クラスタ800は、多数の正常データ100と少数の異常データ804を有する。正常ラベルが割り当てられたクラスタ800に分類された異常データ804は、識別性能の低下要因となっているデータである。提示データ決定部906は、その異常データ804が属するクラスタ800を、データ不足クラスタとして決定する。
提示データ決定部906は、データが不足しているクラスタを決定するためには、多数の正常データ100が属する正常データクラスタ800を設定する必要がある。そこで、提示データ決定部906は、正常データ100が最も多く所属するクラスタ800を正常クラスタと判定する。本実施形態では、正常クラスタは、全クラスタ中に1つであると仮定している。しかし、正常クラスタが2つ以上存在するような場合もある。そのような場合は、2つ以上の正常クラスタを設定しても構わない。例えば、全正常データの総数の8割以上のうちで、正常データが属する数が多いクラスタを正常クラスタと判定してもよい。
次に、提示データ決定部906は、正常クラスタ800に属する異常データ804を抽出する。すなわち、提示データ決定部906は、クラスタ800に属するデータのうちで他の正常ラベルに対してデータの数が少ない異常ラベルに属するデータ804を抽出する。そして、提示データ決定部906は、この抽出した異常データ804が属する正常クラスタ800を、データ不足クラスタとして決定する。
次に、ステップS706では、提示データ決定部906は、データ不足クラスタがない場合は、ステップS710で処理を終了し、データ不足クラスタが存在する場合は、ステップS707に処理を進める。
ステップS707では、提示データ決定部906は、ステップS705で抽出された異常データ804を提示データとして決定する。ステップS705で抽出された異常データ804は、正常クラスタ800に属すると判定されたデータである。そのため、異常データ804は、正常データとの差異が小さい。正常データとの差異が小さい異常データ804をユーザに提示しても、どのようなデータが追加データとして適切であるかを、ユーザが判断することは難しい。ユーザに対して、追加データの傾向を適切に提示するためには、より正常クラスタ800から離れた場合のデータを示し、どのような差異があるかが明確にわかるデータを同時に提示する必要がある。ユーザが差異を判断しやすいデータを、異常データ804と共に提示することで、識別性能の向上に有効なデータの追加を、ユーザに促すことが可能となる。
提示データとしては、抽出した異常データ804と同じ異常パターンであって正常クラスタ800から離れた位置のデータが必要となる。そのようなデータを選択するためには、異常データ804が本来属するべきクラスタ803を決定する必要がある。そこで、提示データ決定部906は、図11(b)に示すように、図11(a)の全データから正常データを除いた異常データのクラスタリングを行い、異常データクラスタ805〜807を生成する。次に、提示データ決定部906は、抽出された異常データ804が属する異常データクラスタ807を、抽出された異常データ804が本来属するべきクラスタであると判定する。 そして、提示データ決定部906は、異常データクラスタ807に属する異常データの中から、抽出された異常データ804の他に、提示するデータを決定する。提示データとしては、異常データクラスタ807に属するデータの中で、抽出された異常データ804の近傍にある異常データ808を提示することができる。これにより、似たデータを複数提示し、追加が必要なデータの情報をより多くユーザに提示することが可能となる。また、その他の方法として、同じ異常データクラスタ807の中で、抽出された異常データ804から遠い異常データ809や、異常データクラスタ807の重心811に近い異常データ810などを、提示データとして決定することができる。ユーザにより多くの情報を提供可能なデータの選択方法であれば、どのような選択方法を用いてもよい。
また、抽出されたデータ804が属する異常データクラスタ807のみではなく、その近傍にある別の異常データクラスタ806に属するデータを提示データとして決定してもよい。この場合は、比較として、追加データが必要な異常データクラスタ807とは異なるクラスタ806のデータとして、提示データを決定する。このようなデータを提示することにより、より本来必要なデータとの差異がユーザにとって明確になる。
本実施形態では、抽出された異常データ804が本来属するべきクラスタ807を、クラスタリングによって判定した。なお、その他の方法、例えば、入力データとして正常と異常のラベル以外にもラベルが割り当てられていれば、そのラベル情報を用いて、本来属するべきクラスタを判定してもよい。
次に、ステップS708では、表示部907は、提示データ決定部606により抽出された異常データ804を含む提示データの空間上での位置座標の位置をユーザに表示(提示)し、追加データの入力を促す。
次に、ステップS709では、追加データ入力部608は、ユーザから追加データの入力を受け付ける。ここでは、表示部607により表示された異常データ804に近いデータをユーザが入力する。追加データ記録部609は、図4に示すフォーマットで、その入力されたデータを保持する。その後、データ解析装置は、ステップS301に処理を戻し、データ記録部200及び追加データ記録部609に保持されているデータを用いて、再度、識別モデルの学習を繰り返す。すなわち、表示部607の表示に基づきデータが追加されると、特徴量抽出部201は、追加された入力データから特徴量ciを抽出し、識別モデル学習部202は、追加されたデータの特徴量ciを用いて、識別モデルの学習を行う。これにより、追加データを考慮して識別モデルが学習され、より適切な識別基準の尤度L(ci)を算出することが可能となり、適切なクラスタリングが行われる。例えば、図11(b)に示すように、異常データ804が属する適切な異常データクラスタ807を生成することができる。
本実施形態では、ステップS706において、提示データ決定部906がデータ不足クラスタがないと判定するまで処理を繰り返す。また、ユーザにより追加データを入力しないことが選択された場合には、データ解析装置は、ステップS710に処理を進め、処理を終了する。
以上のように、本実施形態によれば、データの特徴量ciに加えて、識別基準となる尤度L(ci)を用いてクラスタリングを行うことにより、識別モデルによる影響を考慮して、追加データとして有効な画像データをユーザに対して提示することが可能となる。
第1〜第3の実施形態によれば、4次元以上の特徴量を用いた場合においても、特徴空間上のデータの分布と識別基準の尤度を同時に表示することができる。また、第2及び第3の実施形態によれば、特徴空間上でのデータの分布と識別基準の尤度から、識別性能の向上に有効なデータをユーザに提示することができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。コンピュータを、上述の実施形態のデータ解析装置の各手段として機能させるためのプログラムにより実現してもよい。
なお、上記実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
201 特徴量抽出部、202 識別モデル学習部、203 尤度算出部、206 提示部

Claims (13)

  1. 複数の入力データから特徴量をそれぞれ抽出する特徴量抽出手段と、
    前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出手段と、
    前記特徴量と前記尤度に基づいて、前記入力データの属性情報を提示する提示手段と
    を有することを特徴とするデータ解析装置。
  2. さらに、前記特徴量と前記尤度に基づいて、前記複数の入力データの各々の空間上での位置座標を算出するデータ解析処理手段を有し、
    前記提示手段は、前記入力データの属性情報として、前記複数の入力データの各々の空間上での位置座標の位置を表示することを特徴とする請求項1記載のデータ解析装置。
  3. 前記データ解析処理手段は、前記特徴量と前記尤度が3次元より多い次元のデータである場合には、次元を削減し、3次元以下の空間上での位置座標を算出することを特徴とする請求項2記載のデータ解析装置。
  4. 前記データ解析処理手段は、前記特徴量と前記尤度についての2個の前記入力データの間の距離と、前記空間上での2個の前記入力データの位置座標の間の距離との誤差が最小になるように、前記複数の入力データの各々の位置座標を算出することを特徴とする請求項2又は3記載のデータ解析装置。
  5. 前記データ解析処理手段は、前記特徴量と前記尤度を結合したベクトルを用いて前記位置座標を算出することを特徴とする請求項4記載のデータ解析装置。
  6. 前記提示手段は、前記入力データの属性情報として、前記尤度が同じである位置座標を示す等高線を表示することを特徴とする請求項2〜5のいずれか1項に記載のデータ解析装置。
  7. 前記尤度算出手段は、第1のラベルに属する入力データの特徴量の平均値を用いて、前記複数の入力データの各々が前記第1のラベルに属することの尤度を算出することを特徴とする請求項1〜6のいずれか1項に記載のデータ解析装置。
  8. さらに、前記特徴量と前記尤度を用いて、前記複数の入力データを複数のクラスタに分類するクラスタリング手段と、
    前記クラスタに属する入力データのうちで他のラベルに対して入力データの数が少ないラベルに属する入力データを提示データとして決定する提示データ決定手段とを有し、
    前記提示手段は、前記入力データの属性情報として、前記提示データを提示することを特徴とする請求項1記載のデータ解析装置。
  9. 前記クラスタリング手段は、前記特徴量と前記尤度に基づいて、前記複数の入力データの各々の空間上での位置座標を算出し、
    前記提示手段は、前記入力データの属性情報として、前記提示データの空間上での位置座標の位置を表示することを特徴とする請求項8記載のデータ解析装置。
  10. さらに、前記提示手段により表示された提示データが属するラベルの修正が指示されると、前記提示データが属するラベルを修正するラベル修正手段と、
    前記ラベル修正手段により修正されたラベルの提示データを用いて、前記識別モデルの学習を行う識別モデル学習手段とを有することを特徴とする請求項9記載のデータ解析装置。
  11. 前記提示手段の表示に基づき入力データが追加されると、前記特徴量抽出手段は、前記追加された入力データから特徴量を抽出し、
    さらに、前記追加された入力データの特徴量を用いて、前記識別モデルの学習を行う識別モデル学習手段を有することを特徴とする請求項9記載のデータ解析装置。
  12. 特徴量抽出手段により、複数の入力データから特徴量をそれぞれ抽出する特徴量抽出ステップと、
    尤度算出手段により、前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出ステップと、
    提示手段により、前記特徴量と前記尤度に基づいて、前記入力データの属性情報を提示する提示ステップと
    を有することを特徴とするデータ解析方法。
  13. コンピュータを請求項1〜11のいずれか1項に記載のデータ解析装置の各手段として機能させるためのプログラム。
JP2015204016A 2015-10-15 2015-10-15 データ解析装置、データ解析方法及びプログラム Active JP6679266B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015204016A JP6679266B2 (ja) 2015-10-15 2015-10-15 データ解析装置、データ解析方法及びプログラム
US15/290,573 US20170109427A1 (en) 2015-10-15 2016-10-11 Information processing apparatus, information processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015204016A JP6679266B2 (ja) 2015-10-15 2015-10-15 データ解析装置、データ解析方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017076287A true JP2017076287A (ja) 2017-04-20
JP6679266B2 JP6679266B2 (ja) 2020-04-15

Family

ID=58524087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015204016A Active JP6679266B2 (ja) 2015-10-15 2015-10-15 データ解析装置、データ解析方法及びプログラム

Country Status (2)

Country Link
US (1) US20170109427A1 (ja)
JP (1) JP6679266B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256257A (zh) * 2017-06-12 2017-10-17 上海携程商务有限公司 基于业务数据的异常用户生成内容识别方法及系统
JP2019046095A (ja) * 2017-08-31 2019-03-22 キヤノン株式会社 情報処理装置、情報処理装置の制御方法及びプログラム
JP2019125206A (ja) * 2018-01-17 2019-07-25 株式会社東芝 情報処理装置、情報処理方法及びプログラム
WO2020054551A1 (ja) * 2018-09-11 2020-03-19 日本電気株式会社 情報処理装置、情報処理方法、プログラム
WO2020099986A1 (ja) * 2018-11-15 2020-05-22 株式会社半導体エネルギー研究所 コンテンツの分類方法
JP2020082304A (ja) * 2018-11-29 2020-06-04 三菱電機株式会社 びびり振動検知装置、びびり振動検知方法、びびり振動検知プログラム、及びびびり振動抑制装置
JPWO2020194961A1 (ja) * 2019-03-28 2020-10-01
JP2021105807A (ja) * 2019-12-26 2021-07-26 株式会社日立製作所 計算機システム及び業務システムの運用環境の解析方法
WO2022080126A1 (ja) * 2020-10-14 2022-04-21 日立Astemo株式会社 画像処理装置
WO2022097302A1 (ja) * 2020-11-09 2022-05-12 富士通株式会社 生成プログラム、生成方法および情報処理装置
WO2023181319A1 (ja) * 2022-03-25 2023-09-28 三菱電機株式会社 情報処理装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318846B2 (en) * 2016-12-28 2019-06-11 Ancestry.Com Operations Inc. Clustering historical images using a convolutional neural net and labeled data bootstrapping
JP7318646B2 (ja) * 2018-06-27 2023-08-01 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309485A (ja) * 2005-04-28 2006-11-09 Nec Corp 能動学習方法および能動学習システム
JP2013120441A (ja) * 2011-12-06 2013-06-17 Fuji Xerox Co Ltd 画像識別情報付与プログラム及び画像識別情報付与装置
JP2014219801A (ja) * 2013-05-07 2014-11-20 株式会社東芝 車両判別装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8739062B2 (en) * 2006-02-24 2014-05-27 Sony Corporation Graphical playlist
US7730414B2 (en) * 2006-06-30 2010-06-01 Sony Ericsson Mobile Communications Ab Graphical display
US9015633B2 (en) * 2007-10-22 2015-04-21 Sony Corporation Data management apparatus and method for organizing data elements into multiple categories for display
US8386401B2 (en) * 2008-09-10 2013-02-26 Digital Infuzion, Inc. Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected
WO2010041377A1 (ja) * 2008-10-06 2010-04-15 パナソニック株式会社 代表画像表示装置及び代表画像選択方法
US20130201191A1 (en) * 2012-02-03 2013-08-08 Nec Corporation Multidimensional data visualization apparatus, method, and program
US9449062B2 (en) * 2012-09-28 2016-09-20 Sap Se Data exploration combining visual inspection and analytic search
US9147154B2 (en) * 2013-03-13 2015-09-29 Google Inc. Classifying resources using a deep network
WO2017017722A1 (ja) * 2015-07-24 2017-02-02 オリンパス株式会社 処理装置、処理方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006309485A (ja) * 2005-04-28 2006-11-09 Nec Corp 能動学習方法および能動学習システム
JP2013120441A (ja) * 2011-12-06 2013-06-17 Fuji Xerox Co Ltd 画像識別情報付与プログラム及び画像識別情報付与装置
JP2014219801A (ja) * 2013-05-07 2014-11-20 株式会社東芝 車両判別装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256257A (zh) * 2017-06-12 2017-10-17 上海携程商务有限公司 基于业务数据的异常用户生成内容识别方法及系统
JP2019046095A (ja) * 2017-08-31 2019-03-22 キヤノン株式会社 情報処理装置、情報処理装置の制御方法及びプログラム
JP7197971B2 (ja) 2017-08-31 2022-12-28 キヤノン株式会社 情報処理装置、情報処理装置の制御方法及びプログラム
JP2019125206A (ja) * 2018-01-17 2019-07-25 株式会社東芝 情報処理装置、情報処理方法及びプログラム
JPWO2020054551A1 (ja) * 2018-09-11 2021-08-30 日本電気株式会社 情報処理装置、情報処理方法、プログラム
JP7156383B2 (ja) 2018-09-11 2022-10-19 日本電気株式会社 情報処理装置、情報処理方法、プログラム
WO2020054551A1 (ja) * 2018-09-11 2020-03-19 日本電気株式会社 情報処理装置、情報処理方法、プログラム
WO2020099986A1 (ja) * 2018-11-15 2020-05-22 株式会社半導体エネルギー研究所 コンテンツの分類方法
JP2020082304A (ja) * 2018-11-29 2020-06-04 三菱電機株式会社 びびり振動検知装置、びびり振動検知方法、びびり振動検知プログラム、及びびびり振動抑制装置
JPWO2020194961A1 (ja) * 2019-03-28 2020-10-01
JP2021105807A (ja) * 2019-12-26 2021-07-26 株式会社日立製作所 計算機システム及び業務システムの運用環境の解析方法
WO2022080126A1 (ja) * 2020-10-14 2022-04-21 日立Astemo株式会社 画像処理装置
JP7466685B2 (ja) 2020-10-14 2024-04-12 日立Astemo株式会社 画像処理装置
WO2022097302A1 (ja) * 2020-11-09 2022-05-12 富士通株式会社 生成プログラム、生成方法および情報処理装置
JP7452695B2 (ja) 2020-11-09 2024-03-19 富士通株式会社 生成プログラム、生成方法および情報処理装置
WO2023181319A1 (ja) * 2022-03-25 2023-09-28 三菱電機株式会社 情報処理装置
JP7466815B2 (ja) 2022-03-25 2024-04-12 三菱電機株式会社 情報処理装置

Also Published As

Publication number Publication date
US20170109427A1 (en) 2017-04-20
JP6679266B2 (ja) 2020-04-15

Similar Documents

Publication Publication Date Title
JP6679266B2 (ja) データ解析装置、データ解析方法及びプログラム
JP6941123B2 (ja) 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム
JP6832504B2 (ja) 物体追跡方法、物体追跡装置およびプログラム
JP6708385B2 (ja) 識別器作成装置、識別器作成方法、およびプログラム
JP2018200685A (ja) 完全教師あり学習用のデータセットの形成
US9886669B2 (en) Interactive visualization of machine-learning performance
JP5075924B2 (ja) 識別器学習画像生成プログラム、方法、及びシステム
CN111428726A (zh) 基于图神经网络的全景分割方法、系统、设备及存储介质
JP5713790B2 (ja) 画像処理装置、画像処理方法、及びプログラム
EP3357002A1 (en) Semi-automatic labelling of datasets
JP2016133895A (ja) 情報処理装置、情報処理方法、及びプログラム
JP6245880B2 (ja) 情報処理装置および情報処理手法、プログラム
JP2018142097A (ja) 情報処理装置、情報処理方法及びプログラム
CN105612554A (zh) 用于表征通过视频医疗设备获取的图像的方法
WO2021032062A1 (zh) 图像处理模型生成方法、图像处理方法、装置及电子设备
WO2021084623A1 (ja) 劣化抑制プログラム、劣化抑制方法および情報処理装置
US20220405299A1 (en) Visualizing feature variation effects on computer model prediction
US11398074B1 (en) Method and apparatus for identifying planes of objects in 3D scenes
JP7370759B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN114373088A (zh) 一种图像检测模型的训练方法和相关产品
US20080221788A1 (en) Map generation apparatus, map generation method and computer readable medium
CN109993191B (zh) 信息处理方法及装置、电子设备及存储介质
US20240020918A1 (en) Information processing apparatus and information processing method
CN111091022A (zh) 机器视觉的效能评估方法与系统
WO2021070505A1 (ja) 分類システム、分類方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200318

R151 Written notification of patent or utility model registration

Ref document number: 6679266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151