JP6679266B2 - データ解析装置、データ解析方法及びプログラム - Google Patents
データ解析装置、データ解析方法及びプログラム Download PDFInfo
- Publication number
- JP6679266B2 JP6679266B2 JP2015204016A JP2015204016A JP6679266B2 JP 6679266 B2 JP6679266 B2 JP 6679266B2 JP 2015204016 A JP2015204016 A JP 2015204016A JP 2015204016 A JP2015204016 A JP 2015204016A JP 6679266 B2 JP6679266 B2 JP 6679266B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- likelihood
- input data
- label
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の第1の実施形態では、特定の検査対象物体を撮影し、その撮影した画像に基づいて検査対象物体が正常であるか否かを識別する。本実施形態では、画像から正常と異常を識別する要素となる特徴量を算出し、複数の正常画像と複数の異常画像のそれぞれから算出した特徴量に基づいて、正常と異常を識別する基準となる正常らしさを表す尤度を算出する。
本発明の第2の実施形態によるデータ解析装置について説明する。第1の実施形態では、データ解析装置は、対象のデータから特徴量ciを抽出し、抽出した特徴量ciを用いて正常と異常を識別する識別モデルの学習を行った。本実施形態では、入力データ中に、あらかじめ与えられた正常と異常のラベルの信頼性が低いデータを含んでいる場合を想定する。識別モデルの学習に、誤ったラベルのデータを利用した場合、正常と異常の識別境界が適切に求められず、識別精度が低下する可能性がある。そこで、あらかじめ与えられたラベルをユーザが修正し、適切なラベルを付与し直す。付与し直したラベルを用いて識別モデルの学習を行うことで、より識別性能の高い識別モデルの学習を行うことができる。
本発明の第3の実施形態によるデータ解析装置について説明する。第1の実施形態では、データ解析装置は、対象のデータから特徴量ciを抽出し、その抽出した特徴量ciを用いて正常と異常を識別する識別モデルの学習を行った。そして、データ解析装置は、識別モデルを用いてデータの尤度L(ci)を算出し、特徴空間におけるデータ分布と尤度L(ci)の等高線103を同時に表示した。本実施形態では、入力データに付与されたラベルは信頼できるが、データ数が十分ではない場合を想定する。例えば、異常データ中に、複数種類の異常パターンが存在するような状態である。異常データに複数種類の異常パターンがある場合、ある異常パターンのデータ数は十分にあるが、別の異常パターンではデータ数が極端に少ないといった場合がある。このような場合には、データ数が少ない異常パターンは、識別性能が低下する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。コンピュータを、上述の実施形態のデータ解析装置の各手段として機能させるためのプログラムにより実現してもよい。
Claims (11)
- 複数の入力データから特徴量をそれぞれ抽出する特徴量抽出手段と、
前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出手段と、
前記特徴量と前記尤度に基づいて、前記複数の入力データの各々の空間上での位置座標を算出するデータ解析処理手段と、
前記入力データの属性情報として、前記複数の入力データの各々の空間上での位置座標の位置を表示する提示手段と
を有することを特徴とするデータ解析装置。 - 前記データ解析処理手段は、前記特徴量と前記尤度が3次元より多い次元のデータである場合には、次元を削減し、3次元以下の空間上での位置座標を算出することを特徴とする請求項1記載のデータ解析装置。
- 前記データ解析処理手段は、前記特徴量と前記尤度についての2個の前記入力データの間の距離と、前記空間上での2個の前記入力データの位置座標の間の距離との誤差が最小になるように、前記複数の入力データの各々の位置座標を算出することを特徴とする請求項1又は2記載のデータ解析装置。
- 前記データ解析処理手段は、前記特徴量と前記尤度を結合したベクトルを用いて前記位置座標を算出することを特徴とする請求項3記載のデータ解析装置。
- 前記提示手段は、前記入力データの属性情報として、前記尤度が同じである位置座標を示す等高線を表示することを特徴とする請求項1〜4のいずれか1項に記載のデータ解析装置。
- 前記尤度算出手段は、第1のラベルに属する入力データの特徴量の平均値を用いて、前記複数の入力データの各々が前記第1のラベルに属することの尤度を算出することを特徴とする請求項1〜5のいずれか1項に記載のデータ解析装置。
- さらに、前記特徴量と前記尤度を用いて、前記複数の入力データを複数のクラスタに分類するクラスタリング手段と、
前記クラスタに属する入力データのうちで他のラベルに対して入力データの数が少ないラベルに属する入力データを提示データとして決定する提示データ決定手段とを有し、
前記提示手段は、前記入力データの属性情報として、前記提示データを提示することを特徴とする請求項1記載のデータ解析装置。 - さらに、前記提示手段により表示された提示データが属するラベルの修正が指示されると、前記提示データが属するラベルを修正するラベル修正手段と、
前記ラベル修正手段により修正されたラベルの提示データを用いて、前記識別モデルの学習を行う識別モデル学習手段とを有することを特徴とする請求項7記載のデータ解析装置。 - 前記提示手段の表示に基づき入力データが追加されると、前記特徴量抽出手段は、前記追加された入力データから特徴量を抽出し、
さらに、前記追加された入力データの特徴量を用いて、前記識別モデルの学習を行う識別モデル学習手段を有することを特徴とする請求項7記載のデータ解析装置。 - 特徴量抽出手段により、複数の入力データから特徴量をそれぞれ抽出する特徴量抽出ステップと、
尤度算出手段により、前記特徴量を用いて生成される前記複数の入力データの各々が複数のラベルのうちのいずれに属するかを識別する識別モデルに基づいて、前記複数の入力データの各々が前記ラベルに属することの尤度を算出する尤度算出ステップと、
データ解析処理手段により、前記特徴量と前記尤度に基づいて、前記複数の入力データの各々の空間上での位置座標を算出するデータ解析処理ステップと、
提示手段により、前記入力データの属性情報として、前記複数の入力データの各々の空間上での位置座標の位置を表示する提示ステップと
を有することを特徴とするデータ解析方法。 - コンピュータを請求項1〜9のいずれか1項に記載のデータ解析装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015204016A JP6679266B2 (ja) | 2015-10-15 | 2015-10-15 | データ解析装置、データ解析方法及びプログラム |
US15/290,573 US20170109427A1 (en) | 2015-10-15 | 2016-10-11 | Information processing apparatus, information processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015204016A JP6679266B2 (ja) | 2015-10-15 | 2015-10-15 | データ解析装置、データ解析方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017076287A JP2017076287A (ja) | 2017-04-20 |
JP6679266B2 true JP6679266B2 (ja) | 2020-04-15 |
Family
ID=58524087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015204016A Active JP6679266B2 (ja) | 2015-10-15 | 2015-10-15 | データ解析装置、データ解析方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170109427A1 (ja) |
JP (1) | JP6679266B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10318846B2 (en) * | 2016-12-28 | 2019-06-11 | Ancestry.Com Operations Inc. | Clustering historical images using a convolutional neural net and labeled data bootstrapping |
CN107256257A (zh) * | 2017-06-12 | 2017-10-17 | 上海携程商务有限公司 | 基于业务数据的异常用户生成内容识别方法及系统 |
JP7197971B2 (ja) * | 2017-08-31 | 2022-12-28 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法及びプログラム |
JP6796092B2 (ja) * | 2018-01-17 | 2020-12-02 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
JP7318646B2 (ja) * | 2018-06-27 | 2023-08-01 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
WO2020054551A1 (ja) * | 2018-09-11 | 2020-03-19 | 日本電気株式会社 | 情報処理装置、情報処理方法、プログラム |
JPWO2020099986A1 (ja) * | 2018-11-15 | 2021-11-04 | 株式会社半導体エネルギー研究所 | コンテンツの分類方法 |
JP2020082304A (ja) * | 2018-11-29 | 2020-06-04 | 三菱電機株式会社 | びびり振動検知装置、びびり振動検知方法、びびり振動検知プログラム、及びびびり振動抑制装置 |
CN113632077A (zh) * | 2019-03-28 | 2021-11-09 | 松下知识产权经营株式会社 | 识别信息赋予装置、识别信息赋予方法以及程序 |
JP2021105807A (ja) * | 2019-12-26 | 2021-07-26 | 株式会社日立製作所 | 計算機システム及び業務システムの運用環境の解析方法 |
JP7466685B2 (ja) * | 2020-10-14 | 2024-04-12 | 日立Astemo株式会社 | 画像処理装置 |
WO2022097302A1 (ja) * | 2020-11-09 | 2022-05-12 | 富士通株式会社 | 生成プログラム、生成方法および情報処理装置 |
JP7524045B2 (ja) * | 2020-12-10 | 2024-07-29 | 株式会社東芝 | データ解析装置、方法およびシステム |
WO2023181319A1 (ja) * | 2022-03-25 | 2023-09-28 | 三菱電機株式会社 | 情報処理装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4645288B2 (ja) * | 2005-04-28 | 2011-03-09 | 日本電気株式会社 | 能動学習方法および能動学習システム |
US8739062B2 (en) * | 2006-02-24 | 2014-05-27 | Sony Corporation | Graphical playlist |
US7730414B2 (en) * | 2006-06-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Graphical display |
US9015633B2 (en) * | 2007-10-22 | 2015-04-21 | Sony Corporation | Data management apparatus and method for organizing data elements into multiple categories for display |
US8386401B2 (en) * | 2008-09-10 | 2013-02-26 | Digital Infuzion, Inc. | Machine learning methods and systems for identifying patterns in data using a plurality of learning machines wherein the learning machine that optimizes a performance function is selected |
US8682085B2 (en) * | 2008-10-06 | 2014-03-25 | Panasonic Corporation | Representative image display device and representative image selection method |
JP5821590B2 (ja) * | 2011-12-06 | 2015-11-24 | 富士ゼロックス株式会社 | 画像識別情報付与プログラム及び画像識別情報付与装置 |
US20130201191A1 (en) * | 2012-02-03 | 2013-08-08 | Nec Corporation | Multidimensional data visualization apparatus, method, and program |
US9449062B2 (en) * | 2012-09-28 | 2016-09-20 | Sap Se | Data exploration combining visual inspection and analytic search |
US9147154B2 (en) * | 2013-03-13 | 2015-09-29 | Google Inc. | Classifying resources using a deep network |
JP2014219801A (ja) * | 2013-05-07 | 2014-11-20 | 株式会社東芝 | 車両判別装置 |
JPWO2017017722A1 (ja) * | 2015-07-24 | 2018-05-24 | オリンパス株式会社 | 処理装置、処理方法及びプログラム |
-
2015
- 2015-10-15 JP JP2015204016A patent/JP6679266B2/ja active Active
-
2016
- 2016-10-11 US US15/290,573 patent/US20170109427A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2017076287A (ja) | 2017-04-20 |
US20170109427A1 (en) | 2017-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6679266B2 (ja) | データ解析装置、データ解析方法及びプログラム | |
JP6632193B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6708385B2 (ja) | 識別器作成装置、識別器作成方法、およびプログラム | |
US9886669B2 (en) | Interactive visualization of machine-learning performance | |
JP4991317B2 (ja) | 顔特徴点検出装置及びその方法 | |
JP6245880B2 (ja) | 情報処理装置および情報処理手法、プログラム | |
US20230085687A1 (en) | Machine learning prediction and document rendering improvement based on content order | |
CN114067109B (zh) | 谷物检测方法及检测设备、存储介质 | |
US20130257873A1 (en) | Information processing apparatus, information processing method, and program | |
JP2017102906A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7298825B2 (ja) | 学習支援装置、学習装置、学習支援方法及び学習支援プログラム | |
WO2021084623A1 (ja) | 劣化抑制プログラム、劣化抑制方法および情報処理装置 | |
JP2012174222A (ja) | 画像認識プログラム、方法及び装置 | |
CN113366499A (zh) | 将群体描述符与经训练模型相关联 | |
US20220405299A1 (en) | Visualizing feature variation effects on computer model prediction | |
Hamel | Visualization of support vector machines with unsupervised learning | |
US20240177341A1 (en) | Computer-readable recording medium storing object detection program, device, and machine learning model generation method | |
JP7270127B2 (ja) | 分類システム、分類方法、及びプログラム | |
WO2022230413A1 (ja) | 検出装置、検出装置の制御方法、学習済モデルを生成するモデル生成装置によるモデル生成方法、情報処理プログラム、および記録媒体 | |
CN111091022A (zh) | 机器视觉的效能评估方法与系统 | |
JP7370759B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2021018495A (ja) | 情報処理装置、情報処理方法およびプログラム | |
KR102236802B1 (ko) | 진단 모델용 데이터의 특징 추출 장치 및 방법 | |
JP7309134B2 (ja) | 可視化方法、これに用いるプログラム、および、可視化装置、並びに、これを備える判別装置 | |
WO2024004127A1 (ja) | 情報処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181005 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6679266 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |