JP6771705B2 - 情報処理装置、プログラム及び情報処理方法 - Google Patents
情報処理装置、プログラム及び情報処理方法 Download PDFInfo
- Publication number
- JP6771705B2 JP6771705B2 JP2020533929A JP2020533929A JP6771705B2 JP 6771705 B2 JP6771705 B2 JP 6771705B2 JP 2020533929 A JP2020533929 A JP 2020533929A JP 2020533929 A JP2020533929 A JP 2020533929A JP 6771705 B2 JP6771705 B2 JP 6771705B2
- Authority
- JP
- Japan
- Prior art keywords
- clustering
- information processing
- determination unit
- processing apparatus
- possibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
実施の形態1では、センサ110によって対象とするモータの振動を測定する。センサ110による測定結果を示す測定信号SSは、AD変換器111によってデジタルデータDDに変換される。
ここで付加されるラベルRDは、そのデジタルデータDDがいつ測定されたか、誰によって測定されたか、又は、どの場所で測定されたか等を示すものが想定される。このようなラベルRDは、人手で入力するようにしてもよいが、時計を内蔵した計算機等を利用して自動的に生成するようにしてもよい。
入力部101は、AD変換器111で変換されたデジタルデータDD及びラベル付加部112で付加されたラベルRDの入力を受ける。そして、入力部101は、入力されたデジタルデータDD及びラベルRDを記憶部102に送る。なお、AD変換器111及びラベル付加部112からは、順次、デジタルデータDD及びそれに付加されたラベルRDが送られてくるものとする。
同様に、モータの振動を測定した日付をラベルRDとするクラスタリングが成功した場合は、時間経過を要因とするデジタルデータDDの不均質が生じていると解釈することができる。
表示部106は、出力部105からの指示に応じて、各種表示画像DIを表示する。
図3は、ある単一の種類のラベル集合RGを用いてクラスタリングを行い、データ集合DGの均質性の判定を行う場合を示している。
特徴抽出部103は、データ集合DGに含まれている各々のデジタルデータDDから特徴抽出を行い、抽出された特徴を示す特徴ベクトルの集合である特徴ベクトル集合BGを生成する(S11)。生成された特徴ベクトル集合BGは、クラスタリング判定部104に与えられる。
図4は、複数の種類のラベル集合RGが存在する場合に、複数のラベル集合RGを用いてクラスタリングを行い、データ集合DGの均質性の判定を行う場合を示している。
特徴抽出部103は、データ集合DGに含まれている各々のデジタルデータDDから特徴抽出を行い、抽出された特徴を示す特徴ベクトルの集合である特徴ベクトル集合BGを生成する(S21)。生成された特徴ベクトル集合BGは、クラスタリング判定部104に与えられる。
Claims (17)
- 複数のデジタルデータを含むデータ集合、及び、前記複数のデジタルデータの各々に各々が付加された複数のラベルを含むラベル集合を記憶する記憶部と、
前記複数のデジタルデータの各々から予め定められた特徴を抽出し、前記抽出された特徴を示す特徴ベクトルを生成することで、複数の前記特徴ベクトルを含む特徴ベクトル集合を生成する特徴抽出部と、
前記ラベル集合を用いて、前記特徴ベクトル集合に教師ありのクラスタリングを試行して、前記クラスタリングの可能性を判断することで、前記データ集合の均質性を判定するクラスタリング判定部と、を備えること
を特徴とする情報処理装置。 - 前記ラベルは、前記デジタルデータの均質性とは無関係の内容を示すこと
を特徴とする請求項1に記載の情報処理装置。 - 前記クラスタリング判定部での判定結果を表示する表示部をさらに備えること
を特徴とする請求項1又は2に記載の情報処理装置。 - 前記クラスタリングの可能性は、前記クラスタリングを行うことができるか否かであること
を特徴とする請求項1から3の何れか一項に記載の情報処理装置。 - 前記クラスタリング判定部は、前記クラスタリングを行うことができると判断した場合には、前記データ集合が不均質であると判定し、前記クラスタリングを行うことができないと判断した場合には、前記データ集合が均質であると判定すること
を特徴とする請求項4に記載の情報処理装置。 - 前記クラスタリングの可能性は、前記クラスタリングを行うことができる度合いであること
を特徴とする請求項1から3の何れか一項に記載の情報処理装置。 - 前記クラスタリング判定部は、前記度合いを予め定められた閾値と比較することで、前記クラスタリングの可能性が高いと判断した場合には、前記データ集合が不均質であると判定し、前記クラスタリングの可能性が低いと判断した場合には、前記データ集合が均質であると判定すること
を特徴とする請求項6に記載の情報処理装置。 - 前記クラスタリング判定部は、前記度合いが高ければ高いほど、前記均質性が低いと判定すること
を特徴とする請求項6に記載の情報処理装置。 - 前記クラスタリング判定部は、前記クラスタリングにより、前記複数の特徴ベクトルの各々を複数のクラスタの何れかに分類し、前記複数の特徴ベクトルに対してパラメトリックな分布を当て嵌め、前記複数のクラスタの乖離度合いを用いて、前記クラスタリングの可能性を判断すること
を特徴とする請求項1から8の何れか一項に記載の情報処理装置。 - 前記パラメトリックな分布は、正規分布であること
を特徴とする請求項9に記載の情報処理装置。 - 前記クラスタリング判定部は、前記乖離度合いをマハラノビス距離によって計量すること
を特徴とする請求項9又は10に記載の情報処理装置。 - 前記クラスタリング判定部は、前記乖離度合いをバタチャリヤ距離によって計量すること
を特徴とする請求項9又は10に記載の情報処理装置。 - 前記クラスタリング判定部は、前記クラスタリングにより、前記複数の特徴ベクトルの各々を複数のクラスタの何れかに分類し、前記複数の特徴ベクトルに対して、前記複数のクラスタの各々が乖離するような射影変換を行い、前記複数のクラスタの乖離度合いを用いて、前記クラスタリングの可能性を判断すること
を特徴とする請求項1から8の何れか一項に記載の情報処理装置。 - 前記クラスタリング判定部は、前記射影変換を、判別分析により実行すること
を特徴とする請求項13に記載の情報処理装置。 - 前記クラスタリング判定部は、前記射影変換を、マージン最大化基準に基づいて実行すること
を特徴とする請求項13に記載の情報処理装置。 - コンピュータを、
複数のデジタルデータを含むデータ集合、及び、前記複数のデジタルデータの各々に各々が付加された複数のラベルを含むラベル集合を記憶する記憶部、
前記複数のデジタルデータの各々から予め定められた特徴を抽出し、前記抽出された特徴を示す特徴ベクトルを生成することで、複数の前記特徴ベクトルを含む特徴ベクトル集合を生成する特徴抽出部、及び、
前記ラベル集合を用いて、前記特徴ベクトル集合に教師ありのクラスタリングを試行して、前記クラスタリングの可能性を判断することで、前記データ集合の均質性を判定するクラスタリング判定部、として機能させること
を特徴とするプログラム。 - 複数のデジタルデータを含むデータ集合、及び、前記複数のデジタルデータの各々に各々が付加された複数のラベルを含むラベル集合を記憶し、
前記複数のデジタルデータの各々から予め定められた特徴を抽出し、前記抽出された特徴を示す特徴ベクトルを生成することで、複数の前記特徴ベクトルを含む特徴ベクトル集合を生成し、
前記ラベル集合を用いて、前記特徴ベクトル集合に教師ありのクラスタリングを試行して、前記クラスタリングの可能性を判断することで、前記データ集合の均質性を判定すること
を特徴とする情報処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/028584 WO2020026332A1 (ja) | 2018-07-31 | 2018-07-31 | 情報処理装置、プログラム及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6771705B2 true JP6771705B2 (ja) | 2020-10-21 |
JPWO2020026332A1 JPWO2020026332A1 (ja) | 2020-10-22 |
Family
ID=69232128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020533929A Active JP6771705B2 (ja) | 2018-07-31 | 2018-07-31 | 情報処理装置、プログラム及び情報処理方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11366835B2 (ja) |
JP (1) | JP6771705B2 (ja) |
KR (1) | KR102334489B1 (ja) |
CN (1) | CN112513892B (ja) |
DE (1) | DE112018007776T5 (ja) |
TW (1) | TWI735010B (ja) |
WO (1) | WO2020026332A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI768606B (zh) * | 2020-12-18 | 2022-06-21 | 日月光半導體製造股份有限公司 | 感測器監測系統及方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09185720A (ja) * | 1995-12-28 | 1997-07-15 | Canon Inc | 画像抽出装置 |
JP2001100780A (ja) * | 1999-09-28 | 2001-04-13 | Mitsubishi Electric Corp | 音声モデル作成装置,音声認識装置,音声モデル作成方法及び音声認識方法 |
US7003509B2 (en) * | 2003-07-21 | 2006-02-21 | Leonid Andreev | High-dimensional data clustering with the use of hybrid similarity matrices |
US7308451B1 (en) * | 2001-09-04 | 2007-12-11 | Stratify, Inc. | Method and system for guided cluster based processing on prototypes |
US7010167B1 (en) * | 2002-04-30 | 2006-03-07 | The United States Of America As Represented By The National Security Agency | Method of geometric linear discriminant analysis pattern recognition |
US7143352B2 (en) * | 2002-11-01 | 2006-11-28 | Mitsubishi Electric Research Laboratories, Inc | Blind summarization of video content |
TWI241499B (en) * | 2004-06-30 | 2005-10-11 | Simpleact Inc | A Chinese spam filtering method based on text clustering |
US7574409B2 (en) * | 2004-11-04 | 2009-08-11 | Vericept Corporation | Method, apparatus, and system for clustering and classification |
JP5050607B2 (ja) | 2006-05-09 | 2012-10-17 | オムロン株式会社 | 検査装置、検査方法、検査プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 |
KR100998456B1 (ko) * | 2006-07-06 | 2010-12-06 | 아사히 가라스 가부시키가이샤 | 클러스터링 시스템 및 결함 종류 판정 장치 |
US8972407B2 (en) * | 2007-05-30 | 2015-03-03 | International Business Machines Corporation | Information processing method for determining weight of each feature in subjective hierarchical clustering |
US8631004B2 (en) * | 2009-12-28 | 2014-01-14 | Yahoo! Inc. | Search suggestion clustering and presentation |
US9547830B2 (en) * | 2013-05-07 | 2017-01-17 | Wise.Io, Inc. | Scalable, memory-efficient machine learning and prediction for ensembles of decision trees for homogeneous and heterogeneous datasets |
KR102190484B1 (ko) * | 2013-11-11 | 2020-12-11 | 삼성전자주식회사 | 인식기 학습 방법 및 장치, 데이터 인식 방법 및 장치 |
FR3027417B1 (fr) * | 2014-10-20 | 2016-11-25 | Airbus Operations Sas | Procede et systeme de generation de rapports d'alertes dans un aeronef |
US10552762B2 (en) * | 2015-07-16 | 2020-02-04 | Falkonry Inc. | Machine learning of physical conditions based on abstract relations and sparse labels |
JP6297206B2 (ja) * | 2015-08-11 | 2018-03-20 | 三菱電機株式会社 | ウェブ閲覧装置およびウェブ閲覧プログラム |
US20170083920A1 (en) * | 2015-09-21 | 2017-03-23 | Fair Isaac Corporation | Hybrid method of decision tree and clustering technology |
JP6364037B2 (ja) * | 2016-03-16 | 2018-07-25 | セコム株式会社 | 学習データ選択装置 |
US11176423B2 (en) * | 2016-10-24 | 2021-11-16 | International Business Machines Corporation | Edge-based adaptive machine learning for object recognition |
WO2018122931A1 (ja) * | 2016-12-26 | 2018-07-05 | 株式会社Pfu | 情報処理装置、方法およびプログラム |
CN107967912B (zh) * | 2017-11-28 | 2022-02-25 | 广州势必可赢网络科技有限公司 | 一种人声分割方法及装置 |
EP3935576A4 (en) * | 2019-03-06 | 2022-11-23 | Telepathy Labs, Inc. | METHOD AND SYSTEM TO SUPPORT A DEVELOPER IN IMPROVING THE ACCURACY OF A CLASSIFIER |
US20210374525A1 (en) * | 2020-05-28 | 2021-12-02 | International Business Machines Corporation | Method and system for processing data records |
-
2018
- 2018-07-31 DE DE112018007776.4T patent/DE112018007776T5/de active Pending
- 2018-07-31 WO PCT/JP2018/028584 patent/WO2020026332A1/ja active Application Filing
- 2018-07-31 KR KR1020217002015A patent/KR102334489B1/ko active IP Right Grant
- 2018-07-31 JP JP2020533929A patent/JP6771705B2/ja active Active
- 2018-07-31 CN CN201880095979.1A patent/CN112513892B/zh active Active
-
2019
- 2019-07-24 TW TW108126140A patent/TWI735010B/zh active
-
2020
- 2020-11-24 US US17/103,494 patent/US11366835B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11366835B2 (en) | 2022-06-21 |
JPWO2020026332A1 (ja) | 2020-10-22 |
KR20210013292A (ko) | 2021-02-03 |
US20210081438A1 (en) | 2021-03-18 |
CN112513892B (zh) | 2024-06-25 |
TW202008223A (zh) | 2020-02-16 |
KR102334489B1 (ko) | 2021-12-02 |
DE112018007776T5 (de) | 2021-04-15 |
WO2020026332A1 (ja) | 2020-02-06 |
TWI735010B (zh) | 2021-08-01 |
CN112513892A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10242087B2 (en) | Cluster evaluation in unsupervised learning of continuous data | |
US11703845B2 (en) | Abnormality predicting system and abnormality predicting method | |
CN108228428B (zh) | 用于输出信息的方法和装置 | |
KR20150018642A (ko) | 머신 상태 모니터링에서 결함 진단을 위한 일반화된 패턴 인식 | |
JP6821614B2 (ja) | モデル学習装置、モデル学習方法、プログラム | |
US12066918B2 (en) | System to track and measure machine learning model efficacy | |
EP3333757B1 (en) | Predictive anomaly detection | |
EP3686805A1 (en) | Associating a population descriptor with a trained model | |
CN110490304B (zh) | 一种数据处理方法及设备 | |
JP6771705B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US20130268288A1 (en) | Device, method, and program for extracting abnormal event from medical information using feedback information | |
CN113723525B (zh) | 基于遗传算法的产品推荐方法、装置、设备及存储介质 | |
US10692256B2 (en) | Visualization method, visualization device, and recording medium | |
JP7003334B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2022035161A (ja) | 異常検出方法 | |
Granstedt et al. | Autoencoder embedding of task-specific information | |
JP7227772B2 (ja) | データアセット分析支援システムおよびデータ分析方法 | |
US20230104299A1 (en) | Computational approaches to assessing central nervous system functionality using a digital tablet and stylus | |
US20230252132A1 (en) | Control device, computer program product, and control system | |
Lanckriet et al. | A framework for genomic data fusion and its application to membrane protein prediction | |
CN118228854A (zh) | 一种物料备料预测方法、装置、设备及存储介质 | |
CN118657413A (zh) | 基于lsa和hmm模型的计算思维水平评估方法和系统 | |
JP2021089459A (ja) | 分析装置、分析方法、及び分析プログラム | |
JP2012003334A (ja) | 文書分類装置、文書分類方法、そのプログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200727 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200727 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200929 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6771705 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |