JP2020035039A - 更新支援装置、更新支援方法およびプログラム - Google Patents
更新支援装置、更新支援方法およびプログラム Download PDFInfo
- Publication number
- JP2020035039A JP2020035039A JP2018158981A JP2018158981A JP2020035039A JP 2020035039 A JP2020035039 A JP 2020035039A JP 2018158981 A JP2018158981 A JP 2018158981A JP 2018158981 A JP2018158981 A JP 2018158981A JP 2020035039 A JP2020035039 A JP 2020035039A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unlabeled
- cluster
- identification dictionary
- labeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本実施形態は、センサデータを1つ以上の分類クラスに分類するための識別辞書の更新を支援するものである。更新の対象となる識別辞書は、分類クラスを示すラベルが教示されたセンサデータ(以下、「ラベルありデータ」と呼ぶ)を学習用データとして生成(学習)された既存の識別辞書である。識別辞書の更新は、例えば、既存の識別辞書ではユーザが満足する分類結果が得られず、既存の識別辞書の分類クラスを再構築することが必要とされる場合に行われる。分類クラスの再構築の形態としては、例えば、分類クラスの追加、分類クラスの範囲拡大、分類クラスの細分化、分類クラスの統合などがある。
図1は、第1実施形態に係る更新支援装置の機能的な構成例を示すブロック図である。本実施形態の更新支援装置は、図1に示すように、取得部1と、クラスタリング部2と、評価部3と、学習属性決定部4と、を備える。
パターン1:ラベルなしクラスタの分布が、どのラベルありクラスタの分布とも重ならない。
パターン2:ラベルなしクラスタの分布が、1つのラベルありクラスタの分布に一部重なる。
パターン3:ラベルなしクラスタの分布が、複数のラベルありクラスタの分布に一部重なる。
パターン4:ラベルなしクラスタの分布が、ラベルありクラスタに内包される。
パターン5:複数のラベルなしクラスタの分布が、ラベルありクラスタの分布に内包される。
パターン6:ラベルなしクラスタの分布が、ラベルありクラスタの分布を包含する。
次に、第2実施形態について説明する。本実施形態の更新支援装置は、上述の第1実施形態の更新支援装置に対して、学習属性決定部4が出力する情報に基づいて既存の識別辞書の更新要否を判定し、既存の識別辞書の更新が必要と判断した場合に識別辞書の更新を促す情報をユーザに提示する機能を付加したものである。なお、その他の構成および動作は上述の第1実施形態と同様であるため、以下では、第1実施形態との共通部分は同一の符号を用いて重複した説明を適宜省略し、本実施形態に特徴的な部分についてのみ説明する。
次に、第3実施形態について説明する。本実施形態の更新支援装置は、上述の第2実施形態の更新支援装置に対して、追加学習用データの優先度を決定し、優先度が高い順に追加学習用データをユーザに提示する機能を付加したものである。学習属性の「再構成タイプ」の値によりラベル教示が必要とされる追加学習用データは、ユーザによるラベル教示を受け付け可能に提示される。なお、その他の構成および動作は上述の第1実施形態および第2実施形態と同様であるため、以下では、第1実施形態および第2実施形態との共通部分は同一の符号を用いて重複した説明を適宜省略し、本実施形態に特徴的な部分についてのみ説明する。
上述した各実施形態の更新支援装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることで実現することが可能である。すなわち、上述の更新支援装置の各部の機能は、汎用のコンピュータに搭載された1以上のプロセッサにプログラムを実行させることにより実現することができる。このとき、更新支援装置は、上記のプログラムをコンピュータに予めインストールすることで実現してもよいし、コンピュータ読み取り可能な記憶媒体に上記のプログラムを記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータに適宜インストールすることで実現してもよい。
2 クラスタリング部
3 評価部
4 学習属性決定部
5 提示部
6 優先度決定部
Claims (11)
- センサデータを1つ以上の分類クラスに分類するための識別辞書の更新を支援する更新支援装置であって、
分類クラスを示すラベルが未教示のセンサデータであるラベルなしデータの集合を前記識別辞書に対応する特徴空間上でクラスタリングして、1つ以上のラベルなしクラスタを生成するクラスタリング部と、
前記ラベルが教示され前記識別辞書の生成に用いられたセンサデータであるラベルありデータの集合を前記特徴空間上でクラスタリングすることで生成された1つ以上のラベルありクラスタの前記特徴空間における分布に対する、前記ラベルなしクラスタの前記特徴空間における分布の重なり状態を評価する評価部と、
前記重なり状態の評価結果に基づいて、前記ラベルなしクラスタに属する各ラベルなしデータに対し、少なくとも、該ラベルなしデータが前記識別辞書の更新のための学習用データとして有用か否かを示す項目を含む学習属性を決定する学習属性決定部と、
を備える更新支援装置。 - 前記学習属性は、さらに、前記ラベルなしクラスタに属する各ラベルなしデータが、分類クラスの追加、分類クラスの範囲拡大、分類クラスの細分化、分類クラスの統合、のいずれの形態で分類クラスを再構築するための学習用データとして有用かを示す項目を含む、
請求項1に記載の更新支援装置。 - 前記評価部は、前記ラベルなしクラスタの分布を表す統計量と前記ラベルありクラスタの分布を表す統計量とを用いて算出される距離尺度により、前記重なり状態を評価する、
請求項1または2に記載の更新支援装置。 - 前記クラスタリング部は、さらに、前記ラベルありデータの集合を前記特徴空間上でクラスタリングして、1つ以上の前記ラベルありクラスタを生成する、
請求項1乃至3のいずれか一項に記載の更新支援装置。 - 前記ラベルなしデータの集合のうち、前記学習属性により前記学習用データとして有用であることが示された前記ラベルなしデータである追加学習用データが占める割合、または、前記追加学習用データの総数が、所定の基準値を超えた場合に、前記識別辞書の更新を促す情報を提示する提示部をさらに備える、
請求項1乃至4のいずれか一項に記載の更新支援装置。 - 前記提示部は、さらに、前記ラベルなしデータの集合のうち前記追加学習用データが占める割合、または、前記追加学習用データの総数の経時的な変化を表す情報を提示する、
請求項5に記載の更新支援装置。 - 前記提示部は、さらに、前記追加学習用データを、前記ラベルの教示操作を受け付け可能に提示する、
請求項5または6に記載の更新支援装置。 - 前記追加学習用データの優先度を決定する優先度決定部をさらに備え、
前記提示部は、前記追加学習用データを前記優先度が高い順に提示する、
請求項7に記載の更新支援装置。 - 前記優先度決定部は、前記特徴空間上での前記ラベルありクラスタに対する前記追加学習用データの距離を示す確信度に基づいて、前記追加学習用データの優先度を決定する、
請求項8に記載の更新支援装置。 - センサデータを1つ以上の分類クラスに分類するための識別辞書の更新を支援する更新支援方法であって、
分類クラスを示すラベルが未教示のセンサデータであるラベルなしデータの集合を前記識別辞書に対応する特徴空間上でクラスタリングして、1つ以上のラベルなしクラスタを生成するステップと、
前記ラベルが教示され前記識別辞書の生成に用いられたセンサデータであるラベルありデータの集合を前記特徴空間上でクラスタリングすることで生成された1つ以上のラベルありクラスタの前記特徴空間における分布に対する、前記ラベルなしクラスタの前記特徴空間における分布の重なり状態を評価するステップと、
前記重なり状態の評価結果に基づいて、前記ラベルなしクラスタに属する各ラベルなしデータに対し、少なくとも、該ラベルなしデータが前記識別辞書の更新のための学習用データとして有用か否かを示す項目を含む学習属性を決定するステップと、
を含む更新支援方法。 - センサデータを1つ以上の分類クラスに分類するための識別辞書の更新を支援する機能をコンピュータで実現するためのプログラムであって、
前記コンピュータに、
分類クラスを示すラベルが未教示のセンサデータであるラベルなしデータの集合を前記識別辞書に対応する特徴空間上でクラスタリングして、1つ以上のラベルなしクラスタを生成するステップと、
前記ラベルが教示され前記識別辞書の生成に用いられたセンサデータであるラベルありデータの集合を前記特徴空間上でクラスタリングすることで生成された1つ以上のラベルありクラスタの前記特徴空間における分布に対する、前記ラベルなしクラスタの前記特徴空間における分布の重なり状態を評価するステップと、
前記重なり状態の評価結果に基づいて、前記ラベルなしクラスタに属する各ラベルなしデータに対し、少なくとも、該ラベルなしデータが前記識別辞書の更新のための学習用データとして有用か否かを示す項目を含む学習属性を決定するステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158981A JP6952660B2 (ja) | 2018-08-28 | 2018-08-28 | 更新支援装置、更新支援方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018158981A JP6952660B2 (ja) | 2018-08-28 | 2018-08-28 | 更新支援装置、更新支援方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035039A true JP2020035039A (ja) | 2020-03-05 |
JP6952660B2 JP6952660B2 (ja) | 2021-10-20 |
Family
ID=69668101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018158981A Active JP6952660B2 (ja) | 2018-08-28 | 2018-08-28 | 更新支援装置、更新支援方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6952660B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925990A (zh) * | 2021-02-26 | 2021-06-08 | 上海哔哩哔哩科技有限公司 | 目标群体分类方法及装置 |
JP7086311B1 (ja) * | 2021-06-15 | 2022-06-17 | 三菱電機株式会社 | プログラム、ラベリング支援装置及びラベリング支援方法 |
JP2022151049A (ja) * | 2021-03-26 | 2022-10-07 | 横河電機株式会社 | 装置、方法およびプログラム |
WO2023084712A1 (ja) * | 2021-11-11 | 2023-05-19 | 日本電気株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
US11886490B2 (en) | 2020-04-03 | 2024-01-30 | Samsung Electronics Co, Ltd. | Neural network device for retrieving image and operating method thereof |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257732A (ja) * | 2007-04-06 | 2008-10-23 | Xerox Corp | 文書のクラスタリング又は範疇化のための方法 |
JP2017083990A (ja) * | 2015-10-26 | 2017-05-18 | トヨタ自動車株式会社 | 情報提供装置および情報提供方法 |
JP2017167834A (ja) * | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
WO2018079020A1 (ja) * | 2016-10-26 | 2018-05-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
JP2018109882A (ja) * | 2017-01-05 | 2018-07-12 | 株式会社東芝 | 動作解析装置、動作解析方法およびプログラム |
-
2018
- 2018-08-28 JP JP2018158981A patent/JP6952660B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257732A (ja) * | 2007-04-06 | 2008-10-23 | Xerox Corp | 文書のクラスタリング又は範疇化のための方法 |
JP2017083990A (ja) * | 2015-10-26 | 2017-05-18 | トヨタ自動車株式会社 | 情報提供装置および情報提供方法 |
JP2017167834A (ja) * | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
WO2018079020A1 (ja) * | 2016-10-26 | 2018-05-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
US20190244132A1 (en) * | 2016-10-26 | 2019-08-08 | Sony Corporation | Information processing device and information processing method |
JP2018109882A (ja) * | 2017-01-05 | 2018-07-12 | 株式会社東芝 | 動作解析装置、動作解析方法およびプログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11886490B2 (en) | 2020-04-03 | 2024-01-30 | Samsung Electronics Co, Ltd. | Neural network device for retrieving image and operating method thereof |
CN112925990A (zh) * | 2021-02-26 | 2021-06-08 | 上海哔哩哔哩科技有限公司 | 目标群体分类方法及装置 |
JP2022151049A (ja) * | 2021-03-26 | 2022-10-07 | 横河電機株式会社 | 装置、方法およびプログラム |
JP7463996B2 (ja) | 2021-03-26 | 2024-04-09 | 横河電機株式会社 | 装置、方法およびプログラム |
JP7086311B1 (ja) * | 2021-06-15 | 2022-06-17 | 三菱電機株式会社 | プログラム、ラベリング支援装置及びラベリング支援方法 |
WO2022264279A1 (ja) * | 2021-06-15 | 2022-12-22 | 三菱電機株式会社 | プログラム、ラベリング支援装置及びラベリング支援方法 |
WO2023084712A1 (ja) * | 2021-11-11 | 2023-05-19 | 日本電気株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6952660B2 (ja) | 2021-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6952660B2 (ja) | 更新支援装置、更新支援方法およびプログラム | |
Shamout et al. | Deep interpretable early warning system for the detection of clinical deterioration | |
JP6555061B2 (ja) | クラスタリングプログラム、クラスタリング方法、および情報処理装置 | |
US10423647B2 (en) | Descriptive datacenter state comparison | |
JP6652699B2 (ja) | アノマリ評価プログラム、アノマリ評価方法、および情報処理装置 | |
CN103703487B (zh) | 信息识别方法以及系统 | |
US10191956B2 (en) | Event detection and characterization in big data streams | |
US10365946B2 (en) | Clustering based process deviation detection | |
US20220083814A1 (en) | Associating a population descriptor with a trained model | |
JP2014235654A (ja) | リスク評価装置 | |
JP6201079B2 (ja) | 監視システムおよび監視方法 | |
Hardt et al. | Explaining an increase in predicted risk for clinical alerts | |
US11593700B1 (en) | Network-accessible service for exploration of machine learning models and results | |
US20170220525A1 (en) | Method and apparatus for hierarchical data analysis based on mutual correlations | |
JP2020091756A (ja) | 学習方法、学習プログラムおよび学習装置 | |
US11314984B2 (en) | Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results | |
WO2019046996A1 (en) | JAVA SOFTWARE LATENCY ANOMALY DETECTION | |
Pohl et al. | Active online learning for social media analysis to support crisis management | |
Rajeswari et al. | A comparative evaluation of supervised and unsupervised methods for detecting outliers | |
Gray | Software defect prediction using static code metrics: Formulating a methodology | |
JP6852004B2 (ja) | データ解析システム、データ解析方法、及びプログラム | |
CN115349129A (zh) | 生成具有不确定性区间的性能预测 | |
WO2021106028A1 (ja) | 機械学習装置、機械学習方法、及び、機械学習プログラムが格納された記録媒体 | |
Kruse et al. | Temporal pattern mining | |
Kathiresan et al. | Efficient Detection Using Soft Computing Approach of Modified Fuzzy C-Means Based Outlier Detection in Electronics Patient Records Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200701 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210730 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210928 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6952660 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |