JP7222429B2 - データ選択方法、データ選択装置及びプログラム - Google Patents
データ選択方法、データ選択装置及びプログラム Download PDFInfo
- Publication number
- JP7222429B2 JP7222429B2 JP2021536513A JP2021536513A JP7222429B2 JP 7222429 B2 JP7222429 B2 JP 7222429B2 JP 2021536513 A JP2021536513 A JP 2021536513A JP 2021536513 A JP2021536513 A JP 2021536513A JP 7222429 B2 JP7222429 B2 JP 7222429B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- clusters
- data set
- labeled
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図2は、第1の実施の形態におけるデータ選択装置10の機能構成例を示す図である。図2において、データ選択装置10は、特徴抽出器生成部11及びサンプリング処理部12を有する。これら各部は、データ選択装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。
11 特徴抽出器生成部
12 サンプリング処理部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
B バス
Claims (8)
- ラベルが付与された第1のデータの集合に属するデータと、ラベルが付与されていない第2のデータの集合に属するデータとを、前記ラベルの種類よりも少なくとも1つ多い数のクラスタに分類する分類手順と、
前記クラスタのうち、前記第1のデータを含まないクラスタからラベルの付与対象とする前記第2のデータを選択する選択手順と、
をコンピュータが実行するデータ選択方法。 - 前記第1のデータの集合と前記第2のデータの集合とに基づいて、教師なし特徴表現学習を用いて特徴抽出器を生成する生成手順と、
それぞれの前記第1のデータ及びそれぞれの前記第2のデータについて、前記特徴抽出器を用いて特徴情報を取得する取得手順と、
を前記コンピュータが実行し、
前記分類手順は、前記特徴情報に基づいて前記第1のデータの集合及び前記第2のデータの集合をクラスタに分類する、
ことを特徴とする請求項1記載のデータ選択方法。 - 前記選択手順は、前記特徴情報の分散が相対的に小さいクラスタからラベルの付与対象とする前記第2のデータを選択する、
ことを特徴とする請求項2載のデータ選択方法。 - 前記選択手順は、前記第1のデータを含まないクラスタにおいて、当該クラスタの中心からの距離が最小である前記特徴情報に係る前記第2のデータを選択する、
ことを特徴とする請求項2又は3記載のデータ選択方法。 - ラベルが付与された第1のデータの集合とラベルが付与されていない第2のデータの集合とに基づいて、前記第2のデータの集合のなかからラベルを付与する対象を選択するデータ選択装置であって、
前記第1のデータの集合に属するデータと、前記第2のデータの集合に属するデータとを、前記ラベルの種類よりも少なくとも1つ多い数のクラスタに分類する分類部と、
前記クラスタのうち、前記第1のデータを含まないクラスタからラベルの付与対象とする前記第2のデータを選択する選択部と、
をコンピュータが実行するデータ選択装置。 - 前記データ選択装置は、
前記第1のデータの集合と前記第2のデータの集合とに基づいて、教師なし特徴表現学習を用いて特徴抽出器を生成する生成部と、
それぞれの前記第1のデータ及びそれぞれの前記第2のデータについて、前記特徴抽出器を用いて特徴情報を取得する取得部と、
を有し、
前記分類部は、前記特徴情報に基づいて前記第1のデータの集合及び前記第2のデータの集合をクラスタに分類する、
ことを特徴とする請求項5記載のデータ選択装置。 - 前記選択部は、前記特徴情報の分散が相対的に小さいクラスタからラベルの付与対象とする前記第2のデータを選択する、
ことを特徴とする請求項6記載のデータ選択装置。 - 請求項1乃至4いずれか一項記載のデータ選択方法をコンピュータに実行させることを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/029807 WO2021019681A1 (ja) | 2019-07-30 | 2019-07-30 | データ選択方法、データ選択装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021019681A1 JPWO2021019681A1 (ja) | 2021-02-04 |
JP7222429B2 true JP7222429B2 (ja) | 2023-02-15 |
Family
ID=74229395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021536513A Active JP7222429B2 (ja) | 2019-07-30 | 2019-07-30 | データ選択方法、データ選択装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220335085A1 (ja) |
JP (1) | JP7222429B2 (ja) |
WO (1) | WO2021019681A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120095943A1 (en) | 2010-10-15 | 2012-04-19 | Yahoo! Inc. | System for training classifiers in multiple categories through active learning |
US20160275411A1 (en) | 2015-03-16 | 2016-09-22 | Xerox Corporation | Hybrid active learning for non-stationary streaming data with asynchronous labeling |
US20180032901A1 (en) | 2016-07-27 | 2018-02-01 | International Business Machines Corporation | Greedy Active Learning for Reducing User Interaction |
WO2018079020A1 (ja) | 2016-10-26 | 2018-05-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2018116921A1 (ja) | 2016-12-21 | 2018-06-28 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびプログラム記憶媒体 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11210604B1 (en) * | 2013-12-23 | 2021-12-28 | Groupon, Inc. | Processing dynamic data within an adaptive oracle-trained learning system using dynamic data set distribution optimization |
US20160232441A1 (en) * | 2015-02-05 | 2016-08-11 | International Business Machines Corporation | Scoring type coercion for question answering |
US9767565B2 (en) * | 2015-08-26 | 2017-09-19 | Digitalglobe, Inc. | Synthesizing training data for broad area geospatial object detection |
US9911033B1 (en) * | 2016-09-05 | 2018-03-06 | International Business Machines Corporation | Semi-supervised price tag detection |
US20180096261A1 (en) * | 2016-10-01 | 2018-04-05 | Intel Corporation | Unsupervised machine learning ensemble for anomaly detection |
US11482307B2 (en) * | 2017-03-02 | 2022-10-25 | Drexel University | Multi-temporal information object incremental learning software system |
WO2019051359A1 (en) * | 2017-09-08 | 2019-03-14 | The General Hospital Corporation | SYSTEM AND METHOD FOR AUTOMATICALLY LABELING AND ANNOUNTING NON-STRUCTURED MEDICAL DATA SETS |
US10679129B2 (en) * | 2017-09-28 | 2020-06-09 | D5Ai Llc | Stochastic categorical autoencoder network |
US10628527B2 (en) * | 2018-04-26 | 2020-04-21 | Microsoft Technology Licensing, Llc | Automatically cross-linking application programming interfaces |
US11238308B2 (en) * | 2018-06-26 | 2022-02-01 | Intel Corporation | Entropic clustering of objects |
US10635979B2 (en) * | 2018-07-20 | 2020-04-28 | Google Llc | Category learning neural networks |
US11321629B1 (en) * | 2018-09-26 | 2022-05-03 | Intuit Inc. | System and method for labeling machine learning inputs |
US10810513B2 (en) * | 2018-10-25 | 2020-10-20 | The Boeing Company | Iterative clustering for machine learning model building |
US11455570B2 (en) * | 2019-01-15 | 2022-09-27 | Ebay Inc. | Machine learning-based infrastructure anomaly and incident detection using multi-dimensional machine metrics |
US11295239B2 (en) * | 2019-04-17 | 2022-04-05 | International Business Machines Corporation | Peer assisted distributed architecture for training machine learning models |
US11562236B2 (en) * | 2019-08-20 | 2023-01-24 | Lg Electronics Inc. | Automatically labeling capability for training and validation data for machine learning |
-
2019
- 2019-07-30 US US17/631,396 patent/US20220335085A1/en active Pending
- 2019-07-30 WO PCT/JP2019/029807 patent/WO2021019681A1/ja active Application Filing
- 2019-07-30 JP JP2021536513A patent/JP7222429B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120095943A1 (en) | 2010-10-15 | 2012-04-19 | Yahoo! Inc. | System for training classifiers in multiple categories through active learning |
US20160275411A1 (en) | 2015-03-16 | 2016-09-22 | Xerox Corporation | Hybrid active learning for non-stationary streaming data with asynchronous labeling |
US20180032901A1 (en) | 2016-07-27 | 2018-02-01 | International Business Machines Corporation | Greedy Active Learning for Reducing User Interaction |
WO2018079020A1 (ja) | 2016-10-26 | 2018-05-03 | ソニー株式会社 | 情報処理装置および情報処理方法 |
WO2018116921A1 (ja) | 2016-12-21 | 2018-06-28 | 日本電気株式会社 | 辞書学習装置、辞書学習方法、データ認識方法およびプログラム記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2021019681A1 (ja) | 2021-02-04 |
US20220335085A1 (en) | 2022-10-20 |
JPWO2021019681A1 (ja) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10936911B2 (en) | Logo detection | |
CN109948478B (zh) | 基于神经网络的大规模非均衡数据的人脸识别方法、系统 | |
Wang et al. | Transferring rich feature hierarchies for robust visual tracking | |
Ilyas et al. | Query-efficient black-box adversarial examples (superceded) | |
US11915104B2 (en) | Normalizing text attributes for machine learning models | |
CA2843343C (en) | Systems and methods of detecting body movements using globally generated multi-dimensional gesture data | |
Bissoto et al. | Deep-learning ensembles for skin-lesion segmentation, analysis, classification: RECOD titans at ISIC challenge 2018 | |
US8606022B2 (en) | Information processing apparatus, method and program | |
RU2693916C1 (ru) | Распознавание символов с использованием иерархической классификации | |
US9734435B2 (en) | Recognition of hand poses by classification using discrete values | |
US11823453B2 (en) | Semi supervised target recognition in video | |
US10867246B1 (en) | Training a neural network using small training datasets | |
CN111723856B (zh) | 一种图像数据处理方法、装置、设备及可读存储介质 | |
WO2021034399A1 (en) | Negative sampling algorithm for enhanced image classification | |
CN116670687A (zh) | 用于调整训练后的物体检测模型以适应域偏移的方法和系统 | |
Solé et al. | Evaluation of random forests on large-scale classification problems using a bag-of-visual-words representation | |
Weber et al. | Automated labeling of electron microscopy images using deep learning | |
US11928182B1 (en) | Artificial intelligence system supporting semi-supervised learning with iterative stacking | |
Malygina et al. | GANs' N Lungs: improving pneumonia prediction | |
JP7222429B2 (ja) | データ選択方法、データ選択装置及びプログラム | |
Kim et al. | Sequential cross attention based multi-task learning | |
CN113344189B (zh) | 一种神经网络的训练方法、装置、计算机设备及存储介质 | |
Keyrouz et al. | Chemical structure recognition and prediction: A machine learning technique | |
JPWO2019123642A1 (ja) | 画像認識システム、方法およびプログラム、並びにパラメータ学習システム、方法およびプログラム | |
EP4128015A1 (en) | Class agnostic repetition counting in video(s) utilizing a temporal self-similarity matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7222429 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |