JP2017167834A - 学習データ選択装置 - Google Patents
学習データ選択装置 Download PDFInfo
- Publication number
- JP2017167834A JP2017167834A JP2016052718A JP2016052718A JP2017167834A JP 2017167834 A JP2017167834 A JP 2017167834A JP 2016052718 A JP2016052718 A JP 2016052718A JP 2016052718 A JP2016052718 A JP 2016052718A JP 2017167834 A JP2017167834 A JP 2017167834A
- Authority
- JP
- Japan
- Prior art keywords
- learning data
- data
- unlabeled
- learning
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】記憶部2はデータが属するクラスを示すラベルが付与されたラベル有り学習データ22と、ラベルが付与されていないラベル無し学習データ23とを記憶する。解析手段52はラベル有り学習データによって学習した識別器(識別器情報21)を用い、ラベル無し学習データに対する識別スコアを算出する。選択手段53はデータの特徴ベクトルが定義される特徴空間においてラベル無し学習データ23をクラスタリングして複数のクラスタを生成し、当該ラベル無しクラスタから識別スコアに基づいて識別器の識別境界に近い順に所定数の低信頼度クラスタを選択し、当該低信頼度クラスタのそれぞれから所定の均等な割当個数のラベル無し学習データを能動学習のために選択する。
【選択図】図1
Description
能動学習装置1は本発明に係る学習データ選択装置、及びオラクルとのインターフェース手段を有する。図1は能動学習装置1の概略の構成を示すブロック図である。能動学習装置1は記憶部2、表示部3、入力部4及び制御部5から構成される。このうち、専ら、記憶部2及び制御部5の解析手段52と選択手段53が学習データ選択装置として機能し、一方、表示部3及び入力部4が制御部5の制御の下、インターフェース手段として機能する。具体的には、制御部5は、記憶部2に記憶されたラベル無し学習データの中からオラクルに提示するデータを自動選択して表示部3に出力する。そして、制御部5は、提示したデータに対してオラクルが判別した正解ラベルを入力部4を介して取得し、ラベルを付与したデータをラベル有り学習データに移動させる。さらに制御部5はラベル有り学習データを用いて識別器を学習する機能を有する。能動学習装置1はこれらを繰り返し行う。以下、能動学習装置1の各部について詳細に説明する。
図2は能動学習装置1による能動学習における概略の処理フロー図である。
(1)ラベル無しクラスタの数Kはデータ収集の多様性度合に関係するパラメータである。図4、図5はパラメータKの違いと、多様性度合の違いとの関係を説明する模式図である。図4は能動学習の過程におけるラベル無し学習データ23及び識別境界60の例を2次元の特徴空間にて示している。図にプロットした“+”,“○”は属性クラスが異なるデータを表しており、例えば“+”は「男性」の顔画像データ、“○”は「女性」の顔画像データであるとする。なお、識別境界60は現時点までの学習に基づき推定された境界であり、推定クラスの境界である。識別境界60より左側の領域の各データの推定クラスは「男性」であり、当該領域に存在する“○”はクラスを誤推定されているデータである。同様に識別境界60より右側の領域の各データの推定クラスは「女性」であり、当該領域に存在する“+”はクラスを誤推定されているデータである。
(1)図2のステップS3に関し、データ収集の初期からKをLよりも非常に大きい値に設定すると、図5(a)に示すように、誤推定しているデータのラベル無しクラスタが低信頼度クラスタとして選ばれにくくなるため、最適な識別境界が得られにくくなりやすい。つまり初期値依存問題が起こりやすくなる。
Claims (6)
- データが属するクラスを識別する識別器の能動学習のために利用者に提示する学習データを選択する学習データ選択装置であって、
前記クラスを示すラベルが付与されたラベル有り学習データと、前記ラベルが付与されていないラベル無し学習データとを記憶する記憶部と、
前記ラベル有り学習データによって学習した前記識別器を用い、前記ラベル無し学習データに対する識別スコアを算出する解析手段と、
前記データの特徴ベクトルが定義される特徴空間において前記ラベル無し学習データをクラスタリングして複数のラベル無しクラスタを生成し、当該ラベル無しクラスタから前記識別スコアに基づいて前記識別器の識別境界に近い所定数の低信頼度クラスタを選択し、当該低信頼度クラスタのそれぞれから所定の均等な割当個数の前記ラベル無し学習データを前記能動学習のために選択する選択手段と、
を有することを特徴とする学習データ選択装置。 - 前記解析手段は、前記識別スコアに基づき前記各ラベル無し学習データについて前記クラスを推定し、
前記選択手段は、前記クラスごとに前記ラベル無しクラスタを生成し、前記クラスそれぞれから所定の同数の前記低信頼度クラスタを選択すること、
を特徴とする請求項1に記載の学習データ選択装置。 - 前記選択手段は、前記ラベル無しクラスタの数及び前記低信頼度クラスタの数を、それらの差が前記能動学習を繰り返すに従って大きくなるように設定すること、を特徴とする請求項1又は請求項2に記載の学習データ選択装置。
- 前記選択手段は、前記各低信頼度クラスタを所定数のサブクラスタにクラスタリングし、当該サブクラスタのそれぞれから所定の均等な個数の前記ラベル無し学習データを選択すること、を特徴とする請求項1から請求項3のいずれか1つに記載の学習データ選択装置。
- 前記選択手段は、前記各低信頼度クラスタにて、前記特徴空間における前記ラベル有り学習データまでの距離が大きいものから順に前記ラベル無し学習データを選択すること、を特徴とする請求項1から請求項3のいずれか1つに記載の学習データ選択装置。
- 前記選択手段は、前記各低信頼度クラスタにて、前記ラベル無し学習データの前記識別スコアの範囲を前記割当個数の区間に等分し、当該各区間から前記識別スコアの絶対値が最小である前記ラベル無し学習データを1つずつ選択すること、を特徴とする請求項1から請求項3のいずれか1つに記載の学習データ選択装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016052718A JP6364037B2 (ja) | 2016-03-16 | 2016-03-16 | 学習データ選択装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016052718A JP6364037B2 (ja) | 2016-03-16 | 2016-03-16 | 学習データ選択装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017167834A true JP2017167834A (ja) | 2017-09-21 |
JP6364037B2 JP6364037B2 (ja) | 2018-07-25 |
Family
ID=59910043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016052718A Active JP6364037B2 (ja) | 2016-03-16 | 2016-03-16 | 学習データ選択装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6364037B2 (ja) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019087006A (ja) * | 2017-11-07 | 2019-06-06 | 株式会社アイ・アール・ディー | 特許情報処理装置、特許情報処理方法およびプログラム |
JP2019106119A (ja) * | 2017-12-14 | 2019-06-27 | オムロン株式会社 | 検出システム、情報処理装置、評価方法及びプログラム |
WO2019172451A1 (ja) * | 2018-03-08 | 2019-09-12 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
JP2019159576A (ja) * | 2018-03-09 | 2019-09-19 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
JP2020035039A (ja) * | 2018-08-28 | 2020-03-05 | 株式会社東芝 | 更新支援装置、更新支援方法およびプログラム |
JP2020052783A (ja) * | 2018-09-27 | 2020-04-02 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
KR102131353B1 (ko) * | 2020-01-29 | 2020-07-07 | 주식회사 이글루시큐리티 | 머신 러닝의 예측 데이터 피드백 적용 방법 및 그 시스템 |
KR102159880B1 (ko) * | 2019-05-15 | 2020-09-24 | 한국과학기술원 | 메타 인지 기반 고속 환경 탐색 방법 및 장치 |
JP2020190935A (ja) * | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
CN112149721A (zh) * | 2020-09-10 | 2020-12-29 | 南京大学 | 一种基于主动学习降低标注需求的目标检测方法 |
KR20210013292A (ko) * | 2018-07-31 | 2021-02-03 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 기록 매체 및 정보 처리 방법 |
JP2021047751A (ja) * | 2019-09-20 | 2021-03-25 | 株式会社東芝 | 能動学習装置、能動学習方法及びプログラム |
CN113076437A (zh) * | 2021-04-13 | 2021-07-06 | 华南理工大学 | 一种基于标签重分配的小样本图像分类方法及系统 |
JP2021520529A (ja) * | 2019-04-03 | 2021-08-19 | リイイド インク | アクティブ学習手法を適用した機械学習フレームワークの運用方法、装置及びコンピュータプログラム |
WO2021176529A1 (ja) * | 2020-03-02 | 2021-09-10 | 日本電信電話株式会社 | 学習方法、学習システム、デバイス、学習装置、およびプログラム |
JP2021524955A (ja) * | 2019-04-16 | 2021-09-16 | ワン・コネクト・スマート・テクノロジー・カンパニー・リミテッド・(シェンチェン) | 肖像属性モデル構築方法、装置、コンピュータ機器および記憶媒体 |
JP2021179885A (ja) * | 2020-05-15 | 2021-11-18 | 三菱電機株式会社 | 分類装置、分類方法、及び、プログラム |
WO2022014386A1 (ja) * | 2020-07-15 | 2022-01-20 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法 |
KR20220042237A (ko) * | 2019-09-30 | 2022-04-04 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 및 정보 처리 방법 |
US11308352B2 (en) | 2019-02-28 | 2022-04-19 | Canon Kabushiki Kaisha | Apparatus for processing labeled data to be used in learning of discriminator, method of controlling the apparatus, and non-transitory computer-readable recording medium |
JP2022547003A (ja) * | 2019-11-13 | 2022-11-10 | エヌイーシー ラボラトリーズ アメリカ インク | ラベル付けされていない顔データにわたるクラスタリングに基づく深層顔認識 |
WO2022249572A1 (ja) * | 2021-05-26 | 2022-12-01 | ソニーグループ株式会社 | 画像処理装置、画像処理方法及び記録媒体 |
DE112021006984T5 (de) | 2021-02-05 | 2023-11-16 | Mitsubishi Electric Corporation | Informationsverarbeitungseinrichtung, auswahlausgabe- verfahren und auswahlausgabeprogramm |
JP7473389B2 (ja) | 2020-05-14 | 2024-04-23 | 株式会社日立製作所 | 学習モデル生成システム、及び学習モデル生成方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008276775A (ja) * | 2007-04-25 | 2008-11-13 | Fujitsu Ltd | 画像検索装置 |
-
2016
- 2016-03-16 JP JP2016052718A patent/JP6364037B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008276775A (ja) * | 2007-04-25 | 2008-11-13 | Fujitsu Ltd | 画像検索装置 |
Non-Patent Citations (1)
Title |
---|
DINO IENCO 外3名: "Clustering Based Active Learning for Evolving Data Streams", [ONLINE], JPN6018022179, 2013, ISSN: 0003816378 * |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019087006A (ja) * | 2017-11-07 | 2019-06-06 | 株式会社アイ・アール・ディー | 特許情報処理装置、特許情報処理方法およびプログラム |
JP7054436B2 (ja) | 2017-12-14 | 2022-04-14 | オムロン株式会社 | 検出システム、情報処理装置、評価方法及びプログラム |
JP2019106119A (ja) * | 2017-12-14 | 2019-06-27 | オムロン株式会社 | 検出システム、情報処理装置、評価方法及びプログラム |
JP2021184299A (ja) * | 2018-03-08 | 2021-12-02 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
JP7239853B2 (ja) | 2018-03-08 | 2023-03-15 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
JP2019159499A (ja) * | 2018-03-08 | 2019-09-19 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
CN111868780A (zh) * | 2018-03-08 | 2020-10-30 | Jvc建伍株式会社 | 学习用数据生成装置、学习用模型生成系统、学习用数据生成方法以及程序 |
WO2019172451A1 (ja) * | 2018-03-08 | 2019-09-12 | 株式会社Jvcケンウッド | 学習用データ作成装置、学習用モデル作成システム、学習用データ作成方法、及びプログラム |
CN111868780B (zh) * | 2018-03-08 | 2023-07-28 | Jvc建伍株式会社 | 学习用数据生成装置及方法、模型生成系统以及程序 |
JP2019159576A (ja) * | 2018-03-09 | 2019-09-19 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
JP7024515B2 (ja) | 2018-03-09 | 2022-02-24 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
KR102334489B1 (ko) | 2018-07-31 | 2021-12-02 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 기록 매체 및 정보 처리 방법 |
KR20210013292A (ko) * | 2018-07-31 | 2021-02-03 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 기록 매체 및 정보 처리 방법 |
JP2020035039A (ja) * | 2018-08-28 | 2020-03-05 | 株式会社東芝 | 更新支援装置、更新支援方法およびプログラム |
JP2020052783A (ja) * | 2018-09-27 | 2020-04-02 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
JP7005463B2 (ja) | 2018-09-27 | 2022-01-21 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
US11308352B2 (en) | 2019-02-28 | 2022-04-19 | Canon Kabushiki Kaisha | Apparatus for processing labeled data to be used in learning of discriminator, method of controlling the apparatus, and non-transitory computer-readable recording medium |
US11741683B2 (en) | 2019-02-28 | 2023-08-29 | Canon Kabushiki Kaisha | Apparatus for processing labeled data to be used in learning of discriminator, method of controlling the apparatus, and non-transitory computer-readable recording medium |
JP2021520529A (ja) * | 2019-04-03 | 2021-08-19 | リイイド インク | アクティブ学習手法を適用した機械学習フレームワークの運用方法、装置及びコンピュータプログラム |
JP7054558B2 (ja) | 2019-04-03 | 2022-04-14 | リイイド インク | アクティブ学習手法を適用した機械学習フレームワークの運用方法、装置及びコンピュータプログラム |
JP2021524955A (ja) * | 2019-04-16 | 2021-09-16 | ワン・コネクト・スマート・テクノロジー・カンパニー・リミテッド・(シェンチェン) | 肖像属性モデル構築方法、装置、コンピュータ機器および記憶媒体 |
KR102159880B1 (ko) * | 2019-05-15 | 2020-09-24 | 한국과학기술원 | 메타 인지 기반 고속 환경 탐색 방법 및 장치 |
JP2020190935A (ja) * | 2019-05-22 | 2020-11-26 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
JP7197795B2 (ja) | 2019-05-22 | 2022-12-28 | 富士通株式会社 | 機械学習プログラム、機械学習方法および機械学習装置 |
JP7350587B2 (ja) | 2019-09-20 | 2023-09-26 | 株式会社東芝 | 能動学習装置、能動学習方法及びプログラム |
JP2021047751A (ja) * | 2019-09-20 | 2021-03-25 | 株式会社東芝 | 能動学習装置、能動学習方法及びプログラム |
KR20220042237A (ko) * | 2019-09-30 | 2022-04-04 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 및 정보 처리 방법 |
KR102458999B1 (ko) | 2019-09-30 | 2022-10-25 | 미쓰비시덴키 가부시키가이샤 | 정보 처리 장치, 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 및 정보 처리 방법 |
JP7289012B2 (ja) | 2019-11-13 | 2023-06-08 | エヌイーシー ラボラトリーズ アメリカ インク | ラベル付けされていない顔データにわたるクラスタリングに基づく深層顔認識 |
JP2022547003A (ja) * | 2019-11-13 | 2022-11-10 | エヌイーシー ラボラトリーズ アメリカ インク | ラベル付けされていない顔データにわたるクラスタリングに基づく深層顔認識 |
KR102131353B1 (ko) * | 2020-01-29 | 2020-07-07 | 주식회사 이글루시큐리티 | 머신 러닝의 예측 데이터 피드백 적용 방법 및 그 시스템 |
WO2021176529A1 (ja) * | 2020-03-02 | 2021-09-10 | 日本電信電話株式会社 | 学習方法、学習システム、デバイス、学習装置、およびプログラム |
JP7445171B2 (ja) | 2020-03-02 | 2024-03-07 | 日本電信電話株式会社 | 学習方法、学習システム、デバイス、学習装置、およびプログラム |
JP7473389B2 (ja) | 2020-05-14 | 2024-04-23 | 株式会社日立製作所 | 学習モデル生成システム、及び学習モデル生成方法 |
JP7006724B2 (ja) | 2020-05-15 | 2022-01-24 | 三菱電機株式会社 | 分類装置、分類方法、及び、プログラム |
JP2021179885A (ja) * | 2020-05-15 | 2021-11-18 | 三菱電機株式会社 | 分類装置、分類方法、及び、プログラム |
WO2022014386A1 (ja) * | 2020-07-15 | 2022-01-20 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法 |
CN112149721B (zh) * | 2020-09-10 | 2023-11-17 | 南京大学 | 一种基于主动学习降低标注需求的目标检测方法 |
CN112149721A (zh) * | 2020-09-10 | 2020-12-29 | 南京大学 | 一种基于主动学习降低标注需求的目标检测方法 |
DE112021006984T5 (de) | 2021-02-05 | 2023-11-16 | Mitsubishi Electric Corporation | Informationsverarbeitungseinrichtung, auswahlausgabe- verfahren und auswahlausgabeprogramm |
CN113076437A (zh) * | 2021-04-13 | 2021-07-06 | 华南理工大学 | 一种基于标签重分配的小样本图像分类方法及系统 |
CN113076437B (zh) * | 2021-04-13 | 2023-02-14 | 华南理工大学 | 一种基于标签重分配的小样本图像分类方法及系统 |
WO2022249572A1 (ja) * | 2021-05-26 | 2022-12-01 | ソニーグループ株式会社 | 画像処理装置、画像処理方法及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6364037B2 (ja) | 2018-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6364037B2 (ja) | 学習データ選択装置 | |
CN111373417B (zh) | 与基于度量学习的数据分类相关的设备及其方法 | |
US10515110B2 (en) | Image based search | |
JP5506722B2 (ja) | マルチクラス分類器をトレーニングするための方法 | |
US8595233B2 (en) | Data processing apparatus, data processing method, program, and integrated circuit | |
US20230252072A1 (en) | Textual and image based search | |
O'Donovan et al. | Exploratory font selection using crowdsourced attributes | |
Hajimirsadeghi et al. | Visual recognition by counting instances: A multi-instance cardinality potential kernel | |
McCann et al. | Local naive bayes nearest neighbor for image classification | |
Vijayanarasimhan et al. | Multi-level active prediction of useful image annotations for recognition | |
JP2013125322A (ja) | 学習装置、プログラム及び学習方法 | |
JP2011013732A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20180260737A1 (en) | Information processing device, information processing method, and computer-readable medium | |
JP2012203422A (ja) | 学習装置、方法及びプログラム | |
WO2021096799A1 (en) | Deep face recognition based on clustering over unlabeled face data | |
JP2017084078A (ja) | スタイル検索装置、方法、及びプログラム | |
JP7350587B2 (ja) | 能動学習装置、能動学習方法及びプログラム | |
JP2021163310A (ja) | 表示制御装置、表示制御方法及びプログラム | |
US20220284499A1 (en) | Feature-level recommendations for content items | |
US20220358357A1 (en) | Utilizing a neural network model to predict content memorability based on external and biometric factors | |
JP2016062249A (ja) | 識別辞書学習システム、認識辞書学習方法および認識辞書学習プログラム | |
JP5633424B2 (ja) | プログラム及び情報処理システム | |
US20220309333A1 (en) | Utilizing neural network models to determine content placement based on memorability | |
CN112988699B (zh) | 模型训练方法、数据标签的生成方法及装置 | |
Boroujerdi et al. | Deep interactive region segmentation and captioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180619 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6364037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |