JP7338483B2 - 学習用データ生成プログラム、装置、及び方法 - Google Patents
学習用データ生成プログラム、装置、及び方法 Download PDFInfo
- Publication number
- JP7338483B2 JP7338483B2 JP2020003962A JP2020003962A JP7338483B2 JP 7338483 B2 JP7338483 B2 JP 7338483B2 JP 2020003962 A JP2020003962 A JP 2020003962A JP 2020003962 A JP2020003962 A JP 2020003962A JP 7338483 B2 JP7338483 B2 JP 7338483B2
- Authority
- JP
- Japan
- Prior art keywords
- learning data
- noise
- data
- conditions
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Description
学習用データを取得し、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定し、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成し、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択し、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する、
処理をコンピュータに実行させることを特徴とする学習用データ生成プログラム。
前記統計学的手法により特定の数の条件を決定する処理は、前記複数のノイズ因子のうち、いずれの2つのノイズ因子についても前記いずれの2つのノイズ因子それぞれの各水準の全ての組み合わせが同数含まれるように、前記複数のノイズ因子それぞれの水準を組み合わせた特定の数の条件を決定する処理を含む、
ことを特徴とする付記1に記載の学習用データ生成プログラム。
前記モデルは、前記学習用データで学習済みのモデルである、
ことを特徴とする付記1又は付記2に記載の学習用データ生成プログラム。
前記複数のノイズ因子の1つは、前記学習用データに含まれる少なくとも一部のデータである、
ことを特徴とする付記1~付記3のいずれか1項に記載の学習用データ生成プログラム。
前記ノイズ因子を選択する処理は、ノイズ因子と水準との組を選択する処理を含む、
ことを特徴とする付記1~付記4のいずれか1項に記載の学習用データ生成プログラム。
前記ノイズ因子と水準を選択する処理は、ノイズ因子と水準との組毎に、前記ノイズ因子と水準との組を含む条件に従って変換された前記変換データを前記モデルへ入力することにより得られる、前記変換データが正解である確度を示す値の平均値を算出し、前記平均値が所定の閾値以下となる前記ノイズ因子と水準との組を選択する処理を含む、
ことを特徴とする付記5に記載の学習用データ生成プログラム。
前記新しい学習用データを生成する処理は、
選択された前記1又は複数のノイズ因子が外乱ノイズの場合、外乱ノイズを示すデータを前記学習用データに重畳することにより、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が内乱ノイズの場合、前記学習用データの幾何的変換により、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が敵対的攻撃によるノイズの場合、前記学習用データを、前記敵対的攻撃の手法に応じて変換することにより、前記新しい学習用データを生成する、
処理を含む、
ことを特徴とする付記1~付記6のいずれか1項に記載の学習用データ生成プログラム。
学習用データを取得する取得部と、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定する決定部と、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成する変換データ生成部と、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択する選択部と、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する学習用データ生成部と、
を含むことを特徴とする学習用データ生成装置。
前記決定部は、前記複数のノイズ因子のうち、いずれの2つのノイズ因子についても前記いずれの2つのノイズ因子それぞれの各水準の全ての組み合わせが同数含まれるように、前記複数のノイズ因子それぞれの水準を組み合わせた特定の数の条件を決定する、
ことを特徴とする付記8に記載の学習用データ生成装置。
前記モデルは、前記学習用データで学習済みのモデルである、
ことを特徴とする付記8又は付記9に記載の学習用データ生成装置。
前記複数のノイズ因子の1つは、前記学習用データに含まれる少なくとも一部のデータである、
ことを特徴とする付記8~付記10のいずれか1項に記載の学習用データ生成装置。
前記選択部は、ノイズ因子と水準との組を選択する、
ことを特徴とする付記8~付記11のいずれか1項に記載の学習用データ生成装置。
前記選択部は、ノイズ因子と水準との組毎に、前記ノイズ因子と水準との組を含む条件に従って変換された前記変換データを前記モデルへ入力することにより得られる、前記変換データが正解である確度を示す値の平均値を算出し、前記平均値が所定の閾値以下となる前記ノイズ因子と水準との組を選択する、
ことを特徴とする付記12に記載の学習用データ生成装置。
前記学習用データ生成部は、
選択された前記1又は複数のノイズ因子が外乱ノイズの場合、外乱ノイズを示すデータを前記学習用データに重畳することにより、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が内乱ノイズの場合、前記学習用データの幾何的変換により、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が敵対的攻撃によるノイズの場合、前記学習用データを、前記敵対的攻撃の手法に応じて変換することにより、前記新しい学習用データを生成する、
処理を含む、
ことを特徴とする付記8~付記13のいずれか1項に記載の学習用データ生成装置。
学習用データを取得し、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定し、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成し、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択し、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する、
処理をコンピュータが実行することを特徴とする学習用データ生成方法。
前記統計学的手法により特定の数の条件を決定する処理は、前記複数のノイズ因子のうち、いずれの2つのノイズ因子についても前記いずれの2つのノイズ因子それぞれの各水準の全ての組み合わせが同数含まれるように、前記複数のノイズ因子それぞれの水準を組み合わせた特定の数の条件を決定する処理を含む、
ことを特徴とする付記15に記載の学習用データ生成方法。
前記モデルは、前記学習用データで学習済みのモデルである、
ことを特徴とする付記15又は付記16に記載の学習用データ生成方法。
前記複数のノイズ因子の1つは、前記学習用データに含まれる少なくとも一部のデータである、
ことを特徴とする付記15~付記17のいずれか1項に記載の学習用データ生成方法。
前記ノイズ因子を選択する処理は、ノイズ因子と水準との組を選択する処理を含む、
ことを特徴とする付記15~付記18のいずれか1項に記載の学習用データ生成方法。
学習用データを取得し、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定し、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成し、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択し、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する、
処理をコンピュータに実行させることを特徴とする学習用データ生成プログラムを記憶した記憶媒体。
11 取得部
12 決定部
13 変換データ生成部
14 選択部
15 学習用データ生成部
20 ノイズ情報DB
22 学習済みモデル
40 コンピュータ
41 CPU
42 メモリ
43 記憶部
49 記憶媒体
50 学習用データ生成プログラム
Claims (9)
- 学習用データを取得し、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定し、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成し、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択し、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する、
処理をコンピュータに実行させることを特徴とする学習用データ生成プログラム。 - 前記統計学的手法により特定の数の条件を決定する処理は、前記複数のノイズ因子のうち、いずれの2つのノイズ因子についても前記いずれの2つのノイズ因子それぞれの各水準の全ての組み合わせが同数含まれるように、前記複数のノイズ因子それぞれの水準を組み合わせた特定の数の条件を決定する処理を含む、
ことを特徴とする請求項1に記載の学習用データ生成プログラム。 - 前記モデルは、前記学習用データで学習済みのモデルである、
ことを特徴とする請求項1又は請求項2に記載の学習用データ生成プログラム。 - 前記複数のノイズ因子の1つは、前記学習用データに含まれる少なくとも一部のデータである、
ことを特徴とする請求項1~請求項3のいずれか1項に記載の学習用データ生成プログラム。 - 前記ノイズ因子を選択する処理は、ノイズ因子と水準との組を選択する処理を含む、
ことを特徴とする請求項1~請求項4のいずれか1項に記載の学習用データ生成プログラム。 - 前記ノイズ因子と水準を選択する処理は、ノイズ因子と水準との組毎に、前記ノイズ因子と水準との組を含む条件に従って変換された前記変換データを前記モデルへ入力することにより得られる、前記変換データが正解である確度を示す値の平均値を算出し、前記平均値が所定の閾値以下となる前記ノイズ因子と水準との組を選択する処理を含む、
ことを特徴とする請求項5に記載の学習用データ生成プログラム。 - 前記新しい学習用データを生成する処理は、
選択された前記1又は複数のノイズ因子が外乱ノイズの場合、外乱ノイズを示すデータを前記学習用データに重畳することにより、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が内乱ノイズの場合、前記学習用データの幾何的変換により、前記新しい学習用データを生成し、
選択された前記1又は複数のノイズ因子が敵対的攻撃によるノイズの場合、前記学習用データを、前記敵対的攻撃の手法に応じて変換することにより、前記新しい学習用データを生成する、
処理を含む、
ことを特徴とする請求項1~請求項6のいずれか1項に記載の学習用データ生成プログラム。 - 学習用データを取得する取得部と、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定する決定部と、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成する変換データ生成部と、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択する選択部と、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する学習用データ生成部と、
を含むことを特徴とする学習用データ生成装置。 - 学習用データを取得し、
前記学習用データに対する変換条件を示す複数のノイズ因子それぞれの水準を組み合わせた複数の条件から、統計学的手法により特定の数の条件を決定し、
決定した前記特定の数の条件のそれぞれに従って、前記学習用データに含まれる少なくとも一部のデータを変換することによって、特定の数の変換データを生成し、
前記特定の数の変換データのモデルへの入力に応じて出力された結果に基づいて、前記複数のノイズ因子から1又は複数のノイズ因子を選択し、
選択された前記1又は複数のノイズ因子に基づいて前記学習用データを変換することにより、前記モデルの機械学習のための新しい学習用データを生成する、
処理をコンピュータが実行することを特徴とする学習用データ生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020003962A JP7338483B2 (ja) | 2020-01-14 | 2020-01-14 | 学習用データ生成プログラム、装置、及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020003962A JP7338483B2 (ja) | 2020-01-14 | 2020-01-14 | 学習用データ生成プログラム、装置、及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111232A JP2021111232A (ja) | 2021-08-02 |
JP7338483B2 true JP7338483B2 (ja) | 2023-09-05 |
Family
ID=77059965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020003962A Active JP7338483B2 (ja) | 2020-01-14 | 2020-01-14 | 学習用データ生成プログラム、装置、及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7338483B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024013911A1 (ja) * | 2022-07-13 | 2024-01-18 | 日本電信電話株式会社 | 学習装置、学習方法、学習プログラム、推論装置、推論方法、及び推論プログラム |
JP7344501B1 (ja) * | 2023-03-29 | 2023-09-14 | AI inside株式会社 | プログラム、方法、情報処理装置、システム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004219918A (ja) | 2003-01-17 | 2004-08-05 | Canon Inc | 音声認識環境判定方法 |
JP2014002497A (ja) | 2012-06-18 | 2014-01-09 | Shindengen Electric Mfg Co Ltd | 電子機器の捺印シンボル検査装置、及びその方法 |
JP2018048967A (ja) | 2016-09-23 | 2018-03-29 | 日本電気通信システム株式会社 | 測位用地磁気マップの作成方法、位置測定方法、外的要因ノイズ測定方法及び測位用地磁気マップの作成システム |
-
2020
- 2020-01-14 JP JP2020003962A patent/JP7338483B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004219918A (ja) | 2003-01-17 | 2004-08-05 | Canon Inc | 音声認識環境判定方法 |
JP2014002497A (ja) | 2012-06-18 | 2014-01-09 | Shindengen Electric Mfg Co Ltd | 電子機器の捺印シンボル検査装置、及びその方法 |
JP2018048967A (ja) | 2016-09-23 | 2018-03-29 | 日本電気通信システム株式会社 | 測位用地磁気マップの作成方法、位置測定方法、外的要因ノイズ測定方法及び測位用地磁気マップの作成システム |
Also Published As
Publication number | Publication date |
---|---|
JP2021111232A (ja) | 2021-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6855091B2 (ja) | ニューラルネットワーク学習に利用されるオートラベリングされたイメージのうちでラベル検収のためのサンプルイメージを取得する方法、及びそれを利用したサンプルイメージ取得装置 | |
JP7338483B2 (ja) | 学習用データ生成プログラム、装置、及び方法 | |
CN111414987A (zh) | 神经网络的训练方法、训练装置和电子设备 | |
CN110852447A (zh) | 元学习方法和装置、初始化方法、计算设备和存储介质 | |
JP7047498B2 (ja) | 学習プログラム、学習方法および学習装置 | |
JP6856853B2 (ja) | 極限状況においてフォールトトレランス及びフラクチュエーションロバスト性を向上させるために、ジッタリングが起きたイメージを安定化させるプロセスで生成されたワーピングされたイメージに発生した歪曲を、ganを利用して減らすための学習方法及び学習装置、そしてそれを利用したテスト方法及びテスト装置 | |
CN110674865B (zh) | 面向软件缺陷类分布不平衡的规则学习分类器集成方法 | |
JP7268756B2 (ja) | 劣化抑制プログラム、劣化抑制方法および情報処理装置 | |
WO2020022144A1 (ja) | 画像認識学習装置、画像認識装置、方法、及びプログラム | |
CN111027428A (zh) | 一种多任务模型的训练方法、装置及电子设备 | |
JP2020140466A (ja) | 訓練データ拡張装置、方法、及びプログラム | |
CN111178435A (zh) | 一种分类模型训练方法、系统、电子设备及存储介质 | |
CN111079930A (zh) | 数据集质量参数的确定方法、装置及电子设备 | |
WO2020075462A1 (ja) | 学習器推定装置、学習器推定方法、リスク評価装置、リスク評価方法、プログラム | |
Chu et al. | Variational cross-network embedding for anonymized user identity linkage | |
CN110705622A (zh) | 一种决策方法、系统以及电子设备 | |
KR20210001890A (ko) | 고문서 이미지 광학 문자 판독 장치 및 방법 | |
JP7172067B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN110705631A (zh) | 一种基于svm的散货船舶设备状态检测方法 | |
US20220138627A1 (en) | Computer-readable recording medium storing machine learning program, machine learning apparatus, and machine learning method | |
CN115543762A (zh) | 一种磁盘smart数据扩充方法、系统及电子设备 | |
Müller et al. | Application of deep learning for crack segmentation on concrete surface | |
CN112884145A (zh) | 用于数据中心的智能散热效果检测的神经网络的训练方法 | |
WO2024154270A1 (ja) | 摂動領域推定プログラム、装置、及び方法 | |
WO2021111832A1 (ja) | 情報処理方法、情報処理システム及び情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230725 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230807 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7338483 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |