JPWO2023073837A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2023073837A5 JPWO2023073837A5 JP2023555957A JP2023555957A JPWO2023073837A5 JP WO2023073837 A5 JPWO2023073837 A5 JP WO2023073837A5 JP 2023555957 A JP2023555957 A JP 2023555957A JP 2023555957 A JP2023555957 A JP 2023555957A JP WO2023073837 A5 JPWO2023073837 A5 JP WO2023073837A5
- Authority
- JP
- Japan
- Prior art keywords
- data
- hot
- type
- machine learning
- categorical variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 claims 15
- 238000000034 method Methods 0.000 claims 10
- 230000004044 response Effects 0.000 claims 3
Claims (9)
- 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
処理をコンピュータに実行させることを特徴とするデータ修正プログラム。 - 前記ランク付け処理は、第1の属性の値別に、前記データを前記第1の成分の値の順に並べると共に、前記第1の成分の値が同一のデータを前記推測結果が示す値の順に並べてランクを設定することを含む、
請求項1に記載のデータ修正プログラム。 - 前記偏りを修正する処理は、前記第1の属性の値別に設定されたランクが同一のデータの前記第1の成分の値を、前記ランクが同一のデータの集合における前記第1の成分の値の中央値に修正することを含む、
請求項2に記載のデータ修正プログラム。 - 前記偏りを修正する処理は、修正後の前記第1種別のカテゴリ変数のOne-hot表現の整合性を保つように修正することを含む、
請求項1~請求項3のいずれか1項に記載のデータ修正プログラム。 - 前記One-hot表現の整合性を保つように修正する処理は、前記One-hot表現内にOne-hotの値が複数存在する場合には、前記推測結果に基づいて、複数のOne-hotの値のうち1つを残すように修正し、前記One-hot表現内にOne-hotの値が存在しない場合には、前記推測結果に基づいて、前記One-hot表現内のいずれかの成分の値をOne-hotの値に変更することを含む、
請求項4に記載のデータ修正プログラム。 - 前記機械学習モデルの推測結果は、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分に対する、前記第1の成分の値の確信度である、
請求項1~請求項5のいずれか1項に記載のデータ修正プログラム。 - 前記訓練データの全てを用いて前記機械学習モデルの機械学習を実行するか、又は、前記訓練データの一部を用いて前記機械学習モデルの機械学習を実行し、前記訓練データの残りを用いて、生成された機械学習モデルを検証する、
処理を前記コンピュータに実行させることを特徴とする請求項1~請求項6のいずれか1項に記載のデータ修正プログラム。 - 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
処理を実行する制御部を含むことを特徴とするデータ修正装置。 - 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
処理をコンピュータが実行することを特徴とするデータ修正方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/039692 WO2023073837A1 (ja) | 2021-10-27 | 2021-10-27 | データ修正プログラム、装置、及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023073837A1 JPWO2023073837A1 (ja) | 2023-05-04 |
JPWO2023073837A5 true JPWO2023073837A5 (ja) | 2024-05-10 |
Family
ID=86159238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023555957A Pending JPWO2023073837A1 (ja) | 2021-10-27 | 2021-10-27 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2023073837A1 (ja) |
WO (1) | WO2023073837A1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11281686B2 (en) * | 2018-06-04 | 2022-03-22 | Nec Corporation | Information processing apparatus, method, and program |
JP2020154828A (ja) * | 2019-03-20 | 2020-09-24 | 富士通株式会社 | データ補完プログラム、データ補完方法及びデータ補完装置 |
JP7376401B2 (ja) * | 2020-03-25 | 2023-11-08 | 株式会社日立製作所 | 情報処理システムおよび情報処理プログラム |
-
2021
- 2021-10-27 WO PCT/JP2021/039692 patent/WO2023073837A1/ja active Application Filing
- 2021-10-27 JP JP2023555957A patent/JPWO2023073837A1/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263921B (zh) | 一种联邦学习模型的训练方法及装置 | |
WO2017166449A1 (zh) | 机器学习模型生成方法和装置 | |
US20190102675A1 (en) | Generating and training machine learning systems using stored training datasets | |
RU2608886C2 (ru) | Ранжиратор результатов поиска | |
JP2024023651A5 (ja) | 機械学習のための計算機システム及びコンピュータプログラム | |
US20190102098A1 (en) | Configurable machine learning systems through graphical user interfaces | |
US20210224692A1 (en) | Hyperparameter tuning method, device, and program | |
US20130346400A1 (en) | Self-tuning alterations framework | |
US8972388B1 (en) | Demotion of already observed search query completions | |
JP2018530074A5 (ja) | ||
JP2019040335A (ja) | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム | |
CN112508190A (zh) | 结构化稀疏参数的处理方法、装置、设备及存储介质 | |
JP2023052555A5 (ja) | ||
JP6977733B2 (ja) | パラメータ最適化装置、パラメータ最適化方法、及びプログラム | |
JPWO2023073837A5 (ja) | ||
JPWO2021176572A5 (ja) | ||
JP7301801B2 (ja) | ハイパーパラメータチューニング方法、装置及びプログラム | |
WO2021124489A1 (ja) | 要約学習方法、要約学習装置及びプログラム | |
GB2610333A (en) | Computer implemented method for generating generalized additive models | |
JP2011118761A (ja) | 情報提示装置、情報提示方法、及びプログラム | |
JPWO2021229625A5 (ja) | ||
JPWO2022064570A5 (ja) | ||
KR102424342B1 (ko) | 섬네일 이미지 생성 방법 및 장치 | |
JPWO2021144992A5 (ja) | ||
WO2019064461A1 (ja) | 学習ネットワーク生成装置、及び学習ネットワーク生成プログラム |