JPWO2023073837A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2023073837A5
JPWO2023073837A5 JP2023555957A JP2023555957A JPWO2023073837A5 JP WO2023073837 A5 JPWO2023073837 A5 JP WO2023073837A5 JP 2023555957 A JP2023555957 A JP 2023555957A JP 2023555957 A JP2023555957 A JP 2023555957A JP WO2023073837 A5 JPWO2023073837 A5 JP WO2023073837A5
Authority
JP
Japan
Prior art keywords
data
hot
type
machine learning
categorical variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023555957A
Other languages
English (en)
Other versions
JPWO2023073837A1 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2021/039692 external-priority patent/WO2023073837A1/ja
Publication of JPWO2023073837A1 publication Critical patent/JPWO2023073837A1/ja
Publication of JPWO2023073837A5 publication Critical patent/JPWO2023073837A5/ja
Pending legal-status Critical Current

Links

Claims (9)

  1. 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
    前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
    前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
    処理をコンピュータに実行させることを特徴とするデータ修正プログラム。
  2. 前記ランク付け処理は、第1の属性の値別に、前記データを前記第1の成分の値の順に並べると共に、前記第1の成分の値が同一のデータを前記推測結果が示す値の順に並べてランクを設定することを含む、
    請求項1に記載のデータ修正プログラム。
  3. 前記偏りを修正する処理は、前記第1の属性の値別に設定されたランクが同一のデータの前記第1の成分の値を、前記ランクが同一のデータの集合における前記第1の成分の値の中央値に修正することを含む、
    請求項2に記載のデータ修正プログラム。
  4. 前記偏りを修正する処理は、修正後の前記第1種別のカテゴリ変数のOne-hot表現の整合性を保つように修正することを含む、
    請求項1~請求項3のいずれか1項に記載のデータ修正プログラム。
  5. 前記One-hot表現の整合性を保つように修正する処理は、前記One-hot表現内にOne-hotの値が複数存在する場合には、前記推測結果に基づいて、複数のOne-hotの値のうち1つを残すように修正し、前記One-hot表現内にOne-hotの値が存在しない場合には、前記推測結果に基づいて、前記One-hot表現内のいずれかの成分の値をOne-hotの値に変更することを含む、
    請求項4に記載のデータ修正プログラム。
  6. 前記機械学習モデルの推測結果は、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分に対する、前記第1の成分の値の確信度である、
    請求項1~請求項5のいずれか1項に記載のデータ修正プログラム。
  7. 前記訓練データの全てを用いて前記機械学習モデルの機械学習を実行するか、又は、前記訓練データの一部を用いて前記機械学習モデルの機械学習を実行し、前記訓練データの残りを用いて、生成された機械学習モデルを検証する、
    処理を前記コンピュータに実行させることを特徴とする請求項1~請求項6のいずれか1項に記載のデータ修正プログラム。
  8. 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
    前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
    前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
    処理を実行する制御部を含むことを特徴とするデータ修正装置。
  9. 第1の複数のデータのそれぞれに含まれる第1種別のカテゴリ変数をOne-hot表現に変更した第2の複数のデータを生成し、
    前記第2の複数のデータそれぞれに含まれる前記第1種別のカテゴリ変数のOne-hot表現の第1の成分を目的変数とし、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を説明変数とする訓練データに基づいて生成された機械学習モデルに、前記第2の複数のデータのうち前記第1種別のカテゴリ変数のOne-hot表現以外の部分を入力した場合の前記機械学習モデルの推測結果に基づいて前記第2の複数のデータのそれぞれをランク付けし、
    前記ランク付け処理の結果に基づいて、前記第2の複数のデータにおける前記第1種別のカテゴリ変数の各属性の偏りを修正することによって第3の複数のデータを生成する、
    処理をコンピュータが実行することを特徴とするデータ修正方法。
JP2023555957A 2021-10-27 2021-10-27 Pending JPWO2023073837A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/039692 WO2023073837A1 (ja) 2021-10-27 2021-10-27 データ修正プログラム、装置、及び方法

Publications (2)

Publication Number Publication Date
JPWO2023073837A1 JPWO2023073837A1 (ja) 2023-05-04
JPWO2023073837A5 true JPWO2023073837A5 (ja) 2024-05-10

Family

ID=86159238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023555957A Pending JPWO2023073837A1 (ja) 2021-10-27 2021-10-27

Country Status (2)

Country Link
JP (1) JPWO2023073837A1 (ja)
WO (1) WO2023073837A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11281686B2 (en) * 2018-06-04 2022-03-22 Nec Corporation Information processing apparatus, method, and program
JP2020154828A (ja) * 2019-03-20 2020-09-24 富士通株式会社 データ補完プログラム、データ補完方法及びデータ補完装置
JP7376401B2 (ja) * 2020-03-25 2023-11-08 株式会社日立製作所 情報処理システムおよび情報処理プログラム

Similar Documents

Publication Publication Date Title
CN110263921B (zh) 一种联邦学习模型的训练方法及装置
WO2017166449A1 (zh) 机器学习模型生成方法和装置
US20190102675A1 (en) Generating and training machine learning systems using stored training datasets
RU2608886C2 (ru) Ранжиратор результатов поиска
JP2024023651A5 (ja) 機械学習のための計算機システム及びコンピュータプログラム
US20190102098A1 (en) Configurable machine learning systems through graphical user interfaces
US20210224692A1 (en) Hyperparameter tuning method, device, and program
US20130346400A1 (en) Self-tuning alterations framework
US8972388B1 (en) Demotion of already observed search query completions
JP2018530074A5 (ja)
JP2019040335A (ja) 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム
CN112508190A (zh) 结构化稀疏参数的处理方法、装置、设备及存储介质
JP2023052555A5 (ja)
JP6977733B2 (ja) パラメータ最適化装置、パラメータ最適化方法、及びプログラム
JPWO2023073837A5 (ja)
JPWO2021176572A5 (ja)
JP7301801B2 (ja) ハイパーパラメータチューニング方法、装置及びプログラム
WO2021124489A1 (ja) 要約学習方法、要約学習装置及びプログラム
GB2610333A (en) Computer implemented method for generating generalized additive models
JP2011118761A (ja) 情報提示装置、情報提示方法、及びプログラム
JPWO2021229625A5 (ja)
JPWO2022064570A5 (ja)
KR102424342B1 (ko) 섬네일 이미지 생성 방법 및 장치
JPWO2021144992A5 (ja)
WO2019064461A1 (ja) 学習ネットワーク生成装置、及び学習ネットワーク生成プログラム