JP2021057042A5 - - Google Patents

Download PDF

Info

Publication number
JP2021057042A5
JP2021057042A5 JP2020161399A JP2020161399A JP2021057042A5 JP 2021057042 A5 JP2021057042 A5 JP 2021057042A5 JP 2020161399 A JP2020161399 A JP 2020161399A JP 2020161399 A JP2020161399 A JP 2020161399A JP 2021057042 A5 JP2021057042 A5 JP 2021057042A5
Authority
JP
Japan
Prior art keywords
data set
classifier
prediction
probability
additional data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020161399A
Other languages
English (en)
Other versions
JP2021057042A (ja
Filing date
Publication date
Priority claimed from US16/682,815 external-priority patent/US11710045B2/en
Application filed filed Critical
Publication of JP2021057042A publication Critical patent/JP2021057042A/ja
Publication of JP2021057042A5 publication Critical patent/JP2021057042A5/ja
Pending legal-status Critical Current

Links

Claims (19)

  1. 処理装置(processor)によって、入力データ集合を受信する段階、
    前記処理装置によって、第1分類器の少なくとも第1インスタンスおよび第2インスタンスを生成する段階、
    前記処理装置によって、前記入力データ集合に基づいて前記第1分類器の前記第1インスタンスおよび第2インスタンスを訓練させる段階、
    前記処理装置によって、前記入力データ集合に基づいて前記入力データ集合と関連した潜在空間(latent space)の表現を学習する第2分類器を訓練させる段階、
    前記処理装置によって、前記潜在空間で未分類データ集合である第1追加データ集合を生成する段階、
    前記処理装置によって、前記第1分類器の前記第1インスタンスに基づいて前記第1追加データ集合を分類するための第1予測を生成する段階、
    前記処理装置によって、前記第1分類器の前記第2インスタンスに基づいて前記第1追加データ集合を分類するための第2予測を生成する段階、
    前記処理装置によって、前記第1予測および前記第2予測に基づいて前記第1追加データ集合用の分類注釈を生成する段階、および
    前記処理装置によって、少なくとも前記入力データ集合および前記分類注釈が付けられた第1追加データ集合に基づいて第3分類器を訓練させる段階
    を含み、
    既に訓練された前記第3分類器は、分類する製品のデータを受信し、前記受信したデータに基づいて前記製品に対する予測を出力す
    品の分類方法。
  2. 前記第1分類器、第2分類器および第3分類器のそれぞれは、ニューラルネットワークである、請求項1に記載の分類方法。
  3. 前記第2分類器は、VAE(variational autoencoder)である、請求項2に記載の分類方法。
  4. 前記潜在空間は、前記入力データ集合の圧縮表現を提供する、請求項1に記載の分類方法。
  5. 前記第1追加データ集合の生成段階は、前記潜在空間で任意データ要素を生成する段階を含む、請求項1に記載の分類方法。
  6. 前記分類注釈の生成段階は、
    前記第1予測および前記第2予測に基づいて多数クラスを決定する段階、および
    前記多数クラスに基づいて前記第1追加データ集合を分類する段階
    を含む
    請求項1に記載の分類方法。
  7. 前記分類注釈の生成段階は、
    前記第1予測の第1確率と前記第2予測の第2確率を決定する段階、
    前記第1確率と前記第2確率の平均を計算する段階、および
    前記計算された平均に基づいて前記第1追加データ集合用クラスを定義する段階
    を含む
    請求項1に記載の分類方法。
  8. 前記分類注釈の生成段階は、
    前記第1予測に基づいて、多数クラスの第1確率および少数クラスの第2確率を決定する段階、
    前記第2予測に基づいて、前記多数クラスの第3確率および前記少数クラスの第4確率を決定する段階、
    前記第1確率と前記第3確率の第1平均を計算する段階、
    前記第2確率と前記第4確率の第2平均を計算する段階、および
    前記計算した第1および第2平均に基づいて前記第1追加データ集合を分類する段階
    を含む
    請求項1に記載の分類方法。
  9. 前記潜在空間のオーバーサンプリングに基づいて第2追加データ集合を生成する段階、および
    前記入力データ集合、前記分類注釈が付けられた前記第1追加データ集合および前記第2追加データ集合に基づいて前記第3分類器を訓練させる段階
    をさらに含む、請求項1に記載の分類方法。
  10. 処理装置、および
    メモリ
    を含み、
    前記メモリは、内部にインストラクションを保存しており、
    前記処理装置は、前記インストラクションを実行して、
    入力データ集合を受信し、
    第1分類器の少なくとも第1および第2インスタンスを生成し、
    前記入力データ集合に基づいて前記第1分類器の前記第1および第2インスタンスを訓練させ、
    前記入力データ集合に基づいて前記入力データ集合と関連した潜在空間(latent space)の表現を学習する第2分類器を訓練させ、
    前記潜在空間で未分類データ集合である第1追加データ集合を生成し、
    前記第1分類器の前記第1インスタンスに基づいて前記第1追加データ集合を分類するための第1予測を生成し、
    前記第1分類器の前記第2インスタンスに基づいて前記第1追加データ集合を分類するための第2予測を生成し、
    前記第1予測および前記第2予測に基づいて前記第1追加データ集合用の分類注釈を生成し、
    少なくとも前記入力データ集合および前記分類注釈が付けられた第1追加データ集合に基づいて第3分類器を訓練させ、
    既に訓練された前記第3分類器は、分類する製品のデータを受信し、前記受信したデータに基づいて前記製品に対する予測を出力す
    品の分類システム。
  11. 前記第1分類器、第2分類器および第3分類器のそれぞれは、ニューラルネットワークである、請求項10に記載の分類システム。
  12. 前記第2分類器は、VAE(variational autoencoder)である、請求項11に記載の分類システム。
  13. 前記潜在空間は、前記入力データ集合の圧縮表現を提供する、請求項10に記載の分類システム。
  14. 前記処理装置は、前記インストラクションを実行して前記第1追加データ集合を生成する時、前記潜在空間で任意データ要素を生成する、請求項10に記載の分類システム。
  15. 前記処理装置は、前記インストラクションを実行して前記分類注釈を生成する時、
    前記第1予測および前記第2予測に基づいて多数クラスを決定し、
    前記多数クラスに基づいて前記第1追加データ集合を分類する
    請求項10に記載の分類システム。
  16. 前記処理装置は、前記インストラクションを実行して前記分類注釈を生成する時、
    前記第1予測の第1確率と前記第2予測の第2確率を決定し、
    前記第1確率と前記第2確率の平均を計算し、
    前記計算した平均に基づいて前記第1追加データ集合用クラスを定義する
    請求項10に記載の分類システム。
  17. 前記処理装置は、前記インストラクションを実行して前記分類注釈を生成する時、
    前記第1予測に基づいて、多数クラスの第1確率および少数クラスの第2確率を決定し、
    前記第2予測に基づいて、前記多数クラスの第3確率および前記少数クラスの第4確率を決定し、
    前記第1確率と前記第3確率の第1平均を計算し、
    前記第2確率と前記第4確率の第2平均を計算し、
    前記計算した第1および第2平均に基づいて前記第1追加データ集合を分類する
    請求項10に記載の分類システム。
  18. 前記処理装置は、前記インストラクションを実行して、
    前記潜在空間のオーバーサンプリングに基づいて第2追加データ集合を生成し、
    前記入力データ集合、前記分類注釈が付けられた第1追加データ集合および第2追加データ集合に基づいて前記第3分類器を訓練させる
    請求項10に記載の分類システム。
  19. 入力データ集合を収集するデータ収集回路、および
    前記データ収集回路と連結され、ロジックを含む処理回路
    を含み、
    前記処理回路のロジックは、
    前記収集された入力データ集合を受信し、
    第1分類器の少なくとも第1および第2インスタンスを生成し、
    前記入力データ集合に基づいて前記第1分類器の前記第1および第2インスタンスを訓練させ、
    前記入力データ集合に基づいて前記入力データ集合と関連した潜在空間(latent space)の表現を学習する第2分類器を訓練させ、
    前記潜在空間で未分類データ集合である第1追加データ集合を生成し、
    前記第1分類器の前記第1インスタンスに基づいて前記第1追加データ集合を分類するための第1予測を生成し、
    前記第1分類器の前記第2インスタンスに基づいて前記第1追加データ集合を分類するための第2予測を生成し、
    前記第1予測および前記第2予測に基づいて前記第1追加データ集合用の分類注釈を生成し、
    少なくとも前記入力データ集合および前記分類注釈が付けられた第1追加データ集合に基づいて第3分類器を訓練させ、
    既に訓練された前記第3分類器は、分類する製品のデータを受信し、前記受信したデータに基づいて前記製品に対する予測を出力する
    製品を優良または不良に分類する分類システム。
JP2020161399A 2019-10-01 2020-09-25 製品の分類システムおよび製品の分類方法 Pending JP2021057042A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962909053P 2019-10-01 2019-10-01
US62/909,053 2019-10-01
US16/682,815 US11710045B2 (en) 2019-10-01 2019-11-13 System and method for knowledge distillation
US16/682,815 2019-11-13

Publications (2)

Publication Number Publication Date
JP2021057042A JP2021057042A (ja) 2021-04-08
JP2021057042A5 true JP2021057042A5 (ja) 2023-10-02

Family

ID=72665198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020161399A Pending JP2021057042A (ja) 2019-10-01 2020-09-25 製品の分類システムおよび製品の分類方法

Country Status (6)

Country Link
US (2) US11710045B2 (ja)
EP (1) EP3800588A1 (ja)
JP (1) JP2021057042A (ja)
KR (1) KR20210039927A (ja)
CN (1) CN112598017A (ja)
TW (1) TW202129528A (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11604984B2 (en) * 2019-11-18 2023-03-14 Shanghai United Imaging Intelligence Co., Ltd. Systems and methods for machine learning based modeling
US11494644B2 (en) * 2019-11-20 2022-11-08 Rakuten Group, Inc. System, method, and computer program for recommending items using a direct neural network structure
US11663528B2 (en) * 2020-06-30 2023-05-30 Intuit Inc. Training an ensemble of machine learning models for classification prediction using probabilities and ensemble confidence
CN113219357A (zh) * 2021-04-28 2021-08-06 东软睿驰汽车技术(沈阳)有限公司 电池包健康状态计算方法、系统及电子设备
CN113222034B (zh) * 2021-05-20 2022-01-14 浙江大学 基于知识蒸馏的细粒度多类别不平衡故障分类方法
CN113269266B (zh) * 2021-06-08 2023-09-19 清华大学 多故障模式下基于知识蒸馏的晶圆制造过程故障检测方法
CN113850012B (zh) * 2021-06-11 2024-05-07 腾讯科技(深圳)有限公司 数据处理模型生成方法、装置、介质及电子设备
WO2023053216A1 (ja) * 2021-09-28 2023-04-06 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
US20230136110A1 (en) * 2021-11-01 2023-05-04 Kla Corporation Knowledge distillation for semiconductor-based applications
CN114119959A (zh) * 2021-11-09 2022-03-01 盛视科技股份有限公司 一种基于视觉的垃圾桶满溢检测方法及装置
CN114972952B (zh) * 2022-05-29 2024-03-22 重庆科技学院 一种基于模型轻量化的工业零部件缺陷识别方法
CN114722886A (zh) * 2022-06-10 2022-07-08 四川大学 基于知识蒸馏的曲轴内部缺陷检测方法及检测设备
WO2024086771A1 (en) * 2022-10-21 2024-04-25 Ohio State Innovation Foundation System and method for prediction of artificial intelligence model generalizability

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7899625B2 (en) 2006-07-27 2011-03-01 International Business Machines Corporation Method and system for robust classification strategy for cancer detection from mass spectrometry data
WO2011109863A1 (en) 2010-03-08 2011-09-15 National Ict Australia Limited Annotation of a biological sequence
US20130097103A1 (en) 2011-10-14 2013-04-18 International Business Machines Corporation Techniques for Generating Balanced and Class-Independent Training Data From Unlabeled Data Set
US9037518B2 (en) 2012-07-30 2015-05-19 Hewlett-Packard Development Company, L.P. Classifying unclassified samples
US20150278470A1 (en) 2012-10-25 2015-10-01 Koninklijke Philips N.V. Combined use of clinical risk factors and molecular markers fro thrombosis for clinical decision support
US9224104B2 (en) 2013-09-24 2015-12-29 International Business Machines Corporation Generating data from imbalanced training data sets
US20160092789A1 (en) 2014-09-29 2016-03-31 International Business Machines Corporation Category Oversampling for Imbalanced Machine Learning
GB201508032D0 (en) 2015-05-12 2015-06-24 Rolls Royce Plc Methods and apparatus for predicting fault occurrence in mechanical systems and electrical systems
US20160358099A1 (en) 2015-06-04 2016-12-08 The Boeing Company Advanced analytical infrastructure for machine learning
CN105589806B (zh) 2015-12-17 2018-05-18 北京航空航天大学 一种基于SMOTE+Boosting算法的软件缺陷倾向预测方法
KR101744194B1 (ko) 2016-08-19 2017-06-09 인하대학교 산학협력단 반도체 fab 제조공정에서 유클리드 거리를 활용한 웨이퍼 자동 불량 검사 분류 예측 장치 및 방법
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
WO2018175098A1 (en) * 2017-03-24 2018-09-27 D5Ai Llc Learning coach for machine learning system
CN107103332B (zh) 2017-04-07 2018-06-26 武汉理工大学 一种面向大规模数据集的相关向量机分类方法
CN107391370B (zh) 2017-07-13 2020-05-12 武汉大学 一种基于数据过采样和集成学习的软件缺陷数目预测方法
MX2018011305A (es) 2017-09-18 2019-07-04 Tata Consultancy Services Ltd Técnicas para corregir el desvío de entrenamiento lingüístico en los datos de entrenamiento.
IL256480B (en) 2017-12-21 2021-05-31 Agent Video Intelligence Ltd A system and method for use in training machine learning
CN108563556A (zh) 2018-01-10 2018-09-21 江苏工程职业技术学院 基于差分演化算法的软件缺陷预测优化方法
WO2019155467A1 (en) * 2018-02-07 2019-08-15 Applied Materials Israel Ltd. Method of generating a training set usable for examination of a semiconductor specimen and system thereof
US11372893B2 (en) 2018-06-01 2022-06-28 Ntt Security Holdings Corporation Ensemble-based data curation pipeline for efficient label propagation
US10832003B2 (en) * 2018-08-26 2020-11-10 CloudMinds Technology, Inc. Method and system for intent classification
US11366982B2 (en) 2018-09-24 2022-06-21 Sap Se Computer systems for detecting training data usage in generative models
US20200143274A1 (en) 2018-11-06 2020-05-07 Kira Inc. System and method for applying artificial intelligence techniques to respond to multiple choice questions
US11928610B2 (en) * 2018-11-19 2024-03-12 Koninklijke Philips N.V. Clinical case search and generation system and method based on a probabilistic encoder-generator framework
US11610098B2 (en) 2018-12-27 2023-03-21 Paypal, Inc. Data augmentation in transaction classification using a neural network

Similar Documents

Publication Publication Date Title
JP2021057042A5 (ja)
Al Amrani et al. Random forest and support vector machine based hybrid approach to sentiment analysis
Zeng et al. $ Deep-Full-Range $: a deep learning based network encrypted traffic classification and intrusion detection framework
Cenggoro Deep learning for imbalance data classification using class expert generative adversarial network
US20160328644A1 (en) Adaptive selection of artificial neural networks
WO2019200782A1 (zh) 样本数据分类方法、模型训练方法、电子设备及存储介质
US8842965B1 (en) Large scale video event classification
Bhattacharyya Confidence in predictions from random tree ensembles
Artetxe et al. Balanced training of a hybrid ensemble method for imbalanced datasets: a case of emergency department readmission prediction
Wang et al. Unleash the black magic in age: a multi-task deep neural network approach for cross-age face verification
Gupta et al. A supervised deep learning framework for proactive anomaly detection in cloud workloads
Goyal et al. A novel way of assigning software bug priority using supervised classification on clustered bugs data
Karunaratna et al. Artificial intelligence on single board computers: An experiment on sound event classification
CN111488400B (zh) 数据分类方法、装置和计算机可读存储介质
Aburomman et al. Evolutionof Intrusion Detection Systems Based on Machine Learning Methods
Li Parallel two-class 3D-CNN classifiers for video classification
Kouzani et al. Face classification by a random forest
Alham et al. A distributed SVM ensemble for image classification and annotation
Yi et al. Learning correlations for human action recognition in videos
Abdellatif et al. A Novel Framework for Fog‐Assisted Smart Healthcare System with Workload Optimization
CN114358177A (zh) 一种基于多维度特征紧凑决策边界的未知网络流量分类方法及系统
Zhang et al. Learning classifiers without negative examples: A reduction approach
Cordeiro et al. A PSO algorithm for improving multi-view classification
Wang et al. Image categorization using directed graphs
Mani et al. Performance evaluation of data mining techniques