JP7536361B2 - 自動化された機械学習方法及びその装置 - Google Patents
自動化された機械学習方法及びその装置 Download PDFInfo
- Publication number
- JP7536361B2 JP7536361B2 JP2023516482A JP2023516482A JP7536361B2 JP 7536361 B2 JP7536361 B2 JP 7536361B2 JP 2023516482 A JP2023516482 A JP 2023516482A JP 2023516482 A JP2023516482 A JP 2023516482A JP 7536361 B2 JP7536361 B2 JP 7536361B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- parameter set
- parameter
- validation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims description 59
- 230000006870 function Effects 0.000 claims description 40
- 238000010200 validation analysis Methods 0.000 claims description 33
- 238000002790 cross-validation Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013434 data augmentation Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000005457 optimization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 235000000332 black box Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- APTZNLHMIGJTEW-UHFFFAOYSA-N pyraflufen-ethyl Chemical compound C1=C(Cl)C(OCC(=O)OCC)=CC(C=2C(=C(OC(F)F)N(C)N=2)Cl)=C1F APTZNLHMIGJTEW-UHFFFAOYSA-N 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Stored Programmes (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Description
Claims (15)
- 自動化された機械学習方法であって、
学習モデルの性能に影響を及ぼす少なくとも一つのパラメーターに対する相異なる設定データの組み合わせを含む少なくとも一つの第1パラメーターセットを登録する段階と、
入力された学習条件に基づいて、前記第1パラメーターセットの中で前記学習モデルの生成に用いる少なくとも一つの第2パラメーターセットを選定する段階と、
前記第2パラメーターセット及び所定の入力データセットに基づいてネットワーク関数に対する学習を進めることにより、前記第2パラメーターセットのそれぞれに対応する前記学習モデルを生成し、前記学習モデルのそれぞれに対する検証スコア(validation score)を算出する段階と、
前記検証スコアをもとに、生成された前記学習モデルのいずれか一つを適用モデルで選択する段階と、を含む構成において、
前記第1パラメーターセットを登録する段階は、
前記少なくとも一つのパラメーターに対して相異なる設定データを組み合わせることで、複数の候補パラメーターセットを生成する段階と、
前記候補パラメーターセットのそれぞれに対して第1データセットを通じて前記ネットワーク関数に対する学習を進めて交差検証を行う段階と、
前記交差検証の結果によって、前記候補パラメーターセットの中で少なくとも一つを前記第1パラメーターセットとして決定する段階と、
を含む、方法。 - 前記交差検証を行う段階及び前記第1パラメーターセットとして決定する段階は、前記第1データセットと異なる少なくとも一つの第2データセットに基づいて繰り返し行われる、請求項1に記載の方法。
- 前記交差検証の結果は、前記候補パラメーターセットのそれぞれに対して算出された前記交差検証による検証スコアの平均及び標準偏差を含み、
前記第1パラメーターセットとして決定する段階では、
前記検証スコアの平均及び標準偏差に基づき統計的比較を行うことで、所定の基準値(baseline)よりも高い性能を有する前記候補パラメーターセットを前記第1パラメーターセットとして決定する、請求項1に記載の方法。 - 前記第1パラメーターセットは、ネットワーク関数の種類、オプティマイザー(optimizer)、学習速度(learning rate)、及びデータオーグメンテーション(data augmentation)の中で少なくとも一つに関するパラメーターの設定データを含む、請求項1に記載の方法。
- 前記学習条件は、学習環境、推論速度(inference speed)、及び検索範囲の中で少なくとも一つに関する条件を含む、請求項1に記載の方法。
- 前記第2パラメーターを選定する段階は、
前記第1パラメーターセットをアキテクチャー(architecture)及び前記推論速度の中で少なくとも一つを基準として整列する段階と、
入力された前記学習条件によって、前記整列された第1パラメーターセットの中で上位の所定の割合を前記第2パラメーターセットに選定する段階と、を含む、請求項5に記載の方法。 - 前記検証スコアは、再現率(recall)、精密度(precision)、正確度(accuracy)、及びこれらの組み合わせの中で少なくとも一つに基づいて算出される、請求項1に記載の方法。
- 自動化された機械学習装置であって、
自動化された機械学習のためのプログラムを格納するメモリーと、
前記プログラムを実行することで、学習モデルの性能に影響を及ぼす少なくとも一つのパラメーターに対する相異なる設定データの組み合わせを含む少なくとも一つの第1パラメーターセットを登録し、入力された学習条件に基づいて、前記第1パラメーターセットの中で前記学習モデルの生成に用いる少なくとも一つの第2パラメーターセットを選定し、前記第2パラメーターセット及び所定の入力データセットに基づいてネットワーク関数に対する学習を進めることで、前記第2パラメーターセットのそれぞれに対応する前記学習モデルを生成し、前記学習モデルのそれぞれに対する検証スコア(validation score)を算出して、前記検証スコアに基づき、生成された前記学習モデルのいずれか一つを適用モデルで選択するように制御するプロセッサーと、を含む構成において、
前記プロセッサーは、
前記少なくとも一つのパラメーターに対して相異なる設定データを組み合わせることで、複数の候補パラメーターセットを生成し、前記候補パラメーターセットのそれぞれ対して第1データセットを通じて前記ネットワーク関数に対する学習を進めて交差検証を行い、前記交差検証の結果によって、前記候補パラメーターセットの中で少なくとも一つを前記第1パラメーターセットとして決定するように制御する、装置。 - 前記プロセッサーは、
前記第1データセットと異なる少なくとも一つの第2データセットに基づいて前記交差検証及び前記交差検証の結果による前記第1パラメーターセットの決定を繰り返し行うように制御する、請求項8に記載の装置。 - 前記プロセッサーは、
前記候補パラメーターセットのそれぞれに対して前記交差検証による検証スコアの平均及び標準偏差を算出し、前記検証スコアの平均及び標準偏差に基づき統計的比較を行うことにより、所定の基準値(baseline)よりも高い性能を有する前記候補パラメーターセットを前記第1パラメーターセットとして決定するように制御する、請求項8に記載の装置。 - 前記第1パラメーターセットは、ネットワーク関数の種類、オプティマイザー(optimizer)、学習速度(learning rate)、及びデータオーグメンテーション(data augmentation)の中で少なくとも一つに関するパラメーターの設定データを含む、請求項8に記載の装置。
- 前記学習条件は、学習環境、推論速度(inference speed)、及び検索範囲の中で少なくとも一つに関する条件を含む、請求項8に記載の装置。
- 前記プロセッサーは、
前記第1パラメーターセットをアキテクチャー(architecture)及び前記推論速度の中で少なくとも一つを基準として整列し、入力された前記学習条件によって、前記整列された第1パラメーターセットの中で上位の所定の割合を前記第2パラメーターセットに選定するように制御する、請求項12に記載の装置。 - 前記検証スコアは、再現率(recall)、精密度(precision)、正確度(accuracy)、及びこれらの組み合わせの中で少なくとも一つに基づいて算出される、請求項8に記載の装置。
- 請求項1~7のいずれか一項に記載の方法を実行するために記録媒体に格納されたコンピュータープログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200116989A KR102271736B1 (ko) | 2020-09-11 | 2020-09-11 | 자동화된 기계 학습 방법 및 그 장치 |
KR10-2020-0116989 | 2020-09-11 | ||
PCT/KR2020/016084 WO2022055020A1 (ko) | 2020-09-11 | 2020-11-16 | 자동화된 기계 학습 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023541264A JP2023541264A (ja) | 2023-09-29 |
JP7536361B2 true JP7536361B2 (ja) | 2024-08-20 |
Family
ID=76896784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023516482A Active JP7536361B2 (ja) | 2020-09-11 | 2020-11-16 | 自動化された機械学習方法及びその装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230297830A1 (ja) |
JP (1) | JP7536361B2 (ja) |
KR (1) | KR102271736B1 (ja) |
CN (1) | CN116057543A (ja) |
WO (1) | WO2022055020A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102592515B1 (ko) * | 2021-12-14 | 2023-10-23 | 한국전자기술연구원 | 임베딩 기반 데이터 집합의 처리 장치 및 그 방법 |
KR102552115B1 (ko) * | 2023-03-27 | 2023-07-06 | 유비즈정보기술(주) | 범용성을 가지는 기계 학습 프로그램 기록매체 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190272468A1 (en) | 2018-03-05 | 2019-09-05 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation |
JP2020123270A (ja) | 2019-01-31 | 2020-08-13 | 株式会社日立製作所 | 演算装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102340258B1 (ko) * | 2015-12-29 | 2021-12-15 | 삼성에스디에스 주식회사 | 시계열의 데이터를 예측 하는 방법 및 그 장치 |
KR102044205B1 (ko) * | 2015-12-30 | 2019-11-13 | 주식회사 솔리드웨어 | 빅데이터와 기계학습을 이용한 타겟 정보 예측 시스템 및 예측 방법 |
KR20180079995A (ko) * | 2017-01-03 | 2018-07-11 | 주식회사 데일리인텔리전스 | 머신러닝을 기반으로 데이터를 분석하는 프로그램을 생성하기 위한 방법 |
KR102107378B1 (ko) * | 2017-10-31 | 2020-05-07 | 삼성에스디에스 주식회사 | 하이퍼파라미터 자동 최적화 방법 및 그 장치 |
KR102190105B1 (ko) * | 2018-12-27 | 2020-12-11 | (주)아크릴 | 인공 신경망의 파라미터 셋을 결정하는 방법 |
-
2020
- 2020-09-11 KR KR1020200116989A patent/KR102271736B1/ko active IP Right Grant
- 2020-11-16 US US18/013,492 patent/US20230297830A1/en active Pending
- 2020-11-16 WO PCT/KR2020/016084 patent/WO2022055020A1/ko active Application Filing
- 2020-11-16 CN CN202080105033.6A patent/CN116057543A/zh active Pending
- 2020-11-16 JP JP2023516482A patent/JP7536361B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190272468A1 (en) | 2018-03-05 | 2019-09-05 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation |
JP2020123270A (ja) | 2019-01-31 | 2020-08-13 | 株式会社日立製作所 | 演算装置 |
Non-Patent Citations (1)
Title |
---|
井上 研一 ,使ってわかったAWSのAI まるごと試せば視界は良好 さあPythonではじめよう!,第1版第1刷,日本,株式会社リックテレコム,2020年06月02日,pp.158-221 |
Also Published As
Publication number | Publication date |
---|---|
US20230297830A1 (en) | 2023-09-21 |
JP2023541264A (ja) | 2023-09-29 |
KR102271736B1 (ko) | 2021-07-02 |
WO2022055020A1 (ko) | 2022-03-17 |
CN116057543A (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741361B2 (en) | Machine learning-based network model building method and apparatus | |
US20230252327A1 (en) | Neural architecture search for convolutional neural networks | |
CN111652380B (zh) | 针对机器学习算法进行算法参数调优的方法及系统 | |
US20190278600A1 (en) | Tiled compressed sparse matrix format | |
US20240303494A1 (en) | Method for few-shot unsupervised image-to-image translation | |
US20220004935A1 (en) | Ensemble learning for deep feature defect detection | |
CN111406267A (zh) | 使用性能预测神经网络的神经架构搜索 | |
JP7536361B2 (ja) | 自動化された機械学習方法及びその装置 | |
CN105701120A (zh) | 确定语义匹配度的方法和装置 | |
CN112508186A (zh) | 训练用于图像识别的神经网络的方法和神经网络设备 | |
KR20200099252A (ko) | 회로 디자인을 검증하기 위한 검증 벡터를 생성하는 장치, 회로 디자인 시스템 및 이의 강화 학습 방법 | |
US11983609B2 (en) | Dual machine learning pipelines for transforming data and optimizing data transformation | |
US11972355B2 (en) | Method and system for generating best performing data models for datasets in a computing environment | |
US20200210811A1 (en) | Data processing method based on neural network, training method of neural network, and apparatuses thereof | |
CN112668689A (zh) | 进行多媒体数据处理的方法和设备 | |
CN114358274A (zh) | 训练用于图像识别的神经网络的方法和设备 | |
KR20210058171A (ko) | 주식 예측 딥러닝 모델 생성 및 파라미터 최적화를 위한 Automated Deep Learning Studio | |
CN112819151A (zh) | 用于识别图像的方法和设备以及训练方法 | |
CN114154615A (zh) | 基于硬件性能的神经架构搜索方法和设备 | |
JP7095467B2 (ja) | 訓練データ評価装置、訓練データ評価方法、およびプログラム | |
US11669773B2 (en) | Electronic devices generating verification vector for verifying semiconductor circuit and methods of operating the same | |
CN110738318B (zh) | 网络结构运行时间评估及评估模型生成方法、系统和装置 | |
WO2019209571A1 (en) | Proactive data modeling | |
JP7395396B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20240177471A1 (en) | Automatically ascertaining an optimal architecture for a neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240731 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7536361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |