KR20220059120A - 최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 - Google Patents
최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 Download PDFInfo
- Publication number
- KR20220059120A KR20220059120A KR1020200144337A KR20200144337A KR20220059120A KR 20220059120 A KR20220059120 A KR 20220059120A KR 1020200144337 A KR1020200144337 A KR 1020200144337A KR 20200144337 A KR20200144337 A KR 20200144337A KR 20220059120 A KR20220059120 A KR 20220059120A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- learning model
- learning
- optimal
- module
- Prior art date
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 52
- 238000005457 optimization Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 title claims description 26
- 238000012549 training Methods 0.000 claims abstract description 58
- 238000012360 testing method Methods 0.000 claims abstract description 51
- 238000007781 pre-processing Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 238000013501 data transformation Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000013136 deep learning model Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Feedback Control In General (AREA)
Abstract
Description
도 2는 본 발명의 바람직한 실시예에 따른 기계 학습 모델 자동화 구축 시스템에 있어서, 가장 성능이 우수한 기계 학습 모델을 선택하고 검증 및 예측하는 과정을 순차적으로 설명하는 흐름도이다.
도 3은 기계 학습 알고리즘의 종류를 예시적으로 도시한 도표이다.
도 4는 각 기계 학습 알고리즘에 사용되는 하이퍼 파라미터의 종류를 도시한 도표이다.
10 : 데이터 저장부
20 : 데이터 전처리부
22 : 데이터 삭제 모듈
24 : 데이터 분리 모듈
26 : 데이터 변환 모듈
28 : 결측값 대체 모듈
29 : 가변수 생성 모듈
30 : 정규화 모듈
40 : 학습 알고리즘 모델링 모듈
50 : 하이퍼 파라미터 최적화 모듈
52 : 데이터 프레임 설정 모듈
54 : 하이퍼 파라미터 조합 생성 모듈
56 : 정확도 측정 모듈
58 : 최적값 검출 모듈
60 : 재학습 모듈
70 : 학습 모델 성능 평가 모듈
80 : 학습 모델 예측 모듈
Claims (8)
- 사전 준비된 훈련 데이터 및 테스트 데이터를 저장한 데이터 저장부;
상기 훈련 데이터 및 테스트 데이터에 대하여 전처리하는 데이터 전처리부;
데이터 전처리된 훈련 데이터들 및 테스트 데이터들의 왜도 및 첨도를 조정하여 정규화시키는 정규화 모듈;
상기 정규화된 훈련 데이터들을 이용하여 사전 설정된 복수 개의 학습 모델들을 순차적으로 학습하고, 학습 결과를 기반으로 하여 상기 복수 개의 학습 모델들 중 가장 높은 정확도(Accuracy)를 갖는 학습 모델을 최적 학습 모델로 검출하는 학습 알고리즘 모델링 모듈;
상기 학습 알고리즘 모델링 모듈에 의해 검출된 최적 학습 모델에 대하여 하이퍼 파라미터 최적값을 검출하는 하이퍼 파라미터 최적화 모듈;
상기 검출된 하이퍼 파라미터 최적값을 상기 최적 학습 모델에 적용하여 최적 학습 모델을 재학습시키는 재학습 모듈;
상기 정규화된 테스트 데이터를 이용하여 상기 재학습된 최적 학습 모델에 따른 예측을 수행하는 학습 모델 예측 모듈;
을 구비하여, 정확도가 가장 우수한 하이퍼 파라미터 조합을 갖는 최적 학습 모델을 자동으로 구축할 수 있도록 구성된 것을 특징으로 하는 기계 학습 모델 자동화 구축 시스템. - 제1항에 있어서, 상기 하이퍼 파라미터 최적화 모듈은,
상기 사전 설정된 복수 개의 학습 모델들의 하이퍼 파라미터들에 대한 데이터 프레임(Data Frame) 및 각 데이터에 대한 변수들을 초기 설정하여 저장하는 데이터프레임 설정 모듈;
상기 학습 알고리즘 모델링 모듈에 의해 검출된 최적 학습 모델에 대하여 초기 설정된 하이퍼 파라미터의 데이터 프레임 및 각 데이터에 대한 변수들을 이용하여 복수 개의 하이퍼 파라미터 조합들을 생성하는 하이퍼 파라미터 조합 생성 모듈;
상기 복수 개의 하이퍼 파라미터 조합들을 순차적으로 상기 최적 학습 모델에 적용하여 학습시키고, 각 하이퍼 파라미터 조합에 대한 학습에 따른 최적 학습 모델에 대한 정확도 점수들을 측정하는 정확도 측정 모듈;
상기 하이퍼 파라미터 조합들 중 가장 우수한 정확도 점수를 갖는 하이퍼 파라미터 조합을 검출하고, 상기 검출된 하이퍼 파라미터 조합을 하이퍼 파라미터 최적값으로 설정하는 최적값 검출 모듈;
을 구비하는 것을 특징으로 하는 기계 학습 모델 자동화 구축 시스템. - 제1항에 있어서, 상기 데이터 전처리부는,
훈련 데이터 및 테스트 데이터에 대하여, 데이터의 유형에 따라 수치형 데이터 및 범주형 데이터로 분리하는 데이터 분리 모듈;
훈련 데이터 및 테스트 데이터들 중 범주형 데이터를 검출하고, 상기 범주형 데이터를 수치형 데이터로 변환시키는 데이터 변환 모듈;
훈련 데이터 및 테스트 데이터들 중 결측값이 있는 데이터를 검출하고, 결측값을 대체하는 결측값 대체 모듈;
을 구비하는 것을 특징으로 하는 기계 학습 모델 자동화 구축 시스템. - 제1항에 있어서, 상기 학습 알고리즘 모델링 모듈은,
복수 개의 학습 모델들을 사전 설정하고,
데이터 전처리 및 정규화된 훈련 데이터를 이용하여 상기 복수 개의 학습 모델들을 순차적으로 학습하고, 각 학습 모델에 의한 학습 결과를 나타내고,
각 학습 모델에 대한 학습 결과를 수치화하여 정확도 점수로서 저장하고,
상기 복수 개의 학습 모델들 중 가장 높은 정확도 점수를 갖는 학습 모델을 자동으로 선택하여 최적 학습 모델로 설정하는 것을 특징으로 하는 기계 학습 모델 자동화 구축 시스템. - (a) 사전 준비된 훈련 데이터 및 테스트 데이터를 전처리하는 단계;
(b) 상기 전처리된 훈련 데이터 및 테스트 데이터들의 왜도 및 첨도를 조정하고, 이상치를 제거하여 정규화시키는 단계;
(c) 상기 정규화된 훈련 데이터를 이용하여 사전 설정된 복수 개의 학습 모델들을 순차적으로 학습하고, 학습 결과를 기반으로 하여 복수 개의 학습 모델들 중 가장 높은 정확도를 갖는 학습 모델을 최적 학습 모델로 검출하는 단계;
(d) 상기 검출된 최적 학습 모델에 대하여 하이퍼 파라미터 최적값을 검출하는 단계;
(e) 상기 검출된 하이퍼 파라미터 최적값을 상기 최적 학습 모델에 적용하여 최적 학습 모델을 재학습시키는 단계;
(f) 상기 정규화된 테스트 데이터를 이용하여 상기 재학습된 최적 학습 모델에 따른 예측을 수행하는 단계;
를 구비하여, 정확도가 가장 우수한 하이퍼 파라미터 최적값을 갖는 최적 학습 모델을 자동으로 구축할 수 있도록 구성된 것을 특징으로 하는 기계 학습 모델 자동화 구축 방법. - 제5항에 있어서, 상기 (d) 단계는,
(d1) 상기 사전 설정된 복수 개의 학습 모델들의 하이퍼 파라미터들에 대한 데이터 프레임(Data Frame) 및 각 데이터에 대한 변수들을 초기 설정하여 저장하는 단계;
(d2) 상기 최적 학습 모델에 대하여 초기 설정된 하이퍼 파라미터의 데이터 프레임 및 각 데이터에 대한 변수들을 이용하여 복수 개의 하이퍼 파라미터 조합들을 생성하는 단계;
(d3) 상기 복수 개의 하이퍼 파라미터 조합들을 순차적으로 상기 최적 학습 모델에 적용하여 학습시키고, 각 하이퍼 파라미터 조합에 대한 학습에 따른 최적 학습 모델에 대한 정확도 점수들을 측정하는 단계;
(d4) 상기 하이퍼 파라미터 조합들 중 가장 우수한 정확도 점수를 갖는 하이퍼 파라미터 조합을 검출하고, 상기 검출된 하이퍼 파라미터 조합을 하이퍼 파라미터 최적값으로 설정하고 저장하는 단계;
을 구비하는 것을 특징으로 하는 기계 학습 모델 자동화 구축 방법. - 제5항에 있어서, 상기 (b) 단계는,
(b1) 상기 훈련 데이터 및 테스트 데이터들에 있어서 수치형 데이터로 변환이 불가능한 데이터들을 삭제하는 단계;
(b2) 훈련 데이터 및 테스트 데이터에 대하여, 데이터의 유형에 따라 수치형 데이터 및 범주형 데이터로 분리하는 단계;
(b3) 훈련 데이터 및 테스트 데이터들 중 범주형 데이터를 검출하고, 상기 범주형 데이터를 수치형 데이터로 변환시키는 단계;
(b4) 데이터 변환후, 훈련 데이터 및 테스트 데이터들 중 결측값이 있는 데이터를 검출하고, 결측값을 대체하는 단계;
을 구비하는 것을 특징으로 하는 기계 학습 모델 자동화 구축 방법. - 제5항에 있어서, 상기 (c) 단계는,
복수 개의 학습 모델들을 사전 설정하고,
데이터 전처리 및 정규화된 훈련 데이터를 이용하여 상기 복수 개의 학습 모델들을 순차적으로 학습하고, 각 학습 모델에 의한 학습 결과를 나타내고,
각 학습 모델에 대한 학습 결과를 수치화하여 정확도 점수로서 저장하고,
상기 복수 개의 학습 모델들 중 가장 높은 정확도 점수를 갖는 학습 모델을 최적 학습 모델로 선택하여 출력하는 것을 특징으로 하는 기계 학습 모델 자동화 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200144337A KR102475108B1 (ko) | 2020-11-02 | 2020-11-02 | 최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200144337A KR102475108B1 (ko) | 2020-11-02 | 2020-11-02 | 최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220059120A true KR20220059120A (ko) | 2022-05-10 |
KR102475108B1 KR102475108B1 (ko) | 2022-12-07 |
Family
ID=81592031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200144337A KR102475108B1 (ko) | 2020-11-02 | 2020-11-02 | 최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102475108B1 (ko) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115366281A (zh) * | 2022-08-22 | 2022-11-22 | 青岛科技大学 | 基于机器学习的模温机温度控制方法、装置及可存储介质 |
CN116720288A (zh) * | 2023-04-23 | 2023-09-08 | 华南理工大学 | 一种基于机器学习的微热管自动化设计系统 |
CN116776819A (zh) * | 2023-05-26 | 2023-09-19 | 深圳市海孜寻网络科技有限公司 | 一种集成电路设计方案的测试方法 |
KR20240003465A (ko) * | 2022-07-01 | 2024-01-09 | 박양수 | 통계모형을 이용한 시장규모 추정 장치 및 그 방법 |
KR102634529B1 (ko) * | 2023-05-24 | 2024-02-07 | 주식회사 온투인 | 다단계 시계열 예측 방법을 이용한 농산물 가격 예측 장치 및 이를 이용한 농산물 가격 예측 방법 |
WO2024118157A1 (en) * | 2022-11-30 | 2024-06-06 | Mastercard International Incorporated | A system and method for the automated development of ai projects |
KR20240169854A (ko) * | 2023-05-25 | 2024-12-03 | (주)임팩티브에이아이 | 머신러닝 기반의 하이브리드 모델을 통한 제품의 생애 총판매량 예측 방법 및 장치 |
KR102739222B1 (ko) * | 2024-01-08 | 2024-12-04 | 전북대학교산학협력단 | 소프트웨어 결함 예측 모델을 위한 성능 개선 방법 및 장치 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024151113A1 (ko) * | 2023-01-12 | 2024-07-18 | 주식회사 메디컬에이아이 | 생체 신호의 분석에 최적화 된 모델 구축 방법, 프로그램 및 장치 |
KR102641807B1 (ko) * | 2023-08-22 | 2024-02-27 | 에스케이에코플랜트(주) | 센서보정장치 및 센서보정장치의 동작 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190118937A (ko) * | 2018-04-11 | 2019-10-21 | 삼성에스디에스 주식회사 | 하이퍼파라미터의 최적화 시스템 및 방법 |
KR102037279B1 (ko) | 2019-02-11 | 2019-11-15 | 주식회사 딥노이드 | 딥러닝 시스템 및 그 최적 학습 모델 결정 방법 |
KR20190134983A (ko) | 2018-05-18 | 2019-12-05 | 박병훈 | 빅데이터 기반의 인공지능 통합 플랫폼 서비스 방법 |
KR102096301B1 (ko) | 2019-04-03 | 2020-04-02 | (주)뤼이드 | 액티브 러닝 기법을 적용한 머신 러닝 프레임워크 운용 방법, 장치 및 컴퓨터 프로그램 |
-
2020
- 2020-11-02 KR KR1020200144337A patent/KR102475108B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190118937A (ko) * | 2018-04-11 | 2019-10-21 | 삼성에스디에스 주식회사 | 하이퍼파라미터의 최적화 시스템 및 방법 |
KR20190134983A (ko) | 2018-05-18 | 2019-12-05 | 박병훈 | 빅데이터 기반의 인공지능 통합 플랫폼 서비스 방법 |
KR102037279B1 (ko) | 2019-02-11 | 2019-11-15 | 주식회사 딥노이드 | 딥러닝 시스템 및 그 최적 학습 모델 결정 방법 |
KR102096301B1 (ko) | 2019-04-03 | 2020-04-02 | (주)뤼이드 | 액티브 러닝 기법을 적용한 머신 러닝 프레임워크 운용 방법, 장치 및 컴퓨터 프로그램 |
Non-Patent Citations (2)
Title |
---|
"Meta-learning and Hyperparameter Optimization to Improve Learning Speed and Performance of Reinforcement Learning", Journal of Information Science 37(11), pp. 25-33, 2019.11.* * |
"Up to hyperparameter tuning at once! Bayesian Optimization Application Baseline", https://dacon.io/codeshare/1720, 2020.10.17.* * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20240003465A (ko) * | 2022-07-01 | 2024-01-09 | 박양수 | 통계모형을 이용한 시장규모 추정 장치 및 그 방법 |
CN115366281A (zh) * | 2022-08-22 | 2022-11-22 | 青岛科技大学 | 基于机器学习的模温机温度控制方法、装置及可存储介质 |
WO2024118157A1 (en) * | 2022-11-30 | 2024-06-06 | Mastercard International Incorporated | A system and method for the automated development of ai projects |
CN116720288A (zh) * | 2023-04-23 | 2023-09-08 | 华南理工大学 | 一种基于机器学习的微热管自动化设计系统 |
CN116720288B (zh) * | 2023-04-23 | 2023-12-05 | 华南理工大学 | 一种基于机器学习的微热管自动化设计系统 |
KR102634529B1 (ko) * | 2023-05-24 | 2024-02-07 | 주식회사 온투인 | 다단계 시계열 예측 방법을 이용한 농산물 가격 예측 장치 및 이를 이용한 농산물 가격 예측 방법 |
KR20240169854A (ko) * | 2023-05-25 | 2024-12-03 | (주)임팩티브에이아이 | 머신러닝 기반의 하이브리드 모델을 통한 제품의 생애 총판매량 예측 방법 및 장치 |
CN116776819A (zh) * | 2023-05-26 | 2023-09-19 | 深圳市海孜寻网络科技有限公司 | 一种集成电路设计方案的测试方法 |
KR102739222B1 (ko) * | 2024-01-08 | 2024-12-04 | 전북대학교산학협력단 | 소프트웨어 결함 예측 모델을 위한 성능 개선 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR102475108B1 (ko) | 2022-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102475108B1 (ko) | 최적화된 하이퍼파라미터를 갖는 기계 학습 모델링 자동화 방법 및 이를 이용한 기계 학습 모델링 자동화 시스템 | |
US11650968B2 (en) | Systems and methods for predictive early stopping in neural network training | |
JP6708847B1 (ja) | 機械学習装置及び方法 | |
CN109214605A (zh) | 电力系统短期负荷概率预测方法、装置及系统 | |
CN113779272B (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 | |
CN112529684A (zh) | 一种基于fwa_dbn的客户信用评估方法及系统 | |
CN108062566A (zh) | 一种基于多核潜在特征提取的智能集成软测量方法 | |
CN114219096A (zh) | 一种机器学习算法模型的训练方法、装置及存储介质 | |
CN117609731A (zh) | 一种基于因果推断的本科生毕业去向预测方法与可视分析系统 | |
CN116777596A (zh) | 一种劳务人员信用评估方法和系统 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN115454988A (zh) | 基于随机森林网络的卫星电源系统缺失数据补全方法 | |
CN113743461B (zh) | 无人机集群健康度评估方法及装置 | |
CN114579640A (zh) | 一种基于生成式对抗网络的金融时间序列预测系统和方法 | |
Tiruneh et al. | Feature selection for construction organizational competencies impacting performance | |
CN118710376A (zh) | 基于多模态用户画像的智能金融产品推荐方法及系统 | |
CN118469507A (zh) | 一种基于神经网络模型的电网物料采购流程优化方法 | |
CN115201394B (zh) | 一种多组分变压器油色谱在线监测方法及相关装置 | |
Yılmaz et al. | Investigating the effect of feature selection methods on the success of overall equipment effectiveness prediction | |
Korade et al. | Identification of appropriate machine learning algorithm to predict wine quality | |
Arumugam et al. | Performance evaluation of machine learning and deep learning techniques: a comparative analysis for house price prediction | |
Chen | Analysis of Human Resource Intelligent Recommendation Method Based on Improved Decision Tree Algorithm | |
Prihanto et al. | Atrition Analysis using XG Boost and Support Vector Machine Algorithm | |
Cahyadi et al. | Bitcoin Price Prediction Model Development Using Convolutional Neural Network (CNN) and Long Short-Term Memory (LSTM) | |
Amarif et al. | The Correlation Aspects of Software Development Actual Effort and the Effected Factors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201102 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220822 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20221121 |
|
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20221202 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20221202 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |