KR20220091291A - 머신러닝 학습 장치 및 그것의 동작 방법 - Google Patents

머신러닝 학습 장치 및 그것의 동작 방법 Download PDF

Info

Publication number
KR20220091291A
KR20220091291A KR1020200182652A KR20200182652A KR20220091291A KR 20220091291 A KR20220091291 A KR 20220091291A KR 1020200182652 A KR1020200182652 A KR 1020200182652A KR 20200182652 A KR20200182652 A KR 20200182652A KR 20220091291 A KR20220091291 A KR 20220091291A
Authority
KR
South Korea
Prior art keywords
new data
machine learning
data
learning model
test
Prior art date
Application number
KR1020200182652A
Other languages
English (en)
Inventor
임보미
Original Assignee
주식회사 엘지에너지솔루션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지에너지솔루션 filed Critical 주식회사 엘지에너지솔루션
Priority to KR1020200182652A priority Critical patent/KR20220091291A/ko
Priority to CN202180060822.7A priority patent/CN116249993A/zh
Priority to EP21911330.5A priority patent/EP4170560A4/en
Priority to US18/017,289 priority patent/US20230274185A1/en
Priority to PCT/KR2021/018552 priority patent/WO2022139263A1/ko
Priority to JP2023503024A priority patent/JP2023534285A/ja
Publication of KR20220091291A publication Critical patent/KR20220091291A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 개시의 일 실시예에 따른 머신러닝 학습 장치는 신규 데이터를 수집하는 데이터 관리부, 머신러닝 모델을 생성하는데 사용된 데이터 및 상기 신규 데이터의 특성을 추출하는 데이터 분석부, 및 상기 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하고, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 판단부를 포함할 수 있다.

Description

머신러닝 학습 장치 및 그것의 동작 방법{APPARATUS AND METHOD FOR MACHINE-LEARNING LEARNING}
본 문서에 개시된 실시예들은 머신러닝 학습 장치 및 그것의 동작 방법에 관한 것이다.
머신러닝(Machine Learning)이란 컴퓨터를 학습시켜 어떠한 결과를 예측할 수 있도록 하는 기술이다. 일반적으로 머신러닝을 이용한 결과 예측은 기계를 학습시키기 위한 학습 데이터(Train data)를 준비하고 문제에 적합한 방식으로 학습(Train)시키는 과정, 테스트 데이터(Test data)로 모델을 검증(Validate)하는 과정, 검증을 통과한 모델로 결과를 예측(Predict)하는 과정을 포함하여 이루어진다.
머신러닝 모델은 일정한 기준에 따라 선정된 학습 데이터를 사용하여 생성된다. 선정된 데이터를 기반으로 생성된 머신러닝 모델에 신규 데이터를 입력하여 결과를 예측하고자 할 때, 머신러닝을 통해 일반화 하려는 특성(Feature)과 신규 데이터의 특성 간의 관련성이 낮다면 그 차이로 인해 모델 자체의 정확도(Accuracy)와 별개로 모델의 오차가 증가하게 되어 모델의 신뢰도가 떨어지는 문제가 있다.
본 문서에 개시되는 실시예들의 일 목적은 머신러닝 모델의 오차를 줄이고 신뢰도를 높일 수 있는 머신러닝 학습 장치 및 그것의 동작 방법을 제공하는 데 있다.
본 문서에 개시된 실시예들의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치는 신규 데이터를 수집하는 데이터 관리부, 머신러닝 모델을 생성하는데 사용된 데이터 및 상기 신규 데이터의 특성을 추출하는 데이터 분석부, 상기 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하고, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 판단부를 포함할 수 있다.
일 실시예에 따라, 상기 판단부는 상기 신규 데이터의 개수가 기준 개수 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사(bounds checking) 및 추세 검사(trend test)를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단할 수 있다.
일 실시예에 따라, 상기 추세 검사는 시간에 따른 상기 신규 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수가, 시간에 따른 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수의 범위에 속하는지 판단할 수 있다.
일 실시예에 따라, 상기 판단부가 상기 추세 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 추세 범위에 속하는 것으로 판단하고, 상기 경계 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 경계 범위에 속하는 것으로 판단하는 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 적용할 수 있다.
일 실시예에 따라, 상기 판단부는 상기 신규 데이터의 개수가 기준 개수 이상인 경우, 상기 머신러닝 모델을 생성하는데 사용된 데이터와 상기 신규 데이터에 대하여 F-test 및 T-test를 수행할 수 있다.
일 실시예에 따라, 상기 판단부는 상기 F-test를 수행하여 획득한 결과값 또는 상기 T-test를 수행하여 획득한 결과값이 임계값 인 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 제외 할 수 있다.
일 실시예에 따라, 상기 판단부는 상기 F-test 및 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단할 수 있다.
일 실시예에 따라, 상기 판단부가 상기 추세 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 추세 범위에 속하는 것으로 판단하고, 상기 경계 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 경계 범위에 속하는 것으로 판단하는 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 적용 할 수 있다.
일 실시예에 따라, 상기 판단부의 판단 결과에 기초하여 상기 신규 데이터를 상기 머신러닝 모델에 적용하여 상기 머신러닝 모델을 학습시키는 머신러닝 모델 학습부를 더 포함할 수 있다.
본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치의 동작 방법은 신규 데이터를 수집하는 단계, 머신러닝 모델을 생성하는데 사용된 데이터 및 상기 신규 데이터의 특성을 추출하는 단계, 상기 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하는 단계, 및 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계를 포함할 수 있다.
일 실시예에 따라, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 신규 데이터의 개수가 기준 개수 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단할 수 있다.
일 실시예에 따라, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 신규 데이터의 개수가 기준 개수 이상인 경우, 상기 머신러닝 모델을 생성하는데 사용된 데이터와 상기 신규 데이터에 대하여 F-test 및 T-test를 수행하는 단계를 포함할 수 있다.
일 실시예에 따라, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 F-test를 수행하여 획득한 결과값 또는 상기 T-test를 수행하여 획득한 결과값이 임계값 인 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 제외할 수 있다.
일 실시예에 따라, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 F-test 및 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단할 수 있다.
본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치 및 그것의 동작 방법에 따르면 머신러닝 모델의 오차를 줄이고 신뢰도를 높일 수 있다.
도 1은 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치를 보여주는 블록도이다.
도 2는 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치의 동작 방법을 보여주는 흐름도이다.
도 3은 본 문서에 개시된 다른 실시예에 따른 머신러닝 학습 장치의 동작 방법을 보여주는 흐름도이다.
도 4는 본 문서에 기재된 일 실시예에 따른 시간의 흐름에 따라 나타나는 머신러닝 모델 생성에 사용된 데이터 또는 신규 데이터의 특성의 변화를 보여주는 그래프이다.
도 5는 본 문서에 개시된 일 실시예에 따른 머신러닝 모델 생성에 사용된 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 1차항 및 상수항 추세 계수 값을 보여주는 그래프이다.
도 6는 본 문서에 개시된 일 실시예에 따른 머신러닝 모델 생성에 사용된 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 추세 계수 값을 보여주는 3차원 그래프이다.
이하, 본 문서에 개시된 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 문서에 개시된 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 문서에 개시된 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한다.
본 문서에 개시된 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 문서에 개시된 실시예들이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 문서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치를 보여주는 블록도이다.
도 1을 참조하면, 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치(100)는 데이터 관리부(110), 데이터 분석부(120), 및 판단부(130)를 포함 할 수 있다.
데이터 관리부(110)는 머신러닝 모델에 사용되는 데이터를 관리할 수 있다. 데이터 관리부(110)는 머신러닝 모델을 생성하는 데 사용된 데이터(이하에서, ‘사용 데이터’로 칭함)를 저장할 수 있다. 또한, 데이터 관리부(110)는 머신러닝 모델에 투입될 신규 데이터를 수집할 수 있다. 예를 들어, 사용 데이터는 복수의 배터리 셀들 중 특정 배터리 셀의 방전 상태에서 완충 상태 또는 완충 상태에서 방전 상태에 이르기까지의 전기량의 변화를 기록한 값으로 정의될 수 있다. 또한, 신규 데이터는 복수의 배터리 셀들 중 상기 특정 배터리 셀과 다른 배터리 셀의 방전 상태에서 완충 상태 또는 완충 상태에서 방전 상태에 이르기까지의 전기량의 변화를 기록한 값으로 정의될 수 있다.
또한, 예를 들어, 사용 데이터는 복수의 배터리 셀들 중 특정 배터리 셀의 전압 및/또는 전류의 변화를 기록한 값으로 정의될 수도 있으며, 신규 데이터는 복수의 배터리 셀들 중 상기 특정 배터리 셀과 다른 배터리 셀의 전압 및/또는 전류의 변화를 기록한 값으로 정의될 수도 있다. 여기서, 방전 상태는 배터리의 전압이 기준값(예를 들어, 컷오프 전압(cut-off voltage)) 이하인 경우를 포함할 수 있다.
데이터 분석부(120)는 사용 데이터와 신규 데이터의 특성(Feature)을 추출한다. 여기서 특성은 시간의 흐름에 따라 일정한 시간 간격으로 배치된 시계열 데이터(Time series)에서 발견되는 개별적이고 측정 가능한 경험적 속성을 의미할 수 있다. 예를 들어, 특성은 배터리의 용량을 포함할 수 있다. 여기서 배터리의 용량은 배터리가 저장할 수 있는 전기의 양을 의미할 수 있으며, 배터리의 용량 데이터는 사용 데이터와 신규 데이터로부터 산출될 수 있다.
판단부(130)는 신규 데이터의 개수가 기준 개수 미만인지 판단한다. 여기서, 기준 개수는 신규 데이터를 하나의 집단으로 취급할 것인지, 개별적인 데이터로 취급할 것인지를 판단하는 기준으로 정의될 수 있다. 예를 들어, 판단부(130)는 신규 데이터의 개수가 10개 미만인 경우는 개별적인 데이터로 취급하고, 10개 이상인 경우는 하나의 집단으로 취급할 수 있다.
판단부(130)는 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 신규 데이터를 머신러닝 모델에 적용할 지 판단한다. 예를 들어, 판단부(130)는 신규 데이터의 개수가 기준 개수 이상일 경우는 집단 간의 비교를 통해 신규 데이터가 머신러닝 모델에 투입될 적합한 데이터 인지 판단한다. 이처럼, 신규 데이터 집단과 사용 데이터 집단 간의 비교를 통해 머신러닝 모델에 투입되기에 부적법한 신규 데이터들을 필터링 함으로써 신규 데이터들에 대하여 개별적으로 머신러닝 모델에 투입될 데이터로서 적합한 데이터 인지 확인하는 추가적인 테스트 횟수를 줄일 수 있다.
즉, 판단부(130)는 신규 데이터와 사용 데이터에 대하여 집단 간의 비교 테스트를 수행하고, 소정 조건을 만족한 데이터는 개별적으로 머신러닝 모델에 투입될 데이터로서 적합한 데이터 인지 추가적인 테스트를 수행한다. 또한, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만일 경우에도 신규 데이터 각각을 개별적으로 머신러닝 모델에 투입될 데이터로서 적합한 데이터 인지 확인하는 테스트를 수행한다.
판단부(130)는 이러한 테스트를 통해 신규 데이터가 머신러닝 모델을 통해 판단하고자 하는 집단의 대표적인 데이터로서 적합한 데이터인지 여부를 판단한다. 판단부(130)는 부적합한 데이터는 머신러닝 모델을 통한 예측 과정에 제외할 수 있다. 따라서, 판단부(130)는 머신러닝 모델의 오차를 줄이고, 머신러닝 모델의 신뢰도를 높일 수 있다.
판단부는(130)는 판단 결과에 따라서, 신규 데이터의 개수가 기준 개수 미만인 경우, 신규 데이터의 특성과 사용 데이터의 특성에 대하여 경계 검사(bounds checking) 및 추세 검사(trend test)를 수행할 수 있다.
판단부는(130) 판단 결과에 따라서, 신규 데이터의 개수가 기준 개수 이상인 경우, 사용 데이터의 특성과 신규 데이터의 특성에 대하여 F-test 및 T-test를 수행할 수 있다.
도 2는 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치의 동작 방법을 보여주는 흐름도이다.
도 2를 참조하면, 본 문서에 개시된 일 실시예에 따른 머신러닝 학습 장치의 동작 방법은 신규 데이터를 수집하는 단계(S210), 사용 데이터와 신규 데이터의 특성을 추출하는 단계(S220), 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하는 단계(S230), 및 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 신규 데이터를 머신러닝 모델에 적용할 지 판단하는 단계(S240)를 포함 할 수 있다.
이하에서 상기 S210 단계 내지 S240 단계에 대해 도 1을 참조하여 설명한다.
S210 단계에서, 데이터 관리부(110)는 머신러닝 모델에 투입될 신규 데이터를 수집할 수 있다. 예를 들어, 사용 데이터 는 복수의 배터리 셀들 중 특정 배터리 셀의 방전 상태에서 완충 상태 또는 완충 상태에서 방전 상태에 이르기까지의 전기량의 변화를 기록한 값으로 정의될 수 있다. 또한, 신규 데이터는 복수의 배터리 셀들 중 상기 특정 배터리 셀과 다른 배터리 셀의 방전 상태에서 완충 상태 또는 완충 상태에서 방전 상태에 이르기까지의 전기량의 변화를 기록한 값으로 정의될 수 있다.
또한, 예를 들어, 사용 데이터는 복수의 배터리 셀들 중 특정 배터리 셀의 전압 및/또는 전류의 변화를 기록한 값으로 정의될 수도 있으며, 신규 데이터는 복수의 배터리 셀들 중 상기 특정 배터리 셀과 다른 배터리 셀의전압 및/또는 전류의 변화를 기록한 값으로 정의될 수도 있다. 여기서, 방전 상태는 배터리의 전압이 기준값(예를 들어, 컷오프 전압(cut-off voltage)) 이하인 경우를 포함할 수 있다.
S220 단계에서, 데이터 분석부(120)는 사용 데이터와 신규 데이터의 특성을 추출할 수 있다.
예를 들어, 특성은 배터리의 용량을 포함할 수 있다. 여기서 배터리의 용량은 배터리가 저장할 수 있는 전기의 양을 의미할 수 있으며, 배터리의 용량 데이터는 사용 데이터와 신규 데이터로부터 산출될 수 있다.
S230 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만인지 판단할 수 있다. 여기서 기준 개수는 신규 데이터를 하나의 집단으로 취급할 것인지, 개별적인 데이터로 취급할 것인지를 판단하는 기준으로 정의될 수 있다. 예를 들어, S230 단계에서, 판단부(130)는 신규 데이터의 개수가 10개 미만인 경우는 개별적인 데이터로 취급하고, 10개 이상인 경우는 하나의 집단으로 취급할 수 있다.
S240 단계에서, 판단부(130)는 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 신규 데이터를 머신러닝 모델에 적용할 지 판단한다.
예를 들어, S240 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만일 경우 경계 검사(Bounds checking)와 추세 검사(Trend test)를 수행하여 신규 데이터가 머신러닝 모델에 투입될 적합한 데이터인지 판단한다. S240 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 이상일 경우 F-test 와 T-test를 수행하여 신규 데이터가 머신러닝 모델에 투입될 적합한 데이터인지 판단한다.
도 3은 본 문서에 개시된 다른 실시예에 따른 머신러닝 학습 장치의 동작 방법을 보여주는 흐름도이다. 도 4는 본 문서에 기재된 일 실시예에 따른 시간의 흐름에 따라 나타나는 사용 데이터 또는 신규 데이터의 특성의 변화를 보여주는 그래프이다. 도 5는 본 문서에 개시된 일 실시예에 따른 사용 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 1차항 및 상수항 추세 계수 값을 보여주는 그래프이다. 도 6은 본 문서에 개시된 일 실시예에 따른 사용 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 추세 계수 값을 보여주는 3차원 그래프이다.
먼저, 도 3을 참조하면, 본 문서에 기재된 일 실시예에 따른 머신러닝 학습 장치의 동작 방법은 신규 데이터를 수집하는 단계(S301), 사용 데이터와 신규 데이터의 특성을 추출하는 단계(S302), 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하는 단계(S303), 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 신규 데이터를 머신러닝 모델에 적용할 지 여부를 판단하는 단계(S304), 신규 데이터의 개수가 기준 개수 미만 또는 이상인지 구분하는 단계(S305), 신규 데이터의 개수가 기준 개수 이상인 경우, 사용 데이터와 신규 데이터에 대하여 F-test 및 T-test를 수행하는 단계(S306), F-test와 T-test를 수행하여 획득한 결과값이 임계값 미만인지 여부를 판단하는 단계(S307), 신규 데이터의 개수가 기준 개수 미만이거나 F-test와 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 신규 데이터의 특성과 사용 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하는 단계(S308), 경계 검사와 추세 검사의 결과 신규 데이터가 사용 데이터의 경계 범위와 추세 범위를 만족하는지 여부를 판단하는 단계(S309), 신규데이터가 경계 범위와 추세 범위를 만족하는 경우 머신러닝 모델에 사용되는 단계(S310), 및 F-test 또는 T-test를 수행하여 획득한 결과값이 임계값 이상이거나, 신규 데이터가 사용 데이터의 경계 범위 또는 추세 범위를 만족하지 못하는 경우, 신규 데이터를 상기 머신러닝 모델의 학습에서 제외하는 단계(S311)를 포함할 수 있다.
이하에서 상기 S301 단계 내지 S311 단계에 대해 도 1을 참조하여 설명한다.
S301 단계에서, 데이터 관리부(110)는 머신러닝 모델에 투입될 신규 데이터를 수집할 수 있다.
S302 단계에서, 데이터 분석부(120)는 사용 데이터와 신규 데이터의 특성을 추출할 수 있다.
S303 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단할 수 있다.
S304 단계에서, 판단부(130)는 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 신규 데이터를 머신러닝 모델에 적용할 지 판단할 수 있다.
S305 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만 또는 이상인지 구분할 수 있다.
S306 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 이상인 경우, 사용 데이터와 신규 데이터에 대하여 F-test와 T-test를 수행할 수 있다.
F-test는 두 집단간의 분산(Variance)에 대한 차이가 통계적으로 유의한 수준으로 차이가 있는지 통계적 유의성을 검증하는 검증 기법이다.
아래의 [수학식 1]은 F-test를 통해 두 집단간의 분산 차이를 구하는 식을 의미한다.
Figure pat00001
[수학식 1]에서, a는 신규 데이터의 특성을 의미한다. mean(a)는 신규 데이터의 특성의 평균을 의미한다. n_a는 신규 데이터의 특성의 개수를 의미한다. b는 사용 데이터의 특성을 의미한다. mean(b)는 사용 데이터의 특성의 평균을 의미한다. n_b는 사용 데이터의 특성의 개수를 의미한다.
T-test은 두 집단 간 평균(Mean)에 대한 차이가 통계적으로 유의한 수준으로 차이가 있는지를 검증하는 검증 기법이다.
아래의 [수학식 2]는 T-test를 통해 두 집단의 평균 차이를 구하는 식을 의미한다.
Figure pat00002
[수학식 2]에서, a는 신규 데이터의 특성을 의미한다. mean(a)는 신규 이터의 특성의 평균을 의미한다. n_a는 신규 데이터의 특성의 개수를 의미한다. var(a)는 신규 데이터의 특성의 분산을 의미한다. b는 사용 데이터의 특성을 의미한다. mean(b)는 사용 데이터의 특성의 평균을 의미한다. n_b는 사용 데이터의 특성의 개수를 의미한다. var(b)는 사용 데이터의 특성의 분산을 의미한다.
통계적 유의성이란, 통계학자가 자신의 실험 결과가 우연히 일어난 것인지 아니면 우연히 일어날 수 없는 극단적인 것인지를 판단하는 방법으로 정의 될 수 있다. 예를 들어, F-test와 T-test의 결과값인 P값(P-value)이 임계값 이상이면 유의적 의미가 있는 것으로 판단되고 임계값 미만이면 유의적 의미가 없는 것으로 판단될 수 있다.
S307 단계에서, 판단부(130)는 F-test를 수행하여 획득한 결과값과 T-test를 수행하여 획득한 결과값이 임계값 미만인지 판단할 수 있다. 여기서, 임계값은 머신러닝 모델에서 극단적인 결과가 나와 ‘비정상’ 이라고 판단할 수 있는 기준으로 정의할 수 있다. 즉, 임계값은 데이터가 특정 통계 모델과 얼마나 상반되는지 나타내는 기준으로 정의할 수 있다. 예를 들어, 임계값은 0.05로 설정될 수 있으나, 이에 한정되는 것은 아니며, 통계적인 실험결과에 따라 다소 변동하여 사용할 수 있다.
S308 단계에서, 판단부(130)는 F-test를 수행하여 획득한 결과값과 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 신규 데이터의 특성과 사용 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행할 수 있다.
S308 단계에서, 판단부(130)는 신규 데이터의 개수가 기준 개수 미만인 경우, 신규 데이터의 특성과 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사와 추세 검사를 수행할 수 있다. 여기서, 경계 검사는 데이터가 특정 범위 내에 존재하는지를 판단하는 범위 검사(Range checking)를 포함할 수 있다. 예를 들어, 신규 데이터의 특성의 최소값(Minimum), 최대값(Maximum)이 사용 데이터의 특성의 최소값, 최대값 범위에 포함되는지 여부를 신규 데이터 각각에 대해 개별적으로 판단할 수 있다. 판단부(130)는 경계 검사 결과, 신규 데이터의 특성의 최소값, 최대값이 사용 데이터의 특성의 최소값, 최대값 범위에 포함되면 신규 데이터가 사용 데이터의 경계 범위를 만족하는 것으로 판단할 수 있다.
추세검사에서 추세(Trend)는 시계열 데이터의 장기간에 걸친 점진적이고 지속적인 변화를 의미한다. 즉, 추세는 시계열 데이터의 상승 경향이나 하향 경향의 상태를 의미한다. 예를 들어, 배터리가 충전, 휴지, 방전, 휴지를 겪는 것을 주기(Cycle)라 하면, 배터리의 주기가 반복되면서 나타나는 점진적인 배터리의 용량 변화를 추세라고 할 수 있다. 추세 검사는 신규 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수가, 사용 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수의 범위에 속하는지 판단할 수 있다.
판단부(130)는 추세 검사를 위해, 신규 데이터와 사용 데이터를 X축은 시간, Y축은 데이터의 특성으로 지정하여 각각 개별적으로 근사한다. 판단부(130)는 사용 데이터 또는 신규 데이터를 근사하여 도 4와 같은 그래프를 도출할 수 있다.
도 4를 참조하면, 배터리의 주기가 반복되면서 나타나는 배터리의 특성 (즉, 배터리의 용량 추세)를 보여주는 그래프가 도시된다. 여기서, 데이터는 사용 데이터 또는 신규 데이터일 수 있다.
판단부(130)는 근사를 통해 얻은 그래프로부터 획득한 2차 함수 수식의 계수를 추세 계수로 정의할 수 있다. 2차 함수 수식의 2차항 계수는 a로, 1차항 계수는 b로, 상수항 계수는 c 라고 지정할 수 있다.
도 5를 참조하면, 도 4에 도시된 그래프로부터 획득한 1차항 및 상수항 추세 계수가 도시된다.
도 6을 참조하면, 판단부(130)는 사용 데이터의 특성의 추세 계수 a, b, c를 3차원 그래프에 도시할 수 있다. 판단부(130)는 신규 데이터의 특성의 추세 계수 가 3차원 그래프에 도시된 사용 데이터의 특성의 추세 계수의 범위에 속하는지 개별적으로 판단한다. 판단부(130)는 추세 검사 결과, 신규 데이터의 특성의 추세 계수가 사용 데이터의 추세 계수의 범위에 모두 포함되는 경우 추세 범위를 만족하는 것으로 판단할 수 있다.
도 6을 참조하면, 배터리의 주기가 반복되면서 나타나는 데이터의 특성(즉, 배터리의 용량 추세)을 보여주는 그래프로부터 획득한 사용 데이터의 추세 계수 값을 보여주는 3차원 그래프가 도시된다.
다시 도 3을 참조하면, S309 단계에서, 판단부(130)는 경계 검사와 추세 검사의 결과 신규 데이터가 사용 데이터의 경계 범위와 추세 범위를 만족하는지 판단할 수 있다.
S310 단계에서, 판단부(130)는 신규데이터가 경계 범위와 추세 범위를 모두 만족하는 경우 머신러닝 모델에 사용할 수 있다.
S311 단계에서, 판단부(130)는 F-test를 수행하여 획득한 결과값 또는 T-test를 수행하여 획득한 결과값이 임계값 이상인 경우 신규 데이터를 머신러닝 모델의 학습에서 제외할 수 있다.
S311 단계에서, 판단부(130)는 경계 검사와 추세 검사를 수행하여 신규 데이터가 사용 데이터의 경계 범위 또는 추세 범위를 만족하지 못하는 경우, 신규 데이터를 머신러닝 모델의 학습에서 제외할 수 있다.
이상의 설명은 본 개시의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 개시의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다.
따라서, 본 개시에 개시된 실시예들은 본 개시의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 개시의 기술 사상의 범위가 한정되는 것은 아니다. 본 개시의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 개시의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 머신러닝 학습 장치
110: 데이터 관리부
120: 데이터 분석부
130: 판단부

Claims (14)

  1. 신규 데이터를 수집하는 데이터 관리부;
    머신러닝 모델을 생성하는데 사용된 데이터 및 상기 신규 데이터의 특성을 추출하는 데이터 분석부; 및
    상기 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하고, 상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 판단부를 포함하는 머신러닝 학습 장치.
  2. 제 1 항에 있어서,
    상기 판단부는 상기 신규 데이터의 개수가 기준 개수 미만인 경우,
    상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사(bounds checking) 및 추세 검사(trend test)를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 것을 특징으로 하는 머신러닝 학습 장치.
  3. 제 2 항에 있어서,
    상기 추세 검사는 시간에 따른 상기 신규 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수가, 시간에 따른 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 변화를 나타내는 그래프로부터 획득한 수식의 계수의 범위에 속하는지 판단하는 것을 특징으로 하는 머신러닝 학습 장치.
  4. 제 2항에 있어서,
    상기 판단부가 상기 추세 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 추세 범위에 속하는 것으로 판단하고, 상기 경계 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 경계 범위에 속하는 것으로 판단하는 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에 적용하는 머신러닝 학습 장치.
  5. 제 1항에 있어서,
    상기 판단부는 상기 신규 데이터의 개수가 기준 개수 이상인 경우,
    상기 머신러닝 모델을 생성하는데 사용된 데이터와 상기 신규 데이터에 대하여 F-test 및 T-test를 수행하는 것을 특징으로 하는 머신러닝 학습 장치.
  6. 제 5항에 있어서,
    상기 판단부는 상기 F-test를 수행하여 획득한 결과값 또는 상기 T-test를 수행하여 획득한 결과값이 임계값 이상인 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 제외하는 머신러닝 학습 장치.
  7. 제 5항에 있어서,
    상기 판단부는 상기 F-test 및 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 것을 특징으로 하는 머신러닝 학습 장치.
  8. 제 7항에 있어서,
    상기 판단부가 상기 추세 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 추세 범위에 속하는 것으로 판단하고, 상기 경계 검사를 수행한 결과, 상기 신규 데이터의 특성이 상기 머신러닝 모델 생성에 사용된 데이터의 특성의 경계 범위에 속하는 것으로 판단하는 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에 적용하는 머신러닝 학습 장치.
  9. 제1항에 있어서,
    상기 판단부의 판단 결과에 기초하여 상기 신규 데이터를 상기 머신러닝 모델에 적용하여 상기 머신러닝 모델을 학습시키는 머신러닝 모델 학습부를 더 포함하는 머신러닝 학습 장치.
  10. 신규 데이터를 수집하는 단계;
    머신러닝 모델을 생성하는데 사용된 데이터 및 상기 신규 데이터의 특성을 추출하는 단계;
    상기 신규 데이터의 개수가 기준 개수 미만인지 여부를 판단하는 단계; 및
    상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계를 포함하는 머신러닝 학습 장치의 동작 방법.
  11. 제 10 항에 있어서,
    상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 신규 데이터의 개수가 기준 개수 미만인 경우,
    상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계를 포함하는 머신러닝 학습 장치의 동작 방법.
  12. 제 10항에 있어서,
    상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 신규 데이터의 개수가 기준 개수 이상인 경우, 상기 머신러닝 모델을 생성하는데 사용된 데이터와 상기 신규 데이터에 대하여 F-test 및 T-test를 수행하는 단계를 포함하는 머신러닝 학습 장치의 동작 방법
  13. 제 12항에 있어서,
    상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 F-test를 수행하여 획득한 결과값 또는 상기 T-test를 수행하여 획득한 결과값이 임계값 이상 인 경우, 상기 신규 데이터를 상기 머신러닝 모델의 학습에서 제외하는 단계를 포함하는 머신러닝 학습 장치의 동작 방법
  14. 제 12항에 있어서,
    상기 신규 데이터의 개수에 따라 서로 다른 방법을 이용하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계는 상기 F-test 및 T-test를 수행하여 획득한 결과값이 임계값 미만인 경우, 상기 신규 데이터의 특성과 상기 머신러닝 모델 생성에 사용된 데이터의 특성에 대하여 경계 검사 및 추세 검사를 수행하여 상기 신규 데이터를 상기 머신러닝 모델에 적용할 지 여부를 판단하는 단계를 포함하는 머신러닝 학습 장치의 동작 방법
KR1020200182652A 2020-12-23 2020-12-23 머신러닝 학습 장치 및 그것의 동작 방법 KR20220091291A (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020200182652A KR20220091291A (ko) 2020-12-23 2020-12-23 머신러닝 학습 장치 및 그것의 동작 방법
CN202180060822.7A CN116249993A (zh) 2020-12-23 2021-12-08 机器学习训练装置及其操作方法
EP21911330.5A EP4170560A4 (en) 2020-12-23 2021-12-08 MACHINE LEARNING TRAINING APPARATUS AND OPERATING METHOD THEREOF
US18/017,289 US20230274185A1 (en) 2020-12-23 2021-12-08 Machine learning training apparatus and operating method thereof
PCT/KR2021/018552 WO2022139263A1 (ko) 2020-12-23 2021-12-08 머신러닝 학습 장치 및 그것의 동작 방법
JP2023503024A JP2023534285A (ja) 2020-12-23 2021-12-08 機械学習訓練装置及びその動作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200182652A KR20220091291A (ko) 2020-12-23 2020-12-23 머신러닝 학습 장치 및 그것의 동작 방법

Publications (1)

Publication Number Publication Date
KR20220091291A true KR20220091291A (ko) 2022-06-30

Family

ID=82159538

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200182652A KR20220091291A (ko) 2020-12-23 2020-12-23 머신러닝 학습 장치 및 그것의 동작 방법

Country Status (6)

Country Link
US (1) US20230274185A1 (ko)
EP (1) EP4170560A4 (ko)
JP (1) JP2023534285A (ko)
KR (1) KR20220091291A (ko)
CN (1) CN116249993A (ko)
WO (1) WO2022139263A1 (ko)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7096092B1 (en) * 2000-11-03 2006-08-22 Schlumberger Technology Corporation Methods and apparatus for remote real time oil field management
CN109242133B (zh) * 2018-07-11 2022-03-22 北京石油化工学院 一种地表灾害预警的数据处理方法及系统
WO2020028036A1 (en) * 2018-08-01 2020-02-06 D5Ai Llc Robust von neumann ensembles for deep learning
KR20210145126A (ko) * 2018-12-13 2021-12-01 데이터로봇, 인크. 데이터 이상을 검출하고 해석하기 위한 방법, 및 관련된 시스템 및 디바이스
US11030484B2 (en) * 2019-03-22 2021-06-08 Capital One Services, Llc System and method for efficient generation of machine-learning models
KR102033136B1 (ko) * 2019-04-03 2019-10-16 주식회사 루닛 준지도 학습 기반의 기계학습 방법 및 그 장치
KR102128056B1 (ko) * 2019-11-29 2020-07-07 주식회사 루닛 기계 학습 방법 및 장치
CN111915004A (zh) * 2020-06-17 2020-11-10 北京迈格威科技有限公司 神经网络的训练方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
EP4170560A1 (en) 2023-04-26
JP2023534285A (ja) 2023-08-08
US20230274185A1 (en) 2023-08-31
EP4170560A4 (en) 2024-01-24
CN116249993A (zh) 2023-06-09
WO2022139263A1 (ko) 2022-06-30

Similar Documents

Publication Publication Date Title
CN107785624B (zh) 一种评估锂电池性能的方法
WO2023024851A1 (zh) 电池均衡方法及系统
CN111856283A (zh) 电池评价系统、电池评价方法以及程序
CN116381541B (zh) 一种储能锂电池系统的健康评估方法及系统
CN109768340A (zh) 一种电池放电过程电压不一致性估计方法及装置
CN113657360A (zh) 锂电池健康状态估计方法、装置、设备及可读存储介质
CN113866641A (zh) 一种锂离子电池的故障检测方法及装置
CN108254689A (zh) 电池组反极单体电池检测方法和系统
CN115805810A (zh) 电池故障预测方法、装置、设备、存储介质和程序产品
CN110806540A (zh) 电芯测试数据处理方法、装置、系统和存储介质
CN105987823A (zh) 通信装备基于振动应力变换的加速试验方法
KR20220091291A (ko) 머신러닝 학습 장치 및 그것의 동작 방법
CN117031337A (zh) 一种电芯内短路检测方法、装置、存储介质及设备
CN108446213A (zh) 一种静态代码质量分析方法和装置
CN116298910A (zh) 电池安全管控方法及装置
CN111652379B (zh) 模型管理方法、装置、电子设备及存储介质
JP7193678B2 (ja) 情報処理装置、情報処理方法、情報処理システム、およびプログラム
CN113219358A (zh) 电池包健康状态计算方法、系统及电子设备
CN117610970B (zh) 一种数据迁移工作的智能评估方法及系统
US20230268753A1 (en) Intelligent battery charging based on history
CN116541718B (zh) 电池容量跳水识别模型的训练方法、装置、设备及介质
Kesici et al. Cost sensitive class-weighting approach for transient instability prediction using convolutional neural networks
KR102555776B1 (ko) 배터리 성능진단을 위한 진단 알고리즘의 동작 방법 및 배터리 성능진단 시스템
KR102422603B1 (ko) 배터리 수명 평가 방법 및 장치
TWI842294B (zh) 二次電池容量估測系統