WO2023113295A1

WO2023113295A1 - 모델 갱신 장치 및 방법

Info

Publication number: WO2023113295A1
Application number: PCT/KR2022/018895
Authority: WO
Inventors: 이춘식; 전혜경; 하광림; 강인호
Original assignee: 주식회사 씨에스리
Priority date: 2021-12-16
Filing date: 2022-11-25
Publication date: 2023-06-22

Abstract

본 발명은 인공지능 모델의 성능 향상에 관한 것으로, 보다 상세하게는 인공지능 모델의 성능 향상을 위한 보정, 인공지능 모델의 갱신 기술 및 추가 학습 데이터에 따라 모델을 갱신하는 기술에 관한 것이다. 본 발명의 일 실시 예에 따르면, 운영 중인 인공지능 모델의 갱신 시점을 효율적으로 결정할 수 있어 인공지능 모델의 성능을 유지하면서 갱신에 요구되는 비용을 줄일 수 있다.

Description

모델 갱신 장치 및 방법

본 발명은 인공지능 모델의 성능 향상에 관한 것으로, 보다 상세하게는 인공지능 모델의 성능 향상을 위한 보정, 인공지능 모델의 갱신 기술 및 추가 학습 데이터에 따라 모델을 갱신하는 기술에 관한 것이다.

인공지능 모델의 학습을 위해서는 적절한 레이블을 포함하는 학습데이터가 필요하다. 레이블은 각 데이터에 대해 사람이 직접 데이터를 매칭하거나 미리 설정된 알고리즘에 따라 자동으로 각 데이터에 대응하여 설정될 수 있다.

학습 데이터를 제공하기 위해서는 데이터 수집, 레이블링 등의 작업을 위한 많은 시간과 비용이 소모된다. 특히 사람이 직접 레이블링하는 과정은 시간 및 비용이 많이 든다. 만약, 유사한 데이터가 다수 존재하는 경우, 각 데이터에 대해 직접 사람이 레이블링을 수행하는 것은 비효율적이다.

또한 인공지능 모델의 성능은 적합한 학습을 수행하였을 때 향상된다. 하지만, 새로운 입력 데이터에 대한 처리를 위해서는 해당 처리를 위한 새로운 학습 데이터 세트가 필요하지만, 변화된 입력 데이터의 패턴에 대응하는 학습 데이터 세트를 확보하는 것은 어려운 일이다.

한편 인공지능 모델에 요구는 따라 달라지기 때문에 별도의 학습 데이터를 통한 갱신 과정이 요구된다. 하지만, 인공지능 모델의 갱신 과정은 비용이 크기 때문에 적절한 갱신 시점이 중요하다.

본 발명은 모델 생성 및 갱신을 위한 데이터 수집에 비용을 줄일 수 있으며, 실제 서비스에서 발생하는 데이터를 통해 학습 데이터를 구성함으로써 모델의 성능을 향상시킬 수 있는 모델 갱신 장치 및 방법을 제공한다.

본 발명의 일 측면에 따르면, 모델 갱신 장치를 제공한다.

본 발명의 일 실시 예에 따른 모델 갱신 장치는 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하는 학습 데이터 수집부 및 모델의 학습에 이용된 기 학습 데이터를 입력으로 할 때 모델에서 출력하는 제1 출력과, 기 학습 데이터와의 유사도가 지정된 임계값 이상인 입력 데이터의 입력을 통해 모델에서 출력된 제2 출력의 편차에 따라 모델에 입력되거나 모델로부터 출력되는 데이터를 보정하는 모델 보정부를 포함할 수 있다.

본 발명의 다른 일 측면에 따르면, 모델 갱신 방법 및 이를 실행하는 컴퓨터 프로그램을 제공한다.

본 발명의 일 실시 예에 따른 모델 갱신 방법 및 이를 실행하는 컴퓨터 프로그램은 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하는 단계 및 모델의 학습에 이용된 기 학습 데이터를 입력으로 할 때 모델에서 출력하는 제1 출력과, 기 학습 데이터와의 유사도가 지정된 임계값 이상인 입력 데이터의 입력을 통해 모델에서 출력된 제2 출력의 편차에 따라 상기 모델에 입력되거나 모델로부터 출력되는 데이터를 보정하는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따르면, 새로운 데이터를 통해 인공지능 모델을 새로 학습하지 않고 서비스에서 발생하는 데이터를 통해 모델의 성능을 향상시킬 수 있다.

본 발명의 일 실시 예에 따르면, 운영 중인 인공지능 모델의 갱신 시점을 효율적으로 결정할 수 있어 인공지능 모델의 성능을 유지하면서 갱신에 요구되는 비용을 줄일 수 있다.

또한 본 발명의 일 실시 예에 따르면, 서비스 중인 인공지능 모델의 입력 데이터를 학습 데이터로 관리하면서 모델의 갱신 시점을 판단할 수 있다.

본 발명의 일 실시 예에 따르면, 기 학습된 데이터와 유사한 데이터를 학습 데이터에서 제외하여 레이블링에 소요되는 비용을 줄일 수 있다.

본 발명의 일 실시 예에 따르면, 과대 클래스 샘플링을 통한 비율조정으로 과소 클래스와의 비율을 맞춰 클래스 간 불균형을 완화할 수 있다.

또한, 본 발명의 일 실시 예에 따르면, 정보손실이 적고, 데이터 노이즈에 강한 데이터에 가까운 데이터 세트도 구축할 수 있다.

본 발명의 일 실시 예에 따르면, 모델 생성 및 갱신을 위한 데이터 수집에 비용을 줄일 수 있으며, 실제 서비스에서 발생하는 데이터를 통해 학습 데이터를 구성함으로써 모델의 성능을 향상 시킬 수 있다.

도 1은 본 발명의 일 실시 예에 따른 모델 갱신 장치를 예시한 블록도.

도 2는 본 발명의 일 실시 예에 따른 모델 갱신 장치의 레이블러를 예시한 블록도.

도 3은 본 발명의 일 실시 예에 따른 모델 갱신 장치의 모델 학습부를 예시한 블록도.

도 4는 본 발명의 일 실시 예에 따른 모델 갱신 장치의 학습 데이터 제공부의 구조를 예시한 블록도.

도 5는 본 발명의 일 실시 예에 따른 모델 갱신 장치가 레이블링을 수행하는 방법을 예시한 순서도.

도 6은 본 발명의 일 실시예에 따른 모델 갱신 장치가 학습 데이터에 대해 레이블링을 수행하는 과정을 예시한 순서도.

도 7은 본 발명의 일 실시 예에 따른 모델 갱신 장치가 학습 데이터를 샘플링하는 과정을 예시한 순서도.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서 및 청구항에서 사용되는 단수 표현은, 달리 언급하지 않는 한 일반적으로 "하나 이상"을 의미하는 것으로 해석되어야 한다.

이하, 본 발명의 바람직한 실시 예를 첨부도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

도 1은 본 발명의 일 실시 예에 따른 모델 갱신 장치를 예시한 블록도이다.

도 1을 참조하면, 본 발명의 일 실시 예에 따른 모델 갱신 장치(10)는 레이블러(100), 모델 학습부(200), 학습 데이터 제공부(300), 학습 데이터 수집부(400) 및 모델 보정부(500)를 포함한다.

레이블러(100)는 외부로부터 레이블링 되지 않은 데이터를 수신하고, 학습 데이터 제공부(300)에 저장된 기 학습된 학습 데이터(이하, 기 학습 데이터라 지칭)와 유사도가 미리 지정된 제1 임계값 이상인 데이터를 학습 데이터에서 제외하고 나머지 데이터에 대해 레이블링을 수행하여 학습 데이터 제공부(300)로 전송한다. 이하, 레이블러(100)의 구체적인 동작을 하기의 도 2를 참조하여 상세히 설명하도록 한다.

도 2는 본 발명의 일 실시 예에 따른 모델 갱신 장치의 레이블러를 예시한 블록도이다.

도 2를 참조하면, 레이블러(100)는 클러스터링부(110), 유사도 산출부(120) 및 레이블링부(130)를 포함한다.

클러스터링부(110)는 레이블링이 되지 않은 데이터(이하, 언레이블 데이터라 지칭)를 수신하는 경우, 각 언레이블 데이터에 대해 미리 지정된 패턴에 따라 클러스터링을 수행하여 하나 이상의 군집을 형성한다. 이 때, 클러스터링부(110)는 K-means, Hierarchical clustering, Spectral Clustering, DBSCAN 등의 기법을 통해 군집을 형성할 수 있다. 예를 들어, 클러스터링부(110)는 {수영복, 바닷물, 메아리}를 포함하는 언레이블 데이터를 수신하는 경우, 해당 데이터에 대해 클러스터링을 수행하여 제1 군집인 {수영복, 바닷물}과 제2 군집인 {메아리}를 형성할 수 있다.

유사도 산출부(120)는 각 군집과 모델의 학습에 사용된 기 학습 데이터 간의 유사도를 산출한다. 예를 들어, 기 학습 데이터가 클래스 "산"으로 분류된 데이터인 {나무, 잔디, 계곡 등}와 클래스 "바다"로 분류된 데이터인 {물, 파도, 수영 등}로 학습 데이터 제공부(300)에 저장되었다고 가정하자. 유사도 산출부(120)는 제1 군집인 {수영복, 바닷물}과 각 클래스로 분류된 기 학습 데이터의 군집 간의 유사도를 산출할 수 있다. 또한, 유사도 산출부(120)는 제2 군집인 {메아리}와 각 클래스로 분류된 기 학습 데이터의 군집 간의 유사도를 산출할 수 있다. 유사도 산출부(120)는 코사인 유사도, 자카드 유사도, 유클리디안 유사도 기법과 같은 기법을 통해 유사도를 산출할 수 있다. 유사도 산출부(120)는 각 유사도를 레이블링부(130)로 전송한다.

레이블링부(130)는 언레이블 데이터의 군집과 기 학습 데이터 중 하나 이상의 군집 간의 유사도가 제1 임계값 이상인 경우, 해당 언레이블 데이터의 군집을 학습 데이터에서 제외시킨다. 즉, 레이블링부(130)는 기 학습 데이터 중 모든 군집과의 유사도가 제1 임계값 미만인 언레이블 데이터의 군집에 대해 레이블링을 수행하고, 레이블링된 데이터를 새로운 학습 데이터로써 학습 데이터 제공부(300)에 저장한다.

예를 들어, 레이블링부(130)는 언레이블 데이터의 제1 군집인 {수영복, 바닷물}과 "바다"로 분류된 데이터인 {물, 파도, 수영 등}의 유사도(예를 들어, 각 분류의 데이터 간의 유사도들의 평균)가 제1 임계값 이상인 경우, 제1 군집의 데이터를 학습 데이터에서 제외시킬 수 있다. 레이블링부(130)는 제2 군집인 {메아리}와 기 학습 데이터의 군집 간의 유사도가 제1 임계값 미만인 경우, 제2 군집인 {메아리}에 대해 레이블링을 수행하여 학습 데이터로 학습 데이터 제공부(300)에 전송할 수 있다. 이 때, 레이블링부(130)는 제2 군집인 {메아리}와 기 학습 데이터의 군집 간 유사도가 제1 임계값 미만이고 제2 임계값 이상인 경우(이 때, 제1 임계값은 제2 임계값보다 큰 자연수임), 제2 군집의 데이터에 대한 레이블을 제2 군집의 각 데이터와 가장 유사도가 클래스의 군집과 동일한 레이블로 자동 설정할 수 있다. 또한, 레이블링부(130)는 제2 군집인 {메아리}와 기 학습 데이터의 군집 간 유사도가 제2 임계값 미만인 경우, 제2 군집의 각 데이터에 대해 사용자로부터 직접 새 레이블을 입력받아 레이블링을 수행할 수 있다.

따라서, 레이블러(100)는 언레이블 데이터 중 기 학습 데이터와 유사도가 매우 높은 언레이블 데이터는 학습 데이터로 사용되지 않도록 하여 특정 클래스에 대한 과적합이 되는 경우를 방지하고, 유사도가 일정 수준 이상인 언레이블 데이터에 대해서는 자동 레이블링을 수행하여, 새 레이블을 추가받는 언레이블 데이터의 수를 줄여 레이블링 작업의 부하를 줄일 수 있다.

다시 도 1을 참조하면, 모델 학습부(200)는 학습 데이터 제공부(300)에 저장된 학습 데이터를 통해 인공지능을 구성하는 모델을 학습시킨다. 이 때, 모델은 인공 지능을 구성하는 신경망 등의 시스템에 의해 구현된 모델일 수 있다. 모델 학습부(200)는 학습 데이터 제공부(300)로부터 추가 학습 데이터를 수신하는 경우, 기 학습 데이터의 패턴(데이터와 레이블)와 추가 학습 데이터의 패턴을 비교한다. 모델 학습부(200)는 기 학습 데이터의 패턴과 추가 학습 데이터의 패턴의 유사도가 미리 지정된 임계값 미만인 경우, 추가 학습 데이터를 통해 모델의 갱신을 수행한다. 반대로, 모델 학습부(200)는 기 학습 데이터의 패턴과 추가 학습 데이터의 패턴의 유사도가 미리 지정된 임계값 이상인 경우, 추가 학습 데이터를 통한 모델 갱신을 수행하지 않는다. 이하, 도 3을 참조하여 모델 학습부(200)의 상세 구조를 설명하도록 한다.

도 3은 본 발명의 일 실시 예에 따른 모델 갱신 장치의 모델 학습부를 예시한 블록도이다.

도 3을 참조하면, 모델 학습부(200)는 패턴 저장부(210), 갱신 판단부(220) 및 학습부(230)를 포함한다.

패턴 저장부(210)는 학습 데이터의 패턴을 저장한다. 예를 들어, 의류의 학습데이터와 계절의 레이블을 이용한 학습데이터 세트로 의류에 따른 계절을 예측하는 모델을 생성하는 경우, 패턴 저장부(210)는 <반팔 - 여름>, <긴팔 - 겨울>과 같이 의류와 계절을 연관시키는 패턴을 저장할 수 있다.

갱신 판단부(220)는 학습 데이터 제공부(300)로부터 추가 학습 데이터 패턴을 수신하는 경우, 추가 학습 데이터와 기 학습 데이터의 패턴의 유사도가 지정된 임계값 이하인 경우, 추가 학습 데이터를 통한 모델의 갱신을 학습부(230)를 통해 수행한다. 예를 들어, 추가 학습 데이터의 패턴이 <반팔 - 여름>인 경우, 기 학습 데이터의 패턴과 추가 학습 데이터의 패턴이 동일하기 때문에 갱신 판단부(220)는 <반팔 - 여름>에 따른 갱신을 수행하지 않는다. 반면, 추가 학습 데이터의 패턴이 <반바지 - 여름>이어서 기 학습 데이터의 패턴과 추가 학습 데이터의 패턴간 유사도가 지정된 임계값 이하인 경우, <반바지 - 여름>에 따른 모델 갱신을 학습부(230)를 통해 수행할 수 있다. 반대로 갱신 판단부(220)는 기 학습 데이터의 패턴과 추가 학습 데이터의 패턴간 유사도가 지정된 임계값을 초과하는 경우, 추가 학습 데이터에 따른 갱신을 유보하여, 기 학습 데이터와 유사한 추가 학습 데이터를 통한 갱신을 통해 효과가 높지 않은 갱신을 수행하는 것을 방지할 수 있다.

또한, 갱신 판단부(220)는 학습 데이터 제공부(300)로부터 수신한 전체 학습 데이터 대비 추가 학습 데이터의 수의 비율이 미리 지정된 임계값(예를 들어 30%) 이상인 경우, 학습부(230)를 통해 모델 갱신을 수행할 수 있다. 또는, 갱신 판단부(220)는 전체 학습 데이터 대비 추가 학습 데이터의 수의 비율이 미리 지정된 임계값 이상인 경우, 추가 학습 데이터와 기 학습 데이터의 패턴의 유사도가 지정된 임계값 이하임에 따라 추가 학습 데이터를 통한 모델의 갱신을 학습부(230)를 통해 수행할 수 있다.

학습부(230)는 학습 데이터 및 추가 학습 데이터를 통해 모델의 학습을 수행한다.

따라서, 모델 갱신 장치는 추가 학습 데이터의 패턴이 기 학습 데이터의 패턴과 일정 이상 상이한 경우에만 모델의 갱신을 수행하여 모든 추가 학습 데이터의 추가에 따라 모델의 갱신을 수행하는 비효율적인 상황을 방지할 수 있다.

또한, 모델 갱신 장치는 기존 추가된 레이블을 이용하여 서비스 중인 인공지능 모델의 입력 값을 학습 데이터로 관리하면서 인공지능 모델의 갱신 시점 판단이 가능하다.

다시 도 1을 참조하면, 학습 데이터 제공부(300)는 학습 데이터를 저장하고, 학습 데이터를 모델 학습부(200)로 제공한다. 학습 데이터 제공부(300)는 학습 데이터를 복수의 클래스로 분류하였을 때, 클래스 내 학습 데이터의 수가 가장 많은 과대 클래스와 클래스 내 학습 데이터의 수가 가장 적은 과소 클래스를 검출한다. 학습 데이터 제공부(300)는 과대 클래스와 과소 클래스의 학습 데이터 수의 비율이 지정된 범위 내에 해당하도록 과대 클래스에 대한 샘플링을 수행하여 과대 클래스에 대한 학습 데이터 수를 조정한다. 또한, 학습 데이터 제공부(330)는 과대 클래스의 학습 데이터를 이용하여 노이즈 데이터를 생성하고, 노이즈 데이터를 비지도 학습 GAN(Generative adversarial network)에 입력하여 노이즈 학습 데이터를 생성하고, 기존 학습 데이터에 노이즈 학습 데이터를 추가하여 모델 학습부(200)로 제공할 수 있다. 이하, 도 4를 참조하여 학습 데이터 제공부(300)의 상세한 구조를 설명하도록 한다.

도 4는 본 발명의 일 실시 예에 따른 모델 갱신 장치의 학습 데이터 제공부의 구조를 예시한 블록도이다.

도 4를 참조하면, 학습 데이터 제공부(300)는 불균형 분포 확인부(310), 샘플링부(320) 및 노이즈 추가부(330)를 포함한다.

불균형 분포 확인부(310)는 학습 데이터를 복수의 클래스로 분류하였을 경우, 과대 클래스와 과소 클래스의 학습 데이터 수의 비율이 지정된 범위 내에 해당하는지 판단한다. 만약, 과대 클래스와 과소 클래스의 학습 데이터 수의 비율이 지정된 범위를 벗어나는 경우, 샘플링부(320)로 과대 클래스에 대한 샘플링을 요청하는 샘플링 요청 신호를 전송한다.

샘플링부(320)는 샘플링 요청 신호를 수신하는 경우, 과대 클래스에 대한 샘플링을 수행한다. 샘플링부(320)는 과대 클래스의 학습 데이터에 대응하는 특징 벡터의 중심점을 산출할 수 있다. 샘플링부(320)는 산출된 중심점을 기준으로 특정 벡터의 거리가 일정 이내인 학습 데이터를 샘플링하거나, 확률적 샘플링 방법인 단순 랜덤 샘플링, 2단계 샘플링, 층별 샘플링, 군집/집락 샘플링, 계통 샘플링 등의 기법을 적용할 수 있다

노이즈 추가부(330)는 학습 데이터를 이용하여 노이즈 데이터를 생성하고, 노이즈 데이터를 비지도 학습 GAN에 입력하여 노이즈 학습 데이터를 생성한다. 노이즈 추가부(330)는 샘플링이 완료된 학습 데이터에 노이즈 학습 데이터를 추가하여 모델 학습부(200)로 제공할 수 있다.

따라서, 본 발명의 일 실시 예에 따른 모델 갱신 장치는 특정 클래스가 비대하여 과대 클래스의 결과만을 예측하는 편향된 방향으로 모델이 학습되는 것을 방지하고, 노이즈를 고려하여 생성된 노이즈 학습 데이터를 통해 모델이 노이즈에 대해 강인하게 학습되도록 할 수 있다.

다시 도 1을 참조하면, 학습 데이터 수집부(400)는 학습된 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 통해 학습 데이터를 수집한다. 예를 들어, 학습 데이터 수집부(400)는 학습된 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 수집할 수 있다. 학습 데이터 수집부(400)는 출력 데이터 중 기 학습 데이터의 레이블 범위(기 학습 데이터에 대해 설정된 레이블들의 집합) 내 존재하는 출력 데이터를 레이블로 하여 입력 데이터를 학습 데이터로 설정한 추가 학습 데이터 세트를 구성할 수 있다. 이 때, 학습 데이터 수집부(400)는 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터에 상응하는 입력 데이터가 기 학습 데이터와 상이한 경우에만 해당 입력 데이터 및 출력 데이터를 추가 학습 데이터 세트에 포함시킬 수 있다. 학습 데이터 수집부(400)는 추가 학습 데이터 세트를 학습 데이터 제공부(300)로 전송한다.

따라서, 본 발명의 일 실시예에 따른 모델 갱신 장치는 모델 생성 및 갱신을 위한 데이터 수집에 비용을 줄일 수 있으며, 실제 서비스에서 발생하는 데이터를 통해 학습 데이터를 구성함으로써 모델의 성능을 향상 시킬 수 있다.

모델 보정부(500)는 모델이 출력하는 데이터를 보정하여 모델의 성능을 향상 시킨다. 예를 들어, 모델 보정부(500)는 학습된 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 학습 데이터 수집부(400)를 통해 모니터링할 수 있다. 모델 보정부(500)는 모델의 학습에 이용된 기 학습 데이터를 입력으로 하는 경우 모델에서 출력하는 제1 출력과, 기 학습 데이터와 유사한 입력 데이터(코사인 유사도, 자카드 유사도, 유클리디안 유사도 기법과 같은 기법을 통해 기 학습 데이터와의 유사도가 지정된 임계값 이상인 입력 데이터)의 입력을 통해 모델에서 출력된 제2 출력을 편차를 산출할 수 있다. 모델 보정부(500)는 제1 출력과 제2 출력의 편차가 속하는 클래스의 중심값을 오차 보정 값으로 설정할 수 있다. 이 때, 모델 보정부(500)는 제1 출력과 제2 출력의 편차를 분류하는 클래스를 미리 설정할 수 있고, 각 클래스에 해당하는 편차들의 중심값을 오차 보정값으로 설정할 수 있다. 모델 보정부(500)는 오차 보정값을 입력 데이터 또는 출력 데이터에 적용하여 입력 데이터에 상응하는 출력 데이터를 보정할 수 있다. 이 때, 모델 보정부(500)는 출력 데이터에 오차 보정값을 더하거나 차감하거나, 입력 데이터에 오차 보정값을 더하거나 차감한 뒤 모델에 입력하도록 하여 모델의 출력 데이터가 보정되도록 할 수 있다.

따라서, 본 발명의 일 실시 예에 따른 모델 갱신 장치는 새로운 데이터를 통해 인공지능 모델을 새로 학습하지 않고 서비스에서 발생하는 데이터를 통해 모델의 성능을 향상시킬 수 있다.

도 5는 본 발명의 일 실시 예에 따른 모델 갱신 장치가 레이블링을 수행하는 방법을 예시한 순서도이다. 이하 설명하는 각 단계는 도 1을 참조하여 상술한 모델 갱신 장치를 구성하는 각 기능부가 수행하는 과정이나, 발명의 간결하고 명확한 설명을 위해 각 단계의 주체를 모델 갱신 장치로 통칭하도록 한다.

도 5를 참조하면, 단계 510에서 모델 갱신 장치는 레이블이 설정되지 않은 학습 데이터에 대해 레이블링을 수행한다. 이 때, 레이블링을 수행하는 구체적인 과정은 추후 도 6을 참조하여 상세히 설명하도록 한다.

단계 515에서 모델 갱신 장치는 모델을 통한 서비스에서 모델에 입력 및 출력된 데이터를 통해 추가 학습 데이터를 수집한다. 예를 들어, 모델 갱신 장치는 학습된 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 수집할 수 있다. 모델 갱신 장치는 출력 데이터 중 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터를 레이블로 하여 입력 데이터를 학습 데이터로 설정한 추가 학습 데이터 세트를 구성할 수 있다. 이 때, 모델 갱신 장치는 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터에 상응하는 입력 데이터가 기 학습 데이터와 상이한 경우에만 해당 입력 데이터 및 출력 데이터를 추가 학습 데이터 세트에 포함시킬 수 있다.

단계 520에서 모델 갱신 장치는 학습 데이터에 대해 샘플링을 수행하여 과대 클래스에 속하는 학습 데이터의 수를 조정한다. 이 때, 샘플링을 수행하는 구체적인 과정은 추후 도 7을 참조하여 상세히 설명하도록 한다.

단계 525에서 모델 갱신 장치는 모델의 갱신이 필요한지 판단한다. 이 때, 모델 갱신 장치는 기 학습 데이터와 추가 학습 데이터 패턴의 유사도 또는 전체 학습 데이터 대비 추가 학습 데이터의 비율에 따라 모델의 갱신이 필요한지 판단할 수 있다. 예를 들어, 모델 갱신 장치는 추가 학습 데이터와 기 학습 데이터의 패턴을 저장하여 관리할 수 있다. 모델 갱신 장치는 추가 학습 데이터와 기 학습 데이터의 패턴의 유사도가 지정된 임계값 이하인 경우, 추가 학습 데이터를 통한 모델의 갱신이 필요한 것으로 판단할 수 있다. 또는 모델 갱신 장치는 전체 학습 데이터 대비 추가 학습 데이터의 비율이 지정된 임계값(예를 들어, 30%) 이상인 경우, 추가 학습 데이터를 통한 모델의 갱신이 필요한 것으로 판단할 수 있다.

단계 525에서 모델의 갱신이 필요한 경우, 단계 530에서 모델 갱신 장치는 추가 학습 데이터를 이용하여 모델의 갱신을 수행한다.

단계 525에서 모델의 갱신이 필요하지 않는 경우, 단계 535에서 모델 갱신 장치는 기 학습 데이터를 입력으로 하는 경우 모델에서 출력하는 제1 출력과, 모델을 통한 서비스 제공 중 입력 받은 입력 데이터 중 기 학습 데이터와 유사한 입력 데이터의 입력을 통해 모델에서 출력된 제2 출력을 편차에 따라 모델의 출력 데이터를 보정한다. 이 때, 모델 갱신 장치는 제1 출력과 제2 출력의 편차를 분류하는 클래스를 미리 설정할 수 있고, 각 클래스에 해당하는 편차들의 중심값을 오차 보정값으로 설정할 수 있다. 모델 갱신 장치는 오차 보정값을 출력 데이터에 적용하여 입력 데이터에 상응하는 출력 데이터를 보정할 수 있다. 또는 모델 갱신 장치는 오차 보정값을 입력 데이터에 적용한 뒤 모델에 입력하여 출력 데이터의 값이 보정되도록 할 수 있다.

도 6은 본 발명의 일 실시예에 따른 모델 갱신 장치가 학습 데이터에 대해 레이블링을 수행하는 과정을 예시한 순서도이다. 이하 설명하는 각 과정은 도 5의 단계 510에 해당하는 과정일 수 있다.

도 6을 참조하면, 단계 610에서 모델 갱신 장치는 각 언레이블 데이터에 대해 미리 지정된 패턴에 따라 클러스터링을 수행하여 하나 이상의 군집을 형성한다.

단계 620에서 모델 갱신 장치는 언레이블 데이터의 각 군집과 모델의 학습에 사용된 기 학습 데이터의 군집 간의 유사도를 산출한다. 모델 갱신 장치는 코사인 유사도, 자카드 유사도, 유클리디안 유사도 기법과 같은 기법을 통해 유사도를 산출할 수 있다.

단계 630에서 모델 갱신 장치는 언레이블 데이터의 군집과 기 학습 데이터 중 하나 이상의 군집 간의 유사도가 제1 임계값 이상인 경우, 해당 언레이블 데이터의 군집을 학습 데이터에서 제외시킨다. 또는 모델 갱신 장치는 언레이블 데이터의 군집이 기 학습 데이터 중 모든 군집과의 유사도가 제1 임계값 미만이고 제2 임계값 이상인 경우(이 때, 제1 임계값은 제2 임계값을 초과하는 값임), 해당 군집에 포함된 각 데이터와 가장 유사도가 클래스의 군집과 동일한 레이블을 각 데이터에 상응하는 레이블로 자동 설정할 수 있다. 또는 모델 갱신 장치는 언레이블 데이터의 군집이 기 학습 데이터 중 모든 군집과의 유사도가 제2 임계값 미만인 경우, 각 데이터에 대해 사용자로부터 직접 새 레이블을 입력받아 레이블링을 수행할 수 있다.

도 7은 본 발명의 일 실시 예에 따른 모델 갱신 장치가 학습 데이터를 샘플링하는 과정을 예시한 순서도이다. 이하 설명하는 각 과정은 도 5의 520에 해당하는 과정이다.

도 7을 참조하면, 단계 710에서 모델 갱신 장치는 학습 데이터를 복수의 클래스로 분류하였을 때, 클래스 내 학습 데이터의 수가 가장 많은 과대 클래스와 클래스 내 학습 데이터의 수가 가장 적은 과소 클래스를 검출한다.

단계 720에서 모델 갱신 장치는 과대 클래스와 과소 클래스의 학습 데이터 수의 비율이 지정된 범위 내에 해당하도록 과대 클래스에 대한 샘플링을 수행하여 과대 클래스에 대한 학습 데이터 수를 조정한다. 예를 들어, 모델 갱신 장치는 과대 클래스의 학습 데이터에 대응하는 특징 벡터의 중심점을 산출하고, 중심점을 기준으로 과대 클래스에 대해 샘플링을 수행할 수 있다.

단계 730에서 모델 갱신 장치는 과대 클래스의 학습 데이터를 이용하여 노이즈 데이터를 생성하고, 노이즈 데이터를 비지도 학습 GAN(Generative adversarial network)에 입력하여 노이즈 학습 데이터를 생성하고, 기존 학습 데이터에 노이즈 학습 데이터를 추가한다.

본 발명의 실시 예에 따른 학습 데이터 관리 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 또한 상술한 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이제까지 본 발명에 대하여 그 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

발명의 실시를 위한 형태는 위의 발명의 실시를 위한 최선의 형태에서 함께 기술되었다.

본 발명은 모델 생성 및 갱신을 위한 데이터 수집에 비용을 줄일 수 있으며, 실제 서비스에서 발생하는 데이터를 통해 학습 데이터를 구성함으로써 모델의 성능을 향상 시킬 수 있어 산업상 이용 가능성이 있다.

Claims

모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하는 학습 데이터 수집부; 및

상기 모델의 학습에 이용된 기 학습 데이터를 입력으로 할 때 상기 모델에서 출력하는 제1 출력과, 상기 기 학습 데이터와의 유사도가 지정된 임계값 이상인 상기 입력 데이터의 입력을 통해 상기 모델에서 출력된 제2 출력의 편차에 따라 상기 모델에 입력되거나 상기 모델로부터 출력되는 데이터를 보정하는 모델 보정부를 포함하는 모델 갱신 장치.
제1항에 있어서,

상기 모델 보정부는,

미리 설정된 클래스 중 상기 제1 출력과 상기 제2 출력의 편차에 해당하는 클래스의 중심값을 오차 보정값으로 설정하고,

상기 오차 보정값을 상기 모델에 입력되거나 상기 모델로부터 출력되는 데이터에 적용하는 것을 특징으로 하는 모델 갱신 장치.
기 학습 데이터의 패턴을 저장하는 패턴 저장부;

추가 학습 데이터의 패턴과 상기 기 학습 데이터의 패턴의 유사도에 따라 모델의 갱신을 결정하는 갱신 판단부; 및

상기 추가 학습 데이터를 통해 상기 모델의 갱신을 수행하는 학습부를 포함하는 모델 갱신 장치.
제3항에 있어서,

상기 갱신 판단부는,

상기 추가 학습 데이터의 패턴과 상기 기 학습 데이터의 패턴의 유사도가 지

정된 임계값 이하인 경우, 상기 모델의 갱신하는 것으로 결정하는 것을 특징으로 하는 모델 갱신 장치.
제4항에 있어서,

상기 갱신 판단부는,

상기 추가 학습 데이터의 패턴과 상기 기 학습 데이터의 패턴의 유사도가 지정된 임계값을 초과하는 경우, 상기 모델의 갱신을 유보하는 것을 특징으로 하는 모델 갱신 장치.
모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하고, 출력 데이터 중 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터를 레이블로 한 상기 입력 데이터를 추가 학습 데이터로 설정하는 학습 데이터 수집부; 및 상기 추가 학습 데이터의 수와 전체 학습 데이터의 수 간의 비율이 지정된 임계값 이상인 경우, 상기 모델의 갱신을 수행하는 모델 학습부를 포함하는 모델 갱신 장치.
제6항에 있어서,

상기 학습 데이터 수집부는,

상기 기 학습 데이터의 레이블 범위 내 존재하는 상기 출력 데이터에 상응하

는 상기 입력 데이터가 상기 기 학습 데이터와 상이한 경우에 상기 입력 데이터를 상기 추가 학습 데이터로 설정하는 것을 특징으로 하는 모델 갱신 장치.
모델 갱신 장치가 모델을 갱신하는 방법에 있어서,

모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하는 단계; 및

상기 모델의 학습에 이용된 기 학습 데이터를 입력으로 할 때 상기 모델에서 출력하는 제1 출력과, 상기 기 학습 데이터와의 유사도가 지정된 임계값 이상인 상기 입력 데이터의 입력을 통해 상기 모델에서 출력된 제2 출력의 편차에 따라 상기 모델에 입력되거나 상기 모델로부터 출력되는 데이터를 보정하는 단계를 포함하는 모델 갱신 방법.
제8항에 있어서,

상기 모델의 학습에 이용된 기 학습 데이터를 입력으로 할 때 상기 모델에서 출력하는 제1 출력과, 상기 기 학습 데이터와의 유사도가 지정된 임계값 이상인 상기 입력 데이터의 입력을 통해 상기 모델에서 출력된 제2 출력의 편차에 따라 상기 모델에 입력되거나 상기 모델로부터 출력되는 데이터를 보정하는 단계는,

미리 설정된 클래스 중 상기 제1 출력과 상기 제2 출력의 편차에 해당하는 클래스의 중심값을 오차 보정값으로 설정하는 단계;

상기 오차 보정값을 상기 모델에 입력되거나 상기 모델로부터 출력되는 데이터에 적용하는 단계를 포함하는 것을 특징으로 하는 모델 갱신 방법.
모델 갱신 장치가 모델 갱신을 수행하는 방법에 있어서,

추가 학습 데이터의 패턴을 수신하는 단계;

상기 추가 학습 데이터의 패턴과 기 학습 데이터의 패턴의 유사도를 산출하는 단계;

상기 유사도에 따라 모델의 갱신을 결정하는 단계; 및

상기 추가 학습 데이터를 통해 상기 모델의 갱신을 수행하는 단계를 포함하는 모델 갱신 방법.
제10항에 있어서,

상기 유사도에 따라 모델의 갱신을 결정하는 단계는,

상기 추가 학습 데이터의 패턴과 상기 기 학습 데이터의 패턴의 유사도가 지

정된 임계값 이하인 경우, 상기 모델의 갱신하는 것으로 결정하는 단계인 것을 특징으로 하는 모델 갱신 방법.
제11항에 있어서,

상기 유사도에 따라 모델의 갱신을 결정하는 단계는,

상기 추가 학습 데이터의 패턴과 상기 기 학습 데이터의 패턴의 유사도가 지정된 임계값을 초과하는 경우, 상기 모델의 갱신을 유보하는 단계인 것을 특징으로 하는 모델 갱신 방법.
모델 갱신 장치가 모델을 갱신하는 방법에 있어서,

모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니터링하

고, 출력 데이터 중 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터를 레이블로 한 상기 입력 데이터를 추가 학습 데이터로 설정하는 단계; 및

상기 추가 학습 데이터의 수와 전체 학습 데이터의 수 간의 비율이 지정된 임계값 이상인 경우, 상기 모델의 갱신을 수행하는 단계를 포함하는 모델 갱신 방법.
제13항에 있어서,

상기 모델을 통한 서비스에서 발생하는 입력 데이터 및 출력 데이터를 모니

터링하고, 출력 데이터 중 기 학습 데이터의 레이블 범위 내 존재하는 출력 데이터를 레이블로 한 상기 입력 데이터를 추가 학습 데이터로 설정하는 단계는,

상기 기 학습 데이터의 레이블 범위 내 존재하는 상기 출력 데이터에 상응하는 상기 입력 데이터가 상기 기 학습 데이터와 상이한 경우에 상기 입력 데이터를 상기 추가 학습 데이터로 설정하는 단계인 것을 특징으로 하는 모델 갱신 방법.
제8항 내지 제 14항 중 어느 하나에 따른 모델 갱신 방법을 실행하는 컴퓨터가 판독 가능한 기록매체에 기록된 컴퓨터 프로그램.