WO2021091022A1

WO2021091022A1 - 머신 러닝 시스템 및 머신 러닝 시스템의 동작 방법

Info

Publication number: WO2021091022A1
Application number: PCT/KR2020/001361
Authority: WO
Inventors: 김정훈; 백용호; 정자연; 황영규; 김정배
Original assignee: 주식회사 알체라
Priority date: 2019-11-08
Filing date: 2020-01-29
Publication date: 2021-05-14
Also published as: KR102144975B1

Abstract

머신 러닝 시스템 및 머신 러닝 시스템의 동작 방법이 제공된다. 머신 러닝시스템은, 제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 상기 제1 추출 이미지와 상기 제2 추출 이미지 간 제1 유사도를 판단하는 제1 유사도 판단 모듈; 상기 제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 상기 제1 추출 이미지 및 제2 추출 이미지 각각에 대한 모델 예측을 수행하는 머신 러닝 모델; 상기 머신 러닝 모델로부터 상기 모델 예측의 결과에 해당하는 제1 예측 이미지 및 제2 예측 이미지를 입력 받고, 상기 제1 예측 이미지와 상기 제2 예측 이미지 간 제2 유사도를 판단하는 제2 유사도 판단 모듈; 및 상기 제1 유사도와 상기 제2 유사도에 기초하여 상기 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 학습 데이터 선택 모듈을 포함한다.

Description

머신 러닝 시스템 및 머신 러닝 시스템의 동작 방법

본 발명은 머신 러닝 시스템 및 머신 러닝 시스템의 동작 방법에 관한 것이다.

머신 러닝(machine learning)은 명시적인 프로그램을 실행하지 않고도 컴퓨터가 스스로 문제를 해결할 수 있도록 학습하는 기술로, 대표적인 머신 러닝 알고리즘으로 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforcement learning) 등을 들 수 있다. 지도 학습은, 특징(feature)이 부여된 데이터, 즉 레이블 데이터(labeled data)를 기반으로 새로운 데이터에 대한 특징을 추론하는 알고리즘을 말하며, 비지도 학습은, 특징이 부여되지 않은 데이터들을 분석하는 알고리즘을 말한다. 지도 학습의 유형으로, 예를 들어, 회귀 분석(regression), 분류(classification)를 들 수 있고, 비지도 학습의 유형으로, 예를 들어, 클러스터링(clustering)을 들 수 있다.

지도 학습에서 사용되는 머신 러닝 모델은 레이블 데이터(또는 학습 데이터, 훈련 데이터)로 학습을 수행한 후 새로운 데이터에 대한 특징을 추론하므로, 레이블 데이터는 다양하고 많을수록 좋다. 따라서, 새로운 데이터가 발생한 경우, 새로운 데이터에 대한 레이블링(labeling)을 하고, 기존 레이블 데이터들이 포함된 레이블 데이터 풀(labeled data pool)에 추가함으로써, 레이블 데이터 풀을 갱신해 나가는 작업은 계속 필요하다. 그러므로, 새로운 데이터에 대한 레이블링을 효율적으로 수행하기 위한 방안이 요구된다.

본 발명이 해결하고자 하는 과제는 다수의 언레이블 데이터(unlabeled data)에서 레이블링이 필요한 데이터를 스스로 선택할 수 있는 머신 러닝 시스템 및 머신 러닝 시스템의 동작 방법을 제공하는 것이다.

본 발명의 일 실시 예에 따른 머신 러닝 시스템은, 제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 제1 추출 이미지와 제2 추출 이미지 간 제1 유사도를 판단하는 제1 유사도 판단 모듈; 제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 제1 추출 이미지 및 제2 추출 이미지 각각에 대한 모델 예측을 수행하는 머신 러닝 모델; 머신 러닝 모델로부터 모델 예측의 결과에 해당하는 제1 예측 이미지 및 제2 예측 이미지를 입력 받고, 제1 예측 이미지와 제2 예측 이미지 간 제2 유사도를 판단하는 제2 유사도 판단 모듈; 및 제1 유사도와 제2 유사도에 기초하여 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 학습 데이터 선택 모듈을 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 머신 러닝 시스템은, 동영상 데이터를 입력 받고, 동영상 데이터에서 제1 추출 이미지 및 제2 추출 이미지를 추출하여 제1 유사도 판단 모듈 및 머신 러닝 모델에 제공하는 이미지 추출 모듈을 더 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 추출 이미지와 제2 추출 이미지는 동영상 데이터 중 연속된 이미지 프레임에 해당할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 유사도 판단 모듈은, 제1 추출 이미지와 제2 추출 이미지에 대해 SAD(Sum of Absolute Differences) 기반의 거리 연산을 수행하고, 거리 연산의 결과에 기초하여 제1 유사도를 판단할 수 있다.

본 발명의 몇몇의 실시 예에서, 제2 유사도 판단 모듈은, 제1 예측 이미지와 제2 예측 이미지에 대해 SAD 기반의 거리 연산을 수행하고, 거리 연산의 결과에 기초하여 제2 유사도를 판단할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 유사도 판단 모듈은, 제1 추출 이미지와 제2 추출 이미지에 대해 ED(Euclidean Distance) 기반의 거리 연산을 수행하고, 거리 연산의 결과에 기초하여 제1 유사도를 판단할 수 있다.

본 발명의 몇몇의 실시 예에서, 제2 유사도 판단 모듈은, 제1 예측 이미지와 제2 예측 이미지에 대해 ED 기반의 거리 연산을 수행하고, 거리 연산의 결과에 기초하여 제2 유사도를 판단할 수 있다.

본 발명의 몇몇의 실시 예에서, 학습 데이터 선택 모듈은, 제1 유사도가 사전 정의된 제1 임계치 이상이고 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지 중 적어도 하나를 학습 데이터로 선택할 수 있다.

본 발명의 몇몇의 실시 예에서, 학습 데이터 선택 모듈은, 상기 제1 유사도가, 사전 정의된 제1 임계치 세트 중에서 선택된 제1 임계치 이상이고, 상기 제2 유사도가, 사전 정의된 제2 임계치 세트 중에서 선택된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지 중 적어도 하나를 학습 데이터로 선택할 수 있다.

본 발명의 몇몇의 실시 예에서, 상기 제1 임계치 및 상기 제2 임계치는, 사용자 입력 또는 사전 정의된 정책(policy)에 따라, 상기 제1 임계치 세트 및 상기 제2 임계치 세트로부터 선택될 수 있다.

본 발명의 일 실시 예에 따른 머신 러닝 시스템은, 언레이블 이미지 풀에서 추출된 제1 추출 이미지와 제2 추출 이미지 간 제1 유사도를 판단하는 제1 유사도 판단 모듈; 제1 추출 이미지 및 제2 추출 이미지 각각에 대한 모델 예측을 수행하는 머신 러닝 모델; 머신 러닝 모델로부터 모델 예측의 결과에 해당하는 제1 예측 이미지 및 제2 예측 이미지를 입력 받고, 제1 예측 이미지와 제2 예측 이미지 간 제2 유사도를 판단하는 제2 유사도 판단 모듈; 및 제1 유사도와 제2 유사도에 기초하여 레이블 이미지 풀을 갱신하는 레이블 이미지 풀 갱신 모듈을 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 레이블 이미지 풀 갱신 모듈은, 제1 유사도가 사전 정의된 제1 임계치 이상이고 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지에 기초하여 레이블 이미지 풀을 갱신할 수 있다.

본 발명의 몇몇의 실시 예에서, 레이블 이미지 풀 갱신 모듈은, 상기 제1 유사도가, 사전 정의된 제1 임계치 세트 중에서 선택된 제1 임계치 이상이고, 상기 제2 유사도가, 사전 정의된 제2 임계치 세트 중에서 선택된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지에 기초하여 레이블 이미지 풀을 갱신할 수 있다.

본 발명의 몇몇의 실시 예에서, 상기 제1 임계치 및 상기 제2 임계치는, 사용자 입력 또는 사전 정의된 정책에 따라, 상기 제1 임계치 세트 및 상기 제2 임계치 세트로부터 선택될 수 있다.

본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 제1 추출 이미지와 제2 추출 이미지 각각에 대해 머신 러닝 모델을 이용한 예측을 수행하는 단계; 제1 추출 이미지와 제2 추출 이미지 간 제1 유사도를 판단하는 단계; 모델 예측의 결과에 해당하는 제1 예측 이미지와 제2 예측 이미지 간 제2 유사도를 판단하는 단계; 및 제1 유사도와 제2 유사도에 기초하여 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 단계를 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 유사도를 판단하는 단계는, 제1 추출 이미지와 제2 추출 이미지에 대해 SAD 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제1 유사도를 판단하는 단계를 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 제2 유사도를 판단하는 단계는, 제1 예측 이미지와 제2 예측 이미지에 대해 SAD 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제2 유사도를 판단하는 단계를 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 유사도를 판단하는 단계는, 제1 추출 이미지와 제2 추출 이미지에 대해 ED 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제1 유사도를 판단하는 단계를 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 제2 유사도를 판단하는 단계는, 제1 예측 이미지와 제2 예측 이미지에 대해 ED 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제2 유사도를 판단하는 단계를 포함할 수 있다.

본 발명의 몇몇의 실시 예에서, 학습 데이터를 선택하는 단계는, 제1 유사도가 사전 정의된 제1 임계치 이상이고 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지 중 적어도 하나를 학습 데이터로 선택하는 단계를 포함할 수 있다.

본 발명의 머신 러닝 시스템에 따르면, 동영상에 포함된 다수의 언레이블 데이터에서 샘플 데이터를 추출하고, 추출한 샘플 데이터가 레이블링이 필요한 데이터인지 여부, 즉 현재 머신 러닝 모델에 추가적인 학습이 필요한지 여부를 스스로 판단할 수 있다.

따라서, 동영상 데이터와 같이 다량의 데이터가 계속 새롭게 제공되는 환경에서, 사람이 일일이 레이블링이 필요한 데이터를 골라 낼 필요 없이, 머신 러닝 시스템 스스로 레이블링이 필요한 데이터를 제안할 수 있어, 머신 러닝 시스템의 학습 비용이 감소하고, 그 만큼 더 많은 학습 데이터로 머신 러닝 모델을 학습시킬 수 있어, 결과적으로 고도로 학습된 머신 러닝 시스템을 얻을 수 있게 된다.

도 1은 본 발명의 일 실시 예에 따른 머신 러닝 시스템을 설명하기 위한 블록도이다.

도 2는 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법을 설명하기 위한 흐름도이다.

도 3은 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법을 설명하기 위한 흐름도이다.

도 4는 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법을 설명하기 위한 흐름도이다.

도 5는 본 발명의 일 실시 예에 따른 머신 러닝 시스템을 설명하기 위한 블록도이다.

도 6은 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법을 설명하기 위한 흐름도이다.

도 7은 본 발명의 일 실시 예에 따른 머신 러닝 시스템을 설명하기 위한 블록도이다.

도 8은 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법을 설명하기 위한 흐름도이다.

도 9 및 도 10은 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 예를 설명하기 위한 도면들이다.

아래에서는 첨부한 도면을 참조하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 및 청구범위 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

본 발명의 일 실시 예에 따른 머신 러닝 시스템(1)은 본 명세서에서 설명하는 다양한 실시 예들을 구현하는 컴퓨터 시스템일 수 있다. 구체적으로, 머신 러닝 시스템(1)은 프로세서 및 메모리를 포함하고, 메모리는 컴퓨터로 판독 가능한 명령을 포함하고, 프로세서는 메모리에 저장된 명령을 실행함으로써, 본 명세서에서 설명하는 다양한 실시 예들을 구현할 수 있다.

예를 들어, 머신 러닝 시스템(1)은, 수퍼 컴퓨터, 서버, 메인 프레임, 워크 스테이션, 개인용 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 내장형 컴퓨터, 착용형 컴퓨터 등으로 구현될 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니고, 머신 러닝 시스템(1)은 본 명세서에서 설명하는 다양한 실시 예들을 구현할 수 있는 임의의 컴퓨팅 장치일 수 있다.

본 발명의 몇몇의 실시 예에서, 머신 러닝 시스템(1)은 단일 컴퓨터 장치로 구현될 수도 있고, 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 후술하는 머신 러닝 모델(30)과 학습 모듈(32)은 동일한 단일 컴퓨터 장치로 구현될 수도 있고, 머신 러닝 모델(30)은 제1 컴퓨터 장치로 구현되고 학습 모듈(32)은 제1 컴퓨터 장치와 상이한 제2 컴퓨터 장치로 구현될 수도 있다.

도 1을 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템(1)은 동영상 데이터를 학습하는 머신 러닝 시스템으로서, 이미지 추출 모듈(10), 제1 유사도 판단 모듈(20), 머신 러닝 모델(30), 학습 모듈(32), 제2 유사도 판단 모듈(40) 및 학습 데이터 선택 모듈(50)을 포함할 수 있다.

이미지 추출 모듈(10)은 동영상 데이터를 입력 받고, 동영상 데이터에서 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)를 추출하여 제1 유사도 판단 모듈(20) 및 머신 러닝 모델(30)에 제공할 수 있다.

동영상 데이터는 연속적으로 이어지는 다수의 이미지 프레임을 포함할 수 있다. 한편, 동영상 데이터는, 예를 들어, 머신 러닝 시스템(1)이 영상 인식을 수행하기 위한 동영상 데이터일 수 있다. 즉, 머신 러닝 시스템(1)은 적절하게 학습된 머신 러닝 모델(30)을 이용하여 동영상 데이터로부터 객체를 식별하고 인식하는 작업을 수행할 수 있다.

머신 러닝 시스템(1)이 수행하는 작업의 질을 높이기 위해서는, 다양하고 많은 레이블 데이터로 머신 러닝 모델(30)을 학습시키는 작업이 필수적이다. 예를 들어, 머신 러닝 시스템(1)이 수행하는 영상 인식 작업의 질을 높이기 위해, 동영상 데이터를 구성하는 이미지 프레임에 대해 레이블링을 하여 레이블 이미지를 만들고, 레이블 이미지를 이용하여 머신 러닝 모델(30)을 학습시킬 필요가 있다.

이미지 추출 모듈(10)은, 이와 같이 머신 러닝 모델(30)을 학습시키기 위한 레이블 데이터(즉, 레이블 이미지)가 될 가능성이 있는 후보 데이터를 추출한다. 구체적으로, 이미지 추출 모듈(10)은, 동영상 데이터에서, 후보 데이터로서 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)를 추출할 수 있다. 이후 후술할 학습 데이터 선택 모듈(50)은, 이미지 추출 모듈(10)에 의해 추출된 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)에 레이블링이 필요한 지 여부(즉, 이들 데이터를, 머신 러닝 모델(30)을 학습시키기 위한 학습 데이터로 선택할 지 여부)를 결정할 수 있다.

이하에서는, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)가 동영상 데이터 중 연속된 이미지 프레임에 해당하는 것으로 가정하여 설명할 것이나, 본 발명의 범위가 이에 제한되는 것은 아니고, 동영상 데이터에서 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 사이에 다른 이미지 프레임이 존재할 수도 있다.

제1 유사도 판단 모듈(20)은 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)를 입력 받고, 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 유사도(S(I))를 판단할 수 있다.

본 발명의 몇몇의 실시 예에서, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 SAD(Sum of Absolute Differences) 기반 유사도를 연산할 수 있다. 구체적으로, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)에 대해 SAD 기반의 거리 연산을 수행하고, 그 거리 연산의 결과(D_SAD(I))에 기초하여 제1 유사도(S(I)), 즉, 제1 SAD 기반 유사도(S_SAD(I))를 판단할 수 있다. D_SAD(I) 및 S_SAD(I)는 다음과 같이 연산될 수 있다.

D_SAD(I) = sum(abs(a_n - a_n-1))

S_SAD(I) = 1 / (1 + K_SAD(I) * D_SAD(I))

여기서, a_n은 I(t_n)에 해당하는 p 차원 벡터이고, I(t_n)는 시간 t_n에서의 추출 이미지이고, p 는 추출 이미지의 픽셀 수이다. 그리고 abs()는 벡터 원소들의 절대값을 출력하는 연산을 의미하고, sum()은 벡터 원소들의 합을 출력하는 연산을 의미한다. 한편, K_SAD(I)는 거리-유사도 변환 계수로서, 음이 아닌 임의의 상수로 정해질 수 있다. 예를 들어, K_SAD(I)는 1 / 50,000일 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니다.

즉, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1), 예컨대 I(t_n-1)와 제2 추출 이미지(I2), 예컨대 I(t_n)에 대응하는 두 p 차원 벡터의 차이에 기초하여, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)의 SAD 기반 거리 D_SAD(I)를 연산하고, 연산된 D_SAD(I)에 기초하여 S_SAD(I)를 획득할 수 있다.

한편, 본 발명의 몇몇의 실시 예에서, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 ED(Euclidean Distance) 기반 유사도를 연산할 수 있다. 구체적으로, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)에 대해 ED 기반의 거리 연산을 수행하고, 그 거리 연산의 결과(D_EUC(I))에 기초하여 제1 유사도(S(I)), 즉, 제1 ED 기반 유사도(S_EUC(I))를 판단할 수 있다. D_EUC(I) 및 S_EUC(I)는 다음과 같이 연산될 수 있다.

D_EUC(I) = (a_n - a_n-1)^T (a_n - a_n-1)

S_EUC(I) = 1 / (1 + K_EUC(I) * D_EUC(I))

여기서, a_n은 I(t_n)에 해당하는 p 차원 열 벡터이고, I(t_n)는 시간 t_n에서의 추출 이미지이고, p 는 추출 이미지의 픽셀 수이다. 그리고 ()^T 는 전치(transpose) 연산을 의미한다. 한편, K_EUC(I)는 거리-유사도 변환 계수로서, 음이 아닌 임의의 상수로 정해질 수 있다. 예를 들어, K_EUC(I)는 1 / 50,000일 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니다.

즉, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1), 예컨대 I(t_n-1)와 제2 추출 이미지(I2), 예컨대 I(t_n)에 대응하는 두 p 차원 벡터의 차이에 기초하여, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)의 ED 기반 거리 D_EUC(I)를 연산하고, 연산된 D_EUC(I)에 기초하여 S_EUC(I)를 획득할 수 있다.

그러나, 본 발명의 범위가 이에 제한되는 것은 아니고, 제1 유사도 판단 모듈(20)은, 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 유사도(S(I))를 판단하기 위해, 전술한 SAD 기반 연산을 응용 및 변형하거나, 전술한 ED 기반 연산을 응용 및 변형하거나, 전술한 SAD 기반 연산과 ED 기반 연산을 조합하거나, 아니면 전술한 SAD 및 ED 기반과 다른, 두 이미지 프레임 간의 유사도를 측정할 수 있는 임의의 방식을 사용할 수 있다.

제1 유사도 판단 모듈(20)은 이와 같이 판단한 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 유사도(S(I))를 학습 데이터 선택 모듈(50)에 제공할 수 있다.

머신 러닝 모델(30)은 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)를 입력 받고, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 각각에 대한 모델 예측(model prediction)을 수행할 수 있다.

구체적으로, 머신 러닝 모델(30)은 새로운 데이터(즉 제1 추출 이미지(I1) 및 제2 추출 이미지(I2))를 입력 받기 전의, 기존의 학습 데이터 또는 레이블 이미지 데이터로 학습이 수행된 모델을 이용하여, 새로운 데이터(즉 제1 추출 이미지(I1) 및 제2 추출 이미지(I2))에 대한 모델 예측을 수행하고, 그 모델 예측 결과에 해당하는 제1 예측 이미지(PI1) 및 제2 예측 이미지(PI2)를 제2 유사도 판단 모듈(40)에 제공할 수 있다.

제2 유사도 판단 모듈(40)은 머신 러닝 모델(30)로부터 모델 예측의 결과에 해당하는 제1 예측 이미지(PI1) 및 제2 예측 이미지(PI2)를 입력 받고, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))를 판단할 수 있다. 여기서 예측 이미지는 "모델 출력"이라고 지칭될 수도 있다.

본 발명의 몇몇의 실시 예에서, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 SAD 기반 유사도를 연산할 수 있다. 구체적으로, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2)에 대해 SAD 기반의 거리 연산을 수행하고, 그 거리 연산의 결과(D_SAD(O))에 기초하여 제2 유사도(S(O)), 즉, 제2 SAD 기반 유사도(S_SAD(O))를 판단할 수 있다. D_SAD(O) 및 S_SAD(O)는 다음과 같이 연산될 수 있다.

D_SAD(O) = sum(abs(z_n - z_n-1))

S_SAD(O) = 1 / (1 + K_SAD(O) * D_SAD(O))

여기서, z_n은 Q(t_n)에 해당하는 r 차원 열 벡터이고, Q(t_n)는 P(t_n)에 마스킹(masking)을 적용한 결과이고, P(t_n)는 시간 t_n에서의 모델 출력이고, 모델 출력은 b * m 차원 행렬일 수 있다. 그리고 b 는 머신 러닝 모델(30), 즉 검출(detection) 모델의 검출 박스(detection box)의 개수(예를 들어, Yolo 기준 앵커 박스(anchor box)의 개수, SSD(Single Shot Detector) 기준 디폴트 박스(default box)의 개수)에 해당하고, m 은 각 검출 박스에 대한 예측 출력 벡터(prediction output vector)의 차원에 해당한다. 한편, K_SAD(O)는 거리-유사도 변환 계수로서, 음이 아닌 임의의 상수로 정해질 수 있다. 예를 들어, K_SAD(O)는 1일 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니다.

여기서 마스킹은, 각 m 차원 벡터에서, 검출 모델의 검출 박스가 객체를 포함할 가능성을 나타내는 객체 가능성 스코어(objectness score)가 사전 정의한 임계치보다 작을 때, 해당 벡터를 영(zero) 벡터로 변환하는 연산이다.

그리고 abs()는 벡터 원소들의 절대값을 출력하는 연산을 의미하고, sum()은 벡터 원소들의 합을 출력하는 연산을 의미한다.

본 발명의 몇몇의 실시 예에서, 선택적으로, P(t_n)에 마스킹을 적용한 후, 그 결과를 출력 확률 이미지(output probability image)로 변환할 수도 있다. 이에 따라, z_n은 출력 확률 이미지로부터 도출된 열 벡터에 해당할 수도 있다.

즉, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1), 예컨대 P(t_n-1)와 제2 예측 이미지(PI2), 예컨대 P(t_n)로부터 도출된 대응하는 Q(t_n-1) 및 Q(t_n)의 두 r 차원 벡터의 차이에 기초하여, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2)의 SAD 기반 거리 D_SAD(O)를 연산하고, 연산된 D_SAD(O)에 기초하여 S_SAD(O)를 획득할 수 있다.

한편, 본 발명의 몇몇의 실시 예에서, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 ED 기반 유사도를 연산할 수 있다. 구체적으로, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2)에 대해 ED 기반의 거리 연산을 수행하고, 그 거리 연산의 결과(D_EUC(O))에 기초하여 제2 유사도(S(O)), 즉, 제2 ED 기반 유사도(S_EUC(O))를 판단할 수 있다. D_EUC(O) 및 S_EUC(O)는 다음과 같이 연산될 수 있다.

D_EUC(O) = (z_n - z_n-1)^T (z_n - z_n-1)

S_EUC(O) = 1 / (1 + K_EUC(O) * D_EUC(O))

여기서, z_n은 Q(t_n)에 해당하는 r 차원 열 벡터이고, Q(t_n)는 P(t_n)에 마스킹을 적용한 결과이고, P(t_n)는 시간 t_n에서의 모델 출력이고, 모델 출력은 b * m 차원 행렬일 수 있다. 그리고 b 는 머신 러닝 모델(30), 즉 검출 모델의 검출 박스의 개수(예를 들어, Yolo 기준 앵커 박스의 개수, SSD 기준 디폴트 박스의 개수)에 해당하고, m 은 각 검출 박스에 대한 예측 출력 벡터의 차원에 해당한다. 한편, K_EUC(O)는 거리-유사도 변환 계수로서, 음이 아닌 임의의 상수로 정해질 수 있다. 예를 들어, K_EUC(O)는 1일 수 있으나, 본 발명의 범위가 이에 제한되는 것은 아니다.

여기서 마스킹은, 각 m 차원 벡터에서, 검출 모델의 검출 박스가 객체를 포함할 가능성을 나타내는 객체 가능성 스코어가 사전 정의한 임계치보다 작을 때, 해당 벡터를 영 벡터로 변환하는 연산이다.

본 발명의 몇몇의 실시 예에서, 선택적으로, P(t_n)에 마스킹을 적용한 후, 그 결과를 출력 확률 이미지로 변환할 수도 있다. 이에 따라, z_n은 출력 확률 이미지로부터 도출된 열 벡터에 해당할 수도 있다.

그러나, 본 발명의 범위가 이에 제한되는 것은 아니고, 제2 유사도 판단 모듈(40)은, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))를 판단하기 위해, 전술한 SAD 기반 연산을 응용 및 변형하거나, 전술한 ED 기반 연산을 응용 및 변형하거나, 전술한 SAD 기반 연산과 ED 기반 연산을 조합하거나, 아니면 전술한 SAD 및 ED 기반과 다른, 두 이미지 프레임 간의 유사도를 측정할 수 있는 임의의 방식을 사용할 수 있다.

또한, 제2 유사도 판단 모듈(40)은, 제1 유사도 판단 모듈(20)이 유사도를 측정하기 위해 사용한 방식과 동일한 방식을 사용하여 유사도를 측정할 수도 있고, 제1 유사도 판단 모듈(20)이 유사도를 측정하기 위해 사용한 방식과 상이한 방식을 사용하여 유사도를 측정할 수도 있다.

제2 유사도 판단 모듈(40)은 이와 같이 판단한 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))를 학습 데이터 선택 모듈(50)에 제공할 수 있다.

학습 데이터 선택 모듈(50)은 제1 유사도(S(I))와 제2 유사도(S(O))에 기초하여 머신 러닝 모델(30)을 학습시키기 위한 학습 데이터를 선택할 수 있다. 구체적으로, 학습 데이터 선택 모듈(50)은 제1 유사도(S(I))와 제2 유사도(S(O))를 사전 정의된 임계치와 비교하여 머신 러닝 모델(30)을 학습시키기 위한 학습 데이터를 선택할 수 있다.

이를 위해, 제1 임계치(T(I)) 및 제2 임계치(T(O))가 사전 정의될 수 있다. 제1 임계치(T(I)) 및 제2 임계치(T(O))는 본 발명의 다양한 실시 예에서 구체적인 구현 목적, 환경 등에 따라 정해질 수 있고 변경될 수 있는 값을 가질 수 있다.

학습 데이터 선택 모듈(50)은, 다음과 같은 조건 식을 이용하여, 제1 유사도(S(I))와 제2 유사도(S(O))를 임계치(T(I), T(O))와 비교할 수 있다.

S(I) >= T(I) & S(O) < T(O)

상기 조건 식에 따르면, 학습 데이터 선택 모듈(50)은, 제1 유사도(S(I))가 사전 정의된 제1 임계치(T(I)) 이상이고 제2 유사도(S(O))가 사전 정의된 제2 임계치(T(O)) 미만인 경우, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 중 적어도 하나를 학습 데이터로 선택할 수 있다.

동영상 데이터의 특성 상, 장면이 바뀌는 경우를 제외하고는 제1 추출 이미지(I1)와 제2 추출 이미지(I2)의 유사도는 일반적으로 높을 것이다. 그런데 제1 추출 이미지(I1)와 제2 추출 이미지(I2)의 유사도에 해당하는 제1 유사도(S(I))가 비교적 높은 반면, 모델 예측 결과에 해당하는 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2)의 유사도에 해당하는 제2 유사도(S(O))가 비교적 낮다면, 이는 모델 예측 또는 추론 결과의 불확실성이 높다는 것을 의미할 수 있다. 따라서, 이러한 경우는 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)에 대해 추가 학습이 필요한 상황으로 판단될 수 있다.

이와 같은 경우, 학습 데이터 선택 모듈(50)은, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 중 적어도 하나에 대해 레이블링을 수행하거나, 또는 외부에 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 중 적어도 하나에 대한 레이블링을 요청하고 그 결과를 수신하는 방식으로, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 중 적어도 하나를 학습 데이터(TD)로 선택, 즉 레이블 이미지 데이터로 변환할 수 있다.

학습 데이터 선택 모듈(50)은 선택한 학습 데이터(TD)를 학습 모듈(32)에 제공할 수 있고, 학습 모듈(32)은 학습 데이터 선택 모듈(50)로부터 제공 받은 학습 데이터(TD)를 이용하여 머신 러닝 모델(30)을 학습시킬 수 있다.

본 실시 예에 따르면, 머신 러닝 시스템(1)은, 동영상에 포함된 다수의 언레이블 데이터에서 샘플 데이터(즉, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2))를 추출하고, 추출한 샘플 데이터가 레이블링이 필요한 데이터인지 여부, 즉 현재 머신 러닝 모델(30)에 추가적인 학습이 필요한지 여부를 스스로 판단할 수 있다.

따라서, 동영상 데이터와 같이 다량의 데이터가 계속 새롭게 제공되는 머신 러닝 시스템(1)의 구동 환경에서, 사람이 일일이 레이블링이 필요한 데이터를 골라 낼 필요 없이, 머신 러닝 시스템(1) 스스로 레이블링이 필요한 데이터를 제안할 수 있어, 머신 러닝 시스템의 학습 비용이 감소하고, 그 만큼 더 많은 학습 데이터로 머신 러닝 모델을 학습시킬 수 있어, 결과적으로 고도로 학습된 머신 러닝 시스템(1)을 얻을 수 있게 된다.

한편, 본 발명의 몇몇의 실시 예에서, 학습 데이터 선택 모듈(50)은 사용자 입력 또는 사전 정의된 정책(policy)에 따라 사전 정의된 제1 임계치 세트 중에서 선택된 제1 임계치와, 사전 정의된 제2 임계치 세트 중에서 선택된 제2 임계치를 이용하여 학습 데이터를 선택할 수 있다. 여기서 사전 정의된 제1 임계치 세트는 복수의 제1 임계치 후보를 포함하고, 사전 정의된 제2 임계치 세트는 복수의 제2 임계치 후보를 포함할 수 있다.

예를 들어, 사용자가 제1 임계치 세트의 복수의 제1 임계치 후보 중 하나의 값을 고르면, 학습 데이터 선택 모듈(50)은, 앞서 설명한 바와 같이, 사용자에 의해 선택된 제1 임계치와 제1 유사도(S(I))를 비교할 수 있다. 마찬가지로, 사용자가 제2 임계치 세트의 복수의 제2 임계치 후보 중 하나의 값을 고르면, 학습 데이터 선택 모듈(50)은, 앞서 설명한 바와 같이, 사용자에 의해 선택된 제2 임계치와 제2 유사도(S(O))를 비교할 수 있다.

이외에도, 제1 임계치 세트 및 제2 임계치 세트로부터 제1 임계치 및 제2 임계치가 선택되는 다양한 정책이 존재할 수 있다.

나아가, 학습 데이터 선택 모듈(50)은 1차로 학습 데이터를 선택한 후, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)가 유사로 판단되는 범위를 넓힐 필요가 있는 경우, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)가 유사로 판단되는 범위를 좁힐 필요가 있는 경우, 제1 예측 이미지(PI1) 및 제2 예측 이미지(PI2)가 비 유사로 판단되는 범위를 넓힐 필요가 있는 경우, 제1 예측 이미지(PI1) 및 제2 예측 이미지(PI2)가 비 유사로 판단되는 범위를 좁힐 필요가 있는 경우 등에서, 제1 임계치 세트 및 제2 임계치 세트로부터 제1 임계치 및 제2 임계치를 재선택하고, 재선택한 제1 임계치 및 제2 임계치에 기초하여 2차로 학습 데이터를 선택할 수도 있다.

이에 따라, 머신 러닝 시스템(1)이 레이블링이 필요한 데이터를 제안하는 결정 기준을 세부적으로 조절할 수 있고, 동작 중 필요에 따라 사전에 정해진 정책에 따라 임계치 변경도 가능한 머신 러닝 시스템(1)을 구현할 수 있다.

도 2를 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 동영상에서 이미지를 추출하는 단계(S201)를 포함할 수 있다. 구체적으로, 단계(S201)는 동영상 데이터에서 제1 추출 이미지 및 제2 추출 이미지(I2)를 추출하는 단계를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지를 이용하여 모델 예측을 수행하는 단계(S203)를 포함할 수 있다. 구체적으로, 단계(S203)는 제1 추출 이미지 및 제2 추출 이미지 각각에 대해 머신 러닝 모델을 이용한 예측을 수행하는 단계를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 간 제1 유사도를 판단하는 단계(S205)를 포함할 수 있다. 구체적으로, 단계(S205)는 제1 추출 이미지와 제2 추출 이미지 간 제1 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 예측 이미지 간 제2 유사도를 판단하는 단계(S207)를 포함할 수 있다. 구체적으로, 단계(S207)는 모델 예측의 결과에 해당하는 제1 예측 이미지와 제2 예측 이미지 간 제2 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 제1 유사도와 제2 유사도를 임계치와 비교하는 단계(S209)를 포함할 수 있다. 또한, 상기 방법은, 비교 결과에 기초하여 추출 이미지를 학습 데이터로 선택하는 단계(S211)를 포함할 수 있다. 즉 단계(S209) 및 단계(S211)는 제1 유사도와 제2 유사도를 임계치와 비교하여 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 단계를 포함할 수 있다.

특히, 단계(S211)는, 제1 유사도가 사전 정의된 제1 임계치 이상이고 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 제1 추출 이미지 및 제2 추출 이미지 중 적어도 하나를 학습 데이터로 선택하는 단계를 포함할 수 있다.

본 실시 예와 관련된 더욱 상세한 내용에 대해서는 전술한 도 1에 관한 설명을 참조할 수 있으며, 도 1에 관한 설명들은 본 실시 예에 따른 머신 러닝 시스템의 동작 방법에 그대로 적용될 수 있다.

도 3을 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 추출 이미지를 이용하여 모델 예측을 수행하는 단계(S301)를 포함할 수 있다. 단계(S301)는 도 2의 단계(S203)에 대응될 수 있다. 구체적으로, 단계(S301)는 제1 추출 이미지 및 제2 추출 이미지 각각에 대해 머신 러닝 모델을 이용한 예측을 수행하는 단계를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 간 제1 SAD 기반 유사도를 판단하는 단계(S303)를 포함할 수 있다. 구체적으로, 단계(S303)는 제1 추출 이미지와 제2 추출 이미지 간 제1 SAD 기반 유사도를 판단하는 단계를 포함할 수 있으며, 해당 단계는, 제1 추출 이미지와 제2 추출 이미지에 대해 SAD 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제1 SAD 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 예측 이미지 간 제2 SAD 기반 유사도를 판단하는 단계(S305)를 포함할 수 있다. 구체적으로, 단계(S305)는 모델 예측의 결과에 해당하는 제1 예측 이미지와 제2 예측 이미지 간 제2 SAD 기반 유사도를 판단하는 단계를 포함할 수 있으며, 해당 단계는, 제1 예측 이미지와 제2 예측 이미지에 대해 SAD 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제2 SAD 기반 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 제1 SAD 기반 유사도와 제2 SAD 기반 유사도를 임계치와 비교하는 단계(S307)를 포함할 수 있다. 구체적으로 단계(S307)는 제1 SAD 기반 유사도와 제2 SAD 기반 유사도를 임계치와 비교하여 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 단계를 포함할 수 있다.

도 4를 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 추출 이미지를 이용하여 모델 예측을 수행하는 단계(S401)를 포함할 수 있다. 단계(S401)는 도 2의 단계(S203)에 대응될 수 있다. 구체적으로, 단계(S401)는 제1 추출 이미지 및 제2 추출 이미지 각각에 대해 머신 러닝 모델을 이용한 예측을 수행하는 단계를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 간 제1 ED 기반 유사도를 판단하는 단계(S403)를 포함할 수 있다. 구체적으로, 단계(S403)는 제1 추출 이미지와 제2 추출 이미지 간 제1 ED 기반 유사도를 판단하는 단계를 포함할 수 있으며, 해당 단계는, 제1 추출 이미지와 제2 추출 이미지에 대해 ED 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제1 ED 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 예측 이미지 간 제2 ED 기반 유사도를 판단하는 단계(S405)를 포함할 수 있다. 구체적으로, 단계(S405)는 모델 예측의 결과에 해당하는 제1 예측 이미지와 제2 예측 이미지 간 제2 ED 기반 유사도를 판단하는 단계를 포함할 수 있으며, 해당 단계는, 제1 예측 이미지와 제2 예측 이미지에 대해 ED 기반의 거리 연산을 수행하는 단계 및 거리 연산의 결과에 기초하여 제2 ED 기반 유사도를 판단하는 단계를 포함할 수 있다.

또한, 상기 방법은, 제1 ED 기반 유사도와 제2 ED 기반 유사도를 임계치와 비교하는 단계(S407)를 포함할 수 있다. 구체적으로 단계(S407)는 제1 ED 기반 유사도와 제2 ED 기반 유사도를 임계치와 비교하여 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 단계를 포함할 수 있다.

도 5를 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템(2)은, 언레이블 이미지 풀(34), 제1 유사도 판단 모듈(20), 머신 러닝 모델(30), 제2 유사도 판단 모듈(40), 레이블 이미지 풀(36) 및 레이블 이미지 풀 갱신 모듈(38)을 포함할 수 있다.

언레이블 이미지 풀(34)은 레이블링이 되지 않은 다수의 이미지 데이터를 포함할 수 있다. 특히, 언레이블 이미지 풀(34)은 도 1에서와 같이 반드시 동영상의 형태를 갖지 않는 다수의 이미지 데이터를 포함할 수 있다.

제1 유사도 판단 모듈(20)은 언레이블 이미지 풀(34)에서 추출된 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 유사도(S(I))를 판단할 수 있다.

머신 러닝 모델(30)은 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 각각에 대한 모델 예측을 수행할 수 있다.

제2 유사도 판단 모듈(40)은 머신 러닝 모델(30)로부터 모델 예측의 결과에 해당하는 제1 예측 이미지(PI1) 및 제2 예측 이미지(PI2)를 입력 받고, 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))를 판단할 수 있다.

레이블 이미지 풀 갱신 모듈(38)은 제1 유사도(S(I))와 제2 유사도(S(O))를 임계치(T(I), T(O))와 비교하여 레이블 이미지 풀(26)을 갱신할 수 있다. 즉, 레이블 이미지 풀 갱신 모듈(38)은 제1 유사도(S(I))가 사전 정의된 제1 임계치(T(I)) 이상이고 제2 유사도(S(O))가 사전 정의된 제2 임계치(T(O)) 미만인 경우, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)에 기초하여(예를 들어, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2) 중 적어도 하나에 대해 레이블링을 수행하고, 이를 레이블 이미지 풀(36)에 추가함으로써) 레이블 이미지 풀(36)을 갱신할 수 있다.

본 실시 예에 따르면, 머신 러닝 시스템(2)은, (동영상으로 한정되지 않는) 다수의 언레이블 데이터에서 샘플 데이터(즉, 제1 추출 이미지 및 제2 추출 이미지)를 추출하고, 추출한 샘플 데이터가 레이블링이 필요한 데이터인지 여부, 즉 현재 레이블 이미지 풀(36)에 추가할 필요가 있는지 여부를 스스로 판단할 수 있다.

따라서, 다량의 데이터에서 사람이 일일이 레이블링이 필요한 데이터를 골라 낼 필요 없이, 머신 러닝 시스템(2) 스스로 레이블링이 필요한 데이터를 제안할 수 있어, 머신 러닝 시스템의 학습 비용이 감소하고, 그 만큼 더 많은 학습 데이터로 머신 러닝 모델을 학습시킬 수 있어, 결과적으로 고도로 학습된 머신 러닝 시스템(2)을 얻을 수 있게 된다.

한편, 본 발명의 몇몇의 실시 예에서, 레이블 이미지 풀 갱신 모듈(38)은 사전에 정해진 우선 순위 또는 정책에 따라, 도 1에서 설명한 바와 같이, 조건 식에 사용되는 임계치를 변경할 수 있다.

예를 들어, 레이블 이미지 풀 갱신 모듈(38)은, 제1 유사도(S(I))가 제1 임계치(T(I)) 미만인 경우, 제1 유사도(S(I))가, 사전 정의되고 제1 임계치(T(I))보다 작은 값을 갖는 제3 임계치(T'(I)) 이상이고 제2 유사도(S(O))가 제2 임계치(T(O)) 미만인 경우, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)에 기초하여 레이블 이미지 풀(36)을 갱신할 수 있다.

또 다른 예로, 레이블 이미지 풀 갱신 모듈(38)은, 제1 유사도(S(I))가 제1 임계치(T(I)) 이상이고 제2 유사도(S(O))가 제2 임계치(T(O)) 이상인 경우, 제1 유사도(S(I))가 제1 임계치(T(I)) 이상이고 제2 유사도(S(O))가, 사전 정의되고 제2 임계치(T(O))보다 높은 값을 갖는 제4 임계치(T'(0)) 미만인 경우, 제1 추출 이미지(I1) 및 제2 추출 이미지(I2)에 기초하여 레이블 이미지 풀(36)을 갱신할 수 있다.

이와 같이 임계치를 변경함으로써, 머신 러닝 시스템(1) 스스로 레이블링이 필요한 데이터를 제안하는 결정 기준을 세부적으로 조절할 수 있고, 동작 중 필요에 따라 사전에 정해진 정책에 따라 임계치 변경마저 스스로 수행할 수 있는 머신 러닝 시스템(1)을 구현할 수 있다.

본 실시 예와 관련된 더욱 상세한 내용에 대해서는 전술한 도 1에 관한 설명을 참조할 수 있으며, 도 1에 관한 설명들은 본 실시 예에 따른 머신 러닝 시스템에 그대로 적용될 수 있다.

도 6을 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 언레이블 이미지 풀에서 이미지를 추출하는 단계(S601)를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지를 이용하여 모델 예측을 수행하는 단계(S603)를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 간 제1 유사도를 판단하는 단계(S605)를 포함할 수 있다.

또한, 상기 방법은, 예측 이미지 간 제2 유사도를 판단하는 단계(S607)를 포함할 수 있다.

또한, 상기 방법은, 제1 유사도와 제2 유사도를 임계치와 비교하는 단계(S609)를 포함할 수 있다. 또한, 상기 방법은, 비교 결과에 기초하여 레이블 이미지 풀을 갱신하는 단계 (S611)를 포함할 수 있다.

도 7을 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템(3)이 도 1의 실시 예에 따른 머신 러닝 시스템(1)과 다른 점은, 이미지 추출 모듈(10), 제1 유사도 판단 모듈(20), 머신 러닝 모델(30), 및 제2 유사도 판단 모듈(40)이 3 개 이상의 추출 이미지(I1, I2, I3), 즉, 추출 이미지 시퀀스(image sequence)에 대해 동작한다는 점이다.

이미지 추출 모듈(10)은 동영상 데이터를 입력 받고, 동영상 데이터에서 추출 이미지 시퀀스(I1, I2, I3)를 추출하여 제1 유사도 판단 모듈(20) 및 머신 러닝 모델(30)에 제공할 수 있다.

제1 유사도 판단 모듈(20)은 추출 이미지 시퀀스(I1, I2, I3)를 입력 받고, 추출 이미지 시퀀스(I1, I2, I3) 간 제1 유사도(S(I))를 판단할 수 있다. 예를 들어, 제1 유사도 판단 모듈(20)은, 추출 이미지 시퀀스(I1, I2, I3) 중 시간적으로 인접한 2 개의 추출 이미지에 대한 유사도들을 모두 연산한 후, 그 값들을 평균하여 제1 유사도(S(I))를 연산할 수 있다.

머신 러닝 모델(30)은 추출 이미지 시퀀스(I1, I2, I3)를 입력 받고, 추출 이미지 시퀀스(I1, I2, I3) 각각에 대한 모델 예측을 수행할 수 있다.

제2 유사도 판단 모듈(40)은 머신 러닝 모델(30)로부터 모델 예측의 결과에 해당하는 예측 이미지 시퀀스(PI1, PI2, PI3)를 입력 받고, 예측 이미지 시퀀스(PI1, PI2, PI3) 간 제2 유사도(S(O))를 판단할 수 있다. 예를 들어, 제2 유사도 판단 모듈(40)은, 예측 이미지 시퀀스(PI1, PI2, PI3) 중 시간적으로 인접한 2 개의 예측 이미지에 대한 유사도들을 모두 연산한 후, 그 값들을 평균하여 제2 유사도(S(O))를 연산할 수 있다.

S(I) >= T(I) & S(O) < T(O)

상기 조건 식에 따르면, 학습 데이터 선택 모듈(50)은, 제1 유사도(S(I))가 사전 정의된 제1 임계치(T(I)) 이상이고 제2 유사도(S(O))가 사전 정의된 제2 임계치(T(O)) 미만인 경우, 추출 이미지 시퀀스(I1, I2, I3) 중 적어도 하나를 학습 데이터로 선택할 수 있다.

동영상 데이터의 특성 상, 장면이 바뀌는 경우를 제외하고는 추출 이미지 시퀀스(I1, I2, I3)의 유사도는 일반적으로 높을 것이다. 그런데 추출 이미지 시퀀스(I1, I2, I3)의 유사도에 해당하는 제1 유사도(S(I))가 비교적 높은 반면, 모델 예측 결과에 해당하는 예측 이미지 시퀀스(PI1, PI2, PI3)의 유사도에 해당하는 제2 유사도(S(O))가 비교적 낮다면, 이는 모델 예측 또는 추론 결과의 불확실성이 높다는 것을 의미할 수 있다. 따라서, 이러한 경우는 추출 이미지 시퀀스(I1, I2, I3)에 대해 추가 학습이 필요한 상황으로 판단될 수 있다.

이와 같은 경우, 학습 데이터 선택 모듈(50)은, 추출 이미지 시퀀스(I1, I2, I3) 중 적어도 하나에 대해 레이블링을 수행하거나, 또는 외부에 추출 이미지 시퀀스(I1, I2, I3) 중 적어도 하나에 대한 레이블링을 요청하고 그 결과를 수신하는 방식으로, 추출 이미지 시퀀스(I1, I2, I3) 중 적어도 하나를 학습 데이터(TD)로 선택, 즉 레이블 이미지 데이터로 변환할 수 있다.

도 8을 참조하면, 본 발명의 일 실시 예에 따른 머신 러닝 시스템의 동작 방법은, 동영상에서 이미지 시퀀스를 추출하는 단계(S801)를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 시퀀스를 이용하여 모델 예측을 수행하는 단계(S803)를 포함할 수 있다.

또한, 상기 방법은, 추출 이미지 시퀀스 간 제1 유사도를 판단하는 단계(S805)를 포함할 수 있다.

또한, 상기 방법은, 예측 이미지 시퀀스 간 제2 유사도를 판단하는 단계(S807)를 포함할 수 있다.

또한, 상기 방법은, 제1 유사도와 제2 유사도를 임계치와 비교하는 단계(S809)를 포함할 수 있다. 또한, 상기 방법은, 비교 결과에 기초하여 추출 이미지 시퀀스를 학습 데이터로 선택하는 단계(S811)를 포함할 수 있다.

본 실시 예와 관련된 더욱 상세한 내용에 대해서는 전술한 도 1 및 도 7에 관한 설명을 참조할 수 있으며, 도 1 및 도 7에 관한 설명들은 본 실시 예에 따른 머신 러닝 시스템의 동작 방법에 그대로 적용될 수 있다.

도 9 및 도 10을 참조하면, 도 9는 예컨대 제1 추출 이미지(I1)에 해당하고, 도 10은 예컨대 제2 추출 이미지(I2)에 해당할 수 있다.

제1 유사도 판단 모듈(20)에 의해, 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 간 제1 유사도(S(I))가 0.7521로 연산되고, 제2 유사도 판단 모듈(40)에 의해 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))가 0.1454로 연산된 경우이다. 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2) 간 제2 유사도(S(O))가 비교적 낮은 이유는, 도 11에서 표시된 트럭(OBJ1)에 대한 검출 박스가 도 12에는 존재하지 않아, 그 예측 결과에 차이가 있기 때문이다.

즉, 제1 추출 이미지(I1)와 제2 추출 이미지(I2)의 유사도에 해당하는 제1 유사도(S(I))가 비교적 높은 반면, 모델 예측 결과에 해당하는 제1 예측 이미지(PI1)와 제2 예측 이미지(PI2)의 유사도에 해당하는 제2 유사도(S(O))가 비교적 낮음을 알 수 있다. 이러한 경우, 학습 데이터 선택 모듈(50)은 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 중 적어도 하나를 학습 데이터로 선택할 수 있다. 즉, 학습 데이터 선택 모듈(50)은 제1 추출 이미지(I1)와 제2 추출 이미지(I2) 중 적어도 하나에 대한 추가 학습이 필요하다고 판단할 수 있다.

이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리 범위는 이에 한정되는 것은 아니고, 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자의 여러 변형 및 개량 형태 또한 본 발명의 권리 범위에 속한다.

Claims

제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 상기 제1 추출 이미지와 상기 제2 추출 이미지 간 제1 유사도를 판단하는 제1 유사도 판단 모듈;

상기 제1 추출 이미지 및 제2 추출 이미지를 입력 받고, 상기 제1 추출 이미지 및 상기 제2 추출 이미지 각각에 대한 모델 예측을 수행하는 머신 러닝 모델;

상기 머신 러닝 모델로부터 상기 모델 예측의 결과에 해당하는 제1 예측 이미지 및 제2 예측 이미지를 입력 받고, 상기 제1 예측 이미지와 상기 제2 예측 이미지 간 제2 유사도를 판단하는 제2 유사도 판단 모듈; 및

상기 제1 유사도와 상기 제2 유사도에 기초하여 상기 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 학습 데이터 선택 모듈을 포함하는

머신 러닝 시스템.
제1항에 있어서,

동영상 데이터를 입력 받고, 상기 동영상 데이터에서 제1 추출 이미지 및 제2 추출 이미지를 추출하여 상기 제1 유사도 판단 모듈 및 상기 머신 러닝 모델에 제공하는 이미지 추출 모듈을 더 포함하는 머신 러닝 시스템.
제2항에 있어서,

상기 제1 추출 이미지와 상기 제2 추출 이미지는 상기 동영상 데이터 중 연속된 이미지 프레임에 해당하는 머신 러닝 시스템.
제1항에 있어서,

상기 제1 유사도 판단 모듈은,

상기 제1 추출 이미지와 상기 제2 추출 이미지에 대해 SAD(Sum of Absolute Differences) 기반의 거리 연산을 수행하고,

상기 거리 연산의 결과에 기초하여 상기 제1 유사도를 판단하는, 머신 러닝 시스템.
제4항에 있어서,

상기 제2 유사도 판단 모듈은,

상기 제1 예측 이미지와 상기 제2 예측 이미지에 대해 상기 SAD 기반의 거리 연산을 수행하고,

상기 거리 연산의 결과에 기초하여 상기 제2 유사도를 판단하는, 머신 러닝 시스템.
제1항에 있어서,

상기 제1 유사도 판단 모듈은,

상기 제1 추출 이미지와 상기 제2 추출 이미지에 대해 ED(Euclidean Distance) 기반의 거리 연산을 수행하고,

상기 거리 연산의 결과에 기초하여 상기 제1 유사도를 판단하는, 머신 러닝 시스템.
제6항에 있어서,

상기 제2 유사도 판단 모듈은,

상기 제1 예측 이미지와 상기 제2 예측 이미지에 대해 상기 ED 기반의 거리 연산을 수행하고,

상기 거리 연산의 결과에 기초하여 상기 제2 유사도를 판단하는, 머신 러닝 시스템.
제1항에 있어서,

상기 학습 데이터 선택 모듈은,

상기 제1 유사도가 사전 정의된 제1 임계치 이상이고 상기 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 상기 제1 추출 이미지 및 상기 제2 추출 이미지 중 적어도 하나를 상기 학습 데이터로 선택하는, 머신 러닝 시스템.
제1항에 있어서,

상기 학습 데이터 선택 모듈은,

상기 제1 유사도가, 사전 정의된 제1 임계치 세트 중에서 선택된 제1 임계치 이상이고, 상기 제2 유사도가, 사전 정의된 제2 임계치 세트 중에서 선택된 제2 임계치 미만인 경우, 상기 제1 추출 이미지 및 상기 제2 추출 이미지 중 적어도 하나를 상기 학습 데이터로 선택하는, 머신 러닝 시스템.
제9항에 있어서,

상기 제1 임계치 및 상기 제2 임계치는, 사용자 입력 또는 사전 정의된 정책(policy)에 따라, 상기 제1 임계치 세트 및 상기 제2 임계치 세트로부터 선택되는, 머신 러닝 시스템.
언레이블 이미지 풀에서 추출된 제1 추출 이미지와 제2 추출 이미지 간 제1 유사도를 판단하는 제1 유사도 판단 모듈;

상기 제1 추출 이미지 및 상기 제2 추출 이미지 각각에 대한 모델 예측을 수행하는 머신 러닝 모델;

상기 머신 러닝 모델로부터 상기 모델 예측의 결과에 해당하는 제1 예측 이미지 및 제2 예측 이미지를 입력 받고, 상기 제1 예측 이미지와 상기 제2 예측 이미지 간 제2 유사도를 판단하는 제2 유사도 판단 모듈; 및

상기 제1 유사도와 상기 제2 유사도에 기초하여 레이블 이미지 풀을 갱신하는 레이블 이미지 풀 갱신 모듈을 포함하는

머신 러닝 시스템.
제11항에 있어서,

상기 레이블 이미지 풀 갱신 모듈은,

상기 제1 유사도가 사전 정의된 제1 임계치 이상이고 상기 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 상기 제1 추출 이미지 및 상기 제2 추출 이미지에 기초하여 레이블 이미지 풀을 갱신하는, 머신 러닝 시스템.
제11항에 있어서,

상기 레이블 이미지 풀 갱신 모듈은,

상기 제1 유사도가, 사전 정의된 제1 임계치 세트 중에서 선택된 제1 임계치 이상이고, 상기 제2 유사도가, 사전 정의된 제2 임계치 세트 중에서 선택된 제2 임계치 미만인 경우, 상기 제1 추출 이미지 및 상기 제2 추출 이미지에 기초하여 레이블 이미지 풀을 갱신하는, 머신 러닝 시스템.
제13항에 있어서,

상기 제1 임계치 및 상기 제2 임계치는, 사용자 입력 또는 사전 정의된 정책에 따라, 상기 제1 임계치 세트 및 상기 제2 임계치 세트로부터 선택되는, 머신 러닝 시스템.
제1 추출 이미지와 제2 추출 이미지 각각에 대해 머신 러닝 모델을 이용한 예측을 수행하는 단계;

상기 제1 추출 이미지와 상기 제2 추출 이미지 간 제1 유사도를 판단하는 단계;

모델 예측의 결과에 해당하는 제1 예측 이미지와 제2 예측 이미지 간 제2 유사도를 판단하는 단계; 및

상기 제1 유사도와 상기 제2 유사도에 기초하여 상기 머신 러닝 모델을 학습시키기 위한 학습 데이터를 선택하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.
제15항에 있어서,

상기 제1 유사도를 판단하는 단계는,

상기 제1 추출 이미지와 상기 제2 추출 이미지에 대해 SAD(Sum of Absolute Differences) 기반의 거리 연산을 수행하는 단계 및

상기 거리 연산의 결과에 기초하여 상기 제1 유사도를 판단하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.
제16항에 있어서,

상기 제2 유사도를 판단하는 단계는,

상기 제1 예측 이미지와 상기 제2 예측 이미지에 대해 상기 SAD 기반의 거리 연산을 수행하는 단계 및

상기 거리 연산의 결과에 기초하여 상기 제2 유사도를 판단하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.
제15항에 있어서,

상기 제1 유사도를 판단하는 단계는,

상기 제1 추출 이미지와 상기 제2 추출 이미지에 대해 ED(Euclidean Distance) 기반의 거리 연산을 수행하는 단계 및

상기 거리 연산의 결과에 기초하여 상기 제1 유사도를 판단하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.
제18항에 있어서,

상기 제2 유사도를 판단하는 단계는,

상기 제1 예측 이미지와 상기 제2 예측 이미지에 대해 상기 ED 기반의 거리 연산을 수행하는 단계 및

상기 거리 연산의 결과에 기초하여 상기 제2 유사도를 판단하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.
제15항에 있어서,

상기 학습 데이터를 선택하는 단계는,

상기 제1 유사도가 사전 정의된 제1 임계치 이상이고 상기 제2 유사도가 사전 정의된 제2 임계치 미만인 경우, 상기 제1 추출 이미지 및 상기 제2 추출 이미지 중 적어도 하나를 상기 학습 데이터로 선택하는 단계를 포함하는, 머신 러닝 시스템의 동작 방법.