KR102526086B1

KR102526086B1 - 클래스 의존적 도메인 유사화 학습 방법, 장치 및 컴퓨터 판독 가능한 기록 매체

Info

Publication number: KR102526086B1
Application number: KR1020200147036A
Authority: KR
Inventors: 이재욱; 이우진; 김호기
Original assignee: 서울대학교산학협력단
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2023-04-25
Also published as: KR20220060894A

Abstract

탑재된 인공지능(artificial intelligence, AI) 알고리즘 및/또는 기계학습(machine learning) 알고리즘을 실행하는 클래스 의존적 도메인 유사화 학습 장치가 개시된다. 본 장치는 인코더 및 프로세서를 포함할 수 있다. 본 장치가 제공됨으로써, 도메인 유사화 학습이 신뢰도가 높게 안정적으로 수행될 수 있으며, 완성된 모델의 클래스 분류 정확도가 향상될 수 있다.

Description

클래스 의존적 도메인 유사화 학습 방법, 장치 및 컴퓨터 판독 가능한 기록 매체{METHOD, APPARATUS AND COMPUTER READABLE RECORDING MEDIUM FOR LEARNING DOMAIN INVARIANT OF COMPACT CLASS-CONDITIONAL DOMAIN ADAPTATION}

본 개시는 기계 학습 및 인공지능 기술에 관련된 것으로 더 상세하게는 도메인 적응을 위한 클래스 의존적 도메인 유사화 학습 방법, 이를 위한 장치 및 컴퓨터 판독 가능한 기록 매체에 관한 것이다.

머신 러닝 및 인공 지능 모델은 영상 클래스 분류에 효과적으로 활용되고 있다. 다만, 모든 데이터가 정답(Label)을 가지고 있지 않으며, 이러한 데이터에 정답을 부여하는 작업에 많은 비용이 필연적으로 발생된다.

이를 효과적으로 개선하기 위해 정답이 있는 데이터를 바탕으로 정답이 없는 데이터를 맞추고자하는 도메인 적응(Domain Adaptation) 기술이 등장하였다.

다만, 정답이 없는 도메인의 표현을 정답이 있는 도메인의 표현으로 강제적으로 일치시키는 경우, 성능 저하의 문제가 발생될 수 있다. 특히, 연산 리스크가 큰 우주 비행, 자율 주행 및 지능형 영상 분석 등에서의 성능 저하는 자칫 대형 사고로 연결되는 위험도 있다.

이에, 보다 안정적이면서 높은 신뢰도를 보장하는 도메인 적응 기술이 요청된다.

선행 기술 : 공개특허공보 제10-2019-0019822호(공개일: 2019,02.27)

본 발명이 해결하고자 하는 과제는 도메인 유사화 학습을 편향적이지 않고 신중하게 수행하는 클래스 의존적 도메인 유사화 학습 방법 및 장치를 제공하는 데에 있다.

본 발명의 또 다른 과제는, 클래스 분류를 정확도 높게 안정적으로 수행하는 클래스 의존적 도메인 유사화 학습 방법 및 장치를 제공하는 데에 있다.

본 발명의 또 다른 과제는, 도메인 적응을 신뢰도 높게 저비용으로 수행하는 클래스 의존적 도메인 유사화 학습 방법 및 장치를 제공하는 데에 있다.

본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

상기 과제를 달성하기 위하여, 본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 장치는 레이블(Label)이 있는 제1 도메인에 포함된 데이터 셋(Data Set)을 입력받아 특징 공간(Feature Space)에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 상기 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 인코더(Encoder); 특징 공간 상에서, 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)하여 각 그룹 별 제1 특징 정보에 대한 특징값의 평균값을 산출하는 프로세서를 포함할 수 있다.

프로세서는 특징 공간 상에 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 그룹 별 평균값 간의 거리 및 방향을 결정할 수 있다.

프로세서는 결정된 방향을 고려하여 거리가 비례적으로 줄어들도록 제2 특징 정보 중 적어도 일부를 특징 공간 상에서 이동시킬 수 있다.

본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 방법은 레이블이 있는 제1 도메인에 포함된 데이터 셋을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 단계; 특징 공간 상에서, 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑하여 각 그룹 별 상기 제1 특징 정보의 평균값을 산출하는 단계; 및 특징 공간 상에 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 거리가 비례적으로 줄어들도록 제2 특징 정보 중 적어도 일부를 특징 공간 상에서 이동시키는 단계를 포함할 수 있다.

본 발명의 일 실시 예에 따른 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체가 제공될 수 있다.

프로그램은 프로세서에 의한 실행 시, 프로세서가 레이블이 있는 제1 도메인에 포함된 데이터 셋을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 동작, 특징 공간 상에서, 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑하여 각 그룹 별 상기 제1 특징 정보의 평균값을 산출하는 동작 및 특징 공간 상에 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 거리가 비례적으로 줄어들도록 제2 특징 정보 중 적어도 일부를 특징 공간 상에서 이동시키는 동작을 수행하도록 하는 실행 가능한 명령을 포함할 수 있다.

본 발명에서 이루고자 하는 기술적 과제들의 해결 수단은 이상에서 언급한 해결 수단들로 제한되지 않으며, 언급하지 않은 또 다른 해결 수단들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 발명의 다양한 실시 예에 의해, 정확도 높고 신중하게 도메인 유사화 학습이 수행될 수 있으며, 학습이 완료된 도메인 유사화 모델의 클래스 분류 정확도가 향상될 수 있고, 성능 저하의 문제가 해소될 수 있다.

도 1은 본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 장치의 구성을 나타내는 블록도,
도 2는 본 발명의 일 실시 예에 따른 소정의 도메인에 포함된 데이터 셋에 대응하는 특징 정보를 가시화한 도면,
도 3은 본 발명의 일 실시 예에 따른 도메인 유사화 모델을 학습하는 방법을 가시화한 도면,
도 4는 본 발명의 일 실시 예에 따른 도메인 유사화 모델을 학습하는 프로세스 스텝을 가시화한 도면, 그리고,
도 5는 본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 방법을 나타내는 시퀀스도이다.

이하, 첨부된 도면들을 참조하여 본 발명의 예시적인 실시예들에 대하여 설명한다. 본 발명은 서로 다른 다양한 형태들로 구현될 수 있으며, 본 명세서에 설명된 실시예들로 한정되는 것으로 해석되어서는 안 된다. 도면에서 구성요소들, 계층들 및 영역들의 상대적인 크기는 설명의 명확성을 위해 과장될 수 있다.

도 1은 본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 장치(100, 이하 “도메인 유사화 학습 장치”로 간략 기재)의 구성을 나타내는 블록도이다.

도메인 유사화 학습 장치(100)는 정답에 해당하는 레이블(Label)이 있는 도메인을 이용하여 레이블이 없는 도메인을 최적 적응(Adaptation)하기 위한 학습 장치이다. 도메인 유사화 학습 장치(100)는 학습된 도메인 유사화 모델(141)을 최종적으로 사용하거나 외부 기기/시스템에 제공할 수 있다.

도메인 유사화 학습 장치(100)는 데이터 획득부(110), 인코더(120), 디스플레이(130), 메모리(140) 및 상기 구성들을 컨트롤하는 프로세서(190)를 포함할 수 있다. 도 1에 도시된 구성요소들은 도메인 유사화 학습 장치 (100)를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 도메인 유사화 학습 장치(100)는 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.

먼저, 데이터 획득부(110)는 각종 저장 매체 또는 네트워크를 통해 입력 데이터를 획득하는 모듈로, 이를 위한 입력 모듈 및 통신 모듈을 포함할 수 있다.

인코더(120)는 데이터 획득부(110)로부터 입력된 데이터에서 특징 정보(Latent Vector)를 추출할 수 있다. 특징 정보는 차원이 줄어든 채로 데이터를 잘 설명할 수 있는 특징 공간(Feature Space)에서의 벡터를 말하며, 입력된 데이터의 표현이라 할 수 있다. 선택적 실시 예로, 입력되는 데이터는 영상 데이터일 수 있다.

구체적으로, 인코더(120)는 레이블이 있는 제1 도메인에 포함된 데이터 셋(Set)을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출할 수 있다. 여기서, 특징 공간 상에서 레이블값 별로 특징 정보가 그룹을 형성할 수 있다. 선택적 실시 예로, 제1 도메인에 포함된 데이터 셋은 MNIST(Modified National Institute of Standards and Technology Database) 에 포함된 데이터 셋일 수 있다.

또한, 인코더(120)는 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출할 수 있다. 선택적 실시 예로, 레이블이 없는 데이터 셋은 제2 도메인에 포함될 수 있다.

본 명세서 상에서는 레이블이 있는 제1 도메인의 데이터 셋(

)을 인코더(120)를 이용하여 인코딩(

)한 제1 특징 정보를

라고 하고, 레이블이 없는 제2 도메인의 데이터 셋(

)을 인코더(120)를 이용하여 인코딩(

)한 제2 특징 정보를

라고 사용하기로 한다. 제1 특징 정보 및 제2 특징 정보는 Latent Vector 로 구현될 수 있다.

상기 인코더(120)는 입력되는 데이터 셋의 특징 정보를 추출하여, 특징 공간 상에 임베딩할 수 있다. 아울러, 프로세서(190)는 특징 공간 상의 제2 특징 정보의 표현(Latent Vector)을 소정의 조건하에서 제1 특징 정보의 표현을 이용하여 설정할 수 있다.

디스플레이(130)는 다양한 영상 데이터를 화면에 출력하는 구성이며, 일 예로, 디스플레이(130)는 특징 공간 및 특징 정보 등을 화면 상에 출력할 수 있다.

메모리(140)는 다양한 정보를 저장하는 모듈이며, 도메인 유사화 모델(141)을 저장할 수 있다. 학습 단계에서, 상기 도메인 유사화 모델(141)의 파라미터의 값은 기 설정된 손실 함수의 값을 최소화하기 위해 변동될 수 있다. 선택적 실시 예로, 도메인 유사화 모델(141)의 파라미터의 값은 1 배치 기간을 기준으로 변동될 수 있다. 학습 완료되면, 도메인 유사화 모델(141)은 클래스 분류를 위해 사용될 수 있다.

선택적 실시 예로, 완성된 도메인 유사화 모델(141)은 레이블이 없는 데이터 셋(및 레이블이 있는 데이터 셋)을 입력받아, 클래스 분류를 신뢰도 높게 안정적으로 수행할 수 있다.

프로세서(190)는 특징 공간에서, 레이블이 있는 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)할 수 있다. 예를 들면, 프로세서(190)는 MNIST 데이터 셋을 입력받는 경우, “1”을 나타내는 영상 데이터, “2”를 나타내는 영상 데이터 등의 특징 정보를 특징 공간에 임베딩하면서, 특징 공간에서 정답(“1”, “2”)에 따라 서로 다르게 그룹핑할 수 있다.

프로세서(190)는 그룹핑된 그룹 별로 제1 특징 정보에 대한 특징값의 평균값을 산출할 수 있다. 소정의 정답 그룹(j)에 속하는 제1 특징 정보(

)의 평균값(

)은 아래 [수식 1]과 같다. 여기서,

는 소정의 정답 그룹(j)에 속한 데이터 셋(

)의 개수이다. 선택적 실시 예로, 프로세서(190)는 제1 특징 정보 전부에 대해서 정답 그룹 별로 평균값을 산출할 수 있다.

[수식 1]

그 후에, 프로세서(190)는 특징 공간 상에 레이블이 없는 하나 이상의 제2 특징 정보를 임베딩할 수 있다. 구체적으로, 프로세서(190)는 인코더(120)를 이용하여 제2 특징 정보를 추출할 수 있다.

프로세서(190)는 임베딩된 상기 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 그룹 별 제1 특징 정보의 평균값 간의 거리 및 방향을 결정할 수 있다.

즉, 프로세서(190)는 특징 공간 상에서, 각각의 제2 특징 정보 별로 주변에 배치된 제1 특징 정보의 평균값 간의 거리 및 방향을 결정할 수 있다. 이런 경우, 프로세서는, 각각의 제2 특징 정보 및 주변에 배치된 대표값(제1 특징 정보의 평균값)만 비교하므로, 도메인 유사화 학습 장치(100)의 연산 횟수가 줄어들어, 연산 효율이 향상될 수 있다.

프로세서(190)는 제2 특징 정보 별로, 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 상기 제2 특징 정보 중 적어도 일부를 상기 특징 공간 상에서 이동시킬 수 있다. 선택적 실시 예로, 프로세서(190)는 1 배치 기간 마다 데이터 셋에 대해 도메인 유사화 모델(141)을 학습시킬 수 있다.

도 2는 본 발명의 일 실시 예에 따른 소정의 도메인에 포함된 데이터 셋에 대응하는 특징 정보를 가시화한 도면이다. 특히, 도 2는 제2 특징 정보를 가시한 것으로 상정하기로 한다.

프로세서(190)는 특징 공간 상에 제2 특징 정보(A)를 임베딩할 수 있다. 제2 특징 정보(A)는 헤드(AH), 바디(AB), 이동 전의 특징값(AP)을 포함할 수 있다.

프로세서(190)는 각각의 제2 특징 정보(A)에 대해, 제1 특징 정보에 대한 그룹별 평균값과의 거리 및 방향을 결정할 수 있다. 프로세서(A)는 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 제2 특징 정보 중 적어도 일부를 특징 공간 상에서 이동시킬 수 있다. 이를 위해, 프로세서(A)는 최종적인 이동 거리에 비례한 길이를 바디(AB)로, 이동할 방향을 헤드(AH)로 나타낼 수 있다.

도 3은 본 발명의 일 실시 예에 따른 도메인 유사화 모델을 학습하는 방법을 가시화한 도면이다.

도 3은 1 배치 기간 동안에 해당되는 제2 특징 정보(A1a~A1i, A2a~A2i)의 정답을 미리 알고, 도메인 유사화 모델(141)의 학습을 시뮬레이션 수행한 것을 나타낸다. 도 3은 제2 특징 정보(A1a~A1i, A2a~A2i)가 제1 특징 정보의 정답 그룹 별 평균값(220M1, 220M2) 사이에서의 이동 경향을 나타낸다.

여기서, 프로세서(190)는 특징 공간(210)을 시각적으로 출력할 수 있다. 특징 공간(210)은 제1 및 제2 특징 정보가 임베딩 가능한 확률 분포 공간이라 할 수 있다.

프로세서(190)는 제1 특징 정보 각각을 특징 공간에 모두 임베딩하여 제2 특징 정보와의 거리를 산출하지 않고, 제1 특징 정보의 정답 그룹 별 평균값(220M1, 220M2)만을 연산에 사용하므로, 연산 효율 및 출력 효율이 향상될 수 있다. 제1 특징 정보의 평균값(220M1, 220M2)은 두 개로 가정하기로 하나, 실시 예가 이에 국한되는 것은 아니다.

프로세서(190)는 제2 특징 정보 각각(A1a~A1i, A2a~A2i)의 이동 전의 특징값 위치(도 2의 AP에 대응)를 출력하고, 이동할 위치를 가리키는 방향 및 거리(도 2의 AH, AB)를 특징 공간(210) 상에 출력할 수 있다.

즉, 프로세서(190)는 제2 특징 정보(A1a~A1i, A2a~A2i) 중에서 이동할 제2 특징 정보(A1g, A2f, A2g를 제외하고 모두)와 이동하지 않는 제2 특징 정보(A1g, A2f, A2g)를 특징 공간(210) 상에 출력할 수 있다.

프로세서(190)는 제2 특징 정보 각각(A1a~A1i, A2a~A2i) 및 제1 특징 정보의 정답 그룹 별 평균값(220M1, 220M2) 사이의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시킬 수 있다.

예를 들면, 프로세서(190)는 제2 평균값(220M2) 보다는 제1 평균값(220M1)에 근접한 제2 특징 정보(가령, A1a~A1f)에 대해, 상대적으로 보다 많이 제1 평균값(220M1) 방향으로 이동시킬 수 있으며, 제1 평균값(220M1) 보다 제2 평균값(220M2)에 근접한 제2 특징 정보(가령, A2a~A2d)에 대해, 상대적으로 보다 많이 제2 평균값(220M2) 방향으로 이동시킬 수 있다.

즉, 프로세서(190)는 제2 특징 정보 각각(A1a~A1i, A2a~A2i)에 대해, 제1 평균값(220M1, 220M2)의 거리 및 방향에 기초하여, 근접한 평균값에 비례적으로 더 많이 근접하는 경향성을 갖도록 제2 특징 정보를 이동시킬 수 있다.

다만, 프로세서(190)는 제2 특징 정보 중 평균값(220M1, 220M2)의 방향 및 거리에 있어 중간 지점에 있는 특징 정보(A1g, A2f, A2g)는 이동시키지 않을 수 있다.

이 경우, 프로세서(190)는 이동하지 않은 제2 특징 정보(A1g, A2f, A2g)를 하이라이트 표시하여 디스플레이(130)에 출력할 수 있다.

본 발명의 일 실시 예에 따르면, 거리 및 방향에 따라 비례적으로 제2 특징 정보가 이동함으로써, 학습 중(특히, 학습 초반)에 신중한 학습이 수행될 수 있다. 즉, 제1 특징 정보의 정답 그룹에서 멀리 떨어진 제2 특징 정보를 신중하게 이동시켜, 편향된 학습이 수행되지 않게 할 수 있다.

아울러, 이렇게 완성된 도메인 유사화 모델(141)은 안정적이면서 정확하게 클래스 분류 작업을 수행할 수 있어서, 성능 저하의 문제를 해결할 수 있다.

도 4는 본 발명의 일 실시 예에 따른 도메인 유사화 모델(141)을 학습하는 프로세스 스텝을 가시화한 도면이다.

도 4를 참고하면, 프로세서(190)는 정답(y^s)이 있는 데이터 셋(

)과 정답이 없는 데이터 셋(

)을 인코더(120)에 입력하여, 제1 특징 정보(

) 및 제2 특징 정보(

)를 추출할 수 있다. 선택적 실시 예로, 제1 특징 정보(

) 및 제2 특징 정보(

)는 가우시안 분포의 노이즈값을 이용하여 추출될 수 있으며, 특징 공간 상에 임베딩될 수 있으며, 각 데이터 셋의 표현이라 할 수 있다.

프로세서(190)는 별도의 손실 함수를 이용하는 3 가지 프로세스(410, 420, 430)를 수행할 수 있다. 손실 함수는 기계 학습 및 인공 지능 분야에서 알고리즘의 성능을 최적화하기 위해 이용하는 함수로 우도(Likehood)가 최대가 되도록(손실 함수의 결과값이 최소가 되도록, Kullback-Leibler Divergence 값이 최소가 되도록) 학습이 수행될 수 있다.

먼저, 제1 프로세스(410)를 설명하기로 한다.

프로세서(190)는 상술한 [수식 1]에 따라, 제1 특징 정보(

)에 대해 정답 별 평균값(μ)을 산출할 수 있다. 만약, 제1 특징 정보에 대한 제1 내지 제3 그룹(G1~G3)의 평균값(G1M, G2M, G3M)이 각각 있는 경우, 프로세서(190)는 각각의 제2 특징 정보(A3P)에 대해, 세 그룹과의 거리 및 방향을 결정할 수 있다. 설명의 편의를 위해 제2 특징 정보(A3P(이동전), A3T(이동후))를 하나로 설명하나, 구현시에는 제2 특징 정보의 개수만큼 연산 및 출력될 수 있다.

프로세서(190)는 결정된 방향을 고려하여 결정된 거리가 짧은 평균값(G1M)일수록 높은 가중치를 부여하여 거리가 비례적으로 줄어들도록 제2 특징 정보를 제1 위치(A3P)에서 제2 위치(A3T)로 이동할 수 있다. 결국 제2 특징 정보는 가장 가깝게 배치된 제1 평균값(G1M)에 더 가까이 배치될 수 있다.

수식으로 보다 구체적으로 설명하면, 프로세서(190)는 제1 손실 함수(L1)의 값이 최소가 되도록 제1 프로세스(410)를 수행할 수 있다.

제1 손실함수(L₁)는 아래 [수식 2]에 의해 산출될 수 있다.

[수식 2]

여기서, 제1 거리 변수(

)는 i번째 제2 특징 정보(

)와 j번째 평균값(

)과의 거리에 기초하여 산출되며,

는

를 만족하고, k 는 1(초기값)부터 t까지 이며, t는 제1 특징 정보의 평균값 개수이고,

는 소정의 상수이다.

또한, 제2 거리 변수(

)는 제1 거리 변수(

)를 n승수 곱한 값에 기초하여 산출되며, i번째 제2 특징 정보(

)와 j번째 평균값(

)과의 거리에 기초하여 산출될 수 있다. 제2 거리 변수(

)는

를 만족하며, k 는 1부터 t까지 이며, t는 제1 특징 정보의 평균값 개수일 수 있다. 제2 거리 변수(

)는

을 n승수 곱하였으므로, 방향을 고려하여 가까운 곳에 더욱 가깝게 접근하고, 먼 곳에 더욱 멀게 접근할 수 있다. 또한,

는 정규화를 위한 소정의 값이다.

제1 손실함수(L₁)는 Kullback-Leibler Divergence 를 이용하는데, 가령, KL(P||Q) = Q의 확률 분포를 P의 확률 분포로 유사하게 만드는 연산으로, 연산값이 작을수록 확률 분포가 유사해질 수 있으며, 인공 지능의 우도(Likehood)를 최대화(Maximum)하는 것과 동일하다.

선택적 실시 예로, 프로세서(190)는 제1 손실 함수(L₁)의 값이 최소가 되도록 기 저장된 도메인 유사화 모델(141)을 학습할 수 있다.

다음으로, 제2 프로세스(420) 및 제3 프로세스(430)를 설명하기로 한다.

프로세서(190)는 제2 프로세스(420)를 수행할 때, 제2 손실 함수의 값이 최소가 되게 할 수 있다. 프로세서(190)는 제1 특징 정보의 레이블을 추정한 경우, 추정 정확도를 산출하고, 산출된 값이 최소가 되게 할 수 있다.

제2 손실 함수(L₂)는 아래 수식 3과 같다.

[수식 3]

여기서,

는 실제 정답이고,

는 라벨 분류기(420)를 이용하여 추정된 정답이며, 제2 손실 함수(L₂)는 라벨 분류기(420)의 정답 추정 정확도를 판단하기 위한 함수로, 값이 작을수록 정답 추정률이 높게 산출될 수 있다.

제3 프로세스(430)는 도메인을 분류하기 위한 제3 손실 함수를 이용한다. 제3 손실 함수(

)는 아래 [수식 4]에 의해 도출될 수 있다.

[수식 4]

상기 제3 손실 함수(

)는 인공 지능 알고리즘으로, 각 데이터 셋 각각을 도메인 분류기(430)에 입력하여, 도메인 분류의 정확도를 산출하는 함수이며, 값이 작을수록 높은 도메인 분류 정확도를 갖는다.

프로세서(190)는 제1 내지 제3 손실 함수의 총합(SUM, 440)이 최소가 되도록 각 손실 함수에 포함된 도메인 유사화 모델(141)의 파라미터를 설정할 수 있다.

선택적 실시 예로, 프로세서(190)는 제1 손실 함수(

)만 이용하여, 제1 손실 함수(

)의 값이 최소가 되도록 도메인 유사화 모델(141)을 학습시킬 수도 있다.

도 5는 본 발명의 일 실시 예에 따른 클래스 의존적 도메인 유사화 학습 방법을 나타내는 시퀀스도이다.

우선, 도메인 유사화 학습 장치는 정답이 있는 도메인의 데이터 셋을 제1 특징 정보로 추출한다(S51).

다음으로, 도메인 유사화 학습 장치는 정답이 없는 도메인의 데이터 셋을 제2 특징 정보로 추출한다(S52).

상기 S51, S52의 순서는 동시에 또는 순서를 바꾸어 수행될 수 있다.

도메인 유사화 학습 장치는 특징 공간 상에서, 제1 특징 정보를 정답 별로 그룹핑하고 그룹 별 평균값을 산출한다(S53).

다음으로, 도메인 유사화 학습 장치는 제2 특징 정보 각각과 제1 특징 정보의 그룹 별 평균값 사이의 거리 및 방향을 결정한다(S54).

도메인 유사화 학습 장치는 모든 제1 특징 정보의 그룹 별 평균값 사이의 거리 및 방향을 결정할 수 있다. 결정된 거리 및 방향은 디스플레이에 출력되지 않게 설정할 수 있다.

선택적 실시 예에서, 도메인 유사화 학습 장치는 제1 특징 정보의 그룹 별 평균값을 소정의 기준에 따라 선별하여, 선별된 평균값과 제2 특징 정보 사이의 거리 및 방향을 결정할 수 있다. 제2 특징 정보와의 거리에 따라 평균값이 선별될 수 있으며, 기 설정된 개수의 평균값이 선별될 수도 있다.

도메인 유사화 학습 장치는 결정된 방향을 고려하여 거리가 비례적으로 줄어들도록 제2 특징 정보 중 적어도 일부를 특징 공간 상에서 이동시킬 수 있다(S55).

이 경우, 도메인 유사화 학습 장치는 최종적으로 결정된 방향 및 거리를 도 2 및 도 3에 도시된 바와 같이 디스플레이에 출력한 후, 해당 위치로 이동시킬 수 있다.

도메인 유사화 학습 방법은 S53 단계 이후에, 제1 손실 함수(L₁)의 값이 최소가 되도록 기 저장된 도메인 유사화 모델을 학습하는 단계를 수행할 수 있다.

제1 손실 함수(L₁)는, 제2 특징 정보 각각에 대해, 제1 특징 정보의 정답 그룹 별 평균값 각각과의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시키기 위한 함수일 수 있다.

선택적 실시 예에서, 도메인 유사화 학습 방법은 S53 단계 이후에, 상기 제1 손실 함수(L₁), 제2 손실 함수(L₂) 및 제3 손실 함수(L₃)의 합인 총 손실 함수(L_T)의 값이 최소가 되도록 상기 도메인 유사화 모델을 학습하는 단계를 수행할 수 있다.

여기서, 상기 제1 손실 함수(L₁)는 동일하며, 상기 제2 손실 함수(L₂)는, 제1 특징 정보의 레이블을 추정한 경우, 추정 정확도를 산출하는 함수일 수 있다. 또한, 상기 제3 손실 함수(L₃)는, 제1 특징 정보 및 제2 특징 정보의 도메인을 추정하고, 추정 정확도를 산출하는 함수일 수 있다.

특히, 상기 제1 손실 함수(L₁)는, i번째 제2 특징 정보(

)와 j번째 평균값(

)과의 거리에 기초하여 산출된 제1 거리 변수(

) 및 상기 제1 거리 변수(

)를 n승수 곱한 값에 기초하여 산출된 제2 거리 변수(

)에 기반하여 산출될 수 있다.

또한, 도메인 유사화 학습 방법은 제1 특징 정보의 그룹 별 평균값을 제1 디스플레이하는 단계, 상기 특징 공간 상에서, 이동 전의 임베딩된 상기 제2 특징 정보를 제2 디스플레이하는 단계 및 상기 특징 공간에서 이동하는 상기 적어도 일부의 제2 특징 정보가 이동하는 방향 및 거리를 제3 디스플레이하는 단계를 더 수행할 수 있다.

이 경우, 제3 디스플레이하는 단계는, 특징 공간 상에서 임베딩되어 이동하는 제2 특징 정보의 이동 방향을 화살표의 헤드(Head)로 디스플레이하고, 상기 제2 특징 정보의 이동 거리에 비례한 길이를 상기 화살표의 바디(Body)로 디스플레이하는 단계를 포함할 수 있다.

아울러, 도메인 유사화 학습 방법은 특징 공간 상에서 이동하지 않는 제2 특징 정보를 하이라이트 표시하여 디스플레이하는 단계를 더 수행할 수 있다.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한, 상기 컴퓨터는 도메인 유사화 학습 장치(100)의 프로세서(190)를 포함할 수도 있다.

구체적으로, 상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가, 레이블(Label)이 있는 제1 도메인에 포함된 데이터 셋(Data Set)을 입력받아 특징 공간(Feature Space)에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 상기 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 제1 동작, 특징 공간 상에서, 상기 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)하여 각 그룹 별 상기 제1 특징 정보의 평균값을 산출하는 제2 동작 및 상기 특징 공간 상에 상기 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 상기 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 상기 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 상기 제2 특징 정보 중 적어도 일부를 상기 특징 공간 상에서 이동시키는 제3 동작을 수행하도록 하는 실행 가능한 명령을 포함할 수 있다.

앞에서, 본 발명의 특정한 실시예가 설명되고 도시되었지만 본 발명은 기재된 실시예에 한정되는 것이 아니고, 이 기술 분야에서 통상의 지식을 가진 자는 본 발명의 사상 및 범위를 벗어나지 않고서 다른 구체적인 실시예로 다양하게 수정 및 변형할 수 있음을 이해할 수 있을 것이다. 따라서, 본 발명의 범위는 설명된 실시예에 의하여 정하여 질 것이 아니고 청구범위에 기재된 기술적 사상에 의해 정하여져야 할 것이다.

Claims

클래스 의존적 도메인 유사화 학습 장치로서,
레이블(Label)이 있는 제1 도메인에 포함된 데이터 셋(Data Set)을 입력받아 특징 공간(Feature Space)에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 상기 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 인코더(Encoder);
상기 특징 공간 상에서, 상기 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)하여 각 그룹 별 상기 제1 특징 정보에 대한 특징값의 평균값을 산출하는 프로세서를 포함하며,
상기 프로세서는,
상기 특징 공간 상에 상기 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 상기 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 상기 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 상기 제2 특징 정보 중 적어도 일부를 상기 특징 공간 상에서 이동시키는, 클래스 의존적 도메인 유사화 학습 장치.
제1항에 있어서,
상기 프로세서는,
제1 손실 함수(L₁)의 값이 최소가 되도록 기 저장된 도메인 유사화 모델을 학습하고,
상기 제1 손실 함수(L₁)는, 제2 특징 정보 각각에 대해, 상기 평균값 각각과의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시키기 위한 함수인, 클래스 의존적 도메인 유사화 학습 장치.
제1항에 있어서,
상기 프로세서는,
제1 손실 함수(L₁), 제2 손실 함수(L₂) 및 제3 손실 함수(L₃)의 합인 총 손실 함수(L_T)의 값이 최소가 되도록 상기 도메인 유사화 모델을 학습하고,
상기 제1 손실 함수(L₁)는, 제2 특징 정보 각각에 대해, 상기 평균값 각각과의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시키기 위한 함수이며,
상기 제2 손실 함수(L₂)는, 제1 특징 정보의 레이블을 추정한 경우, 추정 정확도를 산출하는 함수이고,
상기 제3 손실 함수(L₃)는, 제1 특징 정보 및 제2 특징 정보의 도메인을 추정하고, 추정 정확도를 산출하는 함수인, 클래스 의존적 도메인 유사화 학습 장치.
제2항 또는 제3항에 있어서,
상기 제1 손실 함수(L₁)는,
i번째 제2 특징 정보(
)와 j번째 평균값(
)과의 거리에 기초하여 산출된 제1 거리 변수(
) 및 상기 제1 거리 변수(
)를 n승수 곱한 값에 기초하여 산출된 제2 거리 변수(
)에 기반하여 산출되는, 클래스 의존적 도메인 유사화 학습 장치.
제1항에 있어서,
디스플레이를 더 포함하며,
상기 프로세서는,
상기 제1 특징 정보의 그룹 별 평균값을 상기 디스플레이에 표시하고,
상기 특징 공간 상에서, 이동 전의 임베딩된 상기 제2 특징 정보를 상기 디스플레이에 출력하며,
상기 특징 공간에서 이동하는 상기 적어도 일부의 제2 특징 정보가 이동하는 방향 및 거리를 상기 디스플레이에 출력하도록 구성되는, 클래스 의존적 도메인 유사화 학습 장치.
제5항에 있어서,
상기 프로세서는,
상기 특징 공간 상에서 임베딩되어 이동하는 제2 특징 정보의 이동 방향을 화살표의 헤드(Head)로 상기 디스플레이에 출력하고, 상기 제2 특징 정보의 이동 거리에 비례한 길이를 상기 화살표의 바디(Body)로 상기 디스플레이에 출력하도록 구성되는, 클래스 의존적 도메인 유사화 학습 장치.
제5항에 있어서,
상기 프로세서는,
상기 특징 공간 상에서 이동하지 않는 제2 특징 정보를 하이라이트 표시하여 상기 디스플레이에 출력하도록 구성되는, 클래스 의존적 도메인 유사화 학습 장치.
컴퓨팅 장치에 의해 수행되는 클래스 의존적 도메인 유사화 학습 방법으로서,
레이블(Label)이 있는 제1 도메인에 포함된 데이터 셋(Data Set)을 입력받아 특징 공간(Feature Space)에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 상기 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 단계;
상기 특징 공간 상에서, 상기 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)하여 각 그룹 별 상기 제1 특징 정보의 평균값을 산출하는 단계; 및
상기 특징 공간 상에 상기 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 상기 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 상기 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 상기 제2 특징 정보 중 적어도 일부를 상기 특징 공간 상에서 이동시키는 단계를 포함하는, 클래스 의존적 도메인 유사화 학습 방법.
제8항에 있어서,
상기 제1 특징 정보의 평균값을 산출하는 단계 이후에,
제1 손실 함수(L₁)의 값이 최소가 되도록 기 저장된 도메인 유사화 모델을 학습하는 단계를 더 포함하며,
상기 제1 손실 함수(L₁)는, 제2 특징 정보 각각에 대해, 상기 평균값 각각과의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시키기 위한 함수인, 클래스 의존적 도메인 유사화 학습 방법.
제8항에 있어서,
상기 제1 특징 정보의 평균값을 산출하는 단계 이후에,
제1 손실 함수(L₁), 제2 손실 함수(L₂) 및 제3 손실 함수(L₃)의 합인 총 손실 함수(L_T)의 값이 최소가 되도록 상기 도메인 유사화 모델을 학습하는 단계를 더 포함하며,
상기 제1 손실 함수(L₁)는, 제2 특징 정보 각각에 대해, 상기 평균값 각각과의 거리 및 방향을 결정하고, 결정된 방향을 고려하여 결정된 거리가 짧은 평균값일수록 높은 가중치를 부여하여 상기 거리가 비례적으로 줄어들도록, 상기 제2 특징 정보 중 적어도 일부를 이동시키기 위한 함수이며,
상기 제2 손실 함수(L₂)는, 제1 특징 정보의 레이블을 추정한 경우, 추정 정확도를 산출하는 함수이고,
상기 제3 손실 함수(L₃)는, 제1 특징 정보 및 제2 특징 정보의 도메인을 추정하고, 추정 정확도를 산출하는 함수인, 클래스 의존적 도메인 유사화 학습 방법.
제9항 또는 제10항에 있어서,
상기 제1 손실 함수(L₁)는,
i번째 제2 특징 정보(
)와 j번째 평균값(
)과의 거리에 기초하여 산출된 제1 거리 변수(
) 및 상기 제1 거리 변수(
)를 n승수 곱한 값에 기초하여 산출된 제2 거리 변수(
)에 기반하여 산출되는, 클래스 의존적 도메인 유사화 학습 방법.
제8항에 있어서,
상기 제1 특징 정보의 그룹 별 평균값을 제1 디스플레이하는 단계;
상기 특징 공간 상에서, 이동 전의 임베딩된 상기 제2 특징 정보를 제2 디스플레이하는 단계; 및
상기 특징 공간에서 이동하는 상기 적어도 일부의 제2 특징 정보가 이동하는 방향 및 거리를 제3 디스플레이하는 단계를 더 포함하는, 클래스 의존적 도메인 유사화 학습 방법.
제12항에 있어서,
상기 제3 디스플레이하는 단계는,
상기 특징 공간 상에서 임베딩되어 이동하는 제2 특징 정보의 이동 방향을 화살표의 헤드(Head)로 디스플레이하고, 상기 제2 특징 정보의 이동 거리에 비례한 길이를 상기 화살표의 바디(Body)로 디스플레이하는 단계를 포함하는, 클래스 의존적 도메인 유사화 학습 방법.
제12항에 있어서,
상기 특징 공간 상에서 이동하지 않는 제2 특징 정보를 하이라이트 표시하여 디스플레이하는 단계를 더 포함하는, 클래스 의존적 도메인 유사화 학습 방법.
컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체에 있어서,
상기 프로그램은, 프로세서에 의한 실행 시, 상기 프로세서가,
레이블(Label)이 있는 제1 도메인에 포함된 데이터 셋(Data Set)을 입력받아 특징 공간(Feature Space)에 임베딩 가능한 하나 이상의 제1 특징 정보를 추출하고, 레이블이 없는 제2 도메인에 포함된 데이터 셋을 입력받아 상기 특징 공간에 임베딩 가능한 하나 이상의 제2 특징 정보를 추출하는 동작,
상기 특징 공간 상에서, 상기 하나 이상의 제1 특징 정보를 동일 레이블값에 기초하여 하나 이상의 그룹으로 그룹핑(Grouping)하여 각 그룹 별 상기 제1 특징 정보의 평균값을 산출하는 동작 및
상기 특징 공간 상에 상기 하나 이상의 제2 특징 정보를 임베딩하고, 임베딩된 상기 하나 이상의 제2 특징 정보의 각각 및 산출된 하나 이상의 상기 그룹 별 평균값 간의 거리 및 방향을 결정하며, 결정된 방향을 고려하여 상기 거리가 비례적으로 줄어들도록 상기 제2 특징 정보 중 적어도 일부를 상기 특징 공간 상에서 이동시키는 동작을 수행하도록 하는 실행 가능한 명령을 포함하는, 컴퓨터 판독 가능한 기록 매체.