WO2020141907A1

WO2020141907A1 - 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법

Info

Publication number: WO2020141907A1
Application number: PCT/KR2020/000063
Authority: WO
Inventors: 이한빛; 이상구; 김지훈
Original assignee: 삼성전자주식회사; 서울대학교 산학협력단
Priority date: 2019-01-04
Filing date: 2020-01-02
Publication date: 2020-07-09
Also published as: KR20200092453A

Abstract

본 개시는, 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법에 관한 것이다. 이미지 생성 장치는, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득하고, 키워드 집합에 대응되는 속성 벡터를 생성하고, 생성된 속성 벡터를 이미지 생성 모델에 입력함으로써, 특정 상품의 속성들에 대응되는 상품 이미지를 생성하고, 생성된 상품 이미지 및 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상품 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하고, 판별 결과에 기초하여, 이미지 생성 모델을 업데이트할 수 있다. 또한, 본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련될 수 있다.

Description

키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법

본 개시는 키워드에 기초하여 이미지를 생성하는 이미지 생성 장치 및 이미지 생성 방법에 관한 것이다.

인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.

인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다.

기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.

인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.

한편, 디자이너가 어떤 컨셉을 가지고 특정 상품을 디자인하는데 있어서, 해당 컨셉을 나타내는 기존에 없던 이미지가 참고할 필요가 있으며, 이에 따라, 특정 상품의 컨셉을 키워드로 입력 받아 해당 컨셉을 나타내는 새로운 이미지를 생성할 수 있는 기술이 요구되고 있다.

일부 실시예는, 특정 상품의 속성을 나타내는 키워드에 기초하여 특정 상품의 속성에 대응되는 상품 이미지를 생성할 수 있는, 이미지 생성 장치 및 방법을 제공할 수 있다.

도 1은, 일부 실시예에 따른 이미지 생성 장치(1000)가 키워드에 기초하여 이미지를 생성하는 방법을 도시한 개요도이다.

도 2는, 일부 실시예에 따른 이미지 생성 장치(1000)가 키워드에 기초하여 이미지를 생성하는 방법의 흐름도이다.

도 3은, 일부 실시예에 따른 이미지 생성 장치(1000)가 키워드에 기초하여 이미지를 생성하는 예시를 도시한 도면이다.

도 4는, 일부 실시예에 따른 이미지 생성 장치(1000)가 키워드 집합에 대응되는 속성 벡터를 생성하는 방법의 흐름도이다.

도 5는, 일부 실시예에 따른 이미지 생성 장치(1000)가 키워드 집합에 대응되는 속성 벡터를 생성하는 예시를 도시한 도면이다.

도 6은, 이미지 생성 장치(1000)가 이미지 생성의 기초가 된 키워드 집합을 고려하여, 생성된 이미지가 가짜 이미지인지 판별하는 방법의 흐름도이다.

도 7은, 이미지 생성 장치(1000)가 이미지 생성의 기초가 된 키워드 집합을 고려하여, 생성된 이미지가 가짜 이미지인지 판별하는 예시를 도시한 도면이다.

도 8은, 일부 실시예에 따른 이미지 생성 장치(1000)의 블록도이다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 개시의 제1 측면은, 하나 이상의 인스트럭션을 저장하는 메모리; 및 상기 하나 이상의 인스트럭션을 실행함으로써 상기 이미지 생성 장치를 제어하는 프로세서를 포함하며, 상기 프로세서는, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득하고, 상기 키워드 집합 내의 상기 복수의 키워드에 기초하여, 상기 키워드 집합에 대응되는 속성 벡터를 생성하고, 상기 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 상기 이미지 생성 모델로부터 출력되는, 상기 특정 상품의 속성들에 대응되는 상품 이미지를 생성하고, 상기 이미지 생성 모델로부터 출력된 상품 이미지 및 상기 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상기 상품 이미지가 상기 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하고, 상기 판별 결과에 기초하여, 상기 이미지 생성 모델을 업데이트하는, 이미지 생성 장치를 제공할 수 있다.

또한, 본 개시의 제2 측면은, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득하는 동작; 상기 키워드 집합 내의 상기 복수의 키워드에 기초하여, 상기 키워드 집합에 대응되는 속성 벡터를 생성하는 동작; 상기 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 상기 이미지 생성 모델로부터 출력되는, 상기 특정 상품의 속성들에 대응되는 상품 이미지를 생성하는 동작; 상기 이미지 생성 모델로부터 출력된 상품 이미지 및 상기 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상기 상품 이미지가 상기 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하는 동작을 포함하는, 이미지 생성 방법을 제공할 수 있다.

또한, 본 개시의 제 3 측면은, 제 2 측면의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 포함하는 컴퓨터 프로그램 장치를 제공할 수 있다.

아래에서는 첨부한 도면을 참조하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 개시의 실시예를 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

이하 첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들에 대해 설명한다.

도 1을 참조하면, 이미지 생성 장치(1000)는 특정 상품의 속성을 나타내는 키워드 또는 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는 키워드 집합을 입력 받는다. 예를 들어, 이미지 생성 장치(1000)는 의류 상품의 속성들을 나타내는 복수의 키워드를 포함하는 키워드 집합(110, 120)을 입력 받을 수 있다. 제1 키워드 집합(110)은 타이트한 스타일을 나타내는 키워드인 “Bodycon”, 및 짧은 소매를 나타내는 키워드인“Short sleeve”를 포함할 수 있다. 또한, 제2 키워드 집합(120)은 타이트한 스타일을 나타내는 키워드인 “Bodycon”, 빨간색을 나타내는 키워드인 “Red” 및 긴 소매를 나타내는 키워드인“Long sleeve”를 포함할 수 있다.

이미지 생성 장치(1000)는 입력 받은 의류 상품의 속성들을 나타내는 키워드 집합(110, 120)에 기초하여 의류 상품 이미지를 생성할 수 있다. 예를 들어, 도 1을 참조하면, 이미지 생성 장치(1000)는 제1 키워드 집합(110) 내의 키워드인‘Bodycon’ 및 ‘Short sleeve’에 대응되는 이미지로서 짧은 소매의 타이트한 스타일의 여성복 이미지들(115)을 생성할 수 있다. 또한, 이미지 생성 장치(1000)는 제2 키워드 집합(120) 내의 키워드인 “Bodycon’, “Red”, 및 “Long sleeve”에 대응되는 이미지로서 긴 소매의 타이트한 스타일의 빨간색 여성복 이미지들(125)을 생성할 수 있다.

이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 복수의 키워드를 입력 받고, 특정 상품의 속성들을 나타내는 상품 이미지들을 생성할 수 있다. 생성된 상품 이미지들은 특정 상품의 속성들에 대응되게 생성된 이미지들로서, 해당 속성들을 가지는 새로운 상품을 디자인하는데 참고가 되는 이미지들로 활용될 수 있다.

이를 위해, 이미지 생성 장치(1000)는 진짜 상품 이미지에 가까운 상품 이미지를 다양하게 생성할 필요가 있으며, 이미지 생성의 조건으로서 상품의 속성들을 나타내는 키워드 집합에 잘 부합하는 상품 이미지를 생성할 필요가 있다.

동작 210에서, 이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득할 수 있다.

특정 상품은 의류 상품, 문구 상품, 자동차 상품, 등의 상품 중 하나일 수 있다. 예를 들어, 특정 상품은 의류 상품일 수 있으며, 의류 상품은 셔츠, 니트, 바지, 등을 포함할 수 있다. 다만, 특정 상품은 전술한 의류 상품, 문구 상품, 등에 제한되지 않는다.

특정 상품의 속성은, 특정 상품을 나타내는 특징이나 성질을 의미할 수 있다. 예를 들어, 특정 상품이 의류 상품인 경우, 의류 상품의 색깔, 무늬, 소매 길이, 목 부분의 모양, 등이 특정 상품의 속성일 수 있다.

특정 상품의 속성을 나타내는 키워드는, 특정 상품의 특징이나 성질을 나타내는 키워드를 지칭할 수 있다. 예를 들어, 특정 상품이 의류 상품인 경우, 색깔 속성을 나타내는 키워드로서 “red”, “blue” 등, 소매 길이 속성을 나타내는 키워드로서 “long sleeve”, “short sleeve” 등, 무늬 속성을 나타내는 키워드로서 “floral”, “stripe” 등이 의류 상품의 속성을 나타내는 키워드일 수 있다.

키워드 집합은, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함할 수 있다. 키워드 집합 내의 복수의 키워드는 특정 상품의 속성들을 나타내므로, 키워드 집합은 키워드 집합 내의 복수의 키워드에 의해 나타내지는 특정 상품의 속성들의 조합을 나타낼 수 있다. 예를 들어, 특정 상품이 의류 상품인 경우, 의류 상품의 속성을 나타내는 키워드로서 “red”, “long sleeve”, 및 “floral”을 포함하는 키워드 집합은, “red”, “long sleeve”, 및 “floral”의 조합인 색상은 빨간 색이고, 소매 길이는 긴 소매이며, 무늬로 꽃무늬를 가지는 속성을 나타낼 수 있다.

이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 사용자로부터 입력 받을 수 있다. 예를 들어, 이미지 생성 장치(1000)는 터치 스크린, 키보드, 마우스, 등의 입력 인터페이스를 포함할 수 있다. 이미지 생성 장치(1000)는 입력 인터페이스를 통해 사용자로부터 특정 상품의 속성들을 나타내는 복수의 키워드를 입력 받을 수 있다.

또한, 이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 외부 장치로부터 수신할 수 있다. 예를 들어, 이미지 생성 장치(1000)는 외부 장치와 데이터를 송수신하기 위한 통신 인터페이스를 포함할 수 있다. 이미지 생성 장치(1000)는 통신 인터페이스를 통해 외부 장치로부터 특정 상품의 속성들을 나타내는 복수의 키워드를 수신할 수 있다.

또한, 이미지 생성 장치(1000)는 메모리에 저장된 파일에서, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는 키워드 집합을 식별할 수 있다.

동작 220에서, 이미지 생성 장치(1000)는 키워드 집합 내의 복수의 키워드에 기초하여, 키워드 집합에 대응되는 속성 벡터를 생성할 수 있다.

이미지 생성 장치(1000)는 획득한 키워드 집합 내의 복수의 키워드에 대응되는 복수의 벡터를 생성할 수 있다. 이미지 생성 장치(1000)는 생성한 복수의 벡터에 기초하여, 복수의 벡터를 포함하는 벡터 집합에 대응되는 속성 벡터를 생성할 수 있다. 여기서, 벡터 집합은 키워드 집합에 대응되므로, 속성 벡터는 키워드 집합에 대응될 수 있다. 이하 명세서 전체에서, “속성 벡터”는 키워드 집합에 대응되는 벡터로서, 후술하는 이미지 생성 모델에 입력되는 입력 노이즈 벡터를 의미할 수 있다.

속성 벡터는 키워드 집합에 대응되므로, 속성 벡터는 키워드 집합 내의 복수의 키워드가 나타내는 특정 상품의 속성들의 조합에 대응될 수 있다. 예를 들어, 키워드 집합이 특정 상품의 속성을 나타내는 키워드로서 “red”, “long sleeve”, 및 “floral”을 포함하는 경우, 속성 벡터는 키워드 집합 {“red”, “long sleeve”, “floral”}에 대응될 수 있다.

동작 220과 관련하여 이미지 생성 장치(1000)가 속성 벡터를 생성하는 자세한 동작은 도 4에 대한 내용에서 상술하도록 한다.

동작 230에서, 이미지 생성 장치(1000)는 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 이미지 생성 모델로부터 출력되는, 특정 상품의 속성들에 대응되는 상품 이미지를 생성할 수 있다.

소정의 이미지 생성 모델은, 키워드 집합에 대응되는 속성 벡터를 입력 받고, 입력된 속성 벡터에 대응되는 상품 이미지를 출력하도록, 미리 학습된 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예를 들어, CNN(Convolutional Neural Network)과 같은 모델이 이미지 생성 모델로서 사용될 수 있으나, 이에 한정되지 않는다.

이미지 생성 장치(1000)는 이미지 생성 모델을, 동작 240에서 후술하는 이미지 판별 모델과 경쟁적으로 학습시킬 수 있다. 이미지 생성 장치(1000)는, 이미지 생성 모델에서 출력된 가짜 이미지가, 가짜인지 진짜인지 이미지 판별 모델이 판별할 수 없을 정도로, 진짜 이미지와 구별이 어려운 가짜 이미지를 출력하도록 이미지 생성 모델을 학습시킬 수 있다. 또한, 이미지 생성 장치(1000)는, 이미지 생성 모델을 이용하여 생성된 가짜 이미지가 가짜인지 진짜인지 더 잘 판별할 수 있도록 이미지 판별 모델을 학습시킬 수 있다.

이와 같이 이미지 생성 장치(1000)가 이미지 생성 모델과 이미지 판별 모델을 학습시키는데 사용하는 경쟁적 학습 방법은, 인공 신경망의 일종인 GAN(Generative Adversarial Network), DCGAN(Deep Convolutional GAN), cGAN(Conditional GAN) 등의 생성자(Generator) 및 판별자(Discriminator)를 경쟁적으로 학습시키는데 이용되는 방법일 수 있으며, 이에 한정되지 않는다.

이미지 생성 장치(1000)가 이미지 생성 모델을 이용하여 생성하는 특정 상품의 속성들에 대응되는 상품 이미지는, 해당 속성들이 반영된 특정 상품을 나타내는 이미지일 수 있다. 여기서, 상품 이미지는 특정 상품을 나타내는 이미지로서, 특정 상품이 의류 상품인 경우, 드레스, 코트, 바지, 신발 등을 나타내는 이미지일 수 있다. 예를 들어, 의류 상품의 속성들이 {“red”, “long sleeve”, “floral”}과 같은 키워드 집합에 의해 나타내어지는 속성들인 경우, 이미지 생성 모델이 출력하는 의류 상품 이미지는, 색상은 빨간 색이고, 소매 길이는 긴 소매이며, 무늬로 꽃무늬를 가지는 드레스, 셔츠, 등의 의류 상품 이미지일 수 있다.

이미지 생성 모델에 입력되는 속성 벡터는, 동작 210에서 획득된 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는 키워드 집합에 대응된다. 따라서, 이미지 생성 장치(1000)는 이미지 생성 모델에 속성 벡터를 입력함으로써, 동작 210에서 획득된 복수의 키워드가 나타내는 특정 상품의 속성들에 대응되는 상품 이미지를 생성할 수 있다.

이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 서로 다른 상품 이미지를 하나 이상 생성할 수 있다. 이미지 생성 장치(1000)는 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는 하나의 키워드 집합을 획득하고, 획득된 하나의 키워드 집합에 대응되는 복수의 서로 다른 상품 이미지를 생성할 수 있다. 이미지 생성 장치(1000)가 생성한 서로 다른 상품 이미지들은 모두 하나의 키워드 집합에 대응될 수 있지만, 하나의 키워드 집합에 포함된 복수의 키워드들이 나타내는 속성들 이외의 속성들이 서로 다른 상품 이미지들일 수 있다.

예를 들어, 이미지 생성 장치(1000)는 의류 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합으로 {“red”, “long sleeve”, “floral”}를 획득하고, 색상은 빨간 색이고, 소매 길이는 긴 소매이며, 무늬로 꽃무늬를 가지는 서로 다른 의류 상품 이미지들을 생성할 수 있다. 생성된 의류 상품 이미지들은, 모두 {“red”, “long sleeve”, “floral”}가 나타내는 속성들에 대응될 수 있지만, {“red”, “long sleeve”, “floral”}가 나타내는 색상, 소매 길이, 무늬와 같은 속성들 이외의 목 부분의 모양, 의류의 전체 길이, 의류의 윤곽 스타일 등의 속성이 서로 다를 의류 상품 이미지들일 수 있다.

동작 240에서, 이미지 생성 장치(1000)는 이미지 생성 모델로부터 출력된 상품 이미지 및 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상품 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별할 수 있다.

소정의 이미지 판별 모델은, 상품 이미지를 입력 받아, 입력된 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지 특정 상품을 나타내는 진짜 이미지인지 판별하도록, 미리 학습된 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 여기서, 가짜(fake) 이미지는 이미지 생성 모델로부터 출력된 이미지를 의미할 수 있으며, 진짜(real) 이미지는 특정 상품을 나타내는 진짜 이미지로서 이미지 판별 모델에서 학습 데이터로 이용된 이미지(예를 들어, 특정 상품을 촬영한 사진과 같은 실제 상품 이미지)를 의미할 수 있다.

이미지 판별 모델로는, CNN(Convolutional Neural Network)과 같은 모델이 사용될 수 있으며, 이미지 판별 모델은 컨볼루션 연산을 이용하여 이미지로부터 특징을 추출하는 복수의 레이어를 포함할 수 있다. 이미지 판별 모델은, 복수의 레이어를 이용하여, 입력된 상품 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지를 나타내는 확률 값을, 판별 결과로 출력할 수 있다.

이미지 판별 모델이 판별 결과로서 출력하는 확률 값은, 입력된 상품 이미지가 진짜 이미지에 가까울수록 큰 값을 가질 수 있다. 즉, 이미지 판별 모델은, 입력된 상품 이미지를 진짜 이미지로 판별한 경우 판별 결과로서 '1'을 출력하고, 입력된 상품 이미지가 가짜 이미지(예를 들어, 이미지 생성 모델로부터 출력된 가짜 이미지)로 판별한 경우 판별 결과로서 '0'을 출력할 수 있다. 따라서, 이미지 판별 모델이 판별 결과로서 출력하는 확률 값은, 입력된 상품 이미지가 진짜에 가까운지의 정도를 나타내는 값일 수 있다.

이미지 생성 장치(1000)는 이미지 판별 모델에 이미지 생성 모델로부터 출력된 상품 이미지 및 특정 상품의 속성들에 대응되는 진짜 상품 이미지 중 적어도 하나 및 키워드 집합에 관한 데이터를 적용함으로써, 이미지 판별 모델을 학습시킬 수 있다. 즉, 이미지 생성 장치(1000)는 이미지 판별 모델의 학습 데이터로서 이미지 생성 모델로부터 출력된 상품 이미지 및 특정 상품의 속성들에 대응되는 실제 상품 이미지를 사용할 수 있다.

이미지 판별 모델은, 이미지 생성 모델로부터 출력된 상품 이미지 및 해당 상품 이미지에 대응되는 키워드 집합에 관한 데이터를 학습 데이터로 사용하여, 이미지 생성 모델로부터 출력되는 가짜 상품 이미지의 특징에 대해 학습할 수 있다. 또한, 이미지 판별 모델은, 특정 상품의 속성들에 대응되는 진짜 상품 이미지 및 해당 상품 이미지에 대응되는 키워드 집합에 관한 데이터를 학습 데이터로 사용하여, 진짜 이미지의 특징에 대해 학습할 수 있다.

또한, 전술한 바와 같이, 이미지 판별 모델은 이미지 생성 장치(1000)에 의해 이미지 생성 모델과 함께 경쟁적으로 학습될 수 있다. 경쟁적 학습을 이미지 판별 모델이 판별 결과로서 출력하는 확률 값과 연관시켜 설명하면, 이미지 판별 모델은 입력 받은 이미지 생성 모델로부터 출력된 상품 이미지에 대해 판별 결과로서 '0'을 출력하도록 학습되고, 반대로 이미지 생성 모델은 이미지 생성 모델로부터 출력된 상품 이미지에 대해 이미지 판별 모델이 판별 결과로서 '1'을 출력하도록 진짜 이미지에 가까운 상품 이미지를 출력하도록 학습될 수 있다.

이미지 판별 모델은, 판별을 하는데 있어서 키워드 집합에 관한 데이터를 이용할 수 있다. 여기서 키워드 집합은, 이미지 생성 모델이 상품 이미지를 출력하기 위해 입력 받은 속성 벡터에 대응되는 키워드 집합으로서, 이미지 판별 모델이 입력 받은 상품 이미지에 대응되는 키워드 집합일 수 있다. 이미지 판별 모델은 키워드 집합에 관한 데이터를 입력 받음으로써, 입력된 상품 이미지가 이미지 생성 모델에서 출력된 가짜 이미지인지를 판별하는데 있어, 키워드 집합이 나타내는 특정 상품의 속성들을 고려할 수 있다. 예를 들어, 특정 상품이 의류 상품이고, 키워드 집합이 {“red”, “long sleeve”, “floral”}인 경우, 이미지 판별 모델은 입력 받은 의류 상품 이미지의 속성 중 색상, 소매 길이, 무늬에 집중하여 이미지의 진위 여부를 판별할 수 있다.

이미지 판별 모델이 판별을 하는데 있어서 이용하는 키워드 집합에 관한 데이터는, 키워드 집합을 처리하여 생성한 데이터를 의미할 수 있다. 예를 들어, 키워드 집합에 관한 데이터는, 소정의 임베딩 모델에 키워드 집합을 입력하고, 임베딩 모델로부터 출력되는 키워드 집합에 대응되는 벡터 집합을 포함할 수 있다. 또한, 키워드 집합에 관한 데이터는, 키워드 집합에 대응되는 벡터 집합을 처리하여 생성한 데이터를 포함할 수 있다. 이미지 모델이 키워드 집합에 관한 데이터를 판별에 이용하는 구체적인 동작은, 도 6에 대한 내용에서 상술하도록 한다.

동작 250에서, 이미지 생성 장치(1000)는 판별 결과에 기초하여, 이미지 생성 모델을 업데이트할 수 있다.

이미지 생성 장치(1000)는 이미지 생성 모델로부터 출력된 상품 이미지를 이미지 판별 모델에 입력함으로써, 입력된 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지 특정 상품에 관한 진짜 이미지인지 판별할 수 있고, 판별 결과를 이미지 생성 모델에 역전파(back propagation) 할 수 있다. 이미지 생성 장치(1000)는 이미지 생성 모델이 출력한 상품 이미지에 대한 이미지 판별 모델의 판별 결과에 기초하여, 이미지 생성 모델이 진짜 이미지에 가까운 상품 이미지를 출력할 수 있도록 이미지 생성 모델의 기반이 되는 신경망의 웨이트(weight) 값을 조절함으로써, 이미지 생성 모델을 업데이트할 수 있다.

도 3을 참조하면, 이미지 생성 장치(1000)는 의류 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합(310)을 획득할 수 있다. 키워드 집합(310)은 “v neck”, “long sleeve”, “floral”, 및 “white”를 의류 상품의 속성을 나타내는 키워드로서 포함한다. 이미지 생성 장치(1000)는 키워드 집합(310)을, 입력 인터페이스를 통한 사용자 입력, 통신 인터페이스를 통해 외부 장치로부터 수신된 데이터, 메모리에 저장된 파일에서 식별된 데이터 등을 통해 획득할 수 있다.

이미지 생성 장치(1000)는 획득한 키워드 집합(310) 내의 복수의 키워드에 기초하여, 키워드 집합(310)에 대응되는 속성 벡터(320)를 생성할 수 있다. 이미지 생성 장치(1000)는 생성된 속성 벡터(320)를 이미지 생성 모델(330)에 입력함으로써, 이미지 생성 모델로부터 출력되는 상품 이미지(340)를 생성할 수 있다. 이미지 생성 모델(330)로부터 출력되는 상품 이미지(340)는, 키워드 집합(310) 내의 복수의 키워드에 대응되는 의류 상품의 속성들에 대응될 수 있다.

예를 들어, 도 3을 참조하면, 목 부분이 브이 넥(v neck)이고, 소매 길이가 긴 소매(long sleeve)이고, 꽃(floral) 무늬를 가지며, 색상은 흰색(white)인 드레스 이미지가, 키워드 집합(310)에 대응되는 상품 이미지(340)로서 이미지 생성 모델(330)로부터 출력되었다.

이미지 생성 장치(1000)는 이미지 생성 모델(330)로부터 출력된 상품 이미지(340) 및 키워드 집합(310)에 관한 데이터(315)를, 이미지 판별 모델(350)에 입력함으로써, 상품 이미지(340)가 이미지 생성 모델(330)로부터 출력된 가짜 이미지인지를 판별할 수 있다. 이미지 판별 모델(350)은 판별 결과(360)로서 입력된 상품 이미지(340)가 이미지 생성 모델(330)로부터 출력된 가짜 이미지인지를 나타내는 확률 값을 판별 결과(360)로서 출력할 수 있다. 예를 들어, 이미지 판별 모델(350)은 판별 결과(360)로서 0.68을 출력할 수 있다. 출력된 확률 값 0.68은 0.5보다 크므로, 출력 결과(360)는 입력된 상품 이미지(340)가 이미지 생성 모델(330)로부터 출력된 가짜 이미지보다는 진짜 상품 이미지에 가까운 것으로 이미지 판별 모델(350)에서 판단되었음을 나타낸다.

이미지 판별 모델(350)은, 키워드 집합에 관한 데이터(315)를 입력 받음으로써, 입력된 상품 이미지(340)가 이미지 생성 모델(330)로부터 출력된 가짜 이미지인지를 판별하는데 있어, 키워드 집합(310)이 나타내는 특정 상품의 속성들을 고려할 수 있다. 이미지 판별 모델(350)은 키워드 집합(310) {“v neck”, “long sleeve”, “floral”, “white”}이 나타내는 의류 상품의 속성들에 집중하여 입력된 상품 이미지(340)가 이미지 생성 모델(330)로부터 출력된 가짜 상품 이미지인지 진짜 상품 이미지인지 여부를 판별할 수 있다.

이미지 생성 장치(1000)는 판별 결과(360)에 기초하여, 이미지 생성 모델(330)을 업데이트할 수 있다. 예를 들어, 이미지 생성 장치(1000)는 판별 결과(360)를 이미지 생성 모델(330)에 역전파(back propagation)할 수 있다. 이미지 생성 장치(1000)는, 판별 결과(360)에 기초하여, 이미지 생성 모델(330)이 진짜 이미지에 가까운 상품 이미지를 출력할 수 있도록 이미지 생성 모델(330)의 기반이 되는 신경망의 웨이트 값을 조절함으로써, 이미지 생성 모델(330)을 업데이트할 수 있다.

동작 410에서, 이미지 생성 장치(1000)는 소정의 임베딩 모델을 이용하여, 키워드 집합에 대응되는 벡터 집합을 생성할 수 있다.

이미지 생성 장치(1000)는 키워드 집합 내의 복수의 키워드를 소정의 임베딩 모델에 입력함으로써, 임베딩 모델로부터 출력되는, 복수의 키워드에 대응되는 복수의 벡터를 생성할 수 있다. 생성된 복수의 벡터는, 키워드 집합에 대응되는 벡터 집합을 구성할 수 있다.

이미지 생성 장치(1000)는 복수의 키워드에 포함되는 키워드 각각에 대해 대응되는 벡터를 생성함으로써, 복수의 키워드에 대응되는 복수의 벡터를 생성할 수 있다. 예를 들어, 키워드 집합이 {“red”, “long sleeve”, “floral”}인 경우, 이미지 생성 장치(1000)는 “red”에 대응되는 벡터 a ₁, “long sleeve”에 대응되는 벡터 a ₂, 및 “floral”에 대응되는 벡터 a ₃를 각각 생성할 수 있다.

소정의 임베딩 모델은, 특정 상품의 속성을 나타내는 키워드를 입력 받고, 입력된 키워드에 대응되는 벡터를 출력하도록 미리 학습된 모델일 수 있다. 예를 들어, 임베딩 모델은, 미리 학습된 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예를 들어, CNN(Convolutional Neural Network), DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 임베딩 모델로서 사용될 수 있으나, 이에 한정되지 않는다.

임베딩 모델은, 특정 상품의 속성을 나타내는 상품 이미지에 대응되는 벡터와, 특정 상품의 속성들을 나타내는 키워드 집합에 대응되는 벡터 집합 내의 복수의 벡터을 산술 평균한 벡터가, 벡터 공간 상에서 유사하게 위치되도록 미리 학습된 모델일 수 있다.

동작 420에서, 이미지 생성 장치(1000)는 생성된 벡터 집합 내의 복수의 벡터에 기초하여, 벡터 집합에 대응되는 속성 가우시안 분포를 생성할 수 있다.

이미지 생성 장치(1000)는 벡터 집합에 대응되는 가우시안 분포 집합을 생성할 수 있다. 생성된 가우시안 분포 집합은, 벡터 집합 내의 복수의 벡터에 대응되는 복수의 가우시안 분포를 포함할 수 있다.

이미지 생성 장치(1000)는 벡터 집합 내의 복수의 벡터에 포함되는 벡터 각각에 대해 대응되는 가우시안 분포를 생성함으로써, 복수의 벡터에 대응되는 복수의 가우시안 분포를 생성할 수 있다. 예를 들어, 벡터 집합이 {a ₁, a ₂, a ₃}인 경우, 이미지 생성 장치(1000)는 a ₁에 대응되는 가우시안 분포 b ₁, a ₂에 대응되는 가우시안 분포 b ₂, 및 a ₃에 대응되는 가우시안 분포 b ₃를 각각 생성할 수 있다.

이미지 생성 장치(1000)는 소정의 가우시안 분포 맵핑 모델에, 벡터를 입력함으로써, 가우시안 분포 맵핑 모델로부터 출력되는, 입력한 벡터에 대응되는 가우시안 분포를 생성할 수 있다. 가우시안 분포 맵핑 모델은, 벡터를 입력 받고, 입력된 벡터에 대응되는, 가우시안 분포를 나타내는 평균 벡터 및 분산(예를 들어, 공분산 행렬(covariance matrix))을 출력하도록 미리 학습된 모델일 수 있다. 가우시안 분포 맵핑 모델은, 미리 학습된 신경망을 기반으로 하는 모델일 수 있다.

이미지 생성 장치(1000)는 벡터 집합에 대응되는 가우시안 분포 집합 내의 복수의 가우시안 분포에 기초하여, 키워드 집합에 대응되는 속성 가우시안 분포를 생성할 수 있다. 이미지 생성 장치(1000)는 복수의 가우시안 분포에 포함된 각각의 가우시안 분포를 나타내는 평균 벡터 각각 및 분산 각각에 기초하여, 속성 가우시안 분포를 나타내는 평균 벡터 및 분산을 계산함으로써, 속성 가우시안 분포를 생성할 수 있다. 예를 들어, 복수의 가우시안 분포가 가우시안 분포 b ₁, 가우시안 분포 b ₂, 및 가우시안 분포 b ₃를 포함하는 경우, 평균 벡터 c ₁ 및 분산 d ₁ 은 b ₁을 나타내고, 평균 벡터 c ₂ 및 분산 d ₂는 b ₂을 나타내며, 평균 벡터 c ₁ 및 분산 d ₁는 b ₁을 나타낼 수 있다. 이미지 생성 장치는 복수의 가우시안 분포를 나타내는 평균 벡터들(c ₁, c ₂, c ₃) 및 분산들(d ₁, d ₂, d ₃)에 기초하여 속성 가우시안 분포를 나타내는 평균 벡터 및 분산을 계산할 수 있다.

이미지 생성 장치(1000)는 가우시안 곱(product of Gaussian) 연산을 이용하여 속성 가우시안 분포를 생성할 수 있다. 여기서, 가우시안 곱 연산은 다음의 [수학식 1]로 정의될 수 있다.

[수학식 1]

[수학식 1]에서, μ _i은, 가우시안 분포 집합 내의 임의의 가우시안 분포의 평균 벡터를 의미할 수 있다. 또한, σ _i는 가우시안 분포 집합 내의 임의의 가우시안 분포의 공분산 행렬을 의미할 수 있다. μ는, 속성 가우시안 분포의 평균 벡터를 의미할 수 있다. σ는 속성 가우시안 분포의 공분산 행렬을 의미할 수 있다.

이미지 생성 장치(1000)는, [수학식 1]로 정의되는 가우시안 곱 연산에 가우시안 분포 집합 내의 가우시안 분포의 평균 벡터 및 공분산 행렬을 입력함으로써, [수학식 1]로부터 출력되는, 속성 가우시안 분포의 평균 벡터 및 공분산 행렬을 획득할 수 있다.

동작 430에서, 이미지 생성 장치(1000)는 속성 가우시안 분포에 기초하여, 키워드 집합에 대응되는 속성 벡터를 생성할 수 있다.

이미지 생성 장치(1000)는 속성 가우시안 분포로부터 속성 벡터를 샘플링 함으로써, 키워드 집합에 대응되는 속성 벡터를 생성할 수 있다. 속성 벡터는 입력 노이즈 벡터로서 이미지 생성 모델에 입력되어, 키워드 집합이 나타내는 특정 상품의 속성들에 대응되는 상품 이미지를 생성하는데 이용될 수 있다.

도 5를 참조하면, 이미지 생성 장치(1000)는 의류 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합(510)을 획득할 수 있다. 키워드 집합(510)은 의류 상품의 속성을 나타내는 키워드로서 v-neck(512), long sleeve(514), floral(516), 및 white(518)을 포함한다.

이미지 생성 장치(1000)는 소정의 임베딩 모델을 이용하여, 키워드 집합(510)에 대응되는 벡터 집합(520)을 생성할 수 있다. 임베딩 모델은 의류 상품의 속성을 나타내는 키워드를 입력 받고, 입력된 키워드에 대응되는 벡터를 출력하도록 미리 학습된 모델일 수 있다. 이미지 생성 장치(1000)는 키워드 집합(510)을 임베딩 모델에 입력함으로써, 키워드 집합(510) 내의 키워드 각각에 대응되는 벡터를 생성할 수 있다.

예를 들어, 도 5를 참조하면, 이미지 생성 장치(1000)는 키워드 집합(510) 내의 키워드인 v-neck(512), long sleeve(514), floral(516), 및 white(518)을 임베딩 모델에 입력함으로써, v-neck(512)에 대응되는 벡터 a ₁(522), long sleeve(514)에 대응되는 벡터 a ₂(524), floral(516)에 대응되는 벡터 a ₃(526), 및 white(518)에 대응되는 벡터 a ₄(528)을 생성할 수 있다.

이미지 생성 장치(1000)는 벡터 집합(520)에 대응되는 가우시안 분포 집합(530)을 생성할 수 있다. 이미지 생성 장치(1000)는 소정의 가우시안 분포 맵핑 모델에 벡터 집합(520)을 입력함으로써, 가우시안 분포 맵핑 모델로부터 출력되는, 가우시안 분포 집합(530)을 생성할 수 있다. 생성된 가우시안 분포 집합(530) 내의 가우시안 분포들(532, 534, 536, 538) 각각은 벡터 집합(520) 내의 벡터들(522, 524, 526, 528) 각각에 대응될 수 있다.

이미지 생성 장치(1000)는 가우시안 분포 집합(530) 내의 복수의 가우시안 분포에 기초하여, 키워드 집합(510)에 대응되는 속성 가우시안 분포(540)를 생성할 수 있다. 이미지 생성 장치(1000)는 전술한 [수학식 1]로 정의될 수 있는 가우시안 곱 연산을 이용하여, 속성 가우시안 분포(540)를 생성할 수 있다.

이미지 생성 자치(1000)는 생성된 속성 가우시안 분포(540)로부터 속성 벡터(550)를 샘플링함으로써, 키워드 집합(510)에 대응되는 속성 벡터(550)를 생성할 수 있다. 생성된 속성 벡터(550)는 입력 노이즈 벡터로서 이미지 생성 모델(330)에 입력되어, 키워드 집합(510)이 나타내는 의류 상품의 속성들에 대응되는 상품 이미지(340)를 생성하는데 이용될 수 있다.

이미지 생성 장치(1000)는 가우시안 곱 연산을 이용하여 키워드 집합에 대응되는 속성 벡터를 생성하고, 속성 벡터를 이미지 생성 모델에 입력하는 입력 노이즈 벡터로 이용할 수 있다. 이를 통해, 이미지 생성 장치(1000)는 키워드 집합에 대응되는 상품 이미지를 다양하게 생성할 수 있다.

동작 610에서, 이미지 생성 장치(1000)는 이미지 판별 모델에 포함된 복수의 레이어 중 제1 레이어로부터 출력되는, 제1 이미지를 식별할 수 있다. 여기서, 제1 이미지는 복수의 영역으로 구성될 수 있다.

이미지 판별 모델은, 컨볼루션 연산을 이용하여 이미지로부터 특징을 추출하는 복수의 레이어를 포함할 수 있다. 복수의 레이어는 CNN(Convolutional Neural Network)을 구성하는 복수의 컨볼루션 레이어일 수 있다. 여기서 컨볼루션 레이어는 입력된 이미지를 컨볼루션 연산을 이용하여 다운 샘플링함으로써, 입력된 이미지에 대한 특징들을 추출할 수 있다. 컨볼루션 연산을 이용한 특징 추출을 하기 위해 특징 추출을 위한 필터가 사용될 수 있으며, 컨볼루션 연산 과정에서 필터가 입력된 이미지의 특정 영역에 적용됨으로써 해당 영역에 대응되는 특징이 추출될 수 있다.

컨볼루션 레이어는 추출된 특징들을 나타내는 이미지를 출력할 수 있으며, 출력된 이미지는 컨볼루션 연산에 이용되는 필터의 개수에 따라, 복수의 특징 맵(feature map)의 조합으로 구성될 수 있다. 복수의 특징 맵에 포함된 특징 맵 각각은 소정 개수의 복수의 영역으로 구성될 수 있으며, 특징 맵의 복수의 영역에 포함된 영역 각각은 추출된 특징을 나타내는 숫자에 대응될 수 있다. 따라서, 컨볼루션 레이어로부터 출력되는 이미지는, 소정 개수의 복수의 영역으로 구성될 수 있으며, 복수의 영역에 포함된 영역 각각은 추출된 특징을 나타내는 숫자들의 n 차원 특징 벡터에 대응될 수 있다. 여기서 n 차원은, 컨볼루션 레이어에서 출력된 이미지를 구성하는 특징 맵의 개수일 수 있다.

이와 같이, 컨볼루션 레이어로부터 출력되는 이미지는, 이미지를 구성하는 복수의 영역에 대응되는 복수의 특징 벡터들로 정의될 수 있다. 이하에서, 이미지 판별 모델에 포함된 복수의 레이어 중 제1 레이어로부터 출력되는 특징 맵의 조합을 제1 이미지로 지칭하도록 하며, 제1 이미지는 제1 이미지를 구성하는 복수의 영역에 대응되는 복수의 특징 벡터들로 정의될 수 있다.

이미지 생성 장치(1000)는 이미지 판별 모델에 포함된 복수의 레이어 중 제1 레이어로부터 출력되는, 제1 이미지를 식별함으로써, 제1 이미지를 구성하는 복수의 영역에 대응되는 복수의 특징 벡터를 식별할 수 있다.

동작 620에서, 이미지 생성 장치(1000)는 키워드 집합에 대응되는 벡터 집합 내의 복수의 벡터 및 제1 이미지 내의 복수의 영역에 대응되는 복수의 특징 벡터에 기초하여, 제1 이미지 내의 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성할 수 있다.

이미지 생성 장치(1000)는 키워드 집합에 대응되는 벡터 집합 내의 복수의 벡터 및 제1 이미지 내의 복수의 영역에 대응되는 복수의 특징 벡터를 소정의 함수에 입력함으로써, 제1 이미지 내의 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성할 수 있다. 여기서, 벡터 집합 내의 복수의 벡터는, 사영 행렬(projection matrix)을 이용하여 복수의 특징 벡터에 포함된 특징 벡터들의 차원으로 사영된 채로, 소정의 함수에 입력될 수 있다.

복수의 가중치 계수 집합을 생성하기 위한, 소정의 함수는 소프트 맥스(soft max) 함수를 포함할 수 있으며, 복수의 가중치 계수 집합은 다음의 [수학식 2]로 나타내어지는 소프트 맥스 함수를 이용하여 생성될 수 있다.

[수학식 2]

[수학식 2]에서, h _j는 제1 이미지 내의 복수의 영역 중 임의의 영역에 대응되는 특징 벡터를 의미할 수 있다. a _i ^'는 사영된 벡터 집합 내의 복수의 사영된 벡터 중 임의의 사영된 벡터를 의미할 수 있다. [수학식 2]에서 지수 함수에 입력되는 h _j _·a _i ^'는, h _j와 a _i ^'의 내적을 의미할 수 있다. 또한, K는 벡터 집합에 포함된 벡터의 개수를 의미할 수 있다. α _ji는 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 중 h _j에 대응되는 제1 이미지 내의 영역에 대응되는, 가중치 계수 집합을 의미할 수 있다. 각각의 가중치 계수 집합은 벡터 집합에 포함된 벡터의 개수만큼 가중치 계수를 포함할 수 있다.

복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각은, 제1 이미지 내의 복수의 영역에 포함된 영역 각각에 대응될 수 있다. 따라서, 가중치 계수 집합은 제1 이미지 내의 복수의 영역에 포함된 영역의 개수만큼 생성될 수 있다.

전술한 동작 620에 대한 설명에서, 이미지 생성 장치(1000)가 복수의 가중치 계수 집합을 생성하기 위한 함수로서 소프트 맥스 함수를 사용하는 예시를 설명하였으나, 소정의 함수는 소프트 맥스 함수에 한정되지 않는다.

동작 630에서, 이미지 생성 장치(1000)는 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합에 적용함으로써, 제1 이미지 내의 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득할 수 있다.

이미지 생성 장치(1000)는 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합 내의 벡터 각각에 적용하여, 벡터 집합 내의 복수의 벡터를 가중 합(weighted sum)할 수 있다. 이미지 생성 장치(1000)는 복수의 가중치 계수 집합에 기초하여 벡터 집합 내의 복수의 벡터의 가중 합함으로써, 제1 이미지 내의 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득할 수 있다. 여기서, 가중 합 되는 벡터 집합 내의 벡터는, 사영 행렬(projection matrix)을 이용하여 복수의 특징 벡터에 포함된 특징 벡터들의 차원으로 사영된 채로 가중 합 될 수 있다.

사영된 벡터 집합 내의 복수의 사영된 벡터는 다음의 [수학식 3]을 이용해 가중 합 될 수 있다.

[수학식 3]

[수학식 3]에서, α _ji, a _i ^', K는 전술한 [수학식 2]의 α _ji, a _i ^', K에 각각 대응될 수 있다. 또한, [수학식 3]에서 c _j는, 제1 이미지 내의 복수의 영역 중 임의의 영역에 대응되는 컨텍스트 벡터를 의미할 수 있다.

생성된 복수의 컨텍스트 벡터는, 특정 상품의 속성들을 나타내는 키워드 집합에 대응되는 벡터 집합 및 제1 이미지의 복수의 특징 벡터에 기초하여 생성된 데이터로서, 키워드 집합이 나타내는 특정 상품의 속성들에 관한 정보가 반영된 데이터일 수 있다.

동작 640에서, 이미지 생성 장치(1000)는 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킴으로써 획득되는 제2 이미지를, 복수의 레이어 중 제2 레이어에 입력할 수 있다.

이미지 생성 장치(1000)는 생성된 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킬 수 있다. 여기서, 연결은 복수의 벡터를 컨케트네이트(concatenate)하여 하나의 벡터로 결합 시키는 것을 의미할 수 있다. 예를 들어, 두 개의 벡터의 연결은, 두 개의 벡터 중 하나의 벡터(n차원)를 나머지 벡터(m차원)와 결합하여, n+m 차원의 벡터를 생성하는 것을 의미할 수 있다.

이미지 생성 장치(1000)는 컨텍스트 벡터를 대응되는 특징 벡터와 연결시킬 수 있다. 컨텍스트 벡터와 특징 벡터는 각각 제1 이미지 내의 복수의 영역 중 하나의 영역에 대응될 수 있으며, 같은 영역에 대응되는 컨텍스트 벡터와 특징 벡터는 서로 대응될 수 있다. 예를 들어, 제1 이미지 내의 복수의 영역 중 하나의 영역에 대응되는 컨텍스트 벡터 c _j와 특징 벡터 h _j는 서로 대응되며, 이미지 생성 장치(1000)는 c _j와 h _j를 연결시킬 수 있다.

이미지 생성 장치(1000)는 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킴으로써, 제2 이미지를 획득할 수 있다. 제2 이미지는, 제1 이미지에 대응되는 특징 벡터들의 집합에, 벡터 집합에 기초하여 생성된 컨텍스트 벡터 집합이 연결된 이미지로서, 제1 이미지에 키워드 집합이 나타내는 특정 상품의 속성들이 반영된 이미지일 수 있다.

이미지 생성 장치(1000)는 제2 이미지를 이미지 판별 모델의 복수의 레이어 중 제2 레이어에 입력할 수 있다. 제2 레이어는, 이미지 판별 모델의 복수의 레이어 중, 제1 레이어에서 출력되는 제1 이미지 또는 제1 이미지를 처리한 이미지를 입력 받는, 제1 레이어에 연속된 레이어일 수 있다. 제2 레이어는, 키워드 집합에 관한 데이터에 기초하여 제1 이미지를 처리한 이미지로서, 키워드 집합이 나타내는 특정 상품의 속성들이 반영된 제2 이미지를 입력 받을 수 있고, 입력된 제2 이미지에 대한 특징들을 추출할 수 있다. 따라서, 제2 레이어 이후의 레이어에서는 키워드 집합이 나타내는 특정 상품의 속성들이 반영된 채로 특징 추출 과정이 진행될 수 있다. 따라서, 이미지 판별 모델을 이용하여 입력된 상품 이미지가 이미지 생성 모델에서 출력된 가짜 이미지인지를 판별하는데 있어, 키워드 집합이 나타내는 특정 상품의 속성들을 고려될 수 있다. 이미지 생성 장치(1000)는 상품 이미지와 함께 키워드 집합에 관한 데이터를 이미지 판별 모델에 입력함으로써, 이미지 생성의 기초가 된 키워드 집합이 나타내는 특정 상품의 속성들이 고려된 판별 결과를 획득할 수 있다.

전술한 도 6에 대한 설명에서, 도 6의 동작들은, 이미지 생성 장치(1000)가 직접 수행하는 동작들로 기재되었으나 이에 한정되지 않으며, 이미지 생성 장치(1000)가 상품 이미지 및 키워드 집합에 관한 데이터를 이미지 판별 모델에 입력함으로써, 이미지 판별 모델에서 수행되는 동작들일 수도 있다.

도 7을 참조하면, 이미지 생성 장치(1000)는 이미지 생성 모델(330)로부터 출력된 상품 이미지(710)가 가짜 이미지인지를 판별하기 위해, 이미지 판별 모델(700)에 상품 이미지(710)를 입력할 수 있다. 이미지 판별 모델(700)에 입력된 상품 이미지(710)는 이미지 판별 모델(700)에 포함된 복수의 레이어(702) 중 첫번째 레이어에 입력될 수 있다.

이미지 생성 장치(1000)는 상품 이미지(710) 생성의 기초가 된 키워드 집합(730)에 관한 데이터로서, 키워드 집합(730)에 대응되는 벡터 집합(740)을 이미지 판별 모델(700)에 입력할 수 있다.

이미지 생성 장치(1000)는 이미지 판별 모델(700) 내의 복수의 레이어(702) 중 제1 레이어(704)로부터 출력되는 제1 이미지(720)를 식별할 수 있다. 여기서, 제1 이미지(720)는 복수의 영역으로 구성될 수 있으며, 복수의 영역에 포함된 영역 각각은 제1 레이어(704)에 입력된 이미지로부터 추출된 특징을 나타내는 특징 벡터에 대응될 수 있다.

이미지 생성 장치(1000)는 벡터 집합(740) 내의 복수의 벡터 및 제1 이미지(720) 내의 복수의 영역에 대응되는 복수의 특징 벡터에 기초하여, 제1 이미지(720) 내의 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성(750)할 수 있다. 복수의 가중치 계수 집합은 소프트 맥스에 기초한 소정의 함수에 벡터 집합 내의 복수의 벡터 및 제1 이미지(720) 내의 복수의 영역에 대응되는 복수의 특징 벡터를 입력함으로써 생성될 수 있다.

이미지 생성 장치(1000)는 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합(740)에 적용함으로써, 제1 이미지(720) 내의 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득(760)할 수 있다. 여기서, 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합(740)에 적용하는 것은, 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합 내의 벡터 각각에 적용하여, 벡터 집합 내의 복수의 벡터를 가중합(weighted sum)하는 것일 수 있다.

이미지 생성 장치(1000)는 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 제1 이미지(720)의 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결(770)시킴으로써 제2 이미지(780)를 획득할 수 있다. 여기서, 연결(770)은 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 제1 이미지(720)의 복수의 특징 벡터에 포함된 특징 벡터 각각과 대응되게 컨케트네이트하는 것일 수 있다.

이미지 생성 장치(1000)는 획득된 제2 이미지(780)를 이미지 판별 모델(700)의 복수의 레이어(702) 중 제1 레이어(704)에 연속되는 제2 레이어(706)에 입력할 수 있다. 제2 이미지(780)를 입력 받은 제2 레이어(706)는, 키워드 집합(730)이 나타내는 특정 상품의 속성들이 반영된 제2 이미지로부터 특징들을 추출하여 제3 이미지를 출력할 수 있고, 제3 이미지는 이미지 판별 모델의 복수의 레이어를 통해 처리될 수 있다.

따라서, 이미지 생성 장치(1000)는 상품 이미지(710)와 함께 키워드 집합에 관한 데이터로서 벡터 집합(740)을 이미지 판별 모델(700)에 입력함으로써, 상품 이미지(710) 생성의 기초가 된 키워드 집합(730)이 나타내는 특정 상품의 속성들이 고려된 판별 결과(790)를 획득할 수 있다.

전술한 도 7에 대한 설명에서, 도 7의 동작들은, 이미지 생성 장치(1000)가 직접 수행하는 동작들로 기재되었으나 이에 한정되지 않으며, 이미지 생성 장치(1000)가 상품 이미지 및 키워드 집합에 관한 데이터를 이미지 판별 모델에 입력함으로써, 이미지 판별 모델에서 수행되는 동작들일 수도 있다.

도 8을 참조하면, 이미지 생성 장치(1000)는 메모리(1100), 입력 인터페이스(1200), 출력 인터페이스(1300), 및 프로세서(1400)를 포함할 수 있다.

메모리(1100)는 이미지 생성 장치(1000)의 동작을 제어하기 위한 프로그램을 저장할 수 있다. 메모리(1100)는 이미지 생성 장치(1000)의 동작을 제어하기 위한 적어도 하나의 인스트럭션을 포함할 수 있다. 또한, 메모리(1100)는, 예를 들어, 이미지를 생성하는데 이용될 수 있는 키워드 집합 데이터, 벡터 집합 데이터, 특정 상품의 이미지 데이터 등을 저장할 수 있다. 메모리(1100)는, 예를 들어, 키워드에 기초하여 이미지를 생성하기 위한 이미지 생성 모델, 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하는 이미지 판별 모델, 등을 저장할 수 있다. 메모리(1100)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류될 수 있다.

메모리(1100)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.

입력 인터페이스(1200)는, 특정 상품의 속성을 나타내는 키워드를 입력하는 사용자 입력을 수신할 수 있다. 예를 들어, 입력 인터페이스(1200) 는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등을 포함할 수 있으나 이에 한정되는 것은 아니다.

입력 인터페이스(1200)는, 특정 상품의 속성을 나타내는 키워드가 포함된 데이터를 외부 장치로부터 수신할 수 있다. 예를 들어, 입력 인터페이스(1200)는 외부 장치로부터 데이터를 수신할 수 있는 통신 인터페이스를 포함할 수 있다.

입력 인터페이스(1200)에 포함되는 통신 인터페이스는, 외부 장치와의 통신을 위한 하나 이상의 통신 모듈을 포함할 수 있다. 통신 인터페이스는 근거리 통신 인터페이스(short-range wireless communication interface)는, 블루투스 통신 인터페이스, BLE(Bluetooth Low Energy) 통신 인터페이스, 근거리 무선 통신 인터페이스(Near Field Communication interface), WLAN(와이파이) 통신 인터페이스, 지그비(Zigbee) 통신 인터페이스, 적외선(IrDA, infrared Data Association) 통신 인터페이스, WFD(Wi-Fi Direct) 통신 인터페이스, UWB(ultra wideband) 통신 인터페이스, Ant+ 통신 인터페이스 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.

출력 인터페이스(1300)는 이미지 생성 장치(1000)가 키워드에 기초하여 생성한 이미지, 이미지 판별 모델로부터 출력되는 판별 결과, 등을 출력할 수 있다. 출력 인터페이스(1300)는 디스플레이를 포함할 수 있다. 디스플레이는 이미지 또는 키워드 정보를 출력한다. 한편, 디스플레이와 터치패드가 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 예를 들어, 출력 인터페이스(1300)는 외부 장치에게 데이터를 송신할 수 있는 통신 인터페이스를 포함할 수 있다. 입력 인터페이스(1200) 및 출력 인터페이스(1300)는 하나의 인터페이스로 구현될 수도 있다.

프로세서(1400)는, 통상적으로 이미지 생성 장치(1000)의 전반적인 동작을 제어할 수 있다. 예를 들어, 프로세서(1400)는, 메모리(1100)에 저장된 프로그램들을 실행함으로써, 입력 인터페이스(1200) 및 출력 인터페이스(1300)를 전반적으로 제어할 수 있다. 프로세서(1400)는 입력 인터페이스(1200) 및 출력 인터페이스(1300)를 제어함으로써, 도 1 내지 도 7에서의 이미지 생성 장치(1000)의 동작을 제어할 수 있다.

프로세서(1400)는, 특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득할 수 있다. 프로세서(1400)는 키워드 집합 내의 복수의 키워드에 기초하여, 키워드 집합에 대응되는 속성 벡터를 생성할 수 있다. 프로세서(1400)는 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 이미지 생성 모델로부터 출력되는, 특정 상품의 속성들에 대응되는 상품 이미지를 생성할 수 있다. 프로세서(1400)는 이미지 생성 모델로부터 출력된 상품 이미지 및 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상품 이미지가 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별할 수 있다. 프로세서(1400)는 판별 결과에 기초하여, 이미지 생성 모델을 업데이트할 수 있다.

프로세서(1400)는, 소정의 임베딩 모델을 이용하여, 키워드 집합에 대응되는 벡터 집합을 생성할 수 있다. 프로세서(1400)는, 생성된 벡터 집합 내의 복수의 벡터에 기초하여, 벡터 집합에 대응되는 속성 가우시안 분포를 생성할 수 있다. 프로세서(1400)는, 속성 가우시안 분포에 기초하여, 키워드 집합에 대응되는 속성 벡터를 생성할 수 있다.

프로세서(1400)는, 키워드 집합 내의 복수의 키워드를 임베딩 모델에 입력함으로써, 임베딩 모델로부터 출력되는, 복수의 키워드에 대응되는 복수의 벡터를 생성할 수 있다. 여기서, 임베딩 모델은, 특정 상품의 속성을 나타내는 키워드를 입력 받고, 입력된 키워드에 대응되는 벡터를 출력하도록 미리 학습된 모델일 수 있다.

프로세서(1400)는, 벡터 집합 내의 복수의 벡터에 대응되는 복수의 가우시안 분포를 포함하는, 벡터 집합에 대응되는 가우시안 분포 집합을 생성할 수 있다. 프로세서(1400)는, 가우시안 분포 집합 내의 복수의 가우시안 분포에 기초하여, 키워드 집합에 대응되는 속성 가우시안 분포를 생성할 수 있다.

프로세서(1400)는, 복수의 가우시안 분포에 포함된 각각의 가우시안 분포를 나타내는 평균 벡터 각각 및 분산에 기초하여, 속성 가우시안 분포를 나타내는 평균 벡터 및 분산을 계산할 수 있다.

프로세서(1400)는, 이미지 판별 모델에 포함된 복수의 레이어 중 제1 레이어로부터 출력되는, 제1 이미지를 식별할 수 있으며, 여기서, 제1 이미지는 복수의 영역으로 구성될 수 있다. 프로세서(1400)는, 키워드 집합에 대응되는 벡터 집합 내의 복수의 벡터 및 제1 이미지 내의 복수의 영역에 대응되는 복수의 특징 벡터에 기초하여, 제1 이미지 내의 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성할 수 있다. 프로세서(1400)는, 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 벡터 집합에 적용함으로써, 제1 이미지 내의 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득할 수 있다. 프로세서(1400)는, 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킴으로써 획득되는 제2 이미지를, 복수의 레이어 중 제2 레이어에 입력할 수 있다.

프로세서(1400)는, 상품 이미지가 이미지 생성 모델을 이용하여 생성된 가짜 이미지인지 판별하기 위하여, 상품 이미지 및 특정 상품의 속성들에 대응되는 진짜 상품 이미지 중 하나 및 키워드 집합에 관한 데이터를 이미지 판별 모델에 적용함으로써, 이미지 판별 모델을 학습시킬 수 있다.

일부 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

전술한 본 개시의 설명은 예시를 위한 것이며, 본 개시가 속하는 기술분야의 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 개시의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 개시의 범위에 포함되는 것으로 해석되어야 한다.

Claims

키워드에 기초하여 이미지를 생성하는 이미지 생성 장치에 있어서,

하나 이상의 인스트럭션을 저장하는 메모리; 및

상기 하나 이상의 인스트럭션을 실행함으로써 상기 이미지 생성 장치를 제어하는 프로세서를 포함하며,

상기 프로세서는,

특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득하고,

상기 키워드 집합 내의 상기 복수의 키워드에 기초하여, 상기 키워드 집합에 대응되는 속성 벡터를 생성하고,

상기 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 상기 이미지 생성 모델로부터 출력되는, 상기 특정 상품의 속성들에 대응되는 상품 이미지를 생성하고,

상기 이미지 생성 모델로부터 출력된 상품 이미지 및 상기 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상기 상품 이미지가 상기 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하고,

상기 판별 결과에 기초하여, 상기 이미지 생성 모델을 업데이트하는, 장치.
제1 항에 있어서, 상기 프로세서는,

소정의 임베딩 모델을 이용하여, 상기 키워드 집합에 대응되는 벡터 집합을 생성하고,

상기 생성된 벡터 집합 내의 복수의 벡터에 기초하여, 상기 벡터 집합에 대응되는 속성 가우시안 분포를 생성하고,

상기 속성 가우시안 분포에 기초하여, 상기 키워드 집합에 대응되는 상기 속성 벡터를 생성하는 것인, 장치.
제2 항에 있어서, 상기 프로세서는,

상기 키워드 집합 내의 상기 복수의 키워드를 상기 임베딩 모델에 입력함으로써, 상기 임베딩 모델로부터 출력되는, 상기 복수의 키워드에 대응되는 상기 복수의 벡터를 생성하며,

상기 임베딩 모델은,

상기 특정 상품의 속성을 나타내는 키워드를 입력 받고, 상기 입력된 키워드에 대응되는 벡터를 출력하도록 미리 학습된 모델인, 장치.
제2 항에 있어서, 상기 프로세서는,

상기 벡터 집합 내의 상기 복수의 벡터에 대응되는 복수의 가우시안 분포를 포함하는, 상기 벡터 집합에 대응되는 가우시안 분포 집합을 생성하고,

상기 가우시안 분포 집합 내의 상기 복수의 가우시안 분포에 기초하여, 상기 키워드 집합에 대응되는 상기 속성 가우시안 분포를 생성하는 것인, 장치.
제4 항에 있어서, 상기 프로세서는,

상기 복수의 가우시안 분포에 포함된 각각의 가우시안 분포를 나타내는 평균 벡터 각각 및 분산 각각에 기초하여, 상기 속성 가우시안 분포를 나타내는 평균 벡터 및 분산을 계산하는 것인, 장치.
제2 항에 있어서,

상기 이미지 판별 모델은, 컨볼루션 연산을 이용하여 이미지로부터 특징을 추출하는 복수의 레이어를 포함하며,

상기 이미지 판별 모델은, 상기 복수의 레이어를 이용하여, 상기 입력된 상품 이미지가 상기 이미지 생성 모델로부터 출력된 가짜 이미지인지를 나타내는 확률 값을, 상기 판별 결과로 출력하는 것인, 장치.
제6 항에 있어서, 상기 프로세서는,

상기 이미지 판별 모델에 포함된 상기 복수의 레이어 중 제1 레이어로부터 출력되는, 제1 이미지를 식별하며, 상기 제1 이미지는 복수의 영역으로 구성되고,

상기 키워드 집합에 대응되는 상기 벡터 집합 내의 상기 복수의 벡터 및 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 특징 벡터에 기초하여, 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성하고,

상기 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 상기 벡터 집합에 적용함으로써, 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득하고,

상기 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 상기 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킴으로써 획득되는 제2 이미지를, 상기 복수의 레이어 중 제2 레이어에 입력하는 것인, 장치.
제1 항에 있어서, 상기 프로세서는,

상기 상품 이미지가 상기 이미지 생성 모델을 이용하여 생성된 가짜 이미지인지 판별하기 위하여, 상기 상품 이미지 및 상기 특정 상품의 속성들에 대응되는 진짜 상품 이미지 중 하나 및 상기 키워드 집합에 관한 데이터를 상기 이미지 판별 모델에 적용함으로써, 상기 이미지 판별 모델을 학습시키는 것인, 장치.
키워드에 기초하여 이미지를 생성하는 방법에 있어서,

특정 상품의 속성들을 나타내는 복수의 키워드를 포함하는, 키워드 집합을 획득하는 동작;

상기 키워드 집합 내의 상기 복수의 키워드에 기초하여, 상기 키워드 집합에 대응되는 속성 벡터를 생성하는 동작;

상기 생성된 속성 벡터를 소정의 이미지 생성 모델에 입력함으로써, 상기 이미지 생성 모델로부터 출력되는, 상기 특정 상품의 속성들에 대응되는 상품 이미지를 생성하는 동작;

상기 이미지 생성 모델로부터 출력된 상품 이미지 및 상기 키워드 집합에 관한 데이터를, 소정의 이미지 판별 모델에 입력함으로써, 상기 상품 이미지가 상기 이미지 생성 모델로부터 출력된 가짜 이미지인지를 판별하는 동작; 및

상기 판별 결과에 기초하여, 상기 이미지 생성 모델을 업데이트하는 동작을 포함하는, 방법.
제9 항에 있어서, 상기 속성 벡터를 생성하는 동작은,

소정의 임베딩 모델을 이용하여, 상기 키워드 집합에 대응되는 벡터 집합을 생성하는 동작;

상기 생성된 벡터 집합 내의 복수의 벡터에 기초하여, 상기 벡터 집합에 대응되는 속성 가우시안 분포를 생성하는 동작; 및

상기 속성 가우시안 분포에 기초하여, 상기 키워드 집합에 대응되는 상기 속성 벡터를 생성하는 동작을 포함하는, 방법.
제10 항에 있어서, 상기 벡터 집합을 생성하는 동작은,

상기 키워드 집합 내의 상기 복수의 키워드를 상기 임베딩 모델에 입력함으로써, 상기 임베딩 모델로부터 출력되는, 상기 복수의 키워드에 대응되는 상기 복수의 벡터를 생성하는 동작을 포함하고,

상기 임베딩 모델은,

상기 특정 상품의 속성을 나타내는 키워드를 입력 받고, 상기 입력된 키워드에 대응되는 벡터를 출력하도록 미리 학습된 모델인, 방법.
제10 항에 있어서, 상기 속성 가우시안 분포를 생성하는 동작은,

상기 벡터 집합 내의 상기 복수의 벡터에 대응되는 복수의 가우시안 분포를 포함하는, 상기 벡터 집합에 대응되는 가우시안 분포 집합을 생성하는 동작; 및

상기 가우시안 분포 집합 내의 상기 복수의 가우시안 분포에 기초하여, 상기 키워드 집합에 대응되는 상기 속성 가우시안 분포를 생성하는 동작을 포함하는, 방법.
제12 항에 있어서, 상기 복수의 가우시안 분포에 기초하여, 상기 키워드 집합에 대응되는 상기 속성 가우시안 분포를 생성하는 동작은,

상기 복수의 가우시안 분포에 포함된 각각의 가우시안 분포를 나타내는 평균 벡터 각각 및 분산 각각에 기초하여, 상기 속성 가우시안 분포를 나타내는 평균 벡터 및 분산을 계산하는 동작을 포함하는, 방법.
제10 항에 있어서,

상기 이미지 판별 모델은, 컨볼루션 연산을 이용하여 이미지로부터 특징을 추출하는 복수의 레이어를 포함하고,

상기 이미지 판별 모델은, 상기 복수의 레이어를 이용하여, 상기 입력된 상품 이미지가 상기 이미지 생성 모델로부터 출력된 이미지인지를 나타내는 확률 값을, 상기 판별 결과로 출력하는, 방법.
제14 항에 있어서, 상기 판별하는 동작은,

상기 이미지 판별 모델에 포함된 상기 복수의 레이어 중 제1 레이어로부터 출력되는, 제1 이미지를 식별하며, 상기 제1 이미지는 복수의 영역으로 구성되는 동작;

상기 키워드 집합에 대응되는 상기 벡터 집합 내의 상기 복수의 벡터 및 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 특징 벡터에 기초하여, 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 가중치 계수 집합을 생성하는 동작;

상기 복수의 가중치 계수 집합에 포함된 가중치 계수 집합 각각을 상기 벡터 집합에 적용함으로써, 상기 제1 이미지 내의 상기 복수의 영역에 대응되는 복수의 컨텍스트 벡터를 획득하는 동작; 및

상기 복수의 컨텍스트 벡터에 포함된 컨텍스트 벡터 각각을 상기 복수의 특징 벡터에 포함된 특징 벡터 각각과 연결시킴으로써 획득되는 제2 이미지를, 상기 복수의 레이어 중 제2 레이어에 입력하는 동작을 포함하는, 방법.