WO2024085535A1

WO2024085535A1 - 인공지능을 이용하여 이미지를 합성하는 방법 및 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법

Info

Publication number: WO2024085535A1
Application number: PCT/KR2023/015739
Authority: WO
Inventors: 양동보
Original assignee: 퀀텀리프(주); 양동보
Priority date: 2022-10-17
Filing date: 2023-10-12
Publication date: 2024-04-25
Also published as: KR102543429B1

Abstract

본 명세서는 이미지 변환 기술에 관한 것으로, 이미지 합성 장치가 이미지를 합성하는 방법은, 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하고, 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받고, 헤어 영역에 대한 마스크를 이용하여 사용자의 이미지를 마스킹하며, 학습된 헤어 모델을 이용하여 마스킹된 사용자의 이미지 및 헤어 이미지에 기초한 합성 이미지를 생성한다.

Description

인공지능을 이용하여 이미지를 합성하는 방법 및 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법

본 명세서는 이미지 변환 기술에 관한 것으로, 보다 상세하게는 기계학습(machine learning)을 이용하여 사용자의 사진으로부터 새로운 사진을 획득하는 이미지 합성 방법 및 이에 기반하여 사용자의 헤어스타일을 변화시킨 이미지를 생성하고 사용자에게 적합한 헤어디자이너를 매칭하는 하는 방법에 관한 것이다.

원본 이미지를 이용하여 새로운 이미지를 생성하기 위한 다양한 이미지 변환 및 합성 기술이 존재한다. 원본 및 새로운 이미지가 어떠한 데이터인지 또는 변환하고자 하는 목적 내지 변환의 정도에 따라 선택되는 기술의 유형 또한 달라질 수 있다. 최근에는 인공지능 기술의 발전에 따라 이미지 변환 및 합성에도 이러한 인공지능 기술이 활용되고 있으며, 이하의 선행기술문헌을 통해 제시된 GAN(Generative Adversarial Networks)이나 오토인코더(Autoencoder) 등이 대표적인 수단으로서 제시되고 있다.

"Generative Adversarial Networks", Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio, 2014.

GAN을 활용한 이미지 생성 및 변환 기술은 인공 신경망이 다양한 노이즈 입력을 받아 기존에 존재하지 않는 새로운 이미지를 생성하거나 다른 형태나 정보를 지닌 이미지 또는 비디오로 변환할 수 있다. 기존의 딥러닝 기술은 학습 데이터에 대해 다층의 인공 신경망 1개를 학습하는 것이 일반적이었지만, GAN은 2개의 인공 신경망의 상호작용을 통해 최종적으로 진짜인지 구분하기 힘든 가짜 이미지를 생성하는 1개의 생성 신경망을 활용하게 된다.

한편, 현재 출시된 대부분의 이미지 합성 서비스는 미리 선정된 고정 헤어스타일의 유형에 대해서만 합성이 가능하므로 실제와 유사한 스타일 이미지를 도출하는 데에는 한계가 존재하였다. 비록 GAN 모델을 사용하여 이미지를 합성할 경우 상대적으로 더욱 자연스럽고 뛰어난 결과를 도출할 수 있다는 연구 사례들이 존재하나, 실제 사람을 대상으로 하는 실용 서비스의 수준에는 이르지 못하고 있다.

본 명세서의 실시예들이 해결하고자 하는 기술적 과제는, 종래의 고정된 방식의 이미지 합성 기술이 합성 유형에 제한이 존재하는 약점을 해소하고, GAN 등의 딥러닝 기술을 적용하는 경우에도 실제 사용자의 원본 사진으로부터 원하는 형태의 이미지를 얻기 어렵거나 원본 사진의 주요한 특징이나 정보를 잃어버리는 문제를 해결하며, 나아가 종래의 사용자와 헤어디자이너를 매칭하는 기술이 대부분 일정이나 비용 등의 조건에만 집중되어 있다는 한계를 극복하고자 한다.

상기 기술적 과제를 해결하기 위하여, 본 명세서의 일 실시예에 따른 적어도 하나의 프로세서를 포함하는 이미지 합성 장치가 이미지를 합성하는 방법은, 이미지 합성 장치가 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하는 단계; 상기 이미지 합성 장치가 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받는 단계; 상기 이미지 합성 장치가 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하는 단계; 및 상기 이미지 합성 장치가 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성하는 단계;를 포함한다.

일 실시예에 따른 이미지 합성 방법에서, 상기 헤어 모델을 학습하는 단계는, 생성기(generator)가 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성하는 단계; 및 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출하는 단계를 포함하며, 상기 생성기는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고, 상기 구분기는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습할 수 있다.

일 실시예에 따른 이미지 합성 방법에서, 상기 헤어 모델을 학습하는 단계는, 인코더(encoder)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성하는 단계;를 더 포함할 수 있다.

일 실시예에 따른 이미지 합성 방법에서, 상기 구분기는, 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 제 1 구분기; 및 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 제 2 구분기;를 포함하고, 상기 제 1 구분기 및 상기 제 2 구분기 각각을 통해 산출된 손실을 상기 생성기에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도할 수 있다. 또한, 상기 제 1 구분기는 동일한 사람에 대한 복수 개의 얼굴 사진에 기반하여 학습되고, 상기 제 2 구분기는 동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진에 기반하여 학습될 수 있다.

상기 기술적 과제를 해결하기 위하여, 본 명세서의 다른 실시예에 따른 적어도 하나의 프로세서를 포함하는 매칭 시스템이 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법은, 매칭 시스템이 사용자의 이미지를 입력받는 단계; 상기 매칭 시스템이 사용자로부터 입력된 희망 헤어스타일을 설정하고, 이미지 합성 알고리즘을 이용하여 상기 사용자의 이미지로부터 상기 헤어스타일에 따른 합성 이미지를 생성하는 단계; 및 상기 매칭 시스템이 생성된 상기 합성 이미지의 헤어스타일에 대응하여 헤어디자이너를 추천하는 단계;를 포함하고, 상기 이미지 합성 알고리즘은, 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하고, 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받고, 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하며, 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성한다.

다른 실시예에 따른 헤어디자이너 매칭 방법에서, 상기 헤어디자이너를 추천하는 단계는, 복수의 헤어디자이너의 시술 분야 및 경력 중 적어도 하나를 고려하여 헤어디자이너 후보를 적어도 하나 이상 표시하는 단계;를 포함할 수 있다.

다른 실시예에 따른 헤어디자이너 매칭 방법에서, 상기 헤어디자이너를 추천하는 단계는, 표시된 상기 헤어디자이너 후보의 시술 비용, 시술 지역 및 시술 가능 일시 중 적어도 하나를 함께 표시함으로써 상기 사용자와 상기 헤어디자이너 후보 간의 시술 예약을 유도하는 단계;를 더 포함할 수 있다.

다른 실시예에 따른 헤어디자이너 매칭 방법에서, 상기 이미지 합성 알고리즘은, 인코더(encoder)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성하고, 생성기(generator)가 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성하고, 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출하며, 상기 생성기는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고, 상기 구분기는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습함으로써, 상기 헤어 모델을 학습할 수 있다.

다른 실시예에 따른 헤어디자이너 매칭 방법에서, 상기 구분기는, 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 제 1 구분기; 및 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 제 2 구분기;를 포함하고, 상기 제 1 구분기 및 상기 제 2 구분기 각각을 통해 산출된 손실을 상기 생성기에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도하며, 상기 제 1 구분기는 동일한 사람에 대한 복수 개의 얼굴 사진에 기반하여 학습되고, 상기 제 2 구분기는 동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진에 기반하여 학습될 수 있다.

한편, 이하에서는 상기 기재된 이미지 합성 방법 및 헤어디자이너 매칭 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.

본 명세서의 실시예들은, 딥러닝 기술을 활용하여 사용자의 실제 사진으로부터 희망하는 헤어스타일로 변화된 합성 이미지를 생성할 수 있고, 특히 헤어 영역에 대한 마스킹, 얼굴 및 헤어스타일 각각에 대해 학습된 헤어 모델을 제공함으로서 자신의 고유의 외모 특징이 보존되면서도 헤어스타일만의 변화를 얻을 수 있으며, 사용자와 헤어디자이너를 연결하는 플랫폼에 이미지 합성 기술을 도입함으로써 사용자의 변화된 헤어스타일에 기반한 헤어디자이너 매칭을 유도할 수 있다.

본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 명세서에 대한 실시예를 제공하고, 상세한 설명과 함께 본 명세서의 기술적 특징을 설명한다.

도 1은 본 명세서의 실시예들이 제안하는 이미지 합성 방법의 기본 아이디어를 도시한 도면이다.

도 2는 GAN(Generative Adversarial Networks)의 기본 구조를 도시한 도면이다.

도 3은 본 명세서의 실시예들이 제안하는 이미지 합성의 처리 과정을 개괄적으로 도시한 도면이다.

도 4는 본 명세서의 일 실시예에 따른 이미지를 합성하는 방법을 도시한 흐름도이다.

도 5는 본 명세서의 일 실시예에 따른 이미지 합성을 위한 생성기와 구분기의 구성을 도시한 도면이다.

도 6은 본 명세서의 일 실시예에 따른 헤어 모델 학습 과정을 설명하기 위한 도면이다.

도 7은 본 명세서의 다른 실시예에 따른 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법을 도시한 흐름도이다.

도 8a 내지 도 12는 본 명세서의 다른 실시예에 따른 헤어디자이너 매칭 방법을 구현한 애플리케이션의 처리 흐름을 예시한 도면이다.

도 13은 본 명세서의 다른 실시예에 따른 헤어디자이너 매칭 시스템을 도시한 블록도이다.

<부호의 설명>

10: 헤어디자이너 (헤어디자이너 단말)

20: 사용자 (사용자 단말)

30: 매칭 시스템

31: 통신부

32: 프로세서

33: 메모리

이하에서는 도면을 참조하여 본 명세서의 실시예들을 구체적으로 설명하도록 한다. 다만, 하기의 설명 및 첨부된 도면에서 실시예들의 요지를 흐릴 수 있는 공지 기능 또는 구성에 대한 상세한 설명은 생략한다. 덧붙여, 명세서 전체에서, 어떤 구성 요소를 '포함'한다는 것은, 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

또한, 제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로 사용될 수 있다. 예를 들어, 본 발명의 권리 범위로부터 이탈되지 않은 채 제 1 구성 요소는 제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.

본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 명세서를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구비하다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

특별히 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 명세서가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미이다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미인 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

도 1은 본 명세서의 실시예들이 제안하는 이미지 합성 방법의 기본 아이디어를 도시한 도면으로, 원본 이미지(A)로부터 대상 이미지(B)를 참조하여 합성 이미지(C)를 생성하는 것을 목표로 한다. 이때, 원본 이미지(A)는 사용자의 실제 사진이 될 수 있고, 대상 이미지(B)는 원본 이미지(A)와는 헤어스타일이 상이한 사진이 될 수 있다. 최종적으로 생성되는 합성 이미지(C)는 원본 이미지(A)의 인물(사용자)에서 대상 이미지(B) 내에 포함된 헤어스타일의 특징만이 반영된 사진이 될 수 있다. 이를 위해, 원본 이미지(A) 내의 헤어스타일에 대한 정보를 대상 이미지(B) 내의 헤어스타일에 대한 정보로 대체하는 작업이 필요하며, 이러한 헤어스타일의 변경에도 불구하고 자연스러운 이미지 합성을 위해 원본 이미지(A) 내의 사용자의 개인 특징은 그대로 유지되어야 할 것이다.

도 2는 GAN(Generative Adversarial Networks)의 기본 구조를 도시한 도면이다. GAN은 확률 분포를 학습하는 생성기(Generator)(210)와 서로 다른 집합을 구분하는 구분기(Discriminator)(230)의 신경망 2개가 서로 경쟁하면서 학습하는 생성 모델이다. 생성기(210)는 가짜 예제를 만들어 구분기를 최대한 속일 수 있도록 훈련하고, 구분기(230)는 생성기(210)가 제시하는 가짜 예제와 실제 예제를 최대한 정확하게 구분할 수 있도록 훈련한다. 이와 같이 구분기(230)를 속일 수 있도록 대립적으로 생성기(210)를 훈련함으로써, GAN은 2개의 신경망이 서로 대립적으로 발전하는 과정을 통해 실제 예제와 매우 비슷한 유사품(실제 같은 가짜)을 생성할 수 있게 된다. 이러한 특징으로 인해, GAN은 이미지 생성 내지 합성에 적합하다는 평가를 받고 있다.

그런데, GAN을 활용한 이미지 합성 기술에 있어서, 몇 가지 문제점이 발견되었다.

첫째, 도 2에 예시된 바와 같이, 생성기(210)에 입력되는 입력값으로 랜덤 노이즈(random noise)가 주어진다면, 사용자의 실제 사진을 이용하여 이미지를 합성하고자 하는 경우 원본 사진으로부터 원하는 형태의 이미지를 생성하기 어렵다. 따라서, 랜덤 노이즈는 단순히 임의로 생성된 이미지 정보가 아니라 원본 사진으로부터 어떠한 특징을 추출하여 해당 특징을 투영하도록 생성기(210) 이전에 입력값을 구성할 필요가 있다.

둘째, 이미지 내에 포함된 전반적인 특성을 모두 가져온다는 단점이 발견되었다. 예를 들어, 도 1에서 제시한 목표를 고려할 때, 헤어스타일만을 변형시키고자 의도하였으나 피부 톤, 화장, 얼굴의 다른 특징 등도 합성 이미지 내에 반영되어 원본의 얼굴과 다소 차이가 존재하는 합성 이미지가 생성되는 문제가 나타났다. 결과적으로 사용자가 자신의 얼굴이라고 느껴지지 않는 불필요한 특징이 섞여 이미지를 변형시키는 약점을 보완하여야 할 필요가 있다.

셋째, 이미지 합성시 대상(target) 이미지의 비율에 따라 컨텍스트(context) 이미지의 특징(예를 들어, 헤어스타일)을 유지하지 못하는 문제점이 나타났다. 즉, 합성에 개입하는 이미지 내의 특징 부분을 목적에 따라 적절히 통제할 필요가 있다.

상기된 문제점 인식으로부터 안출된 본 명세서의 실시예들은, 사용자의 실제 사진을 입력값으로 사용하되, 대상 이미지의 특징을 보존하면서도, 이미지 내에 포함된 다양한 영역의 특징들 중에서 변화시키고자 의도한 특징만에 집중하여 합성을 수행할 수 있는 기술적 수단을 제안한다.

사용자의 실제 사진을 촬영한 원본 이미지(310)가 입력되면, 합성 성능을 고려하여 전처리 과정(크롭핑(cropping)(320) 내지 정렬(align) 과정)이 수행될 수 있다. 예를 들어, 원본 이미지(310)가 전신 사진이거나 사진 영역 내에 일부 영역에 치우쳐 있거나 다수의 다른 객체와 혼재되어 있는 상황에서, 본 실시예들이 목표로 하는 헤어스타일 합성의 관점에서 얼굴 및 헤어 영역만을 중앙에 오도록 크롭핑 내지 정렬하는 것이 바람직하다.

그런 다음, 이미지 내에서 헤어 영역만을 특정하도록 미리 설계된 마스크(330)를 입력받아 이미지를 마스킹 처리한다. 이와 더불어 변환하고자 하는 헤어 이미지(340)를 입력받는다. 이때, 헤어 이미지(340)는 원본 이미지(310)와는 헤어스타일이 상이한 것으로서 사용자가 변화시키고자 하는 목표 헤어스타일이 입력될 수 있다.

이제 마스킹 처리된 이미지와 변화시키고자 하는 헤어 이미지(340)로부터 미리 학습된 헤어 모델(350)에 기반한 합성 이미지(360)를 생성하여 출력할 수 있다. 여기서, 딥러닝 모델을 어떻게 학습시키고 이미지 합성에 활용할 것인지에 관하여는 이후 도 5 내지 도 6을 통해 구체적으로 기술하도록 한다.

도 4는 본 명세서의 일 실시예에 따른 이미지를 합성하는 방법을 도시한 흐름도이다. 구현의 관점에서, 적어도 하나의 프로세서를 포함하는 이미지 합성 장치가 도 4의 각 단계들이 정의하고 있는 처리 과정을 수행할 수 있으며, 각 단계에 따른 명령어가 포함된 소프트웨어를 상기 프로세서를 통해 구동할 수 있다.

S410 단계에서, 이미지 합성 장치는 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습한다.

우선, 헤어 모델 학습을 위한 학습 데이터로서 한국인의 헤어스타일 이미지인 기존 데이터를 수집하였다. 본 실시예의 구현 과정에서는, 미용 시술 직후 사진 44만장, 묶은머리/올림머리 사진 1만장, 그리고 평소 스타일 사진 5만장의 총 50만장의 사진이 사용되었다. 이들 사진은 동일한 기준으로 라벨링 및 세그멘테이션 되어 있어 하나의 데이터셋(data-set)처럼 이용하거나, 서비스의 목적에 맞게 사용이 가능하다. 모든 데이터셋은 augmentation을 통해 100% 증강되었다. 특정한 작업을 수행하기 위해 데이터를 관련성 있게 수집해 놓은 데이터셋의 중요성은 아무리 강조해도 지나치지 않다. 특히, 데이터셋을 구성하는 개별 데이터 유형, 해당 유형의 데이터 형식, 데이터의 품질은 인공지능 학습 내지 예측 성능에 큰 영향을 끼치므로, 이하에서는 본 실시예들에서 제안하는 데이터셋에 관해 구체적으로 제시한다.

표 1의 데이터 종류를 순차적으로 설명하면 각각 다음과 같다.

1) 미용실 uniform 데이터 셋은 시술 직후 깔끔한 머리스타일을 이미지 형식(확장자 png), 엑셀파일(확장자 csv), JSON(JavaScript Object Notation)형식으로 제공할 수 있다. JSON은 Javascript 객체 문법으로 구조화된 데이터를 표현하기 위한 문자 기반의 표준 포맷으로, 웹 애플리케이션에서 데이터를 전송할 때 사용하며, exif data는 exif tag 버전 차이로 인해 스키마가 달라질 수 있으므로 csv가 아닌 json으로 제공하는 것이 바람직하다.

2) 미용실 longtail 데이터 셋은 시술 직후 깔끔한 시술 가능성이 낮은 머리 스타일을 이미지 형식(확장자 png), 엑셀파일(확장자 csv), JSON 형식으로 제공할 수 있다. 롱테일(longtail) 데이터는 AI 모델을 훈련하는데 필요하지만 이 데이터를 쉽게 이용할 수 없을 수도 있다. 통계학에 근원을 둔 '롱테일'이란 단어는 발생 가능성이 낮은 다수의 사건들이 통계 분포의 한쪽에 길게 분포돼 있는 현상을 말하며, 롱테일은 AI 시스템의 설계와 운영에도 큰 영향을 미친다. 현존 AI 시스템은 롱테일 데이터에 특히 취약한데, 이는 발생 가능성이 낮아 대량의 데이터를 필요로 하는 AI 학습 데이터에 포함되어 있지 않을 수 있기 때문이다.

3) 일상 헤어스타일 데이터 셋은 미용실에 간지 2주일 이상 지나 스타일이 한눈에 즉시 구분되지 않고 사진의 배경과 조명이 다양하여 노이즈(noise)가 많은 데이터셋을 이미지 형식(확장자 png), 엑셀파일(확장자 csv), JSON 형식으로 제공할 수 있다.

4) 특수 헤어스타일 데이터 셋은 미용실에서 시술되지 않으나 많은 사람들이 유지하는 헤어 스타일(묶은 머리, 탈모, 매우 긴 장발 등)의 이미지 형식(확장자 png), 엑셀파일(확장자 csv), JSON 형식으로 제공할 수 있다.

데이터셋을 설계할 때 가장 중요하게 고려해야 하는 점이 데이터 밸런스이다. 적절한 분류 기준에 따라 골고루 데이터가 분포되도록 설계하여 학습시 예상할 수 있는 데이터 편향성을 최소화하도록 해야 한다. 본 실시예들에서는 실제 주문이 많은 헤어스타일이 롱테일(longtail)되는 부분의 데이터를 함께 갖추어 트렌드와 균등 분포 두 가지를 동시에 달성할 수 있도록 데이터셋을 구성하였다.

또한, 본 실시예에서 수집되는 헤어스타일 이미지인 신규 수집 데이터는 기술의 적용 영역인 헤어샵 및 헤어디자이너들이 고객 시술 전/후 사진을 촬영하여 수집하였으며, 기존 데이터(한국인 헤어스타일 이미지)와 동일 스키마 정보를 유지하였다. 신규 수집 데이터에 관한 파일 구조를 예시하면 다음과 같다.

"Annotation.csv" 파일은 다음의 표 2와 같은 구조를 가질 수 있다.

어노테이션(annotation)은 원본 데이터를 설명하기 위해 사용되는 오브젝트 또는 이미지 카테고리와 같은 각각의 메타 데이터를 '태그' 형식으로 데이터셋에 추가하는 작업을 말한다. 즉, 인공지능이 데이터의 내용을 이해할 수 있도록 원천 데이터에 주석을 표시하는 작업에 해당한다. 설명 정보 데이터는 기능 목적에 따라 다양한 형태와 설명 정보를 표현해 줄 수 있고, 여기서는 csv 형식으로 헤어스타일명, 헤어스타일 타입, 머리길이 헤어컬러, 앞머리, 탈모정도, 옆머리스타일, 나이, 정면대표2D샷, 좌우각도, 상하각도, 칼라, 가르마종류, 성별, 특수헤어스타일구분, Segment rgb 평균 등을 csv 형식으로 제공할 수 있다.

"Meta-Annotation.csv" 파일은 다음의 표 3과 같은 구조를 가질 수 있다.

메타데이터는 데이터에 관한 구조화된 데이터, 즉, 다른 데이터를 설명해 주는 데이터로서, 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 메타데이터는 어떠한 데이터, 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다. 데이터 측면 에서는 데이터에 대한 설명을 위해 레이블링(labeling) 하는 것이 이에 해당한다. 레이블링이란 이미지에서 객체 인식 시에 객체의 정보, 즉, 메타데이터를 추가해 주는 것으로, 헤어스타일에 대한 그림 파일에 대한 경로, 촬영set, 촬영자, 촬영날짜, 헤어-얼굴 segment 좌표, 해상도, 촬영장비 등을 csv 형식으로 제공할 수 있다.

"optional-Annotation.csv" 파일은 다음의 표 4와 같은 구조를 가질 수 있다.

옵셔널(optional) 어노테이션은 모발에 관한 추가적인 설명을 제공하는 데이터로서, 촬영set, 모발굵기, 발수성 모발, 천영곱슬여부, 손상도 등을 csv 형식으로 제공할 수 있다.

"exifData.csv" 파일은 다음의 표 5와 같은 구조를 가질 수 있다.

표 5는 데이터가 저장되어 있는 경로를 csv 형식으로 제공할 수 있다.

앞서 지적한 바와 같이, 이미지 합성시 세부 특징을 조정하지 못하는 문제를 해결하기 위해 본 명세서의 실시예들은 대상 이미지의 특징인 시맨틱 지식(Semantic Knowledge)을 보존하면서도, 실제 사진으로부터 생성될 이미지에 투영하고자 하는 특징이 반영된 노이즈를 생성하는 인버전(inversion) 과정을 도입하였다. 즉, 이미지에서 이미지로(Image-to-Image)의 변환이 가능하도록 이미지(실제 사진)를 노이즈로 변환하는 인코더(encoder)를 제시한다. 인코더는 이미지의 특징을 반영한 잠재 벡터(Latent Vector)를 생성하고 이미지의 포즈, 표정 등을 변환시키거나 두 이미지를 인터폴레이션(Interpolation)하여 평균화된 이미지를 생성하는 등 다양한 기능을 수행할 수 있다. 본 실시예에서는 헤어스타일에 관한 특징에 집중한 잠재 벡터를 도출하는 것을 목표로 한다.

도 5는 본 명세서의 일 실시예에 따른 이미지 합성을 위한 생성기와 구분기의 구성을 도시한 도면으로서, 도 4의 헤어 모델을 학습하는 과정(S410)을 보다 구체적으로 제시한다.

생성기(generator)(510)는 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성한다. 또한, 구분기(discriminator)(531, 533)는 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출한다. 생성기(510)는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고, 상기 구분기(531, 533)는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습한다.

그런데, 통상적으로 1개의 구분기를 구비하는 GAN 기술과는 달리 본 명세서의 실시예들은 적어도 2개의 구분기(531, 533)을 포함한다. 헤어스타일을 변화시키는 목표 하에서, 종래의 GAN을 이용하여 헤어스타일을 변화시키면 사용자의 얼굴 모양도 함께 변화되는 문제가 발생하였는바, 본 실시예는 구분기가 단순히 합성된 가짜 사진이 얼마나 진짜와 유사한지만을 판단하는 것 뿐만 아니라, 사진 내에서 얼굴과 헤어스타일을 별도로 구분하여 판단하고자 하였다. 이를 위해, 구분기를 두 종류로 나누어, 하나는 예측된 사진의 얼굴(사람)이 현재 사용자의 얼굴과 같은지 여부를 판별하고, 다른 하나는 예측된 사진의 헤어스타일이 목표 헤어스타일과 같은지 여부를 판별하도록 구성하였다.

도 5를 참조하면, 구분기가 2개 도시되었는데, 제 1 구분기(531)는 가짜 이미지와 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 역할을 수행하고, 제 2 구분기(533)는 가짜 이미지와 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 역할을 수행한다. 그런 다음, 상기 제 1 구분기(531) 및 상기 제 2 구분기(533) 각각을 통해 산출된 손실을 생성기(510)에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도하게 된다.

한편, 상기 제 1 구분기(531)는 동일한 사람에 대한 복수 개의 얼굴 사진에 기반하여 학습되어야 하므로, 동일한 사람에 대한 다수의 사진(예를 들어, 사람1_사진1, 사람1_사진2, 사람2_사진1, 사람2_사진2, ...)을 학습 데이터셋으로 입력받을 수 있다. 또한, 상기 제 2 구분기(533)는 동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진에 기반하여 학습되어야 하므로, 동일한 헤어스타일에 대한 다수의 사진(예를 들어, 목표헤어1_사진1, 목표헤어1_사진2, 같은 헤어2_사진1, 같은 헤어2_사진2, ...)을 학습 데이터셋으로 입력받을 수 있다.

이상에서 기술된 2가지 유형의 구분기(531, 533)를 살펴보면, 얼굴의 동일성과 헤어스타일의 동일성을 각각 판단하는 학습이 필요함을 알 수 있다. 따라서, 앞서 기술한 도 4의 S410 단계에서 이미지 합성 장치가 헤어 모델을 학습하기 위해 필요한 학습 데이터에는 단지 헤어스타일에 관한 이미지 뿐만 아니라 얼굴에 관한 이미지도 필요함을 알 수 있다. 이를 위해, 학습 데이터는, 얼굴 학습을 위한 얼굴 영역이 포함된 이미지 데이터, 헤어스타일 학습을 위한 헤어 영역이 포함된 이미지 데이터 및 헤어 영역이 마스킹 처리된 데이터를 포함할 수 있다.

도 6은 본 명세서의 일 실시예에 따른 헤어 모델 학습 과정을 설명하기 위한 도면으로, 인코더(Encoder)(610) 및 디코더(Decoder)(630)를 이용한 학습을 도시하였다.

우선, 실제 사진으로부터 특징을 추출하기 위해, 인코더(610)에 하나의 사진을 입력하면, 인코딩된 특징(encoded feature)이 출력된다. 물론 이때 입력되는 사진은 헤어스타일에 관한 사진으로 전처리되어 입력되어야만 목표로 하는 헤어스타일에 관한 헤어 모델을 학습할 수 있을 것이다. 이후, 디코더(630)는 해당 특징을 입력받아 다시 원본 사진을 유추하도록 동작한다. 이러한 일련의 과정을 다양한 사진에 대해 다수 수행하게 되면, 헤어스타일이 비슷한 사진들은 인코딩된 특징이 잠재 공간(latent space) 내에서 인접한 점들로 나타나며 학습되는데, 만약 헤어스타일이 상이한 사진의 경우에는 잠재 공간 내에서 멀리 떨어지는 결과가 나타나게 된다.

요약하건대, 헤어 모델을 학습하는 과정은, 인코더(610)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성할 수 있다. 이러한 과정을 통해 종래의 GAN 기술에서 랜덤 노이즈가 실제 사진의 특징을 투영하지 못하는 문제를 해결할 수 있다.

이제, 인코더(610)의 학습이 완료된 후에는, 어떠한 사진이 입력되더라도 인코딩된 특징(encoded feature)이 헤어스타일에 대한 정보를 포함하고 있기 때문에, 구현의 편의에 따라 GAN의 생성기(Generator)에 해당 특징(feature)만을 제공하여도 무방하다.

상기된 과정에 따라 헤어 모델의 학습이 완료되면, 다시 도 4로 돌아와 본 실시예의 나머지 구성들을 설명하자.

S430 단계에서, 이미지 합성 장치는 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받는다. 이때 사용자의 이미지는 사용자의 외모에 관한 다양한 특징이 그대로 보존되기를 희망하는 실제 사진이 될 수 있다.

S450 단계에서, 상기 이미지 합성 장치는 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹한다. 이 과정에서는 사용자의 실제 사진에서 외모에 관한 다양한 특징은 그대로 보존하되, 헤어스타일만을 변경하도록 변형의 영역(domain)을 통제하게 된다.

S470 단계에서, 상기 이미지 합성 장치는 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성한다. 앞서 학습된 헤어 모델은 1개의 생성기와 2개의 구분기를 포함하며, 특히 얼굴의 동일성 여부를 판별하는 제 1 구분기와 헤어스타일의 동일성 여부를 판별하는 제 2 구분기를 통해 생성기의 학습을 동시에 유도하였다. 따라서, 본 실시예가 제안하는 헤어 모델에 의해 생성된 합성 이미지는 목표로 하는 헤어스타일 이외의 특징(예를 들어, 피부색 또는 화장)은 원본 이미지(사용자의 실제 사진) 내의 특징을 보존하면서도 헤어스타일만을 자연스럽게 반영된 결과를 얻을 수 있다.

이하에서는, 상기된 헤어스타일에 대한 이미지 합성 방법을 활용한 플랫폼 응용 기술을 소개하도록 한다.

도 7은 본 명세서의 다른 실시예에 따른 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법을 도시한 흐름도이다. 구현의 관점에서, 적어도 하나의 프로세서를 포함하는 매칭 시스템이 도 7의 각 단계들이 정의하고 있는 처리 과정을 수행할 수 있으며, 각 단계에 따른 명령어가 포함된 소프트웨어를 상기 프로세서를 통해 구동할 수 있다. 이미지 합성에 관한 처리 과정은 앞서 도 4 내지 도 6을 통해 자세히 설명하였으므로, 여기서는 설명의 중복을 피하고자 그 개요만을 약술하도록 한다.

S710 단계에서, 매칭 시스템은 사용자의 이미지를 입력받는다. 예를 들어, 헤어스타일을 변화시키기 희망하는 사용자가 자신의 실제 사진을 촬영함으로써 사용자의 이미지를 매칭 시스템에 제공할 수 있다.

S730 단계에서, 상기 매칭 시스템은 이미지 합성 알고리즘에서 활용되는 헤어 모델을 미리 학습한다. 또는 상기 매칭 시스템은 물리적으로 별도로 분리된 다른 장치를 통해 학습된 결과(헤어 모델)만을 제공받을 수도 있을 것이다.

S750 단계에서, 상기 매칭 시스템은 사용자로부터 입력된 희망 헤어스타일을 설정하고, 이미지 합성 알고리즘을 이용하여 상기 사용자의 이미지로부터 상기 헤어스타일에 따른 합성 이미지를 생성한다. 여기서, 상기 이미지 합성 알고리즘은, 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하고, 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받고, 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하며, 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성할 수 있다.

또한, 이미지 합성 알고리즘은, 인코더(encoder)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성하고, 생성기(generator)가 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성하고, 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출하며, 상기 생성기는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고, 상기 구분기는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습함으로써, 상기 헤어 모델을 학습할 수 있다.

나아가, 상기 구분기는, 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 제 1 구분기 및 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 제 2 구분기를 포함하고, 상기 제 1 구분기 및 상기 제 2 구분기 각각을 통해 산출된 손실을 상기 생성기에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도하며, 상기 제 1 구분기는 동일한 사람에 대한 복수 개의 얼굴 사진에 기반하여 학습되고, 상기 제 2 구분기는 동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진에 기반하여 학습되는 것이 바람직하다.

S770 단계에서, 상기 매칭 시스템은 S750 단계를 통해 생성된 상기 합성 이미지의 헤어스타일에 대응하여 헤어디자이너를 추천한다. 이를 위해, 매칭 시스템은 헤어샵 내지 헤어샵에 근무하는 헤어디자이너와 사용자를 연결하는 협업 플랫폼으로 구현될 수 있다. 즉, 매칭 시스템 내에 다수의 헤어디자이너가 등록될 수 있으며, 헤어디자이너의 시술 가능한 항목과 다양한 시술 조건을 통해 사용자의 요구에 부합하는 헤어디자이너를 추천할 수 있다. 사용자가 추천되는 헤어디자이너를 선택할 경우, 시술 예약 및 결제를 하나의 플랫폼 내에서 처리할 수 있는 편의 기능을 제공하는 것이 가능하다.

요약하건대, 헤어디자이너를 추천하는 S770 단계에서는, 복수의 헤어디자이너의 시술 분야 및 경력 중 적어도 하나를 고려하여 헤어디자이너 후보를 적어도 하나 이상 표시할 수 있다. 나아가, 표시된 상기 헤어디자이너 후보의 시술 비용, 시술 지역 및 시술 가능 일시 중 적어도 하나를 함께 표시함으로써 상기 사용자와 상기 헤어디자이너 후보 간의 시술 예약을 유도할 수도 있다.

도 8a 및 도 8b는 매칭 애플리케이션의 사용자 인터페이스(user interface)를 예시한 것이다. 첫째, 도 8a에서 사용자가 자신의 실제 사진을 촬영하고, 현재의 헤어스타일에서 변화시키고자 하는 다양한 항목을 선택할 수 있도록 화면 상에 제시한다. 예를 들어, 머리 길이, 웨이브, 머리 형태 내지 머리 색깔 등이 선택 항목으로 제시될 수 있다. 둘째, 도 8b에서 사용자가 자신의 사진을 단말기(예를 들어, 스마트폰) 저장 장치에서 불러오고, 목표로 하는 다른 사람의 사진(예를 들어, 연예인)을 불러와 목표 사진으로 제시한다. 그런 다음, 결과 예측하기를 선택하여 자신의 사진과 목표 사진으로부터 생성된 합성 이미지를 확인할 수 있다. 이는 헤어스타일에 대한 시술을 받았을 때의 결과를 예측한 이미지가 될 것이다.

도 9는 앞서 도 8a 또는 도 8b의 사용자 인터페이스를 통해 선택된 항목에 따라 합성 이미지가 화면 상에 표시되었음을 보여준다. 도 8a 또는 도 8b의 원본 사진(사용자 이미지)과 비교할 때, 도 9의 합성 이미지는 동일한 인물의 특징을 모두 보존하면서도 머리 길이와 웨이브가 달라진 이미지가 매우 자연스럽게 표현되었음을 확인할 수 있다. 이제, 사용자는 도 9의 화면에서 디자이너 검색 버튼을 선택하여 매칭 시스템(플랫폼)의 매칭 서비스를 진행할 수 있다.

도 10에는 사용자의 조건에 따라 매칭 가능한 헤어디자이너들을 표시하였다. 이들 헤어디자이너는 앞서 생성된 합성 이미지에 대한 시술이 가능한 헤어디자이너이며, 필요에 따라 추가적인 검색 조건이 부가된 결과를 보여줄 수 있다. 예를 들어, 사용자의 희망에 따른 경력 범위나 인기도 등을 추가 조건으로 하여 필터링된 결과만을 보여줄 수 있다. 이때, 사용자는 헤어디자이너를 한 명 선택하여 상세 화면으로 진행할 수 있다.

도 11은 선택된 헤어디자이너가 시술 가능한 서비스를 보여준다. 사용자는 해당 헤어디자이너가 제공 가능한 서비스 중 적어도 하나를 선택하여 도 12의 예약 화면으로 진행할 수 있다.

도 12에서는 선택한 헤어디자이너의 시술 가능 시간을 보여준다. 필요에 따라서는 예시된 바와 같이 앞서 검색된 다양한 헤어디자이너를 포함하여 하나의 화면에 표시함으로써 사용자의 다른 선택을 유도할 수도 있다. 이제, 사용자는 시술 가능 시간을 특정함으로써 예약을 완료할 수 있다. 필요에 따라서는 결제에 관한 화면으로 진행하여 사전 결제에 관한 다양한 옵션을 제공할 수도 있을 것이다.

도 13은 본 명세서의 다른 실시예에 따른 헤어디자이너 매칭 시스템을 도시한 블록도로서, 도 7의 매칭 방법을 하드웨어 구성의 관점에서 재구성한 것이다.

헤어디자이너(10)는 헤어디자이너가 소지하는 단말이나 헤어샵의 예약 단말이 될 수 있으며 매칭 시스템(30)과 네트워크를 통해 연결된다.

사용자(20)는 사용자가 소지하는 단말이나 PC 등을 이용해 네트워크를 통해 매칭 시스템(30)과 연결된다.

매칭 시스템(30)은, 네트워크를 통해 헤어디자이너(10) 및 사용자(20)와 연결되기 위해 통신부(31)를 구비하며, 사용자의 헤어샵 매칭 및 예약을 중개하는 역할을 수행한다. 매칭 시스템(30)은 사용자(20)로부터 매칭 요청을 받아 이를 처리하는 일련의 처리 과정을 정의하는 명령어를 포함하는 매칭 소프트웨어를 메모리(33)에 로드(load) 또는 저장할 수 있으며, 메모리(33)에 로드 또는 저장된 매칭 소프트웨어를 실행하는 프로세서(32)를 구비한다.

매칭 소프트웨어는, 사용자의 이미지를 입력받고, 사용자(20)로부터 입력된 희망 헤어스타일을 설정하고, 이미지 합성 알고리즘을 이용하여 상기 사용자의 이미지로부터 상기 헤어스타일에 따른 합성 이미지를 생성하며, 생성된 상기 합성 이미지의 헤어스타일에 대응하여 헤어디자이너(10)를 추천하는 명령어를 포함한다. 여기서, 이미지 합성 알고리즘은, 헤어스타일에 관한 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하고, 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받고, 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하며, 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성하도록 정의된다.

도 13을 통해 제안된 매칭 시스템은, 고객으로부터 획득된 사진 데이터를 이용하여 개인화 데이터로 축적할 수 있으며, 또한 헤어디자이너들이 입력한 시술 결과 사진을 이용하여 또한 헤어스타일에 대한 다량의 학습 데이터를 축적할 수 있다. 이 경우, 디자이너들은 자신이 시술한 결과를 마케팅 목적에서 매칭 시스템에 능동적으로 제공함으로써 고객들에게 노출되고자 하는 목표를 달성할 수 있으며, 매칭 시스템의 관점에서는 양질의 학습 데이터를 얻을 수 있는 기회가 될 수 있다.

한편, 본 명세서의 실시예들은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다.

컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등을 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 실시예들을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 명세서가 속하는 기술 분야의 프로그래머들에 의하여 용이하게 추론될 수 있다.

이상에서 본 명세서에 대하여 그 다양한 실시예들을 중심으로 살펴보았다. 본 명세서에 속하는 기술 분야에서 통상의 지식을 가진 자는 다양한 실시예들이 본 명세서의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 명세서의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 명세서에 포함된 것으로 해석되어야 할 것이다.

상기된 본 명세서의 실시예들에 따르면, 딥러닝 기술을 활용하여 사용자의 실제 사진으로부터 희망하는 헤어스타일로 변화된 합성 이미지를 생성할 수 있고, 특히 헤어 영역에 대한 마스킹, 얼굴 및 헤어스타일 각각에 대해 학습된 헤어 모델을 제공함으로서 자신의 고유의 외모 특징이 보존되면서도 헤어스타일만의 변화를 얻을 수 있으며, 사용자와 헤어디자이너를 연결하는 플랫폼에 이미지 합성 기술을 도입함으로써 사용자의 변화된 헤어스타일에 기반한 헤어디자이너 매칭을 유도할 수 있다.

Claims

적어도 하나의 프로세서를 포함하는 이미지 합성 장치가 이미지를 합성하는 방법에 있어서,

이미지 합성 장치가 얼굴 학습을 위한 얼굴 영역이 포함된 이미지 데이터, 헤어스타일 학습을 위한 헤어 영역이 포함된 이미지 데이터 및 헤어 영역이 마스킹 처리된 데이터를 포함하는 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하는 단계;

상기 이미지 합성 장치가 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받는 단계;

상기 이미지 합성 장치가 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하는 단계; 및

상기 이미지 합성 장치가 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성하는 단계;를 포함하고,

상기 헤어 모델을 학습하는 단계는,

생성기(generator)가 가짜(fake) 이미지를 생성하고, 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이를 구분하며, 양자가 서로 경쟁하면서 학습하되,

상기 구분기는,

동일한 사람에 대한 복수 개의 얼굴 사진을 학습 데이터셋으로 입력받아 학습됨으로써 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 제 1 구분기; 및

동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진을 학습 데이터셋으로 입력받아 학습됨으로써 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 제 2 구분기;를 포함함으로써, 사진 내에서 얼굴과 헤어스타일을 별도로 구분하여 판단하는, 이미지 합성 방법.
제 1 항에 있어서,

상기 헤어 모델을 학습하는 단계는,

생성기(generator)가 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성하는 단계; 및

구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출하는 단계;를 포함하며,

상기 생성기는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고,

상기 구분기는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습하는, 이미지 합성 방법.
제 2 항에 있어서,

상기 헤어 모델을 학습하는 단계는,

인코더(encoder)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성하는 단계;를 더 포함하는, 이미지 합성 방법.
제 2 항에 있어서,

상기 구분기는,

상기 제 1 구분기 및 상기 제 2 구분기 각각을 통해 산출된 손실을 상기 생성기에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도하는, 이미지 합성 방법.
제 1 항에 있어서,

상기 학습 데이터는,

시술 직후의 헤어스타일 이미지를 제공하는 제 1 데이터셋;

시술 직후의 시술 가능성이 낮은 헤어스타일 이미지를 제공하는 롱테일(longtail) 데이터인 제 2 데이터셋;

헤어스타일이 즉시 구분되지 않는 일상 헤어스타일 이미지를 제공하는 제 3 데이터셋; 및

시술되지는 않으나 다수의 사람들이 유지하는 헤어스타일 이미지를 제공하는 제 4 데이터셋;를 포함하되,

실제 주문이 많은 헤어스타일이 롱테일되는 부분의 데이터를 함께 갖추도록 데이터셋을 구성하는, 이미지 합성 방법.
적어도 하나의 프로세서를 포함하는 매칭 시스템이 이미지 합성에 기반하여 헤어디자이너를 매칭하는 방법에 있어서,

매칭 시스템이 사용자의 이미지를 입력받는 단계;

상기 매칭 시스템이 사용자로부터 입력된 희망 헤어스타일을 설정하고, 이미지 합성 알고리즘을 이용하여 상기 사용자의 이미지로부터 상기 헤어스타일에 따른 합성 이미지를 생성하는 단계; 및

상기 매칭 시스템이 생성된 상기 합성 이미지의 헤어스타일에 대응하여 헤어디자이너를 추천하는 단계;를 포함하고,

상기 이미지 합성 알고리즘은,

얼굴 학습을 위한 얼굴 영역이 포함된 이미지 데이터, 헤어스타일 학습을 위한 헤어 영역이 포함된 이미지 데이터 및 헤어 영역이 마스킹 처리된 데이터를 포함하는 다수의 학습 데이터를 이용하여 GAN(Generative Adversarial Networks) 구조의 헤어 모델을 학습하고, 사용자의 이미지 및 새로운 헤어스타일을 포함하는 헤어 이미지를 입력받고, 헤어 영역에 대한 마스크를 이용하여 상기 사용자의 이미지를 마스킹하며, 학습된 상기 헤어 모델을 이용하여 마스킹된 상기 사용자의 이미지 및 상기 헤어 이미지에 기초한 합성 이미지를 생성하고,

상기 헤어 모델은,

생성기(generator)가 가짜(fake) 이미지를 생성하고, 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이를 구분하며, 양자가 서로 경쟁하면서 학습되고,

상기 구분기는,

동일한 사람에 대한 복수 개의 얼굴 사진을 학습 데이터셋으로 입력받아 학습됨으로써 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 얼굴인지 여부를 판단하는 제 1 구분기; 및

동일한 헤어스타일에 대한 복수 개의 헤어스타일 사진을 학습 데이터셋으로 입력받아 학습됨으로써 상기 가짜 이미지와 상기 진짜 이미지에 대해 양자가 동일한 헤어스타일인지 여부를 판단하는 제 2 구분기;를 포함함으로써, 사진 내에서 얼굴과 헤어스타일을 별도로 구분하여 판단하는, 헤어디자이너 매칭 방법.
제 6 항에 있어서,

상기 헤어디자이너를 추천하는 단계는,

복수의 헤어디자이너의 시술 분야 및 경력 중 적어도 하나를 고려하여 헤어디자이너 후보를 적어도 하나 이상 표시하는 단계;를 포함하는, 헤어디자이너 매칭 방법.
제 7 항에 있어서,

상기 헤어디자이너를 추천하는 단계는,

표시된 상기 헤어디자이너 후보의 시술 비용, 시술 지역 및 시술 가능 일시 중 적어도 하나를 함께 표시함으로써 상기 사용자와 상기 헤어디자이너 후보 간의 시술 예약을 유도하는 단계;를 더 포함하는, 헤어디자이너 매칭 방법.
제 6 항에 있어서,

상기 이미지 합성 알고리즘은,

인코더(encoder)를 이용하여 다수의 헤어스타일을 포함하는 실제 이미지로부터 헤어스타일의 시맨틱(semantic) 특징을 인버전(inversion)함으로써 유사한 헤어스타일이 인접한 공간에 분포되는 잠재 공간(latent space)을 생성하고, 생성기(generator)가 잠재 공간(latent space) 내의 잠재 벡터(latent vector)를 입력받아 가짜(fake) 이미지를 생성하고, 구분기(discriminator)가 상기 가짜 이미지 및 진짜(real) 이미지를 입력받아 그 차이에 관한 손실(loss)을 산출하며, 상기 생성기는 상기 손실에 기초하여 진짜 이미지와 유사한 가짜 이미지를 생성하도록 학습하고, 상기 구분기는 상기 손실에 기초하여 상기 손실이 임계값 이내인지 여부를 판별하도록 학습하되 상기 제 1 구분기 및 상기 제 2 구분기 각각을 통해 산출된 손실을 상기 생성기에 제공하여 얼굴 및 헤어스타일에 대한 학습을 동시에 유도함으로써, 상기 헤어 모델을 학습하는, 헤어디자이너 매칭 방법.
제 6 항에 있어서,

상기 학습 데이터는,

시술 직후의 헤어스타일 이미지를 제공하는 제 1 데이터셋;

시술 직후의 시술 가능성이 낮은 헤어스타일 이미지를 제공하는 롱테일(longtail) 데이터인 제 2 데이터셋;

헤어스타일이 즉시 구분되지 않는 일상 헤어스타일 이미지를 제공하는 제 3 데이터셋; 및

시술되지는 않으나 다수의 사람들이 유지하는 헤어스타일 이미지를 제공하는 제 4 데이터셋;를 포함하되,

실제 주문이 많은 헤어스타일이 롱테일되는 부분의 데이터를 함께 갖추도록 데이터셋을 구성하는, 헤어디자이너 매칭 방법.