KR102657627B1 - 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램 - Google Patents

생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램 Download PDF

Info

Publication number
KR102657627B1
KR102657627B1 KR1020240008818A KR20240008818A KR102657627B1 KR 102657627 B1 KR102657627 B1 KR 102657627B1 KR 1020240008818 A KR1020240008818 A KR 1020240008818A KR 20240008818 A KR20240008818 A KR 20240008818A KR 102657627 B1 KR102657627 B1 KR 102657627B1
Authority
KR
South Korea
Prior art keywords
prompt
color
recommended
input
recommended color
Prior art date
Application number
KR1020240008818A
Other languages
English (en)
Inventor
이태희
문기환
엄대호
박연선
Original Assignee
주식회사 더매트릭스
(주)한국색채디자인개발원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 더매트릭스, (주)한국색채디자인개발원 filed Critical 주식회사 더매트릭스
Priority to KR1020240008818A priority Critical patent/KR102657627B1/ko
Application granted granted Critical
Publication of KR102657627B1 publication Critical patent/KR102657627B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0475Generative networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 실시 예에 따르면, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스 제공 서버가 개시된다. 상기 서버는, 사용자 단말로부터 수신한 카테고리 및 사용자 프롬프트를 이용해 제1 입력 프롬프트를 생성하는 입력 프롬프트 생성부; 대형 언어 모델에 미리 설정된 출력구조를 제공하는 출력 형태 구조화부; 및 대형 언어 모델에 제1 입력 프롬프트를 입력 값으로 제공하고, 대형 언어 모델로부터 제1 입력 프롬프트에 대한 출력 값을 미리 설정된 출력구조로 획득하는, 색채 추천부를 포함한다.

Description

생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램{SERVERS, SYSTEMS, METHODS, AND PROGRAMS THAT PROVIDE COLOR RECOMMENDATION AND IMAGE GENERATION SERVICES USING GENERATIVE AI MODELS}
본 발명은 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램에 관한 것이다.
본 명세서에서 달리 표시되지 않는 한, 이 섹션에 설명되는 내용들은 이 출원의 청구항들에 대한 종래 기술이 아니며, 이 섹션에 포함된다고 하여 종래 기술이라고 인정되는 것은 아니다.
일반 인공지능(General AI)은 인간의 지능을 모방하여 어떠한 인지 작업도 수행할 수 있는 AI를 의미한다. 이는 단순한 작업 수행을 넘어서서 추론, 문제 해결, 학습, 계획, 언어 이해, 창의적 사고 등 인간과 유사한 지능의 모든 측면을 포함한다.
일반 인공지능을 개발하기 위한 시도가 계속되고 있으며, 이를 거대 언어 모델과 같이 범용성이 뛰어나면서 성능이 우수한 인공지능 모델이 개발되고 있다.
이에 따라, 범용성이 높은 인공지능 모델의 활용에 대한 중요성이 대두되고 있으며, 범용성이 높은 인공지능 모델 활용 기술에 대한 개발이 활발하게 이루어지고 있다.
대한민국 등록특허공보 제10-2486300호(2023.01.04) 대한민국 공개특허공보 제10-2023-0133059호(2023.09.19) 대한민국 공개특허공보 제10-2021-0144294호(2021.11.30) 대한민국 공개특허공보 제10-2338913호(2021.12.08)
본 발명은, 거대 언어 모델 및 이미지 생성 모델을 이용해 사용자가 원하는 분위기의 제품과 적합한 색채를 추천하여 제공하는, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램을 제공하는 것을 일 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 일 측면은, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스 제공 서버를 제공한다.
상기 서버는, 사용자 단말로부터 수신한 카테고리 및 사용자 프롬프트를 이용해 제1 입력 프롬프트를 생성하는 입력 프롬프트 생성부; 대형 언어 모델에 미리 설정된 출력구조를 제공하는 출력 형태 구조화부; 및 대형 언어 모델에 제1 입력 프롬프트를 입력 값으로 제공하고, 대형 언어 모델로부터 제1 입력 프롬프트에 대한 출력 값을 미리 설정된 출력구조로 획득하는, 색채 추천부를 포함한다.
또한, 상기 입력 프롬프트 생성부는, 사용자 프롬프트에 포함된 형용사를 벡터화한 워드 벡터와 유사도가 가장 큰 형용사 벡터를 결정하고, 형용사 벡터가 속한 색채 그룹을 선택하며, 색채 그룹과 미리 매칭된 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 선택하고, 카테고리, 사용자 프롬프트에 포함된 형용사, 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 이용해 제1 입력 프롬프트를 생성한다.
또한, 상기 입력 프롬프트 생성부는, 카테고리를 개체로 지정하는 제1 문구를 생성하고, 사용자 프롬프트에 포함된 형용사를 분위기로 지정하는 제2 문구를 생성하며, 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보로 지정하는 제3 문구를 생성하고, 제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보에서 객체 및 분위기와 적합한 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 선택을 요청하는 제4 문구를 생성하며, 제1 문구, 제2 문구, 제3 문구 및 제4 문구를 포함하는 제1 입력 프롬프트를 생성한다.
또한, 상기 입력 프롬프트 생성부는, 카테고리, 사용자 프롬프트에 포함된 형용사, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드, 배합비, 접미어를 이용해 긍정 프롬프트를 생성하고, 카테고리, 사용자 프롬프트에 포함된 형용사, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 및 배합비를 이용해 부정 프롬프트를 생성하며, 상기 서버는, 긍정 프롬프트 및 부정 프롬프트를 이미지 생성 모델에 입력 값으로 입력하고, 이미지 생성 모델로부터 긍정 프롬프트 및 부정 프롬프트에 대한 출력 값을 획득하는, 이미지 생성부를 더 포함한다.
본 발명의 일 실시 예에 따르면, 거대 언어 모델을 이용해 사용자가 원하는 분위기의 제품과 적합한 색채를 추천하여 제공할 수 있다.
본 발명은의 일 실시 예에 따르면, 거대 언어 모델 및 이미지 생성 모델을 이용해 사용자가 원하는 분위기의 제품의 이미지를 생성하여 제공할 수 있다. 또한, 최적의 배합비 및 부정 프롬프트 설정을 통해 이미지의 품질을 향상시킬 수 있다.
도 1은 본 발명의 일 실시 예에 따른 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하기 위한 시스템에 대한 개요도이다.
도 2는 도 1에 따른 서비스 제공 서버의 기능적 모듈을 예시적으로 나타낸 블록도이다.
도 3은 도 1에 따른 서비스 제공 서버가 색채 추천 및 이미지 생성 서비스를 제공하는 과정을 도시하는 흐름도이다.
도 4는 사용자 프롬프트 입력을 위해 제공하는 사용자 인터페이스를 예시적으로 도시하는 도면이다.
도 5는 도 3의 S300단계의 구체적인 과정을 도시하는 흐름도이다.
도 6은 도 5의 S330단계의 구체적인 과정을 도시하는 흐름도이다.
도 7은 제1 입력 프롬프트를 예시적으로 도시하는 도면이다.
도 8은 도 3의 S400단계의 구체적인 과정을 도시하는 흐름도이다.
도 9는 제1 입력 프롬프트의 출력 구조를 예시적으로 도시하는 도면이다.
도 10은 추천되는 색채를 제공하는 사용자 인터페이스를 예시적으로 도시하는 도면이다.
도 11은 도 3의 S500단계의 구체적인 과정을 도시하는 흐름도이다.
도 12는 제2 입력 프롬프트를 예시적으로 도시하는 도면이다.
도 13은 도 1에 따른 서비스 제공 서버의 하드웨어 구성을 예시적으로 나타낸 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시 예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시 예에 따른 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하기 위한 시스템에 대한 개요도이다.
도 1을 참조하면, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하기 위한 시스템은, 서비스 제공 서버(100), 사용자 단말(200) 및 인공신경망 모델 서버(300)를 포함한다.
서비스 제공 서버(100), 사용자 단말(200) 및 인공신경망 모델 서버(300)는 네트워크를 통해 서로 연결된다.
아울러, 이러한 네트워크는 예컨대, 다수의 접속망(미도시) 및 코어망(미도시)을 포함하며, 외부망, 예컨대 인터넷망(미도시)을 포함하여 구성될 수 있다. 여기서, 접속망(미도시)은 서비스 제공 서버(100), 사용자 단말(200) 및 인공신경망 모델 서버(300)와 유무선 통신을 수행하는 접속망으로서, 예를 들어, BS(Base Station), BTS(Base Transceiver Station), NodeB, eNodeB 등과 같은 다수의 기지국과, BSC(Base Station Controller), RNC(Radio Network Controller)와 같은 기지국 제어기로 구현될 수 있다. 또한, 전술한 바와 같이, 상기 기지국에 일체로 구현되어 있던 디지털 신호 처리부와 무선 신호 처리부를 각각 디지털 유니트(Digital Unit, 이하 DU라 함)와 무선 유니트(Radio Unit, 이하 RU라 함)로 구분하여, 다수의 영역에 각각 다수의 RU(미도시)를 설치하고, 다수의 RU(미도시)를 집중화된 DU(미도시)와 연결하여 구성할 수도 있다.
또한, 접속망(미도시)과 함께 모바일 망을 구성하는 코어망(미도시)은 접속망(미도시)과 외부 망, 예컨대, 인터넷망(미도시)을 연결하는 역할을 수행한다.
이러한 코어망(미도시)은 앞서 설명한 바와 같이, 접속망(미도시) 간의 이동성 제어 및 스위칭 등의 이동통신 서비스를 위한 주요 기능을 수행하는 네트워크 시스템으로서, 서킷 교환(circuit switching) 또는 패킷 교환(packet switching)을 수행하며, 모바일 망 내에서의 패킷 흐름을 관리 및 제어한다. 또한, 코어망(미도시)은 주파수 간 이동성을 관리하고, 접속망(미도시) 및 코어망(미도시) 내의 트래픽 및 다른 네트워크, 예컨대 인터넷 망(미도시)과의 연동을 위한 역할을 수행할 수도 있다. 이러한 코어망(미도시)은 SGW(Serving GateWay), PGW(PDN GateWay), MSC(Mobile Switching Center), HLR(Home Location Register), MME(Mobile Mobility Entity)와 HSS(Home Subscriber Server) 등을 더 포함하여 구성될 수도 있다.
또한, 인터넷망(미도시)은 TCP/IP 프로토콜에 따라서 정보가 교환되는 통상의 공개된 통신망, 즉 공용망을 의미하는 것으로, 서비스 제공 서버(100), 사용자 단말(200) 및 인공신경망 모델 서버(300)로부터 제공되는 정보를 코어망(미도시) 및 접속망(미도시)을 거쳐 네트워크로 제공할 수 있고, 반대로 네트워크로 제공되는 정보를 코어망(미도시) 및 접속망(미도시)을 거쳐 서비스 제공 서버(100), 사용자 단말(200) 및 인공신경망 모델 서버(300)로 제공할 수도 있다. 그러나, 이에 한정되는 것은 아니며, 서비스 제공 서버(100)는 코어망(미도시)과 일체로 구현될 수도 있다.
또한, 상술한 통신 방식 이외에도 기타 널리 공지되었거나 향후 개발될 모든 형태의 통신 방식을 포함할 수 있다.
서비스 제공 서버(100)는, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다.
사용자 단말(200)은, 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 사용하려는 사용자의 단말을 의미한다.
사용자 단말(200)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크 톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 사용자 단말(200)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 사용자 단말(200)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(Smartphone), 스마트 패드(Smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치 를 포함할 수 있다.
인공신경망 모델 서버(300)는, 대규모 언어 생성 모델 및 이미지 생성 모델을 포함한다.
대규모 언어 생성 모델은, 인간과 유사한 텍스트를 생성하기 위해 딥러닝을 사용하 학습된 자기 회귀 언어 모델을 의미한다. 대량의 언어 데이터(corpus)를 수집하여 전처리 후 학습에 사용하며, 레이어 수, 모델의 크기 및 기타 하이퍼파라미터를 결정하여 모델을 학습시킨다. 대규모 언어 생성 모델의 학습에는 트랜스포머, Adam 등의 알고리즘이 사용될 수 있다. 다만, 이에 한정되는 것은 아니다. 대량의 언어 데이터를 이용하여 학습 시, 사용하는 알고리즘에 맞춰 설정된 손실 함수를 최소화하는 방향으로 파라미터를 최적화하여 대규모 언어 생성 모델을 학습시킨다. 일 실시 예에서, 대규모 언어 생성 모델로 Apen AI사의 GPT-2, GPT-3, GPT-4 등이 사용될 수 있다. 다만, 이에 한정되는 것은 아니고, 앞으로 생성되는 새로운 버전의 대규모 언어 생성 모델이 사용될 수 있다.
이미지 생성 모델은, 수집된 훈련된 이미지 데이터를 전처리하고, 전처리된 이미지 데이터를 이용한 훈련을 통해 생성된다. 일 실시 예에서, 이미지 생성 모델은, Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), Stable diffusion, Auto-Regressive Models (e.g., PixelRNN, PixelCNN) 등의 알고리즘을 이용해 생성될 수 있다. 다만, 이에 한정되는 것은 아니며, 공지된 다양한 알고리즘이 사용될 수 있다. 훈련 과정에서 설정된 알고리즘에 대해 정의된 손실 함수를 최소화하는 방향으로 파라미터가 설정되며, 이를 통해 이미지 생성 모델의 성능이 향상될 수 있다.
도시된 실시 예에서, 인공신경망 모델 서버(300)가 서비스 제공 서버(100)와 별도의 서버로 도시되나, 이에 한정되는 것은 아니며 서비스 제공 서버(100)와 인공신경망 모델 서버(300)가 일체로 형성될 수 있다.
도 2는 도 1에 따른 서비스 제공 서버(100)의 기능적 모듈을 예시적으로 나타낸 블록도이다.
서비스 제공 서버(100)는, 카테고리 선택부(101), 사용자 프롬프트 입력부(102), 입력 프롬프트 생성부(103), 출력 형태 구조화부(104), 색채 추천부(105) 및 이미지 생성부(106)를 포함한다.
서비스 제공 서버(100)가 사용자 단말(200)로 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 사용자 단말(200)은, 동적 객체 추적 및 인페인팅 서비스를 제공하는 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 사용자 단말(200)에서 구동될 수도 있다. 여기서, 웹 브라우저는 웹(WWW: World Wide Web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(Hyper Text Mark-up Language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크 롬(Chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(Application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(App)을 포함한다.
도 3은 도 1에 따른 서비스 제공 서버(100)가 색채 추천 및 이미지 생성 서비스를 제공하는 과정을 도시하는 흐름도이다.
도 3을 참조하면, 카테고리 선택부(101)가, 사용자 단말(200)로부터 카테고리를 수신한다(S100).
카테고리 선택부(101)는, 사용자 단말(200)에, 미리 설정된 복수의 카테고리 중 어느 하나를 선택할 수 있는 사용자 인터페이스를 제공할 수 있다. 사용자는 사용자 인터페이스를 통해 사용자가 색채를 추천받기를 원하는 카테고리를 사용자 단말(200)에 입력하고, 사용자 단말(200)은, 입력 받은 카테고리를 카테고리 선택부(101)에 제공한다. 일 실시 예에서, 카테고리 선택부(101)는, 복수의 메인 카테고리 중 어느 하나에 대한 선택을 입력하고, 선택한 메인 카테고리와 매칭되는 복수의 서브 카테고리 중 어느 하나에 대한 선택을 입력할 수 있는 사용자 인터페이스를 사용자 단말(200)에 제공할 수 있다. 예를 들어, "인테리어, 익스테리어"가 메인 카테고리로 설정되고, "인테리어"와 매칭되는 서브 카테고리로 "거실, 주방, 침실, 공부방, 아이방, 회의실, 사무실, 로비"가 설정될 수 있다. 다만, 이에 한정되는 것은 아니고, 사용자 설정에 따라 다양한 카테고리가 설정될 수 있다.
사용자 프롬프트 입력부(102)는, 사용자 단말(200)로부터 사용자 프롬프트를 수신한다(S200).
사용자 프롬프트 입력부(102)는, 사용자 단말(200)에, 사용자 프롬프트를 입력할 수 있는 사용자 인터페이스를 제공할 수 있다. 일 실시 예에서, 사용자는 사용자 인터페이스를 통해 텍스트 형태의 데이터인 사용자 프롬프트를 사용자 단말(200)에 입력하고, 사용자 단말(200)은 사용자로부터 수신한 사용자 프롬프트를 사용자 프롬프트 입력부(102)에 제공할 수 있다.
도 4는 사용자 프롬프트 입력을 위해 제공하는 사용자 인터페이스를 예시적으로 도시하는 도면이다.
도 4를 참조하면, 사용자 프롬프트 입력부(102)는, 사용자 단말(200)에 사용자가 입력한 카테고리(1a) 및 사용자 프롬프트 입력창(1b)을 디스플레이할 수 있다. 사용자 단말(200)은 사용자 프롬프트 입력창(1b)을 통해 사용자로부터 텍스트 형태의 사용자 프롬프트를 입력받을 수 있다.
다시 도 3을 참조하면, 입력 프롬프트 생성부(103)는, 카테고리 및 사용자 프롬프트를 이용해 색채 추천을 위한 제1 입력 프롬프트를 생성한다(S300).
도 5는 도 3의 S300단계의 구체적인 과정을 도시하는 흐름도이다.
도 5를 참조하면, 입력 프롬프트 생성부(103)는, 사용자 프롬프트와 매칭되는 색채 그룹을 결정한다(S310).
입력 프롬프트 생성부(103)는, 텍스트 정제, 토큰화, 불용어 제거, 품사 태그, 구문 분석, 문자 정규화 등을 통해 사용자 프롬프트에서 형용사를 추출하고 벡터화한다. 일 실시 예에서, 입력 프롬프트 생성부(103)는, Word Embedding을 통해 벡터화를 수행할 수 있다. 다만, 이에 한정되는 것은 아니다.
사용자 프롬프트로부터 워드 벡터가 생성되면, 입력 프롬프트 생성부(103)는, 워드 벡터와 미리 설정된 형용사를 벡터화한 형용사 벡터 사이의 유사도를 산출하고, 유사도가 가장 높은 형용사 벡터를 선정하며, 선정된 형용사 벡터가 속한 색채 그룹을 선택한다.
일 실시 예에서, 서비스 제공 서버(100)의 데이터베이스에는, 미리 설정된 복수의 색채 그룹 각각과 미리 설정된 복수의 형용사가 미리 매칭되어 저장될 수 있다. 예를 들어, 형용사 "거친, 권력있는, 야성적인, 건조한, 와일드한, 터프한, 흥분한, 열광적인, 힘센, 공격적인"과 색채 그룹"거친"이 매칭되어 저장될 수 있다. 예를 들어, 형용사 "격조있는, 격식있는, 고귀한, 기품있는, 맵시있는, 숭고한"이 색채 그룹 "격조있는"과 매칭되어 저장될 수 있다. 다만, 이에 한정되는 것은 아니며 설정에 따라 다양한 형용사 및 색채 그룹이 매칭될 수 있다.
예를 들어, 사용자 프롬프트가 "삭막한 분위기"이고, 사용자 프롬프트로부터 "삭막한"에 대한 워드 벡터가 생성되고 워드 벡터와 유사도가 가장 큰 형용사가 "건조한"인 경우, 입력 프롬프트 생성부(103)는, "건조한"이 속한 색채 그룹 "거친"을 사용자 프롬프트와 매칭되는 색채 그룹으로 결정할 수 있다.
일 실시 예에서, 코사인 유사도 (Cosine Similarity), 유클리드 거리 (Euclidean Distance) 등이 유사도 결정에 사용될 수 있다. 다만, 이에 한정되는 것은 아니다.
입력 프롬프트 생성부(103)는, 결정된 색채 그룹과 매칭되는 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 결정한다(S320).
서비서 제공 서버(100)의 데이터베이스에는 미리 설정된 복수의 색채 그룹 각각과 미리 설정된 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드가 매칭되어 저장될 수 있다.
일 실시 예에서, 주조색 코드, 보조색 코드 및 강조색 코드를 표시하는 방법으로 Hexadecimal Color Codes가 사용될 수 있다. 예를 들어, #183533, #2a313d, #85868f와 같은 형태의 코드가 사용될 수 있다. 다만, 이에 한정되는 것은 아니다. Hexadecimal Color Codes 외에 공지된 다양한 색채 표시 체계가 사용될 수 있다.
입력 프롬프트 생성부(103)는, 데이터베이스에서 검색된 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 결정된 색채 그룹과 매칭되는 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드로 결정한다.
입력 프롬프트 생성부(103)는, 카테고리, 사용자 프롬프트, 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 이용해 제1 입력 프롬프트를 생성한다(S330).
도 6은 도 5의 S330단계의 구체적인 과정을 도시하는 흐름도이다. 도 7은 제1 입력 프롬프트를 예시적으로 도시하는 도면이다.
입력 프롬프트 생성부(103)는, 카테고리를 객체로 지정하는 제1 문구를 생성한다(S331).
도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 카테고리와 객체를 등호로 연결하는 제1 문구(2a)를 생성할 수 있다. 다만, 이에 한정되는 것은 아니며, 입력 프롬프트 생성부(103)는, 추천의 대상이 되는 객체가 카테고리와 같음을 나타내는 다양한 형태의 제1 문구를 생성할 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 제1 문구 서식의 지정된 위치에 카테고리를 입력하여 제1 문구를 생성할 수 있다.
입력 프롬프트 생성부(103)는, 사용자 프롬프트에 포함된 형용사를 분위기로 지정하는 제2 문구를 생성한다(S332).
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 제2 문구 서식의 지정된 위치에 사용자 프롬프트로부터 획득한 형용사를 입력하여 제2 문구를 생성할 수 있다.
도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 사용자 프롬프트로부터 획득한 형용사와 분위기를 등호로 연결하는 제2 문구(2b)를 생성할 수 있다. 다만, 이에 한정되는 것은 아니며, 입력 프롬프트 생성부(103)는, 사용자 프롬프트로부터 획득한 형용사가 원하는 분위기와 같음을 나타내는 다양한 형태의 제2 문구를 생성할 수 있다.
입력 프롬프트 생성부(103)는, 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보로 지정하는 제3 문구를 생성한다(S333).
도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 복수의 주조색 코드와 추천을 받기를 원하는 첫 번째 색채의 후보군임을 나타내는 제1 클래스를 등호로 연결하고, 복수의 보조색 코드와 추천을 받기를 원하는 두 번째 색채의 후보군임을 나타내는 제2 클래스를 등호로 연결하며, 복수의 강조색 코드와 추천을 받기를 원하는 세 번째 색채의 후보군임을 나타내는 제3 클래스를 등호로 연결하는 제3 문구(2c)를 생성할 수 있다. 다만, 이에 한정되는 것은 아니며, 복수의 색채코드와 추천을 받기를 원하는 색채의 후보군임을 나타내는 클래스명이 같음을 나타내는 다양한 형태의 제3 문구를 생성할 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 제3 문구 서식의 지정된 위치에 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 입력하여 제3 문구를 생성할 수 있다.
입력 프롬프트 생성부(103)는, 제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보에서 객체 및 분위기와 적합한 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 선택을 요청하는 제4 문구를 생성한다(S334).
도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 제1 클래스, 제2 클래스 및 제3 클래스 각각으로부터 분위기 및 객체에 적합한 3개의 색채를 추천해달라고 요청하는 제4 문구를 생성할 수 있다. 일 실시 예에서, 추천을 요청하는 문구는, 분위기, 객체, 제1 클래스, 제2 클래스 및 제3 클래스를 포함하는 상태에서 다양한 형태로 작성될 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 제4 문구 서식의 지정된 위치에 사용자 프롬프트로부터 획득한 형용사, 객체, 제1 클래스, 제2 클래스 및 제3 클래스를 입력하여 제4 문구를 생성할 수 있다.
도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 추천되는 색이름, 추천되는 색채가 객체 및 분위기에 적합한 이유 및 추천되는 색채에 대한 추가적인 정보를 요청하는 제5 문구를 생성할 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 제5 문구를 사용할 수 있다.
입력 프롬프트 생성부(103)는, 제1 내지 제4 문구를 이용해 제1 입력 프롬프트를 생성한다(S335).
입력 프롬프트 생성부(103)는, 제1 문구, 제2 문구, 제3 문구 및 제4 문구를 포함하는 제1 입력 프롬프트를 생성할 수 있다.
입력 프롬프트 생성부(103)는, 제1 문구, 제2 문구, 제3 문구, 제4 문구 및 제5 문구를 포함하는 제1 입력 프롬프트를 생성할 수 있다.
다시 도 3을 참조하면, 출력 형태 구조화부(104) 및 색채 추천부(105)는, 대형 언어 모델로부터 제1 입력 프롬프트와 대응되는 출력을 획득한다(S400).
도 8은 도 3의 S400단계의 구체적인 과정을 도시하는 흐름도이다.
도 8을 참조하면, 출력 형태 구조화부(104)는, 대형 언어 모델에 미리 설정된 출력구조를 제공한다(S410).
출력 형태 구조화부(104)는, 대형 언어 모델에 미리 설정된 출력구조를 제공할 수 있다.
도 9는 제1 입력 프롬프트의 출력 구조를 예시적으로 도시하는 도면이다.
출력 형태 구조화부(104)는, 추천되는 색채에 대해 추천되는 색채의 색채 코드, 추천되는 색이름, 추천되는 색채가 추천되는 이유, 추천되는 색채에 대한 정보를 포함하도록 출력 구조를 설정하여 대형 언어 모델에 제공할 수 있다.
도시된 실시 예에서, 출력 형태 구조화부(104)는, 추천되는 색채의 색채 코드를 나타내는 제1 매개변수, 추천되는 색이름을 나타내는 제2 매개변수, 추천되는 색채가 추천되는 이유를 나타내는 제3 매개변수 및 추천되는 색채에 대한 정보를 나타내는 제4 매개변수 각각에 대한 설명을 매개변수 영역(3a)에 입력하고, 제1 매개변수, 제2 매개변수, 제3 매개변수, 제4 매개변수를 인자 영역(3b)에 입력하여 출력 구조를 생성할 수 있다. 다만, 이에 한정되는 것은 아니다. 도시된 실시 예에서, 1가지 추천 색채에 대해 색채 코드, 색이름, 색채가 추천되는 이유, 색채에 대한 정보를 출력하도록 구조화한 코드가 도시되나, 이에 한정되는 것은 아니며, 출력 형태 구조화부(104)는, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드에 대해 색채 코드, 색이름, 색채가 추천되는 이유, 색채에 대한 정보를 출력하도록 구조화한 코드를 대형 언어 모델에 제공할 수 있다.
다시 도 8을 참조하면, 색채 추천부(105)는, 대형 언어 모델에 제1 입력 프롬프트를 입력 값으로 제공하고(S420), 대형 언어 모델로부터 제1 입력 프롬프트에 대한 출력 값을 미리 설정된 출력구조로 획득한다(S430).
도 10은 추천되는 색채를 제공하는 사용자 인터페이스를 예시적으로 도시하는 도면이다.
도 10을 참조하면, 제1 입력 프롬프트에 대한 출력 값이 미리 설정된 출력구조로 디스플레이된 사용자 인터페이스가 예시적으로 도시된다. 도시된 실시 예에서, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드 각각에 대해 색채 코드, 색이름, 색채가 추천되는 이유 및 추천되는 색채에 대한 정보가 제공된다.
다시 도 3을 참조하면, 입력 프롬프트 생성부(103)는, 이미지 생성을 위한 제2 입력 프롬프트를 생성한다(S500).
도 11은 도 3의 S500단계의 구체적인 과정을 도시하는 흐름도이다. 도 12는 제2 입력 프롬프트를 예시적으로 도시하는 도면이다.
도 11을 참조하면, 입력 프롬프트 생성부(103)는, 카테고리, 사용자 프롬프트, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드, 배합비, 접미어를 이용해 긍정 프롬프트(3a)를 생성한다(S510).
일 실시 예에서, 입력 프롬프트 생성부(103)는, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 각각과 매칭되는 제1 추천 색이름, 제2 추천 색이름 및 제3 추천 색이름을 생성한다. 입력 프롬프트 생성부(103)는, 제1 추천 색이름, 제2 추천 색이름 및 제3 추천 색이름과 배합비를 매칭한다.
일 실시 예에서, 제1 추천 색이름, 제2 추천 색이름 및 제3 추천 색이름이 Midnight Blue color, Steel Blue color, Navy Blue color이고, 배합비가 1.5:1.3:1.1인 경우, 입력 프롬프트 생성부(103)는, 배합비와 제1 추천 색이름, 제2 추천 색이름 및 제3 추천 색이름을 매칭하는 배색 문구를 생성한다. 도시된 실시 예에서 배색 문구 "{(Midnight Blue color:1.5)|(Steel Blue color:1.3)|(Navy Blue color:1.1)}"가 생성된다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 카테고리, 배색 문구, 사용자 프롬프트, 접미어를 이용해 긍정 프롬프트를 생성한다. 도시된 실시 예에서, 입력 프롬프트 생성부(103)는, 서브 카테고리, 배색 문구, 사용자 프롬프트에서 추출된 형용사, 메인 카테고리, 접미어 순서로 나열하여 긍정 프롬프트를 생성한다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 접미어를 긍정 프롬프트에 포함시킬 수 있다. 예를 들어, "4K quality, masterpiece, detailed, best, quality, photorealistic"등이 접미어로 사용될 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 미리 설정된 배합비를 사용할 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 카테고리, 사용자 프롬프트, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드를 이용해 배합비를 결정할 수 있다. 입력 프롬프트 생성부(103)는, 미리 훈련된 배합비 결정 모델에, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드를 입력 값으로 입력하고, 배합비 결정 모델로부터 입력 값과 매칭되는 배합비를 획득할 수 있다.
배합비 결정 모델은, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드에 배합비를 레이블링하여 생성된 훈련데이터를 이용한 학습을 통해 훈련될 수 있다. 예를 들어, Kitchen, modern and intelligent, interior, #183663, #838c9b, #283659에 배합비 1.5:1.3:1.1을 레이블링하여 훈련데이터를 생성할 수 있다. 배합비 결정 모델의 학습에는, ANN(Artificial Neural Networks), RNN(Recurrent Neural Networks), LSTM(Long Short-Term Memory) 등 공지된 다양한 딥러닝 분야 알고리즘이 학습에 사용될 수 있다. 훈련 과정에서 선택한 알고리즘에 매칭되는 손실 함수를 최소화하는 방향으로 파라미터를 조절하여 배합비 결정 모델을 생성한다.
입력 프롬프트 생성부(103)는, 카테고리, 사용자 프롬프트, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드, 배합비를 이용해 부정 프롬프트(3b)를 생성한다(S520).
일 실시 예에서, 이미지 생성 모델은 부정적인 출력이미지에 사용된 프롬프트를 부정 프롬프트로 레이블링한 훈련데이터를 이용해 부정 프롬프트 입력 시 부정 프롬프트에 대해 레이블링된 출력이미지를 피하도록 학습될 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드에 부정 워드를 레이블링한 훈련 데이터를 이용한 학습을 통해 부정 워드 결정 모델을 생성할 수 있다. 예를 들어, Kitchen, modern and intelligent, interior, #183663, #838c9b, #283659에 text, nsfw, error를 레이블링하여 훈련 데이터를 생성할 수 있다. 부정 워드 결정 모델의 학습에는, ANN(Artificial Neural Networks), RNN(Recurrent Neural Networks), LSTM(Long Short-Term Memory) 등 공지된 다양한 딥러닝 분야 알고리즘이 학습에 사용될 수 있다. 훈련 과정에서 선택한 알고리즘에 매칭되는 손실 함수를 최소화하는 방향으로 파라미터를 조절하여 배합비 결정 모델을 생성한다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 부정 워드 결정 모델에, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드를 입력 값을 입력하고, 부정 워드 결정 모델로부터 획득한 부정 워드를 나열하여 부정 프롬프트를 생성할 수 있다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드에 부정 워드 및 가중치를 레이블링한 훈련 데이터를 이용한 학습을 통해 부정 워드 결정 모델을 생성할 수 있다. 예를 들어, Kitchen, modern and intelligent, interior, #183663, #838c9b, #283659에 text(1.8), nsfw(1), error(1)를 레이블링하여 훈련 데이터를 생성할 수 있다. 부정 워드 결정 모델의 학습에는, ANN(Artificial Neural Networks), RNN(Recurrent Neural Networks), LSTM(Long Short-Term Memory) 등 공지된 다양한 딥러닝 분야 알고리즘이 학습에 사용될 수 있다. 훈련 과정에서 선택한 알고리즘에 매칭되는 손실 함수를 최소화하는 방향으로 파라미터를 조절하여 배합비 결정 모델을 생성한다.
일 실시 예에서, 입력 프롬프트 생성부(103)는, 부정 워드 결정 모델에, 메인 카테고리, 서브 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드를 입력 값을 입력하고, 부정 워드 결정 모델로부터 획득한 부정 워드 및 가중치를 나열하여 부정 프롬프트를 생성할 수 있다.
다시 도 11을 참조하면, 입력 프롬프트 생성부(103)는, 긍정 프롬프트 및 부정 프롬프트를 이용해 제2 입력 프롬프트를 생성한다(S530).
다시 도 3을 참조하면, 이미지 생성부(106)는, 제2 입력 프롬프트를 이미지 생성 모델에 입력 값으로 입력하고, 이미지 생성 모델로부터 제2 입력 프롬프트와 매칭되는 출력값인 이미지를 획득한다.
이미지 생성부(106)는, 획득한 이미지를 사용자 단말(200)에 제공한다.
도 13은 도 1에 따른 서비스 제공 서버(100)의 하드웨어 구성을 예시적으로 나타낸 도면이다.
도 13을 참조하면, 서비스 제공 서버(100)는, 적어도 하나의 프로세서(110) 및 상기 적어도 하나의 프로세서(110)가 적어도 하나의 동작(operation)을 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.
상기 적어도 하나의 동작은 전술한 서비스 제공 서버(100)의 구성부들(101~106)이나 기타 기능 또는 동작 방법을 포함할 수 있다.
여기서 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시 예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다.
예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중 하나일 수 있고, 저장 장치(160)는, 플래시메모리(flash-memory), 하드디스크 드라이브(HDD), 솔리드 스테이트 드라이브(SSD), 또는 각종 메모리 카드(예를 들어, micro SD 카드) 등일 수 있다.
또한, 서버(100)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver)(130)를 포함할 수 있다. 또한, 서버(100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150), 저장 장치(160) 등을 더 포함할 수 있다. 서버(100)에 포함된 각각의 구성 요소들은 버스(bus, 170)에 의해 연결되어 서로 통신을 수행할 수 있다.
서버(100)의 예를 들면, 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (5)

  1. 생성형 AI 모델을 이용한 색채 추천 및 이미지 생성 서비스 제공 서버로서,
    사용자 단말로부터 수신한 카테고리 및 사용자 프롬프트를 이용해 제1 입력 프롬프트를 생성하는 입력 프롬프트 생성부;
    대형 언어 모델에 미리 설정된 출력구조를 제공하는 출력 형태 구조화부; 및
    대형 언어 모델에 제1 입력 프롬프트를 입력 값으로 제공하고, 대형 언어 모델로부터 제1 입력 프롬프트에 대한 출력 값을 미리 설정된 출력구조로 획득하는, 색채 추천부를 포함하고,
    상기 입력 프롬프트 생성부는,
    사용자 프롬프트에 포함된 형용사를 벡터화한 워드 벡터와 유사도가 가장 큰 형용사 벡터를 결정하고, 형용사 벡터가 속한 색채그룹을 선택하며,
    색채그룹과 미리 매칭된 복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 선택하고,
    카테고리를 객체로 지정하는 제1 문구를 생성하고,
    사용자 프롬프트에 포함된 형용사를 분위기로 지정하는 제2 문구를 생성하며,
    복수의 주조색 코드, 복수의 보조색 코드 및 복수의 강조색 코드를 제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보로 지정하는 제3 문구를 생성하고,
    제1 추천 색채 후보, 제2 추천 색채 후보 및 제3 추천 색채 후보에서 객체 및 분위기와 적합한 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 선택을 요청하는 제4 문구를 생성하며,
    제1 문구, 제2 문구, 제3 문구 및 제4 문구를 포함하는 제1 입력 프롬프트를 생성하고,
    미리 훈련된 배합비 결정 모델에, 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드를 입력 값으로 입력하고, 배합비 결정 모델로부터 입력 값과 매칭되는 배합비를 획득하며,
    카테고리, 사용자 프롬프트에 포함된 형용사, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드, 배합비 및 접미어를 이용해 제2 입력 프롬프트를 생성하고,
    상기 서버는,
    제2 입력 프롬프트를 이미지 생성 모델에 입력 값으로 입력하고, 이미지 생성 모델로부터 제2 입력 프롬프트에 대한 출력 값을 획득하는, 이미지 생성부를 더 포함하며,
    배합비 결정 모델은, 카테고리, 사용자 프롬프트에서 추출된 형용사, 제1 추천 색채코드, 제2 추천 색채코드 및 제3 추천 색채코드에 배합비를 레이블링하여 생성된 훈련데이터를 이용한 학습을 통해 훈련되는,
    서버.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 입력 프롬프트 생성부는,
    카테고리, 사용자 프롬프트에 포함된 형용사, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드, 배합비, 접미어를 이용해 긍정 프롬프트를 생성하고,
    카테고리, 사용자 프롬프트에 포함된 형용사, 제1 추천 색채코드, 제2 추천 색채코드, 제3 추천 색채코드 및 배합비를 이용해 부정 프롬프트를 생성하며,
    상기 서버는,
    긍정 프롬프트 및 부정 프롬프트를 이미지 생성 모델에 입력 값으로 입력하고, 이미지 생성 모델로부터 긍정 프롬프트 및 부정 프롬프트에 대한 출력 값을 획득하는, 이미지 생성부를 더 포함하는,
    서버.
KR1020240008818A 2024-01-19 2024-01-19 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램 KR102657627B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020240008818A KR102657627B1 (ko) 2024-01-19 2024-01-19 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020240008818A KR102657627B1 (ko) 2024-01-19 2024-01-19 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램

Publications (1)

Publication Number Publication Date
KR102657627B1 true KR102657627B1 (ko) 2024-04-17

Family

ID=90876223

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020240008818A KR102657627B1 (ko) 2024-01-19 2024-01-19 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램

Country Status (1)

Country Link
KR (1) KR102657627B1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210075036A (ko) * 2020-05-20 2021-06-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 데이터 세트 처리 방법, 장치, 전자 기기 및 저장 매체
KR20210144294A (ko) 2020-05-22 2021-11-30 삼성에스디에스 주식회사 이미지 분할 모델 학습 장치 및 방법
KR102338913B1 (ko) 2021-03-15 2021-12-14 주식회사 도터 혈관내 광단층 영상에서의 생분해성 스텐트를 포함하는 딥러닝 기반 영상 분할 방법
KR20220117545A (ko) * 2021-02-17 2022-08-24 연세대학교 산학협력단 이미지 검색 기반 감성 색채 배색 추천 장치 및 방법
KR102486300B1 (ko) 2022-09-20 2023-01-10 한국전자기술연구원 영상 인페인팅 장치 및 방법
KR20230040138A (ko) * 2021-09-15 2023-03-22 네이버 주식회사 타겟 정보 생성 방법 및 시스템
KR20230133059A (ko) 2022-03-10 2023-09-19 주식회사 엘지유플러스 인공지능 기반 디지털 미디어 컨텐츠 자동 제작 방법, 장치 및 시스템

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210075036A (ko) * 2020-05-20 2021-06-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 데이터 세트 처리 방법, 장치, 전자 기기 및 저장 매체
KR20210144294A (ko) 2020-05-22 2021-11-30 삼성에스디에스 주식회사 이미지 분할 모델 학습 장치 및 방법
KR20220117545A (ko) * 2021-02-17 2022-08-24 연세대학교 산학협력단 이미지 검색 기반 감성 색채 배색 추천 장치 및 방법
KR102338913B1 (ko) 2021-03-15 2021-12-14 주식회사 도터 혈관내 광단층 영상에서의 생분해성 스텐트를 포함하는 딥러닝 기반 영상 분할 방법
KR20230040138A (ko) * 2021-09-15 2023-03-22 네이버 주식회사 타겟 정보 생성 방법 및 시스템
KR20230133059A (ko) 2022-03-10 2023-09-19 주식회사 엘지유플러스 인공지능 기반 디지털 미디어 컨텐츠 자동 제작 방법, 장치 및 시스템
KR102486300B1 (ko) 2022-09-20 2023-01-10 한국전자기술연구원 영상 인페인팅 장치 및 방법

Similar Documents

Publication Publication Date Title
CN107491547A (zh) 基于人工智能的搜索方法和装置
CN110582762A (zh) 自动响应服务器装置、终端装置、响应系统、响应方法及程序
US9721265B2 (en) Systems and methods for generating adaptive surveys and review prose
TWI703862B (zh) 內容推薦方法及裝置
CN111813910B (zh) 客服问题的更新方法、系统、终端设备及计算机存储介质
CN107305578A (zh) 人机智能问答方法和装置
KR102384860B1 (ko) 템플릿이 제공되어 상품 업로드 편의성이 향상된 오픈마켓 플랫폼의 운영방법
KR102446649B1 (ko) 인공지능 모델 기반 추천 템플릿을 이용한 어플리케이션 제작 방법 및 장치
CN111680165A (zh) 信息匹配方法、装置、可读存储介质和电子设备
CN116757270A (zh) 基于人机交互模型或大模型的数据处理方法、服务器
CN114974253A (zh) 一种基于人物画像的自然语言解释方法、装置及存储介质
KR102657627B1 (ko) 생성형 ai 모델을 이용한 색채 추천 및 이미지 생성 서비스를 제공하는 서버, 시스템, 방법 및 프로그램
KR102602936B1 (ko) 인공 지능을 통해 수집한 데이터를 기반으로 숏폼을 자동으로 생성하는 전자 장치 및 이를 이용한 방법
CN111858930A (zh) 一种社交电商用户画像的建立方法
CN116737133A (zh) 布局生成方法、设计稿布局生成方法及装置
CN115879440A (zh) 自然语言处理、模型训练方法、装置、设备及存储介质
KR102286661B1 (ko) 채팅을 기반으로 한 주문형 쇼핑 큐레이션 장치
CN114519094A (zh) 基于随机状态的话术推荐方法、装置及电子设备
CN111222011B (zh) 一种视频向量确定方法和装置
CN112926329A (zh) 文本生成方法、装置、设备及计算机可读存储介质
CN114283300A (zh) 标签确定方法及装置、模型训练方法及装置
KR102662411B1 (ko) 생성형 ai 모델을 이용한 동적 객체 추적, 인페인팅 및 아웃페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램
KR102464356B1 (ko) 인공지능 기반 유저에게 상품을 자동으로 추천하는 셀러와 유저를 매칭시키는 오픈마켓 플랫폼의 운영방법
CN113535970A (zh) 信息处理方法和装置、电子设备以及计算机可读存储介质
KR102655359B1 (ko) 생성형 ai 모델을 이용해 인페인팅 서비스 제공 서버, 시스템, 방법 및 프로그램

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant