KR102549980B1 - 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법 - Google Patents

강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법 Download PDF

Info

Publication number
KR102549980B1
KR102549980B1 KR1020200181469A KR20200181469A KR102549980B1 KR 102549980 B1 KR102549980 B1 KR 102549980B1 KR 1020200181469 A KR1020200181469 A KR 1020200181469A KR 20200181469 A KR20200181469 A KR 20200181469A KR 102549980 B1 KR102549980 B1 KR 102549980B1
Authority
KR
South Korea
Prior art keywords
virtual space
control operation
objects
learning
state
Prior art date
Application number
KR1020200181469A
Other languages
English (en)
Other versions
KR20220090695A (ko
Inventor
김수민
Original Assignee
주식회사 어반베이스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 어반베이스 filed Critical 주식회사 어반베이스
Priority to KR1020200181469A priority Critical patent/KR102549980B1/ko
Priority to EP21911536.7A priority patent/EP4246418A1/en
Priority to PCT/KR2021/019629 priority patent/WO2022139469A1/ko
Priority to CN202180086656.8A priority patent/CN116745797A/zh
Priority to JP2023535888A priority patent/JP2023553638A/ja
Publication of KR20220090695A publication Critical patent/KR20220090695A/ko
Priority to US18/331,703 priority patent/US20230315929A1/en
Application granted granted Critical
Publication of KR102549980B1 publication Critical patent/KR102549980B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computational Mathematics (AREA)
  • Civil Engineering (AREA)
  • Structural Engineering (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

본 발명의 일 실시예에 따른 사물 배치 모델 제공 방법은 인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 상기 가상 공간의 변수를 변화시키는 제어 동작, 상기 가상 공간에 배치되어 상기 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 상기 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정하여 강화 학습의 대상이 되는 학습 환경을 생성하는 단계; 상기 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습시키는 제1 신경망을 생성하는 단계; 상기 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 상기 가치 함수의 예측값을 기초로, 상기 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시키는 제2 신경망을 생성하는 단계; 및 상기 제1 신경망 및 상기 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행하는 단계를 포함할 수 있다.

Description

강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법{APPARATUS AND METHOD FOR PROVIDING MODEL FOR ARRANGEMENT OF OBJECT OF INTERIOR SERVICE BASED ON REINFORCEMENT LEARNING}
본 발명은 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법에 관한 것이다.
사람들은 살아가면서 자신의 개성에 부합하면서 보다 아름다운 주거 환경을 추구하고자 하는 욕구를 가지고 있다. 이를 위해, 간단하게는 주거 공간에 새로운 사물을 배치하여 인테리어를 꾸미거나, 나아가 벽지나 바닥재를 교체하고 공간의 구조를 변경하는 등의 인테리어 공사를 진행하기도 한다.
종래에는 인테리어 공사를 위해 의뢰인이 인테리어 전문가에게 자신이 원하는 공간을 만들고자 주거 환경 등의 인테리어 시안을 의뢰하고, 의뢰받은 인테리어 전문가는 고객이 원하는 인테리어를 설계하여 고객에게 제시하는 방식으로 진행하였다.
그러나 현재는 가상 공간에 사용자가 직접 각종 인테리어 요소를 꾸며볼 수 있는 인테리어 서비스(ex. 3D 공간 데이터 플랫폼 어반베이스)가 개발됨에 따라, 인테리어 서비스의 사용자가 직접 자신의 주거 환경을 이식한 가상 공간에 자신의 취향대로 사물을 배치하고 손쉽게 바닥재/벽지 등을 교체해 볼 수 있다.
이에 따라, 사용자들은 가상 공간의 인테리어를 통해 실제 인테리어를 간접적으로 체감할 수 있으며, 자신의 마음에 드는 실제 인테리어 상품을 주문하거나, 실제 시공과 연동된 인테리어 발주를 넣는 등의 서비스를 제공받고 있다.
한국 공개특허공보 제10-2017-0139903호: 인테리어 서비스 방법 및 인테리어 서비스 시스템
상술한 인테리어 서비스는 사용자가 가상 공간에 직접 각종 인테리어 요소를 꾸며볼 수 있도록, 다양한 종류의 사물, 바닥재, 벽지 등의 인테리어 요소를 사용자의 가상 공간에 제공한다.
한편, 인테리어 요소들의 배치는 미적인 측면과 실용적인 측면에서 모두 중요한데, 인테리어 서비스의 사용자가 인테리어 전문가가 아닌 경우에는 수많은 종류의 사물, 바닥재, 벽지 등을 선택하고 배치하는 데에 어려움을 겪을 수 있다.
이에 따라, 본 발명의 실시예에서 해결하고자 하는 과제는 인테리어 서비스를 사용하는 사용자의 가상 공간에서 사물들의 조화와 동선 등을 고려하여, 인테리어 요소들이 배치될 위치를 자동으로 추천하는 기술을 제공하고자 한다.
다만, 본 발명의 실시예가 이루고자 하는 기술적 과제는 이상에서 언급한 과제로 제한되지 않으며, 이하에서 설명할 내용으로부터 통상의 기술자에게 자명한 범위 내에서 다양한 기술적 과제가 도출될 수 있다.
본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치는 소정의 동작을 수행하도록 하는 명령어들을 저장하는 하나 이상의 메모리; 및 상기 하나 이상의 메모리와 동작 가능 하도록 연결되어 상기 명령어들을 실행하도록 설정된 하나 이상의 프로세서를 포함하고, 상기 프로세서가 수행하는 동작은 인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 상기 가상 공간의 변수를 변화시키는 제어 동작, 상기 가상 공간에 배치되어 상기 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 상기 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정하여 강화 학습의 대상이 되는 학습 환경을 생성하는 동작; 상기 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습시키는 제1 신경망을 생성하는 단계; 상기 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 상기 가치 함수의 예측값을 기초로, 상기 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시키는 제2 신경망을 생성하는 동작; 및 상기 제1 신경망 및 상기 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행하는 동작을 포함할 수 있다.
또한, 상기 변수는 상기 가상 공간을 구성하는 벽 및 바닥의 위치, 각도, 영역을 특정하는 제1 변수; 및 상기 가상 공간에 배치되는 사물의 위치, 각도, 영역을 특정하는 제2 변수를 포함할 수 있다.
또한, 상기 제1 변수는 상기 벽의 중점을 특정하는 위치 좌표, 상기 벽이 배치된 각도를 특정하는 오일러 각도, 상기 바닥의 중심 좌표, 및 상기 바닥의 경계면을 특정하는 폴리곤 정보를 포함할 수 있다.
또한, 상기 제2 변수는 상기 사물의 중점을 특정하는 위치 좌표, 상기 사물의 가로/세로/폭의 크기를 특정하는 크기 정보, 상기 사물이 배치된 각도를 특정하는 오일러 각도, 및 상기 사물과 다른 사물과의 간섭을 평가하는 데에 사용되는 간섭 정보를 포함할 수 있다.
또한, 상기 간섭 정보는 상기 가로/세로/폭의 크기의 내에 상기 사물의 중점을 포함하는 육면체의 면 중 어느 한 면의 넓이에 소정의 거리를 곱한 부피만큼 돌출된 다면체 형태가 차지하게 되는 공간에 대한 정보를 포함할 수 있다.
또한, 상기 정책은 상기 사물 중 상기 가상 공간의 바닥이나 벽에 접하여 다른 사물을 지지하는 사물을 제1 계층으로 분류하고, 상기 사물 중 상기 제1 계층의 사물에 접하여 지지를 받는 사물을 제2 계층으로 분류하여, 소정의 제1 계층의 사물과 연관되어 함께 배치되는 관계쌍으로 설정된 제2 계층의 사물의 종류, 소정의 제1 계층의 사물과 관계쌍인 제2 계층의 사물과의 배치 거리, 소정의 제1 계층의 사물과 관계쌍인 제2 계층의 사물의 배치 방향에 대해 기 정의된 제1 정책과, 소정의 사물이 배치되는 높이에 대한 범위를 기 정의한 제2 정책과, 상기 가상 공간의 현관으로부터 모든 종류의 공간에 최단 공간으로 도달하는 동선을 소정 너비의 면적으로 인식하도록 기 정의한 제3 정책을 포함할 수 있다.
또한, 상기 제어 동작은 상기 가상 공간 내에서 상기 에이전트의 위치 및 각도에 대한 변수를 변화시키는 동작을 포함할 수 있다.
또한, 상기 보상은 상기 제어 동작에 따라 변화된 상기 학습 환경의 상태가 상기 제1, 제2, 제3 정책 각각에 부합하는 정도에 대해 평가하는 기 설정된 복수의 평가식에 따라 계산되고, 상기 복수의 평가식 각각에 대해 반영할 비율을 정한 가중치로 조합하여 결정될 수 있다.
또한, 상기 복수의 평가식은 가상 공간 내 사물 간 거리에 대한 평가 점수, 가상 공간 내 사물을 거리에 따라 그룹으로 분류한 후 분류된 사물 그룹 간의 거리에 대한 평가 점수, 가상 공간 내 사물 간 정렬 관계에 대한 평가 점수, 상기 사물 그룹 간의 정렬 관계에 대한 평가 점수, 상기 사물 그룹과 벽과의 정렬 관계에 대한 평가 점수, 사물이 배치된 높이에 대한 평가 점수, 바닥의 여유 공간에 대한 평가 점수, 사물이 벽에 배치된 밀도에 대한 평가 점수, 동선의 길이에 대한 평가 점수를 포함할 수 있다.
또한, 상기 장치에 의해 생성된 사물 배치 모델을 저장하는 메모리; 및 인테리어 서비스의 사용자로부터 소정의 사물에 대한 배치 요청을 수신하는 입력 인터페이스; 상기 사용자의 가상 공간의 상태에 관한 정보와 상기 소정의 사물에 대한 정보를 특정하는 변수를 생성한 후, 상기 변수를 상기 사물 배치 모델에 입력하여 출력된 제어 동작을 기초로 상기 가상 공간에서 상기 소정의 사물에 대한 배치 공간을 결정하는 프로세서를 포함할 수 있다.
본 발명의 일 실시예에 따른 사물 배치 모델 제공 방법은 인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 상기 가상 공간의 변수를 변화시키는 제어 동작, 상기 가상 공간에 배치되어 상기 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 상기 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정하여 강화 학습의 대상이 되는 학습 환경을 생성하는 단계; 상기 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습시키는 제1 신경망을 생성하는 단계; 상기 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 상기 가치 함수의 예측값을 기초로, 상기 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시키는 제2 신경망을 생성하는 단계; 및 상기 제1 신경망 및 상기 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행하는 단계를 포함할 수 있다.
본 발명의 실시예에 따르면, 강화 학습을 기반으로 인테리어 서비스의 가상 공간에서 사물이 차지하는 크기, 사물 간의 간섭, 함께 배치하는 사물들의 조화, 배치 밀도, 사물들이 배치됨에 따른 공간의 동선 등을 고려하여 최적의 사물 배치 기술을 제공할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도 1은 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치의 기능 블록도이다.
도 2는 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치가 사물 배치 모델에 대한 학습을 수행하는 사물 배치 모델 제공 방법의 동작 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 학습 환경에서 가상 공간의 예시도이다.
도 4는 본 발명의 일 실시예에 따른 학습 환경에서 사물을 특정하는 동작의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 학습 환경에서 관계쌍에 해당하는 제1 계층의 사물 및 제2 계층의 사물에 대해 기 정의된 정보의 예시도이다.
도 6은 본 발명의 일 실시예에 따라 강화 학습 기반으로 가치 함수 및 정책 함수를 학습시키는 동작을 설명하기 위한 예시도이다.
도 7은 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치가 사물 배치 모델을 통해 사물이 배치될 위치를 결정하는 사물 배치 모델 제공 방법의 동작 흐름도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.  그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하여지도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명의 범주는 청구항에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명하면서 공지 기능 또는 구성에 대한 구체적인 설명은 본 발명의 실시예들을 설명하면서 실제로 필요한 경우 외에는 생략될 것이다.  그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다.  그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도면에 표시되고 아래에 설명되는 기능 블록들은 가능한 구현의 예들일 뿐이다. 다른 구현들에서는 상세한 설명의 사상 및 범위를 벗어나지 않는 범위에서 다른 기능 블록들이 사용될 수 있다. 또한 본 발명의 하나 이상의 기능 블록이 개별 블록들로 표시되지만, 본 발명의 기능 블록 중 하나 이상은 동일 기능을 실행하는 다양한 하드웨어 및 소프트웨어 구성의 조합일 수 있다.
또한 어떤 구성 요소들을 포함한다는 표현은 개방형의 표현으로서 해당 구성 요소들이 존재하는 것을 단순히 지칭할 뿐이며, 추가적인 구성 요소들을 배제하는 것으로 이해되어서는 안 된다.
나아가 어떤 구성 요소가 다른 구성 요소에 연결되어 있다거나 접속되어 있다고 언급될 때에는, 그 다른 구성 요소에 직접적으로 연결 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 한다.
또한 '제1, 제2' 등과 같은 표현은 복수의 구성을 구분하기 위한 용도로만 사용된 표현으로써, 구성들 사이의 순서나 기타 특징들을 한정하지 않는다.
이하에서는 도면들을 참조하여 본 발명의 실시예들에 대해 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치(100)의 기능 블록도이다. 도 1을 참조하면, 일 실시예에 따른 사물 배치 모델 제공 장치(100)는 메모리(110), 프로세서(120), 입력 인터페이스(130), 디스플레이부(140) 및 통신 인터페이스(150)를 포함할 수 있다.
메모리(110)는 빅데이터 DB(111), 사물 배치 모델(113) 및 명령어 DB(115)를 포함할 수 있다.
빅데이터 DB(111)는 인테리어 서비스로부터 수집되는 다양한 데이터를 포함할 수 있다. 인테리어 서비스란, 실제 공간의 모습을 3차원의 가상 공간에 이식하여 가상의 인테리어 요소를 꾸며볼 수 있는 기능을 제공하는 서비스를 포함할 수 있다. 인테리어 서비스를 사용하는 사용자들은 자신의 취향대로 가상 공간에 사물/바닥재/벽지 등의 인테리어 요소를 배치할 수 있다. 인테리어 서비스를 사용하는 사용자들은 다른 사용자들이 꾸민 가상 공간의 인테리어를 보고 공감 기능(ex. 좋아요 버튼) 등을 통해 반응할 수 있다. 또한, 인테리어 서비스를 통해 사용자들이 특정 인테리어를 조회한 조회 수가 집계될 수 있다.
빅데이터 DB(111)가 인테리어 서비스로부터 수집되는 모든 정보를 빅데이터로서 저장할 수 있다. 예를 들어, 빅데이터는 인테리어 서비스의 사용자 정보, 사용자가 인테리어한 공간에 대한 정보, 인테리어한 방 종류에 대한 정보, 사용자가 배치한 사물, 벽지, 바닥재 등에 대한 정보, 사용자의 취향에 대한 정보, 사용자들이 특정 인테리어에 대해 평가한 정보, 사용자들이 특정 인테리어를 조회한 횟수에 대한 정보 등을 포함할 수 있다.
사물 배치 모델(113)은 강화 학습을 기반으로 인테리어 서비스의 가상 공간에서 사물이 차지하는 크기, 사물 간의 간섭, 함께 배치하는 사물들의 조화, 배치 밀도, 사물들이 배치됨에 따른 공간의 동선 등을 고려하여 인테리어 서비스의 사용자에게 인테리어 요소가 배치될 최적의 위치와 방향을 추천하는 인공지능 모델이다. 사물 배치 모델(113)은 도 2와 함께 후술될 실시예에 따라 학습이 수행되어 메모리(110)에 저장될 수 있다.
본 발명의 실시예에서 강화 학습은 인테리어 서비스의 가상 공간에서 특정한 사물을 배치하는 경우, 해당 사물이 다른 사물과의 조화, 간섭, 동선 등을 고려하여 최적의 위치에 배치되는 목적을 달성하기 위해, 제어하는 대상인 에이전트(ex. 가상 공간에 배치될 사물)가 어떤 위치에 배치되도록 제어 동작(ex. 배치될 위치, 각도 등을 결정)을 취해야 하는지 판별하는 사물 배치 모델을 생성하는 데에 사용된다. 예를 들어, 본 발명의 실시예에서 강화 학습 알고리즘은 A2C(Advantage Actor-Critic) 모델을 사용할 수 있으나, 이러한 예시에 한정되지 않고 강화 학습의 개념에 기반한 다양한 알고리즘을 본 발명의 실시예에 적용할 수 있다.
명령어 DB(115)는 프로세서(120)의 동작을 수행시킬 수 있는 명령어들을 저장할 수 있다. 예를 들어, 명령어 DB(115)는 후술할 프로세서(120)의 동작들과 대응되는 동작을 수행하도록 하는 컴퓨터 코드를 저장할 수 있다.
프로세서(120)는 사물 배치 모델 제공 장치(100)가 포함하는 구성들, 메모리(110), 입력 인터페이스(130), 디스플레이부(140) 및 통신 인터페이스(150)의 전반적인 동작을 제어할 수 있다. 프로세서(120)는 환경 설정 모듈(121), 강화 학습 모듈(123) 및 제어 모듈(125)을 포함할 수 있다. 프로세서(120)는 메모리(110)에 저장된 명령어들을 실행해 환경 설정 모듈(121), 강화 학습 모듈(123) 및 제어 모듈(125)을 구동시킬 수 있다. 환경 설정 모듈(121), 강화 학습 모듈(123) 및 제어 모듈(125)에 의해 수행되는 동작은 프로세서(120)에 의해 수행되는 동작으로 이해될 수 있다.
환경 설정 모듈(121)은 사물 배치 모델을 강화 학습시키기 위한 학습 환경을 생성할 수 있다. 학습 환경은 사물 배치 모델을 학습시키기 위해 사전 설정되는 환경에 대한 정보를 포함할 수 있다. 예를 들어, 환경 설정 모듈(121)은 인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수(variable), 이러한 변숫값의 조합으로 표현되는 상태(state), 가상 공간의 상태를 구성하는 변수를 변경시키는 제어 동작(action), 제어 동작의 대상이 되는 에이전트(agent), 소정의 변수가 다른 변수에 미치는 영향을 정의한 정책(policy), 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상(reward)을 설정하여 학습 환경을 생성할 수 있다.
강화 학습 모듈(123)은 학습 환경에 대한 설정이 완료되면, 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수와, 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 가치 함수의 예측값을 기초로 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시킴으로써 강화 학습이 수행된 사물 배치 모델을 생성할 수 있다.
제어 모듈(125)은 인테리어 서비스의 가상 공간에 사용자가 특정 사물의 배치를 요청한 경우, 사물 배치 모델을 활용하여 최적의 사물 배치 공간을 추천할 수 있다.
입력 인터페이스(130)는 사용자의 입력을 수신할 수 있다. 예를 들면, 사용자가 인테리어 서비스에서 선택하는 인테리어 요소 등의 입력을 수신할 수 있다.
디스플레이부(140)는 디스플레이 패널을 포함하여 화상을 출력하는 하드웨어 구성을 포함할 수 있다.
통신 인터페이스(150)는 외부 장치(ex. 외부 DB 서버, 사용자 단말 등)와 통신하여 정보를 송수신 할 수 있게 한다. 이를 위해, 통신 인터페이스(150)는 무선 통신 모듈 또는 유선 통신 모듈을 포함할 수 있다.
이하, 도 2 내지 도 7을 통해 사물 배치 모델 제공 장치(100)의 구성 요소들이 연동하여 사물 배치 모델을 학습시키고 사물 배치 모델을 이용하는 구체적인 실시예에 대해 설명한다.
도 2는 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치(100)가 사물 배치 모델에 대한 학습을 수행하는 사물 배치 모델 제공 방법의 동작 흐름도이다. 도 2에 따른 사물 배치 모델 제공 방법의 각 단계는 도 1을 통해 설명된 사물 배치 모델 제공 장치(100)의 구성들에 의해 수행될 수 있으며, 각 단계를 설명하면 다음과 같다.
환경 설정 모듈(121)은 강화 학습의 대상이 되는 학습 환경을 생성할 수 있다(S210). 예를 들어, 환경 설정 모듈(121)은 인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 가상 공간의 변수를 변화시키는 제어 동작, 가상 공간에 배치되어 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정할 수 있다.
변수는 도 3과 같은 가상 공간의 상태(ex. 가상 공간의 크기, 가상 공간의 형태, 가상 공간에 배치되는 사물의 위치, 사물의 크기, 사물의 종류 등)를 나타내기 위한 변수에 대한 식별 정보와 각 변수를 나타내는 값을 포함할 수 있다. 이를 위해, 변수는 크게 2가지 종류로서 인테리어 서비스의 가상 공간을 특정하는 제1 변수와, 가상 공간에 배치되는 사물의 위치, 각도, 차지하는 영역, 간섭 영역을 특정하는 제2 변수를 포함할 수 있다.
제1 변수는 벽의 중점을 특정하는 3차원 위치 좌표, 벽이 배치된 각도를 특정하는 오일러 각도, 벽의 크기를 특정하는 가로/세로/폭의 크기 정보, 바닥의 중심을 특정하는 3차원 위치 좌표 및 바닥의 경계면을 특정하는 폴리곤 정보를 포함할 수 있다. 이에 따라, 바닥과 벽의 위치 및 배치 각도를 설정하여 가상 공간을 특정할 수 있으며, 벽을 통한 공간의 구분을 통해 각 공간의 용도를 특정할 수 있다.
도 4(a)를 참조하면, 제2 변수는 사물의 중점을 특정하는 3차원 위치 좌표, 사물의 가로/세로/폭의 크기를 특정하는 크기 정보, 사물이 배치된 각도를 특정하는 오일러 각도에 대한 정보를 포함할 수 있다. 이에 따라, 사물의 중점과 오일러 각도를 통해 사물이 배치되는 위치와 방향을 특정할 수 있으며, 크기 정보를 통해 가로/세로/폭의 크기 내에 사물의 중점을 포함하는 육면체의 크기로 특정되어 가상 공간 내에서 해당 사물이 차지하게 되는 크기(21)를 특정할 수 있다.
도 4(b)를 참조하면, 제2 변수는 특정 사물과 다른 사물과의 간섭을 평가하는 데에 사용되는 가상의 부피인 간섭 영역에 대한 정보를 포함할 수 있다. 간섭 영역에 대한 정보는 동선 확보 및 사물 간의 간섭을 피하는 요소를 특정하기 위해, 사물을 특정하는 육면체의 면 중 어느 한 면의 넓이에 소정의 거리를 곱한 부피만큼 돌출된 다면체 형태가 차지하는 공간의 부피를 특정(23)할 수 있다.
도 4(c)를 참조하면, 간섭 영역에 대한 정보는 시야각을 표현하는 요소를 특정하기 위해, 사물을 특정하는 육면체의 면 중 어느 한 면에 대한 기 설정된 비율의 면적에 소정의 거리를 곱한 부피만큼 돌출된 복수 개의 다면체가 차례대로 차지하는 공간의 부피를 특정(25)할 수 있다.
정책은 가상 공간에서 어떠한 상태가 학습 목적에 부합하는 상태인지 학습의 방향성을 정의하는 정보를 의미한다. 이를 위해, 본 발명의 실시예에 따른 정책은 사물 간의 바람직한 배치 관계를 정의하는 제1 정책, 사물의 바람직한 높이에 대한 범위를 정의하는 제2 정책, 제1 위치에서 제2 위치까지의 최단 동선을 확보하기 위한 제3 정책을 포함할 수 있다.
제1 정책은 인테리어 서비스의 사물 중 가상 공간의 바닥이나 벽에 접하여 다른 사물을 지지하는 사물을 제1 계층으로 분류하고, 제1 계층의 사물에 접하여 지지를 받는 사물을 제2 계층으로 분류하여, 제1 계층의 사물과 연관되어 함께 배치되는 관계쌍으로 설정된 제2 계층의 사물의 종류, 제1 계층의 사물과 관계쌍인 제2 계층의 사물 간 배치 거리, 제1 계층의 사물과 관계쌍인 제2 계층의 사물의 배치 방향에 대해 도 5와 같이 정의한 정책 정보를 포함할 수 있다.
제2 정책은 소정의 사물이 배치되는 적절한 높이에 대한 범위를 정의한 정책 정보를 포함할 수 있다.
제3 정책은 특정 위치(ex. 현관)로부터 모든 종류의 공간(ex. 거실, 주방, 화장실, 침실 등)에 최단 공간으로 도달하는 동선을 소정 너비의 면적으로 인식하도록 정의한 정책 정보를 포함할 수 있다.
에이전트는 가상 공간에 배치될 사물로 특정될 수 있고, 에이전트는 기 정의된 정책과 보상에 기반하여, 가상 공간에서 배치되는 위치, 각도 등의 결정에 대한 제어 동작이 수행되는 대상이 될 수 있다.
보상은 에이전트에 대한 제어 동작에 따라 변화된 학습 환경의 상태(ex. 가상 공간을 나타내는 변수들의 조합)가 제1 정책, 제2 정책 및 제3 정책 각각에 부합하는 정도를 평가하는 기 설정된 복수의 평가식에 따라 계산될 수 있고, 각각의 평가식에 따라 계산된 평가 점수를 반영할 비율을 정한 가중치에 기초해 합산되어 결정될 수 있다.
예를 들면, 보상은 하기 수학식 1 내지 수학식 13에 의해 결정될 수 있다.
Figure 112020140005433-pat00001
(
Figure 112020140005433-pat00002
: 사물 간 거리의 평가 점수,
Figure 112020140005433-pat00003
: 가상 공간 내 모든 사물의 집합,
Figure 112020140005433-pat00004
: 제1 사물,
Figure 112020140005433-pat00005
: 제2 사물,
Figure 112020140005433-pat00006
: 가상 공간에서 제1 사물과 제2 사물이 겹쳐 있는 부피의 비율,
Figure 112020140005433-pat00007
가상 공간에서 제1 사물의 간섭 정보에 해당하는 공간과 제2 사물의 간섭 정보에 해당하는 공간이 겹쳐 있는 부피의 비율,
Figure 112020140005433-pat00008
는 제1 사물과 제2 사물이 관계쌍에 해당하는 경우 0, 관계쌍이 아닌 경우에는 1)
Figure 112020140005433-pat00009
(
Figure 112020140005433-pat00010
: 사물 그룹 간 거리의 평가 점수,
Figure 112020140005433-pat00011
가상 공간에서 제1 그룹에 속한 사물들의 간섭 정보에 해당하는 공간과 제2 그룹에 속한 사물들의 간섭 정보에 해당하는 공간이 겹쳐 있는 부피의 비율)
이때 수학식 2의 경우, 사물의 그룹은 가상 공간 내에서 사물들이 위치하는 3차원 좌표의 위치를 기반으로 사물들을 군집화하는 소정의 알고리즘을 이용하여 서로 가깝게 배치된 사물 간의 그룹을 분류할 수 있다. 이를 위해, 다양한 그룹화 알고리즘을 사용할 수 있으며, 예를 들면 DBSCAN(Density Based Spatial Clustering of Applications with Noise) 클러스터링 알고리즘을 이용할 수 있다.
Figure 112020140005433-pat00012
(
Figure 112020140005433-pat00013
: 사물 간 정렬 관계의 평가 점수,
Figure 112020140005433-pat00014
: 가상 공간 내 모든 사물의 집합,
Figure 112020140005433-pat00015
: 제1 사물,
Figure 112020140005433-pat00016
: 제2 사물,
Figure 112020140005433-pat00017
: 제1 사물의 중점과 제2 사물의 중점을 이은 선이 소정의 축(ex. x축 또는 y축)에 대해 형성하는 각도)
Figure 112020140005433-pat00018
(
Figure 112020140005433-pat00019
: 사물 그룹 간 정렬 관계의 평가 점수,
Figure 112020140005433-pat00020
: 제1 그룹으로 형성된 사물들의 중점과 제2 그룹으로 형성된 사물들의 중점을 이은 선이 소정의 축(ex. x축 또는 y축)에 대해 형성하는 각도)
Figure 112020140005433-pat00021
(
Figure 112020140005433-pat00022
: 사물 그룹과 벽과의 정렬 관계의 평가 점수,
Figure 112020140005433-pat00023
: 가상 공간 내 모든 사물의 집합,
Figure 112020140005433-pat00024
: 가상 공간 내 형성된 사물의 그룹,
Figure 112020140005433-pat00025
: 가상 공간 내 벽,
Figure 112020140005433-pat00026
: 그룹 내 사물들의 중점과 벽의 중점을 이은 선이 소정의 축(ex. x축 또는 y축)에 대해 형성하는 각도)
Figure 112020140005433-pat00027
(
Figure 112020140005433-pat00028
: 사물이 배치된 높이에 대한 평가 점수,
Figure 112020140005433-pat00029
: 가상 공간 내 모든 사물의 집합,
Figure 112020140005433-pat00030
: 특정 사물,
Figure 112020140005433-pat00031
: 특정 사물이 기 정의된 적정 높이에서 벗어난 높이의 비율,
Figure 112020140005433-pat00032
: 모든 사물들의 평균 높이가 특정 공간(ex. 거실, 침실, 화장실)에 대해 기 정의된 적정 높이에서 벗어난 높이의 비율)
Figure 112020140005433-pat00033
(
Figure 112020140005433-pat00034
: 바닥의 여유 공간에 대한 평가 점수,
Figure 112020140005433-pat00035
: 바닥의 전체 면적,
Figure 112020140005433-pat00036
: 가상 공간 내 모든 그룹의 집합,
Figure 112020140005433-pat00037
: 가상 공간 내 특정 그룹,
Figure 112020140005433-pat00038
: 특정 그룹에 속한 모든 사물의 크기를 바닥에 투사한 경우 바닥에 투사된 면적)
Figure 112020140005433-pat00039
(
Figure 112020140005433-pat00040
: 사물들이 벽에 밀도 있게 배치되었는지에 대한 평가 점수,
Figure 112020140005433-pat00041
: 가상 공간 내 모든 벽의 집합,
Figure 112020140005433-pat00042
: 가상 공간 내 특정 벽,
Figure 112020140005433-pat00043
: 벽
Figure 112020140005433-pat00044
에 소정 거리 이하로 배치된 사물의 개수,
Figure 112020140005433-pat00045
: 벽
Figure 112020140005433-pat00046
에 소정 거리 이하로 배치된 사물,
Figure 112020140005433-pat00047
: 벽
Figure 112020140005433-pat00048
의 면적,
Figure 112020140005433-pat00049
: 벽
Figure 112020140005433-pat00050
에 소정 거리 이하로 배치된 사물의 크기를 벽
Figure 112020140005433-pat00051
에 투사한 경우 벽에 투사된 면적)
Figure 112020140005433-pat00052
(
Figure 112020140005433-pat00053
: 동선의 길이에 대한 평가 점수,
Figure 112020140005433-pat00054
: 기 설정된 제1 위치(ex. 현관 등)에서 기 설정된 제2 위치(ex. 창문, 거실, 주방, 화장실, 침실 등)까지 연결한 선분의 길이)
이때 수학식 9의 경우, 제1 위치 및 제2 위치의 각 위치를 특정하는 중점 정보에 대해 Voronoi Diagram 알고리즘을 적용하여 총 길이를 계산할 수 있다.
Figure 112020140005433-pat00055
수학식 10은 각각의 사물을 기준으로, 사물 간의 배치 거리, 배치 높이, 사물 간의 정렬 관계, 사물과 벽과의 배치 밀도를 고려한 평가 점수이다.
Figure 112020140005433-pat00056
수학식 11은 사물의 그룹을 기준으로, 그룹 간의 배치 거리, 그룹 간의 정렬 관계, 그룹과 벽과의 정렬 관계, 그룹과 벽과의 배치 밀도를 고려한 평가 점수이다.
Figure 112020140005433-pat00057
수학식 12는 사물이 배치됨에 따라 동선의 효율성을 고려한 평가 점수이다.
Figure 112020140005433-pat00058
(
Figure 112020140005433-pat00059
는 평가 점수
Figure 112020140005433-pat00060
의 반영 비율,
Figure 112020140005433-pat00061
는 평가 점수
Figure 112020140005433-pat00062
의 반영 비율,
Figure 112020140005433-pat00063
는 평가 점수
Figure 112020140005433-pat00064
의 반영 비율)
이에 따라, 보상은 제어 동작에 따라 변화된 학습 환경의 상태가 상기 제1, 제2, 제3 정책 각각에 부합하는 정도에 대해 기 설정된 수학식 1 내지 수학식 9의 평가식에 따라 계산될 수 있고, 각각의 기준으로 평가된 수학식 10, 수학식 11, 수학식 12에 대해, 학습의 의도에 따라 반영될 비율을 고려하여 수학식 13과 같이 최종 보상을 결정하도록 학습 환경을 설정할 수 있다.
이처럼, 학습 환경에 대한 설정이 완료된 이후, 강화 학습 모듈(123)은 학습 환경이 가질 수 있는 각 상태에서 행할 수 있는 제어 동작에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습하는 제1 신경망을 생성하고(S220), 학습 환경이 가질 수 있는 각각의 상태에서 행할 수 있는 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 도출하는 정책 함수를 학습하는 제2 신경망을 생성할 수 있다(S230).
도 6은 본 발명의 일 실시예에 따라 강화 학습 중 Actor-Critic 알고리즘 기반으로 가치 함수 및 정책 함수를 학습시키는 동작을 설명하기 위한 예시도이다.
강화 학습 알고리즘의 일 실시예로서 Actor-Critic 알고리즘은 정책을 모델링하고 이 정책 함수에 대해 경사 하강법을 적용하여 학습하는 On-policy 강화학습 알고리즘으로 정책 경사 기법(Policy Gradient)을 통해 최적의 정책을 학습할 수 있다.
본 발명의 일 실시예에 따른 사물 배치 모델(ex. Actor-Critic 모델)은 제1 신경망 및 제2 신경망을 포함할 수 있다. 제1 신경망은 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습하는 Critic 모델을 포함할 수 있다. 제어 동작은 제어하는 대상이 되는 사물이 배치될 위치, 각도 등의 변수를 변경하는 제어 동작을 포함할 수 있다.
제2 신경망은 학습 환경이 가질 수 있는 각각의 상태에서 행할 수 있는 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 도출하는 정책 함수를 학습하는 Actor 모델을 포함할 수 있다.
이때 정책은
Figure 112020140005433-pat00065
으로 정의하며, 현재 상태(
Figure 112020140005433-pat00066
)에 대한 제어 동작(
Figure 112020140005433-pat00067
)의 조건부확률로 표현된다. 또한, 상태와 행동에 대한 상태-행동 가치함수(state-action value function)는
Figure 112020140005433-pat00068
로 정의하며, 어떠한 상태(
Figure 112020140005433-pat00069
)에서 어떠한 행동
Figure 112020140005433-pat00070
을 수행했을 때 획득할 총 보상의 기댓값을 나타낸다.
강화 학습 모듈(123)은 제1 신경망의 입력 변수를 학습 환경의 상태(
Figure 112020140005433-pat00071
)로 설정하고, 제1 신경망의 출력 변수는 학습 환경이 가질 수 있는 각 상태에서 정책을 행함에 따라 달성하게 될 보상, 즉, 가치 함수의 예측값(
Figure 112020140005433-pat00072
)으로 설정할 수 있다. 이때 입력 변수는 학습 환경의 상태를 구성하는 변수로서 제1 변수 또는 제2 변수의 조합이 사용될 수 있다.
한편, 제1 신경망의 학습 방향을 결정하는 비용 함수는 가치 함수의 예측값
Figure 112020140005433-pat00073
이 실제 가치보다 얼마나 좋은지를 나타내는 이득(
Figure 112020140005433-pat00074
)이 최소가 되도록 하는 MSE(mean square error) 함수일 수 있고, 예를 들면, 아래 수학식 14로 설정할 수 있다.
Figure 112020140005433-pat00075
Figure 112020140005433-pat00076
이때
Figure 112020140005433-pat00077
는 상태-행동 가치함수, w는 학습된 파라미터,
Figure 112020140005433-pat00078
는 학습 환경의 현재 상태,
Figure 112020140005433-pat00079
는 현재 상태(
Figure 112020140005433-pat00080
)의 제어 행동(
Figure 112020140005433-pat00081
)에 대한 총 보상의 기댓값,
Figure 112020140005433-pat00082
는 제1 신경망의 비용 함수,
Figure 112020140005433-pat00083
은 다음 상태(
Figure 112020140005433-pat00084
)에서 획득하는 보상,
Figure 112020140005433-pat00085
는 다음 상태(
Figure 112020140005433-pat00086
)의 정책에 대한 총 보상의 기댓값,
Figure 112020140005433-pat00087
는 현재 상태(
Figure 112020140005433-pat00088
)의 정책에 대한 총 보상의 기댓값,
Figure 112020140005433-pat00089
은 학습의 감가율을 의미한다.
이에 따라, 제1 신경망은 학습 환경의 상태가 변경될 때마다 제1 신경망의 비용 함수를 최소화하는 방향으로 제1 신경망의 파라미터, 예를 들면 가중치(weight) 및 바이어스(bias)를 업데이트할 수 있다.
제2 신경망은 학습 환경이 가질 수 있는 각각의 상태에서 행할 수 있는 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 도출하는 정책 함수를 학습한다. 이를 위해, 제2 신경망의 입력 변수를 가치 함수의 예측값 및 학습 환경의 상태(
Figure 112020140005433-pat00090
)로 설정하고, 제2 신경망의 출력 변수를 학습 환경이 가질 수 있는 각각의 상태에서 행할 수 있는 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작이 되도록 설정할 수 있다. 이때 입력 변수는 학습 환경의 상태를 구성하는 변수로서 제1 변수 또는 제2 변수의 조합이 사용될 수 있다.
이때 제2 신경망은 예를 들면, 아래 수학식 15와 같은 형태의 비용 함수를 기초로 학습될 수 있다.
Figure 112020140005433-pat00091
이때
Figure 112020140005433-pat00092
는 제2 신경망의 비용 함수,
Figure 112020140005433-pat00093
는 정책 함수,
Figure 112020140005433-pat00094
는 제2 신경망에서 학습된 파라미터,
Figure 112020140005433-pat00095
는 학습 환경의 현재 상태,
Figure 112020140005433-pat00096
는 현재 상태(
Figure 112020140005433-pat00097
)에서 제어 동작(
Figure 112020140005433-pat00098
)의 조건부확률,
Figure 112020140005433-pat00099
는 상태-행동 가치함수, w는 학습된 파라미터,
Figure 112020140005433-pat00100
는 학습 환경의 현재 상태,
Figure 112020140005433-pat00101
는 현재 상태(
Figure 112020140005433-pat00102
)의 제어 행동(
Figure 112020140005433-pat00103
)에 대한 총 보상의 기댓값을 의미한다.
한편, 제1 신경망의 출력 변수는 제2 신경망의 비용 함수에 적용될 수 있으며, 아래 수학식 16과 같이 설정될 수 있다.
Figure 112020140005433-pat00104
Figure 112020140005433-pat00105
이때
Figure 112020140005433-pat00106
는 제2 신경망의 비용 함수,
Figure 112020140005433-pat00107
는 정책 함수,
Figure 112020140005433-pat00108
는 제2 신경망에서 학습된 파라미터,
Figure 112020140005433-pat00109
는 학습 환경의 현재 상태,
Figure 112020140005433-pat00110
는 현재 상태(
Figure 112020140005433-pat00111
)에서 제어 동작(
Figure 112020140005433-pat00112
)의 조건부확률,
Figure 112020140005433-pat00113
는 가치 함수, w는 제1 신경망에서 학습된 파라미터,
Figure 112020140005433-pat00114
는 현재 상태(
Figure 112020140005433-pat00115
)의 정책에 대한 총 보상의 기댓값,
Figure 112020140005433-pat00116
은 다음 상태(
Figure 112020140005433-pat00117
)에서 획득하는 보상,
Figure 112020140005433-pat00118
는 다음 상태(
Figure 112020140005433-pat00119
)의 정책에 대한 총 보상의 기댓값,
Figure 112020140005433-pat00120
은 제1 신경망(
Figure 112020140005433-pat00121
)에서 학습의 감가율을 의미한다.
이에 따라, 강화 학습 모듈(123)은 제1 신경망의 비용 함수 및 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행할 수 있다(S240).
즉, 학습 환경이 임의의 시작 상태(또는, 인테리어 서비스의 빅데이터에 포함된 가상 공간의 상태)에서 시작되어 특정 사물에 대한 제어 동작이 행해짐에 따라 상태가 변경되면서 종료 상태가 되기까지 매 상태마다 제1 신경망의 비용 함수가 최소가 되도록 가치 함수를 업데이트하고, 업데이트된 가치 함수를 제2 신경망의 비용 함수에 반영하여 제2 신경망의 비용 함수가 최소가 되도록 병렬적으로 정책 함수를 업데이트할 수 있다.
이에 따라, 제2 신경망은 학습 환경의 현재 상태(
Figure 112020140005433-pat00122
)를 입력 받아 정책 함수에 기초하여 현재 학습 환경의 상태에서 최종 상태까지 축적하게 될 보상이 가장 큰 제어 동작(
Figure 112020140005433-pat00123
)을 도출할 수 있다.
이후, 학습 환경은 제어 동작(
Figure 112020140005433-pat00124
)에 의해 현재 상태(
Figure 112020140005433-pat00125
)를 설정된 규칙에 기초하여 다음 상태(
Figure 112020140005433-pat00126
)로 변경시키고, 다음 상태(
Figure 112020140005433-pat00127
)를 구성하는 변수 및 다음 상태에서의 보상(
Figure 112020140005433-pat00128
)을 제1 신경망에 제공한다. 이에 따라, 제1 신경망은 제1 신경망의 비용 함수가 최소가 되도록 가치 함수를 업데이트하고, 업데이트된 파라미터를 제2 신경망에 제공하며, 제2 신경망은 업데이트된 가치 함수의 파라미터를 제2 신경망의 비용 함수에 반영하여 제2 신경망의 비용 함수가 최소가 되도록 정책 함수를 업데이트할 수 있다.
이처럼, 강화 학습 모듈(123)은 상술한 방향성에 따라 제1 신경망 및 제2 신경망의 학습 횟수를 반복하여, 가치 함수 및 정책 함수가 최적의 제어 동작을 결정하도록 학습시킬 수 있고, 사물 배치 모델은 학습이 수차례 반복된 제1 신경망 및 제2 신경망을 포함하는 구성으로 이해될 수 있다. 이에 따라 사물 배치 모델을 사용하여 특정 가상 공간에 사물을 배치하는 경우 기 정의한 정책에 부합하는 최적의 위치가 산출되도록 할 수 있다.
한편, 상술한 수학식 14 내지 수학식 16은 강화 학습의 설명을 위해 예시한 수학식으로서, 본 발명의 실시예를 구현하기 위해 자명한 범위에서 변경하여 사용할 수 있다.
도 7은 본 발명의 일 실시예에 따른 사물 배치 모델 제공 장치(100)가 사물 배치 모델을 통해 사물이 배치될 위치를 결정하는 사물 배치 모델 제공 방법의 동작 흐름도이다. 다만, 도 7에 따른 사물 배치 모델의 사용 동작은 도 2에 따른 사물 배치 모델의 학습 동작과 반드시 동일한 장치에서 수행될 필요가 없으며 서로 다른 객체의 장치일 수 있다.
도 7을 참조하면, 사물 배치 모델 제공 장치(100)에 의해 생성된 사물 배치 모델(113)은 메모리(110)에 저장될 수 있다(S710).
입력 인터페이스는 인테리어 서비스의 사용자로부터 소정의 사물에 대한 배치 요청을 수신할 수 있다(S720).
제어 모듈(125)은 사용자의 가상 공간의 상태에 관한 정보와 소정의 사물에 대한 정보를 특정하는 변수를 생성한 후, 사물 배치 모델에 입력하여 출력된 제어 동작을 기초로 가상 공간에서 소정의 사물의 배치 공간을 결정할 수 있다(S730).
상술한 실시예에 따르면 강화 학습을 기반으로 인테리어 서비스의 가상 공간에서 사물이 차지하는 크기, 사물 간의 간섭, 함께 배치하는 사물들의 종류, 가상 공간의 동선 등을 고려하여 최적의 사물 배치 기술을 제공할 수 있다.
상술한 본 발명의 실시예들은 다양한 수단을 통해 구현될 수 있다. 예를 들어, 본 발명의 실시예들은 하드웨어, 펌웨어(firmware), 소프트웨어 또는 그것들의 결합 등에 의해 구현될 수 있다.
하드웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 프로세서, 컨트롤러, 마이크로 컨트롤러, 마이크로프로세서 등에 의해 구현될 수 있다.
펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 실시예들에 따른 방법은 이상에서 설명된 기능 또는 동작을 수행하는 모듈, 절차 또는 함수 등의 형태로 구현될 수 있다. 소프트웨어 코드 등이 기록된 컴퓨터 프로그램은 컴퓨터 판독 가능 기록 매체 또는 메모리 유닛에 저장되어 프로세서에 의해 구동될 수 있다. 메모리 유닛은 프로세서 내부 또는 외부에 위치하며, 이미 공지된 다양한 수단에 의해 프로세서와 데이터를 주고받을 수 있다.
또한 본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방법으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
더불어 각 블록 또는 각 단계는 특정된 논리적 기능을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또한 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이와 같이, 본 발명이 속하는 기술 분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적이며 한정적이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상세한 설명보다는 후술하는 특허 청구범위에 의하여 나타내어지며, 특허 청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (12)

  1. 사물 배치 모델 제공 장치에 있어서,
    소정의 동작을 수행하도록 하는 명령어들을 저장하는 하나 이상의 메모리; 및 상기 하나 이상의 메모리와 동작 가능 하도록 연결되어 상기 명령어들을 실행하도록 설정된 하나 이상의 프로세서를 포함하고,
    상기 프로세서가 수행하는 동작은,
    인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 상기 변수를 변화시키는 제어 동작, 상기 가상 공간에 배치되어 상기 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 상기 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정하여 강화 학습의 대상이 되는 학습 환경을 생성하는 동작;
    상기 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습시키는 제1 신경망을 생성하는 단계;
    상기 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 상기 가치 함수의 예측값을 기초로, 상기 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시키는 제2 신경망을 생성하는 동작; 및
    상기 제1 신경망 및 상기 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행하는 동작을 포함하고,
    상기 변수는,
    상기 가상 공간을 구성하는 벽 및 바닥을 특정하는 제1 변수와 상기 가상 공간에 배치되는 사물을 특정하는 제2 변수를 포함하고,
    상기 제2 변수는,
    상기 사물의 가로/세로/폭 크기 내에 상기 사물의 중점을 포함하는 육면체의 제1 부피로 특정되는 사물의 크기를 표현하는 요소;
    상기 육면체의 면 중 어느 한 면의 넓이에 소정의 거리를 곱한 부피만큼 돌출된 다면체 형태가 차지하는 공간의 제2 부피로 특정되는 간섭 정보를 표현하는 요소; 및
    상기 육면체의 면 중 어느 한 면에 대한 기 설정된 비율의 면적에 소정의 거리를 곱한 부피만큼 돌출된 복수 개의 다면체가 차례대로 차지하는 공간의 제3 부피로 특정되는 시야각을 표현하는 요소를 포함하는,
    사물 배치 모델 제공 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 제1 변수는,
    상기 벽의 중점을 특정하는 위치 좌표, 상기 벽이 배치된 각도를 특정하는 오일러 각도, 상기 바닥의 중심 좌표, 및 상기 바닥의 경계면을 특정하는 폴리곤 정보를 포함하는,
    사물 배치 모델 제공 장치.
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 정책은,
    상기 사물 중 상기 가상 공간의 바닥이나 벽에 접하여 다른 사물을 지지하는 사물을 제1 계층으로 분류하고, 상기 사물 중 상기 제1 계층의 사물에 접하여 지지를 받는 사물을 제2 계층으로 분류하여, 소정의 제1 계층의 사물과 연관되어 함께 배치되는 관계쌍으로 설정된 제2 계층의 사물의 종류, 소정의 제1 계층의 사물과 관계쌍인 제2 계층의 사물과의 배치 거리, 소정의 제1 계층의 사물과 관계쌍인 제2 계층의 사물의 배치 방향에 대해 기 정의된 제1 정책과,
    소정의 사물이 배치되는 높이에 대한 범위를 기 정의한 제2 정책과,
    상기 가상 공간의 현관으로부터 모든 종류의 공간에 최단 공간으로 도달하는 동선을 소정 너비의 면적으로 인식하도록 기 정의한 제3 정책을 포함하는,
    사물 배치 모델 제공 장치.
  7. 제6항에 있어서,
    상기 제어 동작은,
    상기 가상 공간 내에서 상기 에이전트의 위치 및 각도에 대한 변수를 변화시키는 동작을 포함하는,
    사물 배치 모델 제공 장치.
  8. 제7항에 있어서,
    상기 보상은,
    상기 제어 동작에 따라 변화된 상기 학습 환경의 상태가 상기 제1, 제2, 제3 정책 각각에 부합하는 정도에 대해 평가하는 기 설정된 복수의 평가식에 따라 계산되고, 상기 복수의 평가식 각각에 대해 반영할 비율을 정한 가중치로 조합하여 결정되는,
    사물 배치 모델 제공 장치.
  9. 제8항에 있어서,
    상기 복수의 평가식은,
    가상 공간 내 사물 간 거리에 대한 평가 점수, 가상 공간 내 사물을 거리에 따라 그룹으로 분류한 후 분류된 사물 그룹 간의 거리에 대한 평가 점수, 가상 공간 내 사물 간 정렬 관계에 대한 평가 점수, 상기 사물 그룹 간의 정렬 관계에 대한 평가 점수, 상기 사물 그룹과 벽과의 정렬 관계에 대한 평가 점수, 사물이 배치된 높이에 대한 평가 점수, 바닥의 여유 공간에 대한 평가 점수, 사물이 벽에 배치된 밀도에 대한 평가 점수, 동선의 길이에 대한 평가 점수를 포함하는,
    사물 배치 모델 제공 장치.
  10. 제1항, 제3항, 제6항 내지 제9항 중 어느 한 항의 장치에 의해 생성된 사물 배치 모델을 저장하는 메모리; 및
    인테리어 서비스의 사용자로부터 소정의 사물에 대한 배치 요청을 수신하는 입력 인터페이스;
    상기 사용자의 가상 공간의 상태에 관한 정보와 상기 소정의 사물에 대한 정보를 특정하는 변수를 생성한 후, 상기 변수를 상기 사물 배치 모델에 입력하여 출력된 제어 동작을 기초로 상기 가상 공간에서 상기 소정의 사물에 대한 배치 공간을 결정하는 프로세서를 포함하는
    사물 배치 모델 제공 장치.
  11. 사물 배치 모델 제공 장치에 의해 수행되는 사물 배치 모델 제공 방법에 있어서,
    인테리어 서비스가 제공하는 가상 공간의 상태를 구성하는 변수, 상기 변수를 변화시키는 제어 동작, 상기 가상 공간에 배치되어 상기 제어 동작의 대상이 되는 사물인 에이전트, 소정 변수가 다른 변수에 대해 미치는 영향을 정의한 정책, 상기 제어 동작에 의해 변경된 가상 공간의 상태를 기초로 평가되는 보상을 설정하여 강화 학습의 대상이 되는 학습 환경을 생성하는 단계;
    상기 학습 환경이 가질 수 있는 각각의 상태에서 소정의 제어 동작을 행함에 따라 달성하게 될 보상을 예측하는 가치 함수를 학습시키는 제1 신경망을 생성하는 단계;
    상기 학습 환경이 가질 수 있는 각각의 상태에서 수행 가능한 제어 동작에 의해 변경되는 각각의 상태에 대한 상기 가치 함수의 예측값을 기초로, 상기 수행 가능한 제어 동작 중 최종적으로 축적될 보상을 최대화하는 제어 동작을 판별하는 정책 함수를 학습시키는 제2 신경망을 생성하는 단계; 및
    상기 제1 신경망 및 상기 제2 신경망의 비용 함수가 최소가 되는 방향으로 강화 학습을 수행하는 단계를 포함하고,
    상기 변수는,
    상기 가상 공간을 구성하는 벽 및 바닥을 특정하는 제1 변수와 상기 가상 공간에 배치되는 사물을 특정하는 제2 변수를 포함하고,
    상기 제2 변수는,
    상기 사물의 가로/세로/폭 크기 내에 상기 사물의 중점을 포함하는 육면체의 제1 부피로 특정되는 사물의 크기를 표현하는 요소;
    상기 육면체의 면 중 어느 한 면의 넓이에 소정의 거리를 곱한 부피만큼 돌출된 다면체 형태가 차지하는 공간의 제2 부피로 특정되는 간섭 정보를 표현하는 요소; 및
    상기 육면체의 면 중 어느 한 면에 대한 기 설정된 비율의 면적에 소정의 거리를 곱한 부피만큼 돌출된 복수 개의 다면체가 차례대로 차지하는 공간의 제3 부피로 특정되는 시야각을 표현하는 요소를 포함하는,
    사물 배치 모델 제공 방법.
  12. 제11항의 방법을 프로세서가 수행하게 하는 명령어를 포함하는 컴퓨터 프로그램이 기록된 컴퓨터 판독 가능 기록매체.
KR1020200181469A 2020-12-23 2020-12-23 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법 KR102549980B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020200181469A KR102549980B1 (ko) 2020-12-23 2020-12-23 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법
EP21911536.7A EP4246418A1 (en) 2020-12-23 2021-12-22 Device and method for providing object placement model of interior design service on basis of reinforcement learning
PCT/KR2021/019629 WO2022139469A1 (ko) 2020-12-23 2021-12-22 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법
CN202180086656.8A CN116745797A (zh) 2020-12-23 2021-12-22 基于强化学习的装修服务的物件布置模型提供装置及方法
JP2023535888A JP2023553638A (ja) 2020-12-23 2021-12-22 強化学習基盤インテリアーサービスの事物配置モデル提供装置及び方法
US18/331,703 US20230315929A1 (en) 2020-12-23 2023-06-08 Device and method for providing object placement model of interior design service on basis of reinforcement learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200181469A KR102549980B1 (ko) 2020-12-23 2020-12-23 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20220090695A KR20220090695A (ko) 2022-06-30
KR102549980B1 true KR102549980B1 (ko) 2023-06-30

Family

ID=82158488

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200181469A KR102549980B1 (ko) 2020-12-23 2020-12-23 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법

Country Status (6)

Country Link
US (1) US20230315929A1 (ko)
EP (1) EP4246418A1 (ko)
JP (1) JP2023553638A (ko)
KR (1) KR102549980B1 (ko)
CN (1) CN116745797A (ko)
WO (1) WO2022139469A1 (ko)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8253731B2 (en) * 2006-11-27 2012-08-28 Designin Corporation Systems, methods, and computer program products for home and landscape design
US11094137B2 (en) * 2012-02-24 2021-08-17 Matterport, Inc. Employing three-dimensional (3D) data predicted from two-dimensional (2D) images using neural networks for 3D modeling applications and other applications
KR102325297B1 (ko) * 2015-11-09 2021-11-11 에스케이텔레콤 주식회사 Ar 컨텐츠 자동 배치 방법
KR101833779B1 (ko) 2016-06-10 2018-03-05 박희정 인테리어 서비스 방법 및 인테리어 서비스 시스템
KR102186899B1 (ko) * 2017-12-04 2020-12-04 주식회사 양파 공간 인식에 기반한 인테리어 플랫폼 제공 방법
KR20190106867A (ko) * 2019-08-27 2019-09-18 엘지전자 주식회사 가구의 배치 위치를 가이드하는 인공 지능 장치 및 그의 동작 방법

Also Published As

Publication number Publication date
EP4246418A1 (en) 2023-09-20
KR20220090695A (ko) 2022-06-30
CN116745797A (zh) 2023-09-12
JP2023553638A (ja) 2023-12-25
US20230315929A1 (en) 2023-10-05
WO2022139469A1 (ko) 2022-06-30

Similar Documents

Publication Publication Date Title
JP7014589B2 (ja) コンピューティングリソースによって処理される複数のゾーンへの3dシーンの自動区分化
KR102446805B1 (ko) 가상현실 기반의 인공지능 인테리어 큐레이션 플랫폼 시스템
US20230054150A1 (en) Automated dynamic custom game content generation
CN110494697A (zh) 数据学习服务器和用于生成和使用其学习模型的方法
KR102407595B1 (ko) 메타버스 기반 와이너리 체험 서비스 제공 방법, 장치 및 시스템
US20220226730A1 (en) Operator interface for automated game content generation
CN112311578B (zh) 基于深度强化学习的vnf调度方法及装置
US11672391B2 (en) Robot cleaner and method for determining cleaning path
JP2020013563A (ja) 意味的情報に基づいてフォトリアリスティックな合成画像を生成するためのシステムおよび方法
US11291915B1 (en) Automated prediction of user response states based on traversal behavior
US20240095143A1 (en) Electronic device and method for controlling same
US11565182B2 (en) Parametric player modeling for computer-implemented games
US20230128740A1 (en) Method for providing interface by using virtual space interior design, and device therefor
CN110447041A (zh) 噪声神经网络层
US20230356088A1 (en) On device game engine architecture
US20230125988A1 (en) Method for automating space and interior layouts based on user style and apparatus therefor
US11455074B2 (en) System and user interface for viewing and interacting with three-dimensional scenes
KR20210083575A (ko) 공간 사용률 분석을 제공하는 인테리어 레이아웃 장치 및 그 동작 방법
KR102549980B1 (ko) 강화 학습 기반 인테리어 서비스의 사물 배치 모델 제공 장치 및 방법
KR102492699B1 (ko) 인테리어 서비스의 빅데이터로부터 구축된 간선 연결 데이터 구조 기반의 인접 간선 사물 추천 장치 및 방법
Kolarevic Metadesigning customizable houses
US20230061250A1 (en) Generative Interior Design in Video Games
US11514693B2 (en) Model-based image labeling and/or segmentation
KR102248313B1 (ko) 사전 제작된 인테리어 디자인 모델을 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체
KR102261055B1 (ko) 클릭율 최대화를 위한 이미지 디자인 파라미터 최적화 방법 및 시스템

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant