KR102568853B1 - 전자 장치 및 그 제어 방법 - Google Patents

전자 장치 및 그 제어 방법 Download PDF

Info

Publication number
KR102568853B1
KR102568853B1 KR1020180132175A KR20180132175A KR102568853B1 KR 102568853 B1 KR102568853 B1 KR 102568853B1 KR 1020180132175 A KR1020180132175 A KR 1020180132175A KR 20180132175 A KR20180132175 A KR 20180132175A KR 102568853 B1 KR102568853 B1 KR 102568853B1
Authority
KR
South Korea
Prior art keywords
images
image
layer
aesthetic
electronic device
Prior art date
Application number
KR1020180132175A
Other languages
English (en)
Other versions
KR20200052462A (ko
Inventor
김상희
문경원
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020180132175A priority Critical patent/KR102568853B1/ko
Priority to US16/601,970 priority patent/US11145088B2/en
Priority to PCT/KR2019/013556 priority patent/WO2020091268A1/en
Priority to EP19880361.1A priority patent/EP3867811A4/en
Publication of KR20200052462A publication Critical patent/KR20200052462A/ko
Application granted granted Critical
Publication of KR102568853B1 publication Critical patent/KR102568853B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30181Earth observation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Abstract

본 개시는 기계 학습 알고리즘을 활용하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다.
전자 장치가 개시된다. 본 전자 장치는 메모리 및 획득된 적어도 하나의 이미지를 저장하고, 인공 지능 모델을 통해 적어도 하나의 이미지가 심미성 스코어(score)에 기초하여 분류되면, 분류 결과에 기초하여 적어도 하나의 이미지를 정렬하여 제공하는 프로세서를 포함하고, 인공 지능 모델은, 서로 다른 깊이의 복수의 레이어를 포함하고, 복수의 레이어 각각에서 적어도 하나의 이미지의 특징을 추출하며, 추출된 복수의 특징에 기초하여 적어도 하나의 이미지를 심미성 스코어에 기초하여 분류할 수 있다.

Description

전자 장치 및 그 제어 방법 {ELECTRONIC APPARATUS AND METHOD FOR CONTROLLING THEREOF}
본 개시는 전자 장치 및 그 제어 방법에 관한 것으로, 보다 상세하게는 인공 지능 기술을 기반으로 동작하는 전자 장치 및 그 제어 방법에 관한 것이다.
인공지능 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템으로서 기계가 스스로 학습하고 판단하며, 사용할수록 인식률이 향상되는 시스템이다.
인공지능 기술은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘을 이용하는 기계학습(딥러닝) 기술 및 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 요소 기술들로 구성된다.
요소 기술들은, 예로, 인간의 언어/문자를 인식하는 언어적 이해 기술, 사물을 인간의 시각처럼 인식하는 시각적 이해 기술, 정보를 판단하여 논리적으로 추론하고 예측하는 추론/예측 기술, 인간의 경험 정보를 지식데이터로 처리하는 지식 표현 기술 및 차량의 자율 주행, 로봇의 움직임을 제어하는 동작 제어 기술 중 적어도 하나를 포함할 수 있다.
시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다.
추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다.
최근에는, 이와 같은 인공 지능 기술을 이용하여 이미지를 분류하는 전자 장치가 개발되고 있다.
다만, 종래의 전자 장치는 이미지에 포함된 오브젝트를 식별하는 기술을 구현하는데 그치고 있다. 예를 들어, 강아지 및/또는 고양이 등이 포함된 이미지가 복수 개 입력되었을 때, 종래의 전자 장치는 강아지가 포함된 이미지만을 분류하여 제공하거나, 고양이가 포함된 이미지만을 분류하여 제공하였다.
그러나, 사용자는 단순히 이미지에 포함된 오브젝트에 따라 분류된 사진을 제공받는 것이 아닌, 복수의 이미지 중에서도 심미성이 높은 이미지를 제공받기를 원하는 것이 일반적이다.
즉, 상술한 실시 예에서 사용자는 무작위로 배열된, 강아지만 포함하는 이미지들을 제공받기를 원하는 것이 아니라, 강아지를 포함하는 사진 중에서도 자연스러운 구도로 촬영된 이미지를 우선적으로 제공받길 원한다.
본 개시는 상술한 필요성에 의해 안출된 것으로, 본 개시의 목적은 복수의 이미지를 심미성이 높은 순서대로 정렬하여 사용자에게 제공함에 있다.
상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 전자 장치는, 메모리 및 획득된 적어도 하나의 이미지를 저장하고, 인공 지능 모델을 통해 상기 적어도 하나의 이미지가 심미성 스코어(score)에 기초하여 분류되면, 상기 분류 결과에 기초하여 상기 적어도 하나의 이미지를 정렬하여 제공하는 프로세서를 포함하고, 상기 인공 지능 모델은, 서로 다른 깊이의 복수의 레이어를 포함하고, 상기 복수의 레이어 각각에서 상기 적어도 하나의 이미지의 특징을 추출하며, 상기 추출된 복수의 특징에 기초하여 상기 적어도 하나의 이미지를 상기 심미성 스코어에 기초하여 분류할 수 있다.
그리고, 상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고, 상기 인공 지능 모델은, 상기 제1 레이어에서 상기 적어도 하나의 이미지의 제1 특징을 추출하고, 상기 제2 레이어에서 상기 적어도 하나의 이미지의 상기 제1 특징보다 상대적으로 포괄적인 제2 특징을 추출할 수 있다.
그리고, 상기 프로세서는, 상기 인공 지능 모델을 통해 상기 적어도 하나의 이미지의 스타일이 분류되면, 상기 스타일 및 상기 심미성 스코어에 기초하여 상기 적어도 하나의 이미지를 정렬하여 제공할 수 있다.
그리고, 상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고, 상기 인공 지능 모델은, 상기 제1 레이어에서 추출된 제1 특징 및 제2 레이어에서 추출된 제2 특징에 기초하여 상기 적어도 하나의 이미지를 상기 심미성 스코어에 따라 분류하고, 상기 제2 레이어에서 추출된 제3 특징에 기초하여 상기 적어도 하나의 이미지의 스타일을 분류할 수 있다.
그리고, 상기 프로세서는, 상기 심미성 스코어가 높은 순서대로 상기 적어도 하나의 이미지를 정렬하여 제공하거나, 상기 적어도 하나의 이미지 중 상기 심미성 스코어가 상대적으로 가장 높은 하나의 이미지를 제공하거나, 상기 심미성 스코어가 높은 순서대로 하나의 이미지를 기설정된 시간 간격으로 순차적으로 제공할 수 있다.
그리고, 상기 프로세서는, 상기 스타일 별로 상기 적어도 하나의 이미지를 상기 심미성 스코어에 따라 정렬하여 제공할 수 있다.
그리고, 상기 프로세서는, 서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되는 경우, 상기 제1 및 제2 스타일의 연관성을 판단하고, 연관성이 있는 것으로 판단되면 상기 서로 다른 이미지를 그룹화하여 상기 심미성 스코어에 따라 상기 서로 다른 이미지를 정렬하여 제공할 수 있다.
여기에서, 상기 심미성 스코어는, 상기 적어도 하나의 이미지에 포함된 오브젝트의 구도, 상기 이미지에 포함된 컬러의 다양성 및 상기 이미지에 적용된 촬영 기법 중 적어도 하나에 기초하여 결정되고, 상기 스타일은, 상기 적어도 하나의 이미지에 포함된 사람, 동물, 건물 및 자연 풍경 중 적어도 하나에 기초하여 결정될 수 있다.
상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은, 적어도 하나의 이미지를 획득하는 단계 및 인공 지능 모델을 통해 상기 적어도 하나의 이미지가 심미성 스코어(score)에 기초하여 분류되면, 상기 분류 결과에 기초하여 상기 적어도 하나의 이미지를 정렬하여 제공하는 단계를 포함하고, 상기 인공 지능 모델은, 서로 다른 깊이의 복수의 레이어를 포함하고, 상기 복수의 레이어 각각에서 상기 적어도 하나의 이미지의 특징을 추출하며, 상기 추출된 복수의 특징에 기초하여 상기 적어도 하나의 이미지를 상기 심미성 스코어에 기초하여 분류할 수 있다.
그리고, 상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고, 상기 인공 지능 모델은, 상기 제1 레이어에서 상기 적어도 하나의 이미지의 제1 특징을 추출하고, 상기 제2 레이어에서 상기 적어도 하나의 이미지의 상기 제1 특징보다 상대적으로 포괄적인 제2 특징을 추출할 수 있다.
그리고, 상기 제공하는 단계는, 상기 인공 지능 모델을 통해 상기 적어도 하나의 이미지의 스타일이 분류되면, 상기 스타일 및 상기 심미성 스코어에 기초하여 상기 적어도 하나의 이미지를 정렬하여 제공할 수 있다.
그리고, 상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고, 상기 인공 지능 모델은, 상기 제1 레이어에서 추출된 제1 특징 및 제2 레이어에서 추출된 제2 특징에 기초하여 상기 적어도 하나의 이미지를 상기 심미성 스코어에 따라 분류하고, 상기 제2 레이어에서 추출된 제3 특징에 기초하여 상기 적어도 하나의 이미지의 스타일을 분류할 수 있다.
그리고, 상기 제공하는 단계는, 상기 심미성 스코어가 높은 순서대로 상기 적어도 하나의 이미지를 정렬하여 제공하거나, 상기 적어도 하나의 이미지 중 상기 심미성 스코어가 상대적으로 가장 높은 하나의 이미지를 제공하거나, 상기 심미성 스코어가 높은 순서대로 하나의 이미지를 기설정된 시간 간격으로 순차적으로 제공할 수 있다.
그리고, 상기 제공하는 단계는, 상기 스타일 별로 상기 적어도 하나의 이미지를 상기 심미성 스코어에 따라 정렬하여 제공할 수 있다.
그리고, 상기 제공하는 단계는, 서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되는 경우, 상기 제1 및 제2 스타일의 연관성을 판단하고, 연관성이 있는 것으로 판단되면 상기 서로 다른 이미지를 그룹화하여 상기 심미성 스코어에 따라 상기 서로 다른 이미지를 정렬하여 제공할 수 있다.
여기에서, 상기 심미성 스코어는, 상기 적어도 하나의 이미지에 포함된 오브젝트의 구도, 상기 이미지에 포함된 컬러의 다양성 및 상기 이미지에 적용된 촬영 기법 중 적어도 하나에 기초하여 결정되고, 상기 스타일은, 상기 적어도 하나의 이미지에 포함된 사람, 동물, 건물 및 자연 풍경 중 적어도 하나에 기초하여 결정될 수 있다.
이상과 같은 본 개시의 다양한 실시 예에 따르면, 복수의 이미지를 심미성이 높은 순서대로 정렬하여 제공할 수 있다. 또한, 복수의 이미지를 스타일 별로 구분하여 제공함으로써, 사용자는 조화롭게 정렬된 이미지를 감상할 수 있다.
도 1은 본 개시의 일 실시 예에 따른 전자 장치가 이미지를 분류하는 실시 예를 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 블록도이다.
도 3은 본 개시의 일 실시 예에 따른 인공 지능 모델을 학습하는 방법을 설명하기 위한 도면이다.
도 4는 본 개시의 일 실시 예에 따른 인공 지능 모델의 구조를 설명하기 위한 도면이다.
도 5는 본 개시의 일 실시 예에 따른 이미지를 심미서 스코어 및 스타일에 따라 분류하는 방법을 설명하기 위한 도면이다.
도 6은 본 개시의 일 실시 예에 따른 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
도 7은 본 개시의 일 실시 예에 따른 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
도 8은 본 개시의 일 실시 예에 따른 연관성 있는 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
도 9는 본 개시의 일 실시 예에 따른 심미성 스코어에 따라 이미지를 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
도 10은 본 개시의 일 실시 예에 따른, 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
도 11은 본 개시의 일 실시 예에 따른 각각의 이미지를 순차적으로 제공하는 실시 예를 설명하기 위한 도면이다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 상세 블록도이다.
도 13 본 개시의 일 실시 예에 따른 전자 장치가 방송 수신 장치로 구현되는 경우를 설명하기 위한 상세 블록도이다.
도 14는 본 개시의 일 실시 예에 따른, 인공 지능 모델을 이용하는 전자 장치의 동작을 설명하기 위한 도면이다.
도 15는 본 개시의 일 실시 예에 따른 학습부 및 인식부의 블록도이다.
도 16은 본 개시의 일 실시 예에 따른 전자 장치의 동작을 설명하기 위한 흐름도이다.
먼저, 본 명세서 및 청구범위에서 사용되는 용어는 본 개시의 기능을 고려하여 일반적인 용어들을 선택하였다. 하지만, 이러한 용어들은 당 분야에 종사하는 기술자의 의도나 법률적 또는 기술적 해석 및 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 일부 용어는 출원인이 임의로 선정한 용어도 있다. 이러한 용어에 대해서는 본 명세서에서 정의된 의미로 해석될 수 있으며, 구체적인 용어 정의가 없으면 본 명세서의 전반적인 내용 및 당해 기술 분야의 통상적인 기술 상식을 토대로 해석될 수도 있다.
또한, 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그에 대한 상세한 설명은 축약하거나 생략한다.
나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 개시의 실시 예를 상세하게 설명하지만, 본 개시가 실시 예들에 의해 제한되거나 한정되는 것은 아니다.
이하, 첨부된 도면을 참조하여 본 개시를 상세히 설명한다.
도 1은 본 개시의 일 실시 예에 따른 전자 장치가 이미지를 분류하는 실시 예를 설명하기 위한 도면이다.
본 개시의 일 실시 예에 따른 전자 장치(100)는 스마트 TV가 될 수 있다. 다만, 이는 일 실시 예이고, 전자 장치(100)는 휴대폰, 스마트 폰, 셋톱박스, 노트북, 데스크 탑, 태블릿 PC, 서버 등과 같이 다양한 전자 장치로 구현 될 수 있다. 또한, 전자 장치(100)는 스마트 워치, 스마트 글래스 등의 웨어러블 디바이스가 될 수도 있다.
전자 장치(100)는 획득된 하나 또는 복수의 이미지(10)를 메모리에 저장할 수 있다. 구체적으로, 전자 장치(100)는 전자 장치(100)의 카메라를 통해 획득된 이미지(10)를 메모리에 저장할 수 있음은 물론, USB(Universal Serial Bus) 메모리, SD(Secure Digital) 카드 등의 외부 장치(미도시)와의 통신을 통해 획득된 이미지(10)를 메모리에 저장할 수도 있고, 서버(미도시)와의 통신을 통해 획득된 이미지(10)를 메모리에 저장할 수 있다.
예를 들어, 도 1을 참조하면, 전자 장치(100)는 웃는 표정의 사람을 포함하는 이미지, 무표정의 사람을 포함하는 이미지, 웃는 표정의 강아지를 포함하는 이미지, 바다를 포함하는 이미지 등 다양한 이미지를 획득하고, 획득된 이미지를 메모리에 저장할 수 있다.
전자 장치(100)는 저장된 이미지를 심미성 스코어(score)에 따라 정렬하여 제공할 수 있다. 구체적으로, 전자 장치(100)는 인공 지능 모델을 통해 이미지가 심미성 스코어에 기초하여 분류되면, 그 분류 결과에 기초하여 저장된 이미지를 정렬하여 제공할 수 있다.
예를 들어, 도 1을 참조하면, 전자 장치(100)는 인공 지능 모델을 통해 웃는 표정의 사람을 포함하는 이미지, 웃는 표정의 강아지를 포함하는 이미지, 얌전히 앉아 있는 고양이를 포함하는 이미지 등의 순서대로 복수의 이미지(10)가 심미성 스코어에 기초하여 분류되면, 심미성 스코어가 높은 순서대로 복수의 이미지(10)를 정렬한 이미지(20)를 제공할 수 있다.
전자 장치(100)는 스타일 별로 복수의 이미지를 심미성 스코어에 따라 정렬하여 제공할 수 있다.
구체적으로, 전자 장치(100)는 인공 지능 모델을 통해 이미지의 스타일이 분류되면, 스타일 별로 심미성 스코어가 높은 순서대로 복수의 이미지를 정렬하여 제공할 수 있다.
예를 들어, 도 1을 참조하면, 전자 장치(100)는 인공 지능 모델을 통해 복수의 이미지(10)가 사람 스타일, 동물 스타일 및 풍경 스타일로 분류되면, 각 스타일 별로 심미성 스코어가 높은 순서대로 복수의 이미지(10)를 정렬한 이미지(30)를 제공할 수 있다.
한편, 심미성 스코어 및/또는 스타일에 기초하여 정렬된 이미지는 전자 장치(100)에 구비된 디스플레이를 통해 제공될 수 있음은 물론, 외부 장치(미도시)에 의해 제공될 수도 있다.
구체적으로, 전자 장치(100)는 심미성 스코어 및/또는 스타일에 기초하여 정렬된 이미지를 디스플레이를 구비한 스마트 TV 등의 외부 장치(미도시)로 전송하고, 이에 따라 외부 장치(미도시)는 스코어 및/또는 스타일에 기초하여 정렬된 이미지를 디스플레이 할 수 있다.
이와 같이, 본 개시는 복수의 이미지를 심미성이 높은 순서대로 정렬하여 제공하므로 사용자는 품질이 뛰어난 이미지를 우선적으로 제공받을 수 있다. 또한, 본 개시는 복수의 이미지를 스타일 별로 구분하여 제공함으로써, 사용자는 조화롭게 정렬된 이미지를 감상할 수 있다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 블록도이다.
도 2를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 메모리(110) 및 프로세서(120)를 포함한다.
메모리(110)는 예를 들면, 내장 메모리 또는 외장 메모리를 포함할 수 있다. 내장 메모리는, 예를 들면, 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나를 포함할 수 있다.
외장 메모리는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital), MMC(multi-media card) 또는 메모리 스틱(memory stick) 등을 포함할 수 있다.
메모리(110)는 프로세서(120)에 의해 액세스되며, 프로세서(120)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다.
본 개시에서 메모리라는 용어는 프로세서(120)와 별도로 마련된 메모리, 프로세서(120) 내 롬(미도시) 및 램(미도시) 중 적어도 하나를 포함할 수 있다.
프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어하기 위한 구성이다. 예를 들면, 프로세서(120)는 운영 체제 또는 응용 프로그램을 구동하여 프로세서(120)에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 프로세서(120)는 CPU(central processing unit) 또는 GPU(graphics-processing unit)이거나 둘 다일 수 있다. 프로세서(120)는 적어도 하나의 범용 프로세서(general processor), 디지털 신호 프로세서(digital signal processor), ASIC(Application specific integrated circuit), SoC(system on chip), MICOM(Microcomputer) 등으로 구현될 수 있다.
프로세서(120)는 메모리(110)에 저장된 컴퓨터 실행가능 명령어(computer executable instructions)를 실행함으로써 본 개시의 다양한 실시 예에 따른 전자 장치(100)의 동작을 수행할 수 있다.
예컨대, 프로세서(120)는 메모리(110)에 저장된 컴퓨터 실행가능 명령어(computer executable instructions)를 실행함으로써 인공 지능 모델을 통해 적어도 하나의 이미지가 심미성 스코어(score) 및 스타일에 기초하여 분류되면, 그 분류 결과에 기초하여 적어도 하나의 이미지를 정렬하여 제공할 수 있다.
이하, 본 개시의 일 실시 예에 따른 인공 지능 모델에 대해 먼저 설명하도록 한다.
도 3은 본 개시의 일 실시 예에 따른 인공 지능 모델을 학습하는 방법을 설명하기 위한 도면이다.
본 개시의 일 실시 예에 따른 인공 지능 모델(300)은 뉴럴 네트워크(Neural Network)를 기반으로 하는 모델이 될 수 있다. 일 예로, 인공 지능 모델(300)은 CNN(Convolution Neural Network)을 기반으로 하는 모델이 될 수 있다. 다만, 이는 일 실시 예이고, 인공 지능 모델(300)은 DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)등과 같은 다양한 모델이 될 수 있다.
인공 지능 모델(300)은 이미지 Data set(310)을 입력 받을 수 있다. 여기에서, 이미지 Data set(310)에 포함된 복수의 이미지 각각에는 심미성 스코어 및 스타일이 레이블링(labeling)될 수 있다.
구체적으로, 이미지에 포함된 오브젝트의 구도, 이미지에 포함된 컬러의 다양성, 이미지에 적용된 촬영 기법, 이미지의 프레임, 이미지에 적용된 조명 효과 및 이미지의 독창성 등에 기초하여, 복수의 이미지 각각에는 서로 다른 심미성 스코어가 레이블링 될 수 있다.
예를 들어, 다양한 컬러를 가진 이미지는 흑백 컬러를 가진 이미지보다 상대적으로 높은 심미성 스코어가 레이블링 될 수 있고, 웃는 표정의 사람을 포함하는 이미지는 우는 표정의 사람을 포함하는 이미지보다 상대적으로 높은 심미성 스코어가 레이블링 될 수 있다.
그리고, 심미성 스코어와 별개로, 사람, 동물, 건물, 풍경, 컬러, 감정 표현 등의 스타일이 복수의 이미지 각각에 레이블링 될 수 있다.
예를 들어, 사람을 포함하는 이미지에는 사람이 레이블링 되고, 강아지 등의 동물을 포함하는 이미지에는 동물이 레이블링 되며, 산, 바다 등의 풍경을 포함하는 이미지에는 풍경이 레이블링 될 수 있다.
이와 같이, 복수의 이미지 각각에 심미성 스코어 및 스타일이 레이블링 됨으로써, 본 개시는 스타일 별로 심미성 스코어를 분류할 수 있다.
한편, 인공 지능 모델(300)의 딥러닝 네트워크(320)는 Data set(310)을 입력으로 하여, 심미성 딥러닝 네트워크(321) 및 스타일 딥러닝 네트워크(322)를 통해, 이미지 Data set(310)에 포함된 이미지 각각의 심미성 스코어(331) 및 스타일(332)을 분류하도록 학습할 수 있다. 이와 관련하여, 도 4를 참조하여 설명한다.
도 4는 본 개시의 일 실시 예에 따른 인공 지능 모델의 구조를 설명하기 위한 도면이다.
인공 지능 모델(300)의 딥러닝 네트워크(320)는 심미성 딥러닝 네트워크(321) 및 스타일 딥러닝 네트워크(322)를 포함할 수 있다.
딥러닝 네트워크(320)는 서로 다른 깊이의 복수의 레이어를 포함할 수 있다. 예를 들어, 도 4를 참조하면, 딥러닝 네트워크(320)는 제1 레이어(411-1), 제2 레이어(412-2), 제3 레이어(413-3), …, 제n 레이어(414-n)을 포함할 수 있다.
여기에서, 각 레이어는 특징 맵(feature map)을 포함하는 레이어가 될 수 있다. 구체적으로, 각 레이어는 입력된 이미지에 필터(또는 커널)를 컨벌루션(Convolution)하여 출력된 특징 맵(feature map)을 레이어가 될 수 있다. 한편, 입력된 이미지에는 필터의 컨벌루션 외 풀링(pulling), 패딩(Padding), 스트라이드(Stride) 조절 등이 더 적용될 수 있다. 여기에서, 풀링은 이전 단계의 레이어를 압축하는 것을 의미하고, 패딩은 입력된 이미지의 사방에 1픽셀을 특정 값으로 채우는 것을 의미하며, 스트라이드 조절은 필터를 적용하는 간격을 조절하는 것을 의미한다. 한편, 컬벌루션 레이어는 일 실시 예일 뿐, 본 개시의 레이어는 인공 지능 모델에 따라 다양한 레이어가 될 수 있음은 물론이다.
심미성 딥러닝 네트워크(321)는 서로 다른 깊이의 복수의 레이어(411-1 내지 411-n) 각각에서 이미지의 특징을 추출할 수 있다. 구체적으로, 심미성 딥러닝 네트워크(321)는 제1 레이어(411-1)에서 이미지의 제1 특징을 추출하고, 제2 레이어(411-2)에서 이미지의 제2 특징을 추출할 수 있다.
이에 따라, 심미성 딥러닝 네트워크(321)는 이미지의 디테일한 특징 및 포괄적인 특징을 모두 추출할 수 있다. 구체적으로, 심미성 딥러닝 네트워크(321)는 제1 레이어(411-1)에서 이미지의 디테일한 제1 특징을 추출할 수 있고, 제2 레이어(411-2)에서 제1 특징보다 상대적으로 포괄적인 제2 특징을 추출할 수 있다.
예를 들어, 획득된 이미지가 나무를 포함하는 이미지인 경우, 추출된 제1 특징은 나뭇잎 등이 될 수 있고, 제2 특징은 나뭇잎보다 상대적으로 포괄적인 가지 등이 될 수 있다.
마찬가지로, 심미성 딥러닝 네트워크(321)는 제3 레이어(411-3)부터 제n 레이어(411-n) 각각에서 이미지의 특징을 추출할 수 있다.
그리고, 심미성 딥러닝 네트워크(321)는 복수의 레이어(411-1 내지 411-n) 각각에서 추출된 복수의 특징에 기초하여, 이미지의 심미성 스코어를 학습할 수 있다.
이에 따라, 최종 레이어(411-n)만을 기초로 이미지의 포괄적인 특징만을 고려하여 학습하는 경우와 비교하였을 때, 본 개시는 이미지의 디테일한 특징부터 포괄적인 특징까지 고려하여 학습을 수행하므로, 이미지별로 심미성 스코어를 보다 정밀하게 학습할 수 있다.
한편, 최종 레이어(411-n) 이전의 레이어 단계에서 딥러닝 네트워크(320)는 레이어가 분기(branch)될 수 있다. 구체적으로, 심미성 딥러닝 네트워크(321)의 최종 레이어(411-n) 이전의 레이어 단계에서 레이어는 스타일 딥러닝 네트워크(322)로 분기될 수 있다.
이에 따라, 도 4에 도시된 바와 같이, 심미성 딥러닝 네트워크(321) 및 스타일 딥러닝 네트워크(322)는 복수의 레이어(411-1 내지 411-n) 중 히든 레이어(Hidden layer)(미도시)와 연결되는 최종 레이어(411-n) 이전의 레이어를 공동으로 사용할 수 있다. 즉, 심미성 딥러닝 네트워크(321) 및 스타일 딥러닝 네트워크(322)는 최종 레이어(411-n) 이전의 레이어를 공유할 수 있다.
이와 같이, 최종 레이어(411-n) 이전의 레이어를 공동으로 사용함으로써, 본 개시는, 별개의 딥러닝 네트워크를 병렬적으로 동작시키는 경우와 비교하였을 때, 메모리의 용량 부담 및 프로세서의 연산 부담을 경감시킬 수 있다.
한편, 스타일 딥러닝 네트워크(322)는 최종 레이어(411-n)에서 이미지의 특징을 추출할 수 있다. 여기에서 추출되는 특징은, 이미지가 사람을 포함하는지, 동물을 포함하는지, 풍경을 포함하는지 등과 관련된 특징이 될 수 있다.
이후, 스타일 딥러닝 네트워크(322)는 최종 레이어(411-n)에서 추출된 특징에 기초하여 이미지의 스타일을 학습할 수 있다.
도 5는 본 개시의 일 실시 예에 따른 이미지를 심미서 스코어 및 스타일에 따라 분류하는 방법을 설명하기 위한 도면이다.
딥러닝 네트워크는 학습된 결과에 기초하여, 새로이 입력되는 이미지의 심미서 스코어 및 스타일을 분류할 수 있다.
구체적으로, 도 5를 참조하면, 딥러닝 네트워크(520)는 이미지(510)가 입력되면, 입력된 이미지의 심미성 스코어(531)를 심미성 딥러닝 네트워크(521)를 통해 분류하고, 입력된 이미지의 스타일(532)을 스타일 딥러닝 네트워크(522)를 통해 분류할 수 있다.
여기에서, 딥러닝 네트워크(520)는 도 3의 딥러닝 네트워크(320)에 대응되고, 심미성 딥러닝 네트워크(521)는 도 3의 심미성 딥러닝 네트워크(321)에 대응되며, 스타일 딥러닝 네트워크(522)는 도 3의 스타일 딥러닝 네트워크(322)에 대응되는 네트워크가 될 수 있다.
전술한 바와 같이, 심미성 딥러닝 네트워크(521)는 서로 다른 깊이의 복수의 레이어 각각에서 추출된 특징을 조합하여, 입력된 이미지의 심미성 스코어를 분류할 수 있고, 스타일 딥러닝 네트워크(522)는 최종 레이어에서 추출된 특징에 기초하여 입력된 이미지의 스타일을 분류할 수 있다.
입력된 이미지의 심미성 스코어 및 스타일이 분류되면, 프로세서(120)는 이미지 스코어 및 스타일에 기초하여 이미지를 정렬(540)하고, 정렬된 이미지를 제공(550)할 수 있다.
이하, 도 6 내지 도 11을 참조하여, 이미지 스코어 및 스타일에 기초하여 이미지를 정렬하여 제공하는 실시 예를 설명한다.
도 6은 본 개시의 일 실시 예에 따른 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 복수의 이미지의 심미성 스코어가 분류되면, 심미성 스코어가 높은 순서대로 복수의 이미지를 정렬하여 제공할 수 있다.
예를 들어, 도 6을 참조하면, 프로세서(120)는 제1 내지 제8 이미지가 입력된 상태에서, 인공 지능 모델을 통해 제1 내지 제8 이미지로 갈수록 심미성 스코어가 낮아지는 것으로 분류되면, 제1 내지 제8 이미지 순서대로 이미지를 정렬하여 제공할 수 있다.
이때, 프로세서(120)는 특히 심미성 스코어가 높은 이미지에 별도의 마크를 표시할 수 있다. 예를 들어, 프로세서(120)는 심미성 스코어가 높은 이미지에 별 표시를 하여 제공할 수 있다. 다른 실시 예로, 프로세서(120)는 인공 지능 모델을 통해 심미성 스코어가 90으로 분류되면, 이미지의 일 영역에 해당 스코어를 표시하여 제공할 수도 있다.
이에 따라, 사용자는 심미성 스코어가 높은 순서대로 이미지를 제공받을 수 있고, 특히 심미성이 높은 이미지를 직관적으로 인지할 수 있다. 또한, 심미성 스코어가 이미지에 오버랩되어 표시됨으로써, 심미성 스코어가 높은 사진을 촬영한 것에 대한 격려를 받을 수 있다.
도 7은 본 개시의 일 실시 예에 따른 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 스타일 별로 이미지를 그룹화하여 제공할 수 있다. 구체적으로, 프로세서(120)는 스타일 별로 이미지를 그룹화하고, 해당 그룹 내의 이미지를 심미성 스코어 순서에 따라 정렬하여 제공할 수 있다.
예를 들어, 도 7을 참조하면, 프로세서(120)는 제1 내지 제3 스타일을 각각 그룹화 하고, 해당 그룹내의 이미지를 심미성 스코어 순서에 따라 정렬하여 제공할 수 있다. 여기에서, 제1 스타일은 사람, 제2 스타일은 동물, 제3 스타일은 풍경이 될 수 있으나, 반드시 이에 제한되는 것은 아니다.
이와 같이, 스타일 별로 그룹화하여 이미지를 제공함으로써, 사용자는 스타일 별로 심미성 스코어가 높은 이미지를 용이하게 확인할 수 있다. 또한, 스타일 별로 이미지가 그룹화되어 제공됨으로써, 사용자는 안정감 있는 이미지를 제공받을 수 있다.
도 8은 본 개시의 일 실시 예에 따른 연관성 있는 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되는 경우, 제1 및 제2 스타일의 연관성을 판단할 수 있다.
구체적으로, 프로세서(120)는 인공 지능 모델을 통해 서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되고, 제1 및 제2 스타일의 벡터들 사이의 거리가 기설정된 거리 이하인 경우, 제1 및 제2 스타일은 연관 있는 스타일인 것으로 판단할 수 있다.
보다 구체적으로, 제1 및 제2 스타일의 벡터를 좌표에 표시하였을 때, 프로세서(120)는 좌표에 표시된 벡터들 사이의 거리가 짧을수록 제1 및 제2 스타일의 연관성은 크고, 벡터들 사이의 거리가 멀수록 제1 및 제2 스타일의 연관성은 작은 것으로 판단할 수 있다. 한편, 상술한 판단은 프로세서(120)에 의해 수행될 수 있음은 물론 인공 지능 모델에 의해 수행될 수도 있다고 볼 것이다.
프로세서(120)는 제1 및 제2 스타일이 연관성이 있는 것으로 판단되면, 제1 및 제2 스타일에 포함된 이미지를 그룹화하여 심미성 스코어에 따라 정렬하여 제공할 수 있다.
예를 들어, 도 8에 도시된 바와 같이, 제1 내지 제3 스타일이 연관성이 있고, 제4 및 제5 스타일이 연관성이 있고, 제6 스타일이 다른 스타일과 연관성이 없는 것으로 판단되면, 프로세서(120)는 제1 내지 제3 스타일을 그룹화하여 심미성 스코어에 따라 정렬하여 제공하고, 제4 및 제5 스타일을 그룹화하여 심미성 스코어에 따라 정렬하여 제공하며, 제6 스타일을 별개로 심미성 스코어에 따라 정렬하여 제공할 수 있다.
한편, 연관성 있는 제1 및 제2 스타일의 실시 예로, 제1 스타일은 사람이고, 제2 스타일은 사람 및 동물이 될 수 있으나, 반드시 이에 제한되는 것은 아니다. 다른 실시 예로, 제1 스타일은 산, 제2 스타일은 바다가 될 수 있다.
이와 같이 연관성 있는 스타일을 그룹화하여 제공함으로써, 본 개시는 조화로운 이미지를 사용자에게 제공할 수 있다.
도 9는 본 개시의 일 실시 예에 따른 심미성 스코어에 따라 이미지를 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 다양한 템플릿을 통해 복수의 이미지를 심미성 스코어에 따라 정렬하여 제공할 수 있다. 여기에서, 템플릿은 서로 다른 모양의 템플릿 또는 서로 다른 크기의 템플릿이 될 수 있다.
예를 들어, 도 9에 도시된 바와 같이, 서로 다른 크기의 사각 템플릿을 통해 프로세서(120)는 복수의 이미지를 심미성 스코어에 따라 정렬하여 제공할 수 있다.
이 때, 프로세서(120)는 심미성 스코어가 높은 이미지를 화면의 중앙 영역에 배치하고, 그 다음 심미성 스코어가 높은 이미지를 화면의 우측 영역에 배치하며, 그 다음 심미성 스코어가 높은 이미지를 화면의 좌측 영역에 배치할 수 있다.
구체적으로, 프로세서(120)는 심미성 스코어가 높은 순서대로 이미지를 화면의 중앙 영역의 상측부터 하측까지 배치하고, 그 다음 심미성 스코어가 높은 순서대로 이미지를 화면의 우측 영역의 상측부터 하측까지 배치하며, 그 다음 심미성 스코어가 높은 이미지를 화면의 좌측 영역의 상측부터 하측까지 배치할 수 있다.
이는, 사용자의 시각 특정으로 고려한 배치로써, 이와 같이 복수의 이미지를 정렬하여 제공함으로써 본 개시는 심미성 스코어가 높은 순서대로 사용자가 이미지를 감상하도록 유도할 수 있다.
도 10은 본 개시의 일 실시 예에 따른, 스타일 별로 이미지를 심미성 스코어에 기초하여 정렬하여 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 다양한 템플릿을 통해 복수의 이미지를 스타일 별로 심미성 스코어에 따라 정렬하여 제공할 수 있다. 전술한 바와 같이, 템플릿은 서로 다른 모양의 템플릿 또는 서로 다른 크기의 템플릿이 될 수 있다.
예를 들어, 도 10에 도시된 바와 같이, 서로 다른 크기의 사각 템플릿을 통해 프로세서(120)는 복수의 이미지를 스타일 별로 심미성 스코어에 따라 정렬하여 제공할 수 있다.
한편, 여기에서 제공되는 스타일은 서로 연관된 스타일이 될 수 있다. 일 실시 예로, 도 10의 제1 스타일은 사람, 제2 스타일은 동물, 제3 스타일은 사람 및 동물이 될 수 있다.
이에 따라, 본 개시는 조화롭고 안정감 있는 이미지를 사용자에게 제공할 수 있다.
도 11은 본 개시의 일 실시 예에 따른 각각의 이미지를 순차적으로 제공하는 실시 예를 설명하기 위한 도면이다.
프로세서(120)는 복수의 이미지 중에서 심미성 스코어가 가장 높은 하나의 이미지를 제공할 수 있다.
또한, 프로세서(120)는 심미성 스코어가 높은 순서대로 하나의 이미지를 순차적으로 제공할 수도 있다.
구체적으로, 프로세서(120)는 심미성 스코어가 높은 순서대로 하나의 이미지를 기설정된 시간 간격으로 순차적으로 제공할 수 있다. 여기에서, 기설정된 시간 간격을 제품 출시 단계에 설정되어 있을 수 있음은 물론, 사용자 명령에 따라 설정, 변경될 수 있다. 예를 들어, 기설정된 시간 간격을 3초, 5초 등 다양하게 설정, 변경될 수 있다.
여기에서, 프로세서(120)는 전체 이미지 중에서 심미성 스코어가 높은 하나의 이미지를 순차적으로 제공할 수 있음은 물론, 전체 이미지 중에서 스타일 별로 심미성 스코어가 높은 하나의 이미지를 순차적으로 순차적으로 제공할 수도 있다.
예를 들어, 프로세서(120)는 제1 스타일에서 가장 심미성 스코어가 높은 이미지를 먼저 제공하고, 다음으로 제2 스타일에서 가장 심미성 스코어가 높은 이미지를 제공할 수 있다.
한편, 프로세서(120)는 도 6 내지 도 10과 같이 복수의 이미지를 하나의 화면에 정렬하여 제공하는 경우에도, 기설정된 시간 간격으로 화면을 변경하여 제공할 수 있다. 예를 들어, 100장의 이미지가 입력된 경우, 프로세서(120)는 10장 단위로 이미지를 하나의 화면에 정렬하여 제공할 수 있다.
도 12는 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 상세 블록도이다.
도 12를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 메모리(110), 카메라(130), 통신부(140), 디스플레이(150), 감지부(160), 스피커(170), 센서(180), 마이크(190) 및 프로세서(120)를 포함할 수 있다. 이하, 상술한 부분과 중복되는 부분은 설명은 축약하거나 생략하여 설명한다.
메모리(110)는 전자 장치(100)를 구동하기 위한 다양한 모듈을 저장한다. 예를 들어, 메모리(110)에는 베이스 모듈, 센싱 모듈, 통신 모듈, 프리젠테이션 모듈, 웹 브라우저 모듈, 서비스 모듈을 포함하는 소프트웨어가 저장될 수 있다. 이때, 베이스 모듈은 전자 장치(100)에 포함된 각 하드웨어들로부터 전달되는 신호를 처리하여 상위 레이어 모듈로 전달하는 기초 모듈이다. 센싱 모듈은 각종 센서들로부터 정보를 수집하고, 수집된 정보를 분석 및 관리하는 모듈로서, 얼굴 인식 모듈, 음성 인식 모듈, 모션 인식 모듈, NFC 인식 모듈, 오브젝트 인식 모듈 등을 포함할 수 있다. 프리젠테이션 모듈은 디스플레이 화면을 구성하기 위한 모듈로서, UI 및 그래픽 처리를 수행하는 UI 렌더링 모듈을 포함할 수 있다. 통신 모듈은 외부 장치와 통신을 수행하기 위한 모듈이다. 웹 브라우저 모듈은 웹 브라우징을 수행하여 웹 서버에 액세스하는 모듈을 의미한다. 서비스 모듈은 다양한 서비스를 제공하기 위한 각종 애플리케이션을 포함하는 모듈이다.
카메라(130)는 다양한 피사체를 촬영할 수 있다.
예를 들어, 카메라(130)는 웃는 표정의 사용자, 우는 표정의 사용자, 산책 중인 강아지, 산, 바다 등을 촬영할 수 있다.
그리고, 프로세서(120)는 카메라(130)를 통해 획득된 이미지가 인공 지능 모델을 통해 심미성 스코어 및 스타일에 기초하여 분류되면, 그 분류 결과에 기초하여 이미지를 정렬하여 제공할 수 있다.
카메라(130)는 복수의 카메라 모듈을 가지는 듀얼 카메라라고 구현될 수 있다. 다만, 이는 일 실시 예일 뿐, 카메라(130)는 하나의 카메라 모듈로 구현될 수도 있다.
통신부(140)는 외부 장치와 통신을 수행하여 다양한 데이터를 송수신할 수 있다.
구체적으로, 통신부(140)는 외부 장치와 통신을 수행하여 다양한 이미지를 수신할 수 있다. 여기에서, 외부 장치는 스마트 폰이 될 수 있음은 물론, PC, 스마트 TV, 서버 등과 같은 다양한 전자 장치가 될 수 있다.
또한, 통신부(140)는 심미성 스코어 및 스타일에 기초하여 정렬된 이미지를 외부 장치(미도시)로 전송할 수 있다. 여기에서, 외부 장치(미도시)는 디스플레이를 구비한 스마트 TV 등의 전자 장치가 될 수 있다. 이에 따라, 외부 장치(미도시)는 심미성 스코어 및 스타일에 기초하여 정렬된 이미지를 표시할 수 있다.
이를 위해, 통신부(140)는 무선 통신 칩, 와이 파이 칩, 블루투스 칩 등을 포함할 수 있다.
그리고, 프로세서(120)는 통신부(140)를 통해 획득된 이미지가 인공 지능 모델을 통해 심미성 스코어 및 스타일에 기초하여 분류되면, 그 분류 결과에 기초하여 이미지를 정렬하여 제공할 수 있다.
디스플레이(150)는 다양한 이미지를 표시할 수 있다. 특히, 디스플레이(150)는 심미성 스코어 및 스타일에 기초하여 이미지를 정렬하여 표시할 수 있다.
이러한 디스플레이(150)는 LCD(Liquid Crystal Display), PDP(Plasma Display Panel) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(150) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(150)는 터치 감지부와 결합되어 터치 스크린으로 구현될 수 있다.
감지부(160)는 사용자 명령을 감지하기 위한 다양한 감지 센서로 구현될 수 있다. 예를 들어, 감지부(160)는 터치 감지부를 포함할 수 있다.
스피커(170)는 오디오 처리부(미도시)에 의해 디코딩이나 증폭, 노이즈 필터링과 같은 다양한 처리 작업이 수행된 각종 오디오 데이터를 출력하는 구성이다. 또한, 스피커(170)는 각종 알림 음이나 음성 메시지를 출력할 수 있다. 본 개시의 일 실시 예에 따르면, 스피커(170)는 카메라(130)에 의해 영상이 촬영되는 경우나 이미지를 심미성 스코어 및 스타일에 기초하여 정렬하여 제공하는 경우 오디오를 출력할 수 있다.
센서(180)는 전자 장치(100)의 움직임을 감지할 수 있다. 구체적으로, 센서(180)는 가속도 센서, 자이로 센서 또는 지자기 센서로 구현되어, 전자 장치(100)의 움직임을 감지할 수 있다.
센서(180)는 전자 장치(100) 주변의 조도를 감지할 수 있다. 구체적으로, 센서(180)는 조도 센서로 구현되어, 전자 장치(100) 주변의 조도, 전자 장치(100)에 입사되는 외광의 방향, 밝기 등을 감지할 수 있다.
마이크(190)는 사용자 음성을 수신할 수 있다. 여기에서, 사용자 음성은 카메라 제어를 사용자 음성 또는 이미지를 정렬하여 출력할 것을 요구하는 사용자 음성 등의 다양한 음성이 될 수 있다.
프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어한다.
프로세서(120)는 센서(180)에 의해 감지된 주변 조도에 기초하여, 이미지를 보정할 수 있다.
구체적으로, 프로세서(120)는 조도 센서에 의해 감지된 외광의 색 온도 및 밝기 정보 중 적어도 하나에 기초하여, 이미지의 색 온도 및 밝기 중 적어도 하나를 보정할 수 있다.
예를 들어, 프로세서(120)는 조도 센서로부터 획득한 밝기 정보에 기초하여, 외광의 광도가 어둡다고 판단될 경우, 이미지의 전체 밝기를 어둡게 조절할 수 있다.
프로세서(120)는 마이크(190)를 통해 이미지를 정렬하여 표시하기 위한 사용자 음성이 수신되면, 심미성 스코어 및 스타일에 기초하여 정렬된 이미지가 표시될 수 있도록 디스플레이(150)를 제어할 수 있다.
구체적으로, 프로세서(120)는 마이크(190)를 통해 이미지를 정렬하여 표시하기 위한 사용자 음성이 수신되면, 인공 지능 모델을 통해 이미지를 심미성 스코어 및 스타일에 기초하여 분류하고, 그 분류 결과에 기초하여 이미지를 정렬하여 표시하도록 디스플레이(150)를 제어할 수 있다.
도 13 본 개시의 일 실시 예에 따른 전자 장치가 방송 수신 장치로 구현되는 경우를 설명하기 위한 상세 블록도이다.
본 개시의 일 실시 예에 따른 전자 장치(100)는 방송 수신 장치로 구현될 수 있다.
이 경우, 도 13을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 방송 수신부(230), 신호 분리부(235), A/V 처리부(240), 오디오 출력부(245), 저장부(250), 통신부(255), 조작부(260), 프로세서(270), 영상 신호 생성부(275), 패널부(280) 및 LED 드라이버 (290)를 포함할 수 있다.
방송 수신부(230)는 방송국 또는 위성으로부터 유선 또는 무선으로 방송을 수신할 수 있다. 여기에서, 방송 수신부(230)는 튜너로 구현될 수 있다.
신호 분리부(235)는 방송 수신부(230)로부터 수신된 방송 신호를 영상 신호, 오디오 신호, 부가정보 신호로 분리한다. 그리고 신호 분리부(235)는 영상 신호 및 오디오 신호를 A/V 처리부(240)로 전송한다.
A/V 처리부(240)는 방송 수신부(230) 및 저장부(250)로부터 입력된 영상 신호 및 오디오 신호에 대해 비디오 디코딩, 비디오 스케일링, 오디오 디코딩 등의 신호처리를 수행한다. 그리고 A/V 처리부(240)는 영상 신호를 영상 신호 생성부(220)로 전송하고, 오디오 신호를 오디오 출력부(145)로 전송한다.
오디오 출력부(245)는 A/V 처리부(240)로부터 수신된 오디오 신호를 사운드로 변환하여 스피커(미도시)를 통해 출력할 수 있다.
영상 신호 생성부(275)는 GUI(Graphic User Interface)를 생성한다. 그리고 영상 신호 생성부(275)는 생성된 GUI를 A/V 처리부(240)로부터 수신된 영상에 부가한다. 그리고 영상 신호 생성부(275)는 GUI가 부가된 영상에 대응되는 영상 신호를 패널부(280)로 전송한다. 이에 따라, 패널부(280)는 디스플레이 장치(200)에서 제공하는 각종 정보 및 영상 신호 생성부(275)에서 전달된 영상을 표시할 수 있다.
그리고 영상 신호 생성부(275)는 영상 신호에 대응되는 밝기 정보를 추출하고, 추출된 밝기 정보에 대응되는 디밍 신호를 생성할 수 있다. 그리고 영상 신호 생성부(275)는 생성된 디밍 신호를 패널부(280)에 제공할 수 있다. 이러한 디밍 신호는 PWM 신호일 수 있다. 한편, 본 실시 예에서는 영상 신호 생성부(275)에서 디밍 신호를 생성하여 패널부(280)에 제공하는 것으로 설명하였지만, 패널부(280)가 디밍 신호를 자체적으로 생성할 수도 있다.
패널부(280)는 영상을 표시한다. 이러한 패널부(280)는 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 패널부(280) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 패널부(280)는 터치 감지부와 결합하여 터치 스크린으로 구현될 수 있다.
저장부(250)는 영상 컨텐츠를 저장할 수 있다. 구체적으로, 저장부(250)는 A/V 처리부(240)로부터 영상과 오디오가 압축된 영상 컨텐츠를 수신하고, 이를 저장할 수 있다. 한편, 저장부(250)는 하드디스크, 비휘발성 메모리, 휘발성 메모리 등으로 구현될 수 있다.
조작부(260)는 터치 스크린, 터치패드, 키 버튼, 키 패드 등으로 구현될 수 있다.
통신부(255)는 다양한 유형의 통신방식에 따라 다양한 유형의 외부 기기와 통신을 수행하는 구성이다. 통신부(255)는 와이파이 칩, 블루투스 칩을 포함할 수 있다. 프로세서(270)는 통신부(255)를 이용하여 각종 외부 기기와 통신을 수행할 수 있다.
한편, 전자 장치(100)는 USB 커넥터가 연결될 수 있는 USB 포트나, 헤드셋, 마우스, LAN 등과 같은 다양한 외부 단자와 연결하기 위한 다양한 외부 입력 포트, DMB(Digital Multimedia Broadcasting) 신호를 수신하여 처리하는 DMB 칩 등을 더 포함할 수 있다.
또한, 전자 장치(100)는 도 13에 도시된 구성 외에, 전원 공급부(미도시) 및 센싱부(미도시)를 더 포함할 수 있다. 전원 공급부는 전자 장치(100) 내의 각 구성에 전원을 공급한다. 센싱부는 카메라, 움직임 감지부 등과 같은 다양한 센싱 장치를 포함할 수 있다.
또한, 전자 장치(100)는 셋톱박스 등의 영상 공급 장치와 연결될 수 있는 인터페이스(미도시)를 더 포함할 수 있다. 여기에서, 인터페이스는 HDMI(High-Definition Multimedia Interface) 입력 단자, 컴포넌트 입력 단자, RGB 단자, DVI 단자, DP 단자, 썬더볼트 단자 또는 USB 입력 단자 등이 될 수 있다.
이에 따라, 전자 장치(100)는 인터페이스(미도시)를 통해 셋톱박스 등의 영상 공급 장치로부터 방송 신호, 컨텐츠에 대한 영상 신호, 오디오 신호, 배경 이미지와 관련된 신호 등을 수신할 수 있다.
그리고, 전자 장치(100)는 인터페이스를 통해 영상 공급 장치로부터 수신된 영상 신호를 처리하여 패널부(280)를 통해 영상을 표시하고, 수신된 오디오 신호를 사운드로 변환하여 스피커(미도시)를 통해 출력할 수 있다.
또한, 전자 장치(100)는 사용자 음성을 수신할 수 있는 마이크(미도시)를 더 포함할 수 있다. 여기에서, 사용자 음성은 전자 장치(100)의 카메라를 제어하기 위한 음성 또는 이미지를 정렬하여 패널부(280)에 표시하기 위한 음성 등 다양한 음성이 될 수 있다.
프로세서(270)는 전자 장치(100)의 전반적인 동작을 제어한다. 프로세서(270)는 도 13에 도시된 바와 같이, CPU, GPU, ROM, RAM을 포함할 수 있다.
프로세서(270)는 조작부(260)를 통하여 입력 받은 제어 명령에 따른 영상이 표시되도록 영상 신호 생성부(275), 패널부(280)를 제어할 수 있다.
특히, 프로세서(270)는 마이크(미도시)를 통해 이미지를 정렬하여 표시하기 위한 사용자 음성이 수신되면, 심미성 스코어 및 스타일에 기초하여 정렬된 이미지를 표시하도록 패널부(280)를 제어할 수 있다.
또한, 프로세서(270)는 마이크(미도시)를 통해 이미지를 정렬하여 표시하기 위한 사용자 음성이 수신되면, 이미지의 전송을 요청하는 신호를 외부 장치(미도시)로 전송하도록 통신부(255)를 제어 할 수도 있다.
구체적으로, 프로세서(270)는 마이크(미도시)를 통해 이미지를 정렬하여 표시하기 위한 사용자 음성이 수신되면, 블루투스 또는 와이파이 등의 무선 통신을 통해 이미지의 전송을 요청하는 신호를 외부 장치(미도시)로 전송할 수 있다.
여기에서, 외부 장치(미도시)는 스마트 폰, 서버 등이 될 수 있다. 이 경우, 외부 장치(미도시)는 전자 장치(100)로 복수의 이미지를 전송할 수 있다. 그리고, 전자 장치(100)는 복수의 이미지가 수신되면 인공 지능 모델을 통해 이미지를 심미성 스코어 및 스타일에 기초하여 분류하고, 그 분류 결과에 기초하여 정렬된 이미지를 표시할 수 있다.
한편, 이상에서는 전자 장치(100)에 의해 이미지가 정렬되는 것으로 설명하였으나, 이미지의 정렬은 서버 등의 외부 장치(미도시)에 의해 수행될 수도 있다.
일 실시 예에 따라, 전자 장치(100)가 복수의 이미지를 외부 장치(미도시)로 전송하면, 외부 장치(미도시)는 인공 지능 모델을 통해 복수의 이미지를 심미성 스코어 및 스타일에 기초하여 분류하고, 그 분류 결과에 기초하여 정렬된 이미지를 전자 장치(100)로 전송할 수 있다.
이에 따라, 프로세서(270)는 심미성 스코어 및 스타일에 기초하여 정렬된 이미지를 패널부(280)를 통해 디스플레이할 수 있다.
도 14는 본 개시의 일 실시 예에 따른, 인공 지능 모델을 이용하는 전자 장치의 동작을 설명하기 위한 도면이다.
프로세서(1400)는 학습부(1410) 및 인식부(1420) 중 적어도 하나를 포함할 수 있다. 여기에서, 프로세서(1400)는 도 2의 프로세서(120)에 대응될 수 있다.
학습부(1410)는 소정의 상황 판단을 위한 기준을 갖는 인식 모델을 생성 또는 학습시킬 수 있다. 학습부(1410)는 수집된 학습 데이터를 이용하여 판단 기준을 갖는 인식 모델을 생성할 수 있다.
일 예로, 학습부(1410)는 기저장된 복수의 이미지를 학습 데이터로 이용하여, 기저장된 복수의 이미지를 심미성 스코어 및 스타일에 기초하여 분류하는 인공 지능 모델을 생성, 학습 또는 갱신시킬 수 있다.
인식부(1420)는 소정의 데이터를 학습된 인식 모델의 입력 데이터로 사용하여, 소정의 데이터에 대한 응답 정보를 추정할 수 있다.
일 예로, 인식부(1420)는 소정의 이미지를 학습된 인식 모델의 입력 데이터로 사용하여, 해당 이미지에 대한 응답 정보를 획득(또는, 추정, 추론)할 수 있다.
학습부(1410)의 적어도 일부 및 인식부(1420)의 적어도 일부는, 소프트웨어 모듈로 구현되거나 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다.
예를 들어, 학습부(1410) 및 인식부(1420) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치 또는 객체 인식 장치에 탑재될 수도 있다. 이 때, 인공 지능을 위한 전용 하드웨어 칩은 확률 연산에 특화된 전용 프로세서로서, 기존의 범용 프로세서보다 병렬처리 성능이 높아 기계 학습과 같은 인공 지능 분야의 연산 작업을 빠르게 처리할 수 있다. 학습부(1410) 및 인식부(1420)가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
이 경우, 학습부(1410) 및 인식부(1420)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 학습부(1410) 및 인식부(1420) 중 하나는 전자 장치(100)에 포함되고, 나머지 하나는 외부의 서버에 포함될 수 있다. 또한, 학습부(1410) 및 인식부(1420)는 유선 또는 무선으로 통하여, 학습부(1410)가 구축한 모델 정보를 인식부(1420)로 제공할 수도 있고, 인식부(1420)로 입력된 데이터가 추가 학습 데이터로서 학습부(1410)로 제공될 수도 있다.
도 15는 본 개시의 일 실시 예에 따른 학습부 및 인식부의 블록도이다.
도 15 를 참조하면, 일부 실시 예에 따른 학습부(1510)는 학습 데이터 획득부(1510-1) 및 모델 학습부(1510-4)를 포함할 수 있다. 또한, 학습부(1950)는 학습 데이터 전처리부(1510-2), 학습 데이터 선택부(1510-3) 및 모델 평가부(1510-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.
학습 데이터 획득부(1510-1)는 인식 대상을 추론하기 위한 인식 모델에 필요한 학습 데이터를 획득할 수 있다. 본 개시의 실시 예로, 학습 데이터 획득부(1510-1)는 기저장된 복수의 이미지를 학습 데이터로서 획득할 수 있다. 학습 데이터는 학습부(1510) 또는 학습부(1510)의 제조사가 수집 또는 테스트한 데이터가 될 수도 있다.
모델 학습부(1510-4)는 학습 데이터를 이용하여, 인식 모델이 소정의 인식 대상을 어떻게 판단할 지에 관한 판단 기준을 갖도록 학습시킬 수 있다. 예로, 모델 학습부(1510-4)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또는, 모델 학습부(1510-4)는, 예를 들어, 별다른 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 상황의 판단을 위한 판단 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또한, 모델 학습부(1510-4)는, 예를 들어, 학습에 따른 상황 판단의 결과가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또한, 모델 학습부(1510-4)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 인식 모델을 학습시킬 수 있다
또한, 모델 학습부(1510-4)는 입력 데이터를 이용하여 인식 대상을 추정하기 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 선별 기준을 학습할 수도 있다.
모델 학습부(1510-4)는 미리 구축된 인식 모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 인식 모델을 학습할 인식 모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입 별로 기 분류되어 있을 수 있으며, 인식 모델은 데이터의 타입 별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 오브젝트의 종류 등과 같은 다양한 기준으로 기 분류되어 있을 수 있다.
인식 모델이 학습되면, 모델 학습부(1510-4)는 학습된 인식 모델을 저장할 수 있다. 이 경우, 모델 학습부(1510-4)는 학습된 인식 모델을 전자 장치(100)의 메모리에 저장할 수 있다. 또는, 모델 학습부(1510-4)는 학습된 인식 모델을 전자 장치(100)와 유선 또는 무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.
학습부(1510)는 인식 모델의 분석 결과를 향상시키거나, 인식 모델의 생성에 필요한 자원 또는 시간을 절약하기 위하여, 학습 데이터 전처리부(1510-2) 및 학습 데이터 선택부(1510-3)를 더 포함할 수도 있다.
학습 데이터 전처리부(1510-2)는 상황 판단을 위한 학습에 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 학습 데이터 전처리부(1510-2)는 모델 학습부(1510-4)가 상황 판단을 위한 학습을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.
학습 데이터 선택부(1510-3)는 학습 데이터 획득부(1510-1)에서 획득된 데이터 또는 학습 데이터 전처리부(1510-2)에서 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(1510-4)에 제공될 수 있다. 학습 데이터 선택부(1510-3)는 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 학습에 필요한 학습 데이터를 선택할 수 있다. 또한, 학습 데이터 선택부(1510-3)는 모델 학습부(1510-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 학습 데이터를 선택할 수도 있다.
학습부(1510)는 데이터 인식 모델의 분석 결과를 향상시키기 위하여, 모델 평가부(1510-5)를 더 포함할 수도 있다.
모델 평가부(1510-5)는 인식 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(1510-4)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 인식 모델을 평가하기 위한 기 정의된 데이터일 수 있다.
예를 들어, 모델 평가부(1510-5)는 평가 데이터에 대한 학습된 인식 모델의 분석 결과 중에서, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다.
한편, 학습된 인식 모델이 복수 개가 존재하는 경우, 모델 평가부(1510-5)는 각각의 학습된 인식 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 인식 모델로서 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(1510-5)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 인식 모델로서 결정할 수 있다.
본 개시의 일 실시 예에 따른 인식부(1520)는 인식 데이터 획득부(1520-1) 및 인식 결과 제공부(1520-4)를 포함할 수 있다.
또한, 인식부(1520)는 인식 데이터 전처리부(1520-2), 인식 데이터 선택부(1520-3) 및 모델 갱신부(1520-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.
인식 데이터 획득부(1520-1)는 상황 판단에 필요한 데이터를 획득할 수 있다. 인식 결과 제공부(1520-4)는 인식 데이터 획득부(1520-1)에서 획득된 데이터를 입력 값으로 학습된 인식 모델에 적용하여 상황을 판단할 수 있다. 인식 결과 제공부(1520-4)는 데이터의 분석 목적에 따른 분석 결과를 제공할 수 있다. 인식 결과 제공부(1520-4)는 후술할 인식 데이터 전처리부(1520-2) 또는 인식 데이터 선택부(1520-3)에 의해 선택된 데이터를 입력 값으로 인식 모델에 적용하여 분석 결과를 획득할 수 있다. 분석 결과는 인식 모델에 의해 결정될 수 있다.
인식부(1520)는 인식 모델의 분석 결과를 향상시키거나, 분석 결과의 제공을 위한 자원 또는 시간을 절약하기 위하여, 인식 데이터 전처리부(1520-2) 및 인식 데이터 선택부(1520-3)를 더 포함할 수도 있다.
인식 데이터 전처리부(1520-2)는 상황 판단을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 인식 데이터 전처리부(1520-2)는 인식 결과 제공부(1520-4)가 상황 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 정의된 포맷으로 가공할 수 있다.
인식 데이터 선택부(1520-3)는 인식 데이터 획득부(1520-1)에서 획득된 데이터 또는 인식 데이터 전처리부(1520-2)에서 전처리된 데이터 중에서 상황 판단에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(1520-4)에게 제공될 수 있다. 인식 데이터 선택부(1920-3)는 상황 판단을 위한 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(1520-3)는 모델 학습부(1510-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 데이터를 선택할 수도 있다.
모델 갱신부(1520-5)는 인식 결과 제공부(1520-4)에 의해 제공되는 분석 결과에 대한 평가에 기초하여, 인식 모델이 갱신되도록 제어할 수 있다. 예를 들어, 모델 갱신부(1520-5)는 인식 결과 제공부(1520-4)에 의해 제공되는 분석 결과를 모델 학습부(1510-4)에게 제공함으로써, 모델 학습부(1510-4)가 인식 모델을 추가 학습 또는 갱신하도록 요청할 수 있다.
도 16은 본 개시의 일 실시 예에 따른 전자 장치의 동작을 설명하기 위한 흐름도이다.
전자 장치(100)는 적어도 하나의 이미지를 획득(S1610)할 수 있다.
여기에서 이미지는 전자 장치(100)의 카메라를 통해 촬영된 이미지가 될 수 있음은 물론, 전자 장치(100)에 기저장된 이미지 또는 외부 장치(미도시)로부터 수신된 이미지가 될 수 있다.
예를 들어, 전자 장치(100)는 웃는 표정의 사람을 포함하는 이미지, 우는 표정의 사람을 포함하는 이미지, 산책 중인 강아지를 포함하는 이미지 등을 획득할 수 있다.
전자 장치(100)는 인공 지능 모델을 통해 적어도 하나의 이미지가 심미성 스코어에 기초하여 분류되면, 그 분류 결과에 기초하여 이미지를 정렬하여 제공(S1620)할 수 있다.
예를 들어, 전자 장치(100)는 인공 지능 모델을 통해 웃는 표정의 사람을 포함하는 이미지, 산책 중인 강아지를 포함하는 이미지, 꼬리를 흔드는 강아지를 포함하는 이미지 등의 순서대로 복수의 이미지가 심미성 스코어에 기초하여 분류되면, 심미성 스코어가 높은 순서대로 복수의 이미지를 정렬한 이미지를 제공할 수 있다.
또한, 전자 장치(100)는 스타일 별로 복수의 이미지를 심미성 스코어에 따라 정렬하여 제공할 수 있다.
구체적으로, 전자 장치(100)는 인공 지능 모델을 통해 이미지의 스타일이 분류되면, 스타일 별로 심미성 스코어가 높은 순서대로 복수의 이미지를 정렬하여 제공할 수 있다.
예를 들어, 전자 장치(100)는 인공 지능 모델을 통해 복수의 이미지가 사람 스타일, 동물 스타일 및 풍경 스타일로 분류되면, 각 스타일 별로 심미성 스코어가 높은 순서대로 복수의 이미지를 정렬한 이미지를 제공할 수 있다.
이와 같이, 본 개시는 복수의 이미지를 심미성이 높은 순서대로 정렬하여 제공하므로 사용자는 품질이 뛰어난 이미지를 우선적으로 제공받을 수 있다. 또한, 본 개시는 복수의 이미지를 스타일 별로 구분하여 제공함으로써, 사용자는 조화롭게 정렬된 이미지를 감상할 수 있다.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어/하드웨어 업그레이드 만으로도 구현될 수 있다.
또한, 상술한 본 발명의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 외부의 서버를 통해 수행되는 것도 가능하다.
상술한 다양한 실시 예에 따른 전자 장치의 제어 방법은 프로그램으로 구현되어 다양한 기록 매체에 저장될 수 있다. 즉, 각종 프로세서에 의해 처리되어 상술한 다양한 제어 방법을 실행할 수 있는 컴퓨터 프로그램이 기록 매체에 저장된 상태로 사용될 수도 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
100: 전자 장치
110: 메모리
120: 프로세서

Claims (16)

  1. 전자 장치에 있어서,
    메모리; 및
    획득된 복수의 이미지를 상기 메모리에 저장하고,
    인공 지능 모델을 통해 상기 복수의 이미지 각각에 대응하는 심미성 스코어(score) 및 스타일 정보를 획득하고, 상기 스타일 정보에 기초하여 상기 복수의 이미지를 스타일에 따라 분류하고, 상기 심미성 스코어에 기초하여 상기 분류된 복수의 이미지를 정렬하여 제공하는 프로세서;를 포함하고,
    상기 인공 지능 모델은, 입력된 이미지의 적어도 하나의 특징에 기초하여 상기 이미지에 대응하는 심미성 스코어를 출력하는 심미성 딥러닝 네트워크 및 상기 이미지의 적어도 하나의 특징에 기초하여 상기 이미지의 스타일 정보를 출력하는 스타일 딥러닝 네트워크를 포함하고,
    상기 심미성 딥러닝 네트워크 및 상기 스타일 딥러닝 네트워크는 상기 이미지의 적어도 하나의 특징을 각각 추출하는 서로 다른 깊이의 복수의 레이어를 공유하되, 상기 공유된 복수의 레이어 이후의 서로 다른 최종 레이어를 각각 포함하는, 전자 장치.
  2. 제1항에 있어서,
    상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고,
    상기 인공 지능 모델은, 상기 제1 레이어에서 상기 이미지의 제1 특징을 추출하고, 상기 제2 레이어에서 상기 이미지의 상기 제1 특징보다 상대적으로 포괄적인 제2 특징을 추출하는, 전자 장치.
  3. 삭제
  4. 제1항에 있어서,
    상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고,
    상기 인공 지능 모델은,
    상기 제1 레이어에서 추출된 제1 특징 및 제2 레이어에서 추출된 제2 특징에 기초하여 상기 복수의 이미지를 상기 심미성 스코어에 따라 분류하고, 상기 제2 레이어에서 추출된 제3 특징에 기초하여 상기 복수의 이미지를 상기 스타일 정보에 따라 분류하는, 전자 장치.
  5. 제1항에 있어서,
    상기 프로세서는,
    상기 심미성 스코어가 높은 순서대로 상기 복수의 이미지를 정렬하여 제공하거나, 상기 복수의 이미지 중 상기 심미성 스코어가 상대적으로 가장 높은 하나의 이미지를 제공하거나, 상기 심미성 스코어가 높은 순서대로 하나의 이미지를 기설정된 시간 간격으로 순차적으로 제공하는, 전자 장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 스타일 별로 상기 복수의 이미지를 상기 심미성 스코어에 따라 정렬하여 제공하는, 전자 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되는 경우, 상기 제1 및 제2 스타일의 연관성을 판단하고, 연관성이 있는 것으로 판단되면 상기 서로 다른 이미지를 그룹화하여 상기 심미성 스코어에 따라 상기 서로 다른 이미지를 정렬하여 제공하는, 전자 장치.
  8. 제1항에 있어서,
    상기 심미성 스코어는, 상기 복수의 이미지에 각각 포함된 오브젝트의 구도, 상기 이미지에 포함된 컬러의 다양성 및 상기 이미지에 적용된 촬영 기법 중 적어도 하나에 기초하여 결정되고, 상기 스타일 정보는, 상기 복수의 이미지에 각각 포함된 사람, 동물, 건물 및 자연 풍경 중 적어도 하나에 기초하여 결정되는, 전자 장치.
  9. 전자 장치의 제어 방법에 있어서,
    복수의 이미지를 획득하는 단계; 및
    인공 지능 모델을 통해 상기 복수의 이미지 각각에 대응하는 심미성 스코어(score) 및 스타일 정보를 획득하고, 상기 획득된 스타일 정보에 기초하여 상기 복수의 이미지를 스타일에 따라 분류하고, 상기 심미성 스코어에 기초하여 상기 분류된 복수의 이미지를 정렬하여 제공하는 단계;를 포함하고,
    상기 인공 지능 모델은, 입력된 이미지의 적어도 하나의 특징에 기초하여 상기 이미지에 대응하는 심미성 스코어를 출력하는 심미성 딥러닝 네트워크 및 상기 이미지의 적어도 하나의 특징에 기초하여 상기 이미지의 스타일 정보를 출력하는 스타일 딥러닝 네트워크를 포함하고,
    상기 심미성 딥러닝 네트워크 및 상기 스타일 딥러닝 네트워크는 상기 이미지의 적어도 하나의 특징을 각각 추출하는 서로 다른 깊이의 복수의 레이어를 공유하되, 상기 공유된 복수의 레이어 이후의 서로 다른 최종 레이어를 각각 포함하는, 전자 장치의 제어 방법.
  10. 제9항에 있어서,
    상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고,
    상기 인공 지능 모델은,
    상기 제1 레이어에서 상기 이미지의 제1 특징을 추출하고, 상기 제2 레이어에서 상기 이미지의 상기 제1 특징보다 상대적으로 포괄적인 제2 특징을 추출하는, 전자 장치의 제어 방법.
  11. 삭제
  12. 제9항에 있어서,
    상기 복수의 레이어는 제1 레이어 및 상기 제1 레이어보다 상대적으로 깊은 제2 레이어를 포함하고,
    상기 인공 지능 모델은,
    상기 제1 레이어에서 추출된 제1 특징 및 제2 레이어에서 추출된 제2 특징에 기초하여 상기 복수의 이미지를 상기 심미성 스코어에 따라 분류하고, 상기 제2 레이어에서 추출된 제3 특징에 기초하여 상기 복수의 이미지를 상기 스타일 정보에 따라 분류하는, 전자 장치의 제어 방법.
  13. 제9항에 있어서,
    상기 제공하는 단계는,
    상기 심미성 스코어가 높은 순서대로 상기 복수의 이미지를 정렬하여 제공하거나, 상기 복수의 이미지 중 상기 심미성 스코어가 상대적으로 가장 높은 하나의 이미지를 제공하거나, 상기 심미성 스코어가 높은 순서대로 하나의 이미지를 기설정된 시간 간격으로 순차적으로 제공하는, 전자 장치의 제어 방법.
  14. 제9항에 있어서,
    상기 제공하는 단계는,
    상기 스타일 별로 상기 복수의 이미지를 상기 심미성 스코어에 따라 정렬하여 제공하는, 전자 장치의 제어 방법.
  15. 제9항에 있어서,
    상기 제공하는 단계는,
    서로 다른 이미지가 제1 및 제2 스타일로 각각 분류되는 경우, 상기 제1 및 제2 스타일의 연관성을 판단하고, 연관성이 있는 것으로 판단되면 상기 서로 다른 이미지를 그룹화하여 상기 심미성 스코어에 따라 상기 서로 다른 이미지를 정렬하여 제공하는, 전자 장치의 제어 방법.
  16. 제9항에 있어서,
    상기 심미성 스코어는, 상기 복수의 이미지에 각각 포함된 오브젝트의 구도, 상기 이미지에 포함된 컬러의 다양성 및 상기 이미지에 적용된 촬영 기법 중 적어도 하나에 기초하여 결정되고, 상기 스타일 정보는, 상기 복수의 이미지에 각각 포함된 사람, 동물, 건물 및 자연 풍경 중 적어도 하나에 기초하여 결정되는, 전자 장치의 제어 방법.

KR1020180132175A 2018-10-31 2018-10-31 전자 장치 및 그 제어 방법 KR102568853B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020180132175A KR102568853B1 (ko) 2018-10-31 2018-10-31 전자 장치 및 그 제어 방법
US16/601,970 US11145088B2 (en) 2018-10-31 2019-10-15 Electronic apparatus and method for controlling thereof
PCT/KR2019/013556 WO2020091268A1 (en) 2018-10-31 2019-10-16 Electronic apparatus and method for controlling thereof
EP19880361.1A EP3867811A4 (en) 2018-10-31 2019-10-16 Electronic apparatus and method for controlling thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180132175A KR102568853B1 (ko) 2018-10-31 2018-10-31 전자 장치 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR20200052462A KR20200052462A (ko) 2020-05-15
KR102568853B1 true KR102568853B1 (ko) 2023-08-21

Family

ID=70327070

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180132175A KR102568853B1 (ko) 2018-10-31 2018-10-31 전자 장치 및 그 제어 방법

Country Status (4)

Country Link
US (1) US11145088B2 (ko)
EP (1) EP3867811A4 (ko)
KR (1) KR102568853B1 (ko)
WO (1) WO2020091268A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102608147B1 (ko) * 2018-12-05 2023-12-01 삼성전자주식회사 디스플레이 장치 및 그 구동 방법
US11290640B2 (en) 2020-06-10 2022-03-29 Samsung Electronics Co., Ltd. Electronic device and controlling method of electronic device
US11935154B2 (en) * 2022-03-02 2024-03-19 Microsoft Technology Licensing, Llc Image transformation infrastructure

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160098844A1 (en) 2014-10-03 2016-04-07 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080285860A1 (en) 2007-05-07 2008-11-20 The Penn State Research Foundation Studying aesthetics in photographic images using a computational approach
US8238615B2 (en) 2009-09-25 2012-08-07 Eastman Kodak Company Method for comparing photographer aesthetic quality
US9536293B2 (en) 2014-07-30 2017-01-03 Adobe Systems Incorporated Image assessment using deep convolutional neural networks
US9412043B2 (en) * 2014-10-03 2016-08-09 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality
KR102486699B1 (ko) 2014-12-15 2023-01-11 삼성전자주식회사 영상 인식 방법, 영상 검증 방법, 장치, 및 영상 인식 및 검증에 대한 학습 방법 및 장치
US10346726B2 (en) 2014-12-15 2019-07-09 Samsung Electronics Co., Ltd. Image recognition method and apparatus, image verification method and apparatus, learning method and apparatus to recognize image, and learning method and apparatus to verify image
US9639781B2 (en) * 2015-04-10 2017-05-02 Cognex Corporation Systems and methods for classification and alignment of highly similar or self-similar patterns
CN105718960B (zh) 2016-01-27 2019-01-04 北京工业大学 基于卷积神经网络和空间金字塔匹配的图像排序模型
US10002415B2 (en) * 2016-04-12 2018-06-19 Adobe Systems Incorporated Utilizing deep learning for rating aesthetics of digital images
US10410108B2 (en) 2016-08-08 2019-09-10 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality personalized to users or segments
KR20180027887A (ko) 2016-09-07 2018-03-15 삼성전자주식회사 뉴럴 네트워크에 기초한 인식 장치 및 뉴럴 네트워크의 트레이닝 방법
US10726086B2 (en) 2016-11-15 2020-07-28 Houzz, Inc. Aesthetic search engine
US10110868B2 (en) * 2016-12-22 2018-10-23 Aestatix LLC Image processing to determine center of balance in a digital image
US10970605B2 (en) * 2017-01-03 2021-04-06 Samsung Electronics Co., Ltd. Electronic apparatus and method of operating the same
KR101888647B1 (ko) 2017-01-25 2018-08-14 서울대학교산학협력단 이미지 분류 장치 및 방법
US10049308B1 (en) * 2017-02-21 2018-08-14 A9.Com, Inc. Synthesizing training data
US11030722B2 (en) * 2017-10-04 2021-06-08 Fotonation Limited System and method for estimating optimal parameters
CN107908646B (zh) * 2017-10-10 2019-12-17 西安电子科技大学 一种基于分层卷积神经网络的图像检索方法
CA3081643A1 (en) * 2017-11-06 2019-05-09 University Health Network Platform, device and process for annotation and classification of tissue specimens using convolutional neural network
US11069030B2 (en) * 2018-03-22 2021-07-20 Adobe, Inc. Aesthetics-guided image enhancement
US10467504B1 (en) * 2019-02-08 2019-11-05 Adhark, Inc. Systems, methods, and storage media for evaluating digital images
US11132845B2 (en) * 2019-05-22 2021-09-28 Microsoft Technology Licensing, Llc Real-world object recognition for computing device
US11650597B2 (en) * 2019-07-09 2023-05-16 Samsung Electronics Co., Ltd. Electronic apparatus for identifying object through warped image and control method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160098844A1 (en) 2014-10-03 2016-04-07 EyeEm Mobile GmbH Systems, methods, and computer program products for searching and sorting images by aesthetic quality

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Xin Lu et. al., Published 3 November 2014. Computer Science. Proceedings of the 22nd ACM international conference on Multimedia. RAPID: Rating Pictorial Aesthetics using Deep Learning, 2014.11.03. 1부.*

Also Published As

Publication number Publication date
KR20200052462A (ko) 2020-05-15
US20200134874A1 (en) 2020-04-30
EP3867811A4 (en) 2021-12-29
WO2020091268A1 (en) 2020-05-07
US11145088B2 (en) 2021-10-12
EP3867811A1 (en) 2021-08-25

Similar Documents

Publication Publication Date Title
KR102453169B1 (ko) 디바이스가 이미지를 보정하는 방법 및 그 디바이스
KR102481016B1 (ko) 사진 촬영과 관련된 추천 정보를 제공하는 방법 및 시스템
US10631045B2 (en) Method and apparatus for filtering video
US11482000B2 (en) Image processing apparatus and control method thereof
KR102428920B1 (ko) 전자 장치 및 그 동작 방법
KR102359391B1 (ko) 디바이스가 이미지를 보정하는 방법 및 그 디바이스
US10528799B2 (en) Electronic apparatus and operation method thereof
KR102556492B1 (ko) 텍스트와 연관된 이미지 제공 방법 및 이를 위한 전자 장치
US20210390673A1 (en) Image-capturing device and method for controlling same
KR102568853B1 (ko) 전자 장치 및 그 제어 방법
KR20210062428A (ko) 영상 촬영 장치의 원격 제어 방법 및 장치
KR102430567B1 (ko) 텍스트와 연관된 이미지 제공 방법 및 이를 위한 전자 장치
KR20190107857A (ko) 디스플레이장치 및 그 제어방법
WO2022143314A1 (zh) 一种对象注册方法及装置
KR20200084395A (ko) 영상에서 오브젝트를 인식하는 전자 장치 및 그 동작 방법
KR20200094607A (ko) 영상 시퀀스에 대한 캡션 정보를 생성하는 전자 장치 및 그 동작 방법
KR20200084428A (ko) 동영상을 제작하는 방법 및 그에 따른 장치
KR20190096752A (ko) 컨텐츠에 대한 텍스트 코멘트를 생성하는 방법 및 전자 장치
US11558545B2 (en) Electronic apparatus, controlling method of electronic apparatus, and computer readable medium
JP2019061642A (ja) 映像処理装置及びその方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant