KR102530045B1 - 전자 장치 및 그 동작 방법 - Google Patents

전자 장치 및 그 동작 방법 Download PDF

Info

Publication number
KR102530045B1
KR102530045B1 KR1020170135870A KR20170135870A KR102530045B1 KR 102530045 B1 KR102530045 B1 KR 102530045B1 KR 1020170135870 A KR1020170135870 A KR 1020170135870A KR 20170135870 A KR20170135870 A KR 20170135870A KR 102530045 B1 KR102530045 B1 KR 102530045B1
Authority
KR
South Korea
Prior art keywords
user
information
electronic device
extracted
face
Prior art date
Application number
KR1020170135870A
Other languages
English (en)
Other versions
KR20180074565A (ko
Inventor
한흥우
강성민
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to PCT/KR2017/015279 priority Critical patent/WO2018117704A1/en
Priority to CN201780079799.XA priority patent/CN110100253A/zh
Priority to EP17884746.3A priority patent/EP3539056A4/en
Priority to US15/850,393 priority patent/US10528799B2/en
Publication of KR20180074565A publication Critical patent/KR20180074565A/ko
Priority to US16/732,816 priority patent/US11042728B2/en
Priority to KR1020230057360A priority patent/KR102659288B1/ko
Application granted granted Critical
Publication of KR102530045B1 publication Critical patent/KR102530045B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/002Specific input/output arrangements not covered by G06F3/01 - G06F3/16
    • G06F3/005Input arrangements through a video camera
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Abstract

사용자를 촬영하여, 사용자 이미지를 획득하는 카메라, 하나 이상의 인스트럭션들을 저장하는 메모리 및 메모리에 저장된 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고, 프로세서는 하나 이상의 인스트럭션들을 실행함으로써, 복수의 사용자들의 얼굴 정보에 기초하여 학습된, 제1 인식 모델을 이용하여 사용자 이미지의 얼굴 영역으로부터 사용자를 인식하고, 사용자 이미지로부터, 인식된 사용자에 대한 추가 특징 정보를 추출하고, 추출된 추가 특징 정보에 기초하여 제1 인식 모델을 추가로 학습시키며, 추가로 학습된 제2 인식 모델을 이용하여 사용자 이미지의 인물 영역으로부터 사용자를 인식하고, 제2 인식 모델의 인식 결과를 출력하는, 전자 장치가 개시된다.

Description

전자 장치 및 그 동작 방법{Image display device and operating method for the same}
다양한 실시예들은 전자 장치 및 그 동작방법에 관한 것으로서, 더욱 상세하게는 사용자 이미지에 기초하여, 사용자를 인식할 수 있는 전자 장치 및 그 동작방법에 관한 것이다.
또한, 본 개시는 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공 지능(Artificial Intelligence, AI) 시스템 및 그 응용에 관한 것이다.
얼굴 인식 기술은, 사용자 얼굴에서 눈, 코, 입 등 얼굴에 포함되는 각 기관의 길이나 거리 등 다양한 정보를 추출하고, 이를 분석하여 사용자를 인식하는 기술을 의미한다.
얼굴 인식 기술은 주민등록증, 여권, 신용카드 등을 대체하는 신원확인용으로도 쓰일 수 있고, 출퇴근 관리, 출입문 통과, 비밀번호 대체 등의 보안용으로도 쓰일 수 있다. 또한 범죄 용의자 검색, 우범지대 감시 등의 치안용으로도 활용 가능하다.
얼굴 인식 기술을 이용한 사용자 인식은, 사용자 이미지의 얼굴 영역으로부터 추출되는 특징에 기초하여 사용자를 인식하기 때문에, 사용자 이미지에 얼굴 정면이 포함되지 않거나, 사용자가 멀리서 촬영되어 사용자 얼굴이 작게 나타나는 경우, 얼굴을 인식하지 못하는 문제점이 있다.
또한, 근래에는 인간 수준의 지능을 구현하는 인공 지능 시스템이 얼굴 인식 분야에서 이용되고 있다. 인공 지능 시스템은 기존의 룰(rule) 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공 지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 룰 기반 스마트 시스템은 점차 딥러닝 기반 인공 지능 시스템으로 대체되고 있다.
인공 지능 기술은 기계학습(예로, 딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다.
기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.
인공 지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.
다양한 실시예들은, 사용자의 얼굴 정보 이외에 사용자의 외형 정보나 행동 정보 등을 이용하여, 사용자를 인식할 수 있는 전자 장치 및 그 동작방법을 제공할 수 있다.
일 실시예에 따른 전자 장치는, 사용자를 촬영하여, 사용자 이미지를 획득하는 카메라, 하나 이상의 인스트럭션들을 저장하는 메모리, 및 상기 메모리에 저장된 상기 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고, 상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써, 복수의 사용자들의 얼굴 정보에 기초하여 학습된, 제1 인식 모델을 이용하여 상기 사용자 이미지의 얼굴 영역으로부터 상기 사용자를 인식하고, 상기 사용자 이미지로부터, 상기 인식된 사용자에 대한 추가 특징 정보를 추출하고, 추출된 추가 특징 정보에 기초하여 상기 제1 인식 모델을 추가로 학습시키며, 추가로 학습된 제2 인식 모델을 이용하여 상기 사용자 이미지의 인물 영역으로부터 상기 사용자를 인식하고, 상기 제2 인식 모델의 인식 결과를 출력할 수 있다.
일 실시예에 따른 전자 장치의 동작 방법은, 사용자를 촬영하여, 사용자 이미지를 획득하는 단계, 복수의 사용자들의 얼굴 정보에 기초하여 학습된, 제1 인식 모델을 이용하여 상기 사용자 이미지의 얼굴 영역으로부터 상기 사용자를 인식하는 단계, 상기 사용자 이미지로부터, 상기 인식된 사용자에 대한 추가 특징 정보를 추출하는 단계, 추출된 상기 사용자의 추가 특징 정보에 기초하여 상기 제1 인식 모델을 추가로 학습시키는 단계, 추가로 학습된 제2 인식 모델을 이용하여 상기 사용자 이미지의 인물 영역으로부터 상기 사용자를 인식하는 단계, 및 상기 제2 인식 모델 중 적어도 하나의 인식 결과를 출력하는 단계를 포함할 수 있다.
일 실시예에 따른 전자 장치는, 얼굴 영역이 탐지되지 않는 사용자 이미지를 획득한 경우에도, 사용자 이미지에서 사용자의 외형 정보나 행동 정보를 추출하여, 사용자를 인식할 수 있다. 이에 따라, 사용자 이미지를 획득하는 카메라를 설치하는 위치, 또는 방향의 제약이 사라진다.
일 실시예에 따른 전자 장치는, 자동으로 업데이트 여부를 판단하고, 수집된 사용자의 외형 정보나 행동 정보를 이용하여, 사용자 인식 모델을 업데이트함으로써, 사용자의 이용 편의성이 향상될 수 있다.
도 1은 일 실시예에 따른, 전자 장치에서 사용자를 인식하는 방법을 나타내는 도면이다.
도 2는 일 실시예에 따른 전자 장치의 동작방법을 나타내는 흐름도이다.
도 3은 일 실시예에 따른 얼굴 정보를 이용하여, 사용자를 인식하는 방법을 설명하기 위해 참조되는 도면이다.
도 4는 일 실시예에 따른 추가 특징 정보를 추출하는 방법을 설명하기 위해 참조되는 도면이다.
도 5는 일 실시예에 따른 제1 인식 모델의 인식 결과와 제2 인식 모델의 인식 결과를 나타내는 도면이다.
도 6은 일 실시시예 따른 전자 장치가 제2 인식 모델을 업데이트 하는 방법을 나타내는 흐름도이다.
도 7은 일 실시시예 따른 전자 장치가 제2 인식 모델을 업데이트 하는 방법을 나타내는 흐름도이다.
도 8은 일 실시예에 따른 전자 장치가 인식 모델의 업데이트 여부를 판단하는 방법을 설명하기 위해 참조되는 도면이다.
도 9는 일 실시예에 따른 전자 장치가 인식 모델의 업데이트 여부를 판단하는 방법을 설명하기 위해 참조되는 도면이다.
도 10은 일 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 11은 일부 실시예에 따른 프로세서(120)의 블록도이다.
도 12는 일부 실시예에 따른 데이터 학습부(1300)의 블록도이다.
도 13은 일부 실시예에 따른 데이터 인식부(1400)의 블록도이다.
도 14는 일 실시예에 따른 전자 장치 및 서버가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.
도 15는 다른 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예들에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 일 실시예에 따른, 전자 장치에서 사용자를 인식하는 방법을 나타내는 도면이다.
일 실시예에 따른 전자 장치(100)는, 다양한 형태로 구현될 수 있다. 예를 들어, 전자 장치는 CCTV(closed circuit television), 비디오 폰(video phone), 카메라, 스마트 도어락, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 데스크 탑, 태블릿 PC, 전자책 단말기, 디지털 방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 캠코더, IPTV(Internet Protocol Television), DTV(Digital Television), 착용형 기기(wearable device, 예를 들어, 스마트 글래스(smart glass) 등) 등과 같은 다양한 전자 장치로 구현될 수 있다. 다만, 이에 한정되는 것은 아니다. 또한, 도 1에서는 전자 장치(100)가 사용자를 촬영하여, 사용자 이미지(20)를 획득하는 것으로 도시하였지만, 이에 한정되는 것은 아니며, 일 실시예에 따른 전자 장치(100)는 외부의 카메라 장치에서 촬영된 사용자 이미지를 수신할 수 있다.
본 명세서의 실시예에서 “사용자”라는 용어는 전자 장치의 기능 또는 동작을 제어하는 사람을 의미하며, 관리자 또는 설치 기사를 포함할 수 있다. 또는, 전자 장치에 의해 인식되는 사람을 의미할 수 있다.
일 실시예에 따른 전자 장치(100)는 복수의 사용자에 대한 얼굴 정보를 등록할 수 있다. 예를 들어, 전자 장치(100)는 등록하고자 하는 복수의 사용자들에 대한 사용자 이미지들(10)을 획득할 수 있다. 이때, 사용자 이미지들(10)은 전자 장치를 이용하여 촬영된 이미지, 전자 장치에 저장되어 있는 이미지, 또는 외부 장치로부터 수신한 이미지를 포함할 수 있다. 또한, 사용자 이미지들(10)은 얼굴 영역의 탐지가 가능한 이미지들일 수 있으며, 예를 들어, 사용자들(사용자 A, 사용자 B, 사용자 C)의 얼굴 정면을 포함하는 이미지들일 수 있다.
전자 장치(100)는 제1 인식 모델(30)을 이용하여 사용자 이미지들(10)에서 얼굴 정보를 추출하고, 추출된 얼굴 정보를 이용하여, 제1 인식 모델(30)을 학습시킬 수 있다. 일 실시예에 따른 제1 인식 모델(30)은 얼굴 정보에 기초하여, 사용자를 인식하는 모델일 수 있다. 또한, 제1 인식 모델은 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예를 들어, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 제1 인식 모델(30)로 사용될 수 있으나, 이에 한정되지 않는다.
전자 장치(100)는 인식하고자 하는 사용자를 촬영하여, 사용자 이미지(20)를 획득할 수 있다. 다만, 이에 한정되지 않는다. 전자 장치(100)는 제1 인식 모델(30)을 이용하여, 사용자 이미지(20)에서 얼굴 영역(21)을 검출하고, 검출된 얼굴 영역으로부터 사용자의 얼굴 정보를 추출하며, 추출된 얼굴 정보에 기초하여, 사용자가 등록된 사용자들 중 누구인지를 인식할 수 있다.
또한, 전자 장치(100)는 사용자 이미지(20)에서 인물 영역(22)을 검출할 수 있다. 전자 장치(100)는 인물 영역(22)으로부터 사용자의 외형 정보 또는 행동 정보 등의 추가 특징 정보(40)를 추출할 수 있다. 예를 들어, 전자 장치(100)는 특징 추출 모델을 이용하여, 사용자의 외형 정보 또는 행동 정보 등의 추가 특징 정보(40)를 추출할 수 있으나, 이에 한정되지 않는다.
전자 장치(100)는 얼굴 정보에 기초하여, 사용자 이미지(20)에서 “사용자 A”가 인식되면, 추출된 추가 특징 정보(40)를 “사용자 A”와 매칭시켜, 제1 인식 모델(30)을 추가로 학습시킨 제2 인식 모델(50)을 생성할 수 있다. 일 실시예에 따른 제2 인식 모델(50)은 얼굴 정보 이외에도 추가 특징 정보(40)에 기초하여, 사용자를 인식하는 모델일 수 있다. 또한, 제2 인식 모델(50)은 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예를 들어, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 제2 인식 모델(50)로 사용될 수 있으나, 이에 한정되지 않는다.
예를 들어, 전자 장치(100)는 제2 인식 모델을 이용하는 경우, 얼굴 영역이 탐지되지 않는 사용자 이미지(60)를 획득한 경우에도, 사용자 이미지(60)에서 추가 특징 정보를 추출하고, 추출된 추가 특징 정보에 기초하여,“사용자 A”를 인식할 수 있다.
일 실시예에 따른 전자 장치(100)는 제2 인식 모델을 통한 사용자 인식 결과에 기초하여, 기존 제2 인식 모델의 업데이트 필요 여부를 판단할 수 있다. 업데이트가 필요하다가 판단된 경우에는 제2 인식 모델은 사용자 데이터를 이용하여 추가로 학습될 수 있다. 이때, 사용자 데이터는 사용자 이미지와 사용자 이미지에 매핑되는 사용자 정보, 또는 사용자 이미지에서 추출된 추가 특징 정보와 추가 특징 정보에 매핑되는 사용자 정보를 포함할 수 있다. 다만, 이에 한정되지 않는다.
도 2는 일 실시예에 따른 전자 장치의 동작방법을 나타내는 흐름도이다.
도 2를 참조하면, 일 실시예에 따른 전자 장치(100)는 인식하고자 하는 사용자 이미지를 획득할 수 있다(S210).
예를 들어, 사용자 이미지는, 전자 장치(100)에서 촬영된 이미지, 전자 장치(100)에 저장되어 있는 이미지, 또는 외부 장치로부터 수신한 이미지를 포함할 수 있다. 다만, 이에 한정되지 않는다.
일 실시예에 따른 전자 장치(100)는 제1 인식 모델을 이용하여, 사용자 이미지의 얼굴 영역으로부터 사용자를 인식할 수 있다(S220).
제1 인식 모델은, 등록된 복수의 사용자들에 대한 얼굴 정보를 이용하여 학습된 모델일 수 있으며, 제1 인식 모델은 얼굴 정보에 기초하여, 사용자를 인식하는 모델일 수 있다. 예를 들어, 전자 장치(100)는 사용자 이미지에서 얼굴 영역을 검출하고, 검출된 얼굴 영역으로부터 사용자의 얼굴 정보를 추출하며, 추출된 얼굴 정보에 기초하여, 사용자가 등록된 사용자들 중 누구인지를 인식할 수 있다. 얼굴 정보에 기초하여, 사용자를 인식하는 방법에 대해서는 도 3을 참조하여, 자세히 후술하기로 한다.
일 실시예에 따른 전자 장치(100)는 인식된 사용자에 대한 추가 특징 정보를 추출할 수 있다(S230).
예를 들어, 전자 장치(100)는 단계 210(S210)에서 획득한 사용자 이미지로부터 추가 특징 정보를 추출할 수 있다. 전자 장치(100)는 사용자 이미지에서 인물 영역을 검출하고, 검출된 인물 영역으로부터 사용자의 외형 정보나 행동 정보 등을 포함하는 추가 특징 정보를 추출할 수 있다. 추가 특징 정보를 추출하는 방법에 대해서는 도 4를 참조하여, 자세히 후술하기로 한다.
또는, 전자 장치(100)는 단계 220(S220)에서 인식된 사용자에 대한 사용자 이미지들을 실시간으로 획득하고, 실시간으로 획득되는 이미지들에서 추가 특징 정보를 추출할 수 있다.
일 실시예에 따른 전자 장치(100)는 추가 특징 정보에 기초하여, 제1 인식 모델을 추가로 학습시킬 수 있다(S240).
예를 들어, 전자 장치(100)는 “사용자 A”에 대하여 추출된 추가 특징 정보를 “사용자 A”와 매칭시켜, 제1 인식 모델을 추가로 학습시켜, 제2 인식 모델을 생성할 수 있다. 제2 인식 모델은 사용자의 얼굴 정보 이외에도 추가 특징 정보에 기초하여, 사용자를 인식하는 모델일 수 있다.
일 실시예에 따른 전자 장치는 추가로 학습된 제2 인식 모델을 이용하여, 사용자 이미지의 인물 영역으로부터 사용자를 인식할 수 있다(S250).
예를 들어, 전자 장치(100)는 얼굴 영역이 탐지되지 않는 사용자 이미지를 획득한 경우에도, 사용자 이미지의 인물 영역으로부터 추가 특징 정보를 추출하고, 추출된 추가 특징 정보에 기초하여, 사용자를 인식할 수 있다.
일 실시예에 따른 전자 장치는 인식 결과를 출력할 수 있다(S260).
예를 들어, 전자 장치(100)는 사용자를 인식한 결과, 인식된 사용자를 표시하거나, 인식된 사용자가 정당한 사용자가 아닌 경우, 알람을 발생시키거나, 경고 메시지를 출력할 수 있다. 다만, 이에 한정되지 않는다.
도 3은 일 실시예에 따른 얼굴 정보를 이용하여, 사용자를 인식하는 방법을 설명하기 위해 참조되는 도면이다.
일 실시예에 따른 전자 장치(100)는 얼굴 정보를 이용하여, 사용자를 인식할 수 있다. 예를 들어, 전자 장치(100)는 복수의 사용자에 대한 얼굴 정보를 등록할 수 있다. 전자 장치(100)는 제1 인식 모델 또는 제2 인식 모델을 이용하여, 복수의 사용자들에 대한 이미지들(A1, A2, A3, A4, A5) 각각에서 얼굴 정보를 추출할 수 있다. 예를 들어, 사용자 A의 이미지(A1)에서 추출된 얼굴 정보는 A2로, 사용자 B의 이미지(B1)에서 추출된 얼굴 정보는 B2로, 사용자 C의 이미지(C1)에서 추출된 얼굴 정보는 C2로, 사용자 D의 이미지(D1)에서 추출된 얼굴 정보는 D2로, 사용자 E의 이미지(E1)에서 추출된 얼굴 정보는 E2로 표현될 수 있다. 이때, 얼굴 정보 A2, B2, C2, D2, E2는 특징 행렬, 특징 벡터, 숫자 등으로 표현될 수 있으나, 이에 한정되지 않는다.
전자 장치(100)는 추출된 얼굴 정보를 각 사용자에 매칭시켜, 데이터 베이스(350)에 저장할 수 있다.
전자 장치(100)는 인식하고자 하는 사용자 이미지(310)를 획득할 수 있다. 전자 장치(100)는 사용자 이미지에서 얼굴 영역(320)을 검출할 수 있다. 얼굴 영역 검출은, 사용자 이미지(310)에서 사용자의 얼굴에 대한 위치 정보를 추출하는 것을 의미하며, 공지된 다양한 알고리즘(예를 들어, 예를 들어, viola-jones 알고리즘, 딥 러닝 기반 알고리즘 등)을 이용하여, 수행될 수 있다. 일 예로, 전자 장치(100)는 사용자 이미지(310)를 복수의 픽셀 블록 단위로 구분하고, 각 픽셀 블록 별로 대표 픽셀 값을 산출하며, 산출된 대표 픽셀 값과 각 픽셀 블록의 위치에 기초하여, 얼굴 영역(320)을 검출할 수 있다. 다만, 이에 한정되지 않는다.
전자 장치(100)는 얼굴 영역(320)이 검출되면, 얼굴 영역으로부터 얼굴 정보를 추출할 수 있다. 이때, 얼굴 정보 추출은, 공지된 다양한 알고리즘(예를 들어, template matching 기법, 딥 러닝 기반 알고리즘 등)을 이용하여, 수행될 수 있다. 일 예로, 전자 장치(100)는 얼굴 영역(320)으로부터 얼굴의 특징을 나타내는 특징 파라미터들을 추출하여, 특징 파라미터들에 기초하여 얼굴 정보를 결정할 수 있다. 예를 들어, 전자 장치(100)는 얼굴 형태나 크기, 얼굴 길이, 얼굴 너비, 미간 거리, 콧등 길이, 입술 꼬리 각도, 입술 길이, 눈 크기, 눈 위치, 눈 꼬리 각도, 코 크기, 귀 위치, 눈썹 굵기, 눈썹 위치, 눈썹 길이 등 다양한 특징 파라미터들을 추출할 수 있다. 다만, 이에 한정되지 않는다.
도 3에 도시된 바와 같이, 전자 장치(100)는 사용자 이미지(310)의 얼굴 영역(320)으로부터 얼굴 정보(330)를 추출할 수 있다.
전자 장치(100)는 사용자 이미지(310)로부터 추출된 얼굴 정보(330)를 데이터 베이스에 등록된 얼굴 정보와 비교하여, 얼굴 정보(330)에 대응하는 사용자를 결정할 수 있다. 예를 들어, 전자 장치(100)는 얼굴 정보(330)와 데이터 베이스에 등록된 얼굴 정보(C2)와 동일 유사 범위로 판단되는 경우, 사용자 이미지(310)에 대응하는 사용자를 “사용자 C”로 인식할 수 있다.
도 4는 일 실시예에 따른 추가 특징 정보를 추출하는 방법을 설명하기 위해 참조되는 도면이다.
일 실시예에 따른 전자 장치(100)는 사용자 이미지에서 인물 영역을 검출하고, 인물 영역으로부터 추가 특징 정보를 추출할 수 있다. 또한, 일 실시예에 따른 추가 특징 정보는 사용자의 외형 정보 및 행동 정보 등을 포함할 수 있다. 사용자의 외형 정보는, 사용자의 체형, 헤어 스타일, 헤어 색상, 안경 착용 여부, 의복 스타일, 사용자의 옆 모습이나 앞 모습 등을 포함할 수 있다. 또한, 사용자의 행동 정보는, 사용자의 걸음 걸이, 행동 습관 등을 포함할 수 있다. 다만, 이에 한정되지 않는다.
도 4를 참조하면, 일 실시예에 따른 전자 장치(100)는 제1 사용자 이미지(410)에서 인물 영역(401)을 검출할 수 있다. 예를 들어, 전자 장치(100)는 얼굴 영역(402)을 검출하고, 검출된 얼굴 영역(402)을 기초로 인물 영역(401)의 경계선을 검출할 수 있으며, 검출된 경계선에 따라, 인물 영역(401)을 검출할 수 있다. 또는, 얼굴 영역(402) 이외의 신체 일부 영역을 검출하고, 검출된 신체 일부 영역을 기초로 인물 영역(401)을 검출할 수도 있다. 다만, 이에 한정되지 않으며, 공지된 다양한 알고리즘(예를 들어, 휴먼 검출(human detection) 기법 등)을 이용하여, 인물 영역을 검출할 수 있다.
또한, 전자 장치(100)는 인물 영역(401)이 검출되면, 인물 영역(401)을 신체 부위별 영역으로 구분할 수 있다. 예를 들어, 전자 장치(100)는 사용자의 전체 영역을 사용자의 머리 영역, 팔 영역, 다리 영역, 얼굴 영역, 몸통 영역 등의 부분 영역으로 구분할 수 있다. 전자 장치(100)는 신체 부위별 영역으로부터 추가 특징 정보를 추출할 수 있다.
예를 들어, 사용자의 머리 영역으로부터 헤어 스타일(411, 예를 들어, 머리 길이, 웨이브 여부, 앞 머리 여부 등), 헤어 색상, 헤어 악세서리 등에 대한 정보를 추출할 수 있다. 또는, 사용자의 얼굴 영역으로부터 안경 착용 여부, 수염 모양, 수염 위치 등에 대한 정보를 추출할 수 있다. 또는, 사용자의 팔이나 몸통 영역으로부터 의복 스타일(412), 체형 정보 등을 추출할 수 있다.
또한, 전자 장치(100)는 사용자의 옆 모습을 포함하는 제2 사용자 이미지(420)나 사용자의 뒷 모습을 포함하는 제3 사용자 이미지(430)에서 인물 영역(403, 404)을 검출하고, 검출된 인물 영역(403, 404)으로부터 사용자의 옆 모습 정보 또는 뒷 모습 정보를 추출할 수 있다.
또한, 전자 장치(100)는 사용자의 전신을 포함하는 제4 사용자 이미지(440) 또는 제5 사용자 이미지(450)에서 인물 영역(405, 406)을 검출하고, 검출된 인물 영역(405, 406)으로부터, 사용자의 체형, 신체 비율 등에 대한 정보를 추출할 수 있다. 또한, 실시간으로 획득되는 사용자의 전신에 대한 이미지들(440, 450)에 기초하여, 사용자의 걸음 걸이, 행동 습관 등에 대한 정보를 추출할 수 있다.
일 실시예에 따른 전자 장치(100)는 사용자 이미지로부터 추출된 추가 특징 정보에 기초하여, 제1 인식 모델 또는 제2 인식 모델을 추가로 학습시켜 업데이트시킬 수 있다.
또한, 전자 장치(100)는 사용자 이미지에서 추출된 추가 특징 정보를 사용자와 매칭시켜 데이터 베이스에 저장할 수 있다. 또한, 사용자 이미지가 획득되면, 획득한 사용자 이미지에서 추출된 추가 특징 정보와 데이터 베이스에 저장된 추가 특징 정보를 비교하여, 획득한 사용자 이미지에서 추출된 추가 특징 정보에 대응하는 사용자를 결정할 수 있다.
도 5는 일 실시예에 따른 제1 인식 모델의 인식 결과와 제2 인식 모델의 인식 결과를 나타내는 도면이다.
일 실시예에 따른 제1 인식 모델(30)은 사용자 이미지의 얼굴 영역으로부터 얼굴 정보를 추출하고, 추출된 얼굴 정보에 기초하여, 사용자를 인식하는 모델일 수 있다. 일 실시예에 따른 제2 인식 모델(50)은 사용자 이미지의 인물 영역으로부터 얼굴 정보 및 추가 특징 정보 중 적어도 하나를 추출하고, 추출된 얼굴 정보 및 추가 특징 정보에 기초하여, 사용자를 인식하는 모델일 수 있다. 예를 들어, 제2 인식 모델(50)은 사용자의 얼굴 정보 없이, 사용자의 추가 특징 정보만을 이용하여, 사용자를 인식하는 모델일 수 있다.
제1 인식 모델(30)은 사용자의 얼굴 정보에 기초하여, 추가로 학습되고, 업데이트될 수 있다. 제1 인식 모델(30)이 사용자의 얼굴 정보에 기초하여, 추가로 학습되는 경우, 얼굴 정보에 기초하여, 사용자를 인식하는 정확도가 증가될 수 있다.
또한, 제2 인식 모델(50)은 추가 특징 정보에 기초하여, 제1 인식 모델(30)을 추가로 학습시켜, 확장된 모델일 수 있다. 예를 들어, 제2 인식 모델(50)은 제1 인식 모델(30)을 사용자의 추가 특징 정보에 기초하여, 추가로 학습시킨 모델일 수 있으나, 이에 한정되지 않는다. 또한, 제2 인식 모델(50)은 추가로 수집된 사용자의 추가 특징 정보에 기초하여 학습되고, 업데이트될 수 있다.
도 5를 참조하면, 일 실시예에 따른 전자 장치(100)는 사용자 이미지(510)를 획득할 수 있다. 사용자 이미지(510)는 사용자 A(521), 사용자 B(522), 사용자 C(523)를 포함하는 이미지일 수 있다. 사용자 이미지(510)에서 사용자 A(521)의 얼굴은 정면으로 뚜렷하게 나타나며, 사용자 B(522)는 얼굴은 나타나지 않고 뒷 모습만 나타난다. 또한, 사용자 C(523)는 멀리 있어 얼굴이 희미하게 나타난다.
사용자 이미지(510)가 제1 인식 모델(30)에 입력되는 경우, 제1 인식 모델(30)은 얼굴 정보를 기초로 하여 사용자를 인식하므로, 얼굴 영역의 검출이 가능한 사용자 A(521)만 인식되게 되고, 사용자 B(522)와 사용자 C(523)는 얼굴 영역의 검출이 불가능하여, 인식될 수 없다.
반면에, 사용자 이미지(510)가 제2 인식 모델(50)에 입력되는 경우, 사용자 A(521), 사용자 B(522) 및 사용자 C(523)가 모두 인식될 수 있다.
예를 들어, 전자 장치(100)는 사용자 A(521)의 얼굴 영역으로부터 추출된 얼굴 정보 및 사용자 A(521)의 인물 영역으로부터 추출된 헤어 스타일 정보, 의복 스타일 정보 등에 기초하여, 사용자 A(521)를 인식할 수 있다. 또한, 전자 장치(100)는 사용자 B(522)의 인물 영역으로부터 추출된 뒷 모습 정보, 의복 스타일 정보 등에 기초하여, 사용자 B(522)를 인식할 수 있다. 또한, 전자 장치(100)는 사용자 C(523)의 인물 영역으로부터 추출된 체형 정보, 걸음 걸이 정보 등에 기초하여, 사용자 C(523)를 인식할 수 있다.
따라서, 일 실시예에 따른 전자 장치(100)는 사용자 이미지에서 사용자의 얼굴 영역이 탐지되지 않는 경우(예를 들어, 사용자의 옆 모습이나 뒷 모습 이미지인 경우, 사용자가 멀리 있는 이미지인 경우 등)에도 사용자의 추가 특징 정보를 추출하여, 사용자를 인식할 수 있다.
도 6은 일 실시시예 따른 전자 장치가 제2 인식 모델을 업데이트 하는 방법을 나타내는 흐름도이다.
도 6을 참조하면, 전자 장치(100)는 사용자 이미지를 획득할 수 있다(S610).
또한, 전자 장치(100)는 획득된 사용자 이미지의 인물 영역으로부터 추가 특징 정보를 추출할 수 있다(S620). 전자 장치가 사용자의 추가 특징 정보를 추출하는 방법은, 도 4에서 설명하였으므로, 구체적인 설명은 생략하기로 한다.
전자 장치(100)는 추가 특징 정보에 기초하여, 사용자를 인식할 수 있다(S630). 예를 들어, 전자 장치(100)는 추출된 추가 특징 정보와 데이터 베이스에 저장된 복수의 사용자들 각각에 매칭되는 추가 특징 정보를 비교하여, 추출된 추가 특징 정보에 대응하는 사용자를 결정할 수 있다. 다만, 이에 한정되지 않는다.
전자 장치(100)는 인식 결과에 기초하여, 인식 모델을 평가할 수 있다(S640). 예를 들어, 전자 장치(100)는 단계 630(S630)에서, 추가 특징 정보에 기초하여 인식한 사용자를, 얼굴 특징 정보에 기초하여 인식한 사용자와 비교하여, 사용자가 다른 경우, 인식 오류로 판단할 수 있다.
또는, 전자 장치(100)는 추가 특징 정보에 기초하여 인식한 사용자와 얼굴 특징 정보에 기초하여 인식한 사용자가 동일하나, 추가 특징 정보에 기초하여 인식한 결과, 인식한 사용자일 확률이 기 설정된 값보다 낮게 나온 경우, 인식 오류로 판단할 수 있다.
예를 들어, 전자 장치(100)는 추가 특징 정보에 기초하여 사용자를 인식한 결과, 사용자 A일 확률이 62%, 사용자 B일 확률이 37%로 판단되어, 최종적으로 “사용자 A”로 인식하고, 얼굴 특징 정보에 기초하여 인식한 결과, 사용자 A일 확률이 95% 것으로 판단되어, 최종적으로 “사용자 A”로 인식할 수 있다. 이때, 인식 결과는 동일하나, 추가 특징 정보에 기초하여 인식한 결과, “사용자 A”일 확률이 기 설정된 값 80%보다 낮게 나왔으므로, 전자 장치(100)는 인식 오류로 판단할 수 있다.
다만, 제2 인식 모델을 평가하는 방법은 이에 한정되지 않으며, 다양한 방법으로 평가될 수 있다.
일 실시예에 따른 전자 장치(100)는 제2 인식 모델의 평가 결과에 기초하여, 제2 인식 모델의 업데이트 필요 여부를 판단할 수 있다(S650).
예를 들어, 전자 장치(100)는 제2 인식 모델을 이용하여, 사용자를 인식할 때마다, 인식 오류 횟수를 카운트하여, 인식 오류 횟수가 기 설정된 횟수 이상인 경우, 제2 인식 모델의 업데이트가 필요하다고 판단할 수 있다. 또는, 전자 장치(100)는 인식 오류율을 계산하여, 인식 오류율이 기 설정된 값 이상인 경우, 제2 인식 모델의 업데이트가 필요하다고 판단할 수 있다. 다만, 이에 한정되지 않는다.
전자 장치(100)는 제2 인식 모델의 업데이트가 필요하다고 경우, 수집한 추가 특징 정보를 이용하여, 제2 인식 모델을 추가로 학습시켜 업데이트 시킬 수 있다(S660).
전자 장치(100)는 실시간으로 제2 인식 모델을 업데이트 시킬 수 있다. 또는, 전자 장치(100)는 수집된 추가 특징 정보를 저장하고, 저장된 추가 특징 정보를 이용하여, 주기적으로 인식 모델을 업데이트 시키거나, 전자 장치(100)가 유휴상태인 경우(예를 들어, 전자 장치가 충전 상태에 있는 경우), 사용자 요청이 입력되는 경우, 기 설정된 시간인 경우에, 제2 인식 모델을 학습시킬 수 있다. 다만, 이에 한정되지 않는다.
또한, 전자 장치(100)는 제2 인식 모델을 전체적으로 학습시키거나, 제2 인식 모델의 일부만 학습시킬 수 있다. 다만, 이에 한정되지 않는다.
도 7은 일 실시시예 따른 전자 장치가 제2 인식 모델을 업데이트 하는 방법을 나타내는 흐름도이다.
도 7을 참조하면, 일 실시예에 따른 전자 장치(100)는 실시간으로 동일한 사용자에 대한 사용자 이미지를 획득할 수 있다.
일 실시예에 따른 전자 장치(100)는 실시간으로 획득되는 이미지에서 얼굴 영역의 탐지가 가능한지 여부를 판단하여(S720), 얼굴 영역의 탐지가 가능하지 않은 경우, 사용자 이미지에서 인물 영역을 검출하고, 인물 영역으로부터 사용자의 추가 특징 정보를 추출할 수 있다(S730).
전자 장치가 사용자의 추가 특징 정보를 추출하는 방법은, 도 4에서 설명하였으므로, 구체적인 설명은 생략하기로 한다.
일 실시예에 따른 전자 장치(100)는 추출된 추가 특징 정보에 기초하여, 사용자 이미지에서 제1 사용자를 인식할 수 있다(S740).
반면에, 전자 장치(100)는 얼굴 영역의 탐지가 가능한 경우, 얼굴 영역으로부터 얼굴 정보를 추출하고(S750), 얼굴 정보에 기초하여, 제2 사용자를 인식할 수 있다(S760). 전자 장치가 얼굴 정보에 기초하여, 사용자를 인식하는 방법은 도 3에서 설명하였으므로, 구체적인 설명은 생략하기로 한다.
일 실시예에 따른 전자 장치(100)는 인식된 제1 사용자와 제2 사용자가 동일한지 여부를 판단하여(S770), 제1 사용자와 제2 사용자가 동일하지 않은 경우, 제2 인식 모델의 업데이트가 필요한 것으로 판단할 수 있다.
일 실시예에 따른 전자 장치(100)는 추가 특징 정보를 이용하여, 제2 인식 모델을 업데이트할 수 있다(S780).
예를 들어, 전자 장치(100)는 단계 730(S730)에서 추출한 추가 특징 정보를 단계 760(S760)에서 인식된 제2 사용자와 매칭시켜, 제2 인식 모델을 학습시킴으로써, 제2 인식 모델을 업데이트할 수 있다. 다만, 이에 한정되지 않는다.
또한, 전자 장치(100)는 실시간으로 제2 인식 모델을 업데이트 시키거나, 추가 특징 정보를 저장한 후, 저장된 추가 특징 정보를 이용하여, 기 설정된 시간에 제2 인식 모델을 업데이트시킬 수 있다. 또한, 전자 장치(100)는 제2 인식 모델을 전체적으로 학습시키거나, 제2 인식 모델의 일부만 학습시킬 수 있다. 다만, 이에 한정되지 않는다.
도 8은 일 실시예에 따른 전자 장치가 인식 모델의 업데이트 여부를 판단하는 방법을 설명하기 위해 참조되는 도면이다.
도 8을 참조하면, 전자 장치(100)는 사용자 이미지(810)를 획득할 수 있다. 이때, 사용자 이미지(810)는 전자 장치에서 촬영된 이미지이거나, 외부 장치로부터 수신한 이미지일 수 있다. 또한, 사용자 이미지(810)는 얼굴 영역이 탐지 가능한 이미지일 수 있다.
전자 장치(100)는 사용자 이미지(810)에서 얼굴 영역(801)을 검출하고, 검출된 얼굴 영역으로부터 얼굴 정보를 추출할 수 있다. 이에 대해서는, 도 3에서 설명하였으므로 구체적인 설명은 생략하기로 한다.
전자 장치(100)는 얼굴 정보(820)에 기초하여, 도 8에 도시된 바와 같이, “사용자 A”를 인식할 수 있다.
또한, 전자 장치(100)는 사용자 이미지(810)에서 인물 영역(802)을 검출하고, 검출된 인물 영역으로부터 추가 특징 정보(830)를 추출할 수 있다. 이에 대해서는 도 4에서 설명하였으므로 구체적인 설명은 생략하기로 한다.
전자 장치(100)는 추출된 추가 특징 정보(830)에 기초하여, “사용자 B”를 인식할 수 있다.
도 8에 도시된 바와 같이, 사용자 이미지(810)에서 얼굴 정보(820)에 기초하여, 인식한 사용자는 “사용자 A”이고, 사용자 이미지(810)에서 추가 특징 정보(830)에 기초하여 인식한 사용자는 “사용자 B”일 때, 전자 장치(100)는 제2 인식 모델(50)의 인식 결과가 정확하지 않은 것으로 판단할 수 있다. 또한, 전자 장치(100)는 인식 모델의 업데이트가 필요한 것으로 판단하여, 추출된 추가 특징 정보(830)를 “사용자 A”와 매칭시켜 제2 인식 모델(50)을 추가로 학습시켜 업데이트할 수 있다. 다만, 이에 한정되지 않는다.
도 9는 일 실시예에 따른 전자 장치가 인식 모델의 업데이트 여부를 판단하는 방법을 설명하기 위해 참조되는 도면이다.
일 실시예에 따른 전자 장치(100)는 실시간으로 동일한 사용자에 대한 사용자 이미지들을 획득할 수 있다. 예를 들어, 전자 장치(100)는 도 9에 도시된 바와 같이, 동일한 사용자에 대한 제1 사용자 이미지(910) 및 제2 사용자 이미지(920)를 획득할 수 있다.
이때, 제1 사용자 이미지(910)는 얼굴 영역이 탐지되지 않는 이미지일 수 있다. 전자 장치(100)는 제1 사용자 이미지(910)에서 인물 영역(901)을 검출하고, 인물 영역(901)으로부터 사용자의 추가 특징 정보(915)를 추출할 수 있다. 예를 들어, 전자 장치(100)는 인물 영역(901)으로부터 사용자의 뒷모습 정보, 사용자의 헤어 스타일 정보, 헤어 색상 정보, 의복 스타일 정보, 의복 색상 정보, 사용자의 체형이나 신체 비율 정보 등을 추출할 수 있다.
또한, 전자 장치(100)는 추출된 추가 특징 정보에 기초하여, 제1 사용자 이미지(910)에서 “사용자 A”를 인식할 수 있다.
반면에, 제2 사용자 이미지(920)는 얼굴 영역이 탐지되는 이미지일 수 있다. 전자 장치(100)는 제2 사용자 이미지(920)에서 얼굴 영역(902)을 검출하고, 얼굴 영역(902)으로부터 사용자의 얼굴 정보(925)를 추출할 수 있다. 예를 들어, 전자 장치(100)는 얼굴 영역(902)으로부터 얼굴 형태나 크기, 얼굴 길이, 얼굴 너비, 미간 거리, 콧등 길이, 입술 꼬리 각도, 입술 길이, 눈 크기, 눈 위치, 눈 꼬리 각도, 코 크기, 귀 위치, 눈썹 굵기, 눈썹 위치, 눈썹 길이 등 다양한 특징 파라미터들을 추출하고, 추출된 특징 파라미터들에 기초하여, 얼굴 정보를 결정할 수 있다.
전자 장치(100)는 추출된 사용자의 얼굴 정보에 기초하여, 제2 사용자 이미지(920)에서 “사용자 B”를 인식할 수 있다. 다만 이에 한정되지 않으며, 전자 장치(100)는 제2 사용자 이미지에서 인물 영역(903)을 검출하고, 인물 영역(903)으로부터 사용자의 추가 특징 정보를 추출하여, 얼굴 정보(925) 및 추가 특징 정보에 기초하여, 사용자를 인식할 수도 있다.
일 실시예에 따른 전자 장치(100)는 도 9에 도시된 바와 같이, 제1 사용자 이미지(910)에서 인식된 “사용자 A”와 제2 사용자 이미지(920)에서 인식된 “사용자 B”가 일치하지 않는 경우, 제1 사용자 이미지(910)에서 추출된 추가 특징 정보(915)를 이용하여, 제2 인식 모델(50)을 추가로 학습시켜 업데이트시킬 수 있다. 이때, 전자 장치(100)는 추가 특징 정보(915)를 “사용자 B”에 매칭시켜 제2 인식 모델(50)을 추가로 학습시켜 업데이트할 수 있다. 다만, 이에 한정되지 않는다.
전자 장치(100)는 실시간으로 제2 인식 모델(50)을 업데이트 시킬 수 있다. 또는, 전자 장치(100)는 추가 특징 정보(915)를 저장하고, 저장된 추가 특징 정보를 이용하여, 주기적으로 인식 모델을 업데이트 시키거나, 전자 장치(100)가 유휴상태인 경우(예를 들어, 전자 장치가 충전 상태에 있는 경우), 사용자 요청이 입력되는 경우, 기 설정된 시간인 경우에, 제2 인식 모델(50)을 학습시킬 수 있다. 다만, 이에 한정되지 않는다.
또한, 전자 장치(100)는 제2 인식 모델(50)을 전체적으로 학습시키거나, 제2 인식 모델(50)의 일부만 학습시킬 수 있다. 다만, 이에 한정되지 않는다.
도 10은 일 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다.
도 10을 참조하면, 일 실시예에 따른 전자 장치(100)는 카메라(140), 프로세서(120), 및 메모리(130)를 포함할 수 있다.
일 실시예에 따른 카메라(140)는 이미지 센서를 통해 정지영상 또는 동영상 등의 화상 프레임을 얻을 수 있다. 이미지 센서를 통해 캡쳐된 이미지는 프로세서(120)를 통해 처리될 수 있다. 일 실시예에 따른 카메라(140)는 인식하고자 하는 사용자를 촬영하여, 사용자 이미지를 획득할 수 있다.
일 실시예에 따른 프로세서(120)는 메모리(130)에 저장되는 하나 이상의 프로그램들을 실행할 수 있다. 프로세서(120)는 싱글 코어, 듀얼 코어, 트리플 코어, 쿼드 코어 및 그 배수의 코어를 포함할 수 있다. 또한, 프로세서(120)는 복수의 프로세서를 포함할 수 있다. 예를 들어, 프로세서(120)는 메인 프로세서(main processor, 도시되지 아니함) 및 슬립 모드(sleep mode)에서 동작하는 서브 프로세서(sub processor, 도시되지 아니함)로 구현될 수 있다.
일 실시예에 따른 메모리(130)는 전자 장치(100)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다.
또한, 메모리(130)에 저장되는 프로그램은 하나 이상의 인스트럭션들을 포함할 수 있다. 메모리(130)에 저장된 프로그램(하나 이상의 인스트럭션들) 또는 어플리케이션은 프로세서(120)에 의해 실행될 수 있다.
일 실시예에 따른 프로세서(120)는 메모리(130)에 저장된 제1 인식 모델을 이용하여, 사용자 이미지의 얼굴 영역으로부터 얼굴 정보를 추출하고, 추출된 얼굴 정보와 전자 장치(100)에 등록된 복수의 사용자들에 대한 얼굴 정보를 비교하여, 사용자를 인식할 수 있다. 또한, 프로세서(120)는 메모리(130)에 저장된 하나 이상의 인스트럭션들을 실행함으로써, 사용자 이미지에서 인물 영역을 검출하고, 인물 영역으로부터 사용자의 외형 정보나 행동 정보 등의 추가 특징 정보를 추출할 수 있다. 프로세서(120)는 메모리(130)에 저장된 하나 이상의 인스트럭션들을 실행함으로써, 추출된 추가 특징 정보와 사용자를 매칭시켜, 제1 인식 모델을 추가로 학습시킬 수 있다. 프로세서(120)는 추가로 학습된 제2 인식 모델을 메모리(130)에 저장할 수 있다. 프로세서(120)는 메모리(130)에 저장된 하나 이상의 인스트럭션들을 실행함으로써, 추가로 학습된 제2 인식 모델을 이용하여, 사용자 이미지의 인물 영역으로부터 사용자를 인식할 수 있다.
또한, 프로세서(120)는 메모리(130)에 저장된 하나 이상의 인스트럭션들을 실행함으로써, 제2 인식 모델의 인식 결과를 평가하여, 제2 인식 모델의 업데이트 필요 여부를 판단하고, 제2 인식 모델의 업데이트가 필요하다고 판단되는 경우, 실시간으로 수집된 추가 특징 정보에 기초하여, 제2 인식 모델을 추가로 학습시켜, 업데이트시킬 수 있다.
도 11은 일부 실시예에 따른 프로세서(120)의 블록도이다.
도 11을 참조하면, 일부 실시예에 따른 프로세서(120)는 데이터 학습부(1300) 및 데이터 인식부(1400)를 포함할 수 있다.
데이터 학습부(1300)는 데이터 인식 모델이 사용자 이미지에서 사용자를 인식하기 위한 기준을 갖도록 생성 또는 학습시킬 수 있다. 데이터 학습부(1300)는 사용자 이미지에서 사용자를 인식하기 위하여 학습 데이터를 데이터 인식 모델에 적용하여 판단 기준을 갖는 데이터 인식 모델을 생성할 수 있다.
일 실시예에 따른 데이터 학습부(1300)는 이미지와 관련된 학습 데이터를 이용하여 데이터 인식 모델을 생성 또는 학습 시킬 수 있다.
일 실시예에 따른 데이터 인식 모델은, 제1 인식 모델 및 제2 인식 모델을 포함할 수 있다.
데이터 인식부(1400)는 인식 데이터에 기초하여 사용자를 인식할 수 있다. 데이터 인식부(1400)는 학습된 데이터 인식 모델을 이용하여, 소정의 사용자 이미지로부터 사용자를 인식할 수 있다. 데이터 인식부(1400)는 학습에 의한 기 설정된 기준에 따라 소정의 데이터(예를 들어, 사용자 이미지)를 획득하고, 획득된 데이터를 입력 값으로 하여 데이터 인식 모델을 이용함으로써, 사용자 이미지에 기초한 사용자를 인식할 수 있다. 예를 들어, 사용자 이미지의 얼굴 영역으로부터 검출된 사용자의 얼굴 정보에 기초하여, 사용자를 인식하거나, 사용자 이미지의 인물 영역으로부터 검출된 사용자의 외형 정보나 행동 정보 등의 추가 특징 정보에 기초하여, 사용자를 인식할 수 있다. 또한, 획득된 데이터를 입력 값으로 하여 데이터 인식 모델의 의해 출력된 결과 값은, 데이터 인식 모델을 갱신하는데 이용될 수 있다.
데이터 학습부(1300)의 적어도 일부 및 데이터 인식부(1400)의 적어도 일부는, 소프트웨어 모듈로 구현되거나 또는 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 학습부(1300) 및 데이터 인식부(1400) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.
인공 지능을 위한 전용 하드웨어 칩은 확률 연산에 특화된 전용 프로세서로서, 기존의 범용 프로세서보다 병렬처리 성능이 높아 기계 학습과 같은 인공 지능 분야의 연산 작업을 빠르게 처리할 수 있다. 데이터 학습부(1300) 및 데이터 인식부(1400)가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
데이터 학습부(1300) 및 데이터 인식부(1400)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 학습부(1300) 및 데이터 인식부(1400) 중 하나는 전자 장치에 포함되고, 나머지 하나는 서버에 포함될 수 있다. 또한, 데이터 학습부(1300) 및 데이터 인식부(1400)는 유선 또는 무선으로 통하여, 데이터 학습부(1300)가 구축한 모델 정보를 데이터 인식부(1400)로 제공할 수도 있고, 데이터 인식부(1400)로 입력된 데이터가 추가 학습 데이터로서 데이터 학습부(1300)로 제공될 수도 있다.
도 12는 일부 실시예에 따른 데이터 학습부(1300)의 블록도이다.
도 12를 참조하면, 일부 실시예에 따른 데이터 학습부(1300)는 데이터 획득부(1310) 및 모델 학습부(1340)를 포함할 수 있다. 또한 데이터 학습부(1300)는 전처리부(1320), 학습 데이터 선택부(1330) 및 모델 평가부(1350)중 적어도 하나를 선택적으로 더 포함할 수도 있다. 데이터 획득부(1310)는 사용자를 인식하기 위한 학습을 위하여 필요한 학습 데이터를 획득할 수 있다.
학습 데이터는 데이터 학습부(1300) 또는 전자 장치의 제조사에 의하여 수집 또는 테스트한 데이터가 이용될 수도 있다. 또는, 학습 데이터는 본 개시에 따른 카메라를 통해 입력된 사용자 이미지로부터 생성된 영상 데이터를 포함할 수 있다. 이 때 카메라는 전자 장치 내부에 구비될 수 있으나, 이는 일 실시예에 불과할 뿐, 외부의 카메라를 통해 획득한 영상 데이터가 학습 데이터로서 이용될 수도 있다.
데이터 획득부(1310)는 복수의 사용자 이미지를 획득할 수 있다. 일 예로 데이터 획득부(1310)는 데이터 학습부(1300)를 포함하는 전자 장치의 카메라를 통해 사용자 이미지를 입력 받을 수 있다. 또는 데이터 학습부(1300)를 포함하는 전자 장치와 통신 가능한 외부 장치를 통하여 사용자 이미지를 수신할 수 있다.
모델 학습부(1340)는 학습 데이터를 이용하여 데이터 인식 모델이 사용자 이미지에서 사용자를 어떻게 인식할 지에 관한 기준을 학습할 수 있다.
예로, 모델 학습부(1340)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 데이터 인식 모델을 학습시킬 수 있다. 또는, 모델 학습부(1340)는, 예를 들어, 별다른 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 사용자 이미지에서 얼굴 영역 또는 인물 영역을 검출하는 기준, 얼굴 영역으로부터 얼굴 정보를 추출하는 기준, 인물 영역으로부터 추가 특징 정보를 추출하는 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 데이터 인식 모델을 학습시킬 수 있다.
또한, 모델 학습부(1340)는 사용자를 인식하기 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 기준을 학습할 수도 있다.
특히, 본 개시의 일 실시예에 따른, 모델 학습부(1340)는 사용자 이미지에서 얼굴 영역 또는 인물 영역을 검출하는 기준, 얼굴 영역으로부터 얼굴 정보를 추출하는 기준, 인물 영역으로부터 추가 특징 정보를 추출하는 기준과 관련된 학습 데이터를 이용하여 데이터 인식 모델을 생성 또는 학습시킬 수 있다. 이 경우, 지도 학습 방식을 통하여, 데이터 인식 모델을 학습시키는 경우, 판단 기준으로서, 사용자 이미지에서 얼굴 영역 또는 인물 영역을 검출하는 기준, 얼굴 영역으로부터 얼굴 정보를 추출하는 기준, 인물 영역으로부터 추가 특징 정보를 추출하는 기준이 학습 데이터로서 추가될 수 있다.
예를 들어, 모델 학습부(1340)는 사용자 이미지에서 얼굴 영역 또는 인물 영역을 검출하는 기준, 얼굴 영역으로부터 얼굴 정보를 추출하는 기준, 인물 영역으로부터 추가 특징 정보를 추출하는 기준과 관련된 학습 데이터를 이용하여 데이터 인식 모델을 생성 또는 학습시킬 수 있다. 또한, 모델 학습부(1340)는 데이터 베이스에 저장된 복수의 사용자의 얼굴 정보와 사용자 이미지에서 추출된 사용자의 얼굴 정보에 기초하여, 사용자를 인식하도록 학습할 수 있다. 또는, 데이터 베이스에 저장된 복수의 사용자의 추가 특징 정보와 사용자 이미지에서 추출된 사용자의 추가 특징 정보에 기초하여, 사용자를 인식하도록 학습할 수 있다.
또한, 모델 학습부(1340)는 사용자 이미지에서 사용자를 인식하는 데이터 인식 모델을 학습 데이터를 이용하여 학습시킬 수 있다. 이 경우, 데이터 인식 모델은 미리 구축된 모델일 수 있다. 예를 들어, 데이터 인식 모델은 기본 학습 데이터(예를 들어, 샘플 이미지 등)를 입력 받아 미리 구축된 모델일 수 있다.
데이터 인식 모델은, 데이터 인식 모델의 적용 분야, 학습의 목적 또는 장치의 컴퓨터 성능 등을 고려하여 구축될 수 있다. 데이터 인식 모델은, 예를 들어, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예컨대, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 데이터 인식 모델로서 사용될 수 있으나, 이에 한정되지 않는다.
다양한 실시예에 따르면, 모델 학습부(1340)는 미리 구축된 데이터 인식 모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 데이터 인식 모델을 학습할 데이터 인식 모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입 별로 기 분류되어 있을 수 있으며, 데이터 인식 모델은 데이터의 타입 별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 오브젝트의 종류 등과 같은 다양한 기준으로 기 분류되어 있을 수 있다.
또한, 모델 학습부(1340)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 데이터 인식 모델을 학습시킬 수 있다.
또한, 모델 학습부(1340)는, 예를 들어, 학습 데이터를 입력 값으로 하는 지도 학습(supervised learning) 을 통하여, 데이터 분류 모델을 학습시킬 수 있다. 또한, 모델 학습부(1340)는, 예를 들어, 별다른 지도 없이 상황 판단을 위해 필요한 데이터의 종류를 스스로 학습함으로써, 상황 판단을 위한 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 데이터 분류 모델을 학습시킬 수 있다. 또한, 모델 학습부(1340)는, 예를 들어, 학습에 따른 이미지 분류의 결과가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 데이터 인식 모델을 학습시킬 수 있다.
또한, 데이터 인식 모델이 학습되면, 모델 학습부(1340)는 학습된 데이터 인식 모델을 저장할 수 있다. 이 경우, 모델 학습부(1340)는 학습된 데이터 인식 모델을 데이터 인식부(1400)를 포함하는 전자 장치의 메모리에 저장할 수 있다. 또는, 모델 학습부(1340)는 학습된 데이터 분류 모델을 후술할 데이터 인식부(1400)를 포함하는 전자 장치의 메모리에 저장할 수 있다. 또는, 모델 학습부(1340)는 학습된 데이터 분류 모델을 전자 장치와 유선 또는 무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.
이 경우, 학습된 데이터 분류 모델이 저장되는 메모리는, 예를 들면, 전자 장치의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 함께 저장할 수도 있다. 또한, 메모리는 소프트웨어 및/또는 프로그램을 저장할 수도 있다. 프로그램은, 예를 들면, 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API) 및/또는 어플리케이션 프로그램(또는 "어플리케이션") 등을 포함할 수 있다.
데이터 학습부(1300)는 데이터 인식 모델의 인식 결과를 향상시키거나, 데이터 인식 모델의 생성에 필요한 자원 또는 시간을 절약하기 위하여, 전처리부(1320) 및 학습 데이터 선택부(1330)를 더 포함할 수도 있다.
전처리부(1320)는 사용자를 인식하기 위한 학습에 이용하기 위하여 데이터 획득부(1310)에서 획득된 데이터를 전처리할 수 있다.
예로, 전처리부(1320)는 모델 학습부(1340)가 데이터 인식 모델의 학습을 위한 데이터의 이용이 용이하도록, 획득된 데이터를 기 정의된 포맷으로 가공할 수 있다. 전처리된 데이터는 학습 데이터로서 모델 학습부(1340)에게 제공될 수 있다.
또는, 학습 데이터 선택부(1330)가 전처리된 데이터 중에서 학습에 필요한 학습 데이터를 선별적으로 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(1340)에 제공될 수 있다. 학습 데이터 선택부(1330)는 기 설정된 선별 기준에 따라, 전처리된 데이터 중에서 학습에 필요한 학습 데이터를 선별할 수 있다. 또한, 학습 데이터 선택부(1330)는 모델 학습부(1340)에 의한 학습에 의해 기 설정된 선별 기준에 따라 학습에 필요한 학습 데이터를 선별할 수도 있다.
데이터 학습부(1300)는 데이터 인식 모델의 인식 결과를 향상시키기 위하여, 모델 평가부(1350)를 더 포함할 수도 있다.
모델 평가부(1350)는 데이터 인식 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 인식 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(1340)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 데이터 인식 모델을 평가하기 위한 기 설정된 데이터일 수 있다.
예를 들어, 모델 평가부(1350)는 평가 데이터에 대한 학습된 데이터 인식 모델의 분류 결과 중에서, 인식 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다. 예컨대, 소정 기준이 비율 2%로 정의되는 경우, 학습된 데이터 인식 모델이 총 1000개의 평가 데이터 중의 20개를 초과하는 평가 데이터에 대하여 잘못된 인식 결과를 출력하는 경우, 모델 평가부(1350)는 학습된 데이터 인식 모델이 적합하지 않은 것으로 평가할 수 있다.
한편, 학습된 데이터 인식 모델이 복수 개가 존재하는 경우, 모델 평가부(1350)는 각각의 학습된 데이터 인식 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 데이터 인식 모델로서 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(1350)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 데이터 인식 모델로서 결정할 수 있다.
한편, 데이터 학습부(1300) 내의 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.
또한, 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350) 중 일부는 전자 장치에 포함되고, 나머지 일부는 서버에 포함될 수 있다.
또한, 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(1310), 전처리부(1320), 학습 데이터 선택부(1330), 모델 학습부(1340) 및 모델 평가부(1350) 중 적어도 하나가 소프트웨어 모듈(또는, 인스터력션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
도 13은 일부 실시예에 따른 데이터 인식부(1400)의 블록도이다.
도 13을 참조하면, 일부 실시예에 따른 데이터 인식부(1400)는 데이터 획득부(1410) 및 인식 결과 제공부(1440)를 포함할 수 있다. 또한 데이터 인식부(1400)는 전처리부(1420), 인식 데이터 선택부(1430) 및 모델 갱신부(1450)중 적어도 하나를 선택적으로 더 포함할 수 있다.
데이터 획득부(1410)는 사용자 인식에 필요한 데이터를 획득할 수 있으며, 전처리부(1420)는 사용자 인식을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 전처리부(1420)는 후술할 인식 결과 제공부(1440)가 사용자 인식을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.
인식 결과 제공부(1440)는 선택된 데이터를 데이터 인식 모델에 적용하여 사용자를 인식할 수 있다. 인식 결과 제공부(1440)는 데이터의 인식 목적에 따른 인식 결과를 제공할 수 있다. 인식 결과 제공부(1440)는 인식 데이터 선택부(1430)에 의해 선택된 데이터를 입력 값으로 이용함으로써, 선택된 데이터를 데이터 인식 모델에 적용할 수 있다. 또한, 인식 결과는 데이터 인식 모델에 의해 결정될 수 있다.
예를 들어, 인식 결과 제공부(1440)는 인식된 사용자에 대한 정보를 표시하거나, 인식된 사용자가 정당한 사용자가 아닌 경우, 알람이나 경고 메시지를 출력할 수 있다. 또는, 인식된 사용자가 정당한 사용자인 경우, 소정의 서비스를 제공할 수 있다.
데이터 인식부(1400)는 데이터 인식 모델의 인식 결과를 향상시키거나, 인식 결과의 제공을 위한 자원 또는 시간을 절약하기 위하여, 전처리부(1420) 및 인식 데이터 선택부(1430)를 더 포함할 수도 있다.
전처리부(1420)는 사용자 이미지에서 사용자를 인식하기 위한 판단 기준을 학습하기 위하여 데이터 획득부(1410)에서 획득된 데이터를 전처리할 수 있다.
전처리부(1420)는 인식 결과 제공부(1440)가 사용자 인식을 위한 판단 기준 학습을 위한 데이터의 이용이 용이하도록, 획득된 데이터를 기 정의된 포맷으로 가공할 수 있다.
인식 데이터 선택부(1430)는 전처리된 데이터 중에서 사용자 인식에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(1440)에게 제공될 수 있다. 인식 데이터 선택부(1430)는 사용자 인식을 위한 기 설정된 기준에 따라, 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(1430)는 모델 학습부(1340)에 의한 학습에 의해 기 설정된 기준에 따라 데이터를 선택할 수도 있다.
모델 갱신부(1450)는 인식 결과 제공부(1440)에 의해 제공되는 인식 결과에 대한 평가에 기초하여, 데이터 인식 모델이 갱신되도록 할 수 있다. 예를 들어, 모델 갱신부(1450)는 인식 결과 제공부(1440)에 의해 제공되는 인식 결과를 모델 학습부(1340)에게 제공함으로써, 모델 학습부(1340)가 데이터 인식 모델을 갱신하도록 할 수 있다.
한편, 데이터 인식부(1400) 내의 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450) 중 적어도 하나는, 소프트웨어 모듈로 구현되거나 또는 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 각종 전자 장치에 탑재될 수도 있다.
또한, 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450) 중 일부는 전자 장치에 포함되고, 나머지 일부는 서버에 포함될 수 있다.
또한, 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(1410), 전처리부(1420), 인식 데이터 선택부(1430), 인식 결과 제공부(1440) 및 모델 갱신부(1450) 중 적어도 하나가 소프트웨어 모듈(또는, 인스터력션(instruction)을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 이 경우, 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 적어도 하나의 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
도 14는 일 실시예에 따른 전자 장치 및 서버가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.
도 14를 참조하면, 서버(2000)는 사용자 이미지를 분석하여, 사용자를 인식하기 위한 기준을 학습할 수 있으며, 전자 장치(100)는 서버(2000)에 의한 학습 결과에 기초하여, 사용자를 인식할 수 있다.
이 경우, 서버(2000)의 모델 학습부(2340)는 도 12에 도시된 모델 학습부(1340)의 기능을 수행할 수 있다. 서버(2000)의 모델 학습부(2340)는 이미지를 분석하여, 사용자를 인식하기 위하여 어떤 데이터를 이용할 지, 데이터를 이용하여 사용자를 어떻게 인식할 지에 관한 기준을 학습할 수 있다. 모델 학습부(2340)는 학습에 이용될 데이터를 획득하고, 획득된 데이터를 후술할 데이터 인식 모델에 적용함으로써, 사용자 인식을 위한 기준을 학습할 수 있다.
또한, 전자 장치(100)의 인식 결과 제공부(1440)는 인식 데이터 선택부(1430)에 의해 선택된 데이터를 서버(2000)에 의해 생성된 데이터 인식 모델에 적용하여 상황을 판단할 수 있다. 예를 들어, 인식 결과 제공부(1440)는 인식 데이터 선택부(1430)에 의해 선택된 데이터를 서버(2000)에게 전송하고, 서버(2000)가 인식 데이터 선택부(1430)에 의해 선택된 데이터를 인식 모델에 적용하여 사용자를 인식할 것을 요청할 수 있다. 또한, 인식 결과 제공부(1440)는 서버(2000)에 의해 인식된 사용자에 관한 정보를 서버(2000)로부터 수신할 수 있다.
또는, 전자 장치(100)의 인식 결과 제공부(1440)는 서버(2000)에 의해 생성된 인식 모델을 서버(2000)로부터 수신하고, 수신된 인식 모델을 이용하여 이미지를 분석하고, 사용자를 인식할 수 있다. 이 경우, 전자 장치(100)의 인식 결과 제공부(1440)는 인식 데이터 선택부(1430)에의해 선택된 데이터를 서버(2000)로부터 수신된 데이터 인식 모델에 적용하여 사용자를 인식할 수 있다.
도 15는 다른 실시예에 따른 전자 장치의 구성을 나타내는 블록도이다. 도 15의 전자 장치(300)는 도 1의 전자 장치(100)의 일 실시예일 수 있다.
도 15를 참조하면, 일 실시예에 따른 전자 장치(300)는 제어부(330), 센서부(320), 통신부(340), 출력부(350), 사용자 입력부(360), A/V 입력부(370) 및 저장부(380)를 포함할 수도 있다.
도 15의 제어부(330)는 도 10의 프로세서(120))에, 도 15의 저장부(380)는 도 10의 메모리(130)에, 도 15의 카메라(371)는 도 10의 카메라(140)에 각각 대응될 수 있다. 도 10에서 설명한 내용과 동일한 내용은 도 15에서 생략하기로 한다.
통신부(340)는, 전자 장치(300)와 외부 장치(예를 들어, 서버 등) 간의 통신을 수행하기 위한 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(340)는, 근거리 통신부(341), 이동 통신부(342), 방송 수신부(343)를 포함할 수 있다.
근거리 통신부(short-range wireless communication unit)(341)는, 블루투스 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부, WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
이동 통신부(342)는, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
방송 수신부(343)는, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 전자 장치(300)가 방송 수신부(343)를 포함하지 않을 수도 있다.
통신부(340)는, 외부 장치로부터 적어도 하나의 사용자 이미지를 수신할 수 있다.
출력부(350)는, 오디오 신호 또는 비디오 신호 또는 진동 신호의 출력을 위한 것으로, 이에는 디스플레이부(351)와 음향 출력부(352), 진동 모터(353) 등이 포함될 수 있다.
일 실시예에 따른 디스플레이부(351)는, 프로세서(120)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다. 디스플레이부(351)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display)등으로 구현될 수 있으며, 또한, 3차원 디스플레이(3D display)로 구현될 수 있다. 또한, 디스플레이부(351)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.
일 실시예에 따른 디스플레이부(351)는 사용자 이미지를 표시할 수 있다. 이때, 디스플레이부(140)에 표시되는 이미지는 전자 장치(100)에서 촬영된 이미지, 전자 장치(100)에 저장된 이미지, 외부 장치로부터 수신한 이미지 중 적어도 하나일 수 있다. 다만, 이에 한정되지 않는다. 또한, 디스플레이부(351)는 사용자 인식 결과를 표시할 수 있다. 예를 들어, 인식한 사용자에 대한 정보를 표시하거나, 인식한 사용자가 정당한 사용자가 아닌 경우, 경고 메시지를 표시할 수 있다. 또는, 인식된 사용자가 등록된 사용자가 아닌 경우, 인식 오류 메시지를 표시하거나, 사용자를 새로 등록할 것인지를 묻는 메시지를 표시할 수도 있다. 다만, 이에 한정되지 않는다.
음향 출력부(352)는 통신부(340)로부터 수신되거나 저장부(380)에 저장된 오디오 데이터를 출력한다. 또한, 음향 출력부(352)는 전자 장치(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음, 알림음)과 관련된 음향 신호를 출력한다. 이러한 음향 출력부(352)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다. 예를 들어, 음향 출력부(352)는 인식한 사용자가 정당한 사용자가 아닌 경우, 알람을 출력할 수 있다.
진동 모터(353)는 진동 신호를 출력할 수 있다. 예를 들어, 진동 모터(353)는 오디오 데이터 또는 비디오 데이터(예컨대, 호신호 수신음, 메시지 수신음 등)의 출력에 대응하는 진동 신호를 출력할 수 있다. 또한, 진동 모터(353)는 터치스크린에 터치가 입력되는 경우 진동 신호를 출력할 수도 있다.
제어부(330)는, 전자 장치(300)의 전반적인 동작을 제어한다. 예를 들어, 제어부(330)는, 저장부(380)에 저장된 프로그램들을 실행함으로써, 통신부(340), 출력부(350), 사용자 입력부(360), 센싱부(320), A/V 입력부(370) 등을 제어할 수 있다.
사용자 입력부(360)는, 사용자가 전자 장치(300)를 제어하기 위한 데이터를 입력하는 수단을 의미한다. 예를 들어, 사용자 입력부(360)에는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있으나 이에 한정되는 것은 아니다.
센서부(320)는, 사용자의 생체 정보를 센싱하는 센서뿐만 아니라, 전자 장치(300)의 상태 또는 전자 장치(300) 주변의 상태를 감지하는 센서를 포함할 수 있다. 또한, 센서부(320)는 센서에서 감지된 정보를 제어부(320)로 전달할 수 있다.
센서부(320)는, 지자기 센서(Magnetic sensor), 가속도 센서(Acceleration sensor), 온/습도 센서, 적외선 센서, 자이로스코프 센서, 위치 센서(예컨대, GPS)), 기압 센서, 근접 센서, 및 RGB 센서(illuminance sensor) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다. 각 센서들의 기능은 그 명칭으로부터 당업자가 직관적으로 추론할 수 있으므로, 구체적인 설명은 생략하기로 한다.
A/V(Audio/Video) 입력부(370)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(371)와 마이크로폰(372) 등이 포함될 수 있다. 카메라(371)는 화상 통화모드 또는 촬영 모드에서 이미지 센서를 통해 정지영상 또는 동영상 등의 화상 프레임을 얻을 수 있다. 이미지 센서를 통해 캡쳐된 이미지는 제어부(330) 또는 별도의 이미지 처리부(미도시)를 통해 처리될 수 있다.
카메라(371)에서 처리된 화상 프레임은 저장부(380)에 저장되거나 통신부(340)를 통하여 외부로 전송될 수 있다. 카메라(371)는 전자 장치(300)의 구성 태양에 따라 2개 이상이 구비될 수도 있다.
마이크로폰(372)은, 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리한다. 예를 들어, 마이크로폰(372)은 외부 디바이스 또는 화자로부터 음향 신호를 수신할 수 있다. 마이크로폰(372)은 외부의 음향 신호를 입력 받는 과정에서 발생 되는 잡음(noise)를 제거하기 위한 다양한 잡음 제거 알고리즘을 이용할 수 있다.
저장부(380)는, 제어부(330)의 처리 및 제어를 위한 프로그램을 저장할 수도 있고, 입/출력되는 데이터들(예컨대, 애플리케이션, 콘텐트, 외부 디바이스의 시간대 정보, 주소록 등)을 저장할 수도 있다.
저장부(380)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 전자 장치(300)는 인터넷(internet)상에서 저장부(380)의 저장 기능을 수행하는 웹 스토리지(web storage) 또는 클라우드 서버를 운영할 수도 있다.
저장부(380)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, UI 모듈(381), 터치 스크린 모듈(382), 알림 모듈(383) 등으로 분류될 수 있다.
UI 모듈(381)은, 어플리케이션 별로 전자 장치(300)와 연동되는 특화된 UI, GUI 등을 제공할 수 있다. 터치 스크린 모듈(382)은 사용자의 터치 스크린 상의 터치 제스처를 감지하고, 터치 제스처에 관한 정보를 제어부(130)로 전달할 수 있다.
터치 스크린 모듈(382)은 터치 코드를 인식하고 분석할 수 있다. 터치 스크린 모듈(382)은 컨트롤러를 포함하는 별도의 하드웨어로 구성될 수도 있다.
알림 모듈(383)은 전자 장치(300)의 이벤트 발생을 알리기 위한 신호를 발생할 수 있다. 전자 장치(300)에서 발생되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 일정 알림 등이 있다. 알림 모듈(383)은 디스플레이부(351)를 통해 비디오 신호 형태로 알림 신호를 출력할 수도 있고, 음향 출력부(352)를 통해 오디오 신호 형태로 알림 신호를 출력할 수도 있고, 진동 모터(353)를 통해 진동 신호 형태로 알림 신호를 출력할 수도 있다.
한편, 도 10 및 14에 도시된 전자 장치(100, 300)의 블록도는 일 실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 전자 장치(100, 300)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 실시예들을 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
일 실시예에 따른 장치(예: 모듈들 또는 그 기능들) 또는 방법(예: 동작들)의 적어도 일부는 프로그램 모듈의 형태로 컴퓨터로 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장된 명령어로 구현될 수 있다. 명령어가 프로세서(예: 프로세서(120))에 의해 실행될 경우, 프로세서가 상기 명령어에 해당하는 기능을 수행할 수 있다.
여기서, 프로그램은 컴퓨터가 읽을 수 있는 비일시적 기록매체에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 개시의 실시 예를 구현할 수 있다.
여기서 비일시적 판독 가능 기록매체란, 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미할 뿐만 아니라 레지스터, 캐쉬, 버퍼 등을 포함하며, 신호(signal), 전류(current) 등과 같은 전송 매개체는 포함하지 않는다.
구체적으로, 상술한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 내장 메모리(예: 메모리(110)), 메모리 카드, ROM 또는 RAM 등과 같은 비일시적 판독가능 기록매체에 저장되어 제공될 수 있다.
또한, 개시된 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)으로 제공될 수 있다.
컴퓨터 프로그램 제품은 S/W 프로그램, S/W 프로그램이 저장된 컴퓨터로 읽을 수 있는 저장 매체 또는 판매자 및 구매자 간에 거래되는 상품을 포함할 수 있다.
예를 들어, 컴퓨터 프로그램 제품은 전자 장치 또는 전자 장치의 제조사 또는 전자 마켓(예, 구글 플레이 스토어, 앱 스토어)을 통해 전자적으로 배포되는 S/W 프로그램 형태의 상품(예, 다운로더블 앱)을 포함할 수 있다. 전자적 배포를 위하여, S/W 프로그램의 적어도 일부는 저장 매체에 저장되거나, 임시적으로 생성될 수 있다. 이 경우, 저장 매체는 제조사 또는 전자 마켓의 서버, 또는 중계 서버의 저장매체가 될 수 있다.
이상에서 실시예들에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속한다.

Claims (40)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 전자 장치의 동작 방법에 있어서,
    사용자 이미지를 획득하는 단계;
    제1 인식 모델을 이용하여, 상기 사용자 이미지의 얼굴 영역으로부터 얼굴 정보를 추출하는 단계;
    제2 인식 모델을 이용하여, 상기 사용자 이미지의 인물 영역으로부터 외형 정보를 추출하는 단계; 및
    상기 추출된 얼굴 정보와 상기 추출된 외형 정보 중 적어도 하나에 기초하여, 사용자 인식 결과를 출력하는 단계를 포함하고,
    상기 사용자 인식 결과를 출력하는 단계는,
    상기 사용자 이미지에서 상기 얼굴 영역만 탐지되는 경우, 상기 추출된 얼굴 정보에 기초한 사용자 인식 결과를 출력하고,
    상기 사용자 이미지에서 상기 얼굴 영역과 상기 인물 영역이 탐지되는 경우, 상기 추출된 얼굴 정보, 상기 추출된 외형 정보, 및 상기 사용자 이미지가 생성된 시간 정보에 기초한 사용자 인식 결과를 출력하며,
    상기 사용자 이미지에서 상기 인물 영역만 탐지되는 경우, 상기 추출된 외형 정보 및 상기 사용자 이미지가 생성된 시간 정보에 기초한 사용자 인식 결과를 출력하는, 전자 장치의 동작 방법.
  22. 제21 항에 있어서,
    상기 사용자 인식 결과를 출력하는 단계는,
    상기 사용자 이미지에서 상기 얼굴 영역과 상기 인물 영역이 탐지되는 경우, 상기 추출된 얼굴 정보 및 상기 추출된 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 사용자 인식 결과를 출력하고,
    상기 사용자 이미지에서 상기 인물 영역만 탐지되는 경우, 상기 추출된 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 사용자 인식 결과를 출력하는, 전자 장치의 동작 방법.
  23. 제21 항에 있어서,
    상기 사용자 인식 결과를 출력하는 단계는,
    상기 사용자 인식 결과를 상기 사용자 이미지에 표시하는, 전자 장치의 동작 방법.
  24. 제21 항에 있어서,
    상기 획득된 사용자 이미지로부터 상기 얼굴 영역과 상기 인물 영역을 검출하는 단계를 더 포함하는, 전자 장치의 동작 방법.
  25. 제21 항에 있어서,
    상기 제1 인식 모델 및 상기 제2 인식 모델은 DNN(Deep Neural Network) 모델인, 전자 장치의 동작 방법.
  26. 제21 항에 있어서,
    상기 외형 정보는 의복 스타일 정보인, 전자 장치의 동작 방법.
  27. 제21 항에 있어서,
    상기 외형 정보는 상기 사용자의 상체에 관련된 정보인, 전자 장치의 동작 방법.
  28. 제21 항에 있어서,
    상기 사용자 이미지가 얼굴 영역이 탐지되는 제1 사용자와 얼굴 영역이 탐지되지 않는 제2 사용자를 포함하는 경우,
    상기 제1 인식 모델을 이용하여 상기 얼굴 정보를 추출하는 단계는, 상기 제1 사용자의 얼굴 정보를 추출하고,
    상기 제2 인식 모델을 이용하여 상기 외형 정보를 추출하는 단계는, 상기 제2 사용자의 외형 정보를 추출하며,
    상기 사용자 인식 결과를 출력하는 단계는, 상기 제1 사용자의 얼굴 정보 및 상기 제2 사용자의 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 상기 제1 사용자 및 상기 제2 사용자를 상기 사용자 인식 결과로써 출력하는, 전자 장치의 동작 방법.
  29. 제21 항에 있어서,
    상기 제1 인식 모델은 상기 추출된 얼굴 정보에 기초하여 학습되고,
    상기 제2 인식 모델은 상기 제1 인식 모델에 의해 인식된 사용자에 매칭되는 상기 외형 정보에 기초하여 학습되는, 전자 장치의 동작 방법.
  30. 제21 항 내지 제29 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  31. 전자 장치에 있어서,
    사용자를 촬영하여, 사용자 이미지를 획득하는 카메라;
    하나 이상의 인스트럭션들을 저장하는 메모리; 및
    상기 메모리에 저장된 상기 하나 이상의 인스트럭션들을 실행하는 프로세서를 포함하고,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    제1 인식 모델을 이용하여, 상기 사용자 이미지의 얼굴 영역으로부터 얼굴 정보를 추출하고, 제2 인식 모델을 이용하여, 상기 사용자 이미지의 인물 영역으로부터 외형 정보를 추출하고, 상기 추출된 얼굴 정보와 상기 추출된 외형 정보 중 적어도 하나에 기초하여, 사용자 인식 결과를 출력하며,
    상기 사용자 이미지에서 상기 얼굴 영역만 탐지되는 경우, 상기 추출된 얼굴 정보에 기초한 사용자 인식 결과를 출력하고,
    상기 사용자 이미지에서 상기 얼굴 영역과 상기 인물 영역이 탐지되는 경우, 상기 추출된 얼굴 정보, 상기 추출된 외형 정보, 및 상기 사용자 이미지가 생성된 시간 정보에 기초한 사용자 인식 결과를 출력하며,
    상기 사용자 이미지에서 상기 인물 영역만 탐지되는 경우, 상기 추출된 외형 정보 및 상기 사용자 이미지가 생성된 시간 정보에 기초한 사용자 인식 결과를 출력하는, 전자 장치.
  32. 제31 항에 있어서,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    상기 사용자 이미지에서 상기 얼굴 영역과 상기 인물 영역이 탐지되는 경우, 상기 추출된 얼굴 정보 및 상기 추출된 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 사용자 인식 결과를 출력하고, 상기 사용자 이미지에서 상기 인물 영역만 탐지되는 경우, 상기 추출된 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 사용자 인식 결과를 출력하는, 전자 장치.
  33. 제31 항에 있어서,
    디스플레이부를 더 포함하고,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    상기 사용자 인식 결과를 상기 디스플레이부에 표시된 상기 사용자 이미지에 표시하는, 전자 장치.
  34. 제31 항에 있어서,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    상기 획득된 사용자 이미지로부터 상기 얼굴 영역과 상기 인물 영역을 검출하는, 전자 장치.
  35. 제31 항에 있어서,
    상기 제1 인식 모델 및 상기 제2 인식 모델은 DNN(Deep Neural Network) 모델인, 전자 장치.
  36. 제31 항에 있어서,
    상기 외형 정보는 의복 스타일 정보인, 전자 장치.
  37. 제31 항에 있어서,
    상기 외형 정보는 상기 사용자의 상체에 관련된 정보인, 전자 장치.
  38. 제31 항에 있어서,
    상기 사용자 이미지가 얼굴 영역이 탐지되는 제1 사용자와 얼굴 영역이 탐지되지 않는 제2 사용자를 포함하는 경우,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    상기 제1 인식 모델을 이용하여 상기 제1 사용자의 얼굴 정보를 추출하고, 상기 제2 인식 모델을 이용하여 상기 제2 사용자의 외형 정보를 추출하며, 상기 제1 사용자의 얼굴 정보 및 상기 제2 사용자의 외형 정보를 상기 사용자 이미지가 생성된 시간 정보를 기준으로 분류된 데이터베이스와 비교하여, 상기 제1 사용자 및 상기 제2 사용자를 상기 사용자 인식 결과로써 출력하는, 전자 장치.
  39. 제31 항에 있어서,
    상기 제1 인식 모델은 상기 추출된 얼굴 정보에 기초하여 학습되고,
    상기 제2 인식 모델은 상기 제1 인식 모델에 의해 인식된 사용자에 매칭되는 상기 외형 정보에 기초하여 학습되는, 전자 장치.
  40. 제31 항에 있어서,
    상기 프로세서는 상기 하나 이상의 인스트럭션들을 실행함으로써,
    상기 제2 인식 모델을 이용하여, 상기 인물 영역을 신체 부위별 영역으로 구분하고, 상기 신체 부위별 영역에 대응되는 외형 정보를 추출하는, 전자 장치.
KR1020170135870A 2016-12-23 2017-10-19 전자 장치 및 그 동작 방법 KR102530045B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
PCT/KR2017/015279 WO2018117704A1 (en) 2016-12-23 2017-12-21 Electronic apparatus and operation method thereof
CN201780079799.XA CN110100253A (zh) 2016-12-23 2017-12-21 电子设备及其操作方法
EP17884746.3A EP3539056A4 (en) 2016-12-23 2017-12-21 ELECTRONIC APPARATUS AND METHOD OF OPERATION
US15/850,393 US10528799B2 (en) 2016-12-23 2017-12-21 Electronic apparatus and operation method thereof
US16/732,816 US11042728B2 (en) 2016-12-23 2020-01-02 Electronic apparatus for recognition of a user and operation method thereof
KR1020230057360A KR102659288B1 (ko) 2016-12-23 2023-05-02 전자 장치 및 그 동작 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160177884 2016-12-23
KR20160177884 2016-12-23

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020230057360A Division KR102659288B1 (ko) 2016-12-23 2023-05-02 전자 장치 및 그 동작 방법

Publications (2)

Publication Number Publication Date
KR20180074565A KR20180074565A (ko) 2018-07-03
KR102530045B1 true KR102530045B1 (ko) 2023-05-09

Family

ID=62918528

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170135870A KR102530045B1 (ko) 2016-12-23 2017-10-19 전자 장치 및 그 동작 방법

Country Status (3)

Country Link
EP (1) EP3539056A4 (ko)
KR (1) KR102530045B1 (ko)
CN (1) CN110100253A (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220114836A1 (en) * 2019-01-30 2022-04-14 Samsung Electronics Co., Ltd. Method for processing image, and apparatus therefor
US20220254160A1 (en) * 2019-05-18 2022-08-11 Looplearn Pty Ltd Localised, loop-based self-learning for recognising individuals at locations
EP3915048A4 (en) * 2019-06-03 2022-03-30 Samsung Electronics Co., Ltd. ELECTRONIC OBJECT RECOGNITION APPARATUS AND METHOD FOR OPERATING IT
KR102254138B1 (ko) * 2019-06-03 2021-05-21 삼성전자주식회사 객체 인식을 위한 전자 장치 및 그 제어 방법
KR20200141373A (ko) * 2019-06-10 2020-12-18 (주)사맛디 외형인식모델 학습용 데이터셋 구축 방법, 장치 및 프로그램
US11927931B2 (en) 2019-06-27 2024-03-12 Lg Electronics Inc. Artificial intelligence-based air conditioner
KR102260355B1 (ko) * 2019-10-10 2021-06-02 주식회사 신세계아이앤씨 영상 기반 구매 행동 인식 시스템 및 방법
KR102260120B1 (ko) * 2019-11-04 2021-06-03 주식회사 넥스트케이 딥러닝기반 행동인식장치 및 그 장치의 구동방법
CN110891292A (zh) * 2019-11-20 2020-03-17 三星电子(中国)研发中心 一种终端自动切换网络方法和装置
KR102413128B1 (ko) * 2020-12-14 2022-06-24 주식회사 엘지씨엔에스 계속 사용 인증 방법, 장치 및 기록매체

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101464446B1 (ko) * 2013-10-07 2014-11-24 재단법인대구경북과학기술원 얼굴 인식과 자세 추정을 이용한 개인 인증 방법 및 그 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180112B2 (en) * 2008-01-21 2012-05-15 Eastman Kodak Company Enabling persistent recognition of individuals in images
US8724902B2 (en) * 2010-06-01 2014-05-13 Hewlett-Packard Development Company, L.P. Processing image data
KR102057947B1 (ko) * 2013-04-01 2019-12-20 삼성전자주식회사 사용자 인증을 수행하는 디스플레이 장치 및 그 사용자 인증 방법
KR20150024162A (ko) * 2013-08-26 2015-03-06 주식회사 마랑정보기술 가축의 안면 영상인식 기반 개체식별, 그리고 이를 통한 개별 맞춤형 사양 및 비육관리 시스템
CN103942577B (zh) * 2014-04-29 2018-08-28 上海复控华龙微系统技术有限公司 视频监控中基于自建立样本库及混合特征的身份识别方法
KR20160091786A (ko) * 2015-01-26 2016-08-03 삼성전자주식회사 사용자 관리 방법 및 사용자 관리 장치
CN105825176B (zh) * 2016-03-11 2019-06-04 东华大学 基于多模态非接触身份特征的识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101464446B1 (ko) * 2013-10-07 2014-11-24 재단법인대구경북과학기술원 얼굴 인식과 자세 추정을 이용한 개인 인증 방법 및 그 장치

Also Published As

Publication number Publication date
EP3539056A4 (en) 2019-11-27
KR20180074565A (ko) 2018-07-03
EP3539056A1 (en) 2019-09-18
CN110100253A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
US11042728B2 (en) Electronic apparatus for recognition of a user and operation method thereof
KR102530045B1 (ko) 전자 장치 및 그 동작 방법
CN110249360B (zh) 用于推荐产品的装置和方法
KR102428920B1 (ko) 전자 장치 및 그 동작 방법
KR102453169B1 (ko) 디바이스가 이미지를 보정하는 방법 및 그 디바이스
US10631045B2 (en) Method and apparatus for filtering video
EP3531370B1 (en) Method for correcting image by device and device therefor
KR20190016367A (ko) 객체를 인식하는 방법 및 장치
KR102420567B1 (ko) 음성 인식 장치 및 방법
KR20180055708A (ko) 이미지를 처리하는 전자 장치 및 방법
KR20180074568A (ko) 차선 정보를 추정하는 방법 및 전자 장치
KR102531654B1 (ko) 음성 입력 인증 디바이스 및 그 방법
KR102474245B1 (ko) 스와이프 입력에 기초하여 입력 문자를 판단하는 시스템 및 방법
KR20180072534A (ko) 텍스트와 연관된 이미지 제공 방법 및 이를 위한 전자 장치
KR102384878B1 (ko) 동영상을 필터링하는 방법 및 장치
KR102464906B1 (ko) 패션 상품을 추천하는 전자 장치, 서버 및 그 동작 방법
KR20190048630A (ko) 전자 장치 및 그 제어 방법
EP3879449A1 (en) Electronic device for recognizing object in image, and operation method thereof
KR102659288B1 (ko) 전자 장치 및 그 동작 방법
KR102440963B1 (ko) 전자 장치, 이의 제어 방법 및 비일시적인 컴퓨터 판독가능 기록매체
KR20220121637A (ko) 전자 장치 및 그 동작방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant