KR102664418B1 - Display apparatus and service providing method of thereof - Google Patents

Display apparatus and service providing method of thereof Download PDF

Info

Publication number
KR102664418B1
KR102664418B1 KR1020170157854A KR20170157854A KR102664418B1 KR 102664418 B1 KR102664418 B1 KR 102664418B1 KR 1020170157854 A KR1020170157854 A KR 1020170157854A KR 20170157854 A KR20170157854 A KR 20170157854A KR 102664418 B1 KR102664418 B1 KR 102664418B1
Authority
KR
South Korea
Prior art keywords
display device
user
data
content
unit
Prior art date
Application number
KR1020170157854A
Other languages
Korean (ko)
Other versions
KR20180082950A (en
Inventor
김혜원
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to PCT/KR2018/000444 priority Critical patent/WO2018131875A1/en
Priority to US15/868,539 priority patent/US10257569B2/en
Publication of KR20180082950A publication Critical patent/KR20180082950A/en
Application granted granted Critical
Publication of KR102664418B1 publication Critical patent/KR102664418B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4661Deriving a combined profile for a plurality of end-users of the same client, e.g. for family members within a home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

디스플레이 장치 및 그의 서비스 제공 방법에 제공된다. 본 개시의 일 실시 예에 따른 디스플레이 장치는, 컨텐츠 재생 화면을 표시하는 디스플레이부 및 재생중인 컨텐츠를 인식하고, 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하며, 디스플레이 장치를 사용하는 사용자를 판단하고, 판단된 사용자의 정보를 기초로 인식된 적어도 하나의 오브젝트 중 하나를 선택하며, 선택된 오브젝트와 관련된 서비스를 판단된 사용자에게 제공하는 프로세서를 포함할 수 있다.Provided is a display device and a service provision method thereof. A display device according to an embodiment of the present disclosure recognizes a display unit that displays a content playback screen and content being played, recognizes at least one object on the currently displayed screen, and determines a user using the display device. It may include a processor that selects one of at least one recognized object based on the determined user's information and provides a service related to the selected object to the determined user.

Description

디스플레이 장치 및 그의 서비스 제공 방법{DISPLAY APPARATUS AND SERVICE PROVIDING METHOD OF THEREOF}Display device and service providing method thereof {DISPLAY APPARATUS AND SERVICE PROVIDING METHOD OF THEREOF}

본 개시는 디스플레이 장치 및 그의 서비스 제공 방법에 관한 것으로, 더욱 구체적으로는, 현재 디스플레이 장치를 사용하는 사용자에게 맞춤 ACR 서비스를 제공할 수 있는 디스플레이 장치 및 그의 서비스 제공 방법에 관한 것이다.This disclosure relates to a display device and a service provision method thereof, and more specifically, to a display device capable of providing a customized ACR service to a user currently using the display device and a service provision method thereof.

또한, 본 개시는 딥러닝 등의 기계 학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 인공지능(AI) 시스템 및 그 응용에 관련된 것이다.Additionally, the present disclosure relates to an artificial intelligence (AI) system and its applications that mimic the functions of the human brain, such as cognition and judgment, using machine learning algorithms such as deep learning.

인공지능(Artificial Intelligence, AI) 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며, 기존 Rule 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다. 인공지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 Rule 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.An artificial intelligence (AI) system is a computer system that implements human-level intelligence, and unlike existing rule-based smart systems, it is a system in which machines learn and make decisions on their own and become smarter. As artificial intelligence systems are used, the recognition rate improves and users' preferences can be more accurately understood, and existing rule-based smart systems are gradually being replaced by deep learning-based artificial intelligence systems.

인공지능 기술은 기계학습(딥러닝) 및 기계학습을 활용한 요소 기술들로 구성된다. 기계학습은 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론/예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.Artificial intelligence technology consists of machine learning (deep learning) and element technologies using machine learning. Machine learning is an algorithmic technology that classifies and learns the characteristics of input data on its own, and elemental technology is a technology that uses machine learning algorithms such as deep learning to mimic the functions of the human brain such as cognition and judgment, including linguistic understanding and visual It consists of technical areas such as understanding, reasoning/prediction, knowledge expression, and motion control.

인공지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어/문자를 인식하고 응용/처리하는 기술로서, 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식/합성 등을 포함한다. 시각적 이해는 사물을 인간의 시각처럼 인식하여 처리하는 기술로서, 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면 이해, 공간 이해, 영상 개선 등을 포함한다. 추론 예측은 정보를 판단하여 논리적으로 추론하고 예측하는 기술로서, 지식/확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로서, 지식 구축(데이터 생성/분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로서, 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.The various fields where artificial intelligence technology is applied are as follows. Linguistic understanding is a technology that recognizes and applies/processes human language/characters and includes natural language processing, machine translation, conversation systems, question and answer, and voice recognition/synthesis. Visual understanding is a technology that recognizes and processes objects like human vision, and includes object recognition, object tracking, image search, person recognition, scene understanding, spatial understanding, and image improvement. Inferential prediction is a technology that judges information to make logical inferences and predictions, and includes knowledge/probability-based inference, optimization prediction, preference-based planning, and recommendation. Knowledge expression is a technology that automatically processes human experience information into knowledge data, and includes knowledge construction (data creation/classification) and knowledge management (data utilization). Motion control is a technology that controls the autonomous driving of vehicles and the movement of robots, and includes motion control (navigation, collision, driving), operation control (behavior control), etc.

한편, 근래에는 디스플레이 장치에서 현재 표시되는 컨텐츠를 인식할 수 있는 ACR(Automatic Cotent Recognition) 기술이 개발되었다. 사용자가 현재 어떠한 컨텐츠를 시청하고 있는지를 알 수 있다면, 디스플레이 장치는 타게팅 광고, 컨텐츠 추천, 연관 정보 검색 등의 지능형 서비스를 제공할 수 있다.Meanwhile, in recent years, ACR (Automatic Content Recognition) technology has been developed that can recognize content currently displayed on a display device. If it can know what content the user is currently watching, the display device can provide intelligent services such as targeted advertising, content recommendation, and related information search.

하지만, 가정이나 공공장소에서 사용되는 디스플레이 장치는 여러 사람이 공동으로 사용하는 장치이다. 따라서 디스플레이 장치를 사용하는 여러 사람에게 동일한 상품, 서비스에 대한 정보가 제공될 수밖에 없다. However, display devices used at home or in public places are devices that are shared by many people. Therefore, information about the same product or service is inevitably provided to multiple people using the display device.

여러 사용자가 선호하는 상품, 서비스 등이 상이할 수 있기 때문에, 종래의 ACR 기반 서비스는 일부 사용자에게만 적합한 서비스를 제공할 수 있다는 문제점이 존재한다.Since the products and services preferred by various users may be different, there is a problem in that conventional ACR-based services can provide services suitable only for some users.

본 개시는 상술한 문제점을 해결하기 위한 것으로, 화면 내에서 인식되는 오브젝트를 클러스터링하고, 현재 디스플레이 장치의 사용자를 판단하며, 판단된 사용자에게 적합한 클러스터링된 오브젝트를 선정함으로써, 개인화된 ACR 기반 서비스를 제공할 수 있는 디스플레이 장치 및 그의 서비스 제공 방법을 제공함을 목적으로 한다.The present disclosure is intended to solve the above-mentioned problems, and provides a personalized ACR-based service by clustering objects recognized within the screen, determining the user of the current display device, and selecting clustered objects suitable for the determined user. The purpose is to provide a display device capable of providing a display device and a method of providing its service.

상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 디스플레이 장치는, 컨텐츠 재생 화면을 표시하는 디스플레이부 및 재생중인 컨텐츠를 인식하고, 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하며, 상기 디스플레이 장치를 사용하는 사용자를 판단하고, 상기 판단된 사용자의 정보를 기초로 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하며, 상기 선택된 오브젝트와 관련된 서비스를 상기 판단된 사용자에게 제공하는 프로세서를 포함할 수 있다.In order to achieve the above object, a display device according to an embodiment of the present disclosure recognizes a display unit that displays a content playback screen and the content being played, recognizes at least one object on the currently displayed screen, and uses the display device to It may include a processor that determines the user using the device, selects one of the recognized at least one object based on information about the determined user, and provides a service related to the selected object to the determined user.

그리고, 서버와 통신하는 통신부를 더 포함하고, 상기 프로세서는, 상기 디스플레이부에 표시된 화면의 특징을 추출하여 핑거프린트를 생성하고, 상기 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버에 질의하도록 상기 통신부를 제어하며, 상기 서버로부터 수신된 컨텐츠 정보를 이용하여 컨텐츠를 인식할 수 있다.And, it further includes a communication unit that communicates with a server, wherein the processor extracts characteristics of the screen displayed on the display unit to generate a fingerprint, and queries the server for content information corresponding to the generated fingerprint. can be controlled, and content can be recognized using content information received from the server.

또한, 상기 프로세서는, 상기 디스플레이부에 표시된 화면에서 상품에 해당하는 오브젝트를 인식하고, 상기 인식된 컨텐츠의 메타데이터를 기초로 상기 표시된 화면에서 인물에 해당하는 오브젝트를 인식하며, 상기 인식된 인물과 상품을 클러스터링할 수 있다.In addition, the processor recognizes an object corresponding to a product on the screen displayed on the display unit, recognizes an object corresponding to a person on the displayed screen based on metadata of the recognized content, and Products can be clustered.

그리고, 상기 프로세서는, 상기 표시된 화면에서의 위치를 기초로, 상기 인물과 상품 사이의 관련성 존부를 판단하고, 관련성이 있으면 상기 인식된 인물과 상품을 클러스터링하며, 관련성이 없으면 상기 상품을 필터링할 수 있다.In addition, the processor determines whether there is a relationship between the person and the product based on the position on the displayed screen, clusters the recognized person and the product if there is a relationship, and filters the product if there is no relationship. there is.

또한, 상기 프로세서는, 상기 판단된 사용자가 2명 이상이면, 화면이 변경될 때마다 상기 2명 이상의 사용자 중 한 명의 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단할 수 있다.Additionally, if the determined number of users is two or more, the processor may determine one user among the two or more users as the user using the display device every time the screen is changed.

그리고, 상기 프로세서는, 상기 적어도 하나의 오브젝트에 대한 선호도 순위를 결정하고, 상기 2명 이상의 사용자 중에서, 최우선 순위로 결정된 오브젝트에 대한 선호도가 가장 높은 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단할 수 있다.In addition, the processor may determine a preference ranking for the at least one object, and determine that, among the two or more users, the user with the highest preference for the object determined as the highest priority is the user using the display device. there is.

또한, 사용자의 생체 정보를 입력받는 입력부를 더 포함하고, 상기 프로세서는, 상기 입력부를 통해 입력된 생체 정보와 기저장된 생체 정보를 비교하여, 상기 디스플레이 장치를 사용하는 사용자를 판단할 수 있다.Additionally, it may further include an input unit that receives the user's biometric information, and the processor may determine the user using the display device by comparing the biometric information input through the input unit with pre-stored biometric information.

그리고, 이미지를 촬영하는 카메라를 더 포함하고, 상기 프로세서는, 상기 카메라를 통해 촬영된 상기 디스플레이 장치의 전방에 위치한 기설정된 영역의 이미지에 포함된 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단할 수 있다.And, it may further include a camera for capturing an image, and the processor may determine that a user included in an image of a preset area located in front of the display device captured through the camera is a user using the display device. there is.

한편, 상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 디스플레이 장치의 서비스 제공 방법은, 재생중인 컨텐츠를 인식하는 단계, 상기 컨텐츠의 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하는 단계, 상기 디스플레이 장치를 사용하는 사용자를 판단하는 단계, 상기 판단된 사용자의 정보를 기초로 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하는 단계 및 상기 선택된 오브젝트와 관련된 서비스를 상기 판단된 사용자에게 제공하는 단계를 포함할 수 있다.Meanwhile, a service providing method of a display device according to an embodiment of the present disclosure for achieving the above object includes recognizing content being played, recognizing at least one object on a currently displayed screen of the content, and displaying the display device. It includes determining a user using the device, selecting one of the recognized at least one object based on information on the determined user, and providing a service related to the selected object to the determined user. can do.

그리고, 상기 컨텐츠를 인식하는 단계는, 상기 표시된 화면의 특징을 추출하여 핑거프린트를 생성하는 단계, 상기 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버에 질의하는 단계 및 상기 서버로부터 수신된 컨텐츠 정보를 이용하여, 컨텐츠를 인식하는 단계를 포함할 수 있다.And, the step of recognizing the content includes extracting characteristics of the displayed screen to generate a fingerprint, querying the server for content information corresponding to the generated fingerprint, and content information received from the server. It may include a step of recognizing content.

또한, 상기 오브젝트를 인식하는 단계는, 상기 표시된 화면에서 상품에 해당하는 오브젝트를 인식하는 단계, 상기 인식된 컨텐츠의 메타데이터를 기초로 상기 표시된 화면에서 인물에 해당하는 오브젝트를 인식하는 단계 및 상기 인식된 인물과 상품을 클러스터링하는 단계를 포함할 수 있다.In addition, the step of recognizing the object includes recognizing an object corresponding to a product on the displayed screen, recognizing an object corresponding to a person on the displayed screen based on metadata of the recognized content, and the recognition It may include a step of clustering the people and products.

그리고, 상기 클러스터링하는 단계는, 상기 표시된 화면에서의 위치를 기초로, 상기 인물과 상품 사이의 관련성 존부를 판단하는 단계 및 관련성이 있으면 상기 인식된 인물과 상품을 클러스터링하고, 관련성이 없으면 상기 상품을 필터링하는 단계를 포함할 수 있다.And, the clustering step includes determining whether there is a relationship between the person and the product based on the position on the displayed screen, and if there is a relationship, clustering the recognized person and the product, and if there is no relationship, clustering the product. A filtering step may be included.

또한, 상기 사용자를 판단하는 단계는, 상기 판단된 사용자가 2명 이상이면, 화면이 변경될 때마다 상기 2명 이상의 사용자 중 한 명의 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단할 수 있다.Additionally, in the step of determining the user, if the determined users are two or more, one user among the two or more users may be determined as the user using the display device every time the screen is changed.

그리고, 상기 사용자를 판단하는 단계는, 상기 적어도 하나의 오브젝트에 대한 선호도 순위를 결정하는 단계 및 상기 2명 이상의 사용자 중에서, 최우선 순위로 결정된 오브젝트에 대한 선호도가 가장 높은 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단하는 단계를 포함할 수 있다.And, the step of determining the user includes determining a preference ranking for the at least one object, and selecting the user with the highest preference for the object determined as the highest priority among the two or more users using the display device. It may include a step of determining the user.

또한, 상기 사용자를 판단하는 단계는, 상기 사용자의 생체 정보를 입력받는 단계 및 상기 입력된 생체 정보와 기저장된 생체 정보를 비교하여, 상기 디스플레이 장치를 사용하는 사용자를 판단하는 단계를 포함할 수 있다.In addition, the step of determining the user may include receiving the user's biometric information and comparing the input biometric information with pre-stored biometric information to determine the user using the display device. .

그리고, 상기 사용자를 판단하는 단계는, 상기 디스플레이 장치의 전방에 위치한 기설정된 영역에 대한 이미지를 촬영하는 단계 및 상기 촬영된 이미지에 포함된 사용자를 상기 디스플레이 장치를 사용하는 사용자로 판단하는 단계를 포함할 수 있다.And, the step of determining the user includes taking an image of a preset area located in front of the display device and determining the user included in the captured image as a user using the display device. can do.

또한, 상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 인공지능 신경망(Neural Network) 모델을 이용하는 디스플레이 장치에 있어서, 컨텐츠 재생 화면을 표시하는 디스플레이부 및 재생중인 컨텐츠를 인식하고, 상기 인식된 컨텐츠를 인공지능 신경망(Neural Network) 모델에 입력하여 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하며, 상기 디스플레이 장치를 사용하는 사용자를 판단하고, 상기 판단된 사용자의 정보를 기초로 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하며, 상기 선택된 오브젝트와 관련된 서비스를 상기 판단된 사용자에게 제공하는 프로세서를 포함할 수 있다.In addition, in a display device using an artificial intelligence neural network model according to an embodiment of the present disclosure to achieve the above object, the display unit that displays the content playback screen and the content being played are recognized, and the recognized Input content into an artificial intelligence neural network model to recognize at least one object on the currently displayed screen, determine a user using the display device, and at least one object recognized based on the determined user information. It may include a processor that selects one of the objects and provides a service related to the selected object to the determined user.

이상과 같은 본 개시의 다양한 실시 예에 따르면, 디스플레이 장치는 각각의 사용자에게 맞춤 ACR 기반 서비스를 제공할 수 있다.According to various embodiments of the present disclosure as described above, a display device can provide customized ACR-based services to each user.

도 1은 본 개시의 일 실시 예에 따른 디스플레이 장치의 구성을 설명하기 위한 개략적인 블록도,
도 2는 본 개시의 일 실시 예에 따른 디스플레이 장치의 구성을 상세히 설명하기 위한 블록도,
도 3은 본 개시의 일부 실시 예에 따른 프로세서의 블록도,
도 4a는 본 개시의 일부 실시 예에 따른 데이터 학습부의 블록도,
도 4b는 본 개시의 일부 실시 예에 따른 데이터 인식부의 블록도,
도 5는 본 개시의 일 실시 예에 따른 디스플레이 시스템을 설명하기 위한 도면,
도 6은 ACR 과정을 설명하기 위한 도면,
도 7은 오브젝트 인식 과정을 설명하기 위한 도면,
도 8a는 특징점을 추출하여 오브젝트를 인식하는 방법을 설명하기 위한 도면,
도 8b는 학습을 통해 오브젝트를 인식하는 방법을 설명하기 위한 도면,
도 9는 오브젝트 클러스터링을 설명하기 위한 도면,
도 10은 복수의 사용자 정보가 저장된 경우를 예시하기 위한 도면, 그리고,
도 11 및 도 12는 본 개시의 다양한 실시 예에 따른 디스플레이 장치의 서비스 제공 방법을 설명하기 위한 흐름도이다.
1 is a schematic block diagram for explaining the configuration of a display device according to an embodiment of the present disclosure;
2 is a block diagram illustrating in detail the configuration of a display device according to an embodiment of the present disclosure;
3 is a block diagram of a processor according to some embodiments of the present disclosure;
4A is a block diagram of a data learning unit according to some embodiments of the present disclosure;
4B is a block diagram of a data recognition unit according to some embodiments of the present disclosure;
5 is a diagram for explaining a display system according to an embodiment of the present disclosure;
Figure 6 is a diagram for explaining the ACR process;
7 is a diagram for explaining the object recognition process;
Figure 8a is a diagram for explaining a method of recognizing an object by extracting feature points;
Figure 8b is a diagram for explaining a method of recognizing objects through learning;
9 is a diagram for explaining object clustering;
Figure 10 is a diagram illustrating a case where multiple user information is stored, and
11 and 12 are flowcharts illustrating a method of providing a service by a display device according to various embodiments of the present disclosure.

이하에서는 본 개시의 바람직한 실시 예가 첨부된 도면을 참조하여 상세히 설명한다. 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다. 그리고 후술되는 용어들은 본 개시에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, preferred embodiments of the present disclosure will be described in detail with reference to the attached drawings. In describing the present disclosure, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present disclosure, the detailed description will be omitted. Additionally, the terms described below are defined in consideration of the functions in the present disclosure, and may vary depending on the user, operator, or custom. Therefore, the definition should be made based on the contents throughout this specification.

제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되지는 않는다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 항목들의 조합 또는 복수의 관련된 항목들 중의 어느 하나의 항목을 포함한다.Terms containing ordinal numbers, such as first, second, etc., may be used to describe various components, but the components are not limited by the terms. Terms are used only to distinguish one component from another. For example, a first component may be named a second component without departing from the scope of the present invention, and similarly, the second component may also be named a first component. The term and/or includes a combination of a plurality of related items or any one item among a plurality of related items.

본 명세서에서 사용한 용어는 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 제한 및/또는 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 숫자, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in this specification are used to describe embodiments and are not intended to limit and/or limit the present invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as include or have are intended to designate the presence of features, numbers, operations, components, parts, or a combination thereof described in the specification, but are not intended to indicate the presence of one or more other features, numbers, operations, or configurations. It should be understood that this does not exclude in advance the possibility of the presence or addition of elements, parts, or combinations thereof.

실시 예에 있어서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 또는 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.In an embodiment, a 'module' or 'unit' performs at least one function or operation, and may be implemented as hardware or software, or as a combination of hardware or software. Additionally, a plurality of 'modules' or a plurality of 'units' may be integrated into at least one module and implemented with at least one processor, except for 'modules' or 'units' that need to be implemented with specific hardware.

한편, 본 개시에서, 사용자라는 용어는 전자 장치를 사용하는 사람 또는 전자 장치를 사용하는 장치(예: 인공지능 전자 장치)를 지칭할 수 있다.Meanwhile, in the present disclosure, the term user may refer to a person using an electronic device or a device (eg, an artificial intelligence electronic device) using the electronic device.

이하에서는 첨부된 도면을 이용하여 본 개시에 대하여 구체적으로 설명한다.Hereinafter, the present disclosure will be described in detail using the attached drawings.

도 1은 본 개시의 일 실시 예에 따른 디스플레이 장치(100)의 구성을 설명하기 위한 개략적인 블록도이다. 디스플레이 장치(100)는 스마트 TV일 수 있으나, 이는 일 실시 예에 불과할 뿐, 프로젝션 TV, 모니터, 키오스크, 노트북 PC, 타블렛, 스마트폰, PDA, 전자 액자, 테이블 디스플레이 등 다양한 유형의 장치로 구현될 수 있다.FIG. 1 is a schematic block diagram for explaining the configuration of a display device 100 according to an embodiment of the present disclosure. The display device 100 may be a smart TV, but this is only an example and may be implemented as various types of devices such as projection TVs, monitors, kiosks, laptop PCs, tablets, smartphones, PDAs, electronic photo frames, and table displays. You can.

도 1을 참조하면, 디스플레이 장치(100)는 디스플레이부(110) 및 프로세서(120)를 포함할 수 있다.Referring to FIG. 1, the display device 100 may include a display unit 110 and a processor 120.

디스플레이부(110)는 디스플레이 장치(100)에서 제공하는 각종 영상 컨텐츠, 정보, UI 등을 표시할 수 있다. 예를 들어, 디스플레이부(110)는 live 방송 또는 VOD의 형태로 제공되는 다양한 컨텐츠의 재생 화면을 표시할 수 있다.The display unit 110 can display various video contents, information, UI, etc. provided by the display device 100. For example, the display unit 110 may display a playback screen of various contents provided in the form of live broadcasting or VOD.

프로세서(120)는 현재 재생중인 컨텐츠가 무엇인지 인식할 수 있다. 예를 들어, 프로세서(120)는 표시된 화면의 특징을 추출하여 핑거프린트를 생성할 수 있다. 그리고 프로세서(120)는 생성된 핑거프린트를 서버(200)에 문의하는 방식으로 ACR(Automatic Cotent Recognition)을 수행할 수 있다. 다른 예로, 프로세서(120)는 생성된 핑거프린트를 메모리(160)에 저장된 핑거프린트 데이터베이스와 비교하는 방식으로 ACR을 수행할 수도 있다.The processor 120 can recognize the content currently being played. For example, the processor 120 may generate a fingerprint by extracting features of the displayed screen. Additionally, the processor 120 may perform Automatic Content Recognition (ACR) by querying the server 200 for the generated fingerprint. As another example, the processor 120 may perform ACR by comparing the generated fingerprint with a fingerprint database stored in the memory 160.

핑거프린트는 컨텐츠의 각각의 프레임에 포함된 비디오, 오디오 신호로부터 추출된 특징 데이터이다. 텍스트를 기반으로 한 메타 데이터와는 달리, 핑거프린트는 신호 자체의 고유한 특성을 반영할 수 있다. Fingerprints are feature data extracted from video and audio signals included in each frame of content. Unlike text-based metadata, fingerprints can reflect the unique characteristics of the signal itself.

본 명세서에서 사용되는 용어 '핑거프린트'는, 특정 영상에 대한 한 개의 핑거프린트를 의미하는 것이거나, 경우에 따라서는 특정 영상에 대한 복수의 핑거프린트로 구성된 핑거프린트 리스트를 의미하는 것일 수 있다.The term 'fingerprint' used in this specification may mean a single fingerprint for a specific image, or in some cases, a fingerprint list consisting of multiple fingerprints for a specific image.

프로세서(120)는 디스플레이 장치(100)를 사용하는 사용자를 판단할 수 있다. 예를 들어, 프로세서(120)는 생체 정보를 입력받아 현재 디스플레이 장치(100)를 사용하는 사용자가 누구인지 판단할 수 있다. 다른 예로, 프로세서(120)는 사용자를 촬영하고 얼굴 인식(Face Detection, FD)을 수행하여 현재 디스플레이 장치(100)를 사용하는 사용자가 누구인지 판단할 수 있다.The processor 120 may determine the user using the display device 100. For example, the processor 120 may receive biometric information and determine who is currently using the display device 100. As another example, the processor 120 may photograph a user and perform face detection (FD) to determine who is currently using the display device 100.

프로세서(120)는 판단된 사용자의 선호도, 사용 이력 등을 이용하여 맞춤 서비스를 제공할 수 있다. 만일 여러 사람의 사용자가 판단되면, 프로세서(120)는 컨텐츠의 각각의 프레임(또는 화면)마다 서비스를 제공할 사용자를 결정할 수 있다.The processor 120 may provide a customized service using the determined user's preferences, usage history, etc. If multiple users are determined, the processor 120 can determine the user to whom the service will be provided for each frame (or screen) of content.

본 명세서에서 사용되는 용어 '프레임'은, 오디오 또는 이미지에 관한 정보를 갖는 일련의 데이터를 말한다. 프레임은 일정한 시간 동안의 오디오 또는 이미지에 대한 데이터 수 있다. 디지털 영상 컨텐츠의 경우, 초당 30~60개의 이미지 데이터로 구성될 수 있으며, 이런 30~60개 각각의 이미지 데이터를 프레임이라고 할 수 있다. 예를 들어, 영상 컨텐츠의 현재 프레임, 다음 프레임과 같이 사용될 경우, 프레임은 컨텐츠에 포함된 연속적으로 표시되는 각각의 영상 한 화면을 말할 수 있다.The term 'frame' used in this specification refers to a series of data containing information about audio or images. A frame can be data for audio or images over a certain period of time. In the case of digital video content, it may consist of 30 to 60 image data per second, and each of these 30 to 60 image data can be referred to as a frame. For example, when used as the current frame and next frame of video content, a frame can refer to each continuously displayed video screen included in the content.

프로세서(120)는 현재 표시된 화면(또는 프레임)에서 적어도 하나의 오브젝트를 인식할 수 있다. 예를 들어, 오브젝트는 화면 내의 인물 또는 상품일 수 있다. 프로세서(120)는 인식된 인물과 상품을 클러스터링할 수 있다. 즉, 프로세서(120)는 인물과 관련된 상품으로 인식된 오브젝트를 분류할 수 있다.The processor 120 may recognize at least one object in the currently displayed screen (or frame). For example, the object may be a person or product on the screen. The processor 120 may cluster recognized people and products. That is, the processor 120 can classify objects recognized as products related to people.

판단된 사용자의 인물에 대한 선호도를 기초로, 프로세서(120)는 분류된 오브젝트 중 하나를 선택할 수 있다. 그리고 프로세서(120)는 선택된 오브젝트와 관련된 서비스를 판단된 사용자에게 제공할 수 있다.Based on the determined user's preference for the person, the processor 120 may select one of the classified objects. And the processor 120 may provide services related to the selected object to the determined user.

상술한 실시 예와 같이 디스플레이 장치(100)는 개인화된 ACR 기반 서비스를 제공할 수 있다.As in the above-described embodiment, the display device 100 may provide a personalized ACR-based service.

도 2는 본 개시의 일 실시 예에 따른 디스플레이 장치(100)의 구성을 상세히 설명하기 위한 블록도이다. 도 2를 참조하면, 디스플레이 장치(100)는 디스플레이부(110), 프로세서(120), 통신부(130), 입력부(140), 카메라(150), 메모리(160), 영상 수신부(170) 및 영상 처리부(180)를 포함할 수 있다.FIG. 2 is a block diagram for explaining in detail the configuration of the display device 100 according to an embodiment of the present disclosure. Referring to FIG. 2, the display device 100 includes a display unit 110, a processor 120, a communication unit 130, an input unit 140, a camera 150, a memory 160, an image receiver 170, and an image It may include a processing unit 180.

도 2의 실시 예에 도시된 구성 요소 이외에도 전자 장치(100)는 오디오 처리부(미도시) 및 오디오 출력부(미도시), 전원부(미도시) 등 다양한 구성을 포함할 수 있다. 또한, 전자 장치(100)가 반드시 도 2에 도시된 구성을 모두 포함하여 구현되는 것으로 한정되지 않음은 물론이다.In addition to the components shown in the embodiment of FIG. 2, the electronic device 100 may include various components such as an audio processing unit (not shown), an audio output unit (not shown), and a power supply unit (not shown). Additionally, of course, the electronic device 100 is not necessarily limited to being implemented by including all of the configurations shown in FIG. 2 .

디스플레이부(110)는 디스플레이 장치(100)에서 제공되는 각종 영상 컨텐츠, 정보, UI 등을 표시할 수 있다. 디스플레이부(110)는 액정 표시 장치(Liquid Crystal Display, LCD), 유기 전기 발광 다이오드(Organic Light Emitting Display, OLED) 또는 플라즈마 표시 패널(Plasma Display Panel, PDP) 등으로 구현되어, 디스플레이 장치(100)를 통해 제공 가능한 다양한 화면을 표시할 수 있다.The display unit 110 can display various video contents, information, UI, etc. provided by the display device 100. The display unit 110 is implemented with a liquid crystal display (LCD), an organic light emitting diode (OLED), or a plasma display panel (PDP), and is used as a display device 100. You can display various screens that can be provided through .

통신부(130)는 다양한 유형의 통신 방식에 따라 서버(200)와 통신을 수행하는 기능을 수행한다. 통신부(130)는 유선 또는 무선으로 연결된 서버(200)와 핑거프린트 데이터를 송수신할 수 있다. 또한, 통신부(130)는 서버(200)에 컨텐츠의 특정 프레임 정보를 전송하고, 해당 프레임에 포함된 오브젝트 인식을 요청할 수도 있다. 그리고, 통신부(130)는 외부 서버로부터 영상 데이터를 스트리밍할 수도 있다 통신부(130)는 유무선 통신을 지원하는 다양한 통신 칩을 포함할 수 있다. 예를 들어, 통신부(130)는 유선 LAN, 무선 LAN, WiFi, BT(Bluetooth), NFC(Near Field Communication) 방식으로 동작하는 칩을 포함할 수 있다. The communication unit 130 performs a function of communicating with the server 200 according to various types of communication methods. The communication unit 130 can transmit and receive fingerprint data with the server 200 connected wired or wirelessly. Additionally, the communication unit 130 may transmit information on a specific frame of content to the server 200 and request recognition of an object included in the frame. Additionally, the communication unit 130 may stream video data from an external server. The communication unit 130 may include various communication chips that support wired and wireless communication. For example, the communication unit 130 may include a chip that operates in a wired LAN, wireless LAN, WiFi, BT (Bluetooth), or NFC (Near Field Communication) method.

입력부(140)는 디스플레이 장치(100)를 제어하기 위한 다양한 사용자 명령을 수신할 수 있다. 또한, 입력부(140)는 사용자의 생체 정보를 입력받을 수 있다. 사용자의 생체 정보는 지문 정보, 홍채 정보, 성문 정보 등을 포함할 수 있다. 예를 들어, 입력부(140)는 ACR 기능 실행 버튼에 위치한 지문 인식 센서로 구현되어, ACR 기능 실행 버튼을 누른 사용자의 지문 정보를 수집할 수 있다.The input unit 140 may receive various user commands for controlling the display device 100. Additionally, the input unit 140 can receive input of the user's biometric information. The user's biometric information may include fingerprint information, iris information, voiceprint information, etc. For example, the input unit 140 is implemented as a fingerprint recognition sensor located on the ACR function execution button, and can collect fingerprint information of the user who pressed the ACR function execution button.

입력부(140)는 버튼, 터치 패드 등으로 구현될 수도 있고, 원격제어장치와 같은 별도의 장치로 구현될 수도 있다. 입력부(140)가 터치 패드로 구현되는 경우, 디스플레이부(110)와 결합하여 상호 레이어 구조를 이루는 터치 스크린의 형태로 구현될 수도 있다. 터치 스크린은 터치 입력 위치, 면적, 터치 입력의 압력 등을 검출할 수 있다.The input unit 140 may be implemented as a button, a touch pad, etc., or may be implemented as a separate device such as a remote control device. When the input unit 140 is implemented as a touch pad, it may be implemented in the form of a touch screen that is combined with the display unit 110 to form a mutual layer structure. The touch screen can detect the touch input location, area, and pressure of the touch input.

카메라(150)는 스틸 이미지 또는 동영상을 촬영할 수 있다. 예를 들어, 카메라(150)는 특정 촬영 영역을 항상 촬영할 수 있다. 촬영된 영상 프레임 간의 차이를 이용하여, 디스플레이 장치(100)는 촬영 영역에 변화가 발생하였다는 것을 감지할 수 있다. 예를 들어, 카메라(150)는 디스플레이 장치(100) 전방의 일정 영역을 촬영하고, 프로세서(120)는 촬영된 이미지로부터 사용자가 존재하는지 판단할 수 있다. 그리고, 프로세서(120)는 얼굴 인식 등을 통해 이미지에 포함된 사용자가 누구인지 판단할 수 있다.The camera 150 can capture still images or videos. For example, the camera 150 may always capture a specific capture area. Using the difference between captured image frames, the display device 100 can detect that a change has occurred in the captured image frame. For example, the camera 150 may capture a certain area in front of the display device 100, and the processor 120 may determine whether a user exists from the captured image. Additionally, the processor 120 may determine who the user included in the image is through facial recognition or the like.

카메라(150)는 CCD(Charge Coupled Device), CMOS(Complementary Metal Oxide Semiconductor) 등의 이미지 센서로 구현될 수 있다. CCD는 각각의 MOS(Metal-Oxide-Silicon) 커패시터가 서로 매우 근접한 위치에 있으면서 전하 캐리어가 커패시터에 저장되고 이송되는 소자이다. CMOS 이미지 센서는 제어회로(control circuit) 및 신호처리회로(signal processing circuit)를 주변회로로 사용하는 CMOS 기술을 이용하여 화소 수만큼 MOS 트랜지스터를 만들고 이것을 이용하여 차례차례 출력을 검출하는 스위칭 방식을 채용하는 소자이다.The camera 150 may be implemented with an image sensor such as a charge coupled device (CCD) or complementary metal oxide semiconductor (CMOS). A CCD is a device in which each MOS (Metal-Oxide-Silicon) capacitor is located very close to each other, and charge carriers are stored and transported in the capacitor. CMOS image sensors use CMOS technology that uses control circuits and signal processing circuits as peripheral circuits to create MOS transistors as many as the number of pixels and adopt a switching method that sequentially detects output using these. It is a device that does.

메모리(160)는 디스플레이 장치(100)를 구동하기 위한 다양한 모듈, 소프트웨어, 데이터를 저장할 수 있다. 예를 들어, 메모리(160)는 적어도 하나의 사용자에 대한 생체 정보, 시청 이력 정보, 선호도 정보 등을 저장할 수 있다.The memory 160 can store various modules, software, and data for driving the display device 100. For example, the memory 160 may store biometric information, viewing history information, preference information, etc. for at least one user.

메모리(160)는 플래시 메모리, 하드디스크 등의 형태로 구현 가능하다. 예를 들어, 메모리(160)는 디스플레이 장치(100)의 동작 수행을 위한 프로그램을 저장하기 위한 ROM, 디스플레이 장치(100)의 동작 수행에 따른 데이터를 일시적으로 저장하기 위한 RAM 등을 구비할 수 있다. 또한, 각종 참조 데이터를 저장하기 위한 EEPROM(Electrically Erasable and Programmable ROM) 등을 더 구비할 수 있다.The memory 160 can be implemented in the form of flash memory, hard disk, etc. For example, the memory 160 may include ROM for storing programs for performing operations of the display device 100, RAM for temporarily storing data according to operating operations of the display device 100, etc. . In addition, an Electrically Erasable and Programmable ROM (EEPROM) for storing various reference data may be further provided.

영상 수신부(170)는 다양한 소스를 통해 영상 컨텐츠 데이터를 수신한다. 예를 들어, 영상 수신부(170)는 외부의 방송국으로부터 방송 데이터를 수신할 수 있다. 다른 예로, 영상 수신부(170)는 외부 장치(ex. 셋탑박스, DVD 플레이어)로부터 영상 데이터를 수신하거나, 통신부(130)를 통해 외부 서버로부터 스트리밍된 영상 데이터를 수신할 수 있다.The video receiver 170 receives video content data through various sources. For example, the video receiver 170 may receive broadcast data from an external broadcasting station. As another example, the video receiver 170 may receive video data from an external device (e.g., set-top box, DVD player), or receive video data streamed from an external server through the communication unit 130.

영상 처리부(180)는 영상 수신부(170)로부터 수신한 영상 데이터에 대한 영상 처리를 수행한다. 영상 처리부(180)는 영상 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환과 같은 다양한 이미지 처리를 수행할 수 있다.The image processing unit 180 performs image processing on image data received from the image receiving unit 170. The image processing unit 180 may perform various image processing such as decoding, scaling, noise filtering, frame rate conversion, and resolution conversion on image data.

프로세서(120)는 디스플레이 장치(100)의 상술한 구성들을 제어할 수 있다. 예를 들어, 프로세서(120)는 서버(200)에 생성된 핑거프린트에 대응되는 컨텐츠 정보를 질의하도록 통신부(130)를 제어할 수 있다. 프로세서(120)는 단일 CPU로 구현될 수도 있고, 복수의 프로세서 및 특정 기능을 수행하는 IP로 구현될 수도 있다.The processor 120 can control the above-described configurations of the display device 100. For example, the processor 120 may control the communication unit 130 to query content information corresponding to the fingerprint generated in the server 200. The processor 120 may be implemented as a single CPU, or may be implemented as a plurality of processors and an IP that performs a specific function.

한편, 프로세서(120)는 기존의 범용 프로세서(예: CPU 또는 application processor)가 상술한 동작들을 수행할 수 있지만, 특정 동작들에 대하여는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩이 동작을 수행할 수 있다. Meanwhile, the processor 120 may be an existing general-purpose processor (e.g., CPU or application processor) to perform the above-described operations, but for specific operations, a dedicated hardware chip for artificial intelligence (AI) may perform the operations. It can be done.

이하에서는 도면을 참조하여 프로세서(120)의 동작을 더욱 구체적으로 설명하기로 한다.Hereinafter, the operation of the processor 120 will be described in more detail with reference to the drawings.

도 3은 본 개시의 일부 실시 예에 따른 프로세서(120)의 블록도이다. 도 3을 참조하면, 일부 실시 예에 따른 프로세서(120)는 데이터 학습부(121) 및 데이터 인식부(122)를 포함할 수 있다.Figure 3 is a block diagram of the processor 120 according to some embodiments of the present disclosure. Referring to FIG. 3, the processor 120 according to some embodiments may include a data learning unit 121 and a data recognition unit 122.

데이터 학습부(121)는 이미지 분석을 위한 기준을 학습할 수 있다. 프로세서(120)는 학습된 기준에 따라 각 영상 프레임에서 오브젝트를 인식할 수 있다. 데이터 학습부(121)는 이미지에 포함된 오브젝트를 인식하기 위하여 어떠한 데이터를 이용할 것인지 결정할 수 있다. 또한, 데이터 학습부(121)는 결정된 데이터를 이용하여 오브젝트를 인식하기 위한 기준을 학습할 수 있다. 데이터 학습부(121)는 학습에 이용될 데이터를 획득하고, 획득된 데이터를 후술할 데이터 인식 모델에 적용함으로써 이미지 분석을 위한 기준을 학습할 수 있다.The data learning unit 121 can learn standards for image analysis. The processor 120 may recognize an object in each image frame according to the learned criteria. The data learning unit 121 may determine what data to use to recognize objects included in the image. Additionally, the data learning unit 121 may learn a standard for recognizing an object using the determined data. The data learning unit 121 may learn standards for image analysis by acquiring data to be used for learning and applying the obtained data to a data recognition model to be described later.

데이터 인식부(122)는 학습된 데이터 인식 모델을 이용하여, 소정의 데이터로부터 상황을 인식할 수 있다. 데이터 인식부(122)는 학습에 의한 기설정된 기준에 따라 소정의 데이터를 획득하고, 획득된 데이터를 입력 값으로 하여 데이터 인식 모델을 이용할 수 있다. 예를 들어, 학습된 특징 추출 모델을 이용하여, 데이터 인식부(122)는 현재 표시되는 화면에서 오브젝트를 인식할 수 있다. 또한, 데이터 인식 모델 적용의 결과 값으로 획득된 데이터를 재차 입력 값으로 이용하여, 데이터 인식부(122)는 데이터 인식 모델을 갱신할 수도 있다.The data recognition unit 122 can recognize the situation from predetermined data using a learned data recognition model. The data recognition unit 122 may acquire predetermined data according to a preset standard through learning and use a data recognition model using the acquired data as an input value. For example, using the learned feature extraction model, the data recognition unit 122 can recognize an object on the currently displayed screen. Additionally, the data recognition unit 122 may update the data recognition model by using the data obtained as a result of applying the data recognition model again as an input value.

데이터 학습부(121) 및 데이터 인식부(122) 중 적어도 하나는, 하나 또는 복수의 하드웨어 칩 형태로 제작되어 디스플레이 장치(100)에 탑재될 수 있다. 예를 들어, 데이터 학습부(121) 및 데이터 인식부(122) 중 적어도 하나는 인공 지능(Artifical Intelligence, AI)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 기존의 범용 프로세서(예를 들어, CPU 또는 application processor) 또는 그래픽 전용 프로세서(예를 들어, GPU, ISP)의 일부로 제작되어 전술한 각종 디스플레이 장치(100)에 탑재될 수도 있다.At least one of the data learning unit 121 and the data recognition unit 122 may be manufactured in the form of one or more hardware chips and mounted on the display device 100. For example, at least one of the data learning unit 121 and the data recognition unit 122 may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or an existing general-purpose processor (e.g., It may be manufactured as part of a CPU or application processor) or a graphics processor (eg, GPU, ISP) and mounted on the various display devices 100 described above.

도 3의 실시 예에서는 데이터 학습부(121) 및 데이터 인식부(122)가 모두 디스플레이 장치(100)에 탑재된 경우를 도시하였으나, 이들은 각각 별개의 장치에 탑재될 수도 있다. 예를 들어, 데이터 학습부(121) 및 데이터 인식부(122) 중 하나는 디스플레이 장치(100)에 포함되고, 나머지 하나는 서버(200)에 포함될 수 있다. 또한 데이터 학습부(121) 및 데이터 인식부(122)는 서로 유선 또는 무선으로 연결되어, 데이터 학습부(121)가 구축한 모델 정보가 데이터 인식부(122)로 제공될 수 있고, 데이터 인식부(122)로 입력된 데이터가 추가 학습 데이터로 데이터 학습부(121)로 제공될 수도 있다.In the embodiment of FIG. 3, the data learning unit 121 and the data recognition unit 122 are both mounted on the display device 100, but they may be mounted on separate devices. For example, one of the data learning unit 121 and the data recognition unit 122 may be included in the display device 100, and the other may be included in the server 200. In addition, the data learning unit 121 and the data recognition unit 122 are connected to each other by wire or wirelessly, so that model information built by the data learning unit 121 can be provided to the data recognition unit 122, and the data recognition unit 122 The data input at 122 may be provided to the data learning unit 121 as additional learning data.

한편, 데이터 학습부(121) 및 데이터 인식부(122) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 학습부(121) 및 데이터 인식부(122) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 비일시적 컴퓨터 판독가능 기록매체에 저장될 수 있다. 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 어플리케이션에 의해 제공될 수 있다. 또는 적어도 하나의 소프트웨어 모듈 중 일부는 OS에 의해 제공되고, 나머지 일부는 소정의 어플리케이션에 의해 제공될 수도 있다.Meanwhile, at least one of the data learning unit 121 and the data recognition unit 122 may be implemented as a software module. When at least one of the data learning unit 121 and the data recognition unit 122 is implemented as a software module (or a program module including instructions), the software module may be stored in a non-transitory computer-readable recording medium. At least one software module may be provided by an operating system (OS) or a predetermined application. Alternatively, part of at least one software module may be provided by the OS, and the remaining part may be provided by a predetermined application.

도 4a는 본 개시의 일부 실시 예에 따른 데이터 학습부(121)의 블록도이다. 도 4a를 참조하면, 일부 실시 예에 따른 데이터 학습부(121)는 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5)를 포함할 수 있다.FIG. 4A is a block diagram of the data learning unit 121 according to some embodiments of the present disclosure. Referring to FIG. 4A, the data learning unit 121 according to some embodiments includes a data acquisition unit 121-1, a preprocessing unit 121-2, a learning data selection unit 121-3, and a model learning unit 121. -4) and a model evaluation unit 121-5.

데이터 획득부(121-1)는 상황 판단에 필요한 데이터를 획득할 수 있다. 예를 들어, 데이터 획득부(121-1)는 디스플레이부(110)에서 재생되는 화면을 캡쳐하여 이미지 프레임을 획득할 수 있다. 또한, 데이터 획득부(121-1)는 셋탑박스와 같은 외부 장치로부터 영상 데이터를 수신할 수 있다. 영상 데이터는 복수의 이미지 프레임들로 구성될 수 있다. 그리고, 데이터 획득부(121-1)는 서버(200) 또는 인터넷과 같은 네트워크에서 학습용 영상 데이터를 수신할 수도 있다.The data acquisition unit 121-1 may acquire data necessary for determining the situation. For example, the data acquisition unit 121-1 may acquire an image frame by capturing a screen played on the display unit 110. Additionally, the data acquisition unit 121-1 may receive image data from an external device such as a set-top box. Image data may consist of multiple image frames. Additionally, the data acquisition unit 121-1 may receive video data for learning from the server 200 or a network such as the Internet.

전처리부(121-2)는 상황 판단을 위한 학습에 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 전처리부(121-2)는 후술할 모델 학습부(121-4)가 상황 판단을 위한 학습을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기설정된 포맷으로 가공할 수 있다.The preprocessor 121-2 may preprocess the acquired data so that the acquired data can be used for learning to determine the situation. The pre-processing unit 121-2 may process the acquired data into a preset format so that the model learning unit 121-4, which will be described later, can use the acquired data for learning to determine the situation.

예를 들어, 전처리부(121-2)는 입력된 영상 데이터를 디코딩, 스케일링, 노이즈 필터링, 해상도 변환 등을 수행하여 동일한 포맷의 이미지 프레임을 만들 수 있다. 그리고 전처리부(121-2)는 입력된 이미지 프레임에서 배경 부분을 제거하여 오브젝트 인식에 적합한 이미지로 변환할 수도 있다.For example, the preprocessor 121-2 may create image frames of the same format by performing decoding, scaling, noise filtering, and resolution conversion on the input image data. Additionally, the preprocessor 121-2 may remove the background portion from the input image frame and convert it into an image suitable for object recognition.

학습 데이터 선택부(121-3)는 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 모델 학습부(121-4)에 제공될 수 있다. 학습 데이터 선택부(121-3)는 상황 판단을 위한 기설정된 기준에 따라, 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 또한, 학습 데이터 선택부(121-3)는 후술할 모델 학습부(121-4)에 의한 학습에 의해 기설정된 기준에 따라 데이터를 선택할 수도 있다.The learning data selection unit 121-3 may select data required for learning from preprocessed data. The selected data may be provided to the model learning unit 121-4. The learning data selection unit 121-3 may select data required for learning from preprocessed data according to preset standards for situation determination. Additionally, the learning data selection unit 121-3 may select data according to preset criteria through learning by the model learning unit 121-4, which will be described later.

예를 들어, 학습 초기에는 학습 데이터 선택부(121-3)가 전처리된 이미지 프레임들 중 유사도가 높은 이미지 프레임을 제거할 수 있다. 즉, 초기 학습을 위하여 학습 데이터 선택부(121-3)는 구분하기 쉬운 기준을 학습하도록 유사도가 낮은 데이터들을 선택할 수 있다.For example, at the beginning of learning, the learning data selection unit 121-3 may remove image frames with high similarity from preprocessed image frames. That is, for initial learning, the learning data selection unit 121-3 may select data with low similarity to learn a standard that is easy to distinguish.

그리고, 학습 데이터 선택부(121-3)는 학습에 의해 기설정된 기준 중 하나를 공통으로 만족하는 전처리된 이미지 프레임들을 선택할 수 있다. 이를 통해, 모델 학습부(121-4)는 이미 학습된 기준과는 상이한 다른 기준을 학습할 수 있다.Additionally, the learning data selection unit 121-3 may select preprocessed image frames that commonly satisfy one of the criteria preset by learning. Through this, the model learning unit 121-4 can learn a different standard from the already learned standard.

모델 학습부(121-4)는 학습 데이터에 기초하여 상황을 어떻게 판단할 지에 관한 기준을 학습할 수 있다. 또한, 모델 학습부(121-4)는 상황 판단을 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 기준을 학습할 수도 있다.The model learning unit 121-4 can learn standards for how to judge a situation based on learning data. Additionally, the model learning unit 121-4 may learn standards for what learning data should be used to determine the situation.

예를 들어, 모델 학습부(121-4)는 복수의 이미지 프레임들을 비교하여 이미지를 구분하는 물리적인 특징들을 학습할 수 있다. 이미지 프레임에서의 foreground와 background의 비율, 오브젝트의 크기, 위치, 배치 형태, 특징점 추출 등을 통하여 모델 학습부(121-4)는 이미지 분석 기준을 학습할 수 있다.For example, the model learning unit 121-4 may learn physical characteristics that distinguish images by comparing a plurality of image frames. The model learning unit 121-4 can learn image analysis standards through the ratio of foreground and background in the image frame, object size, location, arrangement type, feature point extraction, etc.

또한, 모델 학습부(121-4)는 상황 판단에 이용되는 데이터 인식 모델을 학습 데이터를 이용하여 학습시킬 수 있다. 이 경우, 데이터 인식 모델은 미리 구축된 모델일 수 있다. 예를 들어, 데이터 인식 모델은 기본 학습 데이터(예를 들어, 샘플 이미지 프레임 등)을 입력 받아 미리 구축된 모델일 수 있다.Additionally, the model learning unit 121-4 can train a data recognition model used for situation determination using learning data. In this case, the data recognition model may be a pre-built model. For example, a data recognition model may be a pre-built model that receives basic training data (for example, sample image frames, etc.) as input.

데이터 인식 모델은, 인식 모델의 적용 분야, 학습의 목적 또는 장치의 컴퓨터 성능 등을 고려하여 구축될 수 있다. 데이터 인식 모델은, 예를 들어, 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예컨대, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 데이터 인식 모델로서 사용될 수 있으나, 이에 한정되지 않는다.A data recognition model may be built considering the application field of the recognition model, the purpose of learning, or the computer performance of the device. The data recognition model may be, for example, a model based on a neural network. For example, models such as Deep Neural Network (DNN), Recurrent Neural Network (RNN), and Bidirectional Recurrent Deep Neural Network (BRDNN) may be used as data recognition models, but are not limited thereto.

또한, 전자 장치(100)는 상술한 바와 같은 동작을 수행하기 위하여 인공지능 에이전트(Artificial intelligence agent)를 이용할 수 있다. 이때, 인공지능 에이전트는 AI(Artificial Intelligence) 기반의 서비스(예를 들어, 음성 인식 서비스, 비서 서비스, 번역 서비스, 검색 서비스 등)를 제공하기 위한 전용 프로그램으로서, 기존의 범용 프로세서(예를 들어, CPU) 또는 별도의 AI 전용 프로세서(예를 들어, GPU 등)에 의해 실행될 수 있다. Additionally, the electronic device 100 may use an artificial intelligence agent to perform the operations described above. At this time, the artificial intelligence agent is a dedicated program to provide AI (Artificial Intelligence)-based services (e.g., voice recognition service, secretary service, translation service, search service, etc.), and is an existing general-purpose processor (e.g., It may be executed by a CPU) or a separate AI-specific processor (e.g., GPU, etc.).

다양한 실시 예에 따르면, 모델 학습부(121-4)는 미리 구축된 데이터 인식 모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 데이터 인식 모델을 학습할 데이터 인식 모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입별로 기분류되어 있을 수 있으며, 데이터 인식 모델은 데이터의 타입별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 오브젝트의 종류 등과 같은 다양한 기준으로 기분류되어 있을 수 있다. According to various embodiments, when there are a plurality of pre-built data recognition models, the model learning unit 121-4 selects a data recognition model with a high correlation between the input learning data and the basic learning data as a data recognition model to be learned. You can decide. In this case, the basic learning data may be classified by data type, and the data recognition model may be built in advance for each data type. For example, the basic training data is categorized by various criteria such as the region where the training data was created, the time the training data was created, the size of the training data, the genre of the training data, the creator of the training data, the type of object in the training data, etc. It may be.

또한, 모델 학습부(121-4)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 데이터 인식 모델을 학습시킬 수 있다.Additionally, the model learning unit 121-4 may train a data recognition model using, for example, a learning algorithm including error back-propagation or gradient descent. .

예를 들어, 모델 학습부(121-4)는 학습 데이터를 입력 값으로 하는 지도 학습(supervised learning) 을 통하여 데이터 인식 모델을 학습시킬 수 있다. 다른 예로, 모델 학습부(121-4)는 별도의 지도 없이 상황 판단을 위해 필요한 데이터의 종류를 스스로 학습함으로써 상황 판단을 위한 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 데이터 인식 모델을 학습시킬 수 있다. 또 다른 예로, 모델 학습부(121-4)는 학습에 따른 상황 판단의 결과가 올바른지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 데이터 인식 모델을 학습시킬 수 있다.For example, the model learning unit 121-4 can learn a data recognition model through supervised learning using training data as input. As another example, the model learning unit 121-4 creates a data recognition model through unsupervised learning, which discovers a standard for situation judgment by learning the type of data needed for situation judgment without separate guidance. It can be learned. As another example, the model learning unit 121-4 may learn a data recognition model through reinforcement learning that uses feedback on whether the result of situational judgment based on learning is correct.

또한, 데이터 인식 모델이 학습되면, 모델 학습부(121-4)는 학습된 데이터 인식 모델을 저장할 수 있다. 이 경우, 모델 학습부(121-4)는 학습된 데이터 인식 모델을 디스플레이 장치(100)의 메모리(160)에 저장할 수 있다. 또는, 모델 학습부(121-4)는 학습된 데이터 인식 모델을 전자 장치와 유선 또는 무선 네트워크로 연결되는 서버(200)의 메모리에 저장할 수도 있다.Additionally, when the data recognition model is learned, the model learning unit 121-4 may store the learned data recognition model. In this case, the model learning unit 121-4 may store the learned data recognition model in the memory 160 of the display device 100. Alternatively, the model learning unit 121-4 may store the learned data recognition model in the memory of the server 200 connected to the electronic device through a wired or wireless network.

이 경우, 학습된 데이터 인식 모델이 저장되는 메모리(160)는 디스플레이 장치(100)의 적어도 하나의 다른 구성요소에 관계된 명령 또는 데이터를 함께 저장할 수도 있다. 또한, 메모리(160)는 소프트웨어 및/또는 프로그램을 저장할 수도 있다. 예를 들어, 프로그램은 커널, 미들웨어, 어플리케이션 프로그래밍 인터페이스(API) 및/또는 어플리케이션 프로그램(또는 "어플리케이션") 등을 포함할 수 있다.In this case, the memory 160 where the learned data recognition model is stored may also store commands or data related to at least one other component of the display device 100. Additionally, memory 160 may store software and/or programs. For example, a program may include a kernel, middleware, an application programming interface (API), and/or an application program (or “application”), etc.

모델 평가부(121-5)는 데이터 인식 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 인식 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(121-4)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 데이터 인식 모델을 평가하기 위한 기설정된 데이터일 수 있다. The model evaluation unit 121-5 inputs evaluation data into the data recognition model, and, if the recognition result output from the evaluation data does not meet a predetermined standard, can cause the model learning unit 121-4 to learn again. there is. In this case, the evaluation data may be preset data for evaluating the data recognition model.

초기 인식 모델 구성 단계에서, 평가 데이터는 두 종류의 오브젝트에 대한 이미지 프레임일 수 있다. 이후에 평가 데이터는 오브젝트의 종류가 증가하는 이미지 프레임의 세트로 대체될 수 있다. 이를 통해 모델 평가부(121-5)는 데이터 인식 모델의 성능을 점차적으로 검증할 수 있다.In the initial recognition model construction stage, evaluation data may be image frames for two types of objects. The evaluation data can then be replaced by a set of image frames with increasing types of objects. Through this, the model evaluation unit 121-5 can gradually verify the performance of the data recognition model.

예를 들어, 모델 평가부(121-5)는 평가 데이터에 대한 학습된 데이터 인식 모델의 인식 결과 중에서, 인식 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다. 예컨대, 소정 기준이 비율 2%로 정의되는 경우, 학습된 데이터 인식 모델이 총 1000개의 평가 데이터 중의 20개를 초과하는 평가 데이터에 대하여 잘못된 인식 결과를 출력하는 경우, 모델 평가부(121-5)는 학습된 데이터 인식 모델이 적합하지 않은 것으로 평가할 수 있다.For example, the model evaluation unit 121-5 applies a predetermined criterion when the number or ratio of evaluation data for which the recognition result is inaccurate among the recognition results of the data recognition model learned for the evaluation data exceeds a preset threshold. It can be evaluated as unsatisfactory. For example, when the predetermined standard is defined as a ratio of 2%, and the learned data recognition model outputs incorrect recognition results for more than 20 evaluation data out of a total of 1000 evaluation data, the model evaluation unit 121-5 It can be evaluated that the learned data recognition model is not suitable.

한편, 학습된 데이터 인식 모델이 복수 개가 존재하는 경우, 모델 평가부(121-5)는 각각의 학습된 동영상 인식 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 데이터 인식 모델로서 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(121-5)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 데이터 인식 모델로서 결정할 수 있다.Meanwhile, when there are a plurality of learned data recognition models, the model evaluation unit 121-5 evaluates whether each learned video recognition model satisfies a predetermined standard, and recognizes the model that satisfies the predetermined standard as the final data. You can decide as a model. In this case, when there are multiple models that satisfy the predetermined criteria, the model evaluation unit 121-5 may determine one or a predetermined number of models preset in descending order of evaluation scores as the final data recognition model.

한편, 데이터 학습부(121) 내의 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예를 들어, CPU 또는 application processor) 또는 그래픽 전용 프로세서(예를 들어, GPU, ISP)의 일부로 제작되어 전술한 각종 디스플레이 장치(100)에 탑재될 수도 있다.Meanwhile, the data acquisition unit 121-1, pre-processing unit 121-2, learning data selection unit 121-3, model learning unit 121-4, and model evaluation unit 121 in the data learning unit 121. At least one of -5) may be manufactured in the form of at least one hardware chip and mounted on an electronic device. For example, at least one of the data acquisition unit 121-1, the pre-processing unit 121-2, the learning data selection unit 121-3, the model learning unit 121-4, and the model evaluation unit 121-5. One may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or an existing general-purpose processor (e.g., CPU or application processor) or a dedicated graphics processor (e.g., GPU, ISP). It may be manufactured as part of and mounted on the various display devices 100 described above.

또한, 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5) 중 일부는 디스플레이 장치(100)에 포함되고, 나머지 일부는 서버(200)에 포함될 수 있다.In addition, the data acquisition unit 121-1, the preprocessing unit 121-2, the learning data selection unit 121-3, the model learning unit 121-4, and the model evaluation unit 121-5 are one electronic unit. It may be mounted on a device, or it may be mounted on separate electronic devices. For example, some of the data acquisition unit 121-1, preprocessing unit 121-2, learning data selection unit 121-3, model learning unit 121-4, and model evaluation unit 121-5. may be included in the display device 100, and the remaining portion may be included in the server 200.

한편, 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(121-1), 전처리부(121-2), 학습 데이터 선택부(121-3), 모델 학습부(121-4) 및 모델 평가부(121-5) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 비일시적 컴퓨터 판독가능 기록매체에 저장될 수 있다. 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 어플리케이션에 의해 제공될 수 있다. 또는 적어도 하나의 소프트웨어 모듈 중 일부는 OS에 의해 제공되고, 나머지 일부는 소정의 어플리케이션에 의해 제공될 수도 있다.Meanwhile, at least one of the data acquisition unit 121-1, the pre-processing unit 121-2, the learning data selection unit 121-3, the model learning unit 121-4, and the model evaluation unit 121-5 It can be implemented as a software module. At least one of the data acquisition unit 121-1, the preprocessing unit 121-2, the learning data selection unit 121-3, the model learning unit 121-4, and the model evaluation unit 121-5 is a software module. When implemented as a program module (or a program module including instructions), the software module may be stored in a non-transitory computer-readable recording medium. At least one software module may be provided by an operating system (OS) or a predetermined application. Alternatively, part of at least one software module may be provided by the OS, and the remaining part may be provided by a predetermined application.

도 4b는 본 개시의 일부 실시 예에 따른 데이터 인식부(122)의 블록도이다. 도 4b를 참조하면, 일부 실시예에 따른 데이터 인식부(122)는 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5)를 포함할 수 있다FIG. 4B is a block diagram of the data recognition unit 122 according to some embodiments of the present disclosure. Referring to FIG. 4B, the data recognition unit 122 according to some embodiments includes a data acquisition unit 122-1, a preprocessing unit 122-2, a recognition data selection unit 122-3, and a recognition result providing unit ( 122-4) and a model update unit 122-5.

데이터 획득부(122-1)는 상황 판단에 필요한 데이터를 획득할 수 있으며, 전처리부(122-2)는 상황 판단을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 전처리부(122-2)는 후술할 인식 결과 제공부(122-4)가 상황 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기설정된 포맷으로 가공할 수 있다. The data acquisition unit 122-1 may acquire data necessary for determining the situation, and the preprocessing unit 122-2 may preprocess the acquired data so that the acquired data can be used for determining the situation. The pre-processing unit 122-2 may process the acquired data into a preset format so that the recognition result providing unit 122-4, which will be described later, can use the acquired data to determine the situation.

인식 데이터 선택부(122-3)는 전처리된 데이터 중에서 상황 판단에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(122-4)에게 제공될 수 있다. 인식 데이터 선택부(122-3)는 상황 판단을 위한 기설정된 기준에 따라, 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(122-3)는 후술할 모델 학습부(142-4)에 의한 학습에 의해 기설정된 기준에 따라 데이터를 선택할 수도 있다.The recognition data selection unit 122-3 may select data necessary for situation determination from preprocessed data. The selected data may be provided to the recognition result provider 122-4. The recognition data selection unit 122-3 may select some or all of the preprocessed data according to preset criteria for situation determination. Additionally, the recognition data selection unit 122-3 may select data according to preset criteria through learning by the model learning unit 142-4, which will be described later.

인식 결과 제공부(122-4)는 선택된 데이터를 데이터 인식 모델에 적용하여 상황을 판단할 수 있다. 인식 결과 제공부(122-4)는 데이터의 인식 목적에 따른 인식 결과를 제공할 수 있다. 인식 결과 제공부(122-4)는 인식 데이터 선택부(122-3)에 의해 선택된 데이터를 입력 값으로 이용함으로써, 선택된 데이터를 데이터 인식 모델에 적용할 수 있다. 또한, 인식 결과는 데이터 인식 모델에 의해 결정될 수 있다. 예를 들어, 데이터 인식 모델에서 결정된 기준에 따라, 인식 결과 제공부(122-4)는 선택된 이미지 프레임을 분석하여 오브젝트를 인식할 수 있다.The recognition result provider 122-4 may determine the situation by applying the selected data to the data recognition model. The recognition result providing unit 122-4 can provide recognition results according to the recognition purpose of the data. The recognition result providing unit 122-4 can apply the selected data to the data recognition model by using the data selected by the recognition data selection unit 122-3 as an input value. Additionally, the recognition result may be determined by a data recognition model. For example, according to the criteria determined in the data recognition model, the recognition result provider 122-4 may recognize the object by analyzing the selected image frame.

모델 갱신부(122-5)는 인식 결과 제공부(122-4)에 의해 제공되는 인식 결과에 대한 평가에 기초하여, 데이터 인식 모델이 갱신되도록 할 수 있다. 예를 들어, 모델 갱신부(122-5)는 인식 결과 제공부(122-4)에 의해 제공되는 인식 결과를 모델 학습부(121-4)에게 제공함으로써, 모델 학습부(121-4)가 데이터 인식 모델을 갱신하도록 할 수 있다.The model updating unit 122-5 may update the data recognition model based on the evaluation of the recognition result provided by the recognition result providing unit 122-4. For example, the model updating unit 122-5 provides the recognition result provided by the recognition result providing unit 122-4 to the model learning unit 121-4, so that the model learning unit 121-4 The data recognition model can be updated.

한편, 데이터 인식부(122) 내의 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 중 적어도 하나는, 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예를 들어, CPU 또는 application processor) 또는 그래픽 전용 프로세서(예를 들어, GPU, ISP)의 일부로 제작되어 전술한 각종 디스플레이 장치(100)에 탑재될 수도 있다.Meanwhile, the data acquisition unit 122-1, the pre-processing unit 122-2, the recognition data selection unit 122-3, the recognition result providing unit 122-4, and the model update unit in the data recognition unit 122 ( At least one of 122-5) may be manufactured in the form of at least one hardware chip and mounted on an electronic device. For example, among the data acquisition unit 122-1, pre-processing unit 122-2, recognition data selection unit 122-3, recognition result providing unit 122-4, and model update unit 122-5. At least one may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or an existing general-purpose processor (e.g., CPU or application processor) or graphics-specific processor (e.g., GPU, ISP). ) and may be mounted on the various display devices 100 described above.

또한, 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 중 일부는 디스플레이 장치(100)에 포함되고, 나머지 일부는 서버(200)에 포함될 수 있다.In addition, a data acquisition unit 122-1, a preprocessing unit 122-2, a recognition data selection unit 122-3, a recognition result providing unit 122-4, and a model updating unit 122-5 are integrated into one electronic unit. It may be mounted on a device, or it may be mounted on separate electronic devices. For example, among the data acquisition unit 122-1, pre-processing unit 122-2, recognition data selection unit 122-3, recognition result providing unit 122-4, and model update unit 122-5. Some may be included in the display device 100, and others may be included in the server 200.

한편, 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 중 적어도 하나는 소프트웨어 모듈로 구현될 수 있다. 데이터 획득부(122-1), 전처리부(122-2), 인식 데이터 선택부(122-3), 인식 결과 제공부(122-4) 및 모델 갱신부(122-5) 중 적어도 하나가 소프트웨어 모듈(또는, 인스트럭션을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 비일시적 컴퓨터 판독가능 기록매체에 저장될 수 있다. 적어도 하나의 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 어플리케이션에 의해 제공될 수 있다. 또는 적어도 하나의 소프트웨어 모듈 중 일부는 OS에 의해 제공되고, 나머지 일부는 소정의 어플리케이션에 의해 제공될 수도 있다.Meanwhile, at least one of the data acquisition unit 122-1, the pre-processing unit 122-2, the recognition data selection unit 122-3, the recognition result providing unit 122-4, and the model update unit 122-5. Can be implemented as a software module. At least one of the data acquisition unit 122-1, the preprocessing unit 122-2, the recognition data selection unit 122-3, the recognition result providing unit 122-4, and the model update unit 122-5 is software. When implemented as a module (or a program module including instructions), the software module may be stored in a non-transitory computer-readable recording medium. At least one software module may be provided by an operating system (OS) or a predetermined application. Alternatively, part of at least one software module may be provided by the OS, and the remaining part may be provided by a predetermined application.

도 5는 본 개시의 일 실시 예에 따른 디스플레이 시스템(1000)을 설명하기 위한 도면이다. 도 5를 참조하면, 디스플레이 시스템(1000)은 디스플레이 장치(100) 및 서버(200)로 구성될 수 있다. FIG. 5 is a diagram for explaining the display system 1000 according to an embodiment of the present disclosure. Referring to FIG. 5, the display system 1000 may be comprised of a display device 100 and a server 200.

이때, 전자 장치(100)는 범용 프로세서를 포함하고, 서버(200)는 인공지능 전용 프로세서를 포함할 수 있다. 또는, 전자 장치(100)는 적어도 하나의 어플리케이션을 포함할 수 있고, 서버(200)는 운영 체제(operating system)를 포함할 수 있다. 서버(200)는 전자 장치(100)보다 더 집적화되거나, 전용화되거나, 딜레이(delay)가 작거나, 성능이 우수하거나 또는 많은 리소스를 가진 구성 요소로서 인식 모델의 생성, 갱신 또는 적용 시에 요구되는 많은 연산을 전자 장치(100)보다 신속하고 효과적으로 처리 가능한 구성 요소가 될 수 있다. At this time, the electronic device 100 may include a general-purpose processor, and the server 200 may include an artificial intelligence-specific processor. Alternatively, the electronic device 100 may include at least one application, and the server 200 may include an operating system. The server 200 is a component that is more integrated, dedicated, has a smaller delay, has better performance, or has more resources than the electronic device 100, and is required when creating, updating, or applying a recognition model. It can be a component that can process many calculations more quickly and effectively than the electronic device 100.

이 경우, 전자 장치(100) 및 서버(200) 간에 데이터를 송/수신하기 위한 인터페이스가 정의될 수 있다. In this case, an interface for transmitting/receiving data between the electronic device 100 and the server 200 may be defined.

예로, 인식 모델에 적용할 학습 데이터를 인자 값(또는, 매개 값 또는 전달 값)으로 갖는 API(application program interface)가 정의될 수 있다. API는 어느 하나의 프로토콜(예로, 전자 장치(100)에서 정의된 프로토콜)에서 다른 프로토콜(예로, 서버(200)에서 정의된 프로토콜)의 어떤 처리를 위해 호출할 수 있는 서브 루틴 또는 함수의 집합으로 정의될 수 있다. 즉, API를 통하여 어느 하나의 프로토콜에서 다른 프로토콜의 동작이 수행될 수 있는 환경을 제공될 수 있다.For example, an API (application program interface) may be defined that has learning data to be applied to a recognition model as an argument value (or a parameter value or transfer value). An API is a set of subroutines or functions that can be called for certain processing in one protocol (e.g., a protocol defined in the electronic device 100) of another protocol (e.g., a protocol defined in the server 200). can be defined. In other words, an environment in which operations of another protocol can be performed in one protocol can be provided through the API.

도 5의 실시 예에서는 디스플레이 장치(100)가 서버(200)에 질의하고, 서버(200)로부터 응답을 수신할 수 있다. 예를 들어, 디스플레이 장치(100)는 서버(200)에 핑거프린트가 포함된 질의를 전송하고, 서버(200)로부터 컨텐츠 정보를 포함한 응답을 수신할 수 있다. 컨텐츠 정보는 전체 컨텐츠에서 현재 프레임의 위치, 재생 시간, 컨텐츠 명칭, 컨텐츠 ID, 현재 프레임에 나타나는 출연자, 현재 프레임에 포함된 상품, 컨텐츠 장르, 시리즈 정보 중 적어도 하나를 포함할 수 있다.In the embodiment of FIG. 5, the display device 100 may query the server 200 and receive a response from the server 200. For example, the display device 100 may transmit a query including a fingerprint to the server 200 and receive a response including content information from the server 200. Content information may include at least one of the location of the current frame in the entire content, playback time, content name, content ID, performer appearing in the current frame, product included in the current frame, content genre, and series information.

다른 예로, 디스플레이 장치(100)는 현재 프레임이 포함된 질의를 서버(200)로 전송하고, 서버(200)로부터 현재 프레임에 포함된 오브젝트 인식 결과를 포함한 응답을 수신할 수도 있다.As another example, the display device 100 may transmit a query including the current frame to the server 200 and receive a response including a result of object recognition included in the current frame from the server 200.

디스플레이 장치(100) 자체에서 ACR 및 오브젝트 인식을 모두 수행할 수도 있으나, 서버(200)에서 ACR 및 오브젝트 인식을 수행할 수도 있다. 이하에서는 서버(200)에서 ACR 및 오브젝트 인식을 수행하는 실시 예를 중심으로 설명하나, 디스플레이 장치(100) 단독으로 동작할 수도 있음은 물론이다.Both ACR and object recognition may be performed in the display device 100 itself, but ACR and object recognition may also be performed in the server 200. Hereinafter, the description will focus on an embodiment in which ACR and object recognition are performed in the server 200, but of course, the display device 100 may operate alone.

도 6은 ACR 과정을 설명하기 위한 도면이다. 도 6의 실시 예에서 디스플레이 장치(100)는 주기적으로 표시된 화면의 특징을 추출하여 핑거프린트를 생성할 수 있다. 그리고 디스플레이 장치(100)는 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버(200)에 질의할 수 있다. 서버(200)는 실시간 방송에 대한 ACR 및 VOD에 대한 ACR을 각각 수행할 수 있다.Figure 6 is a diagram for explaining the ACR process. In the embodiment of FIG. 6, the display device 100 may generate a fingerprint by periodically extracting features of the displayed screen. And the display device 100 may query the server 200 for content information corresponding to the generated fingerprint. The server 200 can perform ACR for real-time broadcasting and ACR for VOD, respectively.

핑거프린트는 프레임에 포함된 비디오, 오디오 신호로부터 추출된 특징 데이터이다. 텍스트를 기반으로 한 메타 데이터와는 달리, 핑거프린트는 신호 자체의 고유한 특성을 반영할 수 있다. 예를 들어, 프레임에 포함된 신호가 오디오 신호인 경우, 핑거프린트는 오디오 신호의 주파수, 진폭 등의 특징을 표현하는 데이터일 수 있다. 그리고, 프레임에 포함된 신호가 비디오(또는 스틸 이미지) 신호인 경우, 핑거프린트는 모션 벡터, 색상 등의 특징을 표현하는 데이터일 수 있다.A fingerprint is feature data extracted from video and audio signals included in a frame. Unlike text-based metadata, fingerprints can reflect the unique characteristics of the signal itself. For example, if the signal included in the frame is an audio signal, the fingerprint may be data expressing characteristics such as frequency and amplitude of the audio signal. Additionally, if the signal included in the frame is a video (or still image) signal, the fingerprint may be data expressing characteristics such as a motion vector and color.

도 6에서 서버(200)는 복수의 장치로 구성되도록 도시되었으나, 단일 서버(200)에서 모든 동작을 수행할 수도 있다. 도 6을 참조하면, 서버(200)는 캡쳐 서버(210), 라이브 인덱싱 서버(220), 라이브 데이터 서버(230), 메타 데이터 서버(240), VOD 저장부(250), VOD 인덱서(260), VOD 데이터 서버(270), 검색 서버(280)로 구성될 수 있다.In FIG. 6, the server 200 is shown to be composed of a plurality of devices, but all operations may be performed by a single server 200. Referring to FIG. 6, the server 200 includes a capture server 210, a live indexing server 220, a live data server 230, a metadata server 240, a VOD storage unit 250, and a VOD indexer 260. , VOD data server 270, and search server 280.

우선 실시간 방송 ACR의 경우, 캡쳐 서버(210)는 방송 신호로부터 각각의 영상 프레임을 추출할 수 있다. 그리고 캡쳐 서버(210)는 추출된 프레임을 분석하여 핑거프린트를 생성할 수 있다. 실시간 방송의 경우 수 초 정도의 영상 정보를 캡쳐 서버(210)가 디스플레이 장치(100)보다 먼저 수신할 수 있다. 캡쳐 서버(210)는 메타 데이터 서버(240)로부터 채널과 방송 시간이 포함된 EPG(Electronic Program Guide) 데이터를 수신할 수 있다. 캡쳐 서버(210)는 EPG 데이터를 이용하여 현재 수신된 방송 신호의 컨텐츠 및 현재 프레임의 전체 컨텐츠에서의 위치를 판단할 수 있다.First, in the case of real-time broadcast ACR, the capture server 210 can extract each video frame from the broadcast signal. And the capture server 210 can generate a fingerprint by analyzing the extracted frame. In the case of real-time broadcasting, the capture server 210 may receive several seconds of video information before the display device 100. The capture server 210 may receive Electronic Program Guide (EPG) data including a channel and broadcast time from the metadata server 240. The capture server 210 can use the EPG data to determine the content of the currently received broadcast signal and the position of the current frame in the overall content.

라이브 인덱싱 서버(220)는 캡쳐 서버(210)로부터 수신한 핑거프린트 데이터 및 컨텐츠 정보를 복수의 라이브 데이터 서버(230)에 분산하여 저장할 수 있다. 예를 들어, 라이브 인덱싱 서버(220)는 방송 채널별, 컨텐츠별로 복수의 라이브 데이터 서버(230) 중 하나로 전송할 수 있다.The live indexing server 220 may distribute and store the fingerprint data and content information received from the capture server 210 across a plurality of live data servers 230. For example, the live indexing server 220 may transmit data to one of a plurality of live data servers 230 for each broadcast channel or content.

검색 서버(280)는 실시간 방송에 대한 질의에 대응하여 라이브 데이터 서버(230)에서 질의에 포함된 핑거프린트와 대응되는 핑거프린트를 검색할 수 있다. 그리고, 검색 서버(280)는 검색된 핑거프린트에 대응되는 컨텐츠 정보를 디스플레이 장치(100)로 전송할 수 있다.The search server 280 may search the live data server 230 for a fingerprint corresponding to the fingerprint included in the query in response to a query about real-time broadcasting. And, the search server 280 may transmit content information corresponding to the searched fingerprint to the display device 100.

다음으로 VOD ACR의 경우, 서비스로 제공할 VOD는 VOD 저장부(250)에 저장될 수 있다. VOD의 경우 서버(200)가 미리 모든 영상 프레임에 대한 정보를 가지고 있을 수 있다는 점이 실시간 방송과의 차이점이다. 서버(200)는 VOD 저장부(250)에 저장된 각각의 VOD에 대한 핑거프린트를 생성할 수 있다. 그리고 VOD 인덱서(260)는 메타 데이터 서버(270)로부터 수신한 해당 VOD의 메타 데이터와 핑거프린트를 매칭하여 복수의 VOD 데이터 서버(270)에 분산하여 저장할 수 있다. VOD의 메타 데이터는 프로그램 또는 컨텐츠의 제목, 장르, 감독, 작가, 등장 인물, 재생 시간 등을 포함할 수 있다.Next, in the case of VOD ACR, the VOD to be provided as a service may be stored in the VOD storage unit 250. In the case of VOD, the difference from real-time broadcasting is that the server 200 may have information about all video frames in advance. The server 200 may generate a fingerprint for each VOD stored in the VOD storage unit 250. In addition, the VOD indexer 260 can match the metadata and fingerprint of the corresponding VOD received from the metadata server 270 and store them in a distributed manner across a plurality of VOD data servers 270. VOD metadata may include the title, genre, director, writer, characters, playback time, etc. of the program or content.

검색 서버(280)는 VOD에 대한 질의에 대응하여 VOD 데이터 서버(270)에서 대응되는 핑거프린트를 검색할 수 있다. 그리고, 검색 서버(280)는 검색된 핑거프린트에 대응되는 컨텐츠 정보를 디스플레이 장치(100)로 전송할 수 있다.The search server 280 may search for a corresponding fingerprint in the VOD data server 270 in response to a query about VOD. And, the search server 280 may transmit content information corresponding to the searched fingerprint to the display device 100.

이와 같이 디스플레이 장치(100)는 서버(200)에 핑거프린트를 송신하여 대응되는 컨텐츠 정보를 요청할 수 있다. 서버(200)는 요청된 컨텐츠가 실시간 방송인지 VOD인지에 따라 라이브 데이터 서버(230) 또는 VOD 데이터 서버(270)에서 대응되는 핑거프린트를 검색할 수 있다. 그리고, 서버(200)는 검색된 핑거프린트에 대응되는 컨텐츠 정보를 디스플레이 장치(100)로 전송할 수 있다.In this way, the display device 100 can request corresponding content information by transmitting a fingerprint to the server 200. The server 200 may search for a corresponding fingerprint from the live data server 230 or the VOD data server 270 depending on whether the requested content is real-time broadcasting or VOD. Additionally, the server 200 may transmit content information corresponding to the searched fingerprint to the display device 100.

도 7은 오브젝트 인식 과정을 설명하기 위한 도면이다. 디스플레이 장치(100)는 서버(200)로부터 컨텐츠 정보를 수신하여, 현재 프레임이 어느 컨텐츠의 몇번째 프레임인지 알 수 있다. 그리고, 디스플레이 장치(100)는 오브젝트 인식 서버(290)로 현재 영상 프레임 데이터를 송신할 수 있다. 오브젝트 인식 서버(290)는 수신된 영상 프레임에서 오브젝트를 인식할 수 있다. 도 7에서는 ACR 기능을 제공하는 서버(200)와 오브젝트 인식 서버(290)가 별도의 장치로 도시되었으나, 동일한 서버 장치에서 ACR 및 오브젝트 인식이 수행될 수도 있다. 또한, 상술한 바와 같이 디스플레이 장치(100)에서 오브젝트 인식이 수행되는 실시 예로 구현될 수도 있다.Figure 7 is a diagram for explaining the object recognition process. The display device 100 can receive content information from the server 200 and know which frame of which content the current frame is. Additionally, the display device 100 may transmit the current image frame data to the object recognition server 290. The object recognition server 290 can recognize an object in a received video frame. In FIG. 7, the server 200 providing the ACR function and the object recognition server 290 are shown as separate devices, but ACR and object recognition may be performed in the same server device. Additionally, as described above, it may be implemented in an embodiment in which object recognition is performed in the display device 100.

도 8a 및 도 8b를 참조하여 오브젝트를 인식하는 방법을 보다 구체적으로 설명하기로 한다. 디스플레이 장치(100) 또는 오브젝트 인식 서버(290)는 표시된 화면에서 상품에 해당하는 오브젝트를 인식할 수 있다. 이하에서는 설명의 편의를 위하여 디스플레이 장치(100)가 오브젝트 인식 동작을 하는 것으로 설명하기로 한다.A method for recognizing an object will be described in more detail with reference to FIGS. 8A and 8B. The display device 100 or the object recognition server 290 may recognize objects corresponding to products on the displayed screen. Hereinafter, for convenience of explanation, it will be described that the display device 100 performs an object recognition operation.

디스플레이 장치(100)는 상품뿐만 아니라 인물에 해당하는 오브젝트를 인식할 수도 있다. 하지만, 컨텐츠 정보로부터 현재 화면에 등장하는 인물 정보를 알 수 있기 때문에, 디스플레이 장치(100)는 표시된 화면에서 주로 상품에 해당하는 오브젝트를 인식하도록 구현될 수 있다.The display device 100 may recognize objects corresponding to people as well as products. However, since information on people currently appearing on the screen can be known from content information, the display device 100 can be implemented to recognize objects that mainly correspond to products on the displayed screen.

도 8a는 특징점을 추출하여 오브젝트를 인식하는 방법을 설명하기 위한 도면이다. 디스플레이 장치(100)는 표시된 화면에서 특징점을 추출하여 기저장된 상품 이미지들과 매칭할 수 있다. 매칭 결과에 따라 디스플레이 장치(100)는 오브젝트가 어떤 상품에 해당하지 판단할 수 있다.Figure 8a is a diagram for explaining a method of recognizing an object by extracting feature points. The display device 100 may extract feature points from the displayed screen and match them with pre-stored product images. According to the matching result, the display device 100 may determine which product the object corresponds to.

예를 들어, 디스플레이 장치(100)는 영상으로부터 크기와 회전에 불변하는 특징점을 추출할 수 있다. 주로 오브젝트의 외곽 부분, 글자나 형상이 있는 모양 등이 특징점으로 추출될 수 있다. 다른 예로, 디스플레이 장치(100)는 여러 개의 영상 프레임으로부터 스케일, 조명, 시점 등의 환경 변화에 불변하는 특징점을 추출할 수 있다.For example, the display device 100 may extract feature points that are invariant to size and rotation from an image. Mainly, the outer part of the object, letters or shapes, etc. can be extracted as feature points. As another example, the display device 100 may extract feature points that are invariant to environmental changes such as scale, lighting, and viewpoint from multiple image frames.

도 8b는 학습을 통해 오브젝트를 인식하는 방법을 설명하기 위한 도면이다. 디스플레이 장치(100)는 인공지능을 이용한 학습을 통하여 화면에 표시된 상품을 인식할 수 있다. 디스플레이 장치(100)는 지도 학습 또는 비지도 학습 방법을 통해 오브젝트를 구분할 수 있는 기준을 학습할 수 있다.Figure 8b is a diagram for explaining a method of recognizing an object through learning. The display device 100 can recognize products displayed on the screen through learning using artificial intelligence. The display device 100 can learn criteria for distinguishing objects through supervised learning or unsupervised learning methods.

예를 들어, 디스플레이 장치(100)는 복수의 이미지 프레임들을 비교하여 이미지를 구분하는 물리적인 특징들을 학습할 수 있다. 이미지 프레임에서의 foreground와 background의 비율, 오브젝트의 크기, 위치, 배치 형태 등을 통하여 디스플레이 장치(100)는 이미지 분석 기준을 학습할 수 있다.For example, the display device 100 may learn physical characteristics that distinguish images by comparing a plurality of image frames. The display device 100 can learn image analysis standards through the ratio of the foreground and background in the image frame, the size, location, and arrangement type of the object.

그리고, 디스플레이 장치(100)는 학습된 이미지 분석 기준을 기초로 화면에 표시된 오브젝트를 인식할 수 있다.Additionally, the display device 100 may recognize objects displayed on the screen based on learned image analysis standards.

도 9는 오브젝트 클러스터링을 설명하기 위한 도면이다. 도 8a 및 도 8b에 각각 도시된 방법에 의하여, 디스플레이 장치(100)는 상품에 해당하는 오브젝트를 인식할 수 있다. 디스플레이 장치(100)는 인식된 상품 1 및 상품 2를 인물과 클러스터링할 수 있다. 그리고, 디스플레이 장치(100)는 클러스터링된 오브젝트를 각각의 영상 프레임과 매칭하여 저장할 수 있다.Figure 9 is a diagram for explaining object clustering. By the method shown in FIGS. 8A and 8B, the display device 100 can recognize an object corresponding to a product. The display device 100 may cluster recognized product 1 and product 2 with a person. Also, the display device 100 can store the clustered objects by matching them with each image frame.

디스플레이 장치(100)는 ACR 과정에서 획득한 컨텐츠의 메타 데이터를 기초로 표시된 화면에서 인물에 해당하는 오브젝트를 인식할 수 있다. 메타 데이터에는 각각의 프레임에 등장하는 인물 정보가 포함될 수 있다. 예를 들어, 디스플레이 장치(100)는 표시되는 컨텐츠의 주인공 위주로 클러스터링을 진행할 수 있다. 디스플레이 장치(100)의 사용자들이 주로 관심을 보이는 상품은 주인공들이 사용하는 상품이기 때문이다.The display device 100 may recognize objects corresponding to people on the displayed screen based on metadata of content acquired during the ACR process. Metadata may include information about people appearing in each frame. For example, the display device 100 may perform clustering focusing on the main character of the displayed content. This is because the products that users of the display device 100 are mainly interested in are products used by the main characters.

도 9의 상부 도면은 디스플레이 장치(100)가 3명의 인물과 2개의 상품을 인식한 것을 도시한 도면이다. 그리고, 도 9의 하부 도면은 디스플레이 장치(100)가 오브젝트 클러스터링을 수행한 결과를 도시한 도면이다.The upper diagram of FIG. 9 is a diagram showing that the display device 100 recognizes three people and two products. And, the lower diagram of FIG. 9 is a diagram showing the result of the display device 100 performing object clustering.

우선 디스플레이 장치(100)는 메타 데이터를 이용하여 인식된 3명의 인물 중 주요 인물이 아닌 가운데 인물을 필터링할 수 있다. 그리고, 디스플레이 장치(100)는 표시된 화면에서의 위치를 기초로, 인식된 인물과 상품 사이의 관련성 존부를 판단할 수 있다. 만일 관련성이 있는 것으로 판단되면, 디스플레이 장치(100)는 인식된 인물과 상품을 클러스터링할 수 있다. 반대로 관련성이 없는 것으로 판단되면, 디스플레이 장치(100)는 상품을 필터링할 수 있다.First, the display device 100 can use metadata to filter out the middle person among the three recognized people who are not the main person. Additionally, the display device 100 may determine whether there is a relationship between the recognized person and the product based on the location on the displayed screen. If determined to be related, the display device 100 may cluster the recognized people and products. Conversely, if it is determined to be irrelevant, the display device 100 may filter the product.

도 9에서, 디스플레이 장치(100)는 화면에서의 위치를 기초로 인식된 2개의 상품이 각각 좌측, 우측의 인물과 관련되어 있는 것으로 판단할 수 있다. 메타 데이터로부터 좌측 및 우측의 인물이 누구인지 알 수 있기 때문에, 디스플레이 장치(100)는 인물명으로 대표되도록 상품과 인물 오브젝트를 클러스트링할 수 있다.In FIG. 9, the display device 100 may determine that the two products recognized based on their positions on the screen are related to the people on the left and right, respectively. Since it is possible to know who the left and right people are from metadata, the display device 100 can cluster products and person objects so that they are represented by the person's name.

이를 통해, 디스플레이 장치(100)는 남자 주인공이 착용한 가방, 여자 주인공이 착용한 가방과 같이 사용자가 관심있는 정보를 중심으로 인식된 오브젝트들을 정리할 수 있다.Through this, the display device 100 can organize recognized objects centered on information of interest to the user, such as the bag worn by the male protagonist and the bag worn by the female protagonist.

실시간 방송의 경우에 상술한 오브젝트 인식 및 클러스터링 과정이 실시간으로 이루어지게 된다. VOD의 경우에는 미리 각각의 프레임에 대한 오브젝트 인식 및 클러스터링 과정이 완료되어, 클러스터링된 오브젝트 정보가 데이터 베이스로 구축될 수 있다.In the case of real-time broadcasting, the above-described object recognition and clustering processes are performed in real time. In the case of VOD, the object recognition and clustering process for each frame is completed in advance, and the clustered object information can be built into a database.

본 개시의 일 실시 예에 따르면, 디스플레이 장치(100)는 현재 디스플레이 장치(100)를 사용하는 사용자가 누구인지 판단할 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자의 생체 정보를 수집할 수 있다. 그리고, 디스플레이 장치(100)는 수집된 생체 정보를 기저장된 생체 정보와 비교하여 사용자가 누구인지 판단할 수 있다. 구체적으로, 디스플레이 장치(100)는 리모컨을 통해 사용자의 지문을 인식할 수도 있고, 카메라를 이용하여 사용자의 홍채를 인식할 수도 있다.According to an embodiment of the present disclosure, the display device 100 may determine who the user currently using the display device 100 is. For example, the display device 100 may collect the user's biometric information. Additionally, the display device 100 may determine who the user is by comparing the collected biometric information with previously stored biometric information. Specifically, the display device 100 may recognize the user's fingerprint using a remote control or recognize the user's iris using a camera.

다른 예로, 디스플레이 장치(100)는 주로 사용자가 위치하는 디스플레이 장치(100) 전방의 일정 영역을 카메라로 촬영할 수 있다. 그리고 디스플레이 장치(100)는 촬영된 이미지에 포함된 사용자를 현재 디스플레이 장치의 사용자로 판단할 수도 있다.As another example, the display device 100 may capture a certain area in front of the display device 100, where the user is mainly located, with a camera. Additionally, the display device 100 may determine that the user included in the captured image is the current user of the display device.

디스플레이 장치(100)는 각각의 사용자들의 로그 정보, 연관 정보 클릭 여부, 성별 정보, 연령 정보, 장르 선호도 정보 등을 수집하여 저장할 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자가 직접 입력한 정보, 디스플레이 장치(100)의 사용 이력으로부터 수집된 정보를 저장할 수 있다. 다른 예로, 디스플레이 장치(100)는 IoT 장치들과 통신하여 IoT 장치들이 사용자를 추적하며 수집한 정보들을 저장할 수도 있다.The display device 100 may collect and store log information, whether relevant information is clicked, gender information, age information, genre preference information, etc., of each user. For example, the display device 100 may store information directly input by the user and information collected from the usage history of the display device 100. As another example, the display device 100 may communicate with IoT devices and store information collected by the IoT devices while tracking the user.

디스플레이 장치(100)는 판단된 사용자의 정보를 이용하여, 클러스터링된 오브젝트들 중 하나의 오브젝트를 선택할 수 있다. 그리고, 디스플레이 장치(100)는 선택된 오브젝트와 관련된 서비스를 제공할 수 있다.The display device 100 may select one object from among the clustered objects using the determined user information. Additionally, the display device 100 may provide services related to the selected object.

예를 들어, 디스플레이 장치(100)는 판단된 사용자의 성별 및 연령 정보를 이용하여, 동일한 성별과 비슷한 연령에 해당하는 등장 인물로 클러스터링된 오브젝트를 선택할 수 있다. 판단된 사용자가 여성일 경우, 디스플레이 장치(100)는 도 9의 여자 주인공이 착용한 가방을 선택할 수 있다. 그리고 디스플레이 장치(100)는 여자 주인공이 착용한 가방을 구입할 수 있는 쇼핑 어플리케이션 실행 서비스를 제공할 수 있다. For example, the display device 100 may use the determined user's gender and age information to select objects clustered with characters of the same gender and similar age. If the determined user is a woman, the display device 100 may select the bag worn by the female protagonist in FIG. 9 . Additionally, the display device 100 can provide a shopping application execution service that allows purchasing the bag worn by the female protagonist.

단일 사용자가 판단된 경우에는 판단된 사용자에게 적합한 서비스를 제공하는 것으로 족하나, 복수의 사용자가 판단된 경우에는 그 중 어느 사용자에게 더 적합한 서비스를 제공할 것인지를 결정하여야 한다. 예를 들어, 카메라를 통해 2명의 사용자가 디스플레이 장치(100)에서 재생되는 컨텐츠를 시청하고 있는 것으로 판단된 경우, 디스플레이 장치(100)는 2명 중 어느 사용자에게 더 적합한 서비스가 제공되어야 할 것인지를 결정하여야 한다.When a single user is determined, it is sufficient to provide a service suitable for the user. However, when multiple users are determined, it must be decided which of the users to provide a more suitable service to. For example, if it is determined through the camera that two users are watching content played on the display device 100, the display device 100 determines which of the two users a more appropriate service should be provided to. Must decide.

디스플레이 장치(100)는 복수의 사용자 정보를 저장할 수 있다. 도 10을 참조하면, 디스플레이 장치(100)는 제1 사용자(1010)의 정보 및 제2 사용자(1020)의 정보를 수집하여 저장할 수 있다. 디스플레이 장치(100)는 현재 화면에서 인식된 클러스터링된 오브젝트들에 대한 선호도 순위를 결정할 수 있다. 예를 들어, 디스플레이 장치(100)는 클러스터링된 상품들 중 판매량이 많은 순서대로 선호도 순위를 결정할 수 있다.The display device 100 can store a plurality of user information. Referring to FIG. 10 , the display device 100 may collect and store information about the first user 1010 and information about the second user 1020 . The display device 100 may determine a preference ranking for clustered objects recognized on the current screen. For example, the display device 100 may determine a preference ranking in order of sales volume among clustered products.

그리고, 디스플레이 장치(100)는 가장 선호도 순위가 높은 오브젝트에 대한 복수의 사용자들의 선호도를 판단할 수 있다. 예를 들어, 디스플레이 장치(100)는 선호도가 가장 높은 것으로 판단된 여자 주인공의 가방에 대한 제1 사용자(1010) 및 제2 사용자(1020)의 선호도를 판단할 수 있다. 저장된 복수의 사용자 정보를 기초로, 디스플레이 장치(100)는 여자 주인공의 가방에 대한 제1 사용자(1010)의 선호도가 제2 사용자(1020)의 선호도보다 높음을 판단할 수 있다. 디스플레이 장치(100)는 현재 화면(현재 프레임)에 대해 디스플레이 장치(100)의 사용자를 제1 사용자(1010)로 결정할 수 있다. 그리고, 디스플레이 장치(100)는 결정된 제1 사용자에게 여자 주인공의 가방과 관련된 서비스를 제공할 수 있다.Additionally, the display device 100 may determine the preferences of a plurality of users for the object with the highest preference ranking. For example, the display device 100 may determine the preferences of the first user 1010 and the second user 1020 for the bag of the female protagonist determined to have the highest preference. Based on the stored plurality of user information, the display device 100 may determine that the first user 1010's preference for the female protagonist's bag is higher than the second user's 1020 preference. The display device 100 may determine the user of the display device 100 as the first user 1010 for the current screen (current frame). Additionally, the display device 100 may provide a service related to the female protagonist's bag to the determined first user.

이와 같이 복수의 사용자가 디스플레이 장치(100)를 사용하는 경우에도, 디스플레이 장치(100)는 서비스를 제공할 더욱 적합한 사용자를 결정할 수 있다. 또한, 디스플레이 장치(100)는 화면이 변경될 때마다 복수의 사용자 중 하나를 선정할 수 있다. 즉, 제1 사용자(1010)에게 적합한 서비스를 제공하다가도, 제2 사용자(1020)가 선호하는 상품이 포함된 화면이 표시되면 디스플레이 장치(100)는 제2 사용자(1020)에게 적합한 서비스를 제공할 수 있다.In this way, even when multiple users use the display device 100, the display device 100 can determine a more suitable user to provide the service to. Additionally, the display device 100 can select one of a plurality of users each time the screen changes. That is, even while providing a suitable service to the first user 1010, if a screen containing a product preferred by the second user 1020 is displayed, the display device 100 may not provide a suitable service to the second user 1020. You can.

상술한 바와 같은 본 개시의 다양한 실시 예에 따르면, 디스플레이 장치(100)는 디스플레이 장치(100)의 사용자를 판단하고, 판단된 사용자에게 개인화된 ACR 기반 서비스를 제공할 수 있다.According to various embodiments of the present disclosure as described above, the display device 100 may determine the user of the display device 100 and provide a personalized ACR-based service to the determined user.

도 11은 본 개시의 일 실시 예에 따른 디스플레이 장치(100)의 서비스 제공 방법을 설명하기 위한 흐름도이다. 도 11을 참조하면, 디스플레이 장치(100)는 재생중인 컨텐츠를 인식할 수 있다(S1110). 예를 들어, 디스플레이 장치(100)는 현재 표시되는 화면의 특징을 추출한 핑거프린트를 서버(200)로 전송하여 현재 화면의 컨텐츠 정보를 문의하는 서버 ACR 방식을 통해 컨텐츠를 인식할 수 있다.FIG. 11 is a flowchart illustrating a method of providing a service by the display device 100 according to an embodiment of the present disclosure. Referring to FIG. 11, the display device 100 can recognize content being played (S1110). For example, the display device 100 may recognize content through a server ACR method that transmits a fingerprint extracted from the characteristics of the currently displayed screen to the server 200 and inquires about content information on the current screen.

그리고 디스플레이 장치(100)는 컨텐츠의 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식할 수 있다(S1120). 예를 들어, 디스플레이 장치(100)는 특징점 추출 알고리즘을 이용하여 오브젝트를 인식할 수 있다. 다른 예로, 디스플레이 장치(100)는 인공지능을 이용하여 이미지 분석 기준을 학습할 수 있다. 그리고 학습된 기준을 이용하여 디스플레이 장치(100)는 표시된 화면에서 오브젝트를 인식할 수 있다.And the display device 100 may recognize at least one object on the currently displayed screen of content (S1120). For example, the display device 100 may recognize an object using a feature point extraction algorithm. As another example, the display device 100 may learn image analysis standards using artificial intelligence. And using the learned standard, the display device 100 can recognize an object on the displayed screen.

디스플레이 장치(100)는 현재 디스플레이 장치(100)를 사용하는 사용자를 판단할 수 있다(S1130). 판단된 사용자의 선호도 정보 등을 이용하여 디스플레이 장치(100)는 개인화된 ACR 기반 서비스를 제공할 수 있다. 예를 들어, 디스플레이 장치(100)는 지문과 같은 사용자의 생체 정보를 수집하여 사용자가 누구인지 판단할 수 있다. 다른 예로, 디스플레이 장치(100)는 얼굴 인식 알고리즘을 이용하여, 카메라로 촬영된 이미지에서 사용자를 추출할 수도 있다.The display device 100 may determine the user currently using the display device 100 (S1130). The display device 100 may provide a personalized ACR-based service using the determined user preference information. For example, the display device 100 may determine who the user is by collecting the user's biometric information, such as a fingerprint. As another example, the display device 100 may extract a user from an image captured by a camera using a face recognition algorithm.

판단된 사용자의 정보를 기초로, 디스플레이 장치(100)는 인식된 오브젝트 중 하나를 선택할 수 있다(S1140). 그리고 디스플레이 장치(100)는 선택된 오브젝트와 관련된 서비스를 제공할 수 있다(S1150). 표시되는 화면에서 인식된 복수의 오브젝트 중 사용자가 선호하는 오브젝트를 선택함으로써, 디스플레이 장치(100)는 개인화된 서비스를 제공할 수 있다.Based on the determined user information, the display device 100 may select one of the recognized objects (S1140). And the display device 100 can provide a service related to the selected object (S1150). The display device 100 can provide a personalized service by selecting a user's preferred object among a plurality of objects recognized on the displayed screen.

도 12는 본 개시의 다른 실시 예에 따른 디스플레이 장치(100)의 서비스 제공 방법을 설명하기 위한 흐름도이다. 도 12를 참조하면, 디스플레이 장치(100)는 시청 중인 컨텐츠를 인식할 수 있다(S1210). 디스플레이 장치(100)는 현재 표시되는 화면으로부터 생성한 핑거프린트를 서버(200)에 저장된 핑거프린트와 매칭하여 현재 재생되는 컨텐츠가 무엇인지 판단할 수 있다.FIG. 12 is a flowchart illustrating a method of providing a service by the display device 100 according to another embodiment of the present disclosure. Referring to FIG. 12, the display device 100 can recognize the content being viewed (S1210). The display device 100 can determine what content is currently being played by matching the fingerprint generated from the currently displayed screen with the fingerprint stored in the server 200.

그리고, 디스플레이 장치(100)는 화면 내의 인물 또는 상품을 인식할 수 있다(S1220). 현재 재생되는 컨텐츠 화면에서 특징점을 추출하거나, 인공지능에 의한 학습 방법을 통하여, 디스플레이 장치(100)는 화면에 포함된 오브젝트를 구분할 수 있다. 이어서 디스플레이 장치(100)는 화면 내에서 인식된 인물과 상품을 클러스터링할 수 있다(S1230). 디스플레이 장치(100)는 메타 데이터를 이용하여 컨텐츠의 주요 인물을 판단하고, 주요 인물과 가까이 위치한 상품을 주요 인물이 사용하는 상품으로 클러스터링할 수 있다.And, the display device 100 can recognize people or products on the screen (S1220). The display device 100 can distinguish objects included in the screen by extracting feature points from the currently playing content screen or through a learning method using artificial intelligence. Next, the display device 100 may cluster the people and products recognized within the screen (S1230). The display device 100 may determine the main person in the content using metadata and cluster products located close to the main person into products used by the main person.

디스플레이 장치(100)는 현재 디스플레이 장치(100)를 사용하는 사용자가 누구인지 판단할 수 있다(S1240). 예를 들어, 디스플레이 장치(100)는 지문 인식, 홍채 인식, 성문 인식과 같은 생체 정보를 이용할 수도 있다. 다른 예로, 디스플레이 장치(100)는 카메라로 컨텐츠를 시청하고 있는 사용자를 인식할 수도 있다.The display device 100 may determine who the user currently using the display device 100 is (S1240). For example, the display device 100 may use biometric information such as fingerprint recognition, iris recognition, or voiceprint recognition. As another example, the display device 100 may recognize a user watching content using a camera.

사용자가 한 명으로 판단될 경우(S1250-Y)에, 디스플레이 장치(100)는 판단된 사용자에 적합한 서비스를 제공할 수 있다. 하지만 사용자가 복수이면(S1250-N), 디스플레이 장치(100)는 서비스를 제공할 사용자를 선정하여야 한다(S1260). 예를 들어, 화면에 등장하는 인물의 정보와 판단된 복수의 사용자의 성별, 연령, 선호도 등을 고려하여, 디스플레이 장치(100)는 서비스를 제공할 대상을 타게팅할 수 있다.When it is determined that there is only one user (S1250-Y), the display device 100 can provide a service suitable for the determined user. However, if there are multiple users (S1250-N), the display device 100 must select a user to provide the service (S1260). For example, taking into account information about people appearing on the screen and the gender, age, preferences, etc. of the determined plurality of users, the display device 100 may target a target for providing services.

서비스를 제공할 대상이 판단되면, 디스플레이 장치(100)는 판단된 사용자의 선호도에 따라 상품을 선택할 수 있다(S1270). 디스플레이 장치(100)는 사용자의 프로필 정보, 선호도 정보 등을 수집할 수 있다. 예를 들어, 디스플레이 장치(100)는 사용자가 입력한 계정 정보, 디스플레이 장치(100) 주변의 IoT 장치들의 사용 정보 등을 수집할 수 있다. 수집된 정보를 이용하여 디스플레이 장치(100)는 인식된 상품들 중 사용자가 가장 선호하는 상품을 선택할 수 있다.When the target to provide the service is determined, the display device 100 may select a product according to the determined user's preference (S1270). The display device 100 may collect user profile information, preference information, etc. For example, the display device 100 may collect account information entered by the user, usage information of IoT devices around the display device 100, etc. Using the collected information, the display device 100 can select the user's most preferred product among the recognized products.

그리고 디스플레이 장치(100)는 선택된 상품에 관련된 서비스를 제공할 수 있다(S1280).And the display device 100 can provide services related to the selected product (S1280).

본 개시에서 사용된 용어 "~부"는 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 모듈은 ASIC(application-specific integrated circuit)으로 구성될 수 있다. The term “unit” used in the present disclosure includes a unit comprised of hardware, software, or firmware, and may be used interchangeably with terms such as logic, logic block, component, or circuit, for example. A module may be an integrated part, a minimum unit that performs one or more functions, or a part thereof. For example, a module may be comprised of an application-specific integrated circuit (ASIC).

본 문서의 다양한 실시예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시예들에 따른 전자 장치(예: 전자 장치(A))를 포함할 수 있다. 상기 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 상기 프로세서의 제어하에 다른 구성요소들을 이용하여 상기 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.Various embodiments of this document may be implemented as software including instructions stored in a machine-readable storage media that can be read by a machine (e.g., a computer). The device may read instructions stored from the storage medium. A device capable of making a call and operating according to a called instruction may include an electronic device (e.g., electronic device A) according to the disclosed embodiments, and when the instruction is executed by a processor, the processor directly: Alternatively, the function corresponding to the instruction may be performed using other components under the control of the processor. The instruction may include code generated or executed by a compiler or interpreter. , It can be provided in the form of a non-transitory storage medium. Here, 'non-transitory' only means that the storage medium does not contain signals and is tangible. There is no distinction between semi-permanent or temporary storage.

일시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.According to one example, methods according to various embodiments disclosed in this document may be provided and included in a computer program product. Computer program products are commodities and can be traded between sellers and buyers. The computer program product may be distributed on a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or online through an application store (e.g. Play Store™). In the case of online distribution, at least a portion of the computer program product may be at least temporarily stored or created temporarily in a storage medium such as the memory of a manufacturer's server, an application store server, or a relay server.

다양한 실시예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.Each component (e.g., module or program) according to various embodiments may be composed of a single or multiple entities, and some of the above-described sub-components may be omitted or other sub-components may be used. It may be further included in various embodiments. Alternatively or additionally, some components (e.g., modules or programs) may be integrated into a single entity and perform the same or similar functions performed by each corresponding component prior to integration. According to various embodiments, operations performed by a module, program, or other component may be executed sequentially, in parallel, iteratively, or heuristically, or at least some operations may be executed in a different order, omitted, or other operations may be added. It can be.

100: 디스플레이 장치 110: 디스플레이부
120: 프로세서 130: 통신부
140: 입력부 150: 카메라
160: 메모리 170: 영상 수신부
180: 영상 처리부
100: display device 110: display unit
120: processor 130: communication department
140: input unit 150: camera
160: memory 170: video receiver
180: Image processing unit

Claims (20)

디스플레이 장치에 있어서,
컨텐츠 재생 화면을 표시하는 디스플레이부;
통신부; 및
재생중인 컨텐츠를 인식하고,
현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하며,
상기 디스플레이 장치를 사용하는 사용자를 식별하고,
상기 식별된 사용자의 정보를 기초로 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하며,
상기 선택된 오브젝트와 관련된 서비스를 상기 식별된 사용자에게 제공하는 프로세서;를 포함하고,
상기 프로세서는,
상기 화면에서 상품에 대응되는 제1 오브젝트를 인식하고,
상기 인식된 컨텐츠의 메타데이터에 기초하여 상기 화면에서 인물에 대응되는 제2 오브젝트를 인식하며,
상기 상품 및 상기 인물 사이에 관련성이 없는 것으로 식별되면, 상기 제1 오브젝트를 필터링하고,
상기 식별된 사용자의 정보를 기초로, 상기 제1 오브젝트가 필터링된 상기 적어도 하나의 오브젝트 중 하나를 선택하며,
상기 디스플레이부에 표시된 화면의 특징을 추출하여 핑거프린트를 생성하며,
상기 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버에 질의하도록 상기 통신부를 제어하고,
상기 서버로부터 수신된 컨텐츠 정보를 이용하여 상기 컨텐츠를 인식하는 디스플레이 장치.
In the display device,
A display unit that displays a content playback screen;
Ministry of Communications; and
Recognizes the content being played,
Recognizes at least one object on the currently displayed screen,
Identify the user using the display device,
Selecting one of the at least one recognized object based on the identified user information,
A processor that provides services related to the selected object to the identified user,
The processor,
Recognize the first object corresponding to the product on the screen,
Recognize a second object corresponding to a person on the screen based on metadata of the recognized content,
If no relationship is identified between the product and the person, filter the first object,
Based on the identified user information, select one of the at least one object through which the first object has been filtered,
Generates a fingerprint by extracting features of the screen displayed on the display unit,
Controlling the communication unit to query the server for content information corresponding to the generated fingerprint,
A display device that recognizes the content using content information received from the server.
삭제delete 삭제delete 제1항에 있어서,
상기 프로세서는,
상기 표시된 화면에서의 위치를 기초로, 상기 인물과 상품 사이의 관련성 존부를 식별하고,
상기 관련성이 있으면 상기 제1 오브젝트 및 상기 제2 오브젝트를 클러스터링하는 디스플레이 장치.
According to paragraph 1,
The processor,
Based on the position on the displayed screen, identify whether there is a relationship between the person and the product,
A display device that clusters the first object and the second object if there is a relationship.
제1항에 있어서,
상기 프로세서는,
상기 식별된 사용자가 2명 이상이면, 화면이 변경될 때마다 상기 2명 이상의 사용자 중 한 명의 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 디스플레이 장치.
According to paragraph 1,
The processor,
If there are two or more identified users, a display device that identifies one of the two or more users as a user using the display device every time the screen is changed.
제5항에 있어서,
상기 프로세서는,
상기 적어도 하나의 오브젝트에 대한 선호도 순위를 결정하고, 상기 2명 이상의 사용자 중에서, 최우선 순위로 결정된 오브젝트에 대한 선호도가 가장 높은 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 디스플레이 장치.
According to clause 5,
The processor,
A display device that determines a preference ranking for the at least one object, and identifies the user with the highest preference for the object determined as the highest priority among the two or more users as the user using the display device.
제1항에 있어서,
사용자의 생체 정보를 입력받는 입력부;를 더 포함하고,
상기 프로세서는,
상기 입력부를 통해 입력된 생체 정보와 기저장된 생체 정보를 비교하여, 상기 디스플레이 장치를 사용하는 사용자를 식별하는 디스플레이 장치.
According to paragraph 1,
It further includes an input unit that receives the user's biometric information,
The processor,
A display device that compares biometric information input through the input unit with pre-stored biometric information to identify a user using the display device.
제1항에 있어서,
이미지를 촬영하는 카메라;를 더 포함하고,
상기 프로세서는,
상기 카메라를 통해 촬영된 상기 디스플레이 장치의 전방에 위치한 기설정된 영역의 이미지에 포함된 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 디스플레이 장치.
According to paragraph 1,
Further including a camera for taking images,
The processor,
A display device that identifies a user included in an image of a preset area located in front of the display device captured by the camera as a user using the display device.
디스플레이 장치의 서비스 제공 방법에 있어서,
재생중인 컨텐츠를 인식하는 단계;
상기 컨텐츠의 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하는 단계;
상기 디스플레이 장치를 사용하는 사용자를 식별하는 단계;
상기 식별된 사용자의 정보를 기초로, 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하는 단계; 및
상기 선택된 오브젝트와 관련된 서비스를 상기 식별된 사용자에게 제공하는 단계;를 포함하며,
상기 적어도 하나의 오브젝트를 인식하는 단계는,
상기 화면에서 상품에 대응되는 제1 오브젝트를 인식하는 단계;
상기 인식된 컨텐츠의 메타데이터에 기초하여 상기 화면에서 인물에 대응되는 제2 오브젝트를 인식하는 단계; 및
상기 상품 및 상기 인물 사이에 관련성이 없는 것으로 식별되면, 상기 제1 오브젝트를 필터링하는 단계; 를 포함하고,
상기 컨텐츠를 인식하는 단계는,
상기 식별된 사용자의 정보를 기초로, 상기 제1 오브젝트가 필터링된 상기 적어도 하나의 오브젝트 중 하나를 선택하는 단계;
상기 표시된 화면의 특징을 추출하여 핑거프린트를 생성하는 단계;
상기 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버에 질의를 전송하는 단계; 및
상기 서버로부터 수신된 컨텐츠 정보를 이용하여 상기 컨텐츠를 인식하는 단계; 를 포함하는 단계; 를 포함하는 서비스 제공 방법.
In a method of providing a service for a display device,
Recognizing the content being played;
Recognizing at least one object on the currently displayed screen of the content;
identifying a user using the display device;
selecting one of the at least one recognized object based on the identified user information; and
It includes providing a service related to the selected object to the identified user,
The step of recognizing at least one object includes:
Recognizing a first object corresponding to a product on the screen;
Recognizing a second object corresponding to a person on the screen based on metadata of the recognized content; and
If no relationship is identified between the product and the person, filtering the first object; Including,
The step of recognizing the content is,
Based on the identified user information, selecting one of the at least one object through which the first object has been filtered;
generating a fingerprint by extracting features of the displayed screen;
transmitting a query for content information corresponding to the generated fingerprint to a server; and
Recognizing the content using content information received from the server; Steps comprising; Service provision method including.
삭제delete 삭제delete 제9항에 있어서,
상기 적어도 하나의 오브젝트를 인식하는 단계는,
상기 표시된 화면에서의 위치를 기초로, 상기 인물과 상품 사이의 관련성 존부를 식별하는 단계; 및
상기 관련성이 있으면 제1 오브젝트 및 상기 제2 오브젝트를 클러스터링하는 단계;를 포함하는 서비스 제공 방법.
According to clause 9,
The step of recognizing at least one object includes:
Identifying whether there is a relationship between the person and the product based on the position on the displayed screen; and
A service providing method comprising: clustering the first object and the second object if the relationship exists.
제9항에 있어서,
상기 사용자를 식별하는 단계는,
상기 식별된 사용자가 2명 이상이면, 화면이 변경될 때마다 상기 2명 이상의 사용자 중 한 명의 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 서비스 제공 방법.
According to clause 9,
The step of identifying the user is,
If there are two or more identified users, a service providing method that identifies one user among the two or more users as a user using the display device each time the screen is changed.
◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈◈Claim 14 was abandoned upon payment of the setup registration fee.◈ 제13항에 있어서,
상기 사용자를 식별하는 단계는,
상기 적어도 하나의 오브젝트에 대한 선호도 순위를 결정하는 단계; 및
상기 2명 이상의 사용자 중에서, 최우선 순위로 결정된 오브젝트에 대한 선호도가 가장 높은 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 단계;를 포함하는 서비스 제공 방법.
According to clause 13,
The step of identifying the user is,
determining a preference ranking for the at least one object; and
Among the two or more users, identifying the user with the highest preference for the object determined as the highest priority as the user using the display device.
◈청구항 15은(는) 설정등록료 납부시 포기되었습니다.◈◈Claim 15 was abandoned upon payment of the setup registration fee.◈ 제9항에 있어서,
상기 사용자를 식별하는 단계는,
상기 사용자의 생체 정보를 입력받는 단계; 및
상기 입력된 생체 정보와 기저장된 생체 정보를 비교하여, 상기 디스플레이 장치를 사용하는 사용자를 식별하는 단계;를 포함하는 서비스 제공 방법.
According to clause 9,
The step of identifying the user is,
Receiving biometric information of the user; and
Comparing the input biometric information with pre-stored biometric information to identify a user using the display device.
◈청구항 16은(는) 설정등록료 납부시 포기되었습니다.◈◈Claim 16 was abandoned upon payment of the setup registration fee.◈ 제9항에 있어서,
상기 사용자를 식별하는 단계는,
상기 디스플레이 장치의 전방에 위치한 기설정된 영역에 대한 이미지를 촬영하는 단계; 및
상기 촬영된 이미지에 포함된 사용자를 상기 디스플레이 장치를 사용하는 사용자로 식별하는 단계;를 포함하는 서비스 제공 방법.
According to clause 9,
The step of identifying the user is,
Taking an image of a preset area located in front of the display device; and
A service providing method comprising: identifying a user included in the captured image as a user using the display device.
인공지능 신경망(Neural Network) 모델을 이용하는 디스플레이 장치에 있어서,
컨텐츠 재생 화면을 표시하는 디스플레이부;
통신부; 및
재생중인 컨텐츠를 인식하고,
상기 인식된 컨텐츠를 인공지능 신경망(Neural Network) 모델에 입력하여 현재 표시된 화면에서 적어도 하나의 오브젝트를 인식하며,
상기 디스플레이 장치를 사용하는 사용자를 식별하고,
상기 식별된 사용자의 정보를 기초로 상기 인식된 적어도 하나의 오브젝트 중 하나를 선택하며, 상기 선택된 오브젝트와 관련된 서비스를 상기 식별된 사용자에게 제공하는 프로세서;를 포함하고,
상기 프로세서는,
상기 화면에서 상품에 대응되는 제1 오브젝트를 인식하고,
상기 인식된 컨텐츠의 메타데이터에 기초하여 상기 화면에서 인물에 대응되는 제2 오브젝트를 인식하며,
상기 상품 및 상기 인물 사이에 관련성이 없는 것으로 식별되면, 상기 제1 오브젝트를 필터링하고,
상기 식별된 사용자의 정보를 기초로, 상기 제1 오브젝트가 필터링된 상기 적어도 하나의 오브젝트 중 하나를 선택하며,
상기 디스플레이부에 표시된 화면의 특징을 추출하여 핑거프린트를 생성하며,
상기 생성된 핑거프린트에 대응되는 컨텐츠 정보를 서버에 질의하도록 상기 통신부를 제어하고,
상기 서버로부터 수신된 컨텐츠 정보를 이용하여 상기 컨텐츠를 인식하는 디스플레이 장치.
In a display device using an artificial intelligence neural network model,
A display unit that displays a content playback screen;
Ministry of Communications; and
Recognizes the content being played,
Input the recognized content into an artificial intelligence neural network model to recognize at least one object on the currently displayed screen,
Identify the user using the display device,
A processor that selects one of the recognized at least one object based on information on the identified user and provides a service related to the selected object to the identified user,
The processor,
Recognize the first object corresponding to the product on the screen,
Recognize a second object corresponding to a person on the screen based on metadata of the recognized content,
If no relationship is identified between the product and the person, filter the first object,
Based on the identified user information, select one of the at least one object for which the first object has been filtered,
Generates a fingerprint by extracting features of the screen displayed on the display unit,
Controlling the communication unit to query the server for content information corresponding to the generated fingerprint,
A display device that recognizes the content using content information received from the server.
삭제delete 삭제delete ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈◈Claim 20 was abandoned upon payment of the setup registration fee.◈ 제17항에 있어서,
상기 프로세서는,
상기 표시된 화면에서의 위치를 기초로, 상기 인물과 상품 사이의 관련성 존부를 식별하고,
상기 관련성이 있으면 제1 오브젝트 및 상기 제2 오브젝트를 클러스터링하는 디스플레이 장치.
According to clause 17,
The processor,
Based on the position on the displayed screen, identify whether there is a relationship between the person and the product,
A display device that clusters the first object and the second object if the relationship exists.
KR1020170157854A 2017-01-11 2017-11-24 Display apparatus and service providing method of thereof KR102664418B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/KR2018/000444 WO2018131875A1 (en) 2017-01-11 2018-01-09 Display apparatus and method for providing service thereof
US15/868,539 US10257569B2 (en) 2017-01-11 2018-01-11 Display apparatus and method for providing service thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170004192 2017-01-11
KR20170004192 2017-01-11

Publications (2)

Publication Number Publication Date
KR20180082950A KR20180082950A (en) 2018-07-19
KR102664418B1 true KR102664418B1 (en) 2024-05-09

Family

ID=63058604

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170157854A KR102664418B1 (en) 2017-01-11 2017-11-24 Display apparatus and service providing method of thereof

Country Status (1)

Country Link
KR (1) KR102664418B1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021132738A1 (en) * 2019-12-23 2021-07-01 엘지전자 주식회사 Display device and method for operating same
CN111541907B (en) * 2020-04-23 2023-09-22 腾讯科技(深圳)有限公司 Article display method, apparatus, device and storage medium
KR102474282B1 (en) * 2021-07-07 2022-12-06 주식회사 에이비파트너스 Method and apparatus for providing product purchase service based on review video
KR102524461B1 (en) * 2021-07-07 2023-04-24 주식회사 에이비파트너스 Method for providing unified interface for product reviews and purchase

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033607A1 (en) * 2005-08-08 2007-02-08 Bryan David A Presence and proximity responsive program display
WO2013086257A1 (en) 2011-12-09 2013-06-13 Viewdle, Inc. Clustering objects detected in video
US8910201B1 (en) 2013-03-11 2014-12-09 Amazon Technologies, Inc. Product placement in digital content
US20160112746A1 (en) * 2013-08-20 2016-04-21 Huawei Device Co., Ltd. Media Playback Method, Apparatus, and System

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101995425B1 (en) * 2011-08-21 2019-07-02 엘지전자 주식회사 Video display device, terminal device and operating method thereof
US9420319B1 (en) * 2012-06-07 2016-08-16 Audible, Inc. Recommendation and purchase options for recommemded products based on associations between a user and consumed digital content
KR102217191B1 (en) * 2014-11-05 2021-02-18 삼성전자주식회사 Terminal device and information providing method thereof
CN106294489B (en) * 2015-06-08 2022-09-30 北京三星通信技术研究有限公司 Content recommendation method, device and system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033607A1 (en) * 2005-08-08 2007-02-08 Bryan David A Presence and proximity responsive program display
WO2013086257A1 (en) 2011-12-09 2013-06-13 Viewdle, Inc. Clustering objects detected in video
US8910201B1 (en) 2013-03-11 2014-12-09 Amazon Technologies, Inc. Product placement in digital content
US20160112746A1 (en) * 2013-08-20 2016-04-21 Huawei Device Co., Ltd. Media Playback Method, Apparatus, and System

Also Published As

Publication number Publication date
KR20180082950A (en) 2018-07-19

Similar Documents

Publication Publication Date Title
US11482000B2 (en) Image processing apparatus and control method thereof
US11166066B2 (en) Display apparatus, content recognizing method thereof, and non-transitory computer readable recording medium
US11113587B2 (en) System and method for appearance search
CN110998601B (en) Method and device for identifying objects
US11206450B2 (en) System, apparatus and method for providing services based on preferences
WO2021238631A1 (en) Article information display method, apparatus and device and readable storage medium
CN110249360B (en) Apparatus and method for recommending products
US10257569B2 (en) Display apparatus and method for providing service thereof
KR102618732B1 (en) Equipment utilizing human recognition and method for utilizing the same
CN105635824B (en) Personalized channel recommendation method and system
KR102664418B1 (en) Display apparatus and service providing method of thereof
KR20190106865A (en) Method for searching video and equipment with video search function
US20190297381A1 (en) Artificial intelligence device and operating method thereof
US20190066158A1 (en) Method and electronic device for providing advertisement
EP3238015A2 (en) First-person camera based visual context aware system
CN103098079A (en) Personalized program selection system and method
KR20180055708A (en) Device and method for image processing
CN111567056B (en) Video playing device and control method thereof
KR101895846B1 (en) Facilitating television based interaction with social networking tools
KR20200010993A (en) Electronic apparatus for recognizing facial identity and facial attributes in image through complemented convolutional neural network
KR20220000758A (en) Image detection apparatus and method thereof
US20190163702A1 (en) Image display apparatus and method of operating the same
US10917721B1 (en) Device and method of performing automatic audio focusing on multiple objects
KR102585244B1 (en) Electronic apparatus and control method thereof
US20240144455A1 (en) Image processing device and operation method thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant