WO2021118097A1 - User terminal device and method for controlling same - Google Patents

User terminal device and method for controlling same Download PDF

Info

Publication number
WO2021118097A1
WO2021118097A1 PCT/KR2020/016339 KR2020016339W WO2021118097A1 WO 2021118097 A1 WO2021118097 A1 WO 2021118097A1 KR 2020016339 W KR2020016339 W KR 2020016339W WO 2021118097 A1 WO2021118097 A1 WO 2021118097A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
display
user
image
gesture
Prior art date
Application number
PCT/KR2020/016339
Other languages
French (fr)
Korean (ko)
Inventor
박희성
박대희
송상곤
이정표
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of WO2021118097A1 publication Critical patent/WO2021118097A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/4722End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content

Definitions

  • the present disclosure relates to a user terminal device and a control method thereof, and more particularly, to a user terminal device operating based on a user's gesture and a control method thereof.
  • a user who views an image through a display device such as a TV may be interested in an object included in the image while watching the image.
  • a display device such as a TV
  • a user watching a drama may be interested in actors, cars, buildings, etc. included in the image.
  • a smart TV has been developed that divides the screen to display a main image such as a drama in a first area of the display and displays an additional image related to the main image in a second area of the display. have.
  • this may interfere with the user's viewing of the image due to the reduction in the size of the main image.
  • the present disclosure has been devised to solve the above problems, and an object of the present disclosure is to provide a user terminal device capable of providing additional information related to an image being reproduced on a display device, and a method for controlling the same.
  • a user terminal device when a movement of the user terminal device by a communication unit, a display, a sensor, and a user's gesture is detected through the sensor, the user terminal device The user's gesture is determined based on the user's gesture, and when it is determined that the user's gesture is a preset gesture, information on an object included in the image displayed on the display device is received from the display device through the communication unit, and the object information on and information on a plurality of applications related to the object are displayed on the display, and when a user command for selecting one of the plurality of applications is received, the selected application based on the information on the object It may include a processor for displaying the provided screen on the display.
  • the processor displays information on the object on the display, and when a user command for selecting the object is received, information on the object and information on a plurality of applications related to the object on the display can be displayed
  • the processor displays an image in which a UI corresponding to the object is superimposed on the image displayed on the display device, and when a user command for selecting the UI is received, information on the object and the Information on a plurality of applications related to the object may be displayed on the display.
  • the processor may obtain information on the number of executions of a plurality of applications based on the user's history information, and display information on the plurality of applications on the display based on the information on the number of executions. have.
  • the processor receives, from the display device, a plurality of image frames displayed on the display device, and displays an indicator for selecting one image frame among the plurality of image frames on the display, through the indicator , when a user command for selecting one image frame from among the plurality of image frames is received, information on an object included in the selected image frame and information on a plurality of applications related to the object may be displayed on the display. have.
  • the processor determines an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device, , a screen provided by the specific application may be displayed on the display based on the object.
  • the processor determines an object representing a phone number from among a plurality of objects included in the image displayed on the display device, and a screen provided by the call application based on the phone number may be displayed on the display.
  • the processor determines an object indicating a location from among a plurality of objects included in the image displayed on the display device, and displays a screen provided by the map application based on the location. can be displayed on the display.
  • the processor receives an image displayed on the display device from the display device, and displays a screen provided by a photo application on the display based on the image. can be displayed
  • the processor receives an audio signal output from the display device from the display device, and outputs the audio signal from the display device based on the audio signal
  • the title of the music may be determined, and the music application may be executed based on the title of the music.
  • the control method of the user terminal device when the motion of the user terminal device by the user's gesture is detected, determining the user's gesture based on the movement of the user terminal device , when it is determined that the user's gesture is a preset gesture, receiving, from a display device, information on an object included in an image displayed on the display device, information on the object, and a plurality of applications related to the object and displaying a screen provided by the selected application based on the information on the object when a user command for selecting one of the plurality of applications is received.
  • the displaying of the information may include displaying information on the object, and when a user command for selecting the object is received, display information on the object and information on a plurality of applications related to the object.
  • the displaying of the information includes displaying an image in which a UI corresponding to the object is superimposed on the image displayed on the display device, and when a user command for selecting the UI is received, information on the object and Information on a plurality of applications related to the object may be displayed.
  • the displaying of the information may include obtaining information on the number of executions of a plurality of applications based on the user's history information, and displaying information on the plurality of applications based on the information on the number of executions.
  • the displaying of the information includes receiving, from the display device, a plurality of image frames displayed on the display device, displaying an indicator for selecting one image frame from among the plurality of image frames, and setting the indicator.
  • the control method when it is determined that the user's gesture is a gesture for executing a specific application, the control method determines an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device. and displaying a screen provided by the specific application based on the object.
  • the displaying of the screen may include determining an object representing a phone number from among a plurality of objects included in the image displayed on the display device when the specific application is a call application, and based on the phone number, the call application The screen provided by this can be displayed.
  • the displaying of the screen may include determining an object indicating a location from among a plurality of objects included in the image displayed on the display device when the specific application is a map application, and providing the map application based on the location screen can be displayed.
  • control method includes receiving an image displayed on the display device from the display device when the user's gesture is determined as a gesture for screen capture, and displaying a screen provided by a photo application based on the image It may include further steps.
  • control method includes receiving an audio signal output from the display device from the display device when it is determined that the user's gesture is a gesture for executing a music application, and executing the music application based on the audio signal It may further include the step of executing.
  • a user terminal device capable of providing additional information related to an image displayed on a display device based on a user's gesture and a control method thereof may be provided.
  • FIG. 1 is a diagram schematically illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
  • FIG. 2 is a block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
  • 3A is a diagram illustrating a user's gesture according to an embodiment of the present disclosure.
  • 3B is a diagram for explaining an embodiment in which a display device recognizes a user's gesture according to an embodiment of the present disclosure
  • FIG. 4 is a view for explaining an embodiment of displaying information on an object according to an embodiment of the present disclosure.
  • FIG. 5 is a view for explaining an embodiment of displaying information about an object on a plurality of areas of a display in different formats according to an embodiment of the present disclosure
  • FIG. 6 is a view for explaining an indicator according to an embodiment of the present disclosure.
  • FIG. 7 is a view for explaining an embodiment of displaying information on an object and information on a plurality of applications related to an object according to an embodiment of the present disclosure.
  • FIG. 8 is a view for explaining an embodiment of displaying information on a plurality of different applications according to user history information according to an embodiment of the present disclosure.
  • FIG. 9 is a diagram for explaining a screen provided by an application using an object according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram for explaining a screen provided by a preset application using an object according to an embodiment of the present disclosure.
  • FIG. 11 is a diagram for explaining an embodiment of executing a call application according to an embodiment of the present disclosure.
  • FIG. 12 is a diagram for explaining an embodiment of executing a photo application according to an embodiment of the present disclosure.
  • FIG. 13 is a diagram for explaining an embodiment of executing a map application according to an embodiment of the present disclosure.
  • FIG. 14 is a diagram for explaining an embodiment of executing a music application according to an embodiment of the present disclosure.
  • 15 is a detailed block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
  • 16 is a view for explaining a display device according to an embodiment of the present disclosure.
  • 17 is a flowchart illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
  • expressions such as “has,” “may have,” “includes,” or “may include” refer to the presence of a corresponding characteristic (eg, a numerical value, function, operation, or component such as a part). and does not exclude the presence of additional features.
  • expressions such as “A or B,” “at least one of A or/and B,” or “one or more of A or/and B” may include all possible combinations of the items listed together.
  • “A or B,” “at least one of A and B,” or “at least one of A or B” means (1) includes at least one A, (2) includes at least one B; Or (3) it may refer to all cases including both at least one A and at least one B.
  • a component eg, a first component is "coupled with/to (operatively or communicatively)" to another component (eg, a second component)
  • another component eg, a second component
  • the certain element may be directly connected to the other element or may be connected through another element (eg, a third element).
  • a component eg, a first component
  • another component eg, a second component
  • the expression “configured to (or configured to)” depends on the context, for example, “suitable for,” “having the capacity to ,” “designed to,” “adapted to,” “made to,” or “capable of.”
  • the term “configured (or configured to)” may not necessarily mean only “specifically designed to” in hardware. Instead, in some circumstances, the expression “a device configured to” may mean that the device is “capable of” with other devices or parts.
  • the phrase “a processor configured (or configured to perform) A, B, and C” refers to a dedicated processor (eg, an embedded processor) for performing the operations, or by executing one or more software programs stored in a memory device. , may mean a generic-purpose processor (eg, a CPU or an application processor) capable of performing corresponding operations.
  • FIG. 1 is a diagram schematically illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
  • the user terminal device 100 may transmit/receive various data by performing communication with the display device 200 .
  • the user terminal device 100 may be communicatively connected to the display device 200 through various communication methods such as Wi-Fi and Bluetooth.
  • the user terminal device 100 may transmit a signal requesting information on an object included in an image displayed on the display device 200 to the display device 200 .
  • the user terminal device 100 determines a user's gesture based on the motion of the user terminal device 100, and the user's gesture is a preset gesture. If it is determined that , a signal requesting information on an object included in an image displayed on the display apparatus 200 may be transmitted to the display apparatus 200 .
  • the display apparatus 200 may analyze the image displayed on the display apparatus 200 to identify an object included in the image.
  • the identified object may be various objects such as text, numbers, faces, and marks included in the image.
  • the display apparatus 200 when a signal for requesting information on an object is received from the user terminal device 100 , the display apparatus 200 applies an object recognition algorithm to the image displayed on the display apparatus 200 to obtain an object included in the image. can be identified.
  • the object recognition algorithm may be various algorithms such as a face recognition algorithm, a text recognition algorithm, and a number recognition algorithm.
  • the display apparatus 200 may identify an object included in an image using an artificial intelligence model.
  • the display apparatus 200 uses a convolutional layer for extracting image feature information and based on the extracted feature information.
  • the object included in the image can be identified through the CNN Convolutional Neural Network model including the fully-connected layer, which is trained to identify the object included in the image. Meanwhile, this is an embodiment, and the display apparatus 200 may identify an object included in an image through various methods such as an edge detection algorithm.
  • the display apparatus 200 may transmit information on the identified object to the user terminal apparatus 100 .
  • the display apparatus 200 may transmit information about the car A to the user terminal device 100 .
  • the user terminal device 100 may display information on an object included in the image displayed on the display device 200 . Specifically, when information on an object is received from the display apparatus 200 , the user terminal device 100 performs a web search using the object as a keyword through the web search application installed in the user terminal device 100 , Information obtained as a result of the search may be displayed on the display of the user terminal device 100 .
  • the user terminal device 100 receives information about the car A from the display device 200, and the car A A web search result as a keyword may be displayed on the display of the user terminal device 100 .
  • the user may be provided with information on the object included in the image displayed on the display apparatus 200 .
  • information about an object is transmitted from the display device 200 to the user terminal device 100 by a user's gesture, when a user is interested in an image being played, information about the object can be easily and quickly provided. .
  • FIG. 2 is a block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
  • the user terminal device 100 may include a communication unit 110 , a sensor 120 , a display 130 , and a processor 140 .
  • the communication unit 110 may transmit/receive various data by performing communication with various external devices.
  • the communication unit 110 may communicate with the display apparatus 200 .
  • the communication unit 110 is connected to the display device 200 through various communication methods such as Wi-Fi and Bluetooth, and may transmit/receive various data to and from the display device 200 .
  • the communication unit 110 may include a Wi-Fi module and a Bluetooth module.
  • the communication unit 110 may transmit information about the user's gesture to the display apparatus 200 . Also, the communication unit 110 may transmit a signal requesting information on an object included in an image displayed on the display apparatus 200 to the display apparatus 200 , and from the display apparatus 200 to the display apparatus 200 . Information on an object included in the displayed image may be received. Also, the communication unit 110 may receive, from the display apparatus 200 , information about an image displayed on the display apparatus 200 .
  • the information about the image may include at least one image frame.
  • the communication unit 110 may communicate with the server to transmit/receive various data.
  • the communication unit 110 communicates with the server through a mobile communication network such as 3G (3rd Generation), 3GPP (3rd Generation Partnership Project), LTE (Long Term Evolution), 5G (5th Generation), etc., or connects to a Wi-Fi network.
  • a mobile communication network such as 3G (3rd Generation), 3GPP (3rd Generation Partnership Project), LTE (Long Term Evolution), 5G (5th Generation), etc.
  • the communication unit 110 may further include a mobile communication module.
  • the communication unit 110 is a server that provides a service through the corresponding application, and a signal for requesting information on an image provided by the application. can be sent to the server.
  • the communication unit 110 may receive information about an image provided by the corresponding application from the server. For example, if the application is an application for web search, the communication unit 110 may receive information about an image including a page for web search from the server.
  • the sensor 120 may detect the movement of the user terminal device 100 by the user's gesture.
  • the sensor 120 may include various sensors capable of detecting the movement of the user terminal device 100 , such as an acceleration sensor and a gyro sensor.
  • the acceleration sensor is a sensor that detects a change in the speed of the user terminal device 100 per unit time.
  • the acceleration sensor may be a 3-axis acceleration sensor that measures the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis based on the movement of the user terminal device 100 .
  • the processor 140 determines that the user terminal device 100 is based on the gravitational acceleration based on the acceleration in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 .
  • the processor 140 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
  • the gyro sensor is a sensor that detects the angular velocity of the user terminal device 100 .
  • the gyro sensor may be a micro electro mechanical systems (MEMS) gyro sensor that senses the angular velocity of the user terminal device 100 based on a Coriolis force measured based on the rotation of the user terminal device 100 .
  • the processor 140 may determine the degree of rotation of the user terminal device 100 based on the amount of change in the angular velocity of the user terminal device 100 sensed by the sensor 120 for a certain period of time, and from this, gestures can be judged.
  • MEMS micro electro mechanical systems
  • the above-described sensor is an embodiment, and the sensor 120 may be implemented as various sensors capable of detecting the movement of the user terminal device.
  • the sensor 120 may further include a geomagnetic sensor capable of measuring a magnetic field that changes according to the movement of the user terminal device 100 .
  • the display 130 may display various images.
  • the image is a concept including at least one of a still image or a moving image
  • the display 130 may display various images such as multimedia content and game content.
  • the display 130 may display various user interfaces (UIs) and icons.
  • UIs user interfaces
  • the display 130 may display information about the object received from the display apparatus 200 .
  • the object is an object included in the image displayed on the display device 200 , and for example, when the car A is included in the image, the display 130 may display information about the car A.
  • the display 130 may display information about a plurality of applications.
  • the plurality of applications are applications related to an object included in an image displayed on the display device 200 , and specifically, the display 130 displays a plurality of applications that can perform a function using the object included in the image. can do.
  • the display 130 may display an application execution screen.
  • the application execution screen is a screen provided by an application executed according to a user command, and specifically, may be an image received from a server that provides a service through the corresponding application.
  • Such a display 130 includes various types of displays, such as Liquid Crystal Display Panel (LCD), Light Emitting Diode (LED), Organic Light Emitting Diodes (OLED), Liquid Crystal on Silicon (LCoS), Digital Light Processing (DLP), and the like.
  • LCD Liquid Crystal Display Panel
  • LED Light Emitting Diode
  • OLED Organic Light Emitting Diodes
  • LCDoS Liquid Crystal on Silicon
  • DLP Digital Light Processing
  • the display 130 may include a driving circuit, a backlight unit, and the like, which may be implemented in the form of an a-si TFT, a low temperature poly silicon (LTPS) TFT, or an organic TFT (OTFT).
  • the processor 140 controls the overall operation of the user terminal device 100 .
  • the processor 140 may include at least one of a central processing unit (CPU), an application processor (AP), or a communication processor (CP).
  • CPU central processing unit
  • AP application processor
  • CP communication processor
  • the processor 140 may control hardware or software components connected to the processor 140 by driving an operating system or an application program, and may perform various data processing and operations.
  • the processor 140 may load and process commands or data received from at least one of the other components into the volatile memory, and store various data in the non-volatile memory.
  • the processor 140 may detect the movement of the user terminal device 100 by the user's gesture. Specifically, the processor 140 may detect the movement of the user terminal device 100 through the sensor 120 . To this end, the processor 140 may receive sensing data generated by the sensor 120 from the sensor 120 .
  • the processor 140 transmits sensing data including information on the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis to the sensor. 120 may be received.
  • the processor 140 determines that the user terminal device 100 is based on the gravitational acceleration based on the acceleration in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 .
  • the processor 140 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
  • the processor 140 receives, from the sensor 120 , sensing data obtained by converting the Coriolis force measured based on the rotation of the user terminal device 100 into an electrical signal. can do.
  • the processor 140 may determine the amount of change in the angular velocity of the user terminal device 100 sensed by the sensor 120 for a predetermined time based on the sensed data, and may determine the user's gesture therefrom.
  • the processor 120 determines the movement of the user terminal device 100 , the inclination angle, and the degree of rotation of the user terminal device 100 based on the sensing data received from the acceleration sensor and the sensing data received from the gyro sensor. and may determine the user's gesture from this.
  • the processor 140 may determine the user's gesture through various sensors such as a geomagnetic sensor capable of measuring a magnetic field that changes according to the movement of the user terminal device 100 .
  • the processor 140 may transmit a signal requesting information on an object included in an image displayed on the display apparatus 200 to the display apparatus 200 .
  • the user terminal device 100 may pre-store information about a preset gesture.
  • the preset gesture may be a gesture of lifting the user terminal device from a horizontal state to a vertical state.
  • the user's gesture may be recognized by the display apparatus 200 .
  • the display apparatus 200 includes a camera 210 , and the display apparatus 200 may determine a user's gesture based on an image captured by the camera 210 . .
  • the display apparatus 200 may identify an object included in the image by applying an object recognition algorithm to an image captured by the camera 210 .
  • the display apparatus 200 may determine the user's gesture based on a change in an object included in the image.
  • the display apparatus 200 determines the movement of the object based on a change in the pixel value of the object included in the image, and determines whether the user's gesture is a preset gesture stored in the display apparatus 200 based on the movement of the object. can be judged
  • the display apparatus 200 may identify an object included in an image captured by the camera 210 using an artificial intelligence model.
  • the display device 200 is a convolutional layer for extracting feature information of an image and a fully-connected layer trained to identify an object included in an image based on the extracted feature information through a CNN model, An object included in an image can be identified.
  • the display apparatus 200 may determine the movement of the object by tracking the object included in the image, and determine whether the user's gesture is a preset gesture stored in the display apparatus 200 based on the movement of the object. . Meanwhile, this is an embodiment, and the display apparatus 200 may identify an object included in an image through various methods such as an edge detection algorithm.
  • the display apparatus 200 may transmit information on the object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 . have.
  • the display apparatus 200 transmits information about an object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 . can be sent to
  • the display apparatus 200 may analyze the object included in the image displayed on the display apparatus 200 to identify the object included in the image.
  • the identified object may be various objects such as text, numbers, faces, and marks included in the image.
  • the text may be a caption included in an image, a shop name on a signboard, and the like
  • the number may be a phone number or an account number.
  • the face may be a human face, as well as an animal face other than a human, such as a dog or a cat.
  • the mark may be a brand mark of a car, a brand mark of a bag, a brand mark of clothing, and the like.
  • the display apparatus 200 may identify an object included in the image by applying an object recognition algorithm to the image displayed on the display apparatus 200 .
  • the object recognition algorithm may be various algorithms such as a face recognition algorithm, a text recognition algorithm, and a number recognition algorithm.
  • the display apparatus 200 may identify an object included in an image using an artificial intelligence model.
  • the display device 200 is a convolutional layer for extracting feature information of an image and a fully-connected layer trained to identify an object included in an image based on the extracted feature information through a CNN model, An object included in an image can be identified.
  • the display device 200 includes a Deep Neural Network (DNN), a Recurrent Neural Network (RNN), a Restricted Boltzmann Machine (RBM), a Deep Belief Network (DBN), and a Bidirectional Recurrent Deep Neural Network (BRDNN). and various artificial intelligence models such as Deep Q-Networks, or edge detection algorithms, etc., to identify objects included in the image.
  • DNN Deep Neural Network
  • RNN Recurrent Neural Network
  • RBM Restricted Boltzmann Machine
  • DBN Deep Belief Network
  • BBN Bidirectional Recurrent Deep Neural Network
  • various artificial intelligence models such as Deep Q-Networks, or edge detection algorithms, etc.
  • the display apparatus 200 may transmit information on the identified object to the user terminal apparatus 100 .
  • the display apparatus 200 transmits information about the car A, the actor B, the actor C, and the cafe D to the user terminal device 100 when the car A, the actor B, the actor C, and the cafe D are identified in the image. can be transmitted
  • the display apparatus 200 identifies an object included in an image, but the object identification may be performed by the user terminal apparatus 100 .
  • the processor 140 transmits information about the image displayed on the display apparatus 200 to the display apparatus 200 .
  • a request signal can be transmitted.
  • the processor 140 may identify an object included in the image through various methods such as the object recognition algorithm or artificial intelligence model described above for the image.
  • the display apparatus 200 transmits information about the image displayed on the display apparatus 200 to the user terminal apparatus 100, and the processor ( When information on an image is received from the display apparatus 200 , the 140 may identify an object included in the image through various methods such as the object recognition algorithm or artificial intelligence model described above for the image.
  • the processor 140 may display information on the object on the display 130 .
  • the processor 140 may display information about the object on the display 130 .
  • the processor 140 displays information on car A, actor B, actor C, and cafe D ( 130) can be indicated.
  • the information on the object may be displayed on the display 130 in a text format, but is not limited thereto.
  • the processor 140 may display an image in which information on an object is superimposed on an image displayed on the display apparatus 200 on the display 130 .
  • the processor 140 may receive information about an image in which information about an object is superimposed on an image displayed on the display apparatus 200 from the display apparatus 200 .
  • the display apparatus 200 is included in the image.
  • the identified object may be identified, a region in which the identified object is located among the entire region of the image may be determined, and information about an image in which information on the object is superimposed on the determined region may be transmitted to the user terminal device 100 .
  • the processor 140 identifies an object in the image received from the display apparatus 200 , determines a region in which the identified object is located among the entire region of the image, and superimposes information on the object on the determined region. can be generated and displayed on the display 130 .
  • the processor 140 may display, on the display 130 , an image in which information about an object is superimposed on an image displayed on the display apparatus 200 , and information about an object listed in text format. For example, referring to FIG. 5 , the processor 140 displays an image in which information about an object is superimposed on a first area of the display 130 , and displays thumbnail information about the object on a second area of the display 130 . and can be displayed by listing in text format. Meanwhile, in FIGS. 4 and 5 , object 1 and object 2 are superimposed and displayed on the image, but according to an embodiment, the processor 140 may superimpose and display the car A, actor B, etc. on the image. .
  • the processor 140 receives a plurality of image frames displayed on the display apparatus 200 from the display apparatus 200 , and displays an indicator for selecting one image frame among the plurality of image frames on the display 130 . can do.
  • the processor 140 may receive information about an object included in the selected image frame from the display apparatus 200 . can
  • the processor 140 may display a plurality of image frames displayed on the display apparatus 200 with the display apparatus 200 . You can request a transfer. In addition, the processor 140 may receive a plurality of image frames from the display apparatus 200 . Alternatively, when it is determined that the user's gesture is a preset gesture through the camera 210 , the display apparatus 200 may transmit a plurality of image frames displayed on the display apparatus 200 to the user terminal apparatus 100 .
  • the processor 140 displays an indicator 610 for selecting one image frame among a plurality of image frames on the display 130 , and through the indicator 610 , a plurality of It is possible to receive a user command for selecting one image frame from among the image frames of .
  • the user command may be a user's touch input or a touch-and-drag input, but is not limited thereto.
  • the processor 140 may display information on the object included in the image frame selected according to a user command on the display 130 .
  • the processor 140 may identify an object included in the selected image frame using the above-described object recognition algorithm or artificial intelligence model, and display information on the identified object on the display 130 .
  • the processor 140 may transmit information on the selected image frame to the display apparatus 200 , receive information about an object included in the selected image frame from the display apparatus 200 , and display it on the display 130 . have.
  • the user can easily select an image frame including the object of interest and check the object of interest.
  • the processor 140 may display information on a plurality of applications related to the object along with the information on the object on the display 130 .
  • the object-related application is an application capable of providing information or performing a function using the identified object.
  • the identified object is an actor, an application capable of providing profile information of the actor, the actor It may be an application that can provide information about a drama or movie that has appeared, and if the identified object is a product such as a car, an application that can provide specification information about the product, information about a shop that sells the product It may be an application that provides , and if the identified object is a store such as a cafe, it may be an application capable of providing a home page screen of the store.
  • the processor 140 displays information on the object on the display 130 , and when a user command for selecting an object is received, the processor 140 displays information on the object and information on a plurality of applications related to the object on the display 130 . ) can be displayed. For example, referring to FIG. 7 , the processor 140 displays, on the display 130 , an image in which a user interface (UI) corresponding to the object is superimposed on the image displayed on the display apparatus 200 in an area where the object is located.
  • UI user interface
  • information on an object corresponding to the selected UI and information on a plurality of applications related to an object corresponding to the selected UI may be displayed on the display 130 .
  • the processor 140 may provide information on car A or perform a function by using car A, an application for web search, and a specification search for An application, an application for sharing information, and an application for shopping may be displayed.
  • the plurality of applications displayed here may be changed based on the user's history information.
  • the user's history information includes information on the number of executions of a plurality of applications, and may be updated whenever the user executes the application.
  • the processor 140 may acquire information on the number of executions of a plurality of applications based on the user's history information.
  • the processor 140 may display information on a plurality of applications listed in the order of the applications having the highest number of executions on the display 130 . If the user's history information is not stored, the processor 140 may display information on a plurality of applications on the display 130 according to a default order.
  • the processor 140 displays a plurality of applications related to car A on the display 130 in a default order, and the user If car A is selected in a state in which there is history information of , information on a plurality of applications listed in the order of the applications having the highest number of executions among the plurality of applications may be displayed on the display 130 . Accordingly, the user may be provided with information on a plurality of personalized applications.
  • the processor 140 may display a screen provided by the selected application on the display 130 based on the information on the object. .
  • the processor 130 executes the selected application and is a server that provides a service through the corresponding application, the identified object information can be transmitted.
  • the processor 140 may receive an image provided by the server from the server based on the information on the identified object. For example, as shown in FIG. 9 , when car A is selected and an application for web search is selected, the processor 140 requests a web search service server providing a web search service to perform a web search for car A as a keyword. , and can receive information about a web searched page with car A as a keyword from the server.
  • the processor 140 may display a screen provided by the application on the display 130 based on the information on the image received from the server.
  • the processor 140 may execute a preset application when information on the identified object is selected. Specifically, the processor 140 displays information on the identified object on the display 130 , and when a user command for selecting an object is received, a screen provided by a preset application using the selected object is displayed on the display 130 . can be displayed in For example, referring to FIG. 10 , the processor 140 displays a plurality of objects on the display 130 , and when a user command for selecting one of the plurality of objects is received, a preset application is provided based on the selected object. screen can be displayed. As shown in FIG. 10 , if the preset application is an application for web search, the processor 130 may display a web search page using the selected object as a keyword on the display 130 .
  • the user terminal device 100 displays information on an object and information on a plurality of applications related to the object.
  • the user terminal device 100 may display a screen provided by the specific application based on the specific object included in the image.
  • FIGS. 11 to 14 it will be described with reference to FIGS. 11 to 14 .
  • the processor 140 may determine whether the user's gesture is a gesture for executing a specific application based on the sensed data received from the sensor 120 . Specifically, the processor 140 may compare the user's gesture with information on a plurality of pre-stored gestures to determine whether the user's gesture is a gesture for executing a specific application.
  • the processor 140 selects an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device 200 .
  • the user terminal device 100 may match and store information on at least one application capable of performing a function using the object for each object. For example, when the user's gesture is determined to be a gesture for executing a call application, the processor 140 determines an object representing a phone number from among a plurality of objects included in the image, and the user's gesture determines the execution of the map application.
  • the object indicating the location may be a name of a region as well as a business name of a restaurant or the like.
  • the processor 140 may identify an object required to execute a function of a specific application from the image. Specifically, as described above, the processor 140 may identify an object required for execution of a function of a specific application from an image using an object recognition algorithm or an artificial intelligence model. To this end, the processor 140 may receive information about an image displayed on the display apparatus 200 from the display apparatus 200 .
  • the identification of the object may be performed by the display apparatus 200 .
  • the display device 200 may display a function of a specific application among a plurality of objects included in an image displayed on the display device 200 . It is possible to identify an object necessary for the execution of , and transmit information on the identified object to the user terminal device 100 .
  • the processor 140 may display a screen provided by a specific application on the display 130 based on the identified object. Specifically, the processor 140 may execute a specific application corresponding to the user's gesture, and display an application execution screen based on the identified object on the display 130 . As an example, referring to FIG. 11 , when the user's gesture is a gesture for executing a call application, the processor 140 identifies an object representing a phone number from among a plurality of objects included in an image, and assigns the number to the identified phone number. Based on the screen provided by the call application may be displayed on the display 130 .
  • the processor 140 receives an image displayed on the display device from the display device 200 and receives the image displayed on the display device from the display device 200 .
  • a screen provided by the photo application may be displayed on the display 130 based on the image.
  • the processor 140 transmits a signal requesting transmission of the image displayed on the display apparatus 200 to the display apparatus 200 , and the display apparatus 200 ), the received image may be stored, and the stored image may be displayed on the display 130 through a photo application.
  • the processor 140 identifies an object indicating a location, such as a region name or a business name, among a plurality of objects included in the image, A screen provided by the map application may be displayed on the display 130 based on the identified object.
  • the processor 140 executes the map application, transmits information on the region name, etc. identified as a server providing a service through the map application, and the server A screen including map information for a corresponding area may be received from the display 130 and displayed on the display 130 .
  • the processor 140 receives an audio signal output from the display apparatus 200 from the display apparatus 200, and based on the audio signal, the display apparatus At 200 , the title of the output music may be determined. Specifically, the processor 140 receives the audio signal output from the display device 200 through a speaker, and analyzes the frequency, tempo, energy, etc. of the audio signal, so that the title of the music output from the display device 200 is displayed. can judge In addition, the processor 140 may execute a music application based on the title of the music to output the music being output on the display device 200 .
  • user convenience can be improved in that the user terminal device 100 can execute a specific object using a specific object only with a user's gesture.
  • 15 is a detailed block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
  • the user terminal device 100 includes a communication unit 110 , a sensor 120 , a display 130 , a storage unit 140 , an input unit 150 , and a microphone 160 . ) and a processor 170 .
  • a communication unit 110 includes a communication unit 110 , a sensor 120 , a display 130 , a storage unit 140 , an input unit 150 , and a microphone 160 .
  • a processor 170 includes a processor 170 .
  • the communication unit 110 may communicate with the display apparatus 200 .
  • the communication unit 110 may communicate with the display apparatus 200 through account information of the user terminal apparatus 100 .
  • the communication unit 110 may communicate with the display device 200 through a server that provides an account service. . Accordingly, the communication unit 110 may communicate with the display apparatus 200 to receive information about the object.
  • the storage unit 140 may store an operating system (OS) for controlling overall operations of the components of the user terminal device 100 and commands or data related to the components of the user terminal device 100 .
  • OS operating system
  • the processor 170 may control a plurality of hardware or software components of the user terminal device 100 using various commands or data stored in the storage unit 140 , and at least one of the other components.
  • the command or data received from the volatile memory may be loaded and processed, and various data may be stored in the non-volatile memory.
  • the storage 140 may store information on a plurality of gestures.
  • the storage unit 140 may store information on a gesture for displaying information on an object included in an image displayed on the display device 200 and information on a plurality of applications related to the object, and information on a specific application for executing a specific application. Information about the gesture can be stored.
  • the storage 140 may store information on a plurality of applications matched to a plurality of objects. Accordingly, when a user command for selecting one of a plurality of objects included in the image is received, the processor 170 provides information on a plurality of applications related to the selected object based on information on a plurality of applications matched with the plurality of objects. information may be displayed on the display 130 . In addition, when the user's gesture is determined to be a gesture for executing a specific application, the processor 140 determines a specific object matched to a specific application based on information on a plurality of applications matched to the plurality of objects, A specific object can be identified in an image.
  • the storage 140 may store information about an object recognition algorithm or artificial intelligence model capable of identifying an object included in an image.
  • the input unit 150 may receive various user commands.
  • the processor 170 may execute a function corresponding to a user command input through the input unit 150 .
  • the input unit 150 may receive a drag input based on a user's gesture.
  • the processor 140 determines the user's gesture based on the drag input, and when it is determined that the user's gesture is a preset gesture, information on the object included in the image displayed on the display apparatus 200 and the object Information on a plurality of applications related to may be displayed on the display 130 .
  • the processor 140 may display a screen provided by the specific application on the display 130 based on the object included in the image displayed on the display device 200 .
  • the processor 150 executes the map application and displays a screen provided by the map application based on the region name included in the image on the display 130 . ) can be displayed.
  • the input unit 260 may be implemented as an input panel.
  • the input panel may be implemented in the form of a touch pad or a keypad including various function keys, number keys, special keys, character keys, or the like, or a touch screen method.
  • the microphone 160 may receive a user's voice.
  • the user's voice may be a voice for executing a specific function of the user terminal device 100 .
  • the processor 170 may analyze the user's voice through a speech to text (STT) algorithm and perform a function corresponding to the user's voice.
  • STT speech to text
  • the processor 170 displays information on an object included in an image displayed on the display device 200 and information on a plurality of applications related to the object. (130) can be indicated.
  • a speaker may output various audio.
  • a speaker may output various sounds provided by a music application.
  • 16 is a view for explaining a display device according to an embodiment of the present disclosure.
  • the display apparatus 200 includes a camera 210 , a communication unit 220 , a display 230 , a storage unit 240 , an input unit 250 , and a microphone 260 . , a speaker 270 , a signal processing unit 280 , and a processor 290 .
  • the camera 210 may generate an image by photographing a subject.
  • the camera 210 may generate an image including the user by photographing the user in front of the display apparatus 200 .
  • the processor 290 may analyze the plurality of images captured by the camera 210 to determine the user's gesture.
  • the camera 210 may be disposed on a panel above the center of the display device 200 , but is not limited thereto, and may be disposed at various locations such as a panel below the center of the display device 200 .
  • an image captured by the camera 170 may be stored in the storage unit 240 .
  • the communication unit 220 may communicate with an external device to transmit/receive various data.
  • the communication unit 220 may communicate with a server through a local area network (LAN), an Internet network, and a mobile communication network, as well as a mobile communication network, BT (Bluetooth), BLE (Bluetooth) Low Energy), WI-FI (Wireless Fidelity), Zigbee, NFC, etc. may communicate with the user terminal device 100 through various communication methods.
  • the communication unit 220 may include various communication modules for performing network communication.
  • the communication unit 220 may include a Bluetooth module, a Wi-Fi module, a wireless communication module, and the like.
  • the communication unit 220 may communicate with an external device to receive broadcast content (or broadcast signal).
  • the broadcast content may include at least one of video, audio, and additional data (eg, EPG).
  • the communication unit 220 may include a tuner (not shown), a demodulator (not shown), an equalizer (not shown), and the like.
  • the storage unit 240 may store an operating system (OS) for controlling overall operations of the components of the display apparatus 200 and commands or data related to components of the display apparatus 200 .
  • OS operating system
  • the processor 290 may control a plurality of hardware or software components of the display apparatus 200 by using various commands or data stored in the storage unit 240 , and use at least one of the other components.
  • the received command or data may be loaded into the volatile memory for processing, and various data may be stored in the non-volatile memory.
  • the storage unit 240 may store information on a plurality of gestures.
  • the storage unit 240 may include information on a gesture for transmitting information on an object included in an image displayed on the display device 200 to the user terminal device 100 and a specific information required for executing a function of a specific application. Information about a gesture for transmitting information about an object to the user terminal device 100 may be stored.
  • the storage unit 240 may store information about an object recognition algorithm or artificial intelligence model capable of identifying an object included in an image.
  • the input unit 250 may receive various user commands.
  • the processor 290 may execute a function corresponding to a user command input through the input unit 250 .
  • the input unit 250 may receive a user command for transmitting information on an object.
  • the processor 290 may transmit information on the object included in the image displayed on the display 230 to the user terminal device 100 .
  • the input unit 250 may be implemented as an input panel.
  • the input panel may be implemented in the form of a touch pad or a keypad including various function keys, number keys, special keys, character keys, or the like, or a touch screen method.
  • the microphone 260 may receive a user's voice.
  • the user's voice may be a voice for executing a specific function of the display apparatus 200 .
  • the processor 290 may analyze the user's voice through a speech to text (STT) algorithm and perform a function corresponding to the user's voice.
  • STT speech to text
  • the processor 290 transmits information on the object included in the image displayed on the display 230 to the user terminal device 100 . can be sent to
  • the speaker 270 may output various sounds.
  • the speaker 270 may output sound of broadcast content.
  • the signal processing unit 280 performs signal processing on the content received through the communication unit 220 .
  • the signal processing unit 280 may perform operations such as decoding, scaling, and frame rate conversion on an image constituting the content to signal the image in a form that can be output by the display apparatus 200 .
  • the signal processing unit 280 may perform signal processing such as decoding on the audio constituting the content to process the audio signal in a form that can be output from the speaker 270 .
  • the display 230 may display an image output from the signal processor 280 , and the speaker 270 may output audio output from the signal processor 290 .
  • the processor 290 controls the overall operation of the display apparatus 200 .
  • the processor 290 may include at least one of a central processing unit (CPU), an application processor (AP), or a communication processor (CP).
  • CPU central processing unit
  • AP application processor
  • CP communication processor
  • the processor 290 may control hardware or software components connected to the processor 290 by driving an operating system or an application program, and may perform various data processing and operations.
  • the processor 290 may load and process commands or data received from at least one of the other components into the volatile memory, and store various data in the non-volatile memory.
  • the processor 290 may control the communication unit 220 to transmit information on an object included in an image displayed on the display 230 to the user terminal device 100 .
  • information on the object may be obtained through image analysis, as described above.
  • the present invention is not limited thereto, and the processor 290 may transmit the metadata to the user terminal device 100 when metadata including information on an object is received from a server providing an image. In this case, the user terminal device 100 may display information on the object based on the information on the object included in the metadata.
  • 17 is a flowchart illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
  • the user terminal device 100 determines the user's gesture based on the movement of the user terminal device 100 (S1710).
  • the user terminal device 100 provides sensing data including information on the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis. Based on , it is possible to determine the tilt angle of the user terminal device 100 based on the gravitational acceleration, and the x-axis, y-axis, and z of the user terminal device 100 sensed by the sensor 120 for a predetermined time. The movement of the user terminal device 100 may be determined based on the amount of acceleration change in the axis. In addition, the user terminal device 100 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
  • the user terminal device 100 converts the Coriolis force measured based on the rotation of the user terminal device 100 into an electrical signal. Based on the sensing data, the user The degree of rotation of the terminal device 100 may be determined, and the user's gesture may be determined based thereon.
  • the user terminal device 100 may receive information about an object included in an image displayed on the display device 200 from the display device 200 ( S1720 ).
  • the user terminal device 100 may transmit a signal requesting information on an object included in the image displayed on the display device 200 to the display device 200 .
  • the user terminal device 100 may pre-store information about a preset gesture.
  • the display apparatus 200 may transmit information about an object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 .
  • the display apparatus 200 may transmit an image in which a UI is superimposed on an image displayed on the display apparatus 200 based on information on an object to the user terminal apparatus 100 .
  • the user terminal device 100 may display information on the object and information on a plurality of applications related to the object on the display ( S1730 ).
  • the object-related application is an application that can provide information or perform a function using the identified object, for example, if the identified object is an actor A, an application that can provide profile information of the actor A; It may be an application that can provide information about a drama or movie in which actor A appeared.
  • the user terminal device 100 may display a screen provided by the selected application on the display based on the information on the object ( S1740 ).
  • the user terminal device 100 may display a screen provided by the application on the display using the identified object.
  • the user terminal device 100 transmits a signal requesting a web search for car A as a keyword to a server providing a web search service, and from the server It is possible to receive information about a page searched for on the web with the keyword car A.
  • the user terminal device 100 may display a screen provided by the application on the display based on the information about the image received from the server.
  • a non-transitory computer readable medium in which a program for sequentially executing the method of controlling a user terminal device according to the present invention is stored may be provided.
  • the non-transitory readable medium refers to a medium that stores data semi-permanently, not a medium that stores data for a short moment, such as a register, cache, memory, etc., and can be read by a device.
  • a non-transitory readable medium such as a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.

Abstract

Disclosed is a user terminal device. The user terminal device comprises: a communication unit; a display; a sensor; and a processor which, when a motion of the user terminal device caused by a gesture of a user is detected through the sensor, determines the gesture of the user on the basis of the motion of the user terminal device. If the gesture of the user is determined to be a preset gesture, the processor receives information about an object included in an image displayed on the display device from the display device through the communication unit, and displays information about the object and information about a plurality of applications related to the object on the display. If a user command for selecting one of the plurality of applications is received, the processor displays a screen provided by the selected application on the display on the basis of the information about the object.

Description

사용자 단말 장치 및 그 제어 방법User terminal device and its control method
본 개시는 사용자 단말 장치 및 그 제어 방법에 관한 것으로, 보다 상세하게는 사용자의 제스처에 기초하여 동작하는 사용자 단말 장치 및 그 제어 방법에 관한 것이다.The present disclosure relates to a user terminal device and a control method thereof, and more particularly, to a user terminal device operating based on a user's gesture and a control method thereof.
TV 등의 디스플레이 장치를 통해 영상을 시청하는 사용자는, 영상을 시청하는 동안 영상에 포함된 오브젝트에 대해 관심을 가질 수 있다. 일 예로, 드라마를 시청하는 사용자는 영상에 포함된 배우, 자동차, 건물 등에 대해 관심을 가질 수 있다. A user who views an image through a display device such as a TV may be interested in an object included in the image while watching the image. For example, a user watching a drama may be interested in actors, cars, buildings, etc. included in the image.
이 경우, 사용자는 스마트 폰 등의 사용자 단말 장치에 설치된 웹 검색을 위한 어플리케이션을 실행하고, 오브젝트에 대한 검색을 수행하는 것이 일반적이다. 그러나, 영상에 포함된 오브젝트의 이름이나 명칭 등을 사용자가 알지 못하는 경우, 사용자는 오브젝트에 대한 검색을 수행하지 못하는 문제가 있다.In this case, it is common for the user to execute an application for web search installed in a user terminal device such as a smart phone and search for an object. However, when the user does not know the name or name of the object included in the image, there is a problem in that the user cannot search for the object.
한편, 최근에는 이러한 문제점을 해결하기 위해, 화면을 분할하여, 디스플레이의 제1 영역에는 드라마 등의 메인 영상을 표시하고 디스플레이의 제2 영역에는 메인 영상과 관련된 부가 영상을 표시하는 스마트 TV가 개발되고 있다. 그러나, 이는 메인 영상의 크기가 작아짐으로 인해, 사용자로 하여금 영상의 시청에 방해를 줄 수 있다.Meanwhile, in recent years, in order to solve this problem, a smart TV has been developed that divides the screen to display a main image such as a drama in a first area of the display and displays an additional image related to the main image in a second area of the display. have. However, this may interfere with the user's viewing of the image due to the reduction in the size of the main image.
본 개시는 상술한 문제점을 해결하기 위해 안출된 것으로, 본 개시의 목적은 디스플레이 장치에서 재생 중인 영상과 관련된 부가 정보를 제공할 수 있는 사용자 단말 장치 및 그 제어 방법을 제공함에 있다.The present disclosure has been devised to solve the above problems, and an object of the present disclosure is to provide a user terminal device capable of providing additional information related to an image being reproduced on a display device, and a method for controlling the same.
상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 사용자 단말 장치는 통신부, 디스플레이, 센서 및 사용자의 제스처에 의한 상기 사용자 단말 장치의 움직임이 상기 센서를 통해 감지되면, 상기 사용자 단말 장치의 움직임에 기초하여 상기 사용자의 제스처를 판단하고, 상기 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 영상에 포함된 오브젝트에 대한 정보를 상기 통신부를 통해 수신하고, 상기 오브젝트에 대한 정보 및, 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하며, 상기 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 상기 오브젝트에 대한 정보에 기초하여 상기 선택된 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는 프로세서를 포함할 수 있다.In a user terminal device according to an embodiment of the present disclosure for achieving the above object, when a movement of the user terminal device by a communication unit, a display, a sensor, and a user's gesture is detected through the sensor, the user terminal device The user's gesture is determined based on the user's gesture, and when it is determined that the user's gesture is a preset gesture, information on an object included in the image displayed on the display device is received from the display device through the communication unit, and the object information on and information on a plurality of applications related to the object are displayed on the display, and when a user command for selecting one of the plurality of applications is received, the selected application based on the information on the object It may include a processor for displaying the provided screen on the display.
그리고, 상기 프로세서는, 상기 오브젝트에 대한 정보를 상기 디스플레이에 표시하고, 상기 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시할 수 있다.In addition, the processor displays information on the object on the display, and when a user command for selecting the object is received, information on the object and information on a plurality of applications related to the object on the display can be displayed
그리고, 상기 프로세서는, 상기 디스플레이 장치에 표시된 영상에, 상기 오브젝트에 대응되는 UI를 중첩한 영상을 상기 디스플레이에 표시하며, 상기 UI를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시할 수 있다.In addition, the processor displays an image in which a UI corresponding to the object is superimposed on the image displayed on the display device, and when a user command for selecting the UI is received, information on the object and the Information on a plurality of applications related to the object may be displayed on the display.
그리고, 상기 프로세서는, 상기 사용자의 히스토리 정보에 기초하여, 복수의 어플리케이션의 실행 횟수에 대한 정보를 획득하고, 상기 실행 횟수에 대한 정보에 기초하여 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시할 수 있다.In addition, the processor may obtain information on the number of executions of a plurality of applications based on the user's history information, and display information on the plurality of applications on the display based on the information on the number of executions. have.
그리고, 상기 프로세서는, 상기 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 복수의 영상 프레임을 수신하고, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터를 상기 디스플레이에 표시하며, 상기 인디케이터를 통해, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령이 수신되면, 상기 선택된 영상 프레임에 포함된 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시할 수 있다.Then, the processor receives, from the display device, a plurality of image frames displayed on the display device, and displays an indicator for selecting one image frame among the plurality of image frames on the display, through the indicator , when a user command for selecting one image frame from among the plurality of image frames is received, information on an object included in the selected image frame and information on a plurality of applications related to the object may be displayed on the display. have.
그리고, 상기 프로세서는, 상기 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 상기 특정 어플리케이션의 기능의 실행을 위해 필요한 오브젝트를 판단하고, 상기 오브젝트에 기초하여 상기 특정 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시할 수 있다.And, when the user's gesture is determined to be a gesture for executing a specific application, the processor determines an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device, , a screen provided by the specific application may be displayed on the display based on the object.
그리고, 상기 프로세서는, 상기 특정 어플리케이션이 통화 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 전화 번호를 나타내는 오브젝트를 판단하고, 상기 전화 번호에 기초하여 상기 통화 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시할 수 있다.In addition, when the specific application is a call application, the processor determines an object representing a phone number from among a plurality of objects included in the image displayed on the display device, and a screen provided by the call application based on the phone number may be displayed on the display.
그리고, 상기 프로세서는, 상기 특정 어플리케이션이 지도 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 위치를 나타내는 오브젝트를 판단하고, 상기 위치에 기초하여 상기 지도 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시할 수 있다.In addition, when the specific application is a map application, the processor determines an object indicating a location from among a plurality of objects included in the image displayed on the display device, and displays a screen provided by the map application based on the location. can be displayed on the display.
그리고, 상기 프로세서는, 상기 사용자의 제스처가 화면 캡쳐를 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에 표시된 영상을 수신하고, 상기 영상에 기초하여 사진 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시할 수 있다.In addition, when the user's gesture is determined as a gesture for screen capture, the processor receives an image displayed on the display device from the display device, and displays a screen provided by a photo application on the display based on the image. can be displayed
그리고, 상기 프로세서는, 상기 사용자의 제스처가 음악 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에서 출력된 오디오 신호를 수신하고, 상기 오디오 신호에 기초하여 상기 디스플레이 장치에서 출력된 음악의 제목을 판단하며, 상기 음악의 제목에 기초하여 상기 음악 어플리케이션을 실행할 수 있다.In addition, when the user's gesture is determined as a gesture for executing a music application, the processor receives an audio signal output from the display device from the display device, and outputs the audio signal from the display device based on the audio signal The title of the music may be determined, and the music application may be executed based on the title of the music.
한편, 본 개시의 일 실시 예에 따른 사용자 단말 장치의 제어 방법은, 사용자의 제스처에 의한 상기 사용자 단말 장치의 움직임이 감지되면, 상기 사용자 단말 장치의 움직임에 기초하여 상기 사용자의 제스처를 판단하는 단계, 상기 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 영상에 포함된 오브젝트에 대한 정보를 수신하는 단계, 상기 오브젝트에 대한 정보 및, 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는 단계 및 상기 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 상기 오브젝트에 대한 정보에 기초하여 상기 선택된 어플리케이션이 제공하는 화면을 표시하는 단계를 포함할 수 있다.On the other hand, the control method of the user terminal device according to an embodiment of the present disclosure, when the motion of the user terminal device by the user's gesture is detected, determining the user's gesture based on the movement of the user terminal device , when it is determined that the user's gesture is a preset gesture, receiving, from a display device, information on an object included in an image displayed on the display device, information on the object, and a plurality of applications related to the object and displaying a screen provided by the selected application based on the information on the object when a user command for selecting one of the plurality of applications is received.
그리고, 상기 정보를 표시하는 단계는, 상기 오브젝트에 대한 정보를 표시하고, 상기 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시할 수 있다.In addition, the displaying of the information may include displaying information on the object, and when a user command for selecting the object is received, display information on the object and information on a plurality of applications related to the object. can
그리고, 상기 정보를 표시하는 단계는, 상기 디스플레이 장치에 표시된 영상에, 상기 오브젝트에 대응되는 UI를 중첩한 영상을 표시하고, 상기 UI를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시할 수 있다.In addition, the displaying of the information includes displaying an image in which a UI corresponding to the object is superimposed on the image displayed on the display device, and when a user command for selecting the UI is received, information on the object and Information on a plurality of applications related to the object may be displayed.
그리고, 상기 정보를 표시하는 단계는, 상기 사용자의 히스토리 정보에 기초하여, 복수의 어플리케이션의 실행 횟수에 대한 정보를 획득하고, 상기 실행 횟수에 대한 정보에 기초하여 복수의 어플리케이션에 대한 정보를 표시할 수 있다.And, the displaying of the information may include obtaining information on the number of executions of a plurality of applications based on the user's history information, and displaying information on the plurality of applications based on the information on the number of executions. can
그리고, 상기 정보를 표시하는 단계는, 상기 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 복수의 영상 프레임을 수신하고, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터를 표시하며, 상기 인디케이터를 통해, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령이 수신되면, 상기 선택된 영상 프레임에 포함된 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시할 수 있다.And, the displaying of the information includes receiving, from the display device, a plurality of image frames displayed on the display device, displaying an indicator for selecting one image frame from among the plurality of image frames, and setting the indicator. Through this, when a user command for selecting one image frame from among the plurality of image frames is received, information on an object included in the selected image frame and information on a plurality of applications related to the object may be displayed.
그리고, 상기 제어 방법은, 상기 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 상기 특정 어플리케이션의 기능의 실행을 위해 필요한 오브젝트를 판단하고, 상기 오브젝트에 기초하여 상기 특정 어플리케이션이 제공하는 화면을 표시하는 단계를 더 포함할 수 있다.In the control method, when it is determined that the user's gesture is a gesture for executing a specific application, the control method determines an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device. and displaying a screen provided by the specific application based on the object.
그리고, 상기 화면을 표시하는 단계는, 상기 특정 어플리케이션이 통화 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 전화 번호를 나타내는 오브젝트를 판단하고, 상기 전화 번호에 기초하여 상기 통화 어플리케이션이 제공하는 화면을 표시할 수 있다.In addition, the displaying of the screen may include determining an object representing a phone number from among a plurality of objects included in the image displayed on the display device when the specific application is a call application, and based on the phone number, the call application The screen provided by this can be displayed.
그리고, 상기 화면을 표시하는 단계는, 상기 특정 어플리케이션이 지도 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 위치를 나타내는 오브젝트를 판단하고, 상기 위치에 기초하여 상기 지도 어플리케이션이 제공하는 화면을 표시할 수 있다.The displaying of the screen may include determining an object indicating a location from among a plurality of objects included in the image displayed on the display device when the specific application is a map application, and providing the map application based on the location screen can be displayed.
그리고, 상기 제어 방법은, 상기 사용자의 제스처가 화면 캡쳐를 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에 표시된 영상을 수신하고, 상기 영상에 기초하여 사진 어플리케이션이 제공하는 화면을 표시하는 단계를 더 포함할 수 있다.In addition, the control method includes receiving an image displayed on the display device from the display device when the user's gesture is determined as a gesture for screen capture, and displaying a screen provided by a photo application based on the image It may include further steps.
그리고, 상기 제어 방법은, 상기 사용자의 제스처가 음악 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에서 출력된 오디오 신호를 수신하고, 상기 오디오 신호에 기초하여 상기 음악 어플리케이션을 실행하는 단계를 더 포함할 수 있다.In addition, the control method includes receiving an audio signal output from the display device from the display device when it is determined that the user's gesture is a gesture for executing a music application, and executing the music application based on the audio signal It may further include the step of executing.
이상과 같은 본 개시의 다양한 실시 예에 따르면, 사용자의 제스처에 기초하여, 디스플레이 장치에 표시된 영상과 관련된 부가 정보를 제공할 수 있는 사용자 단말 장치 및 그 제어 방법이 제공될 수 있다.According to various embodiments of the present disclosure as described above, a user terminal device capable of providing additional information related to an image displayed on a display device based on a user's gesture and a control method thereof may be provided.
도 1은 본 개시의 일 실시 예에 따른 사용자 단말 장치의 동작을 개략적으로 설명하기 위한 도면이다.1 is a diagram schematically illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
도 2는 본 개시의 일 실시 예에 따른 사용자 단말 장치를 설명하기 위한 블록도이다.2 is a block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
도 3a는 본 개시의 일 실시 예에 따른 사용자의 제스처를 도시한 도면이다.3A is a diagram illustrating a user's gesture according to an embodiment of the present disclosure.
도 3b는 본 개시의 일 실시 예에 따른 디스플레이 장치가 사용자의 제스처를 인식하는 실시 예를 설명하기 위한 도면이다.3B is a diagram for explaining an embodiment in which a display device recognizes a user's gesture according to an embodiment of the present disclosure;
도 4는 본 개시의 일 실시 예에 따른 오브젝트에 대한 정보를 표시하는 실시 예를 설명하기 위한 도면이다.4 is a view for explaining an embodiment of displaying information on an object according to an embodiment of the present disclosure.
도 5는 본 개시의 일 실시 예에 따른 오브젝트에 대한 정보를 상이한 형식으로 디스플레이의 복수의 영역에 표시하는 실시 예를 설명하기 위한 도면이다.5 is a view for explaining an embodiment of displaying information about an object on a plurality of areas of a display in different formats according to an embodiment of the present disclosure;
도 6은 본 개시의 일 실시 예에 따른 인디케이터를 설명하기 위한 도면이다.6 is a view for explaining an indicator according to an embodiment of the present disclosure.
도 7은 본 개시의 일 실시 예에 따른 오브젝트에 대한 정보 및, 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는 실시 예를 설명하기 위한 도면이다.7 is a view for explaining an embodiment of displaying information on an object and information on a plurality of applications related to an object according to an embodiment of the present disclosure.
도 8은 본 개시의 일 실시 예에 따른 사용자의 히스토리 정보에 따라 상이한 복수의 어플리케이션에 대한 정보를 표시하는 실시 예를 설명하기 위한 도면이다.8 is a view for explaining an embodiment of displaying information on a plurality of different applications according to user history information according to an embodiment of the present disclosure.
도 9는 본 개시의 일 실시 예에 따른 오브젝트를 이용하여 어플리케이션이 제공하는 화면을 설명하기 위한 도면이다.9 is a diagram for explaining a screen provided by an application using an object according to an embodiment of the present disclosure.
도 10은 본 개시의 일 실시 예에 따른 오브젝트를 이용하여 기설정된 어플리케이션이 제공하는 화면을 설명하기 위한 도면이다.10 is a diagram for explaining a screen provided by a preset application using an object according to an embodiment of the present disclosure.
도 11은 본 개시의 일 실시 예에 따른 통화 어플리케이션을 실행하는 실시 예를 설명하기 위한 도면이다.11 is a diagram for explaining an embodiment of executing a call application according to an embodiment of the present disclosure.
도 12는 본 개시의 일 실시 예에 따른 사진 어플리케이션을 실행하는 실시 예를 설명하기 위한 도면이다.12 is a diagram for explaining an embodiment of executing a photo application according to an embodiment of the present disclosure.
도 13은 본 개시의 일 실시 예에 따른 지도 어플리케이션을 실행하는 실시 예를 설명하기 위한 도면이다.13 is a diagram for explaining an embodiment of executing a map application according to an embodiment of the present disclosure.
도 14는 본 개시의 일 실시 예에 따른 음악 어플리케이션을 실행하는 실시 예를 설명하기 위한 도면이다.14 is a diagram for explaining an embodiment of executing a music application according to an embodiment of the present disclosure.
도 15는 본 개시의 일 실시 예에 따른 사용자 단말 장치를 설명하기 위한 상세 블록도이다.15 is a detailed block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
도 16은 본 개시의 일 실시 예에 따른 디스플레이 장치를 설명하기 위한 도면이다.16 is a view for explaining a display device according to an embodiment of the present disclosure.
도 17은 본 개시의 일 실시 예에 따른 사용자 단말 장치의 동작을 설명하기 위한 흐름도이다.17 is a flowchart illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
이하, 본 문서의 다양한 실시 예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 문서의 실시 예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.Hereinafter, various embodiments of the present document will be described with reference to the accompanying drawings. However, it is not intended to limit the technology described in this document to specific embodiments, and it should be understood that various modifications, equivalents, and/or alternatives of the embodiments of this document are included. . In connection with the description of the drawings, like reference numerals may be used for like components.
본 문서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.In this document, expressions such as "has," "may have," "includes," or "may include" refer to the presence of a corresponding characteristic (eg, a numerical value, function, operation, or component such as a part). and does not exclude the presence of additional features.
본 문서에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.In this document, expressions such as "A or B," "at least one of A or/and B," or "one or more of A or/and B" may include all possible combinations of the items listed together. . For example, "A or B," "at least one of A and B," or "at least one of A or B" means (1) includes at least one A, (2) includes at least one B; Or (3) it may refer to all cases including both at least one A and at least one B.
본 문서에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. As used herein, expressions such as "first," "second," "first," or "second," may modify various elements, regardless of order and/or importance, and refer to one element. It is used only to distinguish it from other components, and does not limit the components.
어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제 3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.A component (eg, a first component) is "coupled with/to (operatively or communicatively)" to another component (eg, a second component) When referring to "connected to", it will be understood that the certain element may be directly connected to the other element or may be connected through another element (eg, a third element). On the other hand, when it is said that a component (eg, a first component) is "directly connected" or "directly connected" to another component (eg, a second component), the component and the It may be understood that other components (eg, a third component) do not exist between other components.
본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.As used herein, the expression "configured to (or configured to)" depends on the context, for example, "suitable for," "having the capacity to ," "designed to," "adapted to," "made to," or "capable of." The term “configured (or configured to)” may not necessarily mean only “specifically designed to” in hardware. Instead, in some circumstances, the expression “a device configured to” may mean that the device is “capable of” with other devices or parts. For example, the phrase “a processor configured (or configured to perform) A, B, and C” refers to a dedicated processor (eg, an embedded processor) for performing the operations, or by executing one or more software programs stored in a memory device. , may mean a generic-purpose processor (eg, a CPU or an application processor) capable of performing corresponding operations.
이하, 첨부된 도면을 참조하여 본 개시를 상세히 설명한다.Hereinafter, the present disclosure will be described in detail with reference to the accompanying drawings.
도 1은 본 개시의 일 실시 예에 따른 사용자 단말 장치의 동작을 개략적으로 설명하기 위한 도면이다.1 is a diagram schematically illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
본 개시의 일 실시 예에 따른 사용자 단말 장치(100)는 디스플레이 장치(200)와 통신을 수행하여 다양한 데이터를 송수신할 수 있다. 이를 위해, 사용자 단말 장치(100)는 와이파이, 블루투스 등과 같은 다양한 통신 방식을 통해, 디스플레이 장치(200)와 통신 연결될 수 있다.The user terminal device 100 according to an embodiment of the present disclosure may transmit/receive various data by performing communication with the display device 200 . To this end, the user terminal device 100 may be communicatively connected to the display device 200 through various communication methods such as Wi-Fi and Bluetooth.
일 예로, 사용자 단말 장치(100)는 사용자의 제스처가 인식되면, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 요청하는 신호를 디스플레이 장치(200)로 전송할 수 있다. 구체적으로, 사용자 단말 장치(100)는 센서를 통해 사용자 단말 장치(100)의 움직임이 감지되면, 사용자 단말 장치(100)의 움직임에 기초하여 사용자의 제스처를 판단하고, 사용자의 제스처가 기설정된 제스처인 것으로 판단되면, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 요청하는 신호를 디스플레이 장치(200)로 전송할 수 있다.For example, when the user's gesture is recognized, the user terminal device 100 may transmit a signal requesting information on an object included in an image displayed on the display device 200 to the display device 200 . Specifically, when a motion of the user terminal device 100 is detected through a sensor, the user terminal device 100 determines a user's gesture based on the motion of the user terminal device 100, and the user's gesture is a preset gesture. If it is determined that , a signal requesting information on an object included in an image displayed on the display apparatus 200 may be transmitted to the display apparatus 200 .
이 경우, 디스플레이 장치(200)는 디스플레이 장치(200)에 표시된 영상을 분석하여, 영상에 포함된 오브젝트를 식별할 수 있다. 여기에서, 식별되는 오브젝트는 영상에 포함된 텍스트, 숫자, 얼굴, 마크 등 다양한 오브젝트가 될 수 있다.In this case, the display apparatus 200 may analyze the image displayed on the display apparatus 200 to identify an object included in the image. Here, the identified object may be various objects such as text, numbers, faces, and marks included in the image.
구체적으로, 디스플레이 장치(200)는 사용자 단말 장치(100)로부터, 오브젝트에 대한 정보를 요청하는 신호가 수신되면, 디스플레이 장치(200)에 표시된 영상에 오브젝트 인식 알고리즘을 적용하여, 영상에 포함된 오브젝트를 식별할 수 있다. 여기에서, 오브젝트 인식 알고리즘은, 얼굴 인식 알고리즘, 텍스트 인식 알고리즘, 숫자 인식 알고리즘 등의 다양한 알고리즘이 될 수 있다. 또한, 디스플레이 장치(200)는 인공 지능 모델을 이용하여 영상에 포함된 오브젝트를 식별할 수도 있다. 구체적으로, 디스플레이 장치(200)는 사용자 단말 장치(100)로부터, 오브젝트에 대한 정보를 요청하는 신호가 수신되면, 영상의 특징 정보를 추출하는 컨볼루션 레이어(Convolutional Layer) 및 추출된 특징 정보에 기초하여 영상에 포함된 오브젝트를 식별하도록 학습된 풀리-커넥티드 레이어(Fully-connected Layer)를 포함하는 CNN Convolutional Neural Network) 모델을 통해, 영상에 포함된 오브젝트를 식별할 수 있다. 한편, 이는 일 실시 예로서, 디스플레이 장치(200)는 엣지 검출 알고리즘 등 다양한 방식을 통해 영상에 포함된 오브젝트를 식별할 수 있다.Specifically, when a signal for requesting information on an object is received from the user terminal device 100 , the display apparatus 200 applies an object recognition algorithm to the image displayed on the display apparatus 200 to obtain an object included in the image. can be identified. Here, the object recognition algorithm may be various algorithms such as a face recognition algorithm, a text recognition algorithm, and a number recognition algorithm. Also, the display apparatus 200 may identify an object included in an image using an artificial intelligence model. Specifically, when a signal for requesting information on an object is received from the user terminal device 100, the display apparatus 200 uses a convolutional layer for extracting image feature information and based on the extracted feature information. The object included in the image can be identified through the CNN Convolutional Neural Network model including the fully-connected layer, which is trained to identify the object included in the image. Meanwhile, this is an embodiment, and the display apparatus 200 may identify an object included in an image through various methods such as an edge detection algorithm.
그리고, 디스플레이 장치(200)는 식별된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다. 일 예로, 디스플레이 장치(200)는 영상에서 자동차 A가 식별된 경우이면, 자동차 A에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.In addition, the display apparatus 200 may transmit information on the identified object to the user terminal apparatus 100 . For example, when the car A is identified in the image, the display apparatus 200 may transmit information about the car A to the user terminal device 100 .
이에 따라, 사용자 단말 장치(100)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 표시할 수 있다. 구체적으로, 사용자 단말 장치(100)는 디스플레이 장치(200)로부터 오브젝트에 대한 정보가 수신되면, 사용자 단말 장치(100)에 설치된 웹 검색을 위한 어플리케이션을 통해 오브젝트를 키워드로 웹 검색을 수행하고, 웹 검색 결과로 획득한 정보를 사용자 단말 장치(100)의 디스플레이에 표시할 수 있다.Accordingly, the user terminal device 100 may display information on an object included in the image displayed on the display device 200 . Specifically, when information on an object is received from the display apparatus 200 , the user terminal device 100 performs a web search using the object as a keyword through the web search application installed in the user terminal device 100 , Information obtained as a result of the search may be displayed on the display of the user terminal device 100 .
일 예로, 도 1에 도시된 바와 같이, 디스플레이 장치(200)에 의해 식별된 오브젝트가 자동차 A이면, 사용자 단말 장치(100)는 자동차 A에 대한 정보를 디스플레이 장치(200)로부터 수신하고, 자동차 A를 키워드로 웹 검색한 결과를 사용자 단말 장치(100)의 디스플레이에 표시할 수 있다.For example, as shown in FIG. 1 , if the object identified by the display device 200 is a car A, the user terminal device 100 receives information about the car A from the display device 200, and the car A A web search result as a keyword may be displayed on the display of the user terminal device 100 .
이에 따라, 사용자는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 제공받을 수 있다. 특히, 사용자의 제스처에 의해 오브젝트에 대한 정보가 디스플레이 장치(200)에서 사용자 단말 장치(100)로 전송되므로, 사용자는 재생 중인 영상에 관심이 생기는 경우, 쉽고 빠르게 오브젝트에 대한 정보를 제공받을 수 있다. Accordingly, the user may be provided with information on the object included in the image displayed on the display apparatus 200 . In particular, since information about an object is transmitted from the display device 200 to the user terminal device 100 by a user's gesture, when a user is interested in an image being played, information about the object can be easily and quickly provided. .
도 2는 본 개시의 일 실시 예에 따른 사용자 단말 장치를 설명하기 위한 블록도이다.2 is a block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
도 2를 참조하면, 본 개시의 일 실시 예에 따른 사용자 단말 장치(100)는 통신부(110), 센서(120), 디스플레이(130) 및 프로세서(140)를 포함할 수 있다.Referring to FIG. 2 , the user terminal device 100 according to an embodiment of the present disclosure may include a communication unit 110 , a sensor 120 , a display 130 , and a processor 140 .
통신부(110)는 다양한 외부 기기와 통신을 수행하여, 다양한 데이터를 송수신 할 수 있다. The communication unit 110 may transmit/receive various data by performing communication with various external devices.
일 예로, 통신부(110)는 디스플레이 장치(200)와 통신을 수행할 수 있다. 구체적으로, 통신부(110)는 와이파이, 블루투스 등과 같은 다양한 통신 방식을 통해, 디스플레이 장치(200)와 통신 연결되어, 디스플레이 장치(200)와 다양한 데이터를 송수신할 수 있다. 이를 위해, 통신부(110)는 와이파이 모듈 및 블루투스 모듈을 포함할 수 있다.For example, the communication unit 110 may communicate with the display apparatus 200 . Specifically, the communication unit 110 is connected to the display device 200 through various communication methods such as Wi-Fi and Bluetooth, and may transmit/receive various data to and from the display device 200 . To this end, the communication unit 110 may include a Wi-Fi module and a Bluetooth module.
일 예로, 통신부(110)는 사용자의 제스처에 대한 정보를 디스플레이 장치(200)로 전송할 수 있다. 또한, 통신부(110)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 요청하는 신호를 디스플레이 장치(200)로 전송할 수 있고, 디스플레이 장치(200)로부터, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 수신할 수 있다. 또한, 통신부(110)는 디스플레이 장치(200)로부터, 디스플레이 장치(200)에 표시된 영상에 대한 정보를 수신할 수 있다. 여기에서, 영상에 대한 정보는 적어도 하나의 영상 프레임을 포함할 수 있다.For example, the communication unit 110 may transmit information about the user's gesture to the display apparatus 200 . Also, the communication unit 110 may transmit a signal requesting information on an object included in an image displayed on the display apparatus 200 to the display apparatus 200 , and from the display apparatus 200 to the display apparatus 200 . Information on an object included in the displayed image may be received. Also, the communication unit 110 may receive, from the display apparatus 200 , information about an image displayed on the display apparatus 200 . Here, the information about the image may include at least one image frame.
한편, 통신부(110)는 서버와 통신을 수행하여, 다양한 데이터를 송수신 할 수 있다. 구체적으로, 통신부(110)는 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), 5G(5th Generation) 등과 같은 이동통신 네트워크를 통해 서버와 통신 연결되거나, 와이파이 네트워크를 통해 서버와 통신 연결되어, 서버와 다양한 데이터를 송수신할 수 있다. 이를 위해, 통신부(110)는 이동통신 모듈을 더 포함할 수 있다.Meanwhile, the communication unit 110 may communicate with the server to transmit/receive various data. Specifically, the communication unit 110 communicates with the server through a mobile communication network such as 3G (3rd Generation), 3GPP (3rd Generation Partnership Project), LTE (Long Term Evolution), 5G (5th Generation), etc., or connects to a Wi-Fi network. Through a communication connection with the server, various data can be transmitted and received with the server. To this end, the communication unit 110 may further include a mobile communication module.
일 예로, 통신부(110)는 사용자 단말 장치(100)에 저장된 어플리케이션을 실행하기 위한 사용자 명령이 수신되면, 해당 어플리케이션을 통해 서비스를 제공하는 서버로, 어플리케이션이 제공하는 영상에 대한 정보를 요청하는 신호를 서버로 전송할 수 있다. 그리고, 통신부(110)는 서버로부터 해당 어플리케이션이 제공하는 영상에 대한 정보를 수신할 수 있다. 일 예로, 어플리케이션이 웹 검색을 위한 어플리케이션이면, 통신부(110)는 웹 검색을 위한 페이지를 포함하는 영상에 대한 정보를 서버로부터 수신할 수 있다.For example, when a user command for executing an application stored in the user terminal device 100 is received, the communication unit 110 is a server that provides a service through the corresponding application, and a signal for requesting information on an image provided by the application. can be sent to the server. In addition, the communication unit 110 may receive information about an image provided by the corresponding application from the server. For example, if the application is an application for web search, the communication unit 110 may receive information about an image including a page for web search from the server.
센서(120)는 사용자의 제스처에 의한, 사용자 단말 장치(100)의 움직임을 감지할 수 있다. 이를 위해, 센서(120)는 가속도 센서, 자이로 센서 등 사용자 단말 장치(100)의 움직임을 감지할 수 있는 다양한 센서를 포함할 수 있다.The sensor 120 may detect the movement of the user terminal device 100 by the user's gesture. To this end, the sensor 120 may include various sensors capable of detecting the movement of the user terminal device 100 , such as an acceleration sensor and a gyro sensor.
여기에서, 가속도 센서는 단위 시간당 사용자 단말 장치(100)의 속도의 변화를 감지하는 센서이다. 일 예로, 가속도 센서는, 사용자 단말 장치(100)의 움직임에 기초하여, x축, y축 및 z축에서의 사용자 단말 장치(100)의 가속도를 측정하는 3축 가속도 센서가 될 수 있다. 이 경우, 프로세서(140)는 센서(120)에 의해 감지된 사용자 단말 장치(100)의 x축, y축 및 z축에서의 가속도에 기초하여, 중력 가속도를 기준으로 사용자 단말 장치(100)가 기울어진 각도를 판단할 수 있고, 일정 시간 동안 센서(120)에 의해 감지된 사용자 단말 장치(100)의 x축, y축 및 z축에서의 가속도 변화량에 기초하여, 사용자 단말 장치(100)의 움직임을 판단할 수 있다. 이에 따라, 프로세서(140)는 사용자 단말 장치(100)의 움직임 및 사용자 단말 장치(100)의 각도 변화에 기초하여, 사용자의 제스처를 판단할 수 있다.Here, the acceleration sensor is a sensor that detects a change in the speed of the user terminal device 100 per unit time. For example, the acceleration sensor may be a 3-axis acceleration sensor that measures the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis based on the movement of the user terminal device 100 . In this case, the processor 140 determines that the user terminal device 100 is based on the gravitational acceleration based on the acceleration in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 . It is possible to determine the tilted angle, and based on the amount of acceleration change in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 for a predetermined time, movement can be judged. Accordingly, the processor 140 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
그리고, 자이로 센서는 사용자 단말 장치(100)의 각속도를 감지하는 센서이다. 일 예로, 자이로 센서는 사용자 단말 장치(100)의 회전에 기초하여 측정된 코리올리의 힘에 기초하여 사용자 단말 장치(100)의 각속도를 감지하는 MEMS(Micro Electro Mechanical Systems) 자이로 센서가 될 수 있다. 이 경우, 프로세서(140)는 일정 시간 동안 센서(120)에 의해 감지된 사용자 단말 장치(100)의 각속도 변화량에 기초하여, 사용자 단말 장치(100)의 회전 정도를 판단할 수 있고, 이로부터 사용자의 제스처를 판단할 수 있다.In addition, the gyro sensor is a sensor that detects the angular velocity of the user terminal device 100 . For example, the gyro sensor may be a micro electro mechanical systems (MEMS) gyro sensor that senses the angular velocity of the user terminal device 100 based on a Coriolis force measured based on the rotation of the user terminal device 100 . In this case, the processor 140 may determine the degree of rotation of the user terminal device 100 based on the amount of change in the angular velocity of the user terminal device 100 sensed by the sensor 120 for a certain period of time, and from this, gestures can be judged.
한편, 상술한 센서는 일 실시 예로서, 센서(120)는 사용자 단말 장치의 움직임을 감지할 수 있는 다양한 센서로 구현될 수 있다. 일 예로, 센서(120)는 사용자 단말 장치(100)의 움직임에 따라 변하는 자기장을 측정할 수 있는 지자기 센서를 더 포함할 수 있다.Meanwhile, the above-described sensor is an embodiment, and the sensor 120 may be implemented as various sensors capable of detecting the movement of the user terminal device. As an example, the sensor 120 may further include a geomagnetic sensor capable of measuring a magnetic field that changes according to the movement of the user terminal device 100 .
디스플레이(130)는 다양한 영상을 디스플레이 할 수 있다. 여기에서 영상은 정지 영상 또는 동영상 중 적어도 하나를 포함하는 개념으로써, 디스플레이(130)는 멀티 미디어 컨텐츠, 게임 컨텐츠 등과 같은 다양한 영상을 표시할 수 있다. 또한, 디스플레이(130)는 각종 유저 인터페이스(UI) 및 아이콘을 표시할 수도 있다.The display 130 may display various images. Here, the image is a concept including at least one of a still image or a moving image, and the display 130 may display various images such as multimedia content and game content. Also, the display 130 may display various user interfaces (UIs) and icons.
특히, 디스플레이(130)는 디스플레이 장치(200)로부터 수신한 오브젝트에 대한 정보를 표시할 수 있다. 여기에서 오브젝트는, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트로서, 일 예로 영상에 자동차 A가 포함된 경우, 디스플레이(130)는 자동차 A에 대한 정보를 표시할 수 있다.In particular, the display 130 may display information about the object received from the display apparatus 200 . Here, the object is an object included in the image displayed on the display device 200 , and for example, when the car A is included in the image, the display 130 may display information about the car A.
또한, 디스플레이(130)는 복수의 어플리케이션에 대한 정보를 표시할 수 있다. 여기에서, 복수의 어플리케이션은 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트와 관련된 어플리케이션으로써, 구체적으로 디스플레이(130)는 영상에 포함된 오브젝트를 이용하여 기능을 수행할 수 있는 복수의 어플리케이션을 표시할 수 있다.Also, the display 130 may display information about a plurality of applications. Here, the plurality of applications are applications related to an object included in an image displayed on the display device 200 , and specifically, the display 130 displays a plurality of applications that can perform a function using the object included in the image. can do.
또한, 디스플레이(130)는 어플리케이션 실행 화면을 표시할 수 있다. 여기에서, 어플리케이션 실행 화면은 사용자 명령에 따라 실행된 어플리케이션이 제공하는 화면으로써, 구체적으로 해당 어플리케이션을 통해 서비스를 제공하는 서버로부터 수신한 영상이 될 수 있다.Also, the display 130 may display an application execution screen. Here, the application execution screen is a screen provided by an application executed according to a user command, and specifically, may be an image received from a server that provides a service through the corresponding application.
이와 같은 디스플레이(130)는 LCD(Liquid Crystal Display Panel), LED(light emitting diode), OLED(Organic Light Emitting Diodes), LCoS(Liquid Crystal on Silicon), DLP(Digital Light Processing) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 또한, 디스플레이(130) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다.Such a display 130 includes various types of displays, such as Liquid Crystal Display Panel (LCD), Light Emitting Diode (LED), Organic Light Emitting Diodes (OLED), Liquid Crystal on Silicon (LCoS), Digital Light Processing (DLP), and the like. can be implemented as In addition, the display 130 may include a driving circuit, a backlight unit, and the like, which may be implemented in the form of an a-si TFT, a low temperature poly silicon (LTPS) TFT, or an organic TFT (OTFT).
프로세서(140)는 사용자 단말 장치(100)의 전반적인 동작을 제어한다. 이를 위해, 프로세서(140)는 중앙처리장치(central processing unit(CPU)), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 적어도 하나를 포함할 수 있다.The processor 140 controls the overall operation of the user terminal device 100 . To this end, the processor 140 may include at least one of a central processing unit (CPU), an application processor (AP), or a communication processor (CP).
프로세서(140)는 운영 체제 또는 응용 프로그램을 구동하여 프로세서(140)에 연결된 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 또한, 프로세서(140)는 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장할 수 있다. The processor 140 may control hardware or software components connected to the processor 140 by driving an operating system or an application program, and may perform various data processing and operations. In addition, the processor 140 may load and process commands or data received from at least one of the other components into the volatile memory, and store various data in the non-volatile memory.
이하, 도 3 내지 도 14를 참조하여, 프로세서(140)의 동작에 대해 상세히 설명한다.Hereinafter, an operation of the processor 140 will be described in detail with reference to FIGS. 3 to 14 .
프로세서(140)는 사용자의 제스처에 의한, 사용자 단말 장치(100)의 움직임을 감지할 수 있다. 구체적으로, 프로세서(140)는 센서(120)를 통해 사용자 단말 장치(100)의 움직임을 감지할 수 있다. 이를 위해, 프로세서(140)는 센서(120)로부터 센서(120)에 의해 생성된 센싱 데이터를 수신할 수 있다.The processor 140 may detect the movement of the user terminal device 100 by the user's gesture. Specifically, the processor 140 may detect the movement of the user terminal device 100 through the sensor 120 . To this end, the processor 140 may receive sensing data generated by the sensor 120 from the sensor 120 .
일 예로, 센서(120)가 3축 가속도 센서로 구현되는 경우, 프로세서(140)는 x축, y축 및 z축에서의 사용자 단말 장치(100)의 가속도에 대한 정보를 포함하는 센싱 데이터를 센서(120)로부터 수신할 수 있다. 이 경우, 프로세서(140)는 센서(120)에 의해 감지된 사용자 단말 장치(100)의 x축, y축 및 z축에서의 가속도에 기초하여, 중력 가속도를 기준으로 사용자 단말 장치(100)가 기울어진 각도를 판단할 수 있고, 일정 시간 동안 센서(120)에 의해 감지된 사용자 단말 장치(100)의 x축, y축 및 z축에서의 가속도 변화량에 기초하여, 사용자 단말 장치(100)의 움직임을 판단할 수 있다. 이에 따라, 프로세서(140)는 사용자 단말 장치(100)의 움직임 및 사용자 단말 장치(100)의 각도 변화에 기초하여, 사용자의 제스처를 판단할 수 있다.For example, when the sensor 120 is implemented as a three-axis acceleration sensor, the processor 140 transmits sensing data including information on the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis to the sensor. 120 may be received. In this case, the processor 140 determines that the user terminal device 100 is based on the gravitational acceleration based on the acceleration in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 . It is possible to determine the tilted angle, and based on the amount of acceleration change in the x-axis, y-axis, and z-axis of the user terminal device 100 sensed by the sensor 120 for a predetermined time, movement can be judged. Accordingly, the processor 140 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
또한, 센서(120)가 자이로 센서로 구현되는 경우, 프로세서(140)는 사용자 단말 장치(100)의 회전에 기초하여 측정된 코리올리의 힘을 전기적 신호로 변환한 센싱 데이터를 센서(120)로부터 수신할 수 있다. 이 경우, 프로세서(140)는 센싱 데이터에 기초하여, 일정 시간 동안 센서(120)에 의해 감지된 사용자 단말 장치(100)의 각속도 변화량를 판단하고, 이로부터 사용자의 제스처를 판단할 수 있다.In addition, when the sensor 120 is implemented as a gyro sensor, the processor 140 receives, from the sensor 120 , sensing data obtained by converting the Coriolis force measured based on the rotation of the user terminal device 100 into an electrical signal. can do. In this case, the processor 140 may determine the amount of change in the angular velocity of the user terminal device 100 sensed by the sensor 120 for a predetermined time based on the sensed data, and may determine the user's gesture therefrom.
또한, 프로세서(120)는 가속도 센서로부터 수신한 센싱 데이터 및 자이로 센서로부터 수신한 센싱 데이터에 기초하여, 사용자 단말 장치(100)의 움직임, 기울어진 각도 및 사용자 단말 장치(100)의 회전 정도를 판단하고, 이로부터 사용자의 제스처를 판단할 수도 있다.In addition, the processor 120 determines the movement of the user terminal device 100 , the inclination angle, and the degree of rotation of the user terminal device 100 based on the sensing data received from the acceleration sensor and the sensing data received from the gyro sensor. and may determine the user's gesture from this.
한편, 상술한 센서는 일 실시 예로서, 프로세서(140)는 사용자 단말 장치(100)의 움직임에 따라 변하는 자기장을 측정할 수 있는 지자기 센서 등 다양한 센서를 통해 사용자의 제스처를 판단할 수 있다.Meanwhile, the above-described sensor is an embodiment, and the processor 140 may determine the user's gesture through various sensors such as a geomagnetic sensor capable of measuring a magnetic field that changes according to the movement of the user terminal device 100 .
프로세서(140)는 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 요청하는 신호를 디스플레이 장치(200)로 전송할 수 있다. 이를 위해, 사용자 단말 장치(100)는 기설정된 제스처에 대한 정보를 기저장하고 있을 수 있다.When it is determined that the user's gesture is a preset gesture, the processor 140 may transmit a signal requesting information on an object included in an image displayed on the display apparatus 200 to the display apparatus 200 . To this end, the user terminal device 100 may pre-store information about a preset gesture.
일 예로, 도 3a를 참조하면, 기설정된 제스처는 수평 상태의 사용자 단말 장치를 수직 상태로 들어 올리는 제스처가 될 수 있다. For example, referring to FIG. 3A , the preset gesture may be a gesture of lifting the user terminal device from a horizontal state to a vertical state.
한편, 사용자의 제스처는 디스플레이 장치(200)에 의해 인식될 수도 있다. 일 예로, 도 3b를 참조하면, 디스플레이 장치(200)는 카메라(210)를 포함하고, 디스플레이 장치(200)는 카메라(210)를 통해 촬영된 영상에 기초하여, 사용자의 제스처를 판단할 수 있다. 구체적으로, 디스플레이 장치(200)는 카메라(210)를 통해 촬영된 영상에 오브젝트 인식 알고리즘을 적용하여, 영상에 포함된 오브젝트를 식별할 수 있다. 그리고, 디스플레이 장치(200)는 영상에 포함된 오브젝트의 변화에 기초하여 사용자의 제스처를 판단할 수 있다. 구체적으로, 디스플레이 장치(200)는 영상에 포함된 오브젝트의 픽셀 값 변화에 기초하여, 오브젝트의 움직임을 판단하고, 오브젝트의 움직임에 기초하여 사용자의 제스처가 디스플레이 장치(200)에 저장된 기설정된 제스처인지를 판단할 수 있다. Meanwhile, the user's gesture may be recognized by the display apparatus 200 . For example, referring to FIG. 3B , the display apparatus 200 includes a camera 210 , and the display apparatus 200 may determine a user's gesture based on an image captured by the camera 210 . . Specifically, the display apparatus 200 may identify an object included in the image by applying an object recognition algorithm to an image captured by the camera 210 . In addition, the display apparatus 200 may determine the user's gesture based on a change in an object included in the image. Specifically, the display apparatus 200 determines the movement of the object based on a change in the pixel value of the object included in the image, and determines whether the user's gesture is a preset gesture stored in the display apparatus 200 based on the movement of the object. can be judged
또한, 디스플레이 장치(200)는 인공 지능 모델을 이용하여 카메라(210)를 통해 촬영된 영상에 포함된 오브젝트를 식별할 수도 있다. 구체적으로, 디스플레이 장치(200)는 영상의 특징 정보를 추출하는 컨볼루션 레이어 및 추출된 특징 정보에 기초하여 영상에 포함된 오브젝트를 식별하도록 학습된 풀리-커넥티드 레이어를 포함하는 CNN 모델을 통해, 영상에 포함된 오브젝트를 식별할 수 있다. 그리고, 디스플레이 장치(200)는 영상에 포함된 오브젝트를 트래킹하여, 오브젝트의 움직임을 판단하고, 오브젝트의 움직임에 기초하여 사용자의 제스처가 디스플레이 장치(200)에 저장된 기설정된 제스처인지를 판단할 수 있다. 한편, 이는 일 실시 예로서, 디스플레이 장치(200)는 엣지 검출 알고리즘 등 다양한 방식을 통해 영상에 포함된 오브젝트를 식별할 수 있다. Also, the display apparatus 200 may identify an object included in an image captured by the camera 210 using an artificial intelligence model. Specifically, the display device 200 is a convolutional layer for extracting feature information of an image and a fully-connected layer trained to identify an object included in an image based on the extracted feature information through a CNN model, An object included in an image can be identified. In addition, the display apparatus 200 may determine the movement of the object by tracking the object included in the image, and determine whether the user's gesture is a preset gesture stored in the display apparatus 200 based on the movement of the object. . Meanwhile, this is an embodiment, and the display apparatus 200 may identify an object included in an image through various methods such as an edge detection algorithm.
디스플레이 장치(200)는 사용자 단말 장치(100)로부터 오브젝트에 대한 정보를 요청하는 신호가 수신되면, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다. 또는, 디스플레이 장치(200)는 카메라(210)에 의해 사용자의 제스처가 기설정된 제스처인 것으로 판단된 경우에도, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.When a signal requesting information on an object is received from the user terminal device 100 , the display apparatus 200 may transmit information on the object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 . have. Alternatively, even when the user's gesture is determined to be a preset gesture by the camera 210 , the display apparatus 200 transmits information about an object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 . can be sent to
이를 위해, 디스플레이 장치(200)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트를 분석하여, 영상에 포함된 오브젝트를 식별할 수 있다. 여기에서, 식별되는 오브젝트는 영상에 포함된 텍스트, 숫자, 얼굴, 마크 등 다양한 오브젝트가 될 수 있다. 예를 들어, 텍스트는 영상에 포함된 자막, 간판의 상점 명칭 등이 될 수 있고, 숫자는 전화번호, 계좌번호 등이 될 수 있다. 그리고, 얼굴은 사람의 얼굴이 될 수 있음은 물론, 강아지, 고양이 등과 같이 사람을 제외한 동물의 얼굴이 될 수 있다. 그리고, 마크는 자동차의 브랜드 마크, 가방의 브랜드 마크, 의류의 브랜드 마크 등이 될 수 있다.To this end, the display apparatus 200 may analyze the object included in the image displayed on the display apparatus 200 to identify the object included in the image. Here, the identified object may be various objects such as text, numbers, faces, and marks included in the image. For example, the text may be a caption included in an image, a shop name on a signboard, and the like, and the number may be a phone number or an account number. In addition, the face may be a human face, as well as an animal face other than a human, such as a dog or a cat. And, the mark may be a brand mark of a car, a brand mark of a bag, a brand mark of clothing, and the like.
구체적으로, 디스플레이 장치(200)는 디스플레이 장치(200)에 표시된 영상에 오브젝트 인식 알고리즘을 적용하여, 영상에 포함된 오브젝트를 식별할 수 있다. 여기에서, 오브젝트 인식 알고리즘은, 얼굴 인식 알고리즘, 텍스트 인식 알고리즘, 숫자 인식 알고리즘 등의 다양한 알고리즘이 될 수 있다. 또한, 디스플레이 장치(200)는 인공 지능 모델을 이용하여 영상에 포함된 오브젝트를 식별할 수도 있다. 구체적으로, 디스플레이 장치(200)는 영상의 특징 정보를 추출하는 컨볼루션 레이어및 추출된 특징 정보에 기초하여 영상에 포함된 오브젝트를 식별하도록 학습된 풀리-커넥티드 레이어를 포함하는 CNN모델을 통해, 영상에 포함된 오브젝트를 식별할 수 있다. 한편, 이는 일 실시 예로서, 디스플레이 장치(200)는 DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 및 심층 Q-네트워크 (Deep Q-Networks)와 같은 다양한 인공 지능 모델이나 엣지 검출 알고리즘 등의 다양한 방식을 통해 영상에 포함된 오브젝트를 식별할 수 있다.Specifically, the display apparatus 200 may identify an object included in the image by applying an object recognition algorithm to the image displayed on the display apparatus 200 . Here, the object recognition algorithm may be various algorithms such as a face recognition algorithm, a text recognition algorithm, and a number recognition algorithm. Also, the display apparatus 200 may identify an object included in an image using an artificial intelligence model. Specifically, the display device 200 is a convolutional layer for extracting feature information of an image and a fully-connected layer trained to identify an object included in an image based on the extracted feature information through a CNN model, An object included in an image can be identified. Meanwhile, as an example, the display device 200 includes a Deep Neural Network (DNN), a Recurrent Neural Network (RNN), a Restricted Boltzmann Machine (RBM), a Deep Belief Network (DBN), and a Bidirectional Recurrent Deep Neural Network (BRDNN). and various artificial intelligence models such as Deep Q-Networks, or edge detection algorithms, etc., to identify objects included in the image.
그리고, 디스플레이 장치(200)는 식별된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다. 일 예로, 디스플레이 장치(200)는 영상에서 자동차 A, 배우 B, 배우 C 및 까페 D가 식별된 경우이면, 자동차 A, 배우 B, 배우 C 및 까페 D에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.In addition, the display apparatus 200 may transmit information on the identified object to the user terminal apparatus 100 . For example, the display apparatus 200 transmits information about the car A, the actor B, the actor C, and the cafe D to the user terminal device 100 when the car A, the actor B, the actor C, and the cafe D are identified in the image. can be transmitted
한편, 이상에서는 디스플레이 장치(200)가 영상에 포함된 오브젝트를 식별하는 것으로 설명하였으나, 오브젝트의 식별은 사용자 단말 장치(100)에 의해 수행될 수도 있다. 일 예로, 프로세서(140)는 센서(120)로부터 수신된 센싱 데이터에 기초하여 사용자의 제스처가 기설정된 제스처인 것으로 판단되면, 디스플레이 장치(200)로 디스플레이 장치(200)에 표시된 영상에 대한 정보를 요청하는 신호를 전송할 수 있다. 그리고, 프로세서(140)는 디스플레이 장치(200)로부터 영상에 대한 정보가 수신되면, 영상에 상술한 오브젝트 인식 알고리즘 또는 인공지능 모델 등의 다양한 방식을 통해, 영상에 포함된 오브젝트를 식별할 수 있다. 또는, 디스플레이 장치(200)는 카메라(210)를 통해 사용자의 제스처가 기설정된 제스처인 것으로 판단되면, 사용자 단말 장치(100)로 디스플레이 장치(200)에 표시된 영상에 대한 정보를 전송하고, 프로세서(140)는 디스플레이 장치(200)로부터 영상에 대한 정보가 수신되면, 영상에 상술한 오브젝트 인식 알고리즘 또는 인공지능 모델 등의 다양한 방식을 통해, 영상에 포함된 오브젝트를 식별할 수 있다.Meanwhile, in the above description, the display apparatus 200 identifies an object included in an image, but the object identification may be performed by the user terminal apparatus 100 . As an example, if it is determined that the user's gesture is a preset gesture based on the sensed data received from the sensor 120 , the processor 140 transmits information about the image displayed on the display apparatus 200 to the display apparatus 200 . A request signal can be transmitted. In addition, when information about an image is received from the display apparatus 200 , the processor 140 may identify an object included in the image through various methods such as the object recognition algorithm or artificial intelligence model described above for the image. Alternatively, when it is determined that the user's gesture is a preset gesture through the camera 210, the display apparatus 200 transmits information about the image displayed on the display apparatus 200 to the user terminal apparatus 100, and the processor ( When information on an image is received from the display apparatus 200 , the 140 may identify an object included in the image through various methods such as the object recognition algorithm or artificial intelligence model described above for the image.
프로세서(140)는 디스플레이 장치(200)로부터 오브젝트에 대한 정보가 수신되면, 오브젝트에 대한 정보를 디스플레이(130)에 표시할 수 있다. 또는, 프로세서(140)는 디스플레이 장치(200)로부터 수신한 영상을 분석한 결과 영상에 포함된 오브젝트가 식별되면, 오브젝트에 대한 정보를 디스플레이(130)에 표시할 수 있다.When information on an object is received from the display apparatus 200 , the processor 140 may display information on the object on the display 130 . Alternatively, when an object included in the image is identified as a result of analyzing the image received from the display apparatus 200 , the processor 140 may display information about the object on the display 130 .
일 예로, 오브젝트에 대한 정보에 자동차 A, 배우 B, 배우 C 및 까페 D에 대한 정보가 포함된 경우이면, 프로세서(140)는 자동차 A, 배우 B, 배우 C 및 까페 D에 대한 정보를 디스플레이(130)에 표시할 수 있다. 여기에서, 오브젝트에 대한 정보는 텍스트 형식으로 나열되어 디스플레이(130)에 표시될 수 있으나, 반드시 이에 한정되는 것은 아니다.For example, if the information on the object includes information on car A, actor B, actor C, and cafe D, the processor 140 displays information on car A, actor B, actor C, and cafe D ( 130) can be indicated. Here, the information on the object may be displayed on the display 130 in a text format, but is not limited thereto.
일 예로, 도 4를 참조하면, 프로세서(140)는 디스플레이 장치(200)에 표시된 영상에, 오브젝트에 대한 정보를 중첩한 영상을 디스플레이(130)에 표시할 수 있다. 이를 위해, 프로세서(140)는 디스플레이 장치(200)로부터 디스플레이 장치(200)에 표시된 영상에, 오브젝트에 대한 정보가 중첩된 영상에 대한 정보를 수신할 수 있다. 구체적으로, 디스플레이 장치(200)는 사용자 단말 장치(100)로부터 오브젝트에 대한 정보를 요청하는 신호가 수신되거나, 카메라(210)를 통해 사용자의 제스처가 기설정된 제스처인 것으로 판단되는 경우, 영상에 포함된 오브젝트를 식별하고, 영상의 전체 영역 중에서 식별된 오브젝트가 위치하는 영역을 판단하며, 판단된 영역에 오브젝트에 대한 정보를 중첩한 영상에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다. 또는, 프로세서(140)는 디스플레이 장치(200)로부터 수신한 영상에서 오브젝트를 식별하고, 영상의 전체 영역 중에서 식별된 오브젝트가 위치하는 영역을 판단하며, 판단된 영역에 오브젝트에 대한 정보를 중첩한 영상을 생성하여 디스플레이(130)에 표시할 수 있다.For example, referring to FIG. 4 , the processor 140 may display an image in which information on an object is superimposed on an image displayed on the display apparatus 200 on the display 130 . To this end, the processor 140 may receive information about an image in which information about an object is superimposed on an image displayed on the display apparatus 200 from the display apparatus 200 . Specifically, when a signal requesting information about an object is received from the user terminal device 100 or it is determined that the user's gesture is a preset gesture through the camera 210, the display apparatus 200 is included in the image. The identified object may be identified, a region in which the identified object is located among the entire region of the image may be determined, and information about an image in which information on the object is superimposed on the determined region may be transmitted to the user terminal device 100 . Alternatively, the processor 140 identifies an object in the image received from the display apparatus 200 , determines a region in which the identified object is located among the entire region of the image, and superimposes information on the object on the determined region. can be generated and displayed on the display 130 .
한편, 프로세서(140)는 디스플레이 장치(200)에 표시된 영상에, 오브젝트에 대한 정보를 중첩한 영상 및, 텍스트 형식으로 나열된 오브젝트에 대한 정보를 디스플레이(130)에 표시할 수도 있다. 일 예로, 도 5를 참조하면, 프로세서(140)는 디스플레이(130)의 제1 영역에는 오브젝트에 대한 정보가 중첩된 영상을 표시하고, 디스플레이(130)의 제2 영역에는 오브젝트에 대한 정보를 썸네일 및 텍스트 형식으로 나열하여 표시할 수 있다. 한편, 도 4 및 도 5에서는 이미지 상에 오브젝트 1, 오브젝트 2 등을 중첩하여 표시하였으나, 실시 예에 따라 프로세서(140)는 이미지 상에 자동차 A, 배우 B 등을 중첩하여 표시할 수도 있다고 볼 것이다.Meanwhile, the processor 140 may display, on the display 130 , an image in which information about an object is superimposed on an image displayed on the display apparatus 200 , and information about an object listed in text format. For example, referring to FIG. 5 , the processor 140 displays an image in which information about an object is superimposed on a first area of the display 130 , and displays thumbnail information about the object on a second area of the display 130 . and can be displayed by listing in text format. Meanwhile, in FIGS. 4 and 5 , object 1 and object 2 are superimposed and displayed on the image, but according to an embodiment, the processor 140 may superimpose and display the car A, actor B, etc. on the image. .
한편, 프로세서(140)는 디스플레이 장치(200)로부터, 디스플레이 장치(200)에 표시된 복수의 영상 프레임을 수신하고, 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터를 디스플레이(130)에 표시할 수 있다. 이 경우, 프로세서(140)는 인디케이터를 통해, 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령이 수신되면, 선택된 영상 프레임에 포함된 오브젝트에 대한 정보를 디스플레이 장치(200)로부터 수신할 수 있다.Meanwhile, the processor 140 receives a plurality of image frames displayed on the display apparatus 200 from the display apparatus 200 , and displays an indicator for selecting one image frame among the plurality of image frames on the display 130 . can do. In this case, when a user command for selecting one image frame among a plurality of image frames is received through the indicator, the processor 140 may receive information about an object included in the selected image frame from the display apparatus 200 . can
구체적으로, 프로세서(140)는 센서(120)로부터 수신된 센싱 데이터에 기초하여 사용자의 제스처가 기설정된 제스처인 것으로 판단되면, 디스플레이 장치(200)로 디스플레이 장치(200)에 표시된 복수의 영상 프레임의 전송을 요청할 수 있다. 그리고, 프로세서(140)는 디스플레이 장치(200)로부터 복수의 영상 프레임을 수신할 수 있다. 또는 디스플레이 장치(200)는 카메라(210)를 통해 사용자의 제스처가 기설정된 제스처인 것으로 판단되면, 사용자 단말 장치(100)로 디스플레이 장치(200)에 표시된 복수의 영상 프레임을 전송할 수 있다.Specifically, when it is determined that the user's gesture is a preset gesture based on the sensed data received from the sensor 120 , the processor 140 may display a plurality of image frames displayed on the display apparatus 200 with the display apparatus 200 . You can request a transfer. In addition, the processor 140 may receive a plurality of image frames from the display apparatus 200 . Alternatively, when it is determined that the user's gesture is a preset gesture through the camera 210 , the display apparatus 200 may transmit a plurality of image frames displayed on the display apparatus 200 to the user terminal apparatus 100 .
이 경우, 프로세서(140)는 도 6에 도시된 바와 같이, 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터(610)를 디스플레이(130)에 표시하고, 인디케이터(610)를 통해, 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령을 수신할 수 있다. 여기에서, 사용자 명령은 사용자의 터치 입력 또는 터치 앤 드래그 입력이 될 수 있으나, 반드시 이에 한정되는 것은 아니다. 그리고, 프로세서(140)는 사용자 명령에 따라 선택된 영상 프레임에 포함된 오브젝트에 대한 정보를 디스플레이(130)에 표시할 수 있다.In this case, as shown in FIG. 6 , the processor 140 displays an indicator 610 for selecting one image frame among a plurality of image frames on the display 130 , and through the indicator 610 , a plurality of It is possible to receive a user command for selecting one image frame from among the image frames of . Here, the user command may be a user's touch input or a touch-and-drag input, but is not limited thereto. In addition, the processor 140 may display information on the object included in the image frame selected according to a user command on the display 130 .
구체적으로, 프로세서(140)는 상술한 오브젝트 인식 알고리즘 또는 인공지능 모델을 이용하여 선택된 영상 프레임에 포함된 오브젝트를 식별하고, 식별된 오브젝트에 대한 정보를 디스플레이(130)에 표시할 수 있다. 또는, 프로세서(140)는 선택된 영상 프레임에 대한 정보를 디스플레이 장치(200)로 전송하고, 디스플레이 장치(200)로부터 선택된 영상 프레임에 포함된 오브젝트에 대한 정보를 수신하여 디스플레이(130)에 표시할 수도 있다.Specifically, the processor 140 may identify an object included in the selected image frame using the above-described object recognition algorithm or artificial intelligence model, and display information on the identified object on the display 130 . Alternatively, the processor 140 may transmit information on the selected image frame to the display apparatus 200 , receive information about an object included in the selected image frame from the display apparatus 200 , and display it on the display 130 . have.
이에 따라, 사용자는 관심 오브젝트가 포함된 이미지 프레임을 용이하게 선택하고, 관심 오브젝트를 확인할 수 있다.Accordingly, the user can easily select an image frame including the object of interest and check the object of interest.
한편, 프로세서(140)는 오브젝트에 대한 정보와 함께 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 여기에서, 오브젝트와 관련된 어플리케이션이란, 식별된 오브젝트를 이용하여 정보를 제공하거나, 기능을 수행할 수 있는 어플리케이션으로써, 가령 식별된 오브젝트가 배우이면, 배우의 프로필 정보를 제공할 수 있는 어플리케이션, 배우가 출연한 드라마나 영화에 대한 정보를 제공할 수 있는 어플리케이션 등이 될 수 있고, 식별된 오브젝트가 자동차 등의 상품이면, 상품에 대한 스펙 정보를 제공할 수 있는 어플리케이션, 상품을 판매하는 샵에 대한 정보를 제공하는 어플리케이션 등이 될 수 있으며, 식별된 오브젝트가 까페 등의 매장이면, 매장의 홈 페이지 화면을 제공할 수 있는 어플리케이션 등이 될 수 있다. Meanwhile, the processor 140 may display information on a plurality of applications related to the object along with the information on the object on the display 130 . Here, the object-related application is an application capable of providing information or performing a function using the identified object. For example, if the identified object is an actor, an application capable of providing profile information of the actor, the actor It may be an application that can provide information about a drama or movie that has appeared, and if the identified object is a product such as a car, an application that can provide specification information about the product, information about a shop that sells the product It may be an application that provides , and if the identified object is a store such as a cafe, it may be an application capable of providing a home page screen of the store.
구체적으로, 프로세서(140)는 오브젝트에 대한 정보를 디스플레이(130)에 표시하고, 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 오브젝트에 대한 정보 및 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 일 예로, 도 7을 참조하면, 프로세서(140)는 디스플레이 장치(200)에 표시된 영상에, 오브젝트에 대응되는 UI(user interface)를 오브젝트가 위치하는 영역에 중첩한 영상을 디스플레이(130)에 표시하고, UI를 선택하기 위한 사용자 명령이 수신되면, 선택된 UI에 대응되는 오브젝트에 대한 정보 및 선택된 UI에 대응되는 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 도 7과 같이, 자동차 A가 선택된 경우이면, 프로세서(140)는 자동차 A에 대한 정보를 제공할 수 있거나, 자동차 A를 이용하여 기능을 수행할 수 있는, 웹 검색을 위한 어플리케이션, 스펙 검색을 위한 어플리케이션, 정보 공유를 위한 어플리케이션 및 쇼핑을 위한 어플리케이션 등을 표시할 수 있다.Specifically, the processor 140 displays information on the object on the display 130 , and when a user command for selecting an object is received, the processor 140 displays information on the object and information on a plurality of applications related to the object on the display 130 . ) can be displayed. For example, referring to FIG. 7 , the processor 140 displays, on the display 130 , an image in which a user interface (UI) corresponding to the object is superimposed on the image displayed on the display apparatus 200 in an area where the object is located. When a user command for selecting a UI is received, information on an object corresponding to the selected UI and information on a plurality of applications related to an object corresponding to the selected UI may be displayed on the display 130 . As shown in FIG. 7 , when car A is selected, the processor 140 may provide information on car A or perform a function by using car A, an application for web search, and a specification search for An application, an application for sharing information, and an application for shopping may be displayed.
한편, 여기에서 표시되는 복수의 어플리케이션은 사용자의 히스토리 정보에 기초하여 변경될 수 있다. 여기에서, 사용자의 히스토리 정보는, 복수의 어플리케이션의 실행 횟수에 대한 정보를 포함하고, 사용자가 어플리케이션을 실행할 때마다 업데이트 될 수 있다. 구체적으로, 프로세서(140)는 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 사용자의 히스토리 정보에 기초하여, 복수의 어플리케이션의 실행 횟수에 대한 정보를 획득할 수 있다. 그리고, 프로세서(140)는 실행 횟수가 많은 어플리케이션 순서대로 나열된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 만약, 사용자의 히스토리 정보가 저장되어 있지 않은 경우이면, 프로세서(140)는 디폴트된 순서에 따라 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다.Meanwhile, the plurality of applications displayed here may be changed based on the user's history information. Here, the user's history information includes information on the number of executions of a plurality of applications, and may be updated whenever the user executes the application. Specifically, when a user command for selecting an object is received, the processor 140 may acquire information on the number of executions of a plurality of applications based on the user's history information. In addition, the processor 140 may display information on a plurality of applications listed in the order of the applications having the highest number of executions on the display 130 . If the user's history information is not stored, the processor 140 may display information on a plurality of applications on the display 130 according to a default order.
일 예로, 도 8을 참조하면, 프로세서(140)는 사용자의 히스토리 정보가 없는 상태에서 자동차 A가 선택된 경우이면, 자동차 A와 관련된 복수의 어플리케이션을 디폴트된 순서대로 디스플레이(130)에 표시하고, 사용자의 히스토리 정보가 있는 상태에서 자동차 A가 선택된 경우이면, 복수의 어플리케이션 중에서 실행 횟수가 많은 어플리케이션 순서대로 나열된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 이에 따라, 사용자는 개인화된 복수의 어플리케이션에 대한 정보를 제공받을 수 있다. As an example, referring to FIG. 8 , when car A is selected in the absence of user history information, the processor 140 displays a plurality of applications related to car A on the display 130 in a default order, and the user If car A is selected in a state in which there is history information of , information on a plurality of applications listed in the order of the applications having the highest number of executions among the plurality of applications may be displayed on the display 130 . Accordingly, the user may be provided with information on a plurality of personalized applications.
프로세서(140)는 디스플레이(130)에 표시된 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 오브젝트에 대한 정보에 기초하여 선택된 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 구체적으로, 프로세서(130)는 디스플레이(130)에 표시된 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 선택된 어플리케이션을 실행하고, 해당 어플리케이션을 통해 서비스를 제공하는 서버로, 식별된 오브젝트에 대한 정보를 전송할 수 있다. 그리고, 프로세서(140)는 식별된 오브젝트에 대한 정보에 기초하여, 서버가 제공하는 영상을 서버로부터 수신할 수 있다. 일 예로, 도 9에 도시된 바와 같이, 자동차 A가 선택되고, 웹 검색을 위한 어플리케이션이 선택된 경우, 프로세서(140)는 웹 검색 서비스를 제공하는 서버로 자동차 A를 키워드로 웹 검색하도록 요청하는 신호를 전송하고, 서버로부터 자동차 A를 키워드로 웹 검색한 페이지에 대한 정보를 수신할 수 있다. 그리고, 프로세서(140)는 서버로부터 수신한 영상에 대한 정보에 기초하여, 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다.When a user command for selecting one of a plurality of applications displayed on the display 130 is received, the processor 140 may display a screen provided by the selected application on the display 130 based on the information on the object. . Specifically, when a user command for selecting one of a plurality of applications displayed on the display 130 is received, the processor 130 executes the selected application and is a server that provides a service through the corresponding application, the identified object information can be transmitted. In addition, the processor 140 may receive an image provided by the server from the server based on the information on the identified object. For example, as shown in FIG. 9 , when car A is selected and an application for web search is selected, the processor 140 requests a web search service server providing a web search service to perform a web search for car A as a keyword. , and can receive information about a web searched page with car A as a keyword from the server. In addition, the processor 140 may display a screen provided by the application on the display 130 based on the information on the image received from the server.
한편, 프로세서(140)는 식별된 오브젝트에 대한 정보가 선택되면 기설정된 어플리케이션을 실행할 수도 있다. 구체적으로, 프로세서(140)는 식별된 오브젝트에 대한 정보를 디스플레이(130)에 표시하고, 오브젝트를 선택하는 사용자 명령이 수신되면, 선택된 오브젝트를 이용하여 기설정된 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 일 예로, 도 10을 참조하면, 프로세서(140)는 복수의 오브젝트를 디스플레이(130)에 표시하고, 복수의 오브젝트 중 하나를 선택하는 사용자 명령이 수신되면, 선택된 오브젝트에 기초하여 기설정된 어플리케이션이 제공하는 화면을 표시할 수 있다. 도 10과 같이, 기설정된 어플리케이션이 웹 검색을 위한 어플리케이션인 경우이면, 프로세서(130)는 선택된 오브젝트를 키워드로 웹 검색한 페이지를 디스플레이(130)에 표시할 수 있다. Meanwhile, the processor 140 may execute a preset application when information on the identified object is selected. Specifically, the processor 140 displays information on the identified object on the display 130 , and when a user command for selecting an object is received, a screen provided by a preset application using the selected object is displayed on the display 130 . can be displayed in For example, referring to FIG. 10 , the processor 140 displays a plurality of objects on the display 130 , and when a user command for selecting one of the plurality of objects is received, a preset application is provided based on the selected object. screen can be displayed. As shown in FIG. 10 , if the preset application is an application for web search, the processor 130 may display a web search page using the selected object as a keyword on the display 130 .
한편, 이상에서는 사용자의 제스처가 기설정된 제스처이면, 사용자 단말 장치(100)는 오브젝트에 대한 정보 및 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는 실시 예를 설명하였다. 그러나, 실시 예에 따라 사용자 단말 장치(100)는 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처인 것으로 판단되면, 영상에 포함된 특정 오브젝트에 기초하여 특정 어플리케이션이 제공하는 화면을 표시할 수도 있다. 이하, 도 11 내지 도 14를 참조하여 설명한다.Meanwhile, in the above description, when the user's gesture is a preset gesture, the user terminal device 100 displays information on an object and information on a plurality of applications related to the object. However, according to an embodiment, when it is determined that the user's gesture is a gesture for executing a specific application, the user terminal device 100 may display a screen provided by the specific application based on the specific object included in the image. Hereinafter, it will be described with reference to FIGS. 11 to 14 .
프로세서(140)는 센서(120)로부터 수신한 센싱 데이터에 기초하여, 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처인지를 판단할 수 있다. 구체적으로, 프로세서(140)는 기저장된 복수의 제스처에 대한 정보와 사용자의 제스처를 비교하여, 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처인지를 판단할 수 있다. The processor 140 may determine whether the user's gesture is a gesture for executing a specific application based on the sensed data received from the sensor 120 . Specifically, the processor 140 may compare the user's gesture with information on a plurality of pre-stored gestures to determine whether the user's gesture is a gesture for executing a specific application.
그리고, 프로세서(140)는 상기 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 복수의 오브젝트 중에서 특정 어플리케이션의 기능의 실행을 위해 필요한 오브젝트를 판단할 수 있다. 이를 위해, 사용자 단말 장치(100)는 오브젝트 별로, 오브젝트를 이용하여 기능을 수행할 수 있는 적어도 하나의 어플리케이션에 대한 정보를 매칭하여 저장하고 있을 수 있다. 일 예로, 프로세서(140)는 사용자의 제스처가 통화 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 영상에 포함된 복수의 오브젝트 중에서 전화 번호를 나타내는 오브젝트를 판단하고, 사용자의 제스처가 지도 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 영상에 포함된 복수의 오브젝트 중에서 위치를 나타내는 오브젝트를 판단할 수 있다. 여기에서, 위치를 나타내는 오브젝트는 지역 명칭이 될 수 있음은 물론, 음식점 등의 상호명이 될 수도 있다. In addition, when the user's gesture is determined to be a gesture for executing a specific application, the processor 140 selects an object necessary for executing the function of the specific application from among a plurality of objects included in the image displayed on the display device 200 . can judge To this end, the user terminal device 100 may match and store information on at least one application capable of performing a function using the object for each object. For example, when the user's gesture is determined to be a gesture for executing a call application, the processor 140 determines an object representing a phone number from among a plurality of objects included in the image, and the user's gesture determines the execution of the map application. When it is determined as a gesture for , it is possible to determine an object indicating a position from among a plurality of objects included in the image. Here, the object indicating the location may be a name of a region as well as a business name of a restaurant or the like.
그리고, 프로세서(140)는 영상에서 특정 어플리케이션의 기능의 실행에 필요한 오브젝트를 식별할 수 있다. 구체적으로, 프로세서(140)는 상술한 바와 같이, 오브젝트 인식 알고리즘 또는 인공지능 모델 등을 이용하여 영상에서 특정 어플리케이션의 기능의 실행에 필요한 오브젝트를 식별할 수 있다. 이를 위해, 프로세서(140)는 디스플레이 장치(200)로부터, 디스플레이 장치(200)에 표시된 영상에 대한 정보를 수신할 수 있다.In addition, the processor 140 may identify an object required to execute a function of a specific application from the image. Specifically, as described above, the processor 140 may identify an object required for execution of a function of a specific application from an image using an object recognition algorithm or an artificial intelligence model. To this end, the processor 140 may receive information about an image displayed on the display apparatus 200 from the display apparatus 200 .
한편, 오브젝트의 식별은 디스플레이 장치(200)에 의해 수행될 수도 있다. 일 예로, 디스플레이 장치(200)는 카메라(210)를 통해 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 복수의 오브젝트 중에서 특정 어플리케이션의 기능의 실행을 위해 필요한 오브젝트를 식별하고, 식별된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.Meanwhile, the identification of the object may be performed by the display apparatus 200 . For example, when the user's gesture is determined to be a gesture for executing a specific application through the camera 210 , the display device 200 may display a function of a specific application among a plurality of objects included in an image displayed on the display device 200 . It is possible to identify an object necessary for the execution of , and transmit information on the identified object to the user terminal device 100 .
프로세서(140)는 식별된 오브젝트에 기초하여 특정 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 구체적으로, 프로세서(140)는 사용자의 제스처에 대응되는 특정 어플리케이션을 실행하고, 식별된 오브젝트에 기초한 어플리케이션 실행 화면을 디스플레이(130)에 표시할 수 있다. 일 예로, 도 11을 참조하면, 프로세서(140)는 사용자의 제스처가 통화 어플리케이션의 실행을 위한 제스처인 경우, 영상에 포함된 복수의 오브젝트 중에서 전화 번호를 나타내는 오브젝트를 식별하고, 식별된 전화 번호에 기초하여 통화 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. The processor 140 may display a screen provided by a specific application on the display 130 based on the identified object. Specifically, the processor 140 may execute a specific application corresponding to the user's gesture, and display an application execution screen based on the identified object on the display 130 . As an example, referring to FIG. 11 , when the user's gesture is a gesture for executing a call application, the processor 140 identifies an object representing a phone number from among a plurality of objects included in an image, and assigns the number to the identified phone number. Based on the screen provided by the call application may be displayed on the display 130 .
또는, 도 12를 참조하면, 프로세서(140)는 사용자의 제스처가 화면 캡쳐를 위한 제스처로 판단되는 경우, 디스플레이 장치(200)로부터 디스플레이 장치에 표시된 영상을 수신하고, 디스플레이 장치(200)로부터 수신한 영상에 기초하여 사진 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 구체적으로, 프로세서(140)는 사용자의 제스처가 화면 캡쳐를 위한 제스처로 판단되는 경우, 디스플레이 장치(200)로 디스플레이 장치(200)에 표시된 영상의 전송을 요청하는 신호를 전송하고, 디스플레이 장치(200)로부터 영상이 수신되면, 수신된 영상을 저장하며, 사진 어플리케이션을 통해 저장된 영상을 디스플레이(130)에 표시할 수 있다.Alternatively, referring to FIG. 12 , when the user's gesture is determined to be a gesture for screen capture, the processor 140 receives an image displayed on the display device from the display device 200 and receives the image displayed on the display device from the display device 200 . A screen provided by the photo application may be displayed on the display 130 based on the image. Specifically, when the user's gesture is determined as a gesture for screen capture, the processor 140 transmits a signal requesting transmission of the image displayed on the display apparatus 200 to the display apparatus 200 , and the display apparatus 200 ), the received image may be stored, and the stored image may be displayed on the display 130 through a photo application.
또한, 도 13을 참조하면, 프로세서(140)는 사용자의 제스처가 지도 어플리케이션의 실행을 위한 제스처인 경우, 영상에 포함된 복수의 오브젝트 중에서 지역명칭 또는 상호명칭 등과 같이 위치를 나타내는 오브젝트를 식별하고, 식별된 오브젝트에 기초하여 지도 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 구체적으로, 프로세서(140)는 사용자의 제스처가 지도 어플리케이션의 실행을 위한 제스처인 경우, 지도 어플리케이션을 실행하고, 지도 어플리케이션을 통해 서비스를 제공하는 서버로 식별된 지역 명칭 등에 대한 정보를 전송하며, 서버로부터 해당 지역에 대한 지도 정보를 포함하는 화면을 수신하여 디스플레이(130)에 표시할 수 있다.In addition, referring to FIG. 13 , when the user's gesture is a gesture for executing a map application, the processor 140 identifies an object indicating a location, such as a region name or a business name, among a plurality of objects included in the image, A screen provided by the map application may be displayed on the display 130 based on the identified object. Specifically, when the user's gesture is a gesture for executing the map application, the processor 140 executes the map application, transmits information on the region name, etc. identified as a server providing a service through the map application, and the server A screen including map information for a corresponding area may be received from the display 130 and displayed on the display 130 .
또한, 프로세서(140)는 사용자의 제스처가 음악 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 디스플레이 장치(200)로부터 디스플레이 장치(200)에서 출력된 오디오 신호를 수신하고, 오디오 신호에 기초하여 디스플레이 장치(200)에서 출력된 음악의 제목을 판단할 수 있다. 구체적으로, 프로세서(140)는 스피커를 통해 디스플레이 장치(200)에서 출력된 오디오 신호를 수신하고, 오디오 신호의 주파수, 템포, 에너지 등을 분석함으로써, 디스플레이 장치(200)에서 출력된 음악의 제목을 판단할 수 있다. 그리고, 프로세서(140)는 음악의 제목에 기초하여 음악 어플리케이션을 실행하여, 디스플레이 장치(200)에서 출력 중인 음악을 출력할 수 있다. Also, when the user's gesture is determined to be a gesture for executing a music application, the processor 140 receives an audio signal output from the display apparatus 200 from the display apparatus 200, and based on the audio signal, the display apparatus At 200 , the title of the output music may be determined. Specifically, the processor 140 receives the audio signal output from the display device 200 through a speaker, and analyzes the frequency, tempo, energy, etc. of the audio signal, so that the title of the music output from the display device 200 is displayed. can judge In addition, the processor 140 may execute a music application based on the title of the music to output the music being output on the display device 200 .
이와 같이, 사용자 단말 장치(100)는 사용자의 제스처만으로 특정 오브젝트를 이용하여 특정 오브젝트를 실행할 수 있다는 점에서, 사용자 편의성이 향상될 수 있다. As described above, user convenience can be improved in that the user terminal device 100 can execute a specific object using a specific object only with a user's gesture.
도 15는 본 개시의 일 실시 예에 따른 사용자 단말 장치를 설명하기 위한 상세 블록도이다.15 is a detailed block diagram illustrating a user terminal device according to an embodiment of the present disclosure.
도 15을 참조하면, 본 개시의 일 실시 예에 따른 사용자 단말 장치(100)는 통신부(110), 센서(120), 디스플레이(130), 저장부(140), 입력부(150), 마이크(160) 및 프로세서(170)를 포함할 수 있다. 이하, 상술한 설명과 중복되는 부분은 생략하거나 축약하여 설명한다.15 , the user terminal device 100 according to an embodiment of the present disclosure includes a communication unit 110 , a sensor 120 , a display 130 , a storage unit 140 , an input unit 150 , and a microphone 160 . ) and a processor 170 . Hereinafter, portions overlapping with the above description will be omitted or abbreviated.
통신부(110)는 디스플레이 장치(200)와 통신을 수행할 수 있다. 특히, 통신부(110)는 사용자 단말 장치(100) 의 계정 정보를 통해 디스플레이 장치(200)와 통신을 수행할 수 있다. 일 예로, 사용자 단말 장치(100) 의 계정 정보 및 디스플레이 장치(200)의 계정 정보가 동일한 경우, 통신부(110)는 계정 서비스를 제공하는 서버를 통해 디스플레이 장치(200)와 통신을 수행할 수 있다. 이에 따라, 통신부(110)는 디스플레이 장치(200)와 통신하여, 오브젝트에 대한 정보를 수신할 수 있다.The communication unit 110 may communicate with the display apparatus 200 . In particular, the communication unit 110 may communicate with the display apparatus 200 through account information of the user terminal apparatus 100 . For example, when the account information of the user terminal device 100 and the account information of the display device 200 are the same, the communication unit 110 may communicate with the display device 200 through a server that provides an account service. . Accordingly, the communication unit 110 may communicate with the display apparatus 200 to receive information about the object.
저장부(140)는 사용자 단말 장치(100)의 구성요소의 전반적인 동작을 제어하기 위한 운영체제(Operating System: OS) 및 사용자 단말 장치(100)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다.The storage unit 140 may store an operating system (OS) for controlling overall operations of the components of the user terminal device 100 and commands or data related to the components of the user terminal device 100 .
이에 따라, 프로세서(170)는 저장부(140)에 저장된 다양한 명령 또는 데이터 등을 이용하여 사용자 단말 장치(100)의 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다. Accordingly, the processor 170 may control a plurality of hardware or software components of the user terminal device 100 using various commands or data stored in the storage unit 140 , and at least one of the other components. The command or data received from the volatile memory may be loaded and processed, and various data may be stored in the non-volatile memory.
특히, 저장부(140)는 복수의 제스처에 대한 정보를 저장할 수 있다. 일 예로, 저장부(140)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보 및 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하기 위한 제스처에 대한 정보 및, 특정 어플리케이션을 실행하기 위한 제스처에 대한 정보를 저장할 수 있다. In particular, the storage 140 may store information on a plurality of gestures. For example, the storage unit 140 may store information on a gesture for displaying information on an object included in an image displayed on the display device 200 and information on a plurality of applications related to the object, and information on a specific application for executing a specific application. Information about the gesture can be stored.
또한, 저장부(140)는 복수의 오브젝트에 매칭된 복수의 어플리케이션에 대한 정보를 저장할 수 있다. 이에 따라, 프로세서(170)는 영상에 포함된 복수의 오브젝트 중 하나를 선택하는 사용자 명령이 수신되면, 복수의 오브젝트에 매칭된 복수의 어플리케이션에 대한 정보에 기초하여, 선택된 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 또한, 프로세서(140)는 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 복수의 오브젝트에 매칭된 복수의 어플리케이션에 대한 정보에 기초하여, 특정 어플리케이션에 매칭된 특정 오브젝트를 판단하고, 영상에서 특정 오브젝트를 식별할 수 있다.Also, the storage 140 may store information on a plurality of applications matched to a plurality of objects. Accordingly, when a user command for selecting one of a plurality of objects included in the image is received, the processor 170 provides information on a plurality of applications related to the selected object based on information on a plurality of applications matched with the plurality of objects. information may be displayed on the display 130 . In addition, when the user's gesture is determined to be a gesture for executing a specific application, the processor 140 determines a specific object matched to a specific application based on information on a plurality of applications matched to the plurality of objects, A specific object can be identified in an image.
또한, 저장부(140)는 영상에 포함된 오브젝트를 식별할 수 있는 오브젝트 인식 알고리즘 또는 인공 지능 모델에 관한 정보를 저장할 수 있다.Also, the storage 140 may store information about an object recognition algorithm or artificial intelligence model capable of identifying an object included in an image.
입력부(150)는 다양한 사용자 명령을 입력 받을 수 있다. 프로세서(170)는 입력부(150)를 통해 입력된 사용자 명령에 대응되는 기능을 실행할 수 있다.The input unit 150 may receive various user commands. The processor 170 may execute a function corresponding to a user command input through the input unit 150 .
일 예로, 입력부(150)는 사용자의 제스처에 기반한 드래그 입력을 수신할 수 있다. 이 경우, 프로세서(140)는 드래그 입력에 기초하여 사용자의 제스처를 판단하고, 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보 및, 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다. 또는, 프로세서(140)는 사용자의 제스처가 특정 어플리케이션을 위한 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 기초하여 특정 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다. 일 예로, 사용자가 L을 그리는 드래그 입력을 입력부(150)에 입력한 경우, 프로세서(150)는 지도 어플리케이션을 실행하고, 영상에 포함된 지역 명칭에 기초하여 지도 어플리케이션이 제공하는 화면을 디스플레이(130)에 표시할 수 있다.For example, the input unit 150 may receive a drag input based on a user's gesture. In this case, the processor 140 determines the user's gesture based on the drag input, and when it is determined that the user's gesture is a preset gesture, information on the object included in the image displayed on the display apparatus 200 and the object Information on a plurality of applications related to may be displayed on the display 130 . Alternatively, when the user's gesture is determined to be a gesture for a specific application, the processor 140 may display a screen provided by the specific application on the display 130 based on the object included in the image displayed on the display device 200 . can For example, when the user inputs a drag input for drawing L into the input unit 150 , the processor 150 executes the map application and displays a screen provided by the map application based on the region name included in the image on the display 130 . ) can be displayed.
이를 위해, 입력부(260)는 입력 패널로 구현될 수 있다. 입력 패널은 터치패드(Touch Pad) 혹은 각종 기능 키, 숫자 키, 특수 키, 문자 키 등을 구비한 키패드(Key Pad) 또는 터치 스크린(Touch Screen) 방식으로 구현될 수 있다.To this end, the input unit 260 may be implemented as an input panel. The input panel may be implemented in the form of a touch pad or a keypad including various function keys, number keys, special keys, character keys, or the like, or a touch screen method.
마이크(160)는 사용자 음성을 수신할 수 있다. 여기에서, 사용자 음성은 사용자 단말 장치(100)의 특정 기능을 실행시키기 위한 음성이 될 수 있다. 프로세서(170)는 마이크(160)를 통해 사용자 음성이 수신되면, STT(Speech to text) 알고리즘을 통해 사용자 음성을 분석하고, 사용자 음성에 대응되는 기능을 수행할 수 있다.The microphone 160 may receive a user's voice. Here, the user's voice may be a voice for executing a specific function of the user terminal device 100 . When the user's voice is received through the microphone 160 , the processor 170 may analyze the user's voice through a speech to text (STT) algorithm and perform a function corresponding to the user's voice.
일 예로, 프로세서(170)는 마이크(160)를 통해 기설정된 음성이 수신된 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보 및, 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이(130)에 표시할 수 있다.For example, when a preset voice is received through the microphone 160 , the processor 170 displays information on an object included in an image displayed on the display device 200 and information on a plurality of applications related to the object. (130) can be indicated.
스피커(미도시)는 다양한 오디오를 출력할 수 있다. 예를 들어, 스피커(미도시)는 음악 어플리케이션이 제공하는 다양한 사운드를 출력할 수 있다.A speaker (not shown) may output various audio. For example, a speaker (not shown) may output various sounds provided by a music application.
도 16은 본 개시의 일 실시 예에 따른 디스플레이 장치를 설명하기 위한 도면이다.16 is a view for explaining a display device according to an embodiment of the present disclosure.
도 16을 참조하면, 본 개시의 일 실시 예에 따른 디스플레이 장치(200)는 카메라(210), 통신부(220), 디스플레이(230), 저장부(240), 입력부(250), 마이크(260), 스피커(270), 신호 처리부(280) 및 프로세서(290)를 포함할 수 있다. Referring to FIG. 16 , the display apparatus 200 according to an embodiment of the present disclosure includes a camera 210 , a communication unit 220 , a display 230 , a storage unit 240 , an input unit 250 , and a microphone 260 . , a speaker 270 , a signal processing unit 280 , and a processor 290 .
카메라(210)는 피사체를 촬영하여 이미지를 생성할 수 있다. 예를 들어, 카메라(210)는 디스플레이 장치(200) 전방의 사용자를 촬영하여, 사용자를 포함하는 이미지를 생성할 수 있다. 이에 따라, 프로세서(290)는 카메라(210)에 의해 촬영된 복수의 이미지를 분석하여 사용자의 제스처를 판단할 수 있다.The camera 210 may generate an image by photographing a subject. For example, the camera 210 may generate an image including the user by photographing the user in front of the display apparatus 200 . Accordingly, the processor 290 may analyze the plurality of images captured by the camera 210 to determine the user's gesture.
이와 같은, 카메라(210)는 디스플레이 장치(200)의 중앙 상측의 패널에 배치될 수 있으나, 반드시 이에 한정되는 것은 아니고, 디스플레이 장치(200)의 중앙 하측의 패널 등 다양한 위치에 배치될 수 있다.As such, the camera 210 may be disposed on a panel above the center of the display device 200 , but is not limited thereto, and may be disposed at various locations such as a panel below the center of the display device 200 .
한편, 카메라(170)에 의해 촬영된 이미지는 저장부(240)에 저장될 수 있다.Meanwhile, an image captured by the camera 170 may be stored in the storage unit 240 .
통신부(220)는 외부 장치와 통신하여 다양한 데이터를 송수신할 수 있다. 예를 들어, 통신부(220)는 근거리 통신망(LAN: Local Area Network), 인터넷 네트워크, 이동 통신 네트워크를 통해 서버와 통신을 수행할 수 있음은 물론, 이동 통신 네트워크, BT(Bluetooth), BLE(Bluetooth Low Energy), WI-FI(Wireless Fidelity), Zigbee, NFC 등과 같은 다양한 통신 방식 등을 통해 사용자 단말 장치(100)과 통신을 수행할 수 있다.The communication unit 220 may communicate with an external device to transmit/receive various data. For example, the communication unit 220 may communicate with a server through a local area network (LAN), an Internet network, and a mobile communication network, as well as a mobile communication network, BT (Bluetooth), BLE (Bluetooth) Low Energy), WI-FI (Wireless Fidelity), Zigbee, NFC, etc. may communicate with the user terminal device 100 through various communication methods.
이를 위해, 통신부(220)는 네트워크 통신을 수행하기 위한 다양한 통신 모듈을 포함할 수 있다. 예를 들어, 통신부(220)는 블루투스 모듈, 와이파이 모듈, 무선 통신 모듈 등을 포함할 수 있다.To this end, the communication unit 220 may include various communication modules for performing network communication. For example, the communication unit 220 may include a Bluetooth module, a Wi-Fi module, a wireless communication module, and the like.
*한편, 통신부(220)는 외부 장치와 통신을 수행하여, 방송 컨텐츠(또는, 방송 신호)를 수신할 수도 있다. 여기에서, 방송 컨텐츠는 영상, 오디오 또는 부가 데이터(예를 들어, EPG) 중 적어도 하나를 포함할 수 있다. 이를 위해, 통신부(220)는 튜너(미도시), 복조기(미도시), 등화기(미도시) 등을 포함할 수 있다.* Meanwhile, the communication unit 220 may communicate with an external device to receive broadcast content (or broadcast signal). Here, the broadcast content may include at least one of video, audio, and additional data (eg, EPG). To this end, the communication unit 220 may include a tuner (not shown), a demodulator (not shown), an equalizer (not shown), and the like.
저장부(240)는 디스플레이 장치(200)의 구성요소의 전반적인 동작을 제어하기 위한 운영체제(Operating System: OS) 및 디스플레이 장치(200)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다.The storage unit 240 may store an operating system (OS) for controlling overall operations of the components of the display apparatus 200 and commands or data related to components of the display apparatus 200 .
이에 따라, 프로세서(290)는 저장부(240)에 저장된 다양한 명령 또는 데이터 등을 이용하여 디스플레이 장치(200)의 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다. Accordingly, the processor 290 may control a plurality of hardware or software components of the display apparatus 200 by using various commands or data stored in the storage unit 240 , and use at least one of the other components. The received command or data may be loaded into the volatile memory for processing, and various data may be stored in the non-volatile memory.
특히, 저장부(240)는 복수의 제스처에 대한 정보를 저장할 수 있다. 일 예로, 저장부(240)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송하기 위한 제스처에 대한 정보 및, 특정 어플리케이션의 기능의 실행에 필요한 특정 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송하기 위한 제스처에 대한 정보를 저장할 수 있다. In particular, the storage unit 240 may store information on a plurality of gestures. For example, the storage unit 240 may include information on a gesture for transmitting information on an object included in an image displayed on the display device 200 to the user terminal device 100 and a specific information required for executing a function of a specific application. Information about a gesture for transmitting information about an object to the user terminal device 100 may be stored.
또한, 저장부(240)는 영상에 포함된 오브젝트를 식별할 수 있는 오브젝트 인식 알고리즘 또는 인공 지능 모델에 관한 정보를 저장할 수 있다. Also, the storage unit 240 may store information about an object recognition algorithm or artificial intelligence model capable of identifying an object included in an image.
입력부(250)는 다양한 사용자 명령을 입력 받을 수 있다. 프로세서(290)는 입력부(250)를 통해 입력된 사용자 명령에 대응되는 기능을 실행할 수 있다.The input unit 250 may receive various user commands. The processor 290 may execute a function corresponding to a user command input through the input unit 250 .
일 예로, 입력부(250)는 오브젝트에 대한 정보를 전송하기 위한 사용자 명령을 입력받을 수 있다. 이 경우, 프로세서(290)는 디스플레이(230)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.For example, the input unit 250 may receive a user command for transmitting information on an object. In this case, the processor 290 may transmit information on the object included in the image displayed on the display 230 to the user terminal device 100 .
이를 위해, 입력부(250)는 입력 패널로 구현될 수 있다. 입력 패널은 터치패드(Touch Pad) 혹은 각종 기능 키, 숫자 키, 특수 키, 문자 키 등을 구비한 키패드(Key Pad) 또는 터치 스크린(Touch Screen) 방식으로 구현될 수 있다.To this end, the input unit 250 may be implemented as an input panel. The input panel may be implemented in the form of a touch pad or a keypad including various function keys, number keys, special keys, character keys, or the like, or a touch screen method.
마이크(260)는 사용자 음성을 수신할 수 있다. 여기에서, 사용자 음성은 디스플레이 장치(200)의 특정 기능을 실행시키기 위한 음성이 될 수 있다. 프로세서(290)는 마이크(260)를 통해 사용자 음성이 수신되면, STT(Speech to text) 알고리즘을 통해 사용자 음성을 분석하고, 사용자 음성에 대응되는 기능을 수행할 수 있다.The microphone 260 may receive a user's voice. Here, the user's voice may be a voice for executing a specific function of the display apparatus 200 . When a user's voice is received through the microphone 260 , the processor 290 may analyze the user's voice through a speech to text (STT) algorithm and perform a function corresponding to the user's voice.
일 예로, 프로세서(290)는 마이크(260)를 통해 오브젝트에 대한 정보의 전송을 요청하는 사용자 음성이 수신되면, 디스플레이(230)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다.For example, when a user voice requesting transmission of information on an object is received through the microphone 260 , the processor 290 transmits information on the object included in the image displayed on the display 230 to the user terminal device 100 . can be sent to
스피커(270)는 다양한 사운드를 출력할 수 있다. 예를 들어, 스피커(270)는 방송 컨텐츠의 사운드를 출력할 수 있다.The speaker 270 may output various sounds. For example, the speaker 270 may output sound of broadcast content.
신호 처리부(280)는 통신부(220)를 통해 수신된 컨텐츠에 대한 신호 처리를 수행한다. 구체적으로, 신호 처리부(280)는 컨텐츠를 구성하는 영상에 디코딩, 스케일링 및 프레임 레이트 변환 등의 동작을 수행하여, 영상을 디스플레이 장치(200)에서 출력 가능한 형태로 신호 처리할 수 있다. 또한, 신호 처리부(280)는 컨텐츠를 구성하는 오디오에 디코딩 등의 신호 처리를 수행하여, 오디오를 스피커(270)에서 출력 가능한 형태로 신호 처리할 수 있다.The signal processing unit 280 performs signal processing on the content received through the communication unit 220 . Specifically, the signal processing unit 280 may perform operations such as decoding, scaling, and frame rate conversion on an image constituting the content to signal the image in a form that can be output by the display apparatus 200 . In addition, the signal processing unit 280 may perform signal processing such as decoding on the audio constituting the content to process the audio signal in a form that can be output from the speaker 270 .
이에 따라, 디스플레이(230)는 신호 처리부(280)에서 출력되는 영상 등을 디스플레이 할 수 있고, 스피커(270)는 신호 처리부(290)에서 출력되는 오디오를 출력할 수 있다. Accordingly, the display 230 may display an image output from the signal processor 280 , and the speaker 270 may output audio output from the signal processor 290 .
프로세서(290)는 디스플레이 장치(200)의 전반적인 동작을 제어한다. 이를 위해, 프로세서(290)는 중앙처리장치(central processing unit(CPU)), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 적어도 하나를 포함할 수 있다.The processor 290 controls the overall operation of the display apparatus 200 . To this end, the processor 290 may include at least one of a central processing unit (CPU), an application processor (AP), or a communication processor (CP).
프로세서(290)는 운영 체제 또는 응용 프로그램을 구동하여 프로세서(290)에 연결된 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 각종 데이터 처리 및 연산을 수행할 수 있다. 또한, 프로세서(290)는 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장할 수 있다. The processor 290 may control hardware or software components connected to the processor 290 by driving an operating system or an application program, and may perform various data processing and operations. In addition, the processor 290 may load and process commands or data received from at least one of the other components into the volatile memory, and store various data in the non-volatile memory.
프로세서(290)는 사용자 단말 장치(100)로, 디스플레이(230)에 표시된 영상에 포함된 오브젝트에 대한 정보를 전송하도록 통신부(220)를 제어할 수 잇다. 여기에서, 오브젝트에 대한 정보는 상술한 바와 같이, 영상 분석을 통해 획득할 수 있다. 다만, 반드시 이에 한정되는 것은 아니고, 프로세서(290)는 오브젝트에 대한 정보를 포함하는 메타 데이터가, 영상을 제공하는 서버로부터 수신된 경우이면, 메타 데이터를 사용자 단말 장치(100)로 전송할 수도 있다. 이 경우, 사용자 단말 장치(100)는 메타 데이터에 포함된 오브젝트에 대한 정보에 기초하여, 오브젝트에 대한 정보를 표시할 수 있다.The processor 290 may control the communication unit 220 to transmit information on an object included in an image displayed on the display 230 to the user terminal device 100 . Here, information on the object may be obtained through image analysis, as described above. However, the present invention is not limited thereto, and the processor 290 may transmit the metadata to the user terminal device 100 when metadata including information on an object is received from a server providing an image. In this case, the user terminal device 100 may display information on the object based on the information on the object included in the metadata.
도 17은 본 개시의 일 실시 예에 따른 사용자 단말 장치의 동작을 설명하기 위한 흐름도이다.17 is a flowchart illustrating an operation of a user terminal device according to an embodiment of the present disclosure.
사용자 단말 장치(100)는 사용자의 제스처에 의한 사용자 단말 장치(100)의 움직임이 센서(120)를 통해 감지되면, 사용자 단말 장치(100)의 움직임에 기초하여 사용자의 제스처를 판단(S1710)할 수 있다. When the movement of the user terminal device 100 by the user's gesture is detected through the sensor 120, the user terminal device 100 determines the user's gesture based on the movement of the user terminal device 100 (S1710). can
일 예로, 센서(120)가 3축 가속도 센서로 구현되는 경우, 사용자 단말 장치(100)는 x축, y축 및 z축에서의 사용자 단말 장치(100)의 가속도에 대한 정보를 포함하는 센싱 데이터에 기초하여, 중력 가속도를 기준으로 사용자 단말 장치(100)가 기울어진 각도를 판단할 수 있고, 일정 시간 동안 센서(120)에 의해 감지된 사용자 단말 장치(100)의 x축, y축 및 z축에서의 가속도 변화량에 기초하여, 사용자 단말 장치(100)의 움직임을 판단할 수 있다. 그리고, 사용자 단말 장치(100)는 사용자 단말 장치(100)의 움직임 및 사용자 단말 장치(100)의 각도 변화에 기초하여, 사용자의 제스처를 판단할 수 있다.As an example, when the sensor 120 is implemented as a three-axis acceleration sensor, the user terminal device 100 provides sensing data including information on the acceleration of the user terminal device 100 in the x-axis, y-axis, and z-axis. Based on , it is possible to determine the tilt angle of the user terminal device 100 based on the gravitational acceleration, and the x-axis, y-axis, and z of the user terminal device 100 sensed by the sensor 120 for a predetermined time. The movement of the user terminal device 100 may be determined based on the amount of acceleration change in the axis. In addition, the user terminal device 100 may determine the user's gesture based on the movement of the user terminal device 100 and the change in the angle of the user terminal device 100 .
또한, 센서(120)가 자이로 센서로 구현되는 경우, 사용자 단말 장치(100)는 사용자 단말 장치(100)의 회전에 기초하여 측정된 코리올리의 힘을 전기적 신호로 변환한 센싱 데이터에 기초하여, 사용자 단말 장치(100)의 회전 정도를 판단할 수 있고, 이로부터 사용자의 제스처를 판단할 수 있다.In addition, when the sensor 120 is implemented as a gyro sensor, the user terminal device 100 converts the Coriolis force measured based on the rotation of the user terminal device 100 into an electrical signal. Based on the sensing data, the user The degree of rotation of the terminal device 100 may be determined, and the user's gesture may be determined based thereon.
사용자 단말 장치(100)는 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치(200)로부터, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 수신(S1720)할 수 있다.When it is determined that the user's gesture is a preset gesture, the user terminal device 100 may receive information about an object included in an image displayed on the display device 200 from the display device 200 ( S1720 ).
구체적으로, 사용자 단말 장치(100)는 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 요청하는 신호를 디스플레이 장치(200)로 전송할 수 있다. 이를 위해, 사용자 단말 장치(100)는 기설정된 제스처에 대한 정보를 기저장하고 있을 수 있다.Specifically, when it is determined that the user's gesture is a preset gesture, the user terminal device 100 may transmit a signal requesting information on an object included in the image displayed on the display device 200 to the display device 200 . have. To this end, the user terminal device 100 may pre-store information about a preset gesture.
이 경우, 디스플레이 장치(200)는 디스플레이 장치(200)에 표시된 영상에 포함된 오브젝트에 대한 정보를 사용자 단말 장치(100)로 전송할 수 있다. 일 예로, 디스플레이 장치(200)는 디스플레이 장치(200)에 표시된 영상에, 오브젝트에 대한 정보에 기초하여 UI를 중첩한 영상을 사용자 단말 장치(100)로 전송할 수 있다.In this case, the display apparatus 200 may transmit information about an object included in the image displayed on the display apparatus 200 to the user terminal apparatus 100 . For example, the display apparatus 200 may transmit an image in which a UI is superimposed on an image displayed on the display apparatus 200 based on information on an object to the user terminal apparatus 100 .
사용자 단말 장치(100)는 오브젝트에 대한 정보 및 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 디스플레이에 표시(S1730)할 수 있다. 여기에서, 오브젝트와 관련된 어플리케이션이란, 식별된 오브젝트를 이용하여 정보를 제공하거나, 기능을 수행할 수 있는 어플리케이션으로써, 가령 식별된 오브젝트가 배우 A이면, 배우 A의 프로필 정보를 제공할 수 있는 어플리케이션, 배우 A가 출연한 드라마나 영화에 대한 정보를 제공할 수 있는 어플리케이션 등이 될 수 있다. The user terminal device 100 may display information on the object and information on a plurality of applications related to the object on the display ( S1730 ). Here, the object-related application is an application that can provide information or perform a function using the identified object, for example, if the identified object is an actor A, an application that can provide profile information of the actor A; It may be an application that can provide information about a drama or movie in which actor A appeared.
사용자 단말 장치(100)는 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 오브젝트에 대한 정보에 기초하여 선택된 어플리케이션이 제공하는 화면을 디스플레이에 표시(S1740)할 수 있다. When a user command for selecting one of a plurality of applications is received, the user terminal device 100 may display a screen provided by the selected application on the display based on the information on the object ( S1740 ).
구체적으로, 사용자 단말 장치(100)는 복수의 어플리케이션 중 하나의 어플리케이션이 선택되면, 식별된 오브젝트를 이용하여 어플리케이션이 제공하는 화면을 디스플레이에 표시할 수 있다. 일 예로, 오브젝트가 자동차 A이고, 웹 검색을 위한 어플리케이션이 선택된 경우, 사용자 단말 장치(100)는 웹 검색 서비스를 제공하는 서버로 자동차 A를 키워드로 웹 검색하도록 요청하는 신호를 전송하고, 서버로부터 자동차 A를 키워드로 웹 검색한 페이지에 대한 정보 수신할 수 있다. 그리고, 사용자 단말 장치(100)는 서버로부터 수신한 영상에 대한 정보에 기초하여, 어플리케이션이 제공하는 화면을 디스플레이에 표시할 수 있다.Specifically, when one application among a plurality of applications is selected, the user terminal device 100 may display a screen provided by the application on the display using the identified object. For example, when the object is car A and an application for web search is selected, the user terminal device 100 transmits a signal requesting a web search for car A as a keyword to a server providing a web search service, and from the server It is possible to receive information about a page searched for on the web with the keyword car A. In addition, the user terminal device 100 may display a screen provided by the application on the display based on the information about the image received from the server.
한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 디스플레이 장치에 설치 가능한 소프트웨어 또는 어플리케이션 형태로 구현될 수 있다. Meanwhile, the above-described methods according to various embodiments of the present disclosure may be implemented in the form of software or applications that can be installed on an existing display device.
또한, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 사용자 단말 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드만으로도 구현될 수 있다. In addition, the above-described methods according to various embodiments of the present disclosure may be implemented only by software upgrade or hardware upgrade of an existing user terminal device.
한편, 본 발명에 따른 사용자 단말 장치의 제어 방법을 순차적으로 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다. Meanwhile, a non-transitory computer readable medium in which a program for sequentially executing the method of controlling a user terminal device according to the present invention is stored may be provided.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.The non-transitory readable medium refers to a medium that stores data semi-permanently, not a medium that stores data for a short moment, such as a register, cache, memory, etc., and can be read by a device. Specifically, the various applications or programs described above may be provided by being stored in a non-transitory readable medium such as a CD, DVD, hard disk, Blu-ray disk, USB, memory card, ROM, and the like.
또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.In addition, although preferred embodiments of the present invention have been illustrated and described above, the present invention is not limited to the specific embodiments described above, and the technical field to which the present invention pertains without departing from the gist of the present invention as claimed in the claims Various modifications are possible by those of ordinary skill in the art, and these modifications should not be individually understood from the technical spirit or prospect of the present invention.

Claims (15)

  1. 사용자 단말 장치에 있어서,In the user terminal device,
    통신부;communication department;
    디스플레이;display;
    센서; 및sensor; and
    사용자의 제스처에 의한 상기 사용자 단말 장치의 움직임이 상기 센서를 통해 감지되면, 상기 사용자 단말 장치의 움직임에 기초하여 상기 사용자의 제스처를 판단하고, When the movement of the user terminal device by the user's gesture is detected through the sensor, determining the user's gesture based on the movement of the user terminal device,
    상기 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 영상에 포함된 오브젝트에 대한 정보를 상기 통신부를 통해 수신하고, 상기 오브젝트에 대한 정보 및, 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하며, When it is determined that the user's gesture is a preset gesture, information on an object included in an image displayed on the display device is received from the display device through the communication unit, information on the object, and a plurality of objects related to the object information about the application of the display is displayed,
    상기 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 상기 오브젝트에 대한 정보에 기초하여 상기 선택된 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는 프로세서;를 포함하는, 사용자 단말 장치.and a processor configured to display a screen provided by the selected application on the display based on the information on the object when a user command for selecting one of the plurality of applications is received.
  2. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 오브젝트에 대한 정보를 상기 디스플레이에 표시하고, 상기 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하는, 사용자 단말 장치.Displaying information on the object on the display, and when a user command for selecting the object is received, information on the object and information on a plurality of applications related to the object are displayed on the display, a user terminal device .
  3. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 디스플레이 장치에 표시된 영상에, 상기 오브젝트에 대응되는 UI를 중첩한 영상을 상기 디스플레이에 표시하며, 상기 UI를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하는, 사용자 단말 장치.An image in which a UI corresponding to the object is superimposed on the image displayed on the display device is displayed on the display, and when a user command for selecting the UI is received, information on the object and a plurality of applications related to the object For displaying information on the display, the user terminal device.
  4. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 사용자의 히스토리 정보에 기초하여, 복수의 어플리케이션의 실행 횟수에 대한 정보를 획득하고, 상기 실행 횟수에 대한 정보에 기초하여 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하는, 사용자 단말 장치.Obtaining information on the number of executions of a plurality of applications based on the user's history information, and displaying information on the plurality of applications on the display based on the information on the number of executions.
  5. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 복수의 영상 프레임을 수신하고, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터를 상기 디스플레이에 표시하며, 상기 인디케이터를 통해, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령이 수신되면, 상기 선택된 영상 프레임에 포함된 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 상기 디스플레이에 표시하는, 사용자 단말 장치.Receive, from the display device, a plurality of image frames displayed on the display device, and display an indicator for selecting one image frame among the plurality of image frames on the display, and through the indicator, the plurality of image frames When a user command for selecting one of the image frames is received, information on an object included in the selected image frame and information on a plurality of applications related to the object are displayed on the display.
  6. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 사용자의 제스처가 특정 어플리케이션의 실행을 위한 제스처로 판단되는 경우, When it is determined that the user's gesture is a gesture for executing a specific application,
    상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 상기 특정 어플리케이션의 기능의 실행을 위해 필요한 오브젝트를 판단하고, 상기 오브젝트에 기초하여 상기 특정 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는, 사용자 단말 장치.A user terminal device for determining an object necessary for executing a function of the specific application from among a plurality of objects included in the image displayed on the display device, and displaying a screen provided by the specific application on the display based on the object .
  7. 제6항에 있어서,7. The method of claim 6,
    상기 프로세서는,The processor is
    상기 특정 어플리케이션이 통화 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 전화 번호를 나타내는 오브젝트를 판단하고, 상기 전화 번호에 기초하여 상기 통화 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는, 사용자 단말 장치.When the specific application is a call application, determining an object representing a phone number from among a plurality of objects included in the image displayed on the display device, and displaying a screen provided by the call application on the display based on the phone number , a user terminal device.
  8. 제6항에 있어서,7. The method of claim 6,
    상기 프로세서는,The processor is
    상기 특정 어플리케이션이 지도 어플리케이션인 경우, 상기 디스플레이 장치에 표시된 영상에 포함된 복수의 오브젝트 중에서 위치를 나타내는 오브젝트를 판단하고, 상기 위치에 기초하여 상기 지도 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는, 사용자 단말 장치.When the specific application is a map application, the user determines an object indicating a location from among a plurality of objects included in the image displayed on the display device, and displays a screen provided by the map application on the display based on the location terminal device.
  9. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 사용자의 제스처가 화면 캡쳐를 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에 표시된 영상을 수신하고, 상기 영상에 기초하여 사진 어플리케이션이 제공하는 화면을 상기 디스플레이에 표시하는, 사용자 단말 장치.When it is determined that the user's gesture is a gesture for screen capture, the user terminal device receives an image displayed on the display device from the display device, and displays a screen provided by a photo application on the display based on the image. .
  10. 제1항에 있어서,According to claim 1,
    상기 프로세서는,The processor is
    상기 사용자의 제스처가 음악 어플리케이션의 실행을 위한 제스처로 판단되는 경우, 상기 디스플레이 장치로부터 상기 디스플레이 장치에서 출력된 오디오 신호를 수신하고, 상기 오디오 신호에 기초하여 상기 디스플레이 장치에서 출력된 음악의 제목을 판단하며, 상기 음악의 제목에 기초하여 상기 음악 어플리케이션을 실행하는, 사용자 단말 장치.When it is determined that the user's gesture is a gesture for executing a music application, an audio signal output from the display device is received from the display device, and a title of music output from the display device is determined based on the audio signal and executing the music application based on the title of the music.
  11. 사용자 단말 장치의 제어 방법에 있어서,A method for controlling a user terminal device, comprising:
    사용자의 제스처에 의한 상기 사용자 단말 장치의 움직임이 감지되면, 상기 사용자 단말 장치의 움직임에 기초하여 상기 사용자의 제스처를 판단하는 단계; determining the user's gesture based on the movement of the user terminal device when the motion of the user terminal device is detected by the user's gesture;
    상기 사용자의 제스처가 기설정된 제스처로 판단되는 경우, 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 영상에 포함된 오브젝트에 대한 정보를 수신하는 단계; receiving, from a display device, information on an object included in an image displayed on the display device when the user's gesture is a preset gesture;
    상기 오브젝트에 대한 정보 및, 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는 단계; 및 displaying information on the object and information on a plurality of applications related to the object; and
    상기 복수의 어플리케이션 중 하나를 선택하기 위한 사용자 명령이 수신되는 경우, 상기 오브젝트에 대한 정보에 기초하여 상기 선택된 어플리케이션이 제공하는 화면을 표시하는 단계;를 포함하는, 사용자 단말 장치의 제어 방법.When a user command for selecting one of the plurality of applications is received, displaying a screen provided by the selected application based on the information on the object;
  12. 제11항에 있어서,12. The method of claim 11,
    상기 정보를 표시하는 단계는,The step of displaying the information is
    상기 오브젝트에 대한 정보를 표시하고, 상기 오브젝트를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는, 사용자 단말 장치의 제어 방법.Displaying information on the object, and when a user command for selecting the object is received, displaying information on the object and information on a plurality of applications related to the object.
  13. 제11항에 있어서,12. The method of claim 11,
    상기 정보를 표시하는 단계는,The step of displaying the information is
    상기 디스플레이 장치에 표시된 영상에, 상기 오브젝트에 대응되는 UI를 중첩한 영상을 표시하고, 상기 UI를 선택하기 위한 사용자 명령이 수신되면, 상기 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는, 사용자 단말 장치의 제어 방법.An image in which a UI corresponding to the object is superimposed is displayed on the image displayed on the display device, and when a user command for selecting the UI is received, information on the object and information on a plurality of applications related to the object Displaying, a control method of a user terminal device.
  14. 제11항에 있어서,12. The method of claim 11,
    상기 정보를 표시하는 단계는,The step of displaying the information is
    상기 사용자의 히스토리 정보에 기초하여, 복수의 어플리케이션의 실행 횟수에 대한 정보를 획득하고, 상기 실행 횟수에 대한 정보에 기초하여 복수의 어플리케이션에 대한 정보를 표시하는, 사용자 단말 장치의 제어 방법.A method of controlling a user terminal device, obtaining information on the number of executions of a plurality of applications based on the user's history information, and displaying information on the plurality of applications based on the information on the number of executions.
  15. 제11항에 있어서,12. The method of claim 11,
    상기 정보를 표시하는 단계는,The step of displaying the information is
    상기 디스플레이 장치로부터, 상기 디스플레이 장치에 표시된 복수의 영상 프레임을 수신하고, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 인디케이터를 표시하며, 상기 인디케이터를 통해, 상기 복수의 영상 프레임 중 하나의 영상 프레임을 선택하기 위한 사용자 명령이 수신되면, 상기 선택된 영상 프레임에 포함된 오브젝트에 대한 정보 및 상기 오브젝트와 관련된 복수의 어플리케이션에 대한 정보를 표시하는, 사용자 단말 장치의 제어 방법.Receive, from the display device, a plurality of image frames displayed on the display device, display an indicator for selecting one image frame from among the plurality of image frames, and display an indicator for selecting one image frame from among the plurality of image frames through the indicator. When a user command for selecting an image frame is received, information on an object included in the selected image frame and information on a plurality of applications related to the object are displayed.
PCT/KR2020/016339 2019-12-10 2020-11-19 User terminal device and method for controlling same WO2021118097A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0163572 2019-12-10
KR1020190163572A KR20210073094A (en) 2019-12-10 2019-12-10 User terminal device and control method thereof

Publications (1)

Publication Number Publication Date
WO2021118097A1 true WO2021118097A1 (en) 2021-06-17

Family

ID=76329017

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/016339 WO2021118097A1 (en) 2019-12-10 2020-11-19 User terminal device and method for controlling same

Country Status (2)

Country Link
KR (1) KR20210073094A (en)
WO (1) WO2021118097A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120105346A (en) * 2011-03-15 2012-09-25 엘지전자 주식회사 Method for searching object information and dispaly apparatus thereof
KR20130097484A (en) * 2012-02-24 2013-09-03 삼성전자주식회사 Method for sharing content and mobile terminal thereof
KR20140059417A (en) * 2012-11-08 2014-05-16 주식회사 엘지유플러스 Terminal apparatus for providing information of object comprised broadcast program and method for operating terminal apparatus
US20170118436A1 (en) * 2012-07-25 2017-04-27 Samsung Electronics Co., Ltd. Method and mobile terminal for displaying information, method and display device for providing information, and method and mobile terminal for generating control signal
US20170199881A1 (en) * 2009-07-16 2017-07-13 Sony Mobile Communications Inc. Information terminal, information presentation method for an information terminal, and information presentation program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170199881A1 (en) * 2009-07-16 2017-07-13 Sony Mobile Communications Inc. Information terminal, information presentation method for an information terminal, and information presentation program
KR20120105346A (en) * 2011-03-15 2012-09-25 엘지전자 주식회사 Method for searching object information and dispaly apparatus thereof
KR20130097484A (en) * 2012-02-24 2013-09-03 삼성전자주식회사 Method for sharing content and mobile terminal thereof
US20170118436A1 (en) * 2012-07-25 2017-04-27 Samsung Electronics Co., Ltd. Method and mobile terminal for displaying information, method and display device for providing information, and method and mobile terminal for generating control signal
KR20140059417A (en) * 2012-11-08 2014-05-16 주식회사 엘지유플러스 Terminal apparatus for providing information of object comprised broadcast program and method for operating terminal apparatus

Also Published As

Publication number Publication date
KR20210073094A (en) 2021-06-18

Similar Documents

Publication Publication Date Title
WO2015111790A1 (en) Smart watch, display device and method of controlling therefor
WO2011078540A2 (en) Mobile device and related control method for external output depending on user interaction based on image sensing module
WO2013133478A1 (en) Portable device and control method thereof
EP3042266A1 (en) Portable device and method of controlling therefor
WO2015005721A1 (en) Portable terminal and method for providing information using the same
WO2018056617A1 (en) Wearable device and method for providing widget thereof
WO2018169374A1 (en) Electronic device and control method therefor
EP3906553A1 (en) Electronic device for providing graphic data based on voice and operating method thereof
WO2020197012A1 (en) Display apparatus and control method thereof
WO2016089047A1 (en) Method and device for providing content
WO2020096288A1 (en) Display apparatus and control method thereof
WO2020116960A1 (en) Electronic device for generating video comprising character and method thereof
WO2019203494A1 (en) Electronic device for inputting characters and method of operation of same
WO2014148691A1 (en) Mobile device and method for controlling the same
WO2014061905A1 (en) System for providing motion and voice based bookmark and method therefor
WO2018056587A1 (en) Electronic apparatus and controlling method thereof
WO2021080290A1 (en) Electronic apparatus and control method thereof
WO2021172832A1 (en) Method for editing image on basis of gesture recognition, and electronic device supporting same
WO2018034535A1 (en) Display apparatus and content display method thereof
WO2021118097A1 (en) User terminal device and method for controlling same
WO2016122153A1 (en) Display apparatus and control method thereof
WO2019151739A1 (en) Electronic apparatus and control method thereof
WO2019216484A1 (en) Electronic device and operating method therefor
WO2017217612A1 (en) Method for creating and sharing subtitles of video content by using one-touch feature
WO2019066254A1 (en) Method and apparatus for executing application by using barometer

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20898061

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20898061

Country of ref document: EP

Kind code of ref document: A1