WO2016111421A1 - 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 - Google Patents

눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 Download PDF

Info

Publication number
WO2016111421A1
WO2016111421A1 PCT/KR2015/004377 KR2015004377W WO2016111421A1 WO 2016111421 A1 WO2016111421 A1 WO 2016111421A1 KR 2015004377 W KR2015004377 W KR 2015004377W WO 2016111421 A1 WO2016111421 A1 WO 2016111421A1
Authority
WO
WIPO (PCT)
Prior art keywords
segment
user
image
frequency characteristic
present
Prior art date
Application number
PCT/KR2015/004377
Other languages
English (en)
French (fr)
Inventor
채용욱
Original Assignee
주식회사 호두랩스코리아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 호두랩스코리아 filed Critical 주식회사 호두랩스코리아
Priority to KR1020167023929A priority Critical patent/KR101723840B1/ko
Publication of WO2016111421A1 publication Critical patent/WO2016111421A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer

Definitions

  • the present invention relates to a method, system and non-transitory computer readable recording medium for providing a user interface based on an eye image.
  • a relatively small wearable device for example, a smart glass, a smart watch, a smart band, a smart device in the form of a ring or a brooch, a body that a user can wear and carry on a body
  • smart devices that are attached or embedded directly into clothing.
  • the present inventors recognize the object to be controlled by the user based on the image information reflected by the user's eye (ie, reflected on the eye) and determine a control command so that the user can control the eye (ie the pupil). He has developed a user interface that allows him to control objects as he wishes by moving.
  • the object of the present invention is to solve all the above-mentioned problems.
  • the present invention captures an image reflected by the user's eye, specifies a segment in the captured image above, and the segment is used to reflect an object present in the real world reflected by the eye. It is the corresponding area-By referring to the frequency characteristic appearing in the above-mentioned segment, the object corresponding to the above-mentioned segment is recognized as the control target, so that the user wants only by moving the eyes (ie, the pupil). Another goal is to provide a user interface that allows you to control the object as it is.
  • a method for providing a user interface based on an eye image comprising: photographing an image reflected by an eye of a user, specifying a segment in the photographed image;
  • a segment is an area corresponding to a state in which an object existing in the real world is reflected and viewed by the eye-and an object corresponding to the specified segment with reference to a frequency characteristic appearing in the specified segment.
  • a method is provided that includes recognizing as.
  • a system for providing a user interface based on an eye image comprising: an image capturing unit for capturing an image reflected by a user's eye, a segment specifying a segment in the captured image A processor, wherein the segment is an area corresponding to a state in which an object existing in the real world is reflected by the eye, and an object corresponding to the specified segment with reference to a frequency characteristic appearing in the specified segment.
  • a system including an object recognition unit for recognizing an object as a control object.
  • non-transitory computer readable recording medium for recording another method, system, and computer program for executing the method for implementing the present invention.
  • the user since the user can obtain the control right for the object only by staring at the object with his eyes, and the user can control the operation of the object for which the control right is obtained by only moving his eyes.
  • An effect is achieved in which the user can control the object as desired using only eyes without using other body parts such as a hand.
  • the image processing for accurately recognizing the shape of the object reflected by the eye (such as It is possible to easily recognize what the user is gazing at, without performing the image processing).
  • FIG. 1 is a view showing a schematic configuration of an entire system for providing a user interface based on an eye image according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating an internal configuration of a system for providing a user interface based on an eye image according to an embodiment of the present invention.
  • FIG. 3 is a diagram exemplarily illustrating a configuration for specifying a segment corresponding to a state of an object reflected in a user's eye according to an embodiment of the present invention.
  • FIG. 4 is a diagram exemplarily illustrating a configuration for recognizing an object corresponding to a segment with reference to frequency characteristics according to an exemplary embodiment of the present invention.
  • FIG. 5 is a diagram exemplarily illustrating a configuration for specifying two or more segments respectively corresponding to the appearance of two or more objects reflected on the eyes of a user according to an exemplary embodiment of the present invention.
  • control unit 260 control unit
  • FIG. 1 is a view showing a schematic configuration of an entire system based on an eye image according to an embodiment of the present invention.
  • the entire system may include a communication network 100, a user interface providing system 200, and a device 300.
  • the communication network 100 may be configured regardless of a communication mode such as wired communication or wireless communication, and includes a local area network (LAN) and a metropolitan area network (MAN). ), And various communication networks such as a wide area network (WAN).
  • the communication network 100 as used herein may be a known Internet or World Wide Web (WWW).
  • the communication network 100 as used herein may include a well-known short range wireless communication network such as Wi-Fi, Wi-Fi Direct, LTE Direct, or Bluetooth.
  • the communication network 100 may include, at least in part, a known wired / wireless data communication network, a known telephone network, or a known wired / wireless television communication network without being limited thereto.
  • the user interface providing system 200 may be a digital device having a computing capability by mounting a microprocessor and a memory means.
  • the user interface providing system 200 may be a server system.
  • the user interface providing system 200 captures the image reflected by the user's eyes, the segment in the image captured above Segment is the area corresponding to the object reflected in the real world reflected by the eye.
  • the segment corresponds to the segment specified above with reference to the frequency characteristic appearing in the segment specified above.
  • the user interface providing system 200 may include a camera that performs a function of capturing an image reflected by the user's eyes or the user's eyes.
  • the user interface providing system 200 The function of the user interface providing system 200 will be described in more detail below.
  • the user interface providing system 200 has been described as above, but this description is an example, the device in which at least some of the functions or components required for the user interface providing system 200 is actually controlled as needed It will be apparent to those skilled in the art that they may be implemented within 300 or included within device 300.
  • the device 300 is a digital device including a function capable of communicating after connecting to the user interface providing system 200 or another device 300, and includes a memory means As long as a digital device equipped with a microprocessor with a computing power can be adopted as the device 300 according to the present invention.
  • Device 300 may be a wearable device such as smart glasses, smart watches, smart bands, smart rings, smart necklaces, etc. It may be a device.
  • the device 300 may further include an application program for performing a function according to the present invention.
  • an application may exist in the form of a program module in the device 300.
  • the characteristics of the program module are the image capturing unit 210, the segment processing unit 220, the object recognition unit 230, the control command determiner 240, and the communication unit 250 of the user interface providing system 200 as described above.
  • the control unit 260 in general.
  • the application may be replaced with a hardware device or a firmware device, at least a part of which may perform a function substantially the same or equivalent thereto.
  • FIG. 2 is a diagram illustrating an internal configuration of a system for providing a user interface based on an eye image according to an embodiment of the present invention.
  • the user interface providing system 200 includes an image photographing unit 210, a segment processing unit 220, an object recognition unit 230, and a control command determining unit 240. It may include a communication unit 250 and a control unit 260. According to the exemplary embodiment of the present invention, the image capturing unit 210, the segment processing unit 220, the object recognition unit 230, the control command determining unit 240, the communication unit 250, and the control unit 260 are at least one of them. Some may be program modules in communication with an external system (not shown). Such program modules may be included in the user interface providing system 200 in the form of an operating system, an application module, and other program modules, and may be physically stored on various known storage devices.
  • program modules may be stored in a remote storage device that can communicate with the user interface providing system 200.
  • program modules include, but are not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform particular tasks or execute particular abstract data types, described below, in accordance with the present invention.
  • the image capturing unit 210 may perform a function of capturing an image reflected by the user's eyes.
  • the image capturing unit 210 may capture an image containing the entire area of the user's eyes centering on the pupil of the user, and an object existing in the real world is captured by the user's eyes. May be reflected (ie, reflected in the user's eyes).
  • the segment processor 220 may perform a function of specifying a segment in the image photographed by the image capturing unit 210.
  • the segment refers to an area corresponding to a state in which an object existing in the real world is reflected (ie, reflected on the eye) in the image captured by the image capturing unit 210.
  • the segment processing unit 220 may specify a segment by distinguishing an area corresponding to the shape of the object from the remaining areas in the image by using a known edge detection algorithm. Can be.
  • FIG. 3 is a diagram exemplarily illustrating a configuration for specifying a segment corresponding to a state of an object reflected in a user's eye according to an embodiment of the present invention.
  • the segment processor 220 may specify an area corresponding to the shape of the object 1 310 in the image as the segment 330.
  • a device such as a TV, a computer monitor, a smartphone, or the like may correspond to the objects referred to in the present invention, and these objects may include components such as a display screen, an LED lamp, and the like, each of which has its own frequency characteristics. Can be. If the user looks at the object with his or her eyes, the user's eyes can see the object, and the frequency characteristics of the object can be seen in the segment corresponding to the object's appearance in the user's eyes. It may appear as it is.
  • the object recognition unit 230 may perform a function of recognizing an object corresponding to the segment as a control object with reference to the frequency characteristic appearing in the segment specified above. .
  • the information on the frequency characteristics of at least one object to be controlled may be stored in a predetermined database (not shown), the object recognition unit 230 May determine that an object having a frequency characteristic matching the frequency characteristic of the specified segment among the at least one object in which information about the frequency characteristic is stored in the database as the object corresponding to the segment.
  • the frequency characteristic to be matched may be defined based on the characteristic at the dominant frequency.
  • the frequency characteristic of a segment may be defined as a dominant frequency, which is a frequency value at which a power value is greatest in a frequency spectrum of the segment.
  • the object recognition unit 230 may determine a time period for acquiring information about frequency characteristics appearing in the segment with reference to a preset trigger signal.
  • the object recognition unit 230 may determine that the frequency characteristic obtained in the segment at the time when the preset trigger signal is input is the frequency characteristic appearing in the segment.
  • the preset trigger signal may include a voice signal, an EEG signal, and the like. For example, when the user looks at the object and shouts "sink", "now", or the like, information about frequency characteristics appearing in the segment may be obtained. For another example, as the user looks at an object and thinks about selecting the object, information about frequency characteristics appearing in a segment when a predetermined brain wave is detected may be acquired.
  • EEG signal detection technology such as Steady-State Visual Evoked Potential (SSVEP) may be utilized.
  • SSVEP Steady-State Visual Evoked Potential
  • the EEG signal detection technology that can be applied to the present invention is not necessarily limited thereto, and it can be understood that the present invention can be changed as much as possible within the range capable of achieving the object of the present invention.
  • the object recognition unit 230 continues to obtain data on the frequency characteristics appearing in the segment for a predetermined time, and the average value calculated from the data on the frequency characteristics thus obtained is a corresponding segment This can be determined by the value of the frequency characteristic shown in.
  • FIG. 4 is a diagram exemplarily illustrating a configuration for recognizing an object corresponding to a segment with reference to frequency characteristics according to an exemplary embodiment of the present invention.
  • the dominant frequency is 15 Hz as the frequency characteristic of the segment 430 included in the image 420.
  • the dominant frequency among the candidate objects stored in the database is 15 Hz.
  • the object which emits light with a frequency characteristic can be recognized as the object corresponding to the said segment (that is, the object which the user is looking at, and the object judged to be a control object).
  • a sampling rate of a camera photographing an eye image is twice as large as a dominant frequency of frequency characteristics appearing in an object or a segment corresponding thereto.
  • the above can be set large.
  • a light emission frequency of a light emitting device provided in a device such as a TV, a computer monitor, a smartphone, and the like is mostly 60 Hz or less
  • a sampling rate of a camera for photographing an eye image may be set to 120 Hz or more.
  • control command determiner 240 determines a control command to be performed on the object recognized as corresponding to the segment (that is, recognized as the object viewed by the user). To perform the function.
  • control command determiner 240 corresponds to the segment by referring to the relative position of the segment defined in the reference coordinate system set based on the position of the center of the pupil of the user. It is possible to determine the control command to be performed on the object recognized to be.
  • a control command to move the corresponding object to the left may be determined.
  • control command determiner 240 may further refer to the additional signal in determining the control command to be performed on the object.
  • the additional signal may include a voice signal, an EEG signal, and the like.
  • control command determiner 240 may move away from the user while looking at an object (a recognized object corresponding to a segment) such as a robot cleaner or an air conditioner.
  • the robot cleaner or the air conditioner which the user is looking at, may perform an operation corresponding to the voice signal with reference to the voice signal obtained by saying “cold”, “temperature decrease”, or the like.
  • the control command determiner 240 may include an object (an object recognized as corresponding to a segment) displayed on a computer monitor, such as a text, an address input box, and a search box. While looking at the user, the word may be input to text, an address input box, a search box, etc., which the user is looking at, with reference to a voice signal obtained by pronouncing a word.
  • control command determination unit 240 while the user looks at the objects (objects recognized as corresponding to the segment), such as a robot cleaner, air conditioner and the like themselves
  • the robot cleaner or the air conditioner that the user is looking at may perform an operation corresponding to the EEG signal with reference to an EEG signal obtained from the user's brain.
  • control command determiner 240 utilizes biometric information (for example, biometric information about a pattern or color of the iris) that can be obtained from the eyes of the user as identification information.
  • biometric information for example, biometric information about a pattern or color of the iris
  • the function may be controlled so that the object can be controlled only by a user who has the authority to control the object.
  • FIG. 5 is a diagram exemplarily illustrating a configuration for specifying two or more segments respectively corresponding to the appearance of two or more objects reflected on the eyes of a user according to an exemplary embodiment of the present invention.
  • two or more objects that emit light with respective frequency characteristics exist in the user's field of view.
  • two or more objects may be included in an image obtained as a result of photographing the user's eyes.
  • Each of the appearances reflected by the eyes may be included.
  • the segment processor 220 in specifying two or more segments corresponding to two or more objects, respectively, includes two or more light emitting regions included in the eye image. Two regions emitting light having different frequency characteristics with reference to the frequency characteristic may be determined to correspond to different segments.
  • the emission frequencies of the two or more objects 510A, 510B, and 510C are different from each other.
  • the emission frequencies of the two or more objects 510A, 510B, and 510C may be set to different prime numbers, respectively.
  • the emission frequencies of the first object 510A, the second object 510B, and the third object 510C may be set to 3 Hz, 7 Hz, and 11 Hz, respectively.
  • the object recognition unit 230 may include an object corresponding to a segment located closest to a position of the center of the pupil among a plurality of segments included in the eye image. Only can be recognized as a control object.
  • the communication unit 250 performs a function of allowing the user interface providing system 200 to communicate with an external device.
  • control unit 260 is the data between the image photographing unit 210, the segment processing unit 220, the object recognition unit 230, the control command determiner 240 and the communication unit 250 To control the flow of the. That is, the controller 250 controls the flow of data from the outside or between the respective components of the user interface providing system 200, such that the image capturing unit 210, the segment processing unit 220, the object recognition unit 230, The control command determiner 240 and the communicator 250 control each to perform a unique function.
  • Embodiments according to the present invention described above may be implemented in the form of program instructions that may be executed by various computer components, and may be recorded on a non-transitory computer readable recording medium.
  • the non-transitory computer readable recording medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the non-transitory computer readable recording medium may be those specially designed and configured for the present invention, or may be known and available to those skilled in the computer software arts.
  • non-transitory computer readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs, DVDs, magnetic-optical media such as floppy disks ( magneto-optical media) and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like.
  • program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
  • the hardware device may be configured to operate as one or more software modules to perform the process according to the invention, and vice versa.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명의 일 태양에 따르면, 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법으로서, 사용자의 눈에 의해 반사되는 영상을 촬영하는 단계, 촬영된 영상 내에서 세그먼트(segment)를 특정하는 단계 - 세그먼트는 현실 세계에 존재하는 대상물이 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 -, 및 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여, 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 단계를 포함하는 방법이 제공된다.

Description

눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
본 발명은 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체에 관한 것이다.
근래에 들어, 스마트폰, 스마트 패드 등과 같이 다양한 기능과 강력한 연산 성능을 갖춘 모바일 스마트 디바이스가 널리 사용되고 있다. 이러한 모바일 스마트 디바이스 중에는 사용자가 신체에 착용하여 휴대할 수 있는 비교적 작은 크기의 웨어러블 디바이스(Wearable Device)(예를 들면, 스마트 글래스, 스마트 워치, 스마트 밴드, 링이나 브로치와 같은 형태의 스마트 디바이스, 신체나 의류에 직접적으로 부착되거나 매립되는 스마트 디바이스 등)도 있다.
웨어러블 디바이스를 비롯한 모바일 스마트 디바이스가 널리 사용됨에 따라, 모바일 스마트 디바이스에 대한 사용자 조작을 지원하는 사용자 인터페이스에 관한 기술도 소개되고 있는데, 아직까지는 음성이나 제스처를 기반으로 하는 사용자 인터페이스를 제공하는 기술이 주류를 이루고 있어서 스마트 글래스와 같이 사용자의 얼굴(특히, 눈) 부위에 착용되는 웨어러블 디바이스에 적합한 새로운 사용자 인터페이스의 필요성이 대두되고 있는 실정이다.
이에, 본 발명자는, 사용자의 눈에 의해 반사되는(즉, 눈에 비추어지는) 영상 정보에 기초하여 사용자가 제어하고자 하는 대상물을 인식하고 제어 명령을 결정함으로써, 사용자가 눈(즉, 동공)을 움직이는 것만으로 자신이 원하는 대로 대상물을 제어할 수 있도록 지원하는 사용자 인터페이스를 개발하기에 이르렀다.
본 발명은 상술한 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은 사용자의 눈에 의해 반사되는 영상을 촬영하고, 위의 촬영된 영상 내에서 세그먼트(segment)를 특정하고 - 세그먼트는 현실 세계에 존재하는 대상물이 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 위의 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여 위의 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식함으로써, 사용자가 눈(즉, 동공)을 움직이는 것만으로 자신이 원하는 대로 대상물을 제어할 수 있도록 지원하는 사용자 인터페이스를 제공하는 것을 다른 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 태양에 따르면, 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법으로서, 사용자의 눈에 의해 반사되는 영상을 촬영하는 단계, 상기 촬영된 영상 내에서 세그먼트(segment)를 특정하는 단계 - 상기 세그먼트는 현실 세계에 존재하는 대상물이 상기 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 및 상기 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여, 상기 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 단계를 포함하는 방법이 제공된다.
본 발명의 다른 태양에 따르면, 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 시스템으로서, 사용자의 눈에 의해 반사되는 영상을 촬영하는 영상 촬영부, 상기 촬영된 영상 내에서 세그먼트(segment)를 특정하는 세그먼트 처리부 - 상기 세그먼트는 현실 세계에 존재하는 대상물이 상기 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 및 상기 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여, 상기 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 대상물 인식부를 포함하는 시스템이 제공된다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 비일시성의 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 의하면, 사용자가 자신의 눈으로 대상물을 응시하는 것만으로 해당 대상물에 대한 제어권을 획득할 수 있고, 사용자가 자신의 눈을 움직이는 것만으로 제어권이 획득된 대상물의 동작을 제어할 수 있으므로, 사용자가 손 등의 다른 신체부위를 사용하지 않고도 눈만을 이용하여 원하는 대로 대상물을 제어할 수 있게 되는 효과가 달성된다.
또한, 본 발명에 의하면, 사용자의 눈에 비추어지는 대상물의 모습에서 나타나는 발광 주파수 특성을 참조로 하여 제어 대상이 되는 대상물을 인식하므로, 눈에 비추어지는 대상물의 형상을 정확하게 인식하기 위한 영상처리(이러한 영상처리에는 많은 연산 자원이 소요되는 것이 일반적임)를 수행하지 않고도 사용자가 응시하고 있는 대상물이 무엇인지를 손쉽게 인식할 수 있게 되는 효과가 달성된다.
또한, 본 발명에 의하면, 음성 신호, 뇌파 신호 등의 부가 신호를 더 참조로 하여 대상물에 대하여 수행될 제어 명령을 결정할 수 있으므로, 사용자가 대상물을 보다 다양하고 정교하게 제어할 수 있게 되는 효과가 달성된다.
도 1은 본 발명의 일 실시예에 따라 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 전체 시스템의 개략적인 구성을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따라 눈 영상에 기반한 사용자 인터페이스 제공 시스템의 내부 구성을 예시적으로 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따라 사용자의 눈에 비추어지는 대상물의 모습에 해당하는 세그먼트를 특정하는 구성을 예시적으로 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따라 주파수 특성을 참조로 하여 세그먼트에 대응하는 대상물을 인식하는 구성을 예시적으로 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따라 사용자의 눈에 비추어지는 둘 이상의 대상물의 모습에 각각 해당하는 둘 이상의 세그먼트를 특정하는 구성을 예시적으로 나타내는 도면이다.
<부호의 설명>
100: 통신망
200: 사용자 인터페이스 제공 시스템
210: 영상 촬영부
220: 세그먼트 처리부
230: 대상물 인식부
240: 제어 명령 결정부
250: 통신부
260: 제어부
300: 디바이스
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
전체 시스템의 구성
도 1은 본 발명의 일 실시예에 따라 눈 영상에 기반한 전체 시스템의 개략적인 구성을 나타내는 도면이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 전체 시스템은 통신망(100), 사용자 인터페이스 제공 시스템(200), 및 디바이스(300)를 포함하여 구성될 수 있다.
먼저, 본 발명의 일 실시예에 따른 통신망(100)은 유선 통신이나 무선 통신과 같은 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 명세서에서 말하는 통신망(100)은 공지의 인터넷 또는 월드와이드웹(WWW; World Wide Web)일 수 있다. 또한, 본 명세서에서 말하는 통신망(100)은 와이파이(Wi-Fi), 와이파이 다이렉트(Wi-Fi Direct), LTE 다이렉트(LTE Direct), 블루투스(Bluetooth)와 같은 공지의 근거리 무선 통신망을 포함할 수 있다. 그러나, 통신망(100)은, 굳이 이에 국한될 필요 없이, 공지의 유무선 데이터 통신망, 공지의 전화망 또는 공지의 유무선 텔레비전 통신망을 그 적어도 일부에 있어서 포함할 수도 있다.
다음으로, 본 발명의 일 실시예에 따른 사용자 인터페이스 제공 시스템(200)은 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기일 수 있다. 이러한 사용자 인터페이스 제공 시스템(200)은 서버 시스템일 수 있다.
구체적으로, 본 발명의 일 실시예에 따른 사용자 인터페이스 제공 시스템(200)은, 아래에서 자세하게 설명되는 바와 같이, 사용자의 눈에 의해 반사되는 영상을 촬영하고, 위의 촬영된 영상 내에서 세그먼트(segment)를 특정하고 - 세그먼트는 현실 세계에 존재하는 대상물이 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 위의 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여 위의 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식함으로써, 사용자가 눈(즉, 동공)을 움직이는 것만으로 자신이 원하는 바에 따라 대상물을 제어할 수 있도록 지원하는 사용자 인터페이스를 제공하는 기능을 수행할 수 있다.
특히, 본 발명의 일 실시예에 따르면, 사용자 인터페이스 제공 시스템(200)에는 사용자의 눈 또는 사용자의 눈에 의해 반사되는 영상을 촬영하는 기능을 수행하는 카메라가 포함될 수 있다.
사용자 인터페이스 제공 시스템(200)의 기능에 관하여는 아래에서 더 자세하게 알아보기로 한다. 한편, 사용자 인터페이스 제공 시스템(200)에 관하여 위와 같이 설명되었으나, 이러한 설명은 예시적인 것이고, 사용자 인터페이스 제공 시스템(200)에 요구되는 기능이나 구성요소의 적어도 일부가 필요에 따라 실제로 제어가 행해지는 디바이스(300) 내에서 실현되거나 디바이스(300) 내에 포함될 수도 있음은 당업자에게 자명하다.
마지막으로, 본 발명의 일 실시예에 따른 디바이스(300)는 사용자 인터페이스 제공 시스템(200) 또는 다른 디바이스(300)에 접속한 후 통신할 수 있는 기능을 포함하는 디지털 기기로서, 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 디바이스(300)로서 채택될 수 있다. 디바이스(300)는 스마트 글래스, 스마트 워치, 스마트 밴드, 스마트 링, 스마트 넥클리스 등과 같은 웨어러블 디바이스이거나 스마트폰, 스마트 패드, 데스크탑 컴퓨터, 노트북 컴퓨터, 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같은 다소 전통적인 디바이스일 수 있다.
또한, 디바이스(300)에는 본 발명에 따른 기능을 수행하기 위한 애플리케이션 프로그램이 더 포함되어 있을 수 있다. 이러한 애플리케이션은 해당 디바이스(300) 내에서 프로그램 모듈의 형태로 존재할 수 있다. 이러한 프로그램 모듈의 성격은 전술한 바와 같은 사용자 인터페이스 제공 시스템(200)의 영상 촬영부(210), 세그먼트 처리부(220), 대상물 인식부(230), 제어 명령 결정부(240), 통신부(250) 및 제어부(260)와 전반적으로 유사할 수 있다. 여기서, 애플리케이션은 그 적어도 일부가 필요에 따라 그것과 실질적으로 동일하거나 균등한 기능을 수행할 수 있는 하드웨어 장치나 펌웨어 장치로 치환될 수도 있다.
사용자 인터페이스 제공 시스템의 구성
이하에서는, 본 발명의 구현을 위하여 중요한 기능을 수행하는 사용자 인터페이스 제공 시스템의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.
도 2는 본 발명의 일 실시예에 따라 눈 영상에 기반한 사용자 인터페이스 제공 시스템의 내부 구성을 예시적으로 나타내는 도면이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 사용자 인터페이스 제공 시스템(200)은, 영상 촬영부(210), 세그먼트 처리부(220), 대상물 인식부(230), 제어 명령 결정부(240), 통신부(250) 및 제어부(260)를 포함할 수 있다. 본 발명의 일 실시예에 따르면, 영상 촬영부(210), 세그먼트 처리부(220), 대상물 인식부(230), 제어 명령 결정부(240), 통신부(250) 및 제어부(260)는 그 중 적어도 일부가 외부 시스템(미도시됨)과 통신하는 프로그램 모듈들일 수 있다. 이러한 프로그램 모듈들은 운영 시스템, 응용 프로그램 모듈 및 기타 프로그램 모듈의 형태로 사용자 인터페이스 제공 시스템(200)에 포함될 수 있으며, 물리적으로는 여러 가지 공지의 기억 장치 상에 저장될 수 있다. 또한, 이러한 프로그램 모듈들은 사용자 인터페이스 제공 시스템(200)과 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈들은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
먼저, 본 발명의 일 실시예에 따르면, 영상 촬영부(210)는 사용자의 눈에 의해 반사되는 영상을 촬영하는 기능을 수행할 수 있다. 예를 들면, 영상 촬영부(210)는 사용자의 동공을 중심으로 하여 사용자의 눈 전체 영역의 모습을 담고 있는 영상을 촬영할 수 있으며, 이렇게 촬영된 영상 내에는 현실 세계에 존재하는 대상물이 사용자의 눈에 의해 반사되어 보여지는(즉, 사용자의 눈에 비추어지는) 모습이 담겨 있을 수 있다.
다음으로, 본 발명의 일 실시예에 따르면, 세그먼트 처리부(220)는 영상 촬영부(210)에 의해 촬영된 영상 내에서 세그먼트(segment)를 특정하는 기능을 수행할 수 있다. 여기서, 세그먼트는 영상 촬영부(210)에 의해 촬영된 영상 내에서 현실 세계에 존재하는 대상물이 눈에 의해 반사되어 보여지는(즉, 눈에 비추어지는) 모습에 해당하는 영역을 가리킨다.
구체적으로, 본 발명의 일 실시예에 따른 세그먼트 처리부(220)는 공지의 엣지(edge) 검출 알고리즘을 이용하여 영상 내에서 대상물의 모습에 해당하는 영역과 그렇지 않은 나머지 영역을 구분함으로써 세그먼트를 특정할 수 있다.
도 3은 본 발명의 일 실시예에 따라 사용자의 눈에 비추어지는 대상물의 모습에 해당하는 세그먼트를 특정하는 구성을 예시적으로 나타내는 도면이다.
도 3을 참조하면, 사용자가 대상물 1(310)을 바라보고 있는 경우를 가정할 수 있는데, 이러한 경우 사용자의 눈에는 대상물 1(310)의 모습이 비추어질 수 있고 사용자의 눈을 촬영한 영상(320)에도 역시 대상물 1(310)의 모습이 포함될 수 있다. 본 발명의 일 실시예에 따르면, 세그먼트 처리부(220)는 영상 내에서 대상물 1(310)의 모습에 해당하는 영역을 세그먼트(330)로서 특정할 수 있다.
한편, 현실 세계에는 특정 주파수 또는 특정 패턴에 따라 규칙적으로 발광하는 대상물이 존재한다. 예를 들면, TV, 컴퓨터 모니터, 스마트폰 등의 디바이스가 본 발명에서 말하는 대상물에 해당할 수 있으며, 이들 대상물은 각각 고유의 주파수 특성을 가지고 발광하는 표시 화면, LED 램프 등의 구성요소를 포함할 수 있다. 만약 사용자가 자신의 눈으로 이러한 대상물을 바라보게 되면, 그 사용자의 눈에는 해당 대상물의 모습이 비추어질 수 있고, 대상물이 가지는 주파수 특성은 사용자의 눈에 비추어지는 해당 대상물의 모습에 해당하는 세그먼트에서도 그대로 나타날 수 있다.
다음으로, 본 발명의 일 실시예에 따르면, 대상물 인식부(230)는 위와 같이 특정되는 세그먼트에서 나타나는 주파수 특성을 참조로 하여 해당 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 기능을 수행할 수 있다.
구체적으로, 본 발명의 일 실시예에 따르면, 제어 대상이 될 수 있는 적어도 하나의 대상물의 주파수 특성에 관한 정보가 소정의 데이터베이스(미도시됨)에 저장되어 있을 수 있으며, 대상물 인식부(230)는 위와 같은 데이터베이스 내에 주파수 특성에 관한 정보가 저장되어 있는 적어도 하나의 대상물 중 위의 특정된 세그먼트의 주파수 특성과 매칭되는 주파수 특성을 가지는 대상물을 해당 세그먼트에 대응하는 대상물인 것으로 결정할 수 있다.
또한, 본 발명의 일 실시예에 따르면, 매칭의 대상이 되는 주파수 특성은 지배 주파수(dominant frequency)에서의 특성을 기준으로 하여 정의될 수 있다. 예를 들면, 세그먼트의 주파수 특성은 해당 세그먼트의 주파수 스펙트럼(spectrum)에서 파워(power) 값이 가장 크게 나타나는 주파수 값인 지배 주파수(dominant frequency)로서 정의될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 대상물 인식부(230)는 기설정된 트리거 신호를 참조로 하여 세그먼트에서 나타나는 주파수 특성에 관한 정보를 획득할 시간대를 결정할 수 있다. 구체적으로, 본 발명의 일 실시예에 따른 대상물 인식부(230)는 기설정된 트리거 신호가 입력되는 시점에 세그먼트에서 획득되는 주파수 특성을 해당 세그먼트에서 나타나는 주파수 특성인 것으로 결정할 수 있다. 여기서, 기설정된 트리거 신호에는, 음성 신호, 뇌파 신호 등이 포함될 수 있다. 예를 들면, 사용자가 대상물을 바라보면서 "싱크", "지금" 등이라고 외치는 때 세그먼트에서 나타나는 주파수 특성에 관한 정보를 획득할 수 있다. 다른 예를 들면, 사용자가 대상물을 바라보면서 해당 대상물을 선택하고자 하는 생각을 함에 따라 기설정된 뇌파가 감지되는 때 세그먼트에서 나타나는 주파수 특성에 관한 정보를 획득할 수 있다.
본 발명의 일 실시예에 따르면, 뇌파 신호를 감지하는 기술로서, 정상(定常) 시각 유발 전위(Steady-State Visual Evoked Potential, SSVEP) 등의 기술이 활용될 수 있다. 다만, 본 발명에 적용될 수 있는 뇌파 신호 감지 기술이 반드시 이에 한정되는 것은 아니며, 본 발명의 목적을 달성할 수 있는 범위 내에서 얼마든지 변경될 수 있음을 밝혀 둔다.
또한, 본 발명의 일 실시예에 따르면, 대상물 인식부(230)는 기설정된 시간 동안 세그먼트에서 나타나는 주파수 특성에 관한 데이터를 계속 획득하고, 이렇게 획득된 주파수 특성에 관한 데이터로부터 산출되는 평균값을 해당 세그먼트에서 나타나는 주파수 특성의 값으로 결정할 수 있다.
도 4는 본 발명의 일 실시예에 따라 주파수 특성을 참조로 하여 세그먼트에 대응하는 대상물을 인식하는 구성을 예시적으로 나타내는 도면이다.
도 4를 참조하면, 영상(420)에 포함되는 세그먼트(430)에서 나타나는 주파수 특성으로서 지배 주파수가 15Hz인 경우를 가정할 수 있는데, 이러한 경우 데이터베이스에 저장되어 있는 여러 후보 대상물 중 지배 주파수가 15Hz인 주파수 특성을 가지고 발광하는 대상물을 해당 세그먼트에 대응하는 대상물(즉, 사용자가 바라보고 있는 대상물로서, 제어 대상이라고 판단되는 대상물)로서 인식할 수 있다.
한편, 본 발명의 일 실시예에 따르면, 에일리어싱(aliasing) 현상을 방지하기 위하여 눈 영상을 촬영하는 카메라의 샘플링 레이트(sampling rate)는 대상물 또는 그에 대응하는 세그먼트에서 나타나는 주파수 특성의 지배 주파수보다 2배 이상 크게 설정될 수 있다. 예를 들면, TV, 컴퓨터 모니터, 스마트폰 등의 디바이스에 구비된 발광 장치의 발광 주파수는 대부분 60Hz 이하이므로, 눈 영상을 촬영하는 카메라의 샘플링 레이트는 120Hz 이상으로 설정될 수 있다.
다음으로, 본 발명의 일 실시예에 따르면, 제어 명령 결정부(240)는, 세그먼트에 대응하는 것으로 인식된(즉, 사용자가 바라보고 있는 대상물이라고 인식된) 대상물에 대하여 수행될 제어 명령을 결정하는 기능을 수행할 수 있다.
구체적으로, 본 발명의 일 실시예에 따르면, 제어 명령 결정부(240)는 사용자의 동공의 중심의 위치를 기준으로 하여 설정되는 기준 좌표계에서 정의되는 세그먼트의 상대적인 위치를 참조로 하여, 세그먼트에 대응하는 것으로 인식된 대상물에 대하여 수행될 제어 명령을 결정할 수 있다.
예를 들면, 눈 영상 내에서 세그먼트가 동공의 중심을 기준으로 할 때 오른쪽에 위치하고 있는 경우(즉, 사용자가 세그먼트의 왼쪽을 바라보고 있는 경우)를 가정할 수 있는데, 이러한 경우에, 해당 세그먼트에 대응하는 대상물을 왼쪽으로 이동시키는 제어 명령이 결정될 수 있다.
또한, 본 발명의 일 실시예에 따르면, 제어 명령 결정부(240)는 대상물에 대하여 수행될 제어 명령을 결정함에 있어서 부가 신호를 더 참조할 수 있다. 여기서, 부가 신호에는, 음성 신호, 뇌파 신호 등이 포함될 수 있다.
예를 들면, 본 발명의 일 실시예에 따른 제어 명령 결정부(240)는, 사용자가 로봇 청소기, 에어컨 등의 대상물(세그먼트에 대응하는 것으로 인식된 대상물임)을 바라보면서 "가", "치워", "추워", "온도 내려" 등의 말을 함에 따라 획득되는 음성 신호를 참조로 하여, 사용자가 바라보고 있는 로봇 청소기 또는 에어컨이 해당 음성 신호에 부합하는 동작을 행하도록 할 수 있다. 유사한 예로서, 본 발명의 일 실시예에 따른 제어 명령 결정부(240)는, 사용자가 컴퓨터 모니터 상에 표시되는 텍스트, 주소 입력창, 검색창 등의 대상물(세그먼트에 대응하는 것으로 인식된 대상물)을 바라보면서 어떤 단어를 발음함에 따라 획득되는 음성 신호를 참조로 하여, 사용자가 바라보고 있는 텍스트, 주소 입력창, 검색창 등에 해당 단어가 입력되도록 할 수 있다.
다른 예를 들면, 본 발명의 일 실시예에 따른 제어 명령 결정부(240)는, 사용자가 로봇 청소기, 에어컨 등의 대상물(세그먼트에 대응하는 것으로 인식된 대상물임)을 바라보면서 이들 대상물을 자신이 원하는 대로 동작시키고자 하는 생각을 하는 경우에, 사용자의 뇌로부터 획득되는 뇌파 신호를 참조로 하여, 사용자가 바라보고 있는 로봇 청소기 또는 에어컨이 해당 뇌파 신호에 부합하는 동작을 행하도록 할 수 있다.
한편, 대상물을 제어하는 것이 보안 등의 이유로 소정의 권한을 가진 사용자에게만 허락되는 경우를 가정할 수 있다. 이러한 경우, 본 발명의 일 실시예에 따른 제어 명령 결정부(240)는, 사용자의 눈으로부터 획득될 수 있는 생체 정보(예를 들면, 홍채의 패턴 또는 색에 관한 생체 정보)를 식별 정보로서 활용하여, 대상물을 제어할 수 있는 권한을 가지고 있는 사용자에 의하여만 해당 대상물이 제어될 수 있도록 하는 기능을 수행할 수 있다.
도 5는 본 발명의 일 실시예에 따라 사용자의 눈에 비추어지는 둘 이상의 대상물의 모습에 각각 해당하는 둘 이상의 세그먼트를 특정하는 구성을 예시적으로 나타내는 도면이다.
도 5를 참조하면, 사용자의 시야에 저마다의 주파수 특성을 가지고 제각각 발광하는 둘 이상의 대상물이 존재하는 경우를 가정할 수 있는데, 이러한 경우에, 사용자의 눈을 촬영한 결과 얻어지는 영상에는 둘 이상의 대상물이 눈에 의해 반사되어 보여지는 모습이 각각 포함될 수 있다.
계속하여, 도 5를 참조하면, 본 발명의 일 실시예에 따른 세그먼트 처리부(220)는, 둘 이상의 대상물에 각각 대응하는 둘 이상의 세그먼트를 특정함에 있어서, 눈 영상에 포함되어 있는 둘 이상의 발광 영역의 주파수 특성을 참조로 하여 서로 다른 주파수 특성을 가지고 발광하는 두 영역은 서로 다른 세그먼트에 해당하는 것으로 판별할 수 있다.
계속하여, 도 5를 참조하면, 둘 이상의 대상물(510A, 510B, 510C) 각각이 발생시키는 광 사이에서 간섭 현상이 나타나는 것을 방지하기 위하여, 둘 이상의 대상물(510A, 510B, 510C 각각의 발광 주파수는 서로 겹쳐지지 않도록(즉, 간섭되지 않도록) 설정될 수 있다. 구체적으로, 본 발명의 일 실시예에 따르면, 둘 이상의 대상물(510A, 510B, 510C)의 발광 주파수는 각각 서로 다른 소수(素數)에 기초하여 설정될 수 있다. 예를 들면, 제1 대상물(510A), 제2 대상물(510B) 및 제3 대상물(510C)의 발광 주파수는 각각 3Hz, 7Hz 및 11Hz로 설정될 수 있다.
계속하여, 도 5를 참조하면, 본 발명의 일 실시예에 따른 대상물 인식부(230)는, 눈 영상 내에 포함되는 복수의 세그먼트 중에서 동공의 중심의 위치로부터 가장 가까운 곳에 위치하는 세그먼트에 대응하는 대상물만을 제어 대상으로서 인식할 수 있다.
한편, 본 발명의 일 실시예에 따른 통신부(250)는 사용자 인터페이스 제공 시스템(200)이 외부 장치와 통신할 수 있도록 하는 기능을 수행한다.
마지막으로, 본 발명의 일 실시예에 따른 제어부(260)는 영상 촬영부(210), 세그먼트 처리부(220), 대상물 인식부(230), 제어 명령 결정부(240) 및 통신부(250) 간의 데이터의 흐름을 제어하는 기능을 수행한다. 즉, 제어부(250)는 외부로부터의 또는 사용자 인터페이스 제공 시스템(200)의 각 구성요소 간의 데이터의 흐름을 제어함으로써, 영상 촬영부(210), 세그먼트 처리부(220), 대상물 인식부(230), 제어 명령 결정부(240) 및 통신부(250)에서 각각 고유 기능을 수행하도록 제어한다.
이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 비일시성의 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 비일시성의 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 비일시성의 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 비일시성의 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

Claims (14)

  1. 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법으로서,
    사용자의 눈에 의해 반사되는 영상을 촬영하는 단계,
    상기 촬영된 영상 내에서 세그먼트(segment)를 특정하는 단계 - 상기 세그먼트는 현실 세계에 존재하는 대상물이 상기 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 및
    상기 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여, 상기 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 인식 단계에서,
    기설정된 트리거 신호를 참조로 하여, 상기 특정된 세그먼트에서 나타나는 주파수 특성을 획득하는 시점을 결정하는 방법.
  3. 제1항에 있어서,
    상기 기설정된 트리거 신호에는, 음성 신호 및 뇌파 신호 중 적어도 하나가 포함되는 방법.
  4. 제1항에 있어서,
    상기 인식 단계에서,
    상기 특정된 세그먼트의 주파수 특성과 매칭되는 주파수 특성을 가지는 대상물을 상기 특정된 세그먼트에 대응하는 대상물인 것으로 결정하는 방법.
  5. 제1항에 있어서,
    상기 주파수 특성은 지배 주파수(dominant frequency)에 기초하여 정의되는 방법.
  6. 제1항에 있어서,
    상기 촬영된 영상 및 부가 신호 중 적어도 하나를 참조로 하여, 상기 인식된 대상물에 대하여 수행될 제어 명령을 결정하는 단계
    를 더 포함하는 방법.
  7. 제6항에 있어서,
    상기 제어 명령 결정 단계에서,
    상기 촬영된 영상 내에서 상기 특정된 세그먼트의 상기 사용자의 동공의 중심을 기준으로 하는 상대적인 위치를 참조로 하여, 상기 인식된 대상물에 대하여 수행될 제어 명령을 결정하는 방법.
  8. 제6항에 있어서,
    상기 부가 신호에는, 음성 신호 및 뇌파 신호 중 적어도 하나가 포함되는 방법.
  9. 제6항에 있어서,
    상기 제어 명령 결정 단계에서,
    상기 사용자의 눈으로부터 획득될 수 있는 생체 정보를 참조로 하여, 상기 결정된 제어 명령이 수행되는 것을 허용할 것인지 여부를 결정하는 방법.
  10. 제1항에 있어서,
    상기 세그먼트는 둘 이상이고,
    상기 제어 대상 인식 단계는,
    상기 둘 이상의 세그먼트 중 상기 사용자의 동공의 중심으로부터 가장 가까운 적어도 하나의 세그먼트를 결정하는 단계, 및
    상기 적어도 하나의 세그먼트 각각에서 나타나는 주파수 특성을 참조로 하여, 상기 적어도 하나의 세그먼트에 각각 대응하는 적어도 하나의 대상물을 제어 대상으로서 인식하는 단계
    를 포함하는 방법.
  11. 제10항에 있어서,
    상기 적어도 하나의 대상물은 제1 대상물 및 제2 대상물을 포함하고,
    상기 제1 대상물의 주파수 특성과 상기 제2 대상물의 주파수 특성은 서로 간섭되지 않도록 설정되는 방법.
  12. 제11항에 있어서,
    상기 제1 대상물의 주파수 특성과 상기 제2 대상물의 주파수 특성은 각각 서로 다른 소수(素數)에 기초하여 설정되는 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록한 비일시성의 컴퓨터 판독 가능한 기록 매체.
  14. 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 시스템으로서,
    사용자의 눈에 의해 반사되는 영상을 촬영하는 영상 촬영부,
    상기 촬영된 영상 내에서 세그먼트(segment)를 특정하는 세그먼트 처리부 - 상기 세그먼트는 현실 세계에 존재하는 대상물이 상기 눈에 의해 반사되어 보여지는 모습에 해당하는 영역임 - , 및
    상기 특정된 세그먼트에서 나타나는 주파수 특성을 참조로 하여, 상기 특정된 세그먼트에 대응하는 대상물을 제어 대상으로서 인식하는 대상물 인식부
    를 포함하는 시스템.
PCT/KR2015/004377 2015-01-09 2015-04-30 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 WO2016111421A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020167023929A KR101723840B1 (ko) 2015-01-09 2015-04-30 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0003370 2015-01-09
KR20150003370 2015-01-09

Publications (1)

Publication Number Publication Date
WO2016111421A1 true WO2016111421A1 (ko) 2016-07-14

Family

ID=56356095

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2015/004377 WO2016111421A1 (ko) 2015-01-09 2015-04-30 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Country Status (2)

Country Link
KR (1) KR101723840B1 (ko)
WO (1) WO2016111421A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102175997B1 (ko) * 2018-12-13 2020-11-06 성균관대학교산학협력단 뇌파 기반의 사용자 의도 인식 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100038897A (ko) * 2008-10-07 2010-04-15 한국과학기술원 눈동자 시선 추정 장치 및 추정 방법
KR101272811B1 (ko) * 2011-08-03 2013-06-10 동국대학교 산학협력단 인터페이스 시스템 및 방법
US20140160011A1 (en) * 2012-12-12 2014-06-12 Hyundai Motor Company Apparatus and method for checking gaze object
KR20140078983A (ko) * 2012-12-18 2014-06-26 현대자동차주식회사 시선기반 착신 제어 방법과 이를 위한 이동통신 단말
US20140218287A1 (en) * 2010-11-03 2014-08-07 Blackberry Limited System and Method for Controlling a Display of a Mobile Device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100038897A (ko) * 2008-10-07 2010-04-15 한국과학기술원 눈동자 시선 추정 장치 및 추정 방법
US20140218287A1 (en) * 2010-11-03 2014-08-07 Blackberry Limited System and Method for Controlling a Display of a Mobile Device
KR101272811B1 (ko) * 2011-08-03 2013-06-10 동국대학교 산학협력단 인터페이스 시스템 및 방법
US20140160011A1 (en) * 2012-12-12 2014-06-12 Hyundai Motor Company Apparatus and method for checking gaze object
KR20140078983A (ko) * 2012-12-18 2014-06-26 현대자동차주식회사 시선기반 착신 제어 방법과 이를 위한 이동통신 단말

Also Published As

Publication number Publication date
KR20160108563A (ko) 2016-09-19
KR101723840B1 (ko) 2017-04-06

Similar Documents

Publication Publication Date Title
WO2020017927A1 (en) System and method for hybrid eye tracker
WO2018155892A1 (en) Method for displaying virtual image, storage medium and electronic device therefor
CN103984097B (zh) 头戴式显示装置、头戴式显示装置的控制方法以及图像显示系统
WO2017209560A1 (ko) 화면 출력 방법 및 이를 지원하는 전자 장치
WO2019013517A1 (en) APPARATUS AND METHOD FOR VOICE CONTROL CONTEXT
WO2018236058A1 (en) ELECTRONIC DEVICE FOR PROVIDING PROPERTY INFORMATION OF AN EXTERNAL LIGHT SOURCE FOR AN OBJECT OF INTEREST
WO2015046686A1 (en) Wearable display device and method for controlling layer in the same
WO2017086708A1 (en) Method and apparatus for displaying content
US20160370591A1 (en) Head mounted display
WO2018155968A1 (en) System and method for automated personalization of an environment
CN105210145A (zh) 交互式的可穿戴和便携式智能装置
WO2016200102A1 (ko) 카메라의 초점을 변경하는 방법 및 장치
JP6940617B2 (ja) バーチャルリアリティーヘッドマウント装置
EP3703387A1 (en) Collection device, sound collection method, and sound source tracking system and method therefor
WO2017111332A1 (ko) 전자 장치 및 전자 장치의 제어 방법
WO2016039582A1 (en) Method and apparatus for recognizing iris
EP3476119A1 (en) Method for controlling multi-filed of view image and electronic device for supporting the same
JP2021536069A (ja) 信号表示灯の状態検出方法及び装置、運転制御方法及び装置
WO2018084649A1 (ko) 눈을 촬영하여 정보를 획득하는 방법 및 장치
WO2021101097A1 (en) Multi-task fusion neural network architecture
WO2018117681A1 (ko) 이미지 처리 방법 및 이를 지원하는 전자 장치
WO2019190076A1 (ko) 시선 추적 방법 및 이를 수행하기 위한 단말
WO2011078596A2 (ko) 상황에 따라 적응적으로 이미지 매칭을 수행하기 위한 방법, 시스템, 및 컴퓨터 판독 가능한 기록 매체
WO2020246639A1 (ko) 증강현실 전자기기의 제어방법
WO2016111421A1 (ko) 눈 영상에 기반한 사용자 인터페이스를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15877141

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20167023929

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15877141

Country of ref document: EP

Kind code of ref document: A1