WO2021246795A1 - 제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 - Google Patents
제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 Download PDFInfo
- Publication number
- WO2021246795A1 WO2021246795A1 PCT/KR2021/006911 KR2021006911W WO2021246795A1 WO 2021246795 A1 WO2021246795 A1 WO 2021246795A1 KR 2021006911 W KR2021006911 W KR 2021006911W WO 2021246795 A1 WO2021246795 A1 WO 2021246795A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- target user
- gesture
- guide message
- message
- gaze
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000007726 management method Methods 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 8
- 230000000007 visual effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/013—Eye tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Definitions
- the present invention relates to a method, system, and non-transitory computer-readable recording medium for recognizing a gesture.
- a trigger signal or an activation signal is executed to start recognition of the user's gesture command, and the trigger signal includes a touch or tap on the touch screen of the smart watch or a portable device that includes a specific gesture.
- the device has been introduced.
- a preset criterion is used as a method of triggering gesture recognition or starting and ending gesture recognition, and this criterion is dynamically applied.
- this criterion is dynamically applied.
- preset conditions must be satisfied in order to trigger gesture recognition, so there is a problem that a cumbersome or difficult to trigger situation often occurs in terms of user experience. .
- the present inventor determines whether the head gesture performed by the target user is a valid gesture with reference to the direction or position determined according to the direction or the position to which at least one of the target user's face and gaze is directed and the guide message provided to the target user.
- An object of the present invention is to solve all the problems of the prior art described above.
- Another object of the present invention is to dynamically change a criterion for determining that a head gesture of a target user is a valid gesture according to a guide message.
- Another object of the present invention is to provide a guide message through a message delivery device associated with a target user to easily and accurately inform a criterion for determining a head gesture of a target user as a valid gesture.
- a representative configuration of the present invention for achieving the above object is as follows.
- a method for recognizing a gesture comprising: providing a guide message to a target user; referring to a direction to which at least one of the target user's face and gaze is directed and a direction or location associated with the guide message to determine whether the head gesture performed by the target user is a valid gesture, and determining the intention of the target user by referring to the head gesture of the target user determined to be the valid gesture.
- a system for recognizing a gesture a guide message management unit providing a guide message to a target user, a direction to which at least one of a face and a gaze of the target user is directed, and a direction or position associated with the guide message
- a valid gesture management unit that determines whether the head gesture performed by the target user is a valid gesture with reference to, and a user who determines the intention of the target user by referring to the target user's head gesture determined to be a valid gesture
- a system is provided that includes an intent management unit.
- a criterion for determining that a head gesture of a target user is a valid gesture according to a guide message can be dynamically changed.
- the present invention by providing the guide message through the message delivery device associated with the target user, it is possible to easily and accurately inform the criteria for determining the head gesture of the target user as a valid gesture.
- FIG. 1 is a diagram illustrating in detail the internal configuration of a gesture recognition system according to an embodiment of the present invention.
- FIG. 2 is a diagram exemplarily illustrating a situation in which a message delivery device is specified according to an embodiment of the present invention.
- 3 to 11 are diagrams exemplarily illustrating a process of recognizing a gesture according to an embodiment of the present invention.
- the entire system may be configured to include a communication network, the gesture recognition system 100, and a message delivery device.
- the communication network may be configured regardless of communication aspects such as wired communication or wireless communication, and includes a local area network (LAN), a metropolitan area network (MAN), and a wide area. It may be composed of various communication networks, such as a wide area network (WAN).
- LAN local area network
- MAN metropolitan area network
- WAN wide area network
- the communication network referred to in this specification may be a well-known Internet or World Wide Web (WWW).
- WWW World Wide Web
- the communication network is not necessarily limited thereto, and may include a known wired/wireless data communication network, a known telephone network, or a known wired/wireless television communication network in at least a part thereof.
- the communication network is a wireless data communication network, and includes radio frequency (RF) communication, Wi-Fi communication, cellular (LTE, etc.) communication, and Bluetooth communication (more specifically, Bluetooth Low Energy (BLE) communication). )), infrared communication, ultrasonic communication, etc. may be implemented in at least a part thereof.
- RF radio frequency
- Wi-Fi Wi-Fi
- cellular LTE, etc.
- Bluetooth Bluetooth Low Energy (BLE) communication
- BLE Bluetooth Low Energy
- infrared communication ultrasonic communication, etc.
- the gesture recognition system 100 may be a digital device having a memory means and a microprocessor mounted therein to have arithmetic capability.
- the gesture recognition system 100 may be a server system.
- the gesture recognition system 100 may be connected to each other through a message delivery device and a communication network or a predetermined processor (not shown) to be described later, and provides a guide message to a target user, and Determine whether a head gesture performed by the target user is a valid gesture with reference to a direction or location associated with a direction or a guide message and a direction toward which at least one of the user's face and gaze is directed, and the target user's head determined to be a valid gesture
- a function of determining the intention of the target user may be performed by referring to the gesture.
- the guide message may be a message in the form of at least one of sight, hearing, or smell provided to the target user through the message delivery device, for example, a visual message such as text or image , may include an audio message such as a voice, or an audiovisual message such as a video, and these messages may be provided in various implementation methods such as pop-up, banner, and floating.
- gesture recognition system 100 The configuration and function of the gesture recognition system 100 according to the present invention will be described in more detail below.
- an external device eg, a message It will be apparent to those skilled in the art that it may be implemented in a delivery device, etc.
- an external system eg, a cloud server, etc.
- the message delivery device (not shown) according to an embodiment of the present invention may communicate with the gesture recognition system 100 through a communication network or a predetermined processor, and may perform a function of outputting a guide message.
- the message delivery device may include various types of devices such as a display capable of outputting a visual or auditory message, a speaker, and the like.
- FIG. 1 is a diagram illustrating in detail the internal configuration of a gesture recognition system 100 according to an embodiment of the present invention.
- the gesture recognition system 100 includes a guide message management unit 110 , a valid gesture management unit 120 , a user intention management unit 130 , a communication unit 140 , and a control unit 150 .
- the guide message management unit 110 can be included in the gesture recognition system 100 in the form of an operating system, an application program module, or other program modules, and may be physically stored in various known storage devices.
- a program module may be stored in a remote storage device capable of communicating with the gesture recognition system 100 .
- a program module includes, but is not limited to, routines, subroutines, programs, objects, components, data structures, etc. that perform specific tasks or execute specific abstract data types according to the present invention.
- the guide message management unit 110 may perform a function of providing a guide message to a target user.
- the guide message management unit 110 may provide a guide message from a message delivery device associated with the target user.
- the guide message management unit 110 provides a guide message to the target user from the message delivery device 320 located at the closest distance to the target user based on the location of the target user. can make it happen More specifically, the guide message management unit 110 may calculate a distance between a location where a plurality of message delivery devices 310 and 320 exist and a location where the target user exists, respectively, and the shortest distance among the calculated distances.
- the message delivery device 320 corresponding to (eg, the Euclidean distance) may be determined as the message delivery device located at the closest distance to the target user.
- the guide message management unit 110 may provide a guide message to the target user from a message delivery device located within a predetermined range based on the direction in which at least one of the target user's face and gaze is directed. More specifically, the guide message management unit 110 is a straight line 201 that is specified based on a direction in which at least one of the target user's face and gaze is directed (eg, in the direction in which at least one of the target user's face and gaze is directed).
- a two-dimensional or three-dimensional region 202 (eg, an area such as a circle, an ellipse, a square, a rectangle, a cone, a quadrangular pyramid) having a straight line 201 extending therefrom as a centerline or a central axis may be specified, and the The guide message may be provided to the target user by the message delivery device 320 included in the area (or the message delivery device closest to the target user among the message delivery devices included in the area).
- the guide message manager 110 may dynamically determine at least one of a message delivery device and a guide message delivery type that will provide the guide message with reference to context information about the target user.
- the guide message management unit 110 searches the case database for cases matching the same or similar information to the information about the location (or place) of the target user, the target, the gaze time, the level of ambient noise, etc.
- a corresponding case can be specified based on the result of learning through machine learning or deep learning with respect to the location (or place) where the target user exists, the subject of attention, the time of the gaze, the level of ambient noise, etc.
- a message delivery device For example, the nearest distance
- its delivery type eg, providing a visual message for a noisy location and an audible message for a quiet location
- the effective gesture management unit 120 provides a head gesture performed by the target user with reference to the direction or location associated with the guide message and the direction to which at least one of the target user's face and gaze is directed. may perform a function of determining whether is a valid gesture.
- the effective gesture management unit 120 may determine a line (or region) that is specified based on a direction in which at least one of the target user's face and gaze is directed (or extends in a direction in which at least one of the target user's face and gaze is directed). ), when a message delivery device providing a guide message to the target user is located on the target user, at least one of the target user's face and gaze is directed in the corresponding direction, or at least one of the target user's face and gaze is directed in the corresponding direction A head gesture performed by a corresponding target user for a predetermined period of time based on a point of view may be determined as a valid gesture.
- the effective gesture management unit 120 may configure at least one of the target user's face and gaze when the direction indicated (or specified) by the guide message coincides with a direction to which at least one of the target user's face and gaze is directed. It is possible to determine as a valid gesture a head gesture performed by the corresponding target user while is facing the corresponding direction or for a predetermined time based on a point in time when at least one of the target user's face and gaze is directed in the corresponding direction.
- At least one of the target user's face and gaze while at least one of the target user's face and gaze is directed in the above-indicated direction A head gesture performed by the corresponding target user for a predetermined period of time based on a time point in which the is directed in the direction may be determined as a valid gesture.
- the user intention management unit 130 performs a function of determining the intention of the target user with reference to the head gesture of the target user determined to be a valid gesture by the effective gesture management unit 120 . can do.
- the user intention management unit 130 may determine an intention corresponding to a pattern that matches or is similar to the pattern of the head gesture of the target user determined to be a valid gesture as the intention of the target user. More specifically, the user intention management unit 130 means a nod gesture, that is, O, yes or down, when the user moves his/her head in the up-down order, and tilts his/her head left-right-left.
- -Moving right or right-left-right-left means a shake gesture, that is, X, no, or cancel
- moving the head in the right-left order means a right gesture, that is It means next
- moving the head in the left-right order means a left gesture, that is, previous
- moving the head in the up-down order means an up gesture, that is, up )
- tilting the head to the left means lean left gesture, i.e. decrease
- tilting the head to the right means lean right gesture, i.e. increase.
- the user intention management unit 130 may refer to a lookup table (not shown) regarding an intention corresponding to a pattern of a head gesture in order to determine the intention of the target user, and this lookup table is obtained when a predetermined condition is satisfied. It can be updated periodically or in real time. Meanwhile, the user intention management unit 130 may perform learning based on a pattern of head gestures of each target user or a plurality of target users, and may determine the intention of the target user based on the learning result. That is, the user intention management unit 130 may use a variety of known learning algorithms to determine the intention corresponding to the target user's pattern. For example, learning based on the image about the target user's head gesture pattern. A Convolutional Neural Network (CNN) algorithm for performing, or the like, a Support Vector Machine (SVM) algorithm for performing learning based on a feature specified from a pattern of a head gesture of a target user, etc. may be used. .
- CNN Convolutional Neural Network
- SVM Support Vector Machine
- the user intention management unit 130 may specify a control command intended by the target user with reference to the intention of the target user determined as above, and execute the control command.
- the communication unit 140 may perform a function of enabling data transmission/reception to/from the guide message management unit 110 , the effective gesture management unit 120 , and the user intention management unit 130 . have.
- control unit 150 controls the flow of data between the guide message management unit 110 , the effective gesture management unit 120 , the user intention management unit 130 , and the communication unit 140 .
- the control unit 150 according to the present invention controls the data flow to/from the outside of the gesture recognition system 100 or the data flow between each component of the gesture recognition system 100, so that the guide message management unit 110, The effective gesture management unit 120 , the user intention management unit 130 , and the communication unit 140 may be controlled to perform their own functions, respectively.
- 4 to 7 are diagrams exemplarily illustrating a situation in which a guide message including text and an image is provided to a target user.
- One guide message is provided (see FIG. 4 ), and at least one of the face and the gaze of the second target user 420 is directed through the second message delivery device 520 located within a predetermined range based on the direction 421 .
- a second guide message is provided (refer to FIG. 5), and a third message delivery device 530 positioned within a predetermined range based on a direction 431 toward which at least one of the face and the gaze of the third target user 430 is directed.
- a third guide message is provided through (see FIG.
- a fourth guide message may be provided through (see FIG. 7 ).
- a guide message could be a visual message "Are you sure? Shake to Cancel or Nod to Confirm” (or "Are you sure? Shake to Cancel or Nod to Confirm”).
- a direction 411 toward which at least one of the face and gaze of the first target user 410 is directed and a direction 511 in which the first guide message is displayed are determined.
- it may be determined whether the head gesture performed by the first target user 410 is a valid gesture, the direction 421 toward which at least one of the face and the gaze of the second target user 420 is directed and the second guide message Whether the head gesture performed by the second target user 420 is a valid gesture may be determined with reference to the display direction 521 (eg, the normal direction of the second guide message), and the third target user
- the third target user 430 with reference to the direction 431 in which at least one of the face and the gaze of the 430 is directed and the direction 531 in which the third guide message is displayed may be determined whether the head gesture performed by
- a gesture performed by the first target user 410 in a state in which at least one of the face and the gaze of the first target user 410 faces a direction opposite to the direction 511 in which the first guide message is displayed It can be determined as a valid gesture, and is performed by the second target user 420 with at least one of the face and the gaze of the second target user 420 facing a direction opposite to the direction 521 in which the second guide message is displayed. may be determined as a valid gesture, and the third target user 430 in a state in which at least one of the face and the gaze of the third target user 430 faces in a direction opposite to the direction 531 in which the third guide message is displayed.
- a gesture performed by the user may be determined as a valid gesture, and at least one of a face and a gaze of the fourth target user 440 faces a direction opposite to the direction 541 in which the fourth guide message is displayed.
- the gesture made by 440 may be determined as a valid gesture.
- the shaking gesture is performed by the first target user 410 If performed, the corresponding shaking gesture may be determined as a valid gesture, and if the nod gesture is performed by the first target user 410 , the corresponding nod gesture may be determined as a valid gesture, and among the face and gaze of the second target user 420 .
- the corresponding shaking gesture may be determined as a valid gesture, and the second target
- the nod gesture may be determined as a valid gesture, and at least one of the face and the gaze of the third target user 430 is opposite to the direction 531 in which the third guide message is displayed.
- the shaking gesture may be determined as a valid gesture, and if the nod gesture is performed by the third target user 430 , the nod gesture is valid It may be determined as a gesture, and in a state in which at least one of the face and gaze of the fourth target user 440 faces the direction opposite to the direction 541 in which the fourth guide message is displayed, shaking by the fourth target user 440
- the corresponding shaking gesture may be determined as a valid gesture, and if the nod gesture is performed by the fourth target user 440 , the corresponding nod gesture may be determined as a valid gesture.
- each target user 410 , 420 , 430 , 440 may be determined with reference to the head gesture of each target user 410 , 420 , 430 , 440 determined to be the above valid gesture.
- the shaking gesture of the first to fourth target users 410, 420, 430, and 440 is determined as a valid gesture, it may be determined that the intention of the corresponding target user 410, 420, 430, 440 is cancellation. If the nod gesture of the first to fourth target users 410 , 420 , 430 , and 440 is determined as a valid gesture, the intention of the corresponding target user 410 , 420 , 430 , 440 may be determined to be consent.
- FIG. 8 is a diagram exemplarily illustrating a situation in which a guide message including a voice is provided to a target user.
- a guide through a message delivery device 850 (eg, a speaker) located within a predetermined range with respect to a direction 811 in which at least one of a face and a gaze of a target user 810 is directed.
- a message may be provided.
- such a guide message could be an audible message "Should I turn up the volume?"
- the target user 810 is It may be determined whether the head gesture performed by .
- the target user 810 in a state where the speaker 850 providing the guide message is present on an extension of the direction 812 in which at least one of the face and the gaze of the target user 810 is directed. may be determined as a valid gesture.
- the corresponding right tilt gesture may be determined as a valid gesture.
- the intention of the target user 810 may be determined with reference to the head gesture of the target user 810 determined to be the above valid gesture.
- the right tilting gesture of the target user 810 is determined as a valid gesture, it may be determined that the intention of the target user 810 is to increase the volume.
- 9 and 10 are diagrams exemplarily illustrating another situation in which a guide message including a voice is provided to a target user.
- a guide through a message delivery device 950 located within a predetermined range based on a direction 911 in which at least one of the face and gaze of the target user 910 is directed.
- a message may be provided.
- such a guide message may be an audible message "Nod to the door video (intercom) to open the door” (or “Nod to the door video to open the door”).
- the target user 910 in a state in which the door video (intercom) 960 indicated in the guide message exists on the extension line of the direction 912 in which at least one of the target user 910's face and gaze is directed. may be determined as a valid gesture.
- the nod gesture when a nod gesture is performed, the nod gesture may be determined as a valid gesture.
- the intention of the target user 910 may be determined with reference to the head gesture of the target user 910 determined to be the above valid gesture.
- the intention of the target user 910 may be determined to be consent (ie, open a door).
- a guide message according to the present invention is provided in a device that performs other conventional functions, or a function other than the function of providing a guide message by a message delivery device is added. can also be done
- a guide message (eg, such The guide message may be a visual message “Shall we open?” (or “Open?”).) is provided to the target user 1010 , or the message delivery device 1060 further performs the function of an intercom so that the calling function is increased.
- a guide message including text related to a corresponding call function may be provided to the target user 1010 in the message delivery device.
- the gesture performed by the target user 1010 is valid while the intercom 1060 providing the guide message is present on an extension line in the direction in which at least one of the target user 1010's face and gaze is directed. It may be determined as a gesture.
- the nod gesture is performed by the target user 1010 in a state where the intercom 1060 providing the guide message is present on an extension line in the direction in which at least one of the face and the gaze of the target user 1010 is directed. Otherwise, the nod gesture may be determined as a valid gesture, and the intention of the corresponding target user 1010 may be determined to be acceptance (ie, opening the door).
- FIG. 11 is a diagram illustrating another situation in which a guide message including a voice is provided to a target user.
- a plurality of message delivery devices 1120 , 1121 , 1122 , 1123 positioned within a predetermined range with respect to the direction 1111 in which at least one of the face and the gaze of the target user 1110 are directed (examples)
- a guide message may be provided through a speaker).
- such a guide message could be an audible message "Should I set to sleep mode?"
- at least one of the face and the gaze of the target user 1110 is adjusted as sound elements such as output and phase of the voice providing the guide message are adjusted in the plurality of message delivery devices 1120 , 1121 , 1122 , and 1123 .
- the sound image of the guide message (that is, a virtual point where the sound is recognized as being output or the sound is focused on a display (specifically, a specific position of the display) located within a predetermined range with respect to the direction 1111 is directed. point) can be located.
- the target user 1110 is sent to the target user 1110 . It may be determined whether the head gesture made by the user is a valid gesture.
- the corresponding target user may be determined as a valid gesture.
- the corresponding target when a nod gesture is performed by the user 1110 , the nod gesture may be determined as a valid gesture.
- the intention of the target user 1110 may be determined with reference to the head gesture of the target user 1110 determined to be the above valid gesture.
- the intention of the target user 1110 may be determined to be acceptance (ie, performing a sleep mode).
- the embodiments according to the present invention described above may be implemented in the form of program instructions that can be executed through various computer components and recorded in a computer-readable recording medium.
- the computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination.
- the program instructions recorded on the computer-readable recording medium may be specially designed and configured for the present invention, or may be known and available to those skilled in the computer software field.
- Examples of computer-readable recording media include hard disks, magnetic media such as floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floppy disks. medium), and hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like.
- Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
- a hardware device may be converted into one or more software modules to perform processing in accordance with the present invention, and vice versa.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
본 발명의 일 태양에 따르면, 제스처를 인식하는 방법으로서, 타겟 사용자에게 가이드 메시지를 제공하는 단계, 상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 상기 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 상기 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 단계, 및 상기 유효한 제스처인 것으로 결정되는 상기 타겟 사용자의 헤드 제스처를 참조하여 상기 타겟 사용자의 의도를 결정하는 단계를 포함하는 방법이 제공된다.
Description
본 발명은 제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체에 관한 것이다.
근래에 들어, 모바일 디바이스, 태블릿, 랩탑, PC, 가전 디바이스, 자동차 등 다양한 사용 환경에서 사용자의 제스처를 인식하여 객체를 제어하거나 명령을 실행할 수 있도록 하는 기술들이 소개되고 있다.
이에 관한, 종래 기술의 일 예로서, 한국공개특허공보 제2015-138831호에 개시된 기술을 예로 들 수 있는데, 휴대용 장치를 휴대하는 사용자의 제스처를 검출하는 센서, 상기 검출된 제스처를 식별하고, 상기 식별된 제스처에 기초하여 상기 제스처에 대응되는 외부 장치를 결정하고, 상기 결정된 외부 장치를 제어하는 명령을 결정하는 제어부, 및 상기 명령에 대응하는 명령 신호를 상기 외부 장치로 전송하는 통신부를 포함하고, 특정 명령에 대응하는 제스처를 수행하기 전에 사용자의 제스처 명령 인식이 시작되도록 트리거 신호 또는 활성화 신호를 실행하며, 이러한 트리거 신호에는 스마트 시계의 터치 스크린 상에서 터치 또는 탭(tap)이나 특정 제스처가 포함되는 휴대용 장치가 소개된 바 있다.
하지만, 위와 같은 종래 기술을 비롯하여 지금까지 소개된 기술에 의하면, 제스처 인식을 트리거하거나 제스처 인식을 시작 및 종료하는 방식으로서 하나의 단일한 기준, 즉 기설정된 기준만이 이용될 뿐이고, 이러한 기준을 동적으로 달라지도록 하는 기술에 관하여는 관심을 보이지 않고 있다. 즉, 사용자의 상황이나 제어 대상 객체의 속성을 전혀 고려함이 없이, 제스처 인식을 트리거하기 위해서는 기설정된 조건을 만족시켜야 되므로 사용자 경험적인 측면에서 번거롭거나 트리거하기 곤란한 상황이 종종 발생하게 되는 문제가 있었다.
이에 본 발명자는, 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 해당 타겟 사용자에게 제공되는 가이드 메시지에 따라 결정되는 방향 또는 위치를 참조하여 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지가 결정되도록 함으로써, 제스처 인식을 신속 정확하면서도 효율적으로 수행할 수 있는 신규하고도 진보된 기술을 제안하는 바이다.
본 발명은, 전술한 종래 기술의 문제점을 모두 해결하는 것을 그 목적으로 한다.
또한, 본 발명은, 가이드 메시지에 따라 타겟 사용자의 헤드 제스처가 유효한 제스처로 결정되는 기준이 동적으로 변동되는 것을 다른 목적으로 한다.
또한, 본 발명은, 타겟 사용자와 연관되는 메시지 전달 디바이스를 통해 가이드 메시지를 제공함으로써, 타겟 사용자의 헤드 제스처가 유효한 제스처로 결정되는 기준을 쉽고 정확하게 알려주는 것을 또 다른 목적으로 한다.
상기 목적을 달성하기 위한 본 발명의 대표적인 구성은 다음과 같다.
본 발명의 일 태양에 따르면, 제스처를 인식하는 방법으로서, 타겟 사용자에게 가이드 메시지를 제공하는 단계, 상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 상기 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 상기 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 단계, 및 상기 유효한 제스처인 것으로 결정되는 상기 타겟 사용자의 헤드 제스처를 참조하여 상기 타겟 사용자의 의도를 결정하는 단계를 포함하는 방법이 제공된다.
본 발명의 다른 태양에 따르면, 제스처를 인식하는 시스템으로서, 타겟 사용자에게 가이드 메시지를 제공하는 가이드 메시지 관리부, 상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 상기 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 상기 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 유효 제스처 관리부, 및 상기 유효한 제스처인 것으로 결정되는 상기 타겟 사용자의 헤드 제스처를 참조하여 상기 타겟 사용자의 의도를 결정하는 사용자 의도 관리부를 포함하는 시스템이 제공된다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 비일시성의 컴퓨터 판독 가능한 기록 매체가 더 제공된다.
본 발명에 의하면, 가이드 메시지에 따라 타겟 사용자의 헤드 제스처가 유효한 제스처로 결정되는 기준이 동적으로 변동될 수 있게 된다.
또한, 본 발명에 의하면, 타겟 사용자와 연관되는 메시지 전달 디바이스를 통해 가이드 메시지를 제공함으로써, 타겟 사용자의 헤드 제스처가 유효한 제스처로 결정되는 기준을 쉽고 정확하게 알려줄 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 제스처 인식 시스템의 내부 구성을 상세하게 도시하는 도면이다.
도 2은 본 발명의 일 실시예에 따라 메시지 전달 디바이스가 특정되는 상황을 예시적으로 나타내는 도면이다.
도 3 내지 도 11은 본 발명의 일 실시예에 따라 제스처가 인식되는 과정을 예시적으로 나타내는 도면이다.
<부호의 설명>
100: 제스처 인식 시스템
110: 가이드 메시지 관리부
120: 유효 제스처 관리부
130: 사용자 의도 관리부
140: 통신부
150: 제어부
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이러한 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 본 명세서에 기재되어 있는 특정 형상, 구조 및 특성은 본 발명의 정신과 범위를 벗어나지 않으면서 일 실시예로부터 다른 실시예로 변경되어 구현될 수 있다. 또한, 각각의 실시예 내의 개별 구성요소의 위치 또는 배치도 본 발명의 정신과 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 행하여지는 것이 아니며, 본 발명의 범위는 청구범위의 청구항들이 청구하는 범위 및 그와 균등한 모든 범위를 포괄하는 것으로 받아들여져야 한다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 구성요소를 나타낸다.
이하에서는, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 여러 바람직한 실시예에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.
전체 시스템의 구성
본 발명의 일 실시예에 따른 전체 시스템은 통신망, 제스처 인식 시스템(100) 및 메시지 전달 디바이스를 포함하여 구성될 수 있다.
먼저, 본 발명의 일 실시예에 따른 통신망은 유선 통신이나 무선 통신과 같은 통신 양태를 가리지 않고 구성될 수 있으며, 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 바람직하게는, 본 명세서에서 말하는 통신망은 공지의 인터넷 또는 월드와이드웹(WWW; World Wide Web)일 수 있다. 그러나, 통신망은, 굳이 이에 국한될 필요 없이, 공지의 유무선 데이터 통신망, 공지의 전화망 또는 공지의 유무선 텔레비전 통신망을 그 적어도 일부에 있어서 포함할 수도 있다.
예를 들면, 통신망은 무선 데이터 통신망으로서, 무선주파수(RF; Radio Frequency) 통신, 와이파이(WiFi) 통신, 셀룰러(LTE 등) 통신, 블루투스 통신(더 구체적으로는, 저전력 블루투스(BLE; Bluetooth Low Energy)), 적외선 통신, 초음파 통신 등과 같은 종래의 통신 방법을 적어도 그 일부분에 있어서 구현하는 것일 수 있다.
다음으로, 본 발명의 일 실시예에 따른 제스처 인식 시스템(100)은 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 디바이스일 수 있다. 이러한 제스처 인식 시스템(100)은 서버 시스템일 수 있다.
본 발명의 일 실시예에 따르면, 제스처 인식 시스템(100)은, 후술할 메시지 전달 디바이스와 통신망 또는 소정의 프로세서(미도시됨)를 통하여 서로 연결될 수 있으며, 타겟 사용자에게 가이드 메시지를 제공하고, 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하고, 유효한 제스처인 것으로 결정되는 타겟 사용자의 헤드 제스처를 참조하여 타겟 사용자의 의도를 결정하는 기능을 수행할 수 있다.
여기서, 본 발명의 일 실시예에 따른 가이드 메시지는 메시지 전달 디바이스를 통해 타겟 사용자에게 제공되는 시각, 청각 또는 후각 중 적어도 하나의 형태의 메시지일 수 있고, 예를 들어, 텍스트 또는 이미지와 같은 시각 메시지, 음성과 같은 청각 메시지, 또는 동영상과 같은 시청각 메시지를 포함할 수 있으며, 이러한 메시지는 팝업, 배너, 플로팅(floating) 등의 다양한 구현 방식으로 제공되는 것일 수 있다.
본 발명에 따른 제스처 인식 시스템(100)의 구성과 기능에 관하여는 아래에서 더 자세하게 알아보기로 한다. 한편, 제스처 인식 시스템(100)에 관하여 위와 같이 설명되었으나, 이러한 설명은 예시적인 것이고, 제스처 인식 시스템(100)에 요구되는 기능이나 구성요소의 적어도 일부가 필요에 따라 외부 디바이스(예를 들면, 메시지 전달 디바이스 등) 또는 외부 시스템(예를 들면, 클라우드 서버 등) 내에서 실현되거나 외부 디바이스 또는 외부 시스템 내에 포함될 수도 있음은 당업자에게 자명하다.
다음으로, 본 발명의 일 실시예에 따른 메시지 전달 디바이스(미도시됨)는 통신망 또는 소정의 프로세서에 의하여 제스처 인식 시스템(100)과 통신이 이루어질 수 있으며, 가이드 메시지를 출력하는 기능을 수행할 수 있다. 예를 들어, 본 발명의 일 실시예에 따른 메시지 전달 디바이스에는 시각 또는 청각 메시지를 출력할 수 있는 디스플레이, 스피커 등 다양한 유형의 디바이스가 포함될 수 있다.
제스처 인식 시스템의 구성
이하에서는, 본 발명의 구현을 위하여 중요한 기능을 수행하는 제스처 인식 시스템(100)의 내부 구성 및 각 구성요소의 기능에 대하여 살펴보기로 한다.
도 1은 본 발명의 일 실시예에 따른 제스처 인식 시스템(100)의 내부 구성을 상세하게 도시하는 도면이다.
도 1에 도시된 바와 같이, 제스처 인식 시스템(100)은, 가이드 메시지 관리부(110), 유효 제스처 관리부(120), 사용자 의도 관리부(130), 통신부(140) 및 제어부(150)를 포함하여 구성될 수 있다. 본 발명의 일 실시예에 따르면, 가이드 메시지 관리부(110), 유효 제스처 관리부(120), 사용자 의도 관리부(130), 통신부(140) 및 제어부(150)는 그 중 적어도 일부가 외부의 시스템과 통신하는 프로그램 모듈일 수 있다. 이러한 프로그램 모듈은 운영 시스템, 응용 프로그램 모듈 또는 기타 프로그램 모듈의 형태로 제스처 인식 시스템(100)에 포함될 수 있고, 물리적으로는 여러 가지 공지의 기억 장치에 저장될 수 있다. 또한, 이러한 프로그램 모듈은 제스처 인식 시스템(100)과 통신 가능한 원격 기억 장치에 저장될 수도 있다. 한편, 이러한 프로그램 모듈은 본 발명에 따라 후술할 특정 업무를 수행하거나 특정 추상 데이터 유형을 실행하는 루틴, 서브루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포괄하지만, 이에 제한되지는 않는다.
먼저, 본 발명의 일 실시예에 따른 가이드 메시지 관리부(110)는 타겟 사용자에게 가이드 메시지를 제공하는 기능을 수행할 수 있다.
구체적으로, 가이드 메시지 관리부(110)는 타겟 사용자와 연관되는 메시지 전달 디바이스에서 가이드 메시지가 제공되도록 할 수 있다.
예를 들어, 도 2를 참조하면, 가이드 메시지 관리부(110)는 타겟 사용자가 존재하는 위치를 기준으로 해당 타겟 사용자와 가장 가까운 거리에 위치하는 메시지 전달 디바이스(320)에서 가이드 메시지가 타겟 사용자에게 제공되도록 할 수 있다. 보다 구체적으로, 가이드 메시지 관리부(110)는 복수의 메시지 전달 디바이스(310, 320)가 존재하는 위치 및 타겟 사용자가 존재하는 위치 사이의 거리를 각각 산출할 수 있고, 그 산출되는 거리 중 가장 짧은 거리(예를 들어, 유클리드 거리)에 대응되는 메시지 전달 디바이스(320)를 타겟 사용자와 가장 가까운 거리에 위치하는 메시지 전달 디바이스로 결정할 수 있다.
다른 예를 들어, 가이드 메시지 관리부(110)는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향을 기준으로 소정 범위 내에 위치하는 메시지 전달 디바이스에서 가이드 메시지가 타겟 사용자에게 제공되도록 할 수 있다. 보다 구체적으로, 가이드 메시지 관리부(110)는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향을 기준으로 특정되는 직선(201)(예를 들어, 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향으로 연장되는 직선(201))을 중심선 또는 중심축으로 갖는 2차원 또는 3차원 영역(202)(예를 들어, 원, 타원, 정사각형, 직사각형, 원뿔, 사각뿔 등의 영역)이 특정될 수 있고, 그 영역 내에 포함되는 메시지 전달 디바이스(320)(또는, 그 영역 내에 포함되는 메시지 전달 디바이스 중 타겟 사용자와 가장 가까운 메시지 전달 디바이스)에서 가이드 메시지가 타겟 사용자에게 제공되도록 할 수 있다.
한편, 가이드 메시지 관리부(110)는 타겟 사용자에 관한 문맥(context) 정보를 참조하여 가이드 메시지를 제공할 메시지 전달 디바이스 및 가이드 메시지 전달 유형 중 적어도 하나를 동적으로 결정할 수 있다.
예를 들어, 가이드 메시지 관리부(110)는 타겟 사용자가 존재하는 위치(또는 장소), 주시 대상, 주시 시간, 주변 소음 정도 등에 관한 정보와 동일하거나 유사한 정보에 매칭되는 사례를 사례 데이터베이스 상에서 검색하거나, 타겟 사용자가 존재하는 위치(또는 장소), 주시 대상, 주시 시간, 주변 소음 정도 등에 관하여 기계 학습(machine learning) 또는 딥 러닝(deep learning)을 통해 학습한 결과에 기초하여 대응되는 사례를 특정할 수 있으며, 그 특정되는 사례를 기준으로 타겟 사용자에 관한 문맥 정보를 특정하고 그 특정되는 문맥 정보에 기초하여 타겟 사용자에게 가이드 메시지를 가장 효율적으로 전달하거나 타겟 사용자의 관심을 극대화할 수 있는 메시지 전달 디바이스(예를 들어, 가장 가까운 거리) 및 그 전달 유형(예를 들어, 시끄러운 장소인 경우에는 시각 메시지를 제공하고 조용한 장소인 경우에는 청각 메시지를 제공)을 동적으로 결정할 수 있다.
다음으로, 본 발명의 일 실시예에 따른 유효 제스처 관리부(120)는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 기능을 수행할 수 있다.
예를 들어, 유효 제스처 관리부(120)는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향에 기초하여 특정되는(또는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향으로 연장되는) 선(또는 영역) 상에 해당 타겟 사용자에게 가이드 메시지를 제공하는 메시지 전달 디바이스가 위치하면, 해당 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 해당 방향을 향하는 동안 또는 해당 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 해당 방향을 향하는 시점을 기준으로 소정 시간 동안 해당 타겟 사용자에 의해 행해지는 헤드 제스처를 유효한 제스처로서 결정할 수 있다.
다른 예를 들어, 유효 제스처 관리부(120)는 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향과 가이드 메시지에 의해 지시(또는 특정)되는 방향이 일치하는 경우에 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 해당 방향을 향하는 동안 또는 해당 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 해당 방향을 향하는 시점을 기준으로 소정 시간 동안 해당 타겟 사용자에 의해 행해지는 헤드 제스처를 유효한 제스처로서 결정할 수 있다.
보다 구체적으로, 음성 가이드 메시지의 내용에 의해 소정 방향을 향하도록 지시되는 경우에, 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 위의 지시되는 방향을 향하는 동안 또는 해당 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 위의 지시되는 방향을 향하는 시점을 기준으로 소정 시간 동안 해당 타겟 사용자에 의해 행해지는 헤드 제스처를 유효한 제스처로서 결정할 수 있다.
다음으로, 본 발명의 일 실시예에 따른 사용자 의도 관리부(130)는 유효 제스처 관리부(120)에 의해 유효한 제스처인 것으로 결정되는 타겟 사용자의 헤드 제스처를 참조하여 타겟 사용자의 의도를 결정하는 기능을 수행할 수 있다.
예를 들어, 도 3을 참조하면, 사용자 의도 관리부(130)는 유효한 제스처인 것으로 결정되는 타겟 사용자의 헤드 제스처의 패턴과 일치 또는 유사한 패턴에 대응되는 의도를 해당 타겟 사용자의 의도로서 결정할 수 있다. 보다 구체적으로, 사용자 의도 관리부(130)는 사용자가 고개를 아래-위 순으로 움직이면 끄덕임(nod) 제스처, 즉 O, 네(yes) 또는 아래(down)을 의미하고, 고개를 좌-우-좌-우 또는 우-좌-우-좌 순으로 움직이면 흔들기(shake) 제스처, 즉 X, 아니오(no) 또는 취소(cancel)을 의미하고, 고개를 우-좌 순으로 움직이면 오른쪽(right) 제스처, 즉 다음(next)을 의미하고, 고개를 좌-우 순으로 움직이면 왼쪽(left) 제스처, 즉 이전(previous)을 의미하고, 고개를 상-하 순으로 움직이면 위쪽(up) 제스처 즉, 위로 이동(up)을 의미하고, 고개를 좌로 기울이면 왼쪽 기울임(lean left) 제스처, 즉 감소(decrease)를 의미하고, 고개를 우로 기울이면 오른쪽 기울임(lean right) 제스처, 즉 증가(increase)를 의미하는 것으로 타겟 사용자의 의도를 결정할 수 있다.
한편, 사용자 의도 관리부(130)는 타겟 사용자의 의도를 결정하기 위하여 헤드 제스처의 패턴에 대응되는 의도에 관한 룩업 테이블(미도시됨)을 참조할 수 있으며, 이러한 룩업 테이블은 소정 조건 만족 시, 소정 기간 마다 또는 실시간으로 업데이트될 수 있다. 한편, 사용자 의도 관리부(130)는 각 타겟 사용자 또는 복수의 타겟 사용자의 헤드 제스처의 패턴에 기초하여 학습을 수행할 수 있고, 그 학습 결과에 기초하여 타겟 사용자의 의도를 결정할 수 있다. 즉, 사용자 의도 관리부(130)는 타겟 사용자의 패턴에 대응되는 의도를 결정하기 위하여 공지의 다양한 학습 알고리즘을 이용할 수 있다, 예를 들어, 타겟 사용자의 헤드 제스처의 패턴에 관한 영상을 기반으로 학습을 수행하기 위한 CNN(Convolutional Neural Network) 알고리즘 등이 활용되거나, 타겟 사용자의 헤드 제스처의 패턴으로부터 특정되는 특징(feature)을 기반으로 학습을 수행하기 위한 SVM(Support Vector Machine) 알고리즘 등이 이용될 수 있다.
나아가, 사용자 의도 관리부(130)는 위와 같이 결정되는 타겟 사용자의 의도를 참조하여 타겟 사용자가 의도한 제어 명령을 특정하고 그 제어 명령이 실행되도록 할 수 있다.
한편, 본 발명의 일 실시예에 따른 통신부(140)는 가이드 메시지 관리부(110), 유효 제스처 관리부(120) 및 사용자 의도 관리부(130)로부터의/로의 데이터 송수신이 가능하도록 하는 기능을 수행할 수 있다.
마지막으로, 본 발명의 일 실시예에 따른 제어부(150)는 가이드 메시지 관리부(110), 유효 제스처 관리부(120), 사용자 의도 관리부(130) 및 통신부(140) 간의 데이터의 흐름을 제어하는 기능을 수행할 수 있다. 즉, 본 발명에 따른 제어부(150)는 제스처 인식 시스템(100)의 외부로부터의/로의 데이터 흐름 또는 제스처 인식 시스템(100)의 각 구성요소 간의 데이터 흐름을 제어함으로써, 가이드 메시지 관리부(110), 유효 제스처 관리부(120), 사용자 의도 관리부(130) 및 통신부(140)에서 각각 고유 기능을 수행하도록 제어할 수 있다.
제1 실시예
도 4 내지 도 7은 텍스트 및 이미지를 포함하는 가이드 메시지가 타겟 사용자에게 제공되는 상황을 예시적으로 나타내는 도면이다.
도 4 내지 도 7을 참조하면, 먼저, 제1 타겟 사용자(410)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(411)을 기준으로 소정 범위 내에 위치하는 제1 메시지 전달 디바이스(510)를 통해 제1 가이드 메시지가 제공되고(도 4 참조), 제2 타겟 사용자(420)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(421)을 기준으로 소정 범위 내에 위치하는 제2 메시지 전달 디바이스(520)를 통해 제2 가이드 메시지가 제공되며(도 5 참조), 제3 타겟 사용자(430)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(431)을 기준으로 소정 범위 내에 위치하는 제3 메시지 전달 디바이스(530)를 통해 제3 가이드 메시지가 제공되고(도 6 참조), 제4 타겟 사용자(440)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(441)을 기준으로 소정 범위 내에 위치하는 제4 메시지 전달 디바이스(540)를 통해 제4 가이드 메시지가 제공될 수 있다(도 7 참조). 예를 들어, 이러한 가이드 메시지는 "정말인가요? 취소면 흔들기 제스처, 확인이면 끄덕임 제스처를 하세요"(또는 "Are you sure? Shake to Cancel or Nod to Confirm")라는 시각 메시지일 수 있다.
그 다음에, 제1 타겟 사용자(410)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(411) 및 제1 가이드 메시지가 디스플레이되는 방향(511)(예를 들어, 제1 가이드 메시지의 법선 방향)을 참조하여 제1 타겟 사용자(410)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있고, 제2 타겟 사용자(420)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(421) 및 제2 가이드 메시지가 디스플레이되는 방향(521)(예를 들어, 제2 가이드 메시지의 법선 방향)을 참조하여 제2 타겟 사용자(420)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있으며, 제3 타겟 사용자(430)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(431) 및 제3 가이드 메시지가 디스플레이되는 방향(531)(예를 들어, 제3 가이드 메시지의 법선 방향)을 참조하여 제3 타겟 사용자(430)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있고, 제4 타겟 사용자(440)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(441) 및 제4 가이드 메시지가 디스플레이되는 방향(541)(예를 들어, 제4 가이드 메시지의 법선 방향)을 참조하여 제4 타겟 사용자(440)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있다.
예를 들어, 제1 타겟 사용자(410)의 얼굴 및 시선 중 적어도 하나가 제1 가이드 메시지가 디스플레이되는 방향(511)의 반대 방향을 향하는 상태로 제1 타겟 사용자(410)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있고, 제2 타겟 사용자(420)의 얼굴 및 시선 중 적어도 하나가 제2 가이드 메시지가 디스플레이되는 방향(521)의 반대 방향을 향하는 상태로 제2 타겟 사용자(420)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있으며, 제3 타겟 사용자(430)의 얼굴 및 시선 중 적어도 하나가 제3 가이드 메시지가 디스플레이되는 방향(531)의 반대 방향을 향하는 상태로 제3 타겟 사용자(430)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있고, 제4 타겟 사용자(440)의 얼굴 및 시선 중 적어도 하나가 제4 가이드 메시지가 디스플레이되는 방향(541)의 반대 방향을 향하는 상태로 제4 타겟 사용자(440)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있다.
보다 구체적으로, 제1 타겟 사용자(410)의 얼굴 및 시선 중 적어도 하나가 제1 가이드 메시지가 디스플레이되는 방향(511)의 반대 방향을 향하는 상태에서, 제1 타겟 사용자(410)에 의해 흔들기 제스처가 행해지면 해당 흔들기 제스처가 유효한 제스처로 결정될 수 있고, 제1 타겟 사용자(410)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있으며, 제2 타겟 사용자(420)의 얼굴 및 시선 중 적어도 하나가 제2 가이드 메시지가 디스플레이되는 방향(521)의 반대 방향을 향하는 상태에서, 제2 타겟 사용자(420)에 의해 흔들기 제스처가 행해지면 해당 흔들기 제스처가 유효한 제스처로 결정될 수 있고, 제2 타겟 사용자(420)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있으며, 제3 타겟 사용자(430)의 얼굴 및 시선 중 적어도 하나가 제3 가이드 메시지가 디스플레이되는 방향(531)의 반대 방향을 향하는 상태에서, 제3 타겟 사용자(430)에 의해 흔들기 제스처가 행해지면 해당 흔들기 제스처가 유효한 제스처로 결정될 수 있고, 제3 타겟 사용자(430)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있으며, 제4 타겟 사용자(440)의 얼굴 및 시선 중 적어도 하나가 제4 가이드 메시지가 디스플레이되는 방향(541)의 반대 방향을 향하는 상태에서, 제4 타겟 사용자(440)에 의해 흔들기 제스처가 행해지면 해당 흔들기 제스처가 유효한 제스처로 결정될 수 있고, 제4 타겟 사용자(440)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있다.
그 다음에, 위의 유효한 제스처인 것으로 결정되는 각 타겟 사용자(410, 420, 430, 440)의 헤드 제스처를 참조하여 각 타겟 사용자(410, 420, 430, 440)의 의도가 결정될 수 있다.
예를 들어, 제1 내지 제4 타겟 사용자(410, 420, 430, 440)의 흔들기 제스처가 유효한 제스처로 결정되면, 해당 타겟 사용자(410, 420, 430, 440)의 의도는 취소인 것으로 결정될 수 있고, 제1 내지 제4 타겟 사용자(410, 420, 430, 440)의 끄덕임 제스처가 유효한 제스처로 결정되면, 해당 타겟 사용자(410, 420, 430, 440)의 의도는 승낙인 것으로 결정될 수 있다.
제2 실시예
도 8은 음성을 포함하는 가이드 메시지가 타겟 사용자에게 제공되는 상황을 예시적으로 나타내는 도면이다.
도 8을 참조하면, 먼저, 타겟 사용자(810)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(811)을 기준으로 소정 범위 내에 위치하는 메시지 전달 디바이스(850)(예를 들어, 스피커)를 통해 가이드 메시지가 제공될 수 있다. 예를 들어, 이러한 가이드 메시지는 "볼륨을 높일까요?"(또는 "Should I turn up the volume?")라는 청각 메시지일 수 있다.
그 다음에, 타겟 사용자(810)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(812)과 가이드 메시지가 제공되는 방향 또는 해당 가이드 메시지를 제공한 스피커(850)의 위치를 참조하여 타겟 사용자(810)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있다.
예를 들어, 타겟 사용자(810)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(812)의 연장선상에 해당 가이드 메시지를 제공한 스피커(850)가 존재하는 상태로 해당 타겟 사용자(810)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있다.
보다 구체적으로, 타겟 사용자(810)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(812)의 연장선상에 해당 가이드 메시지를 제공한 스피커(850)가 존재하는 상태에서, 해당 타겟 사용자(810)에 의해 오른쪽 기울임 제스처가 행해지면 해당 오른쪽 기울임 제스처가 유효한 제스처로 결정될 수 있다.
그 다음에, 위의 유효한 제스처인 것으로 결정되는 타겟 사용자(810)의 헤드 제스처를 참조하여 해당 타겟 사용자(810)의 의도가 결정될 수 있다.
예를 들어, 타겟 사용자(810)의 오른쪽 기울임 제스처가 유효한 제스처로 결정되면, 해당 타겟 사용자(810)의 의도는 볼륨 증가인 것으로 결정될 수 있다.
제3 실시예
도 9 및 도 10은 음성을 포함하는 가이드 메시지가 타겟 사용자에게 제공되는 다른 상황을 예시적으로 나타내는 도면이다.
도 9를 참조하면, 먼저, 타겟 사용자(910)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(911)을 기준으로 소정 범위 내에 위치하는 메시지 전달 디바이스(950)(예를 들어, 스피커)를 통해 가이드 메시지가 제공될 수 있다. 예를 들어, 이러한 가이드 메시지는 "문을 열기 위해서는 도어 비디오(인터폰)를 향해 끄덕이세요"(또는 "Nod to the door video to open the door")라는 청각 메시지일 수 있다.
그 다음에, 타겟 사용자(910)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(912)과 위의 가이드 메시지의 내용에 의해 지시되는 방향 또는 위치를 참조하여 타겟 사용자(910)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있다.
예를 들어, 타겟 사용자(910)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(912)의 연장선상에 해당 가이드 메시지에서 지시된 도어 비디오(인터폰)(960)가 존재하는 상태로 해당 타겟 사용자(910)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있다.
보다 구체적으로, 타겟 사용자(910)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(912)의 연장선상에 해당 가이드 메시지의 내용에서 지시된 도어 비디오(960)가 존재하는 상태에서, 해당 타겟 사용자(910)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있다.
그 다음에, 위의 유효한 제스처인 것으로 결정되는 타겟 사용자(910)의 헤드 제스처를 참조하여 해당 타겟 사용자(910)의 의도가 결정될 수 있다.
예를 들어, 타겟 사용자(910)의 끄덕임 제스처가 유효한 제스처로 결정되면, 해당 타겟 사용자(910)의 의도는 승낙인 것(즉, 도어를 개방하는 것)으로 결정될 수 있다.
한편, 도 10을 참조하면, 본 발명의 일 실시예에 따라 종래의 다른 기능을 수행하는 디바이스에서 본 발명에 따른 가이드 메시지가 제공되거나, 메시지 전달 디바이스가 가이드 메시지를 제공하는 기능 외에 다른 기능을 더 수행할 수도 있다.
예를 들어, 종래에 인터폰(즉, 종래의 다른 기능을 수행하는 디바이스)(1060)에서 호출 기능이 실행되는 경우에 그 디스플레이에서 해당 호출 기능과 연관된 텍스트를 포함하는 가이드 메시지(예를 들어, 이러한 가이드 메시지는 "열까요?"(또는 "Open?")라는 시각 메시지일 수 있다.)가 타겟 사용자(1010)에게 제공되거나, 메시지 전달 디바이스(1060)가 인터폰의 기능을 더 수행하여 호출 기능이 실행되는 경우에 그 메시지 전달 디바이스에서 해당 호출 기능과 연관된 텍스트를 포함하는 가이드 메시지가 타겟 사용자(1010)에게 제공될 수 있다. 이 경우에 타겟 사용자(1010)의 얼굴 및 시선 중 적어도 하나가 향하는 방향의 연장선상에 해당 가이드 메시지가 제공되는 인터폰(1060)이 존재하는 상태로 해당 타겟 사용자(1010)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있다. 보다 구체적으로, 타겟 사용자(1010)의 얼굴 및 시선 중 적어도 하나가 향하는 방향의 연장선상에 해당 가이드 메시지가 제공되는 인터폰(1060)이 존재하는 상태에서 해당 타겟 사용자(1010)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있고, 해당 타겟 사용자(1010)의 의도는 승낙(즉, 도어를 개방)인 것으로 결정될 수 있다.
제4 실시예
도 11은 음성을 포함하는 가이드 메시지가 타겟 사용자에게 제공되는 또 다른 상황을 예시적으로 나타내는 도면이다.
도 11을 참조하면, 먼저, 타겟 사용자(1110)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(1111)을 기준으로 소정 범위 내에 위치하는 복수의 메시지 전달 디바이스(1120, 1121, 1122, 1123)(예를 들어, 스피커)를 통해 가이드 메시지가 제공될 수 있다. 예를 들어, 이러한 가이드 메시지는 "슬립 모드로 설정해야 할까요?"(또는 " Should I set to sleep mode?")라는 청각 메시지일 수 있다. 이 경우에, 복수의 메시지 전달 디바이스(1120, 1121, 1122, 1123)에서 가이드 메시지를 제공하는 음성의 출력, 위상 등의 소리 요소가 조정됨에 따라 타겟 사용자(1110)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(1111)을 기준으로 소정 범위 내에 위치하는 디스플레이(구체적으로는 디스플레이의 특정 위치) 상에 위의 가이드 메시지의 음상(즉, 음성이 출력되는 것으로 인식되는 가상의 지점 또는 소리의 초점이 맺히는 지점)이 위치될 수 있다.
그 다음에, 타겟 사용자(910)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(1112)과 위의 가이드 메시지가 제공되는 위치(즉, 음상의 위치)(1124)를 참조하여 타겟 사용자(1110)에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부가 결정될 수 있다.
예를 들어, 타겟 사용자(1110)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(1112)의 연장선상에 위의 음상의 위치(1124) 또는 해당 가이드 메시지가 제공되는 디스플레이가 존재하는 상태로 해당 타겟 사용자(1110)에 의해 행해지는 제스처가 유효한 제스처로서 결정될 수 있다.
보다 구체적으로, 타겟 사용자(1110)의 얼굴 및 시선 중 적어도 하나가 향하는 방향(1112)의 연장선상에 위의 음상의 위치(1124) 또는 해당 가이드 메시지가 제공되는 디스플레이가 존재하는 상태에서, 해당 타겟 사용자(1110)에 의해 끄덕임 제스처가 행해지면 해당 끄덕임 제스처가 유효한 제스처로 결정될 수 있다.
그 다음에, 위의 유효한 제스처인 것으로 결정되는 타겟 사용자(1110)의 헤드 제스처를 참조하여 해당 타겟 사용자(1110)의 의도가 결정될 수 있다.
예를 들어, 타겟 사용자(1110)의 끄덕임 제스처가 유효한 제스처로 결정되면, 해당 타겟 사용자(1110)의 의도는 승낙인 것(즉, 슬립 모드를 수행하는 것)으로 결정될 수 있다.
이상 설명된 본 발명에 따른 실시예는 다양한 컴퓨터 구성요소를 통하여 실행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등과 같은, 프로그램 명령어를 저장하고 실행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위하여 하나 이상의 소프트웨어 모듈로 변경될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항과 한정된 실시예 및 도면에 의하여 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위하여 제공된 것일 뿐, 본 발명이 상기 실시예에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정과 변경을 꾀할 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
Claims (7)
- 제스처를 인식하는 방법으로서,타겟 사용자에게 가이드 메시지를 제공하는 단계,상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 상기 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 상기 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 단계, 및상기 유효한 제스처인 것으로 결정되는 상기 타겟 사용자의 헤드 제스처를 참조하여 상기 타겟 사용자의 의도를 결정하는 단계를 포함하는방법.
- 제1항에 있어서,상기 가이드 메시지를 제공하는 단계에서, 상기 타겟 사용자와 연관되는 메시지 전달 디바이스에서 상기 가이드 메시지가 제공되는,방법.
- 제2항에 있어서,상기 메시지 전달 디바이스는 상기 타겟 사용자와 가장 가까운 거리에 위치하는, 디바이스인방법.
- 제2항에 있어서,상기 메시지 전달 디바이스는 상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향을 기준으로 소정 범위 내에 위치하는 디바이스인,방법.
- 제1항에 있어서,상기 유효한 제스처인지 여부를 결정하는 단계에서, 상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 상기 가이드 메시지에 의해 특정되는 방향을 향하는 동안에 상기 타겟 사용자에 의해 행해지는 헤드 제스처를 상기 유효한 제스처로서 결정하는,방법.
- 제1항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록한 비일시성의 컴퓨터 판독 가능 기록 매체.
- 제스처를 인식하는 시스템으로서,타겟 사용자에게 가이드 메시지를 제공하는 가이드 메시지 관리부,상기 타겟 사용자의 얼굴 및 시선 중 적어도 하나가 향하는 방향 및 상기 가이드 메시지와 연관되는 방향 또는 위치를 참조하여 상기 타겟 사용자에 의해 행해지는 헤드 제스처가 유효한 제스처인지 여부를 결정하는 유효 제스처 관리부, 및상기 유효한 제스처인 것으로 결정되는 상기 타겟 사용자의 헤드 제스처를 참조하여 상기 타겟 사용자의 의도를 결정하는 사용자 의도 관리부를 포함하는시스템.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200067814A KR20210150862A (ko) | 2020-06-04 | 2020-06-04 | 제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
KR10-2020-0067814 | 2020-06-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021246795A1 true WO2021246795A1 (ko) | 2021-12-09 |
Family
ID=78831228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/006911 WO2021246795A1 (ko) | 2020-06-04 | 2021-06-03 | 제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 |
Country Status (2)
Country | Link |
---|---|
KR (2) | KR20210150862A (ko) |
WO (1) | WO2021246795A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639205A (zh) * | 2022-03-30 | 2022-06-17 | 中国工商银行股份有限公司 | 基于喷气感应的密码输入装置、方法和自助设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209965A (ja) * | 2010-03-29 | 2011-10-20 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
US20130135204A1 (en) * | 2011-11-30 | 2013-05-30 | Google Inc. | Unlocking a Screen Using Eye Tracking Information |
KR20150003528A (ko) * | 2013-07-01 | 2015-01-09 | 삼성전자주식회사 | 머리 움직임을 이용한 사용자 인터페이스 방법 및 장치 |
KR20160023889A (ko) * | 2013-06-25 | 2016-03-03 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 위치 신호를 통한 사용자 인터페이스 요소들의 선택 |
KR20160143134A (ko) * | 2015-06-04 | 2016-12-14 | 엘지전자 주식회사 | 헤드 마운티드 디스플레이 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10613642B2 (en) * | 2014-03-12 | 2020-04-07 | Microsoft Technology Licensing, Llc | Gesture parameter tuning |
-
2020
- 2020-06-04 KR KR1020200067814A patent/KR20210150862A/ko not_active IP Right Cessation
-
2021
- 2021-06-03 WO PCT/KR2021/006911 patent/WO2021246795A1/ko active Application Filing
-
2023
- 2023-01-26 KR KR1020230010347A patent/KR102581729B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011209965A (ja) * | 2010-03-29 | 2011-10-20 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
US20130135204A1 (en) * | 2011-11-30 | 2013-05-30 | Google Inc. | Unlocking a Screen Using Eye Tracking Information |
KR20160023889A (ko) * | 2013-06-25 | 2016-03-03 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 위치 신호를 통한 사용자 인터페이스 요소들의 선택 |
KR20150003528A (ko) * | 2013-07-01 | 2015-01-09 | 삼성전자주식회사 | 머리 움직임을 이용한 사용자 인터페이스 방법 및 장치 |
KR20160143134A (ko) * | 2015-06-04 | 2016-12-14 | 엘지전자 주식회사 | 헤드 마운티드 디스플레이 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639205A (zh) * | 2022-03-30 | 2022-06-17 | 中国工商银行股份有限公司 | 基于喷气感应的密码输入装置、方法和自助设备 |
Also Published As
Publication number | Publication date |
---|---|
KR102581729B1 (ko) | 2023-09-25 |
KR20230022898A (ko) | 2023-02-16 |
KR20210150862A (ko) | 2021-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018147687A1 (en) | Method and apparatus for managing voice-based interaction in internet of things network system | |
JP6689986B2 (ja) | ゲーム内のキャラクタの移動制御方法、サーバ及びクライアント | |
WO2017188801A1 (ko) | 동작-음성의 다중 모드 명령에 기반한 최적 제어 방법 및 이를 적용한 전자 장치 | |
KR102203510B1 (ko) | 애플리케이션 프로그램 제어 방법 및 장치, 그리고 전자 장치 | |
CN111083684B (zh) | 控制电子设备的方法及电子设备 | |
CN112346685B (zh) | 一种熄屏投屏控制方法、设备及计算机可读存储介质 | |
CN107231473B (zh) | 一种音频输出调控方法、设备及计算机可读存储介质 | |
US11558848B2 (en) | Intelligent notification delivery | |
JP6481210B2 (ja) | 情報処理装置、制御方法、およびプログラム | |
WO2020057258A1 (zh) | 信息处理方法及终端 | |
WO2020171548A1 (ko) | 사용자 입력 처리 방법 및 이를 지원하는 전자 장치 | |
CN108833690B (zh) | 权限管控方法、终端及计算机可读存储介质 | |
CN110022401A (zh) | 一种控制参数设置方法、终端及计算机可读存储介质 | |
WO2020080635A1 (ko) | 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법 | |
WO2020135092A1 (zh) | 权限管理方法及终端设备 | |
WO2021054671A1 (en) | Electronic apparatus and method for controlling voice recognition thereof | |
EP3823251B1 (en) | Function control method, function control device, and computer-readable storage medium | |
CN114761926A (zh) | 一种信息获取方法、终端及计算机存储介质 | |
WO2021246795A1 (ko) | 제스처를 인식하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
WO2023092785A1 (zh) | 终端控制方法、终端控制系统及存储介质 | |
CN109788114B (zh) | 一种通话处理方法及终端 | |
WO2018117660A1 (en) | Security enhanced speech recognition method and device | |
WO2019135543A1 (ko) | 전자장치 및 그 제어방법 | |
WO2017071349A1 (zh) | 一种应用于移动终端的模块控制方法及装置 | |
CN113064536B (zh) | 处理方法、处理设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21818730 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
32PN | Ep: public notification in the ep bulletin as address of the adressee cannot be established |
Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 17.05.2023) |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21818730 Country of ref document: EP Kind code of ref document: A1 |