KR20130140772A - Method circuit and system for human to machine interfacing by hand gestures - Google Patents

Method circuit and system for human to machine interfacing by hand gestures Download PDF

Info

Publication number
KR20130140772A
KR20130140772A KR1020137014811A KR20137014811A KR20130140772A KR 20130140772 A KR20130140772 A KR 20130140772A KR 1020137014811 A KR1020137014811 A KR 1020137014811A KR 20137014811 A KR20137014811 A KR 20137014811A KR 20130140772 A KR20130140772 A KR 20130140772A
Authority
KR
South Korea
Prior art keywords
hand
skeleton
skeletal
dataset
image
Prior art date
Application number
KR1020137014811A
Other languages
Korean (ko)
Inventor
도르 기본
Original Assignee
익스트림 리얼리티 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 익스트림 리얼리티 엘티디. filed Critical 익스트림 리얼리티 엘티디.
Priority claimed from PCT/IB2012/050027 external-priority patent/WO2012095756A2/en
Publication of KR20130140772A publication Critical patent/KR20130140772A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures

Abstract

본 발명은 하나 이상의 3D 손 골격 모델을 사용하는 인간과 기계의 인터페이싱을 위한 시스템, 방법 및 회로에 관한 것이며, 이들은 손의 2D 이미지를 획득하기 위한 이미지 수집 회로, 획득된 이미지에서 손 특징을 식별하기 위한 손 특징 식별 모듈 및 식별된 특징을 사용하여 손의 2D 골격 데이터세트를 생성하기 위한 이미지 골격 형성 모듈을 포함한다. 3D 골격 형성 모듈은 2D 투영도가 생성된 2D 골격 데이터세트에 실질적으로 대응하는, 하나 이상의 3D 손 골격 모델의 일부 또는 전부의 구성을 판정하는 것에 의해 3D 손 골격 데이터세트를 생성하도록 구성된다.The present invention relates to systems, methods, and circuits for interfacing humans and machines using one or more 3D hand skeletal models, which include image acquisition circuitry for acquiring 2D images of the hands, and identifying hand features in the acquired images. A hand feature identification module and an image skeleton forming module for generating a 2D skeleton dataset of the hand using the identified features. The 3D skeletal shaping module is configured to generate the 3D hand skeletal dataset by determining the configuration of some or all of the one or more 3D hand skeletal models substantially corresponding to the 2D skeletal dataset from which the 2D projection was generated.

Description

손동작에 의한 인간과 기계의 인터페이싱을 위한 시스템 및 방법 회로{METHOD CIRCUIT AND SYSTEM FOR HUMAN TO MACHINE INTERFACING BY HAND GESTURES}System and Method Circuit for Interfacing Human-Machine by Hand Movement {METHOD CIRCUIT AND SYSTEM FOR HUMAN TO MACHINE INTERFACING BY HAND GESTURES}

본 발명은 일반적으로 인간과 기계의 인터페이싱 분야 및 인간과 기계의 비접촉 인터페이싱 분야에 관한 것이다. 더 구체적으로, 본 발명은 카메라의 정면에서 수행되는 손동작을 이용하여 명령하는 기계에 관한 것이다.The present invention relates generally to the field of human-machine interfacing and to the field of non-contact interfacing of human-machine. More specifically, the present invention relates to a machine for commanding using hand gestures performed at the front of the camera.

종래의 인간과 기계의 인터페이싱은 몇몇의 인터페이싱 핵심 기술의 사용을 활용한다. 첫 번째로, 그리고 가장 흔하게는, 버튼, 손잡이(knob), 스위치 등과 같은 물리적 인터페이싱 유닛이며, 이들은 인터페이스 기계의 상응하는 반응을 만들기 위해서 눌러지거나, 유지되거나, 돌려지거나, 움직이거나, 스위치가 눌러지거나, 그렇지 않으면 인터페이싱 인간에 의해 다르게 처리되도록 설계된다.Conventional human-machine interfacing utilizes the use of several interfacing core technologies. First, and most often, physical interfacing units such as buttons, knobs, switches, etc., which are pressed, held, turned, moved, or pressed in order to make the corresponding response of the interface machine. Otherwise, the interfacing is designed to be handled differently by humans.

두 번째 기초 기술은 터치 스크린을 사용하는 것이며, 이 기술은 물리적 인터페이싱 유닛이 스크린상에 표시된 그래픽 이미지로 교체되고, 그래픽 이미지의 영역 상에서 사용자의 손가락/장기(organ)로 만지거나 슬라이딩하여 인터페이싱하여, 인터페이스 기계에 그가 원하는 명령을 제공한다. 그래픽 이미지가 변화될 수 있기 때문에, 다양한 유형의 사용 또는 응용에 대응하는 융통성 있는 인터페이스는 사용자의 체험 및 인터페이싱 효율을 최적하하기 위해 사용될 수 있다.The second basic technique is to use a touch screen, in which the physical interfacing unit is replaced with the graphical image displayed on the screen, and the user touches or slides the interface with the finger / organ on the area of the graphical image, Give the interface machine the command he wants. As the graphical images can be varied, flexible interfaces corresponding to various types of uses or applications can be used to optimize the user's experience and interfacing efficiency.

다른 방법은 사용자에 의해 제공된 자연 언어 명령을 식별하기 위해서 인간 음성 인식과 같은 기술; 및 사용자에게 보유되거나 접착된 장치를 활용하는 것이며, 이때 상기 장치의 움직임은 추적되고 기계 명령어에 해당한다.Other methods include techniques such as human speech recognition to identify natural language commands provided by a user; And utilizing a device held or glued to the user, where the movement of the device is tracked and corresponds to machine instructions.

인간과 기계의 인터페이싱 분야에서는 비접촉 인터페이싱 방법 및 시스템에 대한 필요가 여전히 존재하며, 이러한 방법 및 시스템은 자연 인간 신체 또는 신체 일부(들)/장기(들)(예, 인간의 손) 중 하나 이상의 광학 이미지가 상기 인간의 일부들/장기(들)에 의해 수행된 특정 움직임 및/또는 동작에 해당하는 기계 명령어로 번역되도록 할 수 있다.There is still a need for non-contact interfacing methods and systems in the field of human and machine interfacing, where such methods and systems provide for the optics of one or more of the natural human body or body part (s) / organs (s) (eg, human hands). An image may be translated into machine instructions corresponding to a particular movement and / or movement performed by the human parts / organs (s).

본 발명은, 인간과 기계의 비접촉 인터페이싱을 가능하게 하는, 손 동작에 의한 인간과 기계의 인터페이싱을 위한 시스템 및 방법 회로이다.The present invention is a system and method circuit for the interfacing of a human and a machine by hand motion, which enables non-contact interfacing of a human and a machine.

본 발명의 일부 실시예에 따르면, 기계와의 인터페이싱은 카메라의 정면에서 손동작을 수행함으로써 이루어질 수 있다.According to some embodiments of the invention, interfacing with the machine may be accomplished by performing a hand gesture at the front of the camera.

본 발명의 일부 실시예에 따르면, 카메라는 손동작을 식별하도록 구성된 이미지 처리 로직(image processing logic)에 결합될 수 있다. 본 발명의 일부 실시예에서, 상기 이미지 처리 로직은 손 특징 및/또는 손 이미지로부터 주름, 지골(phalange) 및 손끝과 같은 요소를 추출할 수 있다.According to some embodiments of the invention, the camera may be coupled to image processing logic configured to identify hand gestures. In some embodiments of the invention, the image processing logic may extract elements such as wrinkles, phalanges and fingertips from the hand features and / or hand images.

본 발명의 일부 실시예에 따르면, 상기 이미지 처리 로직은 손 특징 및/또는 식별된 요소에 기초하여 2D 이미지 골격을 만들 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격을 만들어낼 수 있고, 3D 골격의 2D 투영도는 2D 이미지 골격과 실질적으로 유사할 수 있고 제약들을 충족할 수 있다. 본 발명의 일부 실시예에 따르면, 상기 제약들은 진짜 같은 손 자세(pose)로 규정될 수 있다.According to some embodiments of the invention, the image processing logic may create a 2D image skeleton based on hand features and / or identified elements. According to some embodiments of the invention, the image processing logic may produce a 3D skeleton, and the 2D projection of the 3D skeleton may be substantially similar to the 2D image skeleton and satisfy constraints. According to some embodiments of the invention, the constraints may be defined as a true hand pose.

본 발명의 일부 실시예에 따르면, 3D 골격은 인터페이싱 손의 자세 및/또는 카메라로부터의 위치 및/또는 거리를 나타낼 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 손짓(3D 골격에 의해 대표됨)의 자세 및/또는 카메라로부터의 위치 및/또는 거리에 따라 시스템 이벤트를 개시할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격 움직임을, 손이 인터페이싱 하는 기계에 보내질 명령으로 번역할 수 있다.According to some embodiments of the invention, the 3D skeleton may represent the pose of the interfacing hand and / or the position and / or distance from the camera. According to some embodiments of the invention, the image processing logic may initiate a system event depending on the pose of the hand gesture (represented by the 3D skeleton) and / or the position and / or distance from the camera. According to some embodiments of the invention, the image processing logic may translate the 3D skeletal motion into a command to be sent to a machine that the hands interface with.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱을 위한 시스템은 하나 이상의 3D 손 골격 모델을 사용할 수 있으며, 상기 시스템은 손의 2D 이미지를 얻기 위한 이미지 획득 회로, 획득한 이미지에서 손의 특징을 식별하기 위한 손 특징 식별 모듈, 식별된 특징을 사용하여 손의 2D 골격 데이터 세트를 생성하기 위한 이미지 골격 형성 모듈; 및/또는 2D 투영도가 생성된 2D 골격 데이터 세트와 실질적으로 상응하는, 하나 이상의 3D 손 골격 모델의 일부 또는 전부의 구성을 판정함으로써 3D 손 골격 데이터 세트를 생성하는 3D 골격 형성 모듈을 포함할 수 있다.According to some embodiments of the invention, a system for interfacing a human and a machine may use one or more 3D hand skeletal models, the system comprising an image acquisition circuit for obtaining a 2D image of the hand, the characteristics of the hand in the acquired image. A hand feature identification module for identifying an image, an image skeleton forming module for generating a 2D skeleton data set of a hand using the identified feature; And / or a 3D skeletal shaping module that generates a 3D hand skeletal data set by determining a configuration of some or all of the one or more 3D hand skeletal models, substantially corresponding to the 2D skeletal data set for which the 2D projection is generated. .

본 발명의 일부 실시예에 따르면, 이미지 골격 형성 모듈은 2D 골격 데이터 세트를 생성하기 위해서 인간 손의 요소들 간의 해부학적 관계 및 제약을 사용하도록 더 구성될 수 있다.According to some embodiments of the invention, the image skeletal shaping module may be further configured to use anatomical relationships and constraints between elements of the human hand to generate a 2D skeletal data set.

본 발명의 일부 실시예에 따르면, 이미지 골격 형성 모듈은 하나 이상의 2D 골격 데이터 세트 요소에 대한 품질 속성을 판정하도록 더 구성될 수 있다.According to some embodiments of the invention, the image skeleton forming module may be further configured to determine quality attributes for one or more 2D skeleton data set elements.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 시스템은 하나 이상의 이전의 3D 손 골격 데이터 세트를 저장하기 위한 골격 데이터베이스 형성 모듈을 포함할 수 있고, 3D 골격 형성장치는 데이터베이스 형성 모듈에 의해 이전에 저장된 하나 이상의 3D 손 골격 데이터 세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하도록 구성될 수 있다.According to some embodiments of the invention, the human and machine interfacing system may comprise a skeletal database forming module for storing one or more previous 3D hand skeletal data sets, wherein the 3D skeletal forming apparatus is transferred by a database forming module. And generate a 3D hand skeleton data set based at least in part on one or more 3D hand skeleton data sets stored in.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 시스템은 모션 다이나믹 물리학 법칙이 적용되는 두 개 이상의 이전의 3D 손 골격 데이터 세트에 기초한 3D 손 골격 데이터 세트를 예측하기 위한 예측 모듈을 포함할 수 있고, 3D 골격 형성장치는 예측 모듈에 의해 예측되는 바와 같은 3D 골격 데이터 세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하도록 더 구성된다.According to some embodiments of the invention, a human-machine interfacing system may comprise a prediction module for predicting a 3D hand skeleton data set based on two or more previous 3D hand skeleton data sets to which the laws of motion dynamics physics are applied. And the 3D skeleton forming apparatus is further configured to generate the 3D hand skeleton data set based at least in part on the 3D skeleton data set as predicted by the prediction module.

본 발명의 일부 실시예에 따르면, 하나 이상의 3D 손 골격 모델을 사용하는 인간과 기계의 인터페이싱을 위한 방법은 손의 2D 이미지를 얻는 단계, 획득한 이미지에서 하나 이상의 손 특징을 식별하는 단계, 식별된 특징을 사용하여 손의 2D 골격 데이터 세트를 생성하는 단계; 및/또는 2D 투영도가 생성된 2D 골격 데이터 세트와 실질적으로 상응하는, 하나 이상의 3D 손 골격 모델의 일부 또는 전부의 구성을 판정함으로써 3D 손 골격 데이터 세트를 생성하는 단계를 포함할 수 있다.According to some embodiments of the invention, a method for interfacing a human and a machine using one or more 3D hand skeletal models includes obtaining a 2D image of a hand, identifying one or more hand features in the acquired image, and identifying the identified Generating a 2D skeleton data set of the hand using the feature; And / or generating the 3D hand skeleton data set by determining a configuration of some or all of the one or more 3D hand skeleton models, substantially corresponding to the 2D skeleton data set for which the 2D projection was generated.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 방법은 인간 손의 요소들 간의 해부학적 관계 및 제약에 적어도 부분적으로 기초하여 2D 골격 데이터 세트를 생성하는 단계를 더 포함할 수 있다.According to some embodiments of the invention, the method of interfacing humans and machines may further comprise generating a 2D skeletal data set based at least in part on anatomical relationships and constraints between elements of the human hand.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 방법은 하나 이상의 2D 골격 데이터 세트 요소에 대한 품질 속성의 판정에 적어도 부분적으로 기초하여 2D 골격 데이터 세트를 생성하는 단계를 포함할 수 있다.According to some embodiments of the invention, a method of interfacing a human and a machine may comprise generating a 2D skeletal data set based at least in part on the determination of a quality attribute for one or more 2D skeletal data set elements.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 방법은 하나 이상의 3D 손 골격 데이터세트를 저장하고, 이전에 저장된 3D 손 골격 데이터세트에적어도 부분적으로 기초하여 3D 손 골격 데이터세트를 생성하는 것에, 적어도 기초하여 3D 손 골격 데이터 세트를 생성하는 단계를 포함할 수 있다.According to some embodiments of the invention, a method of interfacing a human and a machine comprises storing one or more 3D hand skeleton datasets and generating a 3D hand skeleton dataset based at least in part on previously stored 3D hand skeleton datasets. And generating a 3D hand skeleton data set based at least on the basis.

본 발명의 일부 실시예에 따르면, 인간과 기계의 인터페이싱 방법은 모션 다이나믹 물리학 법칙을 두 개 이상의 이전에 생성된 3D 손 골격 데이터 세트에 적용함으로써 3D 손 골격 데이터 세트를 예측하고 예측된 3D 손 골격 데이터 세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하는 것에, 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하는 단계를 포함할 수 있다.According to some embodiments of the present invention, a method of interfacing a human and a machine predicts a 3D hand skeleton data set by applying a motion dynamic physics law to two or more previously generated 3D hand skeleton data sets and predicts the predicted 3D hand skeleton data. Generating a 3D hand skeleton data set based at least in part on the set, comprising generating a 3D hand skeleton data set based at least in part.

본 발명의 일부 실시예에 따르면, 하나 이상의 3D 손 골격 모델을 사용하여 3D 손 골격 데이터 세트를 생성하기 위한 회로는 손의 2D 이미지에서 손 특징을 식별하기 위한 손 특징 식별 모듈, 식별된 특징을 사용하여 손의 2D 골격 데이터 세트를 생성하기 위한 이미지 골격 형성 모듈, 및/또는 2D 투영도가 생성된 2D 골격 데이터 세트와 실질적으로 상응하는, 하나 이상의 3D 손 골격의 구성을 판정함으로써 3D 손 골격 데이터 세트를 생성하는 3D 골격 형성장치를 포함할 수 있다.According to some embodiments of the invention, circuitry for generating a 3D hand skeleton data set using one or more 3D hand skeleton models uses a hand feature identification module, identified features for identifying hand features in a 2D image of the hand. The 3D hand skeleton data set by determining an image skeleton forming module for generating a 2D skeleton data set of the hand, and / or configuration of one or more 3D hand skeletons substantially corresponding to the 2D skeleton data set for which the 2D projection was generated. It may include a 3D skeleton forming device to generate.

본 발명의 일부 실시예에 따르면, 3D 손 골격 데이터 세트를 생성하기 위한 회로의 이미지 골격 형성 모듈은 인간 손의 요소들 간의 해부학적 관계 및 제약을 사용하여 2D 골격 데이터 세트를 생성할 수 있다.According to some embodiments of the invention, the image skeletal shaping module of the circuit for generating the 3D hand skeletal data set may generate the 2D skeletal data set using anatomical relationships and constraints between elements of the human hand.

본 발명의 일부 실시예에 따르면, 이미지 골격 형성 모듈은 하나 이상의 2D 골격 데이터 세트 요소들에 대한 품질 속성을 판정할 수 있다.According to some embodiments of the invention, the image skeleton forming module may determine quality attributes for one or more 2D skeleton data set elements.

본 발명의 일부 실시예에 따르면, 3D 손 골격 데이터 세트를 생성하기 위한 회로는, 하나 이상의 이전의 3D 손 골격 데이터 세트를 저장하고, 데이터베이스 형성 모듈에 의해 이전에 저장된 하나 이상의 3D 손 골격 데이터 세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하기 위한, 골격 데이터베이스 형성 모듈을 포함할 수 있다.According to some embodiments of the present invention, a circuit for generating a 3D hand skeleton data set stores one or more previous 3D hand skeleton data sets and stores the one or more 3D hand skeleton data sets previously stored by a database forming module. And a skeleton database formation module for generating a 3D hand skeleton data set based at least in part.

본 발명의 일부 실시예에 따르면, 3D 손 골격 데이터 세트를 생성하기 위한 회로는 모션 다이나믹 물리학 법칙이 적용되는 두 개 이상의 이전의 3D 손 골격 데이터 세트에 기초하여 3D 손 골격 데이터 세트를 예측하기 위한 예측 모듈을 포함할 수 있고, 3D 골격 형성장치는 상기 예측 모듈에 의해 예측되는 바와 같이 3D 손 골격 데이터 세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터 세트를 생성하도록 구성된다.According to some embodiments of the invention, a circuit for generating a 3D hand skeleton data set is a prediction for predicting a 3D hand skeleton data set based on two or more previous 3D hand skeleton data sets to which the motion dynamic physics law is applied. And a module, wherein the 3D skeleton forming apparatus is configured to generate the 3D hand skeleton data set based at least in part on the 3D hand skeleton data set as predicted by the prediction module.

본 발명으로 여겨지는 소재는 구체적으로 제시되고, 본 명세서의 마지막 부분에서 명백하게 청구된다. 그러나, 목적, 특징 및 그의 효과와 함께 본 발명의 작동 방법 및 구성 모두는 이어지는 구체적인 설명을 첨부된 도면과 함께 읽음으로써 가장 잘 이해될 수 있다.
도 1은, 본 발명의 일부 실시예에 따른, 통신/컴퓨터 장치의 카메라에 의해 사진 찍힌 손의 삽화이며, 상기 통신/컴퓨터 장치는 손에 의해 만들어진 동작을 식별하고, 선택적으로는 식별된 손 자세 및/또는 동작에 기초하여 명령 또는 이벤트를 생성하도록 구성된 처리 로직을 포함할 수 있다.
도 2a 내지 2i는, 본 발명의 일부 실시예에 따른, 카메라에 의해 인식될 수 있고 컴퓨터 장치의 명령 및/또는 이벤트에 해당될 수 있는 예시적인 동작을 취하는 손의 사진 삽화이다.
도 3은, 본 발명의 일부 실시예에 따른, 도 2a 내지 2i에서 보여진 손의 예시적인 특징을 보여주며, 이러한 특징은 통신/컴퓨터 장치에 포함된 이미지 처리 로직에 의해 손의 이미지로부터 추출될 수 있다.
도 4는, 본 발명의 일부 실시예에 따른, 손 골격의 예시적인 구조를 보여준다.
도 5a 내지 5c는, 본 발명의 일부 실시예에 따른, 가시적 및 비가시적 손 특징으로부터 손 요소들의 위치를 추출하기 위한 예시적인 방법을 보여준다.
도 6a 내지 6d는, 본 발명의 일부 실시예에 따른, 인터페이싱 손으로부터 추출된 2D 이미지 골격의 몇몇 예시를 보여준다.
도 7a 내지 7c는, 본 발명의 일부 실시예에 따른, 상이한 자세의 몇몇 예시적인 2D 이미지 골격 및 3D 골격의 실질적으로 유사한 투영도를 보여준다.
도 8a 내지 8b는, 본 발명의 일부 실시예에 따른, 포착 카메라로부터 두 개의 상이한 거리에 위치된 손의 두 개의 2D 이미지 골격과 실질적으로 유사할 수 있는 3D 골격의 두 개의 투영도를 보여준다.
도 9a 및 9b는, 본 발명의 일부 실시예에 따른, 3D 골격 골 길이 및 품질이 최신화될 수 있도록 하는 방법 및 메커니즘을 보여주는 예이다.
도 10은, 본 발명의 일부 실시예에 따른, 손의 하나 이상의 획득한 이미지에 기초하여 손의 동작을 식별하도록 구성된 처리 모듈을 포함하는 예시적인 처리 유닛의 기능적 블록 다이어그램이다.
도 11은, 본 발명의 일부 실시예에 따른, 이미지 처리 유닛이 작동하기 위한 예시적인 방법의 단계를 포함하는 흐름도이다.
삽화의 간명성 및 명확성을 위해서, 도면에서 보여진 요소들은 척도에 맞게 필수적으로 도시되지 않았다는 것은 인정될 것이다. 예를 들어, 일부 요소들의 치수는 명확성을 위해 다른 요소들에 비해 과장될 수 있다. 나아가, 적절한 경우에, 참조 번호는 상응하거나 유사한 요소에 대해 도면 중에서 반복될 수 있다.
Materials considered to be the present invention are specifically presented and are explicitly claimed at the end of the present specification. However, all the methods and configurations of the present invention, together with the objects, features and effects thereof, can be best understood by reading the following detailed description in conjunction with the accompanying drawings.
1 is an illustration of a hand photographed by a camera of a communication / computer device, in accordance with some embodiments of the present invention, wherein the communication / computer device identifies an action made by the hand and optionally identified hand posture. And / or processing logic configured to generate an instruction or event based on the action.
2A-2I are photographic illustrations of a hand taking exemplary actions that may be recognized by a camera and correspond to commands and / or events of a computer device, in accordance with some embodiments of the present invention.
FIG. 3 shows exemplary features of the hand shown in FIGS. 2A-2I, in accordance with some embodiments of the present invention, which features may be extracted from an image of the hand by image processing logic included in a communication / computer device. have.
4 shows an exemplary structure of the hand skeleton, in accordance with some embodiments of the present invention.
5A-5C show an exemplary method for extracting the position of hand elements from visible and invisible hand features, in accordance with some embodiments of the present invention.
6A-6D show some examples of 2D image skeletons extracted from an interfacing hand, in accordance with some embodiments of the present invention.
7A-7C show substantially similar projections of some exemplary 2D image skeletons and 3D skeletons of different poses, in accordance with some embodiments of the present invention.
8A-8B show two projection views of a 3D skeleton that may be substantially similar to two 2D image skeletons of a hand located at two different distances from a capture camera, in accordance with some embodiments of the present invention.
9A and 9B are examples showing methods and mechanisms for enabling 3D skeletal bone length and quality to be updated in accordance with some embodiments of the present invention.
10 is a functional block diagram of an exemplary processing unit that includes a processing module configured to identify a motion of a hand based on one or more acquired images of the hand, in accordance with some embodiments of the present invention.
11 is a flow chart including the steps of an exemplary method for operating an image processing unit, in accordance with some embodiments of the present invention.
For simplicity and clarity of illustration, it will be appreciated that the elements shown in the drawings are not necessarily drawn to scale. For example, the dimensions of some elements may be exaggerated relative to others for clarity. Further, where appropriate, reference numerals may be repeated among the figures for corresponding or similar elements.

이어지는 발명의 실시하기 위한 구체적인 내용에서, 다양한 구체적인 내용이 본 발명의 완벽한 이해를 제공하기 위해 제시된다. 그러나, 본 발명이 이러한 구체적인 설명이 없이도 실시될 수 있을 것이라고 당해 분야의 통상의 기술자에 의해 이해될 것이다. 다른 예로서, 잘 알려진 방법, 절차, 구성요소 및 회로는 본 발명을 모호하지 않도록 구체적으로 설명되지 않는다.In the following detailed description, numerous specific details are set forth in order to provide a thorough understanding of the present invention. However, it will be understood by those skilled in the art that the present invention may be practiced without these specific details. As another example, well known methods, procedures, components and circuits have not been described in detail so as not to obscure the present invention.

특별히 다르게 제시되지 않는 한, 이어지는 논의로부터 분명하기 때문에, 명세서 전반에 걸쳐서 "처리되는", "컴퓨터로 사용되는", "계산되는", "판정되는" 등과 같은 용어를 사용하는 명세서의 논의는 컴퓨터 또는 컴퓨터 시스템의 작동 및/또는 처리, 또는 컴퓨터 시스템의 기록 내의 물리적 양으로 대표되는 데이터를 조작 및/또는 변환하고/변환하거나 컴퓨터 시스템의 메모리, 기록 장치 또는 다른 이러한 정보 저장, 전달 또는 표시 장치 내의 물리적 양으로 유사하게 대표되는 다른 데이터로 기억하는, 전자 장치와 같은 유사한 전자 컴퓨터 장치와 관련 있다.Unless expressly indicated otherwise, discussions in the specification that use terms such as “processed”, “computer-used”, “computed”, “determined”, etc., throughout the specification, are indefinite from the discussion that follows. Or in the operation and / or processing of the computer system, or in the manipulation and / or conversion of data represented by a physical quantity in a record of the computer system and / or in a memory, recording device or other such storage, transfer or display device of the computer system. It relates to a similar electronic computer device, such as an electronic device, that stores in other data similarly represented in physical quantities.

본 발명의 실시예는 본원에서의 작동을 수행하기 위한 장치를 포함할 수 있다. 이 장치는 소정의 목적을 위해 특별히 제작될 수 있거나, 이러한 장치는 컴퓨터 내에 저장된 컴퓨터 프로그램에 의해 재구성되거나 선택적으로 활성화된 일반용 컴퓨터를 포함할 수 있다. 이러한 컴퓨터 프로그램은 컴퓨터로 판독가능한 저장 매체에 저장될 수 있으며, 이러한 매체는 플로피 디스크, 광학 디스크, CD-ROM, 마그네틱 광 디스크, 읽기 전용 디스크(ROM), 임의 추출 기억 장치(RAM), 전기적으로 프로그램 가능 읽기용 기억 장치(EPROM), 전기적으로 소거 및 프로그램 가능 읽기 전용 메모리(EEPROM), 마그네틱 또는 광 카드, 또는 전자 지시를 저장하기에 적합하고 컴퓨터 시스템 버스에 결합시킬 수 있는 임의의 다른 유형의 매체를 포함하는 임의의 유형의 디스크이며, 이에 제한되지 않는다.Embodiments of the invention may include apparatus for performing the operations herein. The device may be specially manufactured for a given purpose, or the device may include a general purpose computer reconfigured or selectively activated by a computer program stored in the computer. Such computer programs may be stored in a computer readable storage medium, which may be a floppy disk, an optical disk, a CD-ROM, a magnetic optical disk, a read-only disk (ROM), a random extraction memory (RAM), or electrically Programmable read memory (EPROM), electrically erasable and programmable read-only memory (EEPROM), magnetic or optical cards, or any other type suitable for storing electronic instructions and capable of being coupled to a computer system bus Any type of disc that includes a medium, but is not limited to such.

본원에서 제시된 프로세스 및 디스플레이는 임의의 특정 컴퓨터 또는 다른 장치에 선천적으로 관련되지 않는다. 다양한 일반용 시스템이 본원의 교시에 따른 프로그램과 함께 사용될 수 있거나, 소정의 방법을 수행하기 위해서 더 특별한 장치를 제작하기 편리하다는 것을 입증할 수 있다. 다양한 이러한 시스템을 위한 소정의 구조는 하기 설명으로부터 나타난다. 추가적으로, 본 발명의 실시예는 임의의 특정 프로그래밍 언어를 참조하여 설명되지 않는다. 다양한 프로그래밍 언어는 본원에서 설명된 발명의 교시를 시행하기 위해 사용될 수 있다고 인정될 것이다.The processes and displays presented herein are not inherently related to any particular computer or other device. Various general purpose systems may be used with the programs in accordance with the teachings herein, or may prove convenient to fabricate more specialized devices to perform certain methods. Certain structures for various such systems appear from the description below. In addition, embodiments of the present invention are not described with reference to any particular programming language. It will be appreciated that various programming languages may be used to practice the teachings of the invention described herein.

본 발명은 손동작 및/또는 신체 비접촉을 통한 인간과 기계의 인터페이싱을 위한 시스템 및 방법 회로이다. 본원에서 설명된 개념 및 방법은 내용을 간명하게 유지하기 위해 손동작에 관해서 설명되며, 동일한 개념 및 방법은 전체 신체 움직임 감지 및/또는 다른 신체 부분의 움직임 감지에 적용될 수 있다.The present invention is a system and method circuit for interfacing a human and a machine via hand gestures and / or body contactless. The concepts and methods described herein are described with respect to hand gestures in order to keep the content simple, and the same concepts and methods can be applied to sensing whole body motion and / or motion of other body parts.

본 발명의 일부 실시예에 따르면, 손 또는 인간 신체의 상태는 판정될 수 있다. 본 발명의 일부 실시예에 따르면, 상기 상태는 카메라로부터 손/신체 거리, 이것의 공간적 배향, 및/또는 이것의 자세를 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 카메라로부터의 손, 신체 또는 신체 일부의 자세 및/또는 배향 및/또는 거리를 나타낼 수 있는 3D 골격을 추출하기 위한 이미지 처리 로직이 제공될 수 있다. 본 발명의 일부 실시예에 따르면, 카메라로부터의 손, 신체 또는 신체 일부의 자세 및/또는 배향 및/또는 방향을 나타낼 수 있는 3D 골격을 추출하기 위한 방법이 제공된다. 본 발명의 일부 실시예에 따르면, 인간의 신체 또는 인간 신체 일부의 골격을 식별하고 인간 신체 내에서 손의 3D 골격을 식별하기 위한 방법이 제공된다. According to some embodiments of the invention, the condition of the hand or the human body can be determined. According to some embodiments of the invention, the condition may include hand / body distance from the camera, its spatial orientation, and / or its pose. According to some embodiments of the present invention, image processing logic may be provided for extracting a 3D skeleton that may represent the posture and / or orientation and / or distance of the hand, body or body part from the camera. According to some embodiments of the present invention, a method is provided for extracting a 3D skeleton that can represent a posture and / or orientation and / or orientation of a hand, body or body part from a camera. According to some embodiments of the invention, a method is provided for identifying a skeleton of a human body or part of a human body and for identifying a 3D skeleton of a hand within the human body.

본 발명의 일부 실시예에 따르면, 카메라가 제공되며, 그 카메라의 정면에는 기계와 인터페이싱할 수 있는 인간의 손과 같은 대상물이 있을 수 있다. 본 발명의 일부 실시예에 따르면, 카메라의 정면에 있는 손은 손동작을 수행함으로써 기계와 인터페이싱할 수 있다. 본 발명의 일부 실시예에 따르면, 카메라는 인터페이싱 손의 하나 또는 일련의 이미지를 포착할 수 있다. 본 발명의 일부 실시예에 따르면, 카메라는 기계와 의도적으로 인터페이싱하는 사용자의 손과 같은 인터페이싱된 대상물의 이미지 내에서 하나 이상의 특징, 요소, 지골 및/또는 관절의 공간적 위치를 추정하도록 구성된 이미지 처리 로직에 연결될 수 있다.According to some embodiments of the invention, a camera is provided, in front of which there may be an object such as a human hand capable of interfacing with a machine. According to some embodiments of the invention, a hand in front of the camera may interface with the machine by performing a hand gesture. According to some embodiments of the present invention, the camera may capture one or a series of images of the interfacing hands. According to some embodiments of the invention, the camera is configured to estimate the spatial location of one or more features, elements, phalanges and / or joints within an image of an interfaced object, such as a user's hand intentionally interfacing with the machine. Can be connected to.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 인터페이싱 손의 골격 대표일 수 있는 3D 골격을 만들 수 있다. 본 발명의 일부 실시예에 따르면, 3D 골격의 요소들의 치수 비율은 인터페이싱 손의 요소들의 치수 비율과 실질적으로 유사할 수 있다. 본 발명의 일부 실시예에 따르면, 3D 골격의 요소들의 치수 또는 특징은 한 유닛의 길이에 비례할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 인터페이싱 손의 이미지에서 식별된 특징 및/또는 요소에 따라 2D 이미지 골격을 만들 수 있다.According to some embodiments of the invention, the image processing logic may create a 3D skeleton that may be a skeleton representative of the interfacing hand. According to some embodiments of the invention, the dimensional ratios of the elements of the 3D skeleton may be substantially similar to the dimensional ratios of the elements of the interfacing hand. According to some embodiments of the invention, the dimensions or features of the elements of the 3D skeleton may be proportional to the length of one unit. According to some embodiments of the invention, the image processing logic may create a 2D image skeleton according to the features and / or elements identified in the image of the interfacing hand.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격의 선택적인 3D 위치를 만들 수 있고, 3D 골격의 2D 투영도를 2D 이미지 골격에 실질적으로 매칭하기 위해서 3D 골격에 제약들을 적용할 수 있다.According to some embodiments of the invention, the image processing logic may make an optional 3D position of the 3D skeleton and apply constraints to the 3D skeleton to substantially match the 2D projection of the 3D skeleton to the 2D image skeleton.

본 발명의 일부 실시예에 따르면, 3D 골격의 3D 위치의 다음 프레임에 대한 예측을 생성하기 위해서, 모션 다이나믹 물리학 법칙도 두 개 이상의 3D 골격에 적용될 수 있다.In accordance with some embodiments of the present invention, motion dynamic physics may also be applied to two or more 3D skeletons to produce predictions for the next frame of the 3D position of the 3D skeleton.

도 1은 본 발명에 따른 시스템의 예시적인 개략적 설명이다. 이 예시에 따르면, 핸드폰(3)에 구비된 카메라(2)의 정면에서 손동작을 취하는 인터페이싱 손(1)이 있을 수 있다. 도 2a 내지 2f는 상이한 자세의 인터페이싱 손의 예시적 이미지를 보여준다.1 is an exemplary schematic illustration of a system according to the invention. According to this example, there may be an interfacing hand 1 which makes a hand gesture in front of the camera 2 provided in the cellular phone 3. 2A-2F show exemplary images of interfacing hands in different postures.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 손가락, 손끝, 손톱, 손가락 지문, 손바닥 지문, 손가락 관절, 뿐만 아니라 다른 특징과 같은 인터페이싱 손의 특징을 검출할 수 있다.According to some embodiments of the invention, the image processing logic may detect features of the interfacing hand such as fingers, fingertips, fingernails, finger prints, palm prints, finger joints, as well as other features.

도 3은 도 2a 내지 2f에서 보여진 예시적인 인터페이싱 손의 예시적인 특징을 보여준다. 이 도면에서, 4, 5, 6, 7 및 8에서는 엄지 손가락, 검지 손가락, 중지 손가락, 약지 손가락 및 새끼 손가락을 각각 보여줄 수 있다. 9, 10, 11, 12 및 13에서는 엄지 손가락, 검지 손가락, 중지 손가락, 약지 손가락 및 새끼 손가락의 손끝을 각각 보여줄 수 있다. 14, 15, 16, 17 및 18은 손가락의 지문을 보여줄 수 있다. 19 및 20은 검지 손가락 및 새끼 손가락이 손바닥에 연결되는 곳의 지문을 보여줄 수 있다. 21, 22는 검지 손가락의 지골에 대한 접선을 보여줄 수 있다.3 shows example features of the example interfacing hands shown in FIGS. 2A-2F. In this figure, 4, 5, 6, 7 and 8 can show thumb, index finger, middle finger, ring finger and little finger respectively. In 9, 10, 11, 12 and 13, the fingertips of the thumb, index finger, middle finger, ring finger and little finger can be shown, respectively. 14, 15, 16, 17 and 18 can show the fingerprint of a finger. 19 and 20 can show fingerprints where the index finger and pinkie are connected to the palm. 21 and 22 may show a tangent to the phalanges of the index finger.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 메모리를 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 손 골격의 일반적 구조를 메모리에 저장할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 인간 신체 골격의 일반적 구조를 메모리에 저장할 수 있다.According to some embodiments of the invention, the image processing logic may comprise a memory. According to some embodiments of the invention, the image processing logic may store the general structure of the hand skeleton in a memory. According to some embodiments of the invention, the image processing logic may store the general structure of the human body skeleton in a memory.

본 발명의 일부 실시예에 따르면, 메모리에 저장된 3D 손 골격의 일반적 구조는 벡터로서 설명될 수 있으며, 여기서 벡터의 일부 프리미티브(primitives)는 손의 골격의 파라미터(예, 길이)를 설명하고, 벡터의 일부 프리미티브는 골 프리미티브들 간의 다이나믹 관계(예, 각도)를 나타내는 관절의 파라미터를 설명한다.According to some embodiments of the invention, the general structure of a 3D hand skeleton stored in memory can be described as a vector, where some primitives of the vector describe a parameter (eg, length) of the hand skeleton, and the vector Some of the primitives describe a parameter of the joint that represents a dynamic relationship (eg, angle) between the bone primitives.

도 4는 본 발명의 일부 실시예에 따른 손 골격의 일부 구조의 예를 보여준다. 이 예시에 따르면, 손 골격은 b, c, d, e...u에 의해 연결된 관절/손끝 A,B C...U로 제작된다.4 shows an example of some structures of the hand skeleton in accordance with some embodiments of the present invention. According to this example, the hand skeleton is made of joints / fingertips A, B C ... U connected by b, c, d, e ... u.

어린 아이의 손이 가장 작고 성장한 사람의 손이 가장 크며, 그리고 기계와 인터페이싱하는 손은, 손이 카메라에 가까워지면 손의 이미지는 커지고, 손이 카메라로부터 멀어지면 손의 이미지가 작아지는 방식으로 카메라로부터 상이한 거리에 있을 수 있기 때문에, 사람의 손의 치수는 어느 한도 내에 있다. 따라서, 인터페이싱 손의 이미지는 사람의 나이 및 카메라로부터 손의 거리에 따른 상이한 크기일 수 있지만, 주어진 인터페이싱 손의 상이한 특징 및/또는 요소의 치수 비율은 카메라 또는 그의 배향으로부터 손의 거리에 상관없이 일정하게 유지된다. 그러므로, 손의 제 1 특징 및/또는 요소의 주어진 길이, 손의 모든 다른 특징 및/또는 요소의 길이는 제 1 특징 및/또는 요소에 관하여 정의될 수 있다. 예를 들어, 도 4에서 골 b는 제 1 요소로 정의될 수 있으며, 골 c의 길이는 k1*길이(b)일 수 있고, 골 d의 길이는 k2*길이(b) 등일 수 있다.The youngest child's hand is the smallest, the grown person's hand is the largest, and the hand that interfaces with the machine has the camera in such a way that the image of the hand becomes larger as the hand approaches the camera, and the image of the hand becomes smaller as the hand moves away from the camera. Since they may be at different distances from, the dimensions of the human hand are within any limits. Thus, the image of the interfacing hand may be of different sizes depending on the age of the person and the distance of the hand from the camera, but the dimensional ratio of the different features and / or elements of a given interfacing hand is constant regardless of the distance of the hand from the camera or its orientation. Is maintained. Therefore, the first feature of the hand and / or the given length of the element, all other features of the hand and / or the length of the element can be defined with respect to the first feature and / or element. For example, in Figure 4, the bone b may be defined as the first element, the length of the bone c may be k1 * length (b), the length of the bone d may be k2 * length (b) and the like.

본 발명의 일부 실시예에 따르면, 인터페이싱 손은 메모리에 저장된 일반적인 구조 3D 골격에 의해 견본이 만들어질 수 있다. 본 발명의 일부 실시예에 따르면, 3D 골격의 손 객체(예, 손바닥 관절로부터 손끝까지의 검지 손가락의 골의 길이, 특정 골의 길이, 또는 몇몇 골의 길이들의 합)를 나타내는 특정 지정된 골의 길이는 하나의 유닛 길이로 정의될 수 있다. 본 발명의 일부 실시예에 따르면, 3D 골격의 골/손-객체의 길이는 지정된 골/손-객체에 비례하여 정의될 수 있다.According to some embodiments of the present invention, the interfacing hand may be sampled by a general structural 3D skeleton stored in memory. According to some embodiments of the invention, the length of a particular designated bone representing a hand object of the 3D skeleton (eg, the length of the bone of the index finger from the palm joint to the fingertip, the length of a particular bone, or the sum of the lengths of several bones) May be defined as one unit length. According to some embodiments of the invention, the length of the bone / hand-object of the 3D skeleton may be defined in proportion to the designated bone / hand-object.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 손의 이미지, 골의 상대적 길이로부터 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 골 길이 및/또는 카메라로부터 손의 거리를 추정할 수 있다. 손 배향 및 자세, 숨겨진 손 요소(hidden hand elements) 등과 같은 이미지 내의 다양한 인자 때문에, 일부 추정된 길이의 확실성 수준은, 이미지 내 명확하게 나타나는 요소들의 길이의 확실성 수준보다 작을 수 있다.According to some embodiments of the invention, the image processing logic may be estimated from the image of the hand, the relative length of the bone. According to some embodiments of the invention, the image processing logic may estimate bone length and / or hand distance from the camera. Because of various factors in the image, such as hand orientation and posture, hidden hand elements, and the like, the certain level of certainty of length may be less than the level of certainty of the length of elements that appear clearly in the image.

본 발명의 일부 실시예에 따르면, 3D 골격 백터는 각각의 골과 관련된 속성들을 가질 수 있고, 메모리에 저장된다. 본 발명의 일부 실시예에 따르면, 골 속성은 골의 상대적 길이를 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 골 속성은 길이 품질을 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 골 속성은 품질 강인성/확실성을 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 골 속성은 다른 골에 대한 각도 의존성을 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 각도 의존성은 계층적(hierarchical)일 수 있다.According to some embodiments of the invention, the 3D skeletal vector may have attributes associated with each bone and are stored in memory. According to some embodiments of the invention, the bone attribute may include the relative length of the bone. According to some embodiments of the invention, the bone attribute may comprise length quality. According to some embodiments of the invention, the bone attribute may include quality toughness / assurance. According to some embodiments of the present invention, bone attributes may include angular dependence on other bones. According to some embodiments of the present invention, the angle dependency may be hierarchical.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 메모리 내에 손 골격의 이차원(2D) 일반적인 구조일 수 있는 이미지 골격을 저장할 수도 있다. 본 발명의 일부 실시예에 따르면, 메모리 내에 저장된 2D 이미지 골격은 손 골 및 관절을 대표하는 프리미티브로 구성되는 백터로서 설명될 수 있다. 본 발명의 일부 실시예에 따르면, 백터 관절 프리미티브는 평면상의 점으로 설명될 수 있으며, 각각의 점들은 2차원 좌표(x,y)들을 가진다. 본 발명의 일부 실시예에 따르면, 백터 프리미티브는 다른 백터 프리미티브 (관절)에 대해 프리미티브 (관절) 연결 (골)을 대표하는 속성을 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 2D 골격 백터는 각각의 프리미티브와 연관된 2D(x,y) 좌표 세트를 가질 수 있고, 메모리에 저장된다. 본 발명의 일부 실시예에 따르면, 프리미티브(x,y) 좌표는 손 이미지로부터 추출될 수 있다.According to some embodiments of the invention, the image processing logic may store in the memory an image skeleton that may be a two-dimensional (2D) general structure of the hand skeleton. According to some embodiments of the invention, a 2D image skeleton stored in memory may be described as a vector consisting of primitives representing the hand bones and joints. According to some embodiments of the invention, the vector joint primitive may be described as a point on a plane, each point having two-dimensional coordinates (x, y). According to some embodiments of the invention, the vector primitives may include attributes representing primitive (joint) connections (bones) relative to other vector primitives (joints). According to some embodiments of the invention, an image 2D skeletal vector may have a set of 2D (x, y) coordinates associated with each primitive and stored in memory. According to some embodiments of the invention, primitive (x, y) coordinates may be extracted from the hand image.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 포착된 이미지에서 관절, 손끝 및 손의 지골의 2차원 위치를 추정할 수 있다. 본 발명의 일부 실시예에 따르면, 관절, 손끝 및 지골의 위치는 검출된 손 특징을 분석함으로써 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 관절의 위치는 손가락의 주름의 위치에 따라 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 관절의 위치는 손가락의 두 개의 부분에 대한 접선인 두 개의 선의 교차 위치에 따라 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 지골의 위치는 두 개의 인접한 관절과 직선을 연결함으로써 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 지골의 위치는 이미지 내 지골을 식별함으로써 추정될 수 있다. 본 발명의 일부 실시예에 따르면, 지골의 위치는 이미지에서 지골의 일부를 식별하고, 나머지 지골을 내삽(interpolating) 및/또는 외삽(extrapolating)함으로써 추정될 수 있다.According to some embodiments of the invention, the image processing logic may estimate the two-dimensional position of the joint, fingertip, and phalanges of the hand in the captured image. According to some embodiments of the invention, the position of the joints, fingertips and phalanges can be estimated by analyzing the detected hand features. According to some embodiments of the invention, the position of the joint may be estimated according to the position of the wrinkles of the fingers. According to some embodiments of the invention, the position of the joint may be estimated according to the intersection position of two lines which are tangent to two parts of the finger. According to some embodiments of the invention, the location of the phalanges can be estimated by connecting a straight line with two adjacent joints. According to some embodiments of the invention, the location of the phalanges can be estimated by identifying the phalanges in the image. According to some embodiments of the invention, the location of the phalanges can be estimated by identifying a portion of the phalanges in the image and interpolating and / or extrapolating the remaining phalanges.

도 5a 내지 5c는 손의 이미지의 일부 예시를 보여준다. 도 5a의 예시에 따르면, 관절 J1의 위치는 주름 C1에 따라 추정될 수 있다. 선 L0 및 L1은 지골 P1에 대한 접선일 수 있고, 선 L2는 선 L0 및 L1 사이의 중간일 수 있고 지골 P1의 중심을 대표할 수 있다. 선 L3 및 L4는 지골 P2에 대한 접선일 수 있고, 선 L5는 선 L3 및 L4 사이의 중간일 수 있고 지골 P2의 중심을 대표할 수 있다. 관절 J2는 선 L2 및 선 L5의 교차 지점에 따라 추정될 수 있다. 도 5c에서, 관절 J6의 위치는, 검지 손가락의 뒤에 가려져서 이미지에서 보여지지 않지만, 선 L6 및 선 L7의 교차 지점에 따라 추정될 수 있다. 도 5b에서, 지골 P3의 위치는 부분 P3.1 P3.2를 내삽함으로써 추정될 수 있다.5A-5C show some examples of images of hands. According to the example of FIG. 5A, the position of the joint J1 may be estimated according to the wrinkle C1. Lines L0 and L1 may be tangent to the phalanges P1, and line L2 may be intermediate between lines L0 and L1 and may represent the center of the phalanges P1. Lines L3 and L4 can be tangent to the phalanges P2, and line L5 can be intermediate between lines L3 and L4 and can represent the center of the phalanges P2. Joint J2 can be estimated according to the intersection of lines L2 and L5. In FIG. 5C, the position of the joint J6 is hidden behind the index finger and is not shown in the image, but can be estimated according to the intersection of the lines L6 and L7. In FIG. 5B, the location of the phalanges P3 can be estimated by interpolating the portions P3.1 P3.2.

본 발명의 일부 실시예에 따르면, 보이지 않는 손 요소(지골 및 관절)의 위치는 보이는 손 요소 및 보이고 보이지 않는 요소 간의 계층적 관계에 따라 추정될 수 있다.According to some embodiments of the present invention, the position of the invisible hand elements (bones and joints) can be estimated according to the hierarchical relationship between the visible hand elements and the invisible elements.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 2D 이미지 골격 백터의 상응하는 프리미티브에 관절 및 손끝의 추정된 이차원 위치를 부여할 수 있다. 일부 관절의 2D 위치가 더 정확히 추정될 수 있고 다른 관절의 위치가 덜 정확히 추정될 수 있기 때문에, 본 발명의 일부 실시예에 따르면, 프리미티브 좌표는 프리미티브 위치 품질 속성을 포함할 수 있다. 도 6a 내지 6d는 인터페이싱 손으로부터 추출된 이미지 골격의 몇몇 예시이다.According to some embodiments of the invention, the image processing logic may assign the estimated two-dimensional positions of the joints and fingertips to the corresponding primitives of the 2D image skeletal vector. According to some embodiments of the present invention, primitive coordinates may include primitive position quality attributes because the 2D position of some joints may be estimated more accurately and the position of other joints may be estimated less accurately. 6A-6D are some examples of image skeletons extracted from an interfacing hand.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격의 2D 투영도가 2D 이미지 골격과 실질적으로 유사한 공간적 위치로 3D 골격을 위치시킬 수 있다. 도 7a 내지 7c 모두는 예시적인 2D 이미지 골격 A, 및 3D 골격의 몇몇 상이한 자세 B, C 및 D를 보여준다. 3D 골격 자세(B, C, D)의 이차원 투영도 E는 2D 골격 A와 실질적으로 유사할 수 있다.According to some embodiments of the invention, the image processing logic may position the 3D skeleton in a spatial position substantially similar to the 2D image skeleton of the 2D image skeleton of the 3D skeleton. 7A-7C all show exemplary 2D image skeleton A, and several different poses B, C, and D of the 3D skeleton. The two-dimensional projection E of the 3D skeletal pose (B, C, D) may be substantially similar to the 2D skeletal A.

인간 손의 손가락은 손바닥의 안쪽으로 오직 한 방향으로 모든 세 개의 관절이 굽어질 수 있다. 손가락은 손끝에 인접한 두 개의 관절에서 측방향으로 굽어질 수 없고, 손바닥으로 손가락을 연결하는 관절에서의 측방향 움직임은 제한된다. 또한, 손가락은 세 개의 관절 모두에서 뒤쪽으로 굽어질 수 없다. 손가락은 그의 관절 중 어느 것의 둘레로 회전될 수 없다. 각각의 지골은 그것이 연결되는 손목에 인접한 지골에 대하여 각각의 공간적 방향으로 굽어질 수 있는 특정 각도를 가질 수 있다. 본 발명의 일부 실시예에 따르면, 관절 속성은 관절의 해부학적 제약을 포함할 수 있다. 본 발명의 일부 실시예에 따르면, 관절의 해부학적 제약은 각각의 공간적 방향으로의 각도를 포함할 수 있다는 것이며, 여기서 손바닥의 관절 상에 연결되는 골이 손바닥에 인접한 골에 대하여 굽어질 수 있다. 본 발명의 일부 실시예에 따르면, 각도는 손바닥에 인접한 다른 관절에서의 각도 및 골의 길이에 의존할 수 있다.The fingers of a human hand can bend all three joints in only one direction into the inside of the palm. The finger cannot be bent laterally at the two joints adjacent to the fingertip, and the lateral movement at the joint connecting the finger with the palm is limited. Also, the fingers cannot be bent backwards in all three joints. The finger cannot be rotated around any of its joints. Each phalanx can have a specific angle that can be bent in each spatial direction relative to the phalanx adjacent to the wrist to which it is connected. According to some embodiments of the present invention, the joint properties may include anatomical constraints of the joints. According to some embodiments of the invention, the anatomical constraints of the joints may include angles in each spatial direction, wherein bones connected on the joints of the palms may be bent relative to bones adjacent to the palms. According to some embodiments of the invention, the angle may depend on the length of the bone and the angle at another joint adjacent the palm.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격의 관절에 관절 제약을 적용할 수 있다. 본 발명의 일부 실시예에 따르면, 제약을 실질적으로 충족할 수 있는 3D 공간적 자세 및 위치로 3D 골격이 있을 수 있다. 2D 이미지 골격과 실질적으로 매칭되는 2D 투영된 골격을 갖는 3D 골격의 공간적 위치는, 카메라로부터 손의 상대적 거리를 판정할 수도 있다.According to some embodiments of the invention, the image processing logic may apply joint constraints to the joints of the 3D skeleton. According to some embodiments of the invention, there may be a 3D skeleton in 3D spatial pose and position that may substantially meet the constraints. The spatial location of the 3D skeleton with the 2D projected skeleton substantially matching the 2D image skeleton may determine the relative distance of the hand from the camera.

도 8a 내지 8b는 도 4에 도시된 3D 골격의 두 개의 상이한 2D 투영된 이미지를 보여준다. 도 8a의 골격은 카메라에 인접한 도 4의 골격의 투영된 이미지이고, 도 8b의 골격은 카메라로부터 떨어진 도 4의 골격의 투영된 이미지이다.8A-8B show two different 2D projected images of the 3D skeleton shown in FIG. 4. The skeleton of FIG. 8A is a projected image of the skeleton of FIG. 4 adjacent to the camera, and the skeleton of FIG. 8B is a projected image of the skeleton of FIG. 4 away from the camera.

카메라는, 동작하는 인터페이싱 손의 일련의 이미지를 포착할 수 있다. 각각의 이미지는 이미지가 포착되는 속도, 손이 움직이는 속도, 카메라로부터 손의 거리, 및 카메라의 해상도에 따라서 이전의 사진과 어느 정도 상이할 수 있다. 각각의 포착된 이미지에 기초하여, 이미지 처리 로직은 3D 골격의 공간적 위치, 배향, 거리 및 자세를 추정할 수 있다. 각각의 3D 골격은 이미지가 포착되는 속도, 손이 움직이는 속도, 카메라로부터 손의 거리, 및 카메라의 해상도에 따라서 이전의 사진과 어느 정도 상이할 수 있다.The camera can capture a series of images of the operating interfacing hands. Each image may be somewhat different from the previous picture depending on the speed at which the image is captured, the speed at which the hand moves, the distance of the hand from the camera, and the resolution of the camera. Based on each captured image, the image processing logic can estimate the spatial position, orientation, distance and pose of the 3D skeleton. Each 3D skeleton may be somewhat different from the previous picture depending on the speed at which the image is captured, the speed at which the hand moves, the distance of the hand from the camera, and the resolution of the camera.

두 개 이상의 이전의 이미지로부터 유래된 두 개 이상의 이전의 3D 골격은 모션 다이나믹 물리학 법칙에 기초하여 현재 3D 골격을 계산하고 예측하는데에 사용될 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 모션 다이나믹 물리학 법칙을 사용하여 두 개 이상의 이전에 3D 골격에 기초하여 현재 3D 골격을 예측할 수 있다. 본 발명의 일부 실시예에 따르면, 예측된 3D 골격은 제약을 실질적으로 충족할 수 있는 방식으로 공간적으로 자세를 취하고 위치될 수 있다.Two or more previous 3D skeletons derived from two or more previous images can be used to calculate and predict the current 3D skeleton based on the laws of motion dynamics physics. According to some embodiments of the invention, the image processing logic may predict the current 3D skeleton based on two or more previously 3D skeletons using motion dynamic physics laws. According to some embodiments of the invention, the predicted 3D skeleton can be spatially positioned and positioned in a manner that can substantially meet the constraints.

본 발명의 일부 실시예에 따르면, 현재 3D 골격은 예측될 수 있다. 예측된 현재 3D 골격은 골격의 2D 투영도가 2D 이미지 골격과 실질적으로 동일할 수 있고 제약을 충족하는 골격을 만들도록 공간적으로 재배치될 수 있다. 본 발명에 일부 실시예에 따르면, 이미지 처리 로직은 모션 다이나믹 물리학 법칙에 기초하여 현재 3D 골격을 예측하기 위해 두 개 이상의 이전의 3D 골격을 사용할 수 있다. 본 발명의 일부 실시예에 따르면, 예측된 3D 골격은, 그의 2D 투영도가 2D 이미지 골격과 실질적으로 동일할 수 있는 3D 골격을 만들기 위해서, 제약을 충족하는 방식으로 최소한으로 자세를 다시 잡을 수 있다.According to some embodiments of the invention, the current 3D skeleton can be predicted. The predicted current 3D skeleton may be spatially rearranged to create a skeleton that meets constraints and the 2D projection of the skeleton may be substantially the same as the 2D image skeleton. According to some embodiments of the present invention, the image processing logic may use two or more previous 3D skeletons to predict the current 3D skeleton based on the laws of motion dynamic physics. According to some embodiments of the present invention, the predicted 3D skeleton can be repositioned to a minimum in a manner that satisfies the constraints to create a 3D skeleton whose 2D projection can be substantially the same as the 2D image skeleton.

손 이미지로부터 추출된 2D 이미지 골격의 요소의 데이터 품질은 판정될 수 있다. 예를 들어: 다른 요소의 뒤에 부분적으로 가려진 요소들은 카메라에 완전히 보여지는 요소에 비해 더 낮은 품질 점수를 가질 수 있다. 저조하게 식별된 요소들은 명확하게 식별된 요소에 비해 낮은 품질 점수를 가질 것이다. 카메라를 향해 지시하는 요소들은 카메라를 마주하는 요소에 비해 더 낮은 품질 점수를 가질 수 있다. 3D 골격을 설명하는 백터에서 각각의 골은 길이와 같은 것에 관련된 속성; 및 골의 길이 값의 데이터 품질을 판정할 수 있는 품질 점수 속성과 같은 몇몇 속성을 가질 수 있다. 3D 골격의 골의 길이는 2D 이미지 골격에서 상응하는 골격의 길이로부터 판정될 수 있다. 3D 골격의 골 길이 품질은 2D 이미지 골격에 대응하는 골의 길이의 정확성으로부터 판정될 수 있다.The data quality of the elements of the 2D image skeleton extracted from the hand image can be determined. For example: Elements that are partially hidden behind other elements may have lower quality scores than elements that are completely visible to the camera. Poorly identified elements will have lower quality scores than clearly identified elements. Elements pointing towards the camera may have lower quality scores than elements facing the camera. In the vector describing the 3D skeleton each bone has attributes related to things such as length; And a quality score attribute that can determine the data quality of the bone's length value. The length of the bone of the 3D skeleton can be determined from the length of the corresponding skeleton in the 2D image skeleton. The bone length quality of the 3D skeleton can be determined from the accuracy of the length of the bone corresponding to the 2D image skeleton.

본 발명의 일부 실시예에 따르면, 인터페이싱 손은 움직이거나 동작을 취할 수 있다. 카메라는 상이한 방향 및 자세의 인터페이싱 손의 이미지를 포착할 수 있으며, 이는 3D 골격 골의 길이의 데이터 품질을 시간이 지남에 따라 개선할 수 있도록 하며, 예를 들어, 만일 동일한 골의 길이가 인터페이싱 손의 몇몇 배향으로부터 판정되면, 그 골의 품질 점수는 증가될 수 있다. 만일 제약을 매칭하는 3D 골격의 2D 투영도 및 인터페이싱 손의 이미지로부터 추출된 2D 골격(2D 이미지 골격) 사이의 골 길이에서 차이가 존재하면, 및/또는 만일 이미지(2D 이미지 골격)로부터 추출된 2D 골격의 골에 비해 낮은 품질을 가질 수 있는 3D 골격의 골이 있다면, 낮은 품질을 갖는 3D 골격의 품질 및/또는 골 길이는 더 높은 품질 점수를 갖는 2D 이미지 골격의 상응하는 골의 품질 값 및/또는 길이에 따라 최신화될 수 있다.According to some embodiments of the invention, the interfacing hand may move or take action. The camera can capture images of interfacing hands in different directions and postures, which allows to improve the data quality of the length of the 3D skeletal bones over time, for example, if the same bone lengths are interfacing hands. Determined from several orientations of, the quality score of that goal can be increased. If there is a difference in bone length between the 2D projection of the 3D skeleton matching the constraint and the 2D skeleton (2D image skeleton) extracted from the image of the interfacing hand, and / or the 2D skeleton extracted from the image (2D image skeleton) If there are bones in the 3D skeleton that may have a lower quality compared to the bones of, then the quality and / or bone length of the 3D skeleton with lower quality is the quality value of the corresponding bone of the 2D image skeleton with the higher quality score and / or It can be updated according to length.

도 9a는 3D 골 길이 품질 개선의 예시를 보여준다. 도 9a의 예시에서, 골 75는 불확실한 길이를 갖는 3D 골격 골일 수 있다. 골 75는 관절 70에서 시작하고 관절 71과 관절 72 사이의 임의의 곳인 불확실한 길이로 끝날 수 있다. 골 76은 2D 이미지 골격 내 골 75에 대응하는 골일 수 있다. 골 76은 불확실한 길이를 가질 수 있으며, 상기 골 76은 관절 62에서 시작하고 관절 77과 관절 78 사이의 임의의 곳에서 끝날 수 있다. 골 75는 다수의 공간적 배향으로 위치될 수 있으며, 이것들의 2D 투영도는 상응하는 2D 이미지 골격의 골을 매칭할 수 있다. 도 9a에서, 골 75는 배향 63, 64, 65, 66 및 81을 가질 수 있다고 보여진다. 상기 배향 모두에서 골 75의 이차원 투영도는 골 76의 경계 내에 있을 수 있다. 이차원 투영도는 골 76에 비해 짧을 수 있기 때문에, 골 75의 배향 82 및 63은 유효한 배향이 아닐 수도 있다. 도 9a에서 볼 수 있듯이, 골 75의 모든 유효한 배향(63, 64, 65, 66, 81)에서, 골 75는, 선 67 및 68 사이에서 골 76의 불확실성 창문 경계(window boundary) 내에 있기 위하여, 관절 83으로부터 원호 69까지의 거리에 비해 더 길어질 필요성이 있으며, 원호 69의 아랫부분은 골 76의 불확실성 경계 내에 절대 포함되지 않을 수 있다. 그러므로, 골 75 길이의 불확실성의 하부 경계는 개선되고 최신화될 수 있고, 관절 71은 79로 전환될 수 있다. 골 75의 배향 63 및 64에서, 골의 전체 길이는 불확실성 경계 내에 포함되므로, 관절 72는 개선되지 않을 수 있고 관절 80으로 남겨질 수 있다. 결과는, 골 75 길이의 불확실성 수준은 관절 71 및 72 사이의 거리로부터 관절 79 및 80 사이의 더 짧은 거리로 감소될 수 있다.9A shows an example of 3D bone length quality improvement. In the example of FIG. 9A, the bone 75 may be a 3D skeletal bone with an uncertain length. The bone 75 may begin at joint 70 and end at an uncertain length, anywhere between joints 71 and 72. The bone 76 may be a bone corresponding to the bone 75 in the 2D image skeleton. The bone 76 can have an uncertain length, which can start at joint 62 and end anywhere between joint 77 and joint 78. The valleys 75 can be located in multiple spatial orientations, and their 2D projections can match the valleys of the corresponding 2D image skeleton. In FIG. 9A, it is seen that valley 75 can have orientations 63, 64, 65, 66, and 81. The two-dimensional projection of valley 75 in all of the above orientations may be within the boundary of valley 76. Since the two-dimensional projection can be short compared to the valleys 76, the orientations 82 and 63 of the valleys 75 may not be effective orientations. As can be seen in FIG. 9A, in all valid orientations of valley 75 (63, 64, 65, 66, 81), valley 75 is within the uncertainty window boundary of valley 76 between lines 67 and 68, There is a need to be longer than the distance from joint 83 to arc 69, and the lower portion of arc 69 may never be included within the uncertainty boundary of valley 76. Therefore, the lower boundary of uncertainty of bone 75 length can be improved and updated, and joint 71 can be converted to 79. In the orientations 63 and 64 of the valley 75, the total length of the valley is included within the uncertainty boundary, so that the joint 72 may not be improved and may be left as the joint 80. The result is that the level of uncertainty of bone 75 length can be reduced from the distance between joints 71 and 72 to a shorter distance between joints 79 and 80.

또 다른 예는 도 9b에 도시되며, 이 예에서, 3D 골격의 골 75는 관절 70에서 시작하고 관절 71 및 72 사이의 불확실한 위치에서 끝나는 불확실한 길이를 가질 수 있다. 골 76은 골 75에 대하여 이미지 골격에서 대응하는 골일 수 있다. 골 76은 불확실한 길이를 가질 수 있으며, 이것은 관절 62에서 시작하고 관절 77과 관절 78 사이의 임의의 지점에서 끝날 수 있다. 골 75는 나머지 골격(도면에서 도시되지 않은 것)에 대한 공간적 배향을 제한할 수 있는 제약을 가질 수 있다. 도 9b에서 도시된 예시에서, 골 75는 배향 65 및 배향 66 사이에서 다수의 배향으로 위치될 수 있다. 도면에서 볼 수 있듯이, 원호 69 및 원호 74 사이의 골의 부분은 선 67 및 68 사이의 골 76의 불확실성 경계 내에 포함될 수 있다. 관절 83 및 원호 69 사이의 골의 부분, 및 원호 69 위의 골의 부분은 골 76 불확실성 경계의 밖에 있다. 그러므로, 골 75의 불확실성 길이는 감소될 수 있으며, 관절 71은 79로 전환될 수 있고, 관절 72는 80으로 전환될 수 있다. 결과는, 골 75 길이의 불확실성 수준이 관절 71 및 72 사이의 길이로부터 관절 79 및 80 사이의 더 짧은 길이로 감소될 수 있다는 것이다.Another example is shown in FIG. 9B, where the bone 75 of the 3D skeleton may have an uncertain length starting at joint 70 and ending at an uncertain position between joints 71 and 72. The valley 76 may be a corresponding valley in the image skeleton with respect to valley 75. The valley 76 can have an uncertain length, which can begin at joint 62 and end at any point between joint 77 and joint 78. The valley 75 may have constraints that can limit the spatial orientation with respect to the rest of the skeleton (not shown in the figure). In the example shown in FIG. 9B, the valley 75 can be positioned in multiple orientations between orientation 65 and orientation 66. As can be seen in the figure, the portion of the valley between arc 69 and arc 74 can be included within the uncertainty boundary of valley 76 between lines 67 and 68. The portion of the bone between the joints 83 and arc 69, and the portion of the bone above arc 69, is outside the bone 76 uncertainty boundary. Therefore, the uncertainty length of bone 75 can be reduced, joint 71 can be converted to 79, and joint 72 can be converted to 80. The result is that the level of uncertainty of bone 75 length can be reduced from the length between joints 71 and 72 to the shorter length between joints 79 and 80.

동작을 취하는 손이 카메라의 정면으로 움직이면, 카메라는 상이한 배향 및 자세에서 손의 이미지를 획득할 수 있다. 본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 최신화될 수 있고, 골 길이의 품질을 개선할 수 있다.As the hand taking action moves in front of the camera, the camera can acquire images of the hand in different orientations and postures. According to some embodiments of the present invention, image processing logic can be updated and improve the quality of bone length.

사람의 손의 골 길이가 서로 간에 비례하기 때문에, 손은 예를 들어 중지 손가락에 비해 더 긴 검지 손가락을 가질 수 없으며, 3D 골격 골의 길이는 각 부분간에 특정 비율의 제한 내에 있다는 제약이 있을 수 있다. 그러므로, 만일 예를 들어, 중지 손가락에 상응하는 3D 골격의 골이 길이 속성 및 높은 품질 점수(낮은 붙확실성)을 갖고, 검지 손가락에 상응하는 3D 골격의 골이 길이 속성 및 낮은 품질 점수(높은 불확실성)를 가져서, 검지 손가락에 상응하는 골이 중지 손가락에 상응하는 골보다 더 길 수 있다면, 검지 손가락에 상응하는 골의 품질 속성은 개선되고 불확실성은 검지 손가락에 상응하는 골이 중지 손가락에 상응하는 골 보다 더 길지 않는 수준으로 감소될 수 있다.Since the bone length of a human hand is proportional to each other, the hand may not have a longer index finger, for example, than the middle finger, and there may be a constraint that the length of the 3D skeletal bone is within certain proportional limits between the parts. have. Thus, for example, if the bone of the 3D skeleton corresponding to the middle finger has a length attribute and a high quality score (low uncertainty), the bone of the 3D skeleton corresponding to the index finger has a length attribute and a low quality score (high uncertainty). If the bone corresponding to the index finger can be longer than the bone corresponding to the middle finger, the quality attribute of the bone corresponding to the index finger is improved and the uncertainty is the bone corresponding to the middle finger. It can be reduced to a level not longer.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직은 3D 골격의 또 다른 골의 품질 및 두 개의 골들 간의 관계를 규정하는 하나 이상의 제약에 기초하여 3D 골격 골의 품질 속성을 최신화하고 개선할 수 있다.According to some embodiments of the invention, the image processing logic may update and improve the quality attributes of the 3D skeletal bone based on one or more constraints defining the quality of another bone of the 3D skeleton and the relationship between the two bones. .

도 10은 본 발명의 일부 실시예에 따른 시스템의 예시적인 블록도이다. 이미지 수집 회로(예, 카메라)는 기계와 인터페이싱하는 3D 손의 2D 이미지를 얻을 수 있다. 포착된 이미지는 이미지 메모리에 저장될 수 있다.10 is an exemplary block diagram of a system in accordance with some embodiments of the present invention. Image acquisition circuitry (e.g. cameras) may obtain 2D images of 3D hands that interface with the machine. The captured image can be stored in image memory.

본 발명의 일부 실시예에 따르면, 이미지 처리 로직/회로는 이어지는 모듈의 일부 또는 전부를 포함할 수 있다: 제어 유닛, 손 특징/요소 식별 모듈, 이미지 골격 형성 모듈, 3D 골격 형성 모듈, 골격 데이터베이스 형성 모듈, 골격 예측 모듈, 처리 이미지 메모리 모듈.According to some embodiments of the invention, the image processing logic / circuit may include some or all of the following modules: control unit, hand feature / element identification module, image skeletal shaping module, 3D skeletal shaping module, skeletal database shaping Module, skeletal prediction module, processed image memory module.

손 특징/요소 식별 모듈은 손 이미지를 수신할 수 있고, 손끝, 손가락 관절의 주름, 손가락 가장자리, 손가락 지골들 간의 각도 등과 같은 손의 요소 또는 특징을 식별할 수 있다. 이미지 골격 형성 모듈은 손 요소 식별 모듈로부터 손 요소의 데이터를 수신받고 손의 2D 이미지 골격을 만들 수 있다. 이미지 골격 형성장치는 놓친 요소들을 채워넣기 위해서, 눈에 보이는 요소를 내삽 및/또는 외삽할 수 있으며, 및/또는 손 요소들 간의 해부학적 관계를 사용할 수 있다. 또한, 이미지 골격 형성장치는 이 장치가 만들어낸 이미지 골격 요소의 품질 및/또는 불확실성을 판정할 수 있다.The hand feature / element identification module may receive a hand image and identify an element or feature of the hand, such as a fingertip, wrinkle of a finger joint, finger edge, angle between finger phalanges, and the like. The image skeleton forming module may receive data of the hand element from the hand element identification module and generate a 2D image skeleton of the hand. The image skeletal forming device may interpolate and / or extrapolate visible elements and / or use anatomical relationships between hand elements to fill in missing elements. The image skeleton forming apparatus may also determine the quality and / or uncertainty of the image skeleton elements produced by the apparatus.

3D 골격 형성 모듈은 이미지 골격 형성 모듈로부터의 골격 골 치수 및 속성을 수신할 수 있으며, 메모리에 저장된 이전의 3D 골격을 수신할 수도 있으며, 및/또는 골격 예측 모듈로부터 예측된 3D 골격을 수신할 수도 있고, 이미지 골격 형성 모듈로부터의 2D 이미지 골격을 수신할 수도 있다. 이러한 입력들 중 하나 이상에 기초하여, 3D 골격 형성 모듈은 복수의 3D 골격을 만들어낼 수 있으며, 그 중에서 특정 골격이 선택될 수 있다.The 3D skeletal shaping module may receive skeletal bone dimensions and attributes from the image skeletal shaping module, may receive previous 3D bones stored in memory, and / or receive 3D skeletal predictions from the skeletal prediction module. And a 2D image skeleton from the image skeleton forming module. Based on one or more of these inputs, the 3D skeletal forming module can produce a plurality of 3D skeletons, from which a particular skeleton can be selected.

골격 데이터베이스 형성 모듈은 3D 골격 형성 모듈로부터 매칭되는 골격 정도를 수신할 수 있으며; 그 정보는 골격 골 치수 및/또는 골격 배향 를 포함할 수 있지만, 이에 제한되지 않는다. 골격 데이터베이스 형성장치는 이미지 골격 형성장치로부터 골격 골 치수, 골격 배향, 골격 골 치수 품질 및 불확실성과 관련한 정보를 수신할 수도 있다. 이후에, 골격 데이터베이스 형성장치는 3D 골격 중 하나 이상의 골의 길이 및/또는 길이의 품질 속성을 만들고/만들거나 최신화하고/최신화하거나 개선하고/개선할 수 있다.The skeletal database forming module may receive a matching degree of skeleton from the 3D skeletal forming module; The information may include, but is not limited to, skeletal bone dimensions and / or skeletal orientation. The skeletal database forming apparatus may receive information regarding skeletal bone dimensions, skeletal orientation, skeletal bone dimension quality and uncertainty from the image skeletal forming apparatus. The skeletal database forming apparatus may then create and / or update and / or update / improve / improve the quality attributes of the length and / or length of one or more bones of the 3D skeleton.

골격 예측 모듈은 메모리에 저장된 이전의 3D 골격을 수신할 수 있고, 모션 다이나믹 물리학 법칙에 기초하여 다음 3D 골격 위치 및/또는 자세를 예측할 수 있다. 3D 골격 형성 모듈은 새로운 3D 골격을 만들기 위해 예측된 골격을 사용할 수 있다.The skeletal prediction module may receive a previous 3D skeleton stored in memory and may predict the next 3D skeletal position and / or pose based on the laws of motion dynamic physics. The 3D skeletal formation module can use predicted skeletons to create new 3D skeletons.

처리 이미지 메모리 모듈은 포착된 이미지, 3D 골격, 이미지 골격, 하나 이상의 이전 3D 골격, 예측된 골격, 투영된 골격, 상이한 골격의 속성, 해부학적 제약 및 저장할 필요가 있는 임의의 다른 정보를 저장할 수 있다.The processed image memory module may store captured images, 3D skeletons, image skeletons, one or more previous 3D skeletons, predicted skeletons, projected skeletons, attributes of different skeletons, anatomical constraints, and any other information that needs to be stored. .

도 11은 본 발명에 따른 몇몇 실시예의 방법을 설명하는 예시적인 개략 흐름도이다. 단계 101에서, 인터페이싱 손의 이미지는 이미지 수집 회로(예, 카메라)에 의해 포착될 수 있다. 카메라는 초당 특정 속도의 이미지로 포착된 이미지를 얻을 수 있다. 포착된 하나 이상의 이미지는 추가적인 처리를 위해 메모리에 저장될 수 있다. 단계 103에서, 손끝, 손가락 및 손바닥의 주름과 같은 손의 특징은 식별될 수 있다. 단계 104에서, 인터페이싱 손의 2D 이미지 골격은 식별된 손 특징에 기초하여 제작될 수 있다. 예를 들어, 손가락 주름은 손가락 관절의 위치를 추정하기 위해 사용될 수 있다. 단계 105에서, 3D 골격은 단계 104에서 제작된 이미지 골격과 실질적으로 유사할 수 있는 2D 투영도의 방식으로 자세를 잡을 수 있다. 단계 106에서, 각각의 단계 105에서 제작된 각각의 후보 골격은 손가락 지골들 간의 허용된 각도와 같은 제약에 대하여 확인될 수 있다. 제약을 충족하는 골격은, 인터페이싱 손-매칭된 골격과 실질적으로 유사한 자세로 있는 선택된 골격일 수 있다. 단계 107에서, 하나 이상의 이전 골격은 모션 다이나믹 물리학 법칙에 기초하여 현재 매칭되는 골격을 예측하기 위해서 사용될 수 있다. 이 단계에서, 골격의 이전 3D 움직임은 현재 골격 위치를 외삽하기 위해 분석된다. 예측된 골격은 단계 105에서 사용되어서 후보 골격을 만들 수 있다. 단계 108에서, 임의의 모호성, 불일치, 불확실성은 상이한 골격으로부터 수집된 입력 정보에 기초하여 해결될 수 있다. 이 단계에서, 골 길이의 품질은 개선될 수 있다. 단계 109에서, 매칭 골격의 위치 및/또는 움직임과 관련한 정보는 손이 인터페이싱하는 기계에 명형 신호를 출력하기 위해 분석될 수 있다.11 is an exemplary schematic flowchart illustrating a method of some embodiments in accordance with the present invention. In step 101, an image of the interfacing hand may be captured by an image acquisition circuit (eg, a camera). The camera can obtain captured images at specific speeds per second. The captured one or more images may be stored in memory for further processing. At step 103, features of the hand such as wrinkles on the fingertips, fingers and palms can be identified. In step 104, the 2D image skeleton of the interfacing hand may be produced based on the identified hand feature. For example, finger wrinkles can be used to estimate the position of the finger joints. In step 105, the 3D skeleton may be positioned in a manner of 2D projection, which may be substantially similar to the image skeleton produced in step 104. In step 106, each candidate skeleton fabricated in each step 105 may be checked for constraints such as the allowed angle between the finger phalanges. The skeleton that satisfies the constraint can be a selected skeleton that is in a substantially similar posture to the interfacing hand-matched skeleton. In step 107, one or more previous skeletons may be used to predict the currently matching skeleton based on motion dynamic physics laws. In this step, the previous 3D movement of the skeleton is analyzed to extrapolate the current skeleton position. The predicted skeleton can be used in step 105 to make a candidate skeleton. In step 108, any ambiguity, inconsistency, uncertainty may be resolved based on input information collected from different skeletons. At this stage, the quality of the bone length can be improved. In step 109, information relating to the position and / or movement of the matching skeleton may be analyzed to output a sharp signal to the machine with which the hand interfaces.

본 발명의 특정 특징이 본원에서 예시되고 설명되었지만, 많은 변형, 치환 변화 및 등가물이 당해 분야의 통상의 기술자에 의해 일어날 수 있을 것이다. 그러므로, 첨부된 청구항은 본 발명의 진실된 사상 내에 속하는 모든 이러한 변형 및 변화를 아우르는 것을 의도하는 것으로 이해될 것이다.While certain features of the invention have been illustrated and described herein, many modifications, substitution changes, and equivalents may occur to those skilled in the art. Therefore, it is to be understood that the appended claims are intended to cover all such modifications and variations as fall within the true spirit of the invention.

Claims (15)

하나 이상의 3D 손 골격 모델을 사용하는 인간과 기계의 인터페이싱용 시스템에 있어서, 상기 시스템은:
손의 2D 이미지를 획득하기 위한 이미지 수집 회로;
수집된 이미지에서 손 특징을 식별하기 위한 손 특징 식별 모듈;
식별된 특징을 사용하여 손의 2D 골격 데이터세트를 생성하도록 구성된 이미지 골격 형성 모듈; 및
3D 손 골격 모델의 2D 투영도가 생성된 2D 골격 데이터세트에 실질적으로 대응하는, 하나 이상의 3D 손 골격 모델의 일부 또는 전부의 구성을 판정하는 것에 의해 3D 손 골격 데이터세트를 생성하도록 구성된 3D 골격 형성 모듈
을 포함하는 것을 특징으로 하는 시스템.
In a system for interfacing a human and a machine using one or more 3D hand skeleton models, the system comprises:
Image acquisition circuitry for obtaining a 2D image of a hand;
A hand feature identification module for identifying hand features in the collected image;
An image skeletal shaping module, configured to generate a 2D skeletal dataset of the hand using the identified features; And
A 3D skeletal shaping module configured to generate a 3D hand skeletal dataset by determining a configuration of some or all of the one or more 3D hand skeletal models substantially corresponding to the generated 2D skeletal dataset of the 3D hand skeletal model.
≪ / RTI >
제 1 항에 있어서,
상기 이미지 골격 형성 모듈은, 2D 골격 데이터세트를 생성하기 위해 인간 손의 요소들 간의 해부학적 관계 및 제약을 사용하도록 더 구성되는 것을 특징으로 하는 시스템.
The method of claim 1,
The image skeletal shaping module is further configured to use anatomical relationships and constraints between elements of the human hand to generate a 2D skeletal dataset.
제 2 항에 있어서,
상기 이미지 골격 형성 모듈은 하나 이상의 2D 골격 데이터세트 요소에 대한 품질 속성을 판정하도록 더 구성되는 것을 특징으로 하는 시스템.
3. The method of claim 2,
And the image skeletal shaping module is further configured to determine quality attributes for one or more 2D skeletal dataset elements.
제 1 항에 있어서,
하나 이상의 이전 3D 손 골격 데이터세트를 저장하도록 구성된 골격 데이터베이스 형성 모듈을 더 포함하고;
3D 골격 형성장치는 상기 데이터베이스 형성 모듈에 의해 이전에 저장된 하나 이상의 3D 손 골격 데이터세트에 적어도 일부 기초하여 3D 손 골격 데이터세트를 생성하도록 더 구성되는 것을 특징으로 하는 시스템.
The method of claim 1,
Further comprising a skeleton database formation module configured to store one or more previous 3D hand skeleton datasets;
And the 3D skeleton forming apparatus is further configured to generate a 3D hand skeleton dataset based at least in part on the one or more 3D hand skeleton datasets previously stored by the database forming module.
제 1 항에 있어서,
모션 다이나믹 물리학 법칙(motion dynamics physics rules)이 적용되는 두 개 이상의 이전 3D 손 골격 데이터세트에 기초하여 3D 손 골격 데이터세트를 예측하도록 구성된 예측 모듈을 더 포함하고;
상기 3D 골격 형성장치는 상기 예측 모듈에 의해 예측된 3D 손 골격 데이터세트에 적어도 일부 기초하여 3D 손 골격 데이터세트를 생성하도록 더 구성되는 것을 특징으로 하는 시스템.
The method of claim 1,
A prediction module configured to predict the 3D hand skeleton dataset based on two or more previous 3D hand skeleton datasets to which motion dynamics physics rules apply;
And the 3D skeleton forming apparatus is further configured to generate a 3D hand skeleton dataset based at least in part on the 3D hand skeleton dataset predicted by the prediction module.
하나 이상의 3D 손 골격 모델을 사용하는 인간과 기계의 인터페이싱 방법에 있어서, 상기 방법은:
손의 2D 이미지를 획득하는 단계;
획득한 이미지에서 하나 이상의 손 특징을 식별하는 단계;
식별된 특징을 사용하여 손의 2D 골격 데이터세트를 생성하는 단계;
3D 손 골격 모델의 2D 투영도가 생성된 2D 골격 데이터세트와 실질적으로 대응하는, 상기 하나 이상의 3D 손 골격 모델의 일부 또는 전부의 구성을 판정하는 것에 의해 3D 손 골격 데이터세트를 생성하는 단계
를 포함하는 것을 특징으로 하는 인간과 기계의 인터페이싱 방법.
In a method of interfacing a human and a machine using one or more 3D hand skeleton models, the method comprises:
Obtaining a 2D image of a hand;
Identifying one or more hand features in the acquired image;
Generating a 2D skeletal dataset of the hand using the identified features;
Generating a 3D hand skeleton dataset by determining a configuration of some or all of the one or more 3D hand skeleton models substantially corresponding to the generated 2D skeleton dataset of the 3D hand skeleton model
Human and machine interfacing method comprising a.
제 6 항에 있어서,
2D 골격 데이터세트를 생성하는 단계는 2D 골격 데이터세트를 생성하기 위해 인간 손의 요소들 간의 해부학적 관계 및 제약을 사용하는 것을 더 포함하는 것을 특징으로 하는 인간과 기계의 인터페이싱 방법.
The method according to claim 6,
Generating the 2D skeletal dataset further comprises using anatomical relationships and constraints between the elements of the human hand to generate the 2D skeletal dataset.
제 7 항에 있어서,
2D 골격 데이터세트를 생성하는 단계는 하나 이상의 2D 골격 데이터세트 요소에 대한 품질 속성을 판정하는 것을 더 포함하는 것을 특징으로 하는 인간과 기계의 인터페이싱 방법.
The method of claim 7, wherein
Generating a 2D skeletal dataset further comprises determining a quality attribute for one or more 2D skeletal dataset elements.
제 6 항에 있어서,
3D 손 골격 데이터세트를 생성하는 단계는 하나 이상의 3D 손 골격 데이터세트를 저장하는 것, 및 이전에 저장된 3D 손 골격 데이터세트에 적어도 일부 기초하여 3D 손 골격 데이터세트를 생성하는 것을 더 포함하는 것을 특징으로 하는 인간과 기계의 인터페이싱 방법.
The method according to claim 6,
Generating a 3D hand skeleton dataset further comprises storing one or more 3D hand skeleton datasets, and generating a 3D hand skeleton dataset based at least in part on a previously stored 3D hand skeleton dataset. Human and machine interfacing method.
제 6 항에 있어서,
3D 손 골격 데이터세트를 생성하는 단계는, 두 개 이상의 이전에 생성된 3D 손 골격 데이터세트에 모션 다이나믹 물리학 법칙을 적용하는 것에 의해 3D 손 골격 데이터세트를 예측하고, 예측된 3D 손 골격 데이터세트에 적어도 부분적으로 기초하여 3D 손 골격 데이터세트를 생성하는 것을 더 포함하는 것을 특징으로 하는 인간과 기계의 인터페이싱 방법.
The method according to claim 6,
Generating the 3D hand skeleton dataset comprises predicting the 3D hand skeleton dataset by applying motion dynamic physics laws to two or more previously generated 3D hand skeleton datasets, and generating the predicted 3D hand skeleton dataset. Generating a 3D hand skeletal dataset based at least in part on the human and machine interfacing method.
하나 이상의 3D 손 골격 모델을 사용하여 3D 손 골격 데이터세트를 생성하는 회로에 있어서, 상기 회로는:
손의 2D 이미지에서 손 특징을 식별하기 위한 손 특징 식별 모듈;
식별된 특징을 사용하여 손의 2D 골격 데이터세트를 생성하도록 구성된 이미지 골격 형성 모듈; 및
3D 손 골격 모델의 2D 투영도가 생성된 2D 골격 데이터세트에 실질적으로 대응하는, 하나 이상의 3D 손 골격 모델의 구성을 판정하도록 구성된 3D 골격 형성장치
를 포함하는 것을 특징으로 하는 회로.
A circuit for generating a 3D hand skeleton dataset using at least one 3D hand skeleton model, the circuit comprising:
A hand feature identification module for identifying hand features in a 2D image of the hand;
An image skeletal shaping module, configured to generate a 2D skeletal dataset of the hand using the identified features; And
3D skeletal forming apparatus configured to determine a configuration of at least one 3D hand skeleton model substantially corresponding to the 2D skeletal dataset from which the 3D hand skeleton model was generated
Circuit comprising a.
제 11 항에 있어서,
상기 이미지 골격 형성 모듈은 2D 골격 데이터세트를 생성하기 위해서 인간 손의 요소들 간의 해부학적 관계 및 제약을 사용하도록 더 구성되는 것을 특징으로 하는 회로.
The method of claim 11,
The image skeletal shaping module is further configured to use anatomical relationships and constraints between elements of the human hand to generate a 2D skeletal dataset.
제 12 항에 있어서,
상기 이미지 골격 형성 모듈은 하나 이상의 2D 골격 데이터세트 요소에 대한 품질 속성을 판정하도록 더 구성되는 것을 특징으로 하는 회로.
13. The method of claim 12,
And the image skeletal shaping module is further configured to determine quality attributes for one or more 2D skeletal dataset elements.
제 11 항에 있어서,
하나 이상의 이전 3D 손 골격 데이터세트를 저장하도록 구성된 골격 데이터베이스 형성 모듈을 더 포함하고;
상기 3D 골격 형성장치는 상기 골격 데이터베이스 형성 모듈에 의해 이전에 저장된 하나 이상의 3D 손 골격 데이터세트에 적어도 일부 기초하여 3D 손 골격 데이터세트를 생성하도록 더 구성되는 것을 특징으로 하는 회로.
The method of claim 11,
Further comprising a skeleton database formation module configured to store one or more previous 3D hand skeleton datasets;
And the 3D skeleton forming apparatus is further configured to generate a 3D hand skeleton dataset based at least in part on one or more 3D hand skeleton datasets previously stored by the skeleton database forming module.
제 11 항에 있어서,
모션 다이나믹 물리학 법칙이 적용되는 두 개 이상의 이전 3D 손 골격 데이터세트에 기초하여 3D 손 골격 데이터세트를 예측하도록 구성된 예측 모듈을 더 포함하고;
상기 3D 골격 형성장치는 상기 예측 모듈에 의해 예측된 3D 손 골격 데이터세트에 적어도 일부 기초하여 3D 손 골격 데이터세트를 생성하도록 더 구성되는 것을 특징으로 하는 회로.
The method of claim 11,
A prediction module configured to predict the 3D hand bone dataset based on two or more previous 3D hand bone datasets to which the motion dynamic physics law is applied;
And the 3D skeleton forming apparatus is further configured to generate a 3D hand skeleton dataset based at least in part on the 3D hand skeleton dataset predicted by the prediction module.
KR1020137014811A 2011-01-03 2012-01-03 Method circuit and system for human to machine interfacing by hand gestures KR20130140772A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201113983335A 2011-01-03 2011-01-03
US12/983,335 2011-01-03
PCT/IB2012/050027 WO2012095756A2 (en) 2011-01-03 2012-01-03 Method circuit and system for human to machine interfacing by hand gestures

Publications (1)

Publication Number Publication Date
KR20130140772A true KR20130140772A (en) 2013-12-24

Family

ID=49985147

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137014811A KR20130140772A (en) 2011-01-03 2012-01-03 Method circuit and system for human to machine interfacing by hand gestures

Country Status (1)

Country Link
KR (1) KR20130140772A (en)

Similar Documents

Publication Publication Date Title
US8872899B2 (en) Method circuit and system for human to machine interfacing by hand gestures
JP2014501011A5 (en)
Erol et al. Vision-based hand pose estimation: A review
Erol et al. A review on vision-based full DOF hand motion estimation
Hasan et al. RETRACTED ARTICLE: Static hand gesture recognition using neural networks
JP5931215B2 (en) Method and apparatus for estimating posture
JP5403699B2 (en) Finger shape estimation device, finger shape estimation method and program
CN104937635B (en) More hypothesis target tracking devices based on model
US20130335318A1 (en) Method and apparatus for doing hand and face gesture recognition using 3d sensors and hardware non-linear classifiers
CN108509026B (en) Remote maintenance support system and method based on enhanced interaction mode
JP6066093B2 (en) Finger shape estimation device, finger shape estimation method, and finger shape estimation program
JP2007538318A5 (en)
Liang et al. Hough forest with optimized leaves for global hand pose estimation with arbitrary postures
Xiao et al. A hand gesture-based interface for design review using leap motion controller
Rodriguez et al. Robust vision-based hand tracking using single camera for ubiquitous 3D gesture interaction
US20210158565A1 (en) Pose selection and animation of characters using video data and training techniques
Thalmann et al. First-person palm pose tracking and gesture recognition in augmented reality
Shah et al. Gesture recognition technique: a review
Mahmud et al. Recognition of symbolic gestures using depth information
JP2014182662A (en) Operation apparatus and operation method
Jeong et al. Hand gesture user interface for transforming objects in 3d virtual space
KR20130140772A (en) Method circuit and system for human to machine interfacing by hand gestures
Lin Visual hand tracking and gesture analysis
Feng et al. An HCI paradigm fusing flexible object selection and AOM-based animation
Zeineb et al. Hand gesture recognition system

Legal Events

Date Code Title Description
A201 Request for examination
WITB Written withdrawal of application