KR101017449B1 - Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same - Google Patents

Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same Download PDF

Info

Publication number
KR101017449B1
KR101017449B1 KR1020090006554A KR20090006554A KR101017449B1 KR 101017449 B1 KR101017449 B1 KR 101017449B1 KR 1020090006554 A KR1020090006554 A KR 1020090006554A KR 20090006554 A KR20090006554 A KR 20090006554A KR 101017449 B1 KR101017449 B1 KR 101017449B1
Authority
KR
South Korea
Prior art keywords
motion
symbol sequence
user
symbol
normal
Prior art date
Application number
KR1020090006554A
Other languages
Korean (ko)
Other versions
KR20100087512A (en
Inventor
김태영
김종호
임철수
Original Assignee
서경대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서경대학교 산학협력단 filed Critical 서경대학교 산학협력단
Priority to KR1020090006554A priority Critical patent/KR101017449B1/en
Publication of KR20100087512A publication Critical patent/KR20100087512A/en
Application granted granted Critical
Publication of KR101017449B1 publication Critical patent/KR101017449B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures

Landscapes

  • Image Analysis (AREA)

Abstract

본 발명은 (a) 정규 동작의 특징점들의 시간에 따른 위치 변화를 기초로 정규 동작 기호 시퀀스를 생성하는 단계와, (b) 상기 정규 동작 기호 시퀀스에 대해서 은닉 마르코프 모델을 사용하여 동작 패턴 모델링을 수행하는 단계와, (c) 사용자 동작의 특징점들의 시간에 따른 위치 변화를 기초로 사용자 동작 기호 시퀀스를 추출하는 단계와, (d) 상기 사용자 동작 기호 시퀀스를 상기 단계 (b)에서의 상기 동작 패턴 모델링을 비교하여 상기 사용자 동작을 인식하는 단계를 포함하되, (e) 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 비교하여 상기 사용자 동작과 상기 정규 동작의 동작 유사도를 추출하는 단계를 더 포함하는 은닉 마르코프 모델 기반 동작 인식 방법에 관한 것이다.The present invention comprises (a) generating a normal motion symbol sequence based on a change in position of feature points of a normal motion over time, and (b) performing motion pattern modeling using a hidden Markov model for the normal motion symbol sequence. (C) extracting a user action symbol sequence based on a change in position of feature points of a user action over time; and (d) modeling the user action symbol sequence in the step (b). And recognizing the user's motion by comparing the method, and (e) comparing the user's motion symbol sequence with the normal motion symbol sequence and extracting a motion similarity between the user's motion and the normal motion. Markov model-based motion recognition method.

본 발명에 따르면, 동작의 특징점들을 추출하고 동작의 특징점들의 시간에 따른 위치 변화를 은닉 마르코프 모델을 이용하여 동작 패턴 모델링을 수행한 후 동작 패턴 모델링과 사용자 동작을 비교하여 동작 인식 및 동작 유사도를 추출할 수 있다.According to the present invention, after extracting the feature points of the motion and performing the motion pattern modeling using the hidden Markov model to change the position of the feature points of the motion over time, motion recognition and motion similarity are extracted by comparing the motion pattern modeling and the user motion. can do.

은닉 마르코프, 정규 동작 기호 시퀀스, 사용자 동작 기호 시퀀스, 동작 패턴 모델링, 동작 유사도 Hidden Markov, Regular Behavior Symbol Sequence, User Behavior Symbol Sequence, Behavior Pattern Modeling, Behavior Similarity

Description

은닉 마르코프 모델 기반 동작 인식 방법 및 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체{METHOD FOR RECOGNIZING MOTION BASED ON HIDDEN MARKOV MODEL AND COMPUTER-READABLE MEDIUM HAVING THEREON PROGRAM PERFORMING FUNCTION EMBODYING THE SAME}TECHNICAL FOR RECOGNIZING MOTION BASED ON HIDDEN MARKOV MODEL AND COMPUTER-READABLE MEDIUM HAVING THEREON PROGRAM PERFORMING FUNCTION EMBODYING THE SAME}

본 발명은 은닉 마르코프 모델 기반 동작 인식 방법 및 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체에 관한 것으로, 더욱 구체적으로는 동작의 특징점들을 추출하고 동작의 특징점들의 시간에 따른 위치 변화를 은닉 마르코프 모델을 이용하여 동작 패턴 모델링을 수행한 후 동작 패턴 모델링과 사용자 동작을 비교하여 동작 인식 및 동작 유사도를 추출하는 은닉 마르코프 모델 기반 동작 인식 방법 및 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체에 관한 것이다.The present invention relates to a hidden Markov model-based motion recognition method and a computer-readable recording medium having recorded thereon a program for realizing the same. After performing the motion pattern modeling using the model, a hidden Markov model-based motion recognition method for extracting motion recognition and motion similarity by comparing the motion pattern modeling and the user motion, and a computer-readable recording medium recording a program for realizing the motion pattern model It is about.

최근 유비쿼터스 기술과 가상현실 기반 기술들이 발전함에 따라 동작 인식 처리 기술들이 연구되고 있다. 동작 인식 처리 기술은 예컨대 손 동작을 이용한 전자 기기와 컴퓨터 제어에 관한 HCI(Human-Computer Interface) 관련 기술, 사람에게 부착한 센서를 통해 전달되는 데이터를 이용해 움직임을 인식하여 컴퓨터 애니 메이션 등에 활용하는 기술 등이 있다. Recently, with the development of ubiquitous technology and virtual reality based technology, motion recognition processing technologies have been studied. Motion recognition processing technology is, for example, a technology related to human-computer interface (HCI) related to electronic devices and computer control using hand gestures, and technology that recognizes movement using data transmitted through a sensor attached to a person and utilizes it for computer animation. Etc.

동작 인식 처리 기술은 카메라를 통해 입력되는 이미지를 분석하여 동작을 인식하거나 추적하는 시스템 기술이나, 보안 또는 감시를 필요로 하는 장소에서 위험한 동작들을 자동적으로 찾아내는 감시 시스템 기술 등 다양한 분야에 응용이 가능하다. 또한 동작 인식 처리 기술을 이용하면 게임이나 오락분야에서는 사용자들이 자신의 신체를 이용하여 가상의 기구나 장비들을 제어할 수 있으며, 운동 자체에 의미를 두는 자세 교정이나 재활 훈련과 같은 치료 분야에서도 동작 인식 처리 기술이 이용될 수 있다. The motion recognition processing technology can be applied to various fields such as a system technology that analyzes an image input through a camera to recognize or track a motion, or a surveillance system technology that automatically finds dangerous motions in a place requiring security or surveillance. . In addition, motion recognition processing technology allows users to control virtual instruments and equipment using their bodies in the game and entertainment field, and also recognizes motion in therapeutic areas such as posture correction and rehabilitation training, which imply meaning to the exercise itself. Processing techniques can be used.

종래 동작 인식 기술에 따르면, 동작을 인식하기 위해서는 연속된 프레임에서 사용자의 신체 특징을 추출하는 과정에서 많은 연산이 필요하고 추출된 특징 벡터에서 작업의 패턴을 인식하는 과정이 필요하다. 동작의 패턴 인식은 주로 제스쳐 인식을 사용한다. 제스쳐 인식은 인체 각 부위가 시간 축에 대해 어떠한 형상 변화를 가지는가를 추출하는 것을 의미한다. 그러나 인체는 매우 복잡한 3차원 관절 구조를 지니고 있으므로 제스처를 인식하는 것은 매우 어렵다. 따라서 제스처 인식은 인간의 손, 팔 등이 기계에 의해서 측정될 수 있어야 한다는 점을 요구한다.According to the conventional motion recognition technology, in order to recognize a motion, a lot of operations are required in a process of extracting a user's body features in a continuous frame, and a process of recognizing a pattern of a task in the extracted feature vector is required. Pattern recognition of motion mainly uses gesture recognition. Gesture recognition means extracting what shape change each part of the human body has on the time axis. However, since the human body has a very complex three-dimensional joint structure, it is very difficult to recognize a gesture. Gesture recognition therefore requires that a human hand, arm, etc., be measured by a machine.

손의 제스처나 몸의 움직임 같은 사람의 구체적 동작을 인식하기 위해서 비전(vision) 기반으로 비디오 시퀀스 영상에 대한 연구가 활발하게 진행 중이다.In order to recognize a specific motion of a person such as a hand gesture or a body movement, research on a video sequence image based on vision is being actively conducted.

비전 기반의 영상 정보를 이용한 동작 인식 방법은 비접촉식 인식 방법으로 인간의 신체에 어떤 장치도 부착하지 않고 카메라를 통해 얻어진 영상을 이용하여 외관의 특징을 기반으로 제스처를 인식하는 방법이다. 비전 기반의 동작 인식 방법 에서 동작에 대한 분류나 구분을 하기 위해서는 동작을 모델들과 비교하는 과정을 거치며, 비교를 위해서 다양한 특징 정보들이 이용된다. 이러한 특징 정보들에는 기하학적 특징, 통계적 특징, 시간 변화에서 추출된 특징 등이 있다.The motion recognition method using vision-based image information is a non-contact recognition method that recognizes gestures based on appearance features using an image obtained through a camera without attaching any device to a human body. In the vision-based motion recognition method, motion classification and classification are performed to compare motions with models, and various feature information is used for comparison. Such feature information includes geometric features, statistical features, and features extracted from time changes.

첫 번째 기하학적 특징을 이용하는 방법은 에지, 코너 등을 구하여 정규 모델에 대한 데이터를 준비하고 인식할 동작에 대해서도 같은 방식으로 구한 데이터와 비교하는 방법이다. 기하학적 특징을 이용하면 여러 가지 복잡한 동작에 대한 특징 추출이 어렵고 많은 전처리 과정이 필요하게 되어 인식 속도와 인식률이 떨어지게 된다. The first method of using geometric features is to find the edges, corners, and so on, to prepare data for a regular model and compare it with the data obtained in the same way. The use of geometric features makes it difficult to extract features for many complex motions and requires a lot of preprocessing to reduce recognition speed and recognition rate.

두 번째 통계적 특징을 이용하는 방법은 전처리 과정으로 많은 영상 집합에 대해 통계적으로 높은 확률 값을 가지는 밝기 정보와 위치 정보를 분석하여 매칭을 시도하는 방법이다. 비교적 좋은 인식율을 가지며 실시간 적용에도 효과적이다. The second statistical feature is a preprocessing method that attempts matching by analyzing brightness information and location information having statistically high probability values for many image sets. It has a relatively good recognition rate and is effective for real time application.

세 번째로 시간의 변화에 따른 영상의 특징점 추출 정보를 이용하는 방법은 동작이 이루어지는 대상에 대해 시간의 흐름에 따른 동작의 패턴을 분석하여 패턴에 따른 동작을 구분하거나 분류하는 방법이다. 특징점 추출 정보를 이용하는 방법은 일반적인 환경에서도 동작성을 쉽게 추출할 수 있는 장점이 있지만 수많은 영상들을 이용하여 학습시키고 적당한 패턴을 모델화하여야하는 단점이 있다.Third, a method of using feature point extraction information of an image according to a change of time is a method of classifying or classifying an operation according to a pattern by analyzing a pattern of an operation according to time. The method of using the feature extraction information has the advantage of easily extracting the operability even in a general environment, but has the disadvantage of learning using a large number of images and modeling an appropriate pattern.

본 발명의 목적은 동작의 특징점들을 추출하고 동작의 특징점들의 시간에 따른 위치 변화를 은닉 마르코프 모델을 이용하여 동작 패턴 모델링을 수행한 후 동작 패턴 모델링과 사용자 동작을 비교하여 동작 인식 및 동작 유사도를 추출하는 은닉 마르코프 모델 기반 동작 인식 방법을 제공하는 데 있다.An object of the present invention is to extract the feature points of the motion, perform the motion pattern modeling using the hidden Markov model of the positional changes of the feature points of the motion, and then compare the motion pattern modeling and user motion to extract motion recognition and motion similarity To provide a hidden Markov model-based motion recognition method.

본 발명의 다른 목적은 상기 은닉 마르코프 모델 기반 동작 인식 방법의 각 단계를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 제공하는데 있다.Another object of the present invention is to provide a computer readable recording medium having recorded thereon a program for realizing each step of the hidden Markov model-based motion recognition method.

상기 기술적 과제를 달성하기 위하여, 본 발명은 (a) 정규 동작의 특징점들의 시간에 따른 위치 변화를 기초로 정규 동작 기호 시퀀스를 생성하는 단계와, (b) 상기 정규 동작 기호 시퀀스에 대해서 은닉 마르코프 모델을 사용하여 동작 패턴 모델링을 수행하는 단계와, (c) 사용자 동작의 특징점들의 시간에 따른 위치 변화를 기초로 사용자 동작 기호 시퀀스를 추출하는 단계와, (d) 상기 사용자 동작 기호 시퀀스를 상기 단계 (b)에서의 상기 동작 패턴 모델링을 비교하여 상기 사용자 동작을 인식하는 단계를 포함하되, (e) 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 비교하여 상기 사용자 동작과 상기 정규 동작의 동작 유사도를 추출하는 단계를 더 포함하는 은닉 마르코프 모델 기반 동작 인식 방법을 제공한다.In order to achieve the above technical problem, the present invention comprises the steps of (a) generating a normal motion symbol sequence based on the change in position of the feature points of the normal operation over time, and (b) a hidden Markov model for the normal motion symbol sequence. (C) extracting a user motion symbol sequence based on a change in position of feature points of the user motion over time using the method; and (d) converting the user motion symbol sequence to the step ( b) recognizing the user's motion by comparing the motion pattern modeling in (b), and (e) comparing the user's motion symbol sequence with the normal motion symbol sequence to determine the motion similarity between the user's motion and the normal motion. It provides a hidden Markov model-based motion recognition method further comprising the step of extracting.

본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (a)는, (a-1) 상기 정규 동작의 특징점들의 시간에 따른 위치 변화의 방향 벡터 가 포함되는 공간에 따라서 상기 정규 동작 기호 시퀀스를 생성하는 단계를 포함하는 것이고, 상기 단계 (c)는, (c-1) 상기 사용자 동작의 특징점들의 시간에 따른 위치 변화의 방향 벡터가 포함되는 공간에 따라서 상기 사용자 동작 기호 시퀀스를 생성하는 단계를 포함하는 것일 수 있다.In the Hidden Markov Model-based Motion Recognition Method according to the present invention, the step (a) may include (a-1) the normal motion symbol according to a space including a direction vector of positional change over time of the feature points of the normal motion. Generating a sequence, wherein step (c) comprises: (c-1) generating the user gesture symbol sequence according to a space in which a direction vector of positional change over time of the feature points of the user gesture is included; It may be to include a step.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (a-1)는, (a-2) 상기 정규 동작의 초기 특징점들의 무게 중심과 상기 정규 동작의 초기 특징점들 사이의 방향 벡터가 포함되는 공간에 따라서 상기 정규 동작 기호 시퀀스의 초기 값을 결정하는 단계를 포함하는 것이고, 상기 단계 (c-1)는, (c-2) 상기 사용자 동작의 초기 특징점들의 무게 중심과 상기 사용자 동작의 초기 특징점들 사이의 방향 벡터가 포함되는 공간에 따라서 상기 사용자 동작 기호 시퀀스의 초기 값을 결정하는 단계를 포함하는 것일 수 있다.In the hidden Markov model-based motion recognition method according to the present invention, the step (a-1) may include (a-2) a direction vector between the center of gravity of the initial feature points of the normal motion and the initial feature points of the normal motion. And determining an initial value of the normal operation sign sequence according to a space in which the step is included. The step (c-1) may include (c-2) the center of gravity of the initial feature points of the user motion and the user motion. The method may include determining an initial value of the user gesture symbol sequence according to a space in which a direction vector between initial feature points of U is included.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (b)는, (b-1) 상기 동작 패턴 모델링을 구성하는 상태의 전이 확률 a ij 와 관측 확률 b jk 를 초기화하는 단계와, (b-2) 전체 길이 T 이하의 z에 대해서 a ij (z)와 a ij (z-1), b jk (z)와 b jk (z-1)의 차이가 기준값 ε 이하인 경우 다음 수학식을 이용하여 추정값

Figure 112009005183796-pat00001
Figure 112009005183796-pat00002
를 반복적으로 추출하는 단계와,
Figure 112009005183796-pat00003
,
Figure 112009005183796-pat00004
[
Figure 112009005183796-pat00005
는 상태 w i (t-1)에서 상태 w j (t)로의 전이 기대 확률, v k 는 정규 동작 기호 시퀀스 내의 기호를 나타냄] (b-3) 최종적으로 추출한
Figure 112009005183796-pat00006
Figure 112009005183796-pat00007
를 전이 확률 a ij 와 관측 확률 b jk 로 지정하는 단계를 포함하는 것일 수 있다.In the hidden Markov model-based motion recognition method according to the present invention, the step (b) includes (b-1) initializing the transition probability a ij and the observation probability b jk of the state constituting the motion pattern modeling; , (b-2) the difference between a ij (z) and a ij (z-1), b jk (z) and b jk (z-1) for z less than or equal to the total length T , Estimates Using Equations
Figure 112009005183796-pat00001
And
Figure 112009005183796-pat00002
Extracting it repeatedly;
Figure 112009005183796-pat00003
,
Figure 112009005183796-pat00004
[
Figure 112009005183796-pat00005
Is the expected probability of transition from state w i (t-1 ) to state w j (t) , and v k represents a symbol in the sequence of normal motion symbols] (b-3)
Figure 112009005183796-pat00006
And
Figure 112009005183796-pat00007
It may include the step of designating the transition probability a ij and the observation probability b jk .

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (d)는, (d-1) 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스 각각의 매칭 확률을 상기 동작 패턴 모델링을 기초로 추출하는 단계와, (d-2) 상기 매칭 확률의 차이가 미리 지정한 기준값 이하일 때 상기 사용자 동작을 상기 정규 동작으로 인식하는 단계를 포함하는 것일 수 있다.In the hidden Markov model-based motion recognition method according to the present invention, the step (d) may include (d-1) matching probabilities of the user motion symbol sequence and the normal motion symbol sequence based on the motion pattern modeling. And (d-2) recognizing the user's motion as the normal motion when the difference of the matching probability is equal to or less than a predetermined reference value.

삭제delete

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (e)는, (e-1) 미리 지정된 기준값에서 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 일치시키는데 발생하는 비용을 감산한 값을 상기 동작 유사도로 추출하는 단계를 포함하는 것일 수 있다.In addition, in the hidden Markov model-based motion recognition method according to the present invention, the step (e) subtracts the cost incurred in (e-1) matching the user motion symbol sequence with the normal motion symbol sequence at a predetermined reference value. It may include extracting a value to the operation similarity.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상 기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스는 공백을 포함하는 것일 수 있다.In addition, in the hidden Markov model-based gesture recognition method according to the present invention, the user gesture symbol sequence and the regular gesture symbol sequence may include a space.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 비용(Acost)은,

Figure 112009005183796-pat00008
을 기초로 추출될수 있다. In addition, in the hidden Markov model-based motion recognition method according to the present invention, the cost (A cost ),
Figure 112009005183796-pat00008
Can be extracted based on.

[단 S1'(i)와 S2'(i)는 공백을 포함하는 상기 정규 동작 기호 시퀀스와 상기 사용자 동작 기호 시퀀스의 i번째 기호를 각각 나타내며, s(S1'(i), S2'(i))는 상기 정규 동작 기호 시퀀스와 상기 사용자 동작 기호 시퀀스의 i번째 기호를 정렬하는 비용값을 출력하는 함수를 나타내며, l은 정렬 길이를 나타냄][Wherein S 1 ′ (i) and S 2 ′ (i) indicate the i th symbol of the normal operation symbol sequence and the user operation symbol sequence each including a space, and s (S 1 '(i), S 2 '(i)) represents a function for outputting a cost value for aligning the i-th symbol of the regular motion sign sequence and the user motion sign sequence, and l indicates an alignment length]

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 s(S1'(i), S2'(i))는, 상기 정규 동작 기호 시퀀스의 i번째 기호가 공백이 아니고 상기 사용자 동작 기호 시퀀스의 i번째 기호가 공백일 때 발생하는 삽입 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호가 공백이고 상기 사용자 동작 기호 시퀀스의 i번째 기호가 공백이 아닐 때 발생하는 삭제 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호와 상기 사용자 동작 기호 시퀀스의 i번째 기호가 모두 공백이 아닐 때 발생하는 교체 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호와 상기 사용자 동작 기호 시퀀스의 i번째 기호가 일치하는 경우 발생하는 정합 비용 중 어느 하나를 출력하는 것일 수 있다.In addition, in the hidden Markov model-based motion recognition method according to the present invention, in the s (S 1 '(i), S 2 ' (i)), the i-th symbol of the normal operation symbol sequence is not blank, the user operation An insertion cost incurred when the i-th symbol of the symbol sequence is blank, a deletion cost incurred when the i-th symbol in the regular operation symbol sequence is blank and the non-blank in the i-operation symbol sequence of the user sequence; Replacement cost incurred when the i th symbol of the operation symbol sequence and the i th symbol of the user operation symbol sequence are not blank, and the i th symbol of the regular operation symbol sequence and the i th symbol of the user operation symbol sequence match It may be to output any one of the matching costs that occur.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상 기 단계 (e)는, (e-2) 상기 사용자 동작 기호 시퀀스 또는 상기 정규 동작 기호 시퀀스 내에 동일한 기호가 반복되는 경우 상기 반복되는 기호를 한번만 표시하도록 변환한 후 비교하여 상기 사용자 동작과 상기 정규 동작의 동작 유사도를 추출하는 단계를 포함하는 것일 수 있다.In addition, in the hidden Markov model-based motion recognition method according to the present invention, the step (e) is (e-2) when the same symbol is repeated in the user motion symbol sequence or the normal motion symbol sequence, the repeated symbol Converting to display only one time, and comparing the extracted user motion with the normal motion.

또한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 상기 단계 (e)는, (e-3) 상기 사용자 동작이 부분 동작인 경우 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 비교하여 상기 사용자 동작과 상기 정규 동작의 부분 동작 유사도를 추출하는 단계를 포함하는 것일 수 있다.In addition, in the hidden Markov model-based motion recognition method according to the present invention, the step (e) is (e-3) when the user motion is a partial motion by comparing the user motion symbol sequence and the normal motion symbol sequence And extracting a partial motion similarity between the user motion and the normal motion.

또한 본 발명은 전술한 은닉 마르코프 모델 기반 동작 인식 방법의 각 단계를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 제공한다.The present invention also provides a computer-readable recording medium having recorded thereon a program for realizing each step of the above-described hidden Markov model-based motion recognition method.

본 발명에 따르면 동작의 특징점들을 추출하고 동작의 특징점들의 시간에 따른 위치 변화를 은닉 마르코프 모델을 이용하여 동작 패턴 모델링을 수행한 후 동작 패턴 모델링과 사용자 동작을 비교하여 동작 인식 및 동작 유사도를 추출할 수 있다.According to the present invention, after extracting the feature points of the motion and performing the motion pattern modeling using the hidden Markov model of the positional change of the feature points of the motion over time, motion recognition and motion similarity can be extracted by comparing the motion pattern modeling and the user motion. Can be.

이하, 본 발명의 은닉 마르코프 모델 기반 동작 인식 방법 및 이를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체의 실시예를 첨부한 도면을 참조로 보다 구체적으로 설명한다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT Hereinafter, a hidden markov model-based motion recognition method of the present invention and an embodiment of a computer-readable recording medium recording a program for realizing the same will be described in more detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법의 예시적인 흐름도이다.1 is an exemplary flowchart of a hidden Markov model based motion recognition method in accordance with the present invention.

우선 정규 동작의 특징점들의 시간에 따른 위치 변화를 기초로 정규 동작 기호 시퀀스를 생성한다(S110).First, a normal operation symbol sequence is generated based on a change in position of feature points of the normal operation over time (S110).

정규 동작 기호 시퀀스의 생성은 다음과 같이 수행할 수 있다.The generation of the regular operation symbol sequence may be performed as follows.

우선 인체의 팔, 다리와 같은 인체 부위 특징점을 추출한다.First, the feature points of the human body such as arms and legs of the human body are extracted.

예컨대 적외선 LED 및 영상 처리를 이용하여 머리, 양 손목, 양 발목의 5개 부분에 대하여 위치 좌표를 추출한다.For example, infrared LEDs and image processing are used to extract positional coordinates for five parts of the head, both wrists, and both ankles.

이후 추출한 각 위치 좌표에 대해서 시간 변화에 따른 위치 변화를 미리 지정된 개수의 구간, 예컨대 8개의 구간으로 분류한다.Thereafter, the positional change according to the time change is classified into each of the extracted positional coordinates into a predetermined number of sections, for example, eight sections.

도 2 내지 도 3은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 특징점의 위치 및 시간에 따른 위치 변화를 이용하여 정규 동작 기호 시퀀스를 생성하는 예를 나타내는 도면이다.2 to 3 are diagrams illustrating an example of generating a normal motion symbol sequence using a position change of a feature point and a position according to time in a hidden Markov model-based motion recognition method according to the present invention.

도 2를 참조하면, 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 특징점의 시간에 따른 위치 변화, 즉 기준점에서 변화점으로의 위치 변화는 방향 벡터로 표현할 수 있다. 정규 동작의 특징점들의 시간에 따른 위치 변화의 방향 벡터가 포함되는 공간을 기준으로 정규 동작 기호 시퀀스를 생성할 수 있다.Referring to FIG. 2, in the hidden Markov model-based motion recognition method according to the present invention, a positional change of a feature point over time, that is, a positional change from a reference point to a change point may be expressed as a direction vector. A normal motion symbol sequence may be generated based on a space including a direction vector of a position change of a feature point of the normal motion over time.

예컨대 도 2를 참조하면, 방향 벡터는 8개의 구간으로 구분된 공간 중 어느 하나에 배치되며, 시간에 따른 운동 벡터가 포함되는 구간을 해당 방향 벡터의 기 호로 지정한다. 여기서 방향 벡터의 기호는 계산 편의를 위하여 8개의 구간으로 구분된 공간에 대응하여 1 내지 8 사이의 숫자로 표시한다.For example, referring to FIG. 2, the direction vector is disposed in any one of the space divided into eight sections, and a section including the motion vector over time is designated as a symbol of the corresponding direction vector. Here, the sign of the direction vector is represented by a number between 1 and 8 corresponding to the space divided into eight sections for the convenience of calculation.

도 3을 참조하면, t=0인 위치에서 t=1인 위치로의 변화는 도 2의 8 구간에 대응한다. 따라서 해당 변화에 대한 기호는 8로 설정할 수 있다. 또한 t=1인 위치에서 t=2인 위치로의 변화는 도 2의 7 구간에 대응한다. 따라서 해당 변화에 대한 기호는 7로 설정할 수 있다. Referring to FIG. 3, a change from a position at t = 0 to a position at t = 1 corresponds to 8 sections of FIG. 2. Therefore, the symbol for the change can be set to 8. In addition, the change from the position of t = 1 to the position of t = 2 corresponds to the section 7 of FIG. 2. Therefore, the symbol for the change can be set to 7.

한편 처음 시작 위치에 대한 기호는 위치 변화가 없는 상태이므로 공간 구분을 통하여 생성되지 않는다. On the other hand, the symbol for the first starting position is not generated through space division because there is no change of position.

따라서 처음 시작 위치에 대한 기호는 모든 특징점들을 컨벡스 헐(Convex Hull) 기법을 이용하여 다각형을 생성한 후 다각형의 무게 중심을 구한 후 무게 중심점을 기준점으로 하는 공간에 특징점들을 재배치하여 해당 특징점이 속하는 구간의 기호가 시작 위치에 대한 기호가 되도록 지정할 수 있다.Therefore, the symbol for the first starting position is to create all polygons using the Convex Hull technique, obtain the center of gravity of the polygon, and then rearrange the feature points in the space with the center of gravity as the reference point. You can specify that the symbol of to be the symbol for the starting position.

도 2 및 도 3을 참조하면, t=0인 위치에서 특징점이 2구간에 있다고 가정하면, 처음 시작 위치에 대한 기호는 2로 설정할 수 있다.2 and 3, assuming that the feature point is in the second section at the position t = 0, the symbol for the first start position may be set to two.

따라서 도 3의 상황에 대한 정규 동작 기호 시퀀스는 {2, 8, 7}로 나타낼 수 있다. Accordingly, the normal operation symbol sequence for the situation of FIG. 3 may be represented by {2, 8, 7}.

도 2 내지 도 3을 참조로 설명한 방식을 통하여 생성되는 시간 변화에 따른 위치 변화 집합, 즉 정규 동작 기호 시퀀스는 동작에 대한 패턴 데이터로서 사용할 수 있다.A set of positional changes according to time changes, that is, a normal operation symbol sequence generated through the method described with reference to FIGS. 2 to 3, may be used as pattern data for an operation.

이후 S110에서 생성한 정규 동작 기호 시퀀스에 대해서 은닉 마르코프 모델 을 사용하여 동작 패턴 모델링을 수행한다(S130).Subsequently, motion pattern modeling is performed on the normal motion symbol sequence generated in S110 using a hidden Markov model (S130).

동작을 인식하기 위해서는 동작 고유의 데이터를 패턴화하고 이러한 패턴화된 데이터를 사용 목적에 맞게 구조화하는 동작 패턴 모델링이 필요하다.In order to recognize a motion, motion pattern modeling is required to pattern motion-specific data and to structure the patterned data for use.

동작 패턴 모델링 기법은 일반적으로 확률적 접근 방법을 사용한다. 동작 패턴 모델링을 위하여 본원 발명에서는 음성 인식, 손 제스처 인식 등에 사용하는 은닉 마르코프 모델을 사용하였다. 은닉 마르코프 모델은 모델링하기 어려운 패턴의 확률론적 구조를 명확하게 표현 가능한 기호들을 통하여 모델링하는 이중 확률론적 구조의 모델이다. 은닉 마르코프 모델은 패턴을 유한 상태 오토마타[Probabilistic finite state automata] 구조로 표현하며, 패턴의 유한 상태들은 시간 전후에 따른 결합 확률[Joint probability]로 표현할 수 있다. Behavior pattern modeling techniques generally use a stochastic approach. For the behavior pattern modeling, the present invention uses a hidden Markov model used for speech recognition, hand gesture recognition, and the like. Hidden Markov models are models of double stochastic structures that model stochastic structures of patterns that are difficult to model through clearly expressible symbols. The hidden Markov model expresses the pattern as a Probabilistic finite state automata structure, and the finite states of the pattern can be expressed as a joint probability over time.

따라서 모델링을 위한 기호 집합은 패턴의 고유 특징과 시간 변화에 대하여 전후 관계성을 포함하는 형식이 되어야 한다. 본원 발명에서는 이러한 모델링 가능한 기호들, 즉 고유 데이터로서 시간 변화에 따른 위치 변화 집합, 즉 전술한 정규 동작 기호 시퀀스를 사용하였다. Therefore, the symbol set for modeling should be in the form of including the relationship between the inherent characteristics of the pattern and the time change. In the present invention, such modelable symbols, that is, a set of positional changes over time as the unique data, that is, the above-described normal motion symbol sequence, are used.

먼저 패턴 데이터와 시간과의 관계를 표현하기 위하여 패턴의 유한 상태들을 시간 t에 대하여 나타내고, 행동을 완료하는 순간 t n 까지 전개되는 과정을 모델링하기 위하여 t+1의 상태를 t상태의 영향력으로 표현한다. t에서의 상태를 w(t)라 하면, 전체 길이 T의 상태 시퀀스에서의 특정 상태 w i 는 다음 수학식 1과 같이 표현할 수 있다.First, in order to express the relationship between the pattern data and time, the finite states of the pattern are represented with respect to time t , and the moment t n is completed. The state of t + 1 is expressed as the influence of t state in order to model the process that evolves up to. If the state at t is w (t) , the specific state w i in the state sequence of the entire length T can be expressed as Equation 1 below.

Figure 112009005183796-pat00009
Figure 112009005183796-pat00009

시간 t일때의 상태 w i (t)에 대해서 시간 t+1일때의 상태 w j (t+1)가 될 확률은 다음 수학식 2와 같이 전이 확률[Transition Probability] a ij 로 표시할 수 있다.Probability that the time condition w j (t + 1) of the t + 1 when for state w i (t) of time t when can be represented by the transition probabilities [Transition Probability] a ij, as shown in the following equation (2).

Figure 112009005183796-pat00010
Figure 112009005183796-pat00010

a ij 의 전체 집합 모델 θ와 전체 길이 T의 상태 시퀀스가 있다면, 모델 θ가 이 상태 시퀀스를 생성할 확률은 일련의 상태들 간의 전이 확률을 곱하는 것으로 나타낼 수 있다. If there is a full set model θ of a ij and a state sequence of full length T , then the probability that the model θ generates this state sequence can be represented by multiplying the transition probability between the series of states.

시간 t에서의 기호를 v(t)라 하면, 전체 길이 T의 기호 시퀀스에서 특정 기호 v k 는 다음 수학식 3과 같이 나타낼 수 있다.If the symbol at time t is v (t) , the specific symbol v k in the symbol sequence of the full length T may be expressed as in Equation 3 below.

Figure 112009005183796-pat00011
Figure 112009005183796-pat00011

상태 w j 에서 관측될 수 있는 기호, 즉 동작의 운동 벡터 정보에 대한 기호를v k 라 하면, 시간 t의 어떤 상태 w j (t)에서 기호 v k (t)가 발생할 확률은 P(v k (t)|w j (t))이다. If the symbol that can be observed in state w j , that is, the symbol for motion vector information of the motion, is v k , then the probability that the symbol v k (t) will occur in any state w j (t) at time t is P (v k (t) | w j (t))

즉, 전체 길이 T에 대한 기호 집합이 주어졌을 때 시간 t에 대한 기호 v k (t)가 발생할 확률이 높은 상태 w j (t)를 찾아감으로서 전체 상태 시퀀스를 모델링할 수 있다. That is, the entire state sequence can be modeled by finding a state w j (t) having a high probability that a symbol v k (t ) for time t is given when a symbol set for the entire length T is given.

모델의 상태와 기호의 개수에 따른 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)를 정리하면 다음 수학식 4와 같다.The state transition probability distribution (A) according to the state of the model and the number of symbols and the probability occurrence probability distribution (B) of each state are summarized as in Equation 4 below.

Figure 112009005183796-pat00012
Figure 112009005183796-pat00012

Figure 112009005183796-pat00013
Figure 112009005183796-pat00013

수학식 4에서 c는 상태의 개수이며, k는 기호의 개수를 의미하며, W T 는 상태 시퀀스, V T 는 기호 시퀀스이며, 모든 i에 대해서

Figure 112009005183796-pat00014
을 만족하고, 모든 j에 대해서
Figure 112009005183796-pat00015
를 만족한다. 또한 WT는 T개의 원소를 가질 수 있으며, VT도 T개의 원소를 가질 수 있다. In Equation 4, c is the number of states, k is the number of symbols, W T is a sequence of states, V T is a sequence of symbols, for all i
Figure 112009005183796-pat00014
For all j
Figure 112009005183796-pat00015
. In addition, W T may have T elements, and V T may also have T elements.

정리된 수학식 4를 기초로 동작 모델 θ에 대한 파라미터 집합 A, B, 즉 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)의 값은 모델링할 동작의 기호 시퀀스를 이용한 학습 과정을 통하여 구할 수 있다.Based on Equation 4, the values of the parameter sets A and B for the motion model θ, that is, the state transition probability distribution (A) and the symbol occurrence probability distribution (B) in each state are calculated using a symbol sequence of the motion to be modeled. Can be obtained through the learning process.

파라미터 값 계산은 다음과 같은 역방향 알고리즘을 사용한다. The parameter value calculation uses the following backward algorithm.

모델 θ가 상태 w i (t)에 있을 때 t까지의 상태 시퀀스 생성 확률을 α i (t)라하고 t+1T 까지의 나머지 상태 시퀀스 생성확률을 β i (t)라 한다면 다음 수학식 5와 같이 표현할 수 있다.When the model θ is in state w i (t) , the probability of generating the state sequence up to t is α i (t) , and the probability of generating the remaining state sequences from t + 1T is β i (t) . It can be expressed as 5.

Figure 112009005183796-pat00016
Figure 112009005183796-pat00016

수학식 5를 이용하여 β i (T-1)을 구하면 수학식 6으로 표시할 수 있다.If β i (T-1) is obtained using Equation 5, it may be expressed by Equation 6.

Figure 112009005183796-pat00017
Figure 112009005183796-pat00017

수학식 6을 통하여 구해진 β i (T-1)를 이용하여 β i (T-2)를 구할 수 있으며, 역방향으로 이와 같은 과정을 반복해서 β i (t)를 구할 수 있다. Β i (T-2) can be obtained using β i (T-1) obtained through Equation 6, and β i (t) can be obtained by repeating this process in the reverse direction.

도 4는 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 β i (t)를 구하는 예를 나타내는 도면이다.4 is a diagram illustrating an example of obtaining β i (t) in the hidden Markov model-based motion recognition method according to the present invention.

도 4를 참조하면, 각 상태에 대해서 전체 길이 T를 기초로 β i (t)를 구하며, 해당 시점에서의 최대값, 즉 β MAX (1) 내지 β MAX (T)가 도시된다.Referring to FIG. 4, β i (t) is obtained for each state based on the total length T , and maximum values at that time, that is, β MAX (1) to β MAX (T) are shown.

수학식 6에서 결정되어야 하는 전이 확률 a ij 와 관측 확률 b jk 의 추정 값

Figure 112009005183796-pat00018
,
Figure 112009005183796-pat00019
은 학습을 위한 기호 시퀀스 V T 를 통하여 구할 수 있다. Estimated value of transition probability a ij and observation probability b jk to be determined in Equation 6
Figure 112009005183796-pat00018
,
Figure 112009005183796-pat00019
Can be obtained through the symbol sequence V T for learning.

상태 w i (t-1)에서 상태 w j (t)로의 전이 기대 확률을

Figure 112009005183796-pat00020
라 하면,
Figure 112009005183796-pat00021
는 다음 수학식 7과 같이 나타낼 수 있다. Expected probability of transition from state w i (t-1 ) to state w j (t)
Figure 112009005183796-pat00020
Say,
Figure 112009005183796-pat00021
May be expressed as in Equation 7 below.

Figure 112009005183796-pat00022
Figure 112009005183796-pat00022

상태 w i (t-1)에서 상태 w j (t)로의 전이 기대 수는

Figure 112009005183796-pat00023
로 나타낼 수 있으며, w i 로부터의 임의의 전이 전체 기대 수는
Figure 112009005183796-pat00024
로 나타낼 수 있다. The expected number of transitions from state w i (t-1) to state w j (t) is
Figure 112009005183796-pat00023
And the total expected number of any transition from w i is
Figure 112009005183796-pat00024
It can be represented as.

따라서 추정

Figure 112009005183796-pat00025
w i 에서 w j 로의 전이 기대 수와 w i 로부터의 임의의 전이의 대한 전체 기대 수간의 비율로 찾아 낼 수 있으며, 같은 방법으로 상태 w j 에서 특정 v k 가 관측되는 빈도와 임의의 기호에 대한 빈도 간의 비율을 계산하여 추정
Figure 112009005183796-pat00026
를 구할 수 있다.Thus estimated
Figure 112009005183796-pat00025
Can be found as the ratio between the expected number of transitions from w i to w j and the total expected number of arbitrary transitions from w i , and in the same way depends on the frequency at which particular v k is observed in state w j and on any symbol. By calculating the ratio between frequencies for
Figure 112009005183796-pat00026
Can be obtained.

수학식 8 내지 수학식 9는 전이 확률 a ij 와 관측 확률 b jk 의 추정 값,

Figure 112009005183796-pat00027
Figure 112009005183796-pat00028
를 각각 나타낸다.Equations 8 to 9 are estimated values of the transition probability a ij and the observation probability b jk ,
Figure 112009005183796-pat00027
And
Figure 112009005183796-pat00028
Respectively.

Figure 112009005183796-pat00029
Figure 112009005183796-pat00029

Figure 112009005183796-pat00030
Figure 112009005183796-pat00030

수학식 8과 수학식 9를 이용하면, 동작 모델 θ에 대한 파라미터 집합 A, B, 즉 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)의 값을 구할 수 있다.Using Equations 8 and 9, the values of parameter sets A and B for the motion model θ, namely, the state transition probability distribution A and the symbol occurrence probability distribution B in each state can be obtained.

도 5는 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서, 추정값을 이용하여 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)를 추출하는 알고리즘의 예를 나타내는 도면이다.5 is a diagram illustrating an example of an algorithm for extracting a state transition probability distribution A and a symbol occurrence probability distribution B in each state in the hidden Markov model-based motion recognition method according to the present invention. .

도 5를 참조하면, 학습 알고리즘을 이용하여 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)를 추출할 수 있다.Referring to FIG. 5, a state transition probability distribution A and a symbol occurrence probability distribution B in each state may be extracted using a learning algorithm.

우선 전이 확률 a ij 와 관측 확률 b jk 를 초기화하고 학습 시퀀스, 즉 기호 시퀀스 VT를 학습한다. a ij (z)와 a ij (z-1), b jk (z)와 b jk (z-1)의 차이가 기준값인 ε이하 인 경우 동안 수학식 8과 수학식 9를 이용하여

Figure 112009005183796-pat00031
Figure 112009005183796-pat00032
를 반복적으로 구한다.First, the transition probability a ij and the observation probability b jk are initialized and the learning sequence, that is, the symbol sequence V T is learned. If the difference between a ij (z) and a ij (z-1), b jk (z) and b jk (z-1) is less than or equal to the reference value ε,
Figure 112009005183796-pat00031
And
Figure 112009005183796-pat00032
Get it repeatedly.

이후 최종적으로 추출한

Figure 112009005183796-pat00033
Figure 112009005183796-pat00034
를 전이 확률 a ij 와 관측 확률 b jk 로 지정하는 것에 의해서 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)를 구할 수 있다.After the final extraction
Figure 112009005183796-pat00033
And
Figure 112009005183796-pat00034
By specifying the transition probability a ij and the observation probability b jk , the state transition probability distribution A and the symbol occurrence probability distribution B in each state can be obtained.

전술한 과정을 통하여 동작 패턴 모델링이 완료된다.Operation pattern modeling is completed through the above-described process.

이후 사용자 동작의 특징점들의 시간에 따른 위치 변화를 기초로 사용자 동작 기호 시퀀스를 추출한다(S150).Thereafter, the user's motion symbol sequence is extracted based on the change in position of the feature points of the user's motion over time (S150).

사용자 동작 기호 시퀀스는 도 2 내지 도 3을 참조로 설명한 정규 동작 기호 시퀀스의 추출과 동일하므로 상세한 설명을 생략한다.Since the user operation symbol sequence is the same as the extraction of the normal operation symbol sequence described with reference to FIGS. 2 to 3, a detailed description thereof will be omitted.

이후 단계 S150에서 추출한 사용자 동작 기호 시퀀스를 단계 S130에서의 동작 패턴 모델링을 비교하여 사용자 동작을 인식한다(S170).Thereafter, the user motion symbol sequence extracted in step S150 is compared with the motion pattern modeling in step S130 to recognize the user motion (S170).

단계 S130에서의 동작 패턴 모델링 과정을 통하면, 동작 패턴 모델 θ는 구해진 파라미터 집합 A, B로 표현할 수 있다.Through the operation pattern modeling process in step S130, the operation pattern model θ may be expressed by the obtained parameter sets A and B.

본원 발명에서는 동작을 인식하기 위해서 학습 과정을 통해 구해진 모델 θ에 대하여 사용자 동작 기호 시퀀스와 학습에 이용하였던 정규 동작 기호 시퀀스를 이용하여 각각의 매칭 확률을 구한 후, 두 확률의 차가 일정 이하일 때 해당 동작 모델과 유사한 동작을 행동한 것으로 지정하는 방식을 사용한다.In the present invention, after each matching probability is obtained by using the user's motion symbol sequence and the normal motion symbol sequence used for learning with respect to the model θ obtained through the learning process in order to recognize the motion, when the difference between the two probabilities is less than a predetermined motion Use behaviors that designate model-like behavior as actions.

모델에 대한 매칭 확률을 계산하는 방법은 모델링 시에 사용하였던 기호 시퀀스와 상태 시퀀스의 관계성을 이용하여 최적의 상태 시퀀스를 생성하고, 이러한 상태 시퀀스를 이용하여 전체 길이 T에 대하여 상태 전이 확률과 기호 시퀀스의 발생 확률을 곱하는 방식을 사용할 수 있다.The method of calculating the matching probability for the model generates an optimal state sequence using the relationship between the symbol sequence and the state sequence used in the modeling, and the state transition probability and the symbol for the entire length T using the state sequence. A method of multiplying the occurrence probability of the sequence may be used.

즉 사용자 동작 기호 시퀀스 V T 를 통하여 정규 모델 θ에서의 상태 전이 경로(Path)를 구하고, t→T의 경로값(전이 확률 값)의 합 Sum(X1=APath)과 모델링 시에 사용한 정규 동작 기호 시퀀스로 구할 수 있는 Sum(X2=APath) 값의 차이로 가장 가까운 동작을 인식할 수 있다.In other words, the state transition path (Path) in the regular model θ is obtained through the user's motion symbol sequence V T , and the sum Sum (X 1 = A Path ) of the path value (transition probability value) of t → T and the normal used in modeling. The closest motion can be recognized by the difference between Sum (X 2 = A Path ) values, which can be obtained as the action symbol sequence.

상태 전이 경로의 탐색은 다음과 같이 수행될 수 있다.The search of the state transition path may be performed as follows.

도 6은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 최적 경로를 검색하는 알고리즘의 예를 나타내는 도면이다.6 is a diagram illustrating an example of an algorithm for searching for an optimal path in the hidden Markov model-based motion recognition method according to the present invention.

도 6을 참조하면, T 이하의 t에 대해서, 모델 θ가 상태 w i (t)에 있을 때 t까지의 상태 시퀀스 생성 확률 α j (t)을 연산한 후 해당 시점에서의 α j (t)가 최대값을 가지는 경우를 경로에 추가한다. 이와 같은 동작을 T까지 반복하여 최적 경로를 탐색할 수 있다.6, the model θ is α j (t) at that time and then calculating the t α j (t) status sequence, the probability of occurrence of until the condition w i (t) with respect to the following T t Adds to the path if has the maximum value. This operation can be repeated up to T to search for the optimal path.

도 7은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 도 6의 알고리즘을 이용하여 생성된 최적 경로를 예시적으로 나타내는 도면이다.FIG. 7 is a diagram illustrating an optimal path generated using the algorithm of FIG. 6 in the hidden Markov model-based motion recognition method according to the present invention.

도 7을 참조하면, 해당 시점에서의 α j (t)가 최대값을 가지는 경우 즉 α MAX (1) 내지 α MAX (T)를 이용하여 최적 경로가 탐색된다.Referring to FIG. 7, when α j (t) has a maximum value at that time, that is , an optimal path is searched using α MAX (1) to α MAX (T) .

최적 경로는 T까지의 경로 값의 합이 가장 큰 경로이므로 경로 검색은 지역 탐색이 아닌 전역 탐색을 사용하여야 한다.Since the optimal path is the path with the largest sum of the path values up to T, the path search should use global search, not local search.

이와 같은 과정을 통하여 사용자 동작을 인식할 수 있다.Through this process, the user's motion can be recognized.

한편 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법은 사용자 동작 기호 시퀀스와 정규 동작 기호 시퀀스를 비교하여 사용자 동작과 정규 동작의 동작 유사도를 추출하는 단계를 더 포함할 수 있다.Meanwhile, the hidden Markov model-based motion recognition method according to the present invention may further include extracting motion similarity between the user motion and the normal motion by comparing the user motion symbol sequence with the normal motion symbol sequence.

동작 유사도는 비교 대상이 되는 두 개의 동작에 대한 단계별 일치 정도를 나타내는 척도이다. 그러나 은닉 마르코프 모델은 확률적으로 접근을 수행하므로 비교 대상이 되는 두 개의 동작에 대해서 전체 시간 T에 대한 매칭 확률을 계산하여 두 개의 동작에 대한 매칭 확률을 추출하기 때문에 단계별 동작 일치에 대한 동작 유사도를 나타내지 못하는 단점이 있다.The motion similarity is a measure of the degree of correspondence between two motions to be compared. However, since the hidden Markov model performs a probabilistic approach, it calculates the matching probabilities for the entire time T for the two motions to be compared and extracts the matching probabilities for the two motions. There is a disadvantage that can not be represented.

본원 발명에서는, 기호 시퀀스를 사용하여 부분 동작에 대한 동작 유사도를 추출한다.In the present invention, a symbol sequence is used to extract motion similarity for partial motion.

학습에 사용되었던 정규 동작의 기호 시퀀스를 S1이라고 하고, 사용자 동작의 기호 시퀀스를 S2라 할 때, 두 시퀀스가 완전 일치 했을 시의 기준값에서 점수 행렬(Score Matrix)을 이용하여 두 시퀀스 S1과 S2를 일치 시키는데 발생하는 비용(Cost)의 합을 감산하는 방식으로 동작 유사도를 추출할 수 있다.When the symbol sequence of the normal operation used for learning is called S 1 , and the symbol sequence of the user's action is S 2 , the two sequences S 1 using a score matrix at a reference value when the two sequences match perfectly. The motion similarity can be extracted by subtracting the sum of costs incurred from matching S 2 to S 2 .

좀 더 구체적으로, S1과 S2에 포함되는 시퀀스 집합을 Λ라 하고 Λ에 공백이 추가된 집합을 Λ'라 할 때, Λ'에 있는 임의의 원소 x와 y를 정렬할 때 발생하는 비용을 추출하는 함수를 s(x, y)로 가정한다.More specifically, when the set of sequences included in S 1 and S 2 is called Λ and the set with spaces added to Λ is Λ ', the cost incurred when aligning arbitrary elements x and y in Λ' Assume that s (x, y) is a function that extracts.

이 경우 S1과 S2의 두 시퀀스를 일치 시키는데 발생하는 전체 비용은 다음 수학식 10과 같이 표현할 수 있다.In this case, the total cost incurred in matching two sequences of S 1 and S 2 may be expressed as in Equation 10 below.

Figure 112009005183796-pat00035
Figure 112009005183796-pat00035

여기에서, S1'(i), S2'(i)는 공백을 고려한 S1과 S2의 i번째 기호를 나타내며, l은 정렬의 길이를 나타낸다.Here, S 1 '(i), S 2 ' (i) represents the i-th symbol of S 1 and S 2 in consideration of white space, and l represents the length of the alignment.

한편 s(S1'(i), S2'(i))는 다음과 같은 값을 가질 수 있다.Meanwhile, s (S 1 '(i), S 2 ' (i)) may have the following values.

삽입비용(insCost)은 S1'(i)가 공백이 아니고 S2'(i)가 공백일 때 발생하는 비용이다. 본 발명에서 삽입 비용은 예컨대 5로 지정할 수 있다.The insertion cost (insCost) is a cost incurred when S 1 '(i) is not empty and S 2 ' (i) is empty. In the present invention, the insertion cost can be designated as 5, for example.

삭제비용(delCost)은 S1'(i)가 공백이고, S2'(i)가 공백이 아닐 때 발생하는 비용이다. 본 발명에서 삭제 비용은 예컨대 5로 지정할 수 있다.The delete cost (delCost) is a cost incurred when S 1 '(i) is blank and S 2 ' (i) is not blank. In the present invention, the deletion cost can be specified as, for example, five.

교체비용(ChangeCost)는 S1'(i)와 S2'(i)가 모두 공백이 아니고, 같지 않을 때 발생하는 비용이다. 본 발명에서 교체 비용은 예컨대 7로 지정할 수 있다.ChangeCost is a cost incurred when S 1 '(i) and S 2 ' (i) are both non-blank and not equal. In the present invention, the replacement cost can be designated, for example.

한편 S1'(i)와 S2'(i)가 동일할 때는 s(S1'(i), S2'(i))는 정합 비용, 예컨대 0으로 값을 지정할 수 있다.On the other hand, when S 1 '(i) and S 2 ' (i) is the same, s (S 1 '(i), S 2 ' (i)) can be assigned a value, such as 0, the matching cost.

S1 = {6, 2, 7, 6, 3, 6}, S2 = {6, 2, 3, 2, 3, 7}이라고 가정하면, Λ = {2, 3, 6, 7}로 나타낼 수 있다.Assuming that S 1 = {6, 2, 7, 6, 3, 6}, and S 2 = {6, 2, 3, 2, 3, 7}, Λ = {2, 3, 6, 7} Can be.

한편 공백을 고려하여 S1'이 {6, 2, 7, -, 6, 3, 6}이고, S2'가 {6, 2, 3, 2, -, 3, 7}로 가정하자,('-'는 공백을 나타냄).On the other hand, suppose S 1 'is {6, 2, 7,-, 6, 3, 6} and S 2 ' is {6, 2, 3, 2,-, 3, 7} with spaces in mind, ( '-' Represents a space).

이 경우 Λ'의 점수 행렬은 다음 표 1을 기초로 설정될 수 있다.In this case, the score matrix of Λ 'may be set based on the following Table 1.

SS 22 33 66 77 -- 22 00 77 77 77 55 33 00 77 77 55 66 00 77 55 77 00 55 -- 00

점수행렬에서는 x, y가 매칭되면 s(x,y)는 0이고, 매칭되지 않으면 s(x, y)는 0보다 큰 값을 가지게 한다. 매칭되지 않는 경우의 값은 전술한 삽입 비용, 삭제 비용 및 교체 비용으로 설정하였으며, 표 1에서 삽입 비용은 5, 삭제 비용은 5, 교체 비용은 7을 사용하였다.In the score matrix, if x and y match, s (x, y) is zero, and if it does not match, s (x, y) has a value greater than zero. In the case of non-matching, the insertion cost, the deletion cost, and the replacement cost were set as described above. In Table 1, the insertion cost was 5, the deletion cost was 5, and the replacement cost was 7.

이 경우 수학식 10을 이용하여 전체 비용을 계산하면 다음과 같다.In this case, the total cost is calculated using Equation 10 as follows.

S1'의 첫번째 기호는 S2'의 첫번째 기호와 일치하므로 s(S1'(1), S2'(1))은 0이다.The first symbol of S 1 ′ corresponds to the first symbol of S 2 ′, so s (S 1 '(1), S 2 ' (1)) is 0.

S1'의 두번째 기호는 S2'의 두번째 기호와 일치하므로 s(S1'(2), S2'(2))은 0이다.S 1 'of the second symbol S 2', so match the second symbol of the s (S 1 '(2) , S 2' (2)) is zero.

S1'의 세번째 기호는 S2'의 세번째 기호와 일치하지 않으며, s(S1'(3), S2'(3))은 교체 비용인 7의 값을 가진다.S 1 'of the third symbol S 2' does not match the sign of the third, s (S 1 '(3 ), S 2' (3)) has a value of 7, the replacement cost.

S1'의 네번째 기호는 공백이므로 s(S1'(4), S2'(4))은 삭제 비용인 5의 값을 가진다.Since the fourth symbol of S 1 ′ is blank, s (S 1 '(4), S 2 ' (4)) has a value of 5, which is the deletion cost.

S1'의 다섯번째 기호는 공백이 아니고 S2'의 다섯번째 기호는 공백이므로 s(S1'(5), S2'(5))은 삽입 비용인 5의 값을 가진다.Since the fifth symbol of S 1 'is not blank and the fifth symbol of S 2 ' is blank, s (S 1 '(5), S 2 ' (5)) has a value of 5, which is an insertion cost.

S1'의 여섯번째 기호는 S2'의 여섯번째 기호와 일치하므로 s(S1'(6), S2'(6))은 0이다.The sixth symbol of S 1 'corresponds to the sixth symbol of S 2 ', so s (S 1 '(6), S 2 ' (6)) is zero.

S1'의 일곱번째 기호는 S2'의 일곱번째 기호와 일치하지 않으며, s(S1'(7), S2'(7))은 교체 비용인 7의 값을 가진다.S 1 'of the seventh symbol S 2' does not match the sign of the seventh, s (S 1 '(7 ), S 2' (7)) has a value of 7, the replacement cost.

전체 비용은 각 비용의 합인 24를 가진다.The total cost has 24, the sum of each cost.

따라서 기준값을 예컨대 100으로 가정하면, 동작 유사도는 기준값에서 전체 비용을 감산한 76의 값을 가진다.Thus, assuming a reference value of 100, for example, the operational similarity has a value of 76 minus the total cost from the reference value.

한편 전술한 기호 시퀀스 S1과 S2는 단위 시간당 운동 벡터로 표현되는 방향 정보 형식을 가진다. 기호 시퀀스를 시간 축에 독립적으로 변환하기 위하여 동일한 기호가 반복되는 경우 반복되는 기호를 하나로 줄일 수 있다. 반복성이 제거된 기호 시퀀스의 형태는 시간 간격에 대한 정보가 제거됨과 동시에 동작의 형태를 나타내는 데이터 형식을 가지게 된다. 전술한 동작 유사도의 측정을 위해서 반복성이 제거된 기호 시퀀스를 사용하여 연산 량을 최소화할 수도 있다. Meanwhile, the aforementioned symbol sequences S 1 and S 2 have a direction information format expressed as a motion vector per unit time. If the same symbol is repeated to convert the symbol sequence independently of the time axis, the repeated symbol can be reduced to one. The form of the symbol sequence from which the repeatability is removed has a data format indicating the form of the operation while removing the information on the time interval. In order to measure the aforementioned motion similarity, the amount of computation may be minimized by using a symbol sequence from which repeatability is removed.

특히 부분 동작의 동작 유사도를 추출하기 위하여, 전술한 점수행렬을 사용하여 가능한 가장 작은 값을 가지는 전체 비용을 추출하고, 기준값에서 추출된 전체 비용을 감산하여 동작 유사도를 추출할 수 있다.In particular, in order to extract the motion similarity of the partial motion, the overall cost having the smallest possible value may be extracted using the aforementioned score matrix, and the motion similarity may be extracted by subtracting the total cost extracted from the reference value.

한편 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법의 실험을 위하여 영상 처리, 동작 인식 등 연산 처리를 위한 호스트 컴퓨터 1대와 사용자 디스플레이를 위한 컴퓨터 1대를 이용하여 시스템을 구성하고 실험을 수행하였다. On the other hand, for the experiment of the hidden Markov model-based motion recognition method according to the present invention, a system was constructed and experimented using one host computer for computation processing such as image processing and motion recognition and one computer for user display.

실험 방법은 첫번째로 3개의 샘플 동작에 대하여 각각 2, 3m 정도 거리에서 10회, 20회, 30회 반복 실험에 의한 동작 인식율을 산출하고, 두번째로 한 동작을 2~5구간으로 구분하여 각 구간에 대한 부분 동작 실험으로 동작 유사도를 추출하였다. Experimental method firstly calculates the motion recognition rate by 10, 20, and 30 repetition experiments at distances of 2, 3m for each of the three sample motions, and divides one motion into 2 to 5 sections. The motion similarity was extracted by the partial motion experiment for.

샘플 동작은 다음 표 2와 같다.Sample operations are shown in Table 2 below.

구분division 동 작Action 특 징Characteristic AA 의자에 앉아 양손을 번갈아 들어올리기Sitting in a chair, lifting both hands alternately 팔의 움직임, 몸을 중심으로 팔의 반원 움직임Arm movement, half-circle movement of the arm around the body BB 의자에서 일어나기Waking up from a chair 상하 움직임Up and down movement CC 좌로 3걸음 이동하기Move 3 steps left 다리의 움직임, 좌우 움직임Leg movement

추출된 동작 인식률은 다음 표 3과 같다.The extracted motion recognition rates are shown in Table 3 below.

구분division 10회10th 20회20 times 30회30 times 2m2 m 3m3m 2m2 m 3m3m 2m2 m 3m3m AA 100%100% 100%100% 95%95% 95%95% 95%95% 95%95% BB 95%95% 95%95% 95%95% 90%90% 90%90% 90%90% CC 90%90% 90%90% 90%90% 90%90% 93%93% 93%93%

실험 결과, 카메라 위치를 기준으로 정면 운동에 대해서는 대해서는 95% 이상의 인식율을 보였으며, 거리에 따른 인식율 차이는 크지 않았다. 또한 샘플 동작 C에 대해서는 옆으로 이동할 시에 사용자의 행동에서 이동 시 마다 무게 중심이 이동되면서 정규 동작 보다 무게 중심이 심하게 이동하면서 이동한 경우에서 인식에 오차가 발생하였다. As a result, the recognition rate was more than 95% for the frontal movement based on the camera position. In addition, about the sample motion C, when the user's action is moved to the side, the center of gravity is moved every time the user moves.

한편 부분 동작에 대한 동작 유사도의 실험을 위해서 샘플 동작 A에 대해서 5 단계로 동작을 구분하고 전체 동작을 수행하지 않고 일부 단계 동작만을 행동하였을 때 동작 유사도 결과를 실험해 보았다. On the other hand, in order to experiment the motion similarity with respect to the partial motions, the motions were classified into 5 steps for the sample motion A, and the motion similarity results were tested when only some step motions were performed without performing the entire motion.

도 8은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 부분 동작의 동작 유사도 추출을 위한 단계 동작을 나타내는 도면이다.8 is a diagram illustrating a step operation for extracting a motion similarity of a partial motion in the hidden Markov model-based motion recognition method according to the present invention.

도 8을 참조하면, 샘플 A의 동작을 (a)왼손 들어올리기 (b)오른손 들어올리기 (c)양손 내리기 (d)양손 들어올리기 (e)양손 내리기로 구분하였다.Referring to Figure 8, the operation of Sample A was divided into (a) lifting the left hand (b) lifting the right hand (c) lowering both hands (d) lifting both hands (e) lowering both hands.

표 4는 추출된 부분 동작에 대한 동작 유사도를 나타낸다.Table 4 shows the motion similarity for the extracted partial motion.

구분division 2m2 m 3m3m a~ea ~ e 100100 100100 a~da ~ d 7272 7070 a~ca ~ c 5151 5151 d~ed ~ e 5555 5252 dd 1010 00

부분 동작에 대한 동작 유사도 추출 결과, 부분 단계 동작들을 모두 수행하였을 경우에는 거리에 관계없이 정규 동작과 사용자 동작이 정확하게 일치했음을 보였고, 부분 단계 동작들의 일부 단계를 수행하였을 경우 전체 동작에 비례한 동작 유사도를 나타냈다. 특히 동작의 처음 시작을 다르게 하였을 경우, 예컨대 d~e 또는 d만을 수행한 경우에 대해서도 부분적인 동작 유사도를 측정할 수 있다.As a result of extracting the motion similarity for partial motion, it was shown that the normal motion and the user motion exactly matched regardless of the distance when all the partial step motions were performed, and the motion similarity proportional to the overall motion when some steps of the partial motions were performed. Indicated. In particular, when the initial start of the operation is different, for example, even if only d-e or d is performed, the partial motion similarity can be measured.

본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법은 다양한 분야에 적용이 가능하다. 예컨대 동작 인식 기반 게임, 동작의 반복 훈련 및 훈련 달성 정도 측정, 동작 인식을 이용한 포스쳐 인식 등에 활용이 가능하다. 또한 부분 동작에 대한 유사도를 측정할 수 있으므로 정규 동작과의 비교 측정을 통하여 장애인 재활 훈련에 사용할 수 도 있다.The hidden Markov model-based motion recognition method according to the present invention can be applied to various fields. For example, it can be used for motion recognition based games, repetitive training and measurement of training achievement, and posture recognition using motion recognition. In addition, since the similarity to partial motion can be measured, it can be used for rehabilitation training for the disabled through comparison with regular motion.

또한 본 발명은 전술한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법의 각 단계를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 제공한다.The present invention also provides a computer-readable recording medium having recorded thereon a program for realizing each step of the above-described hidden Markov model-based motion recognition method according to the present invention.

컴퓨터로 판독 가능한 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있도록 데이터, 즉 코드 또는 프로그램 형태의 데이터가 저장되는 모든 종류의 기록 장치를 지칭한다. 이러한 컴퓨터로 판독 가능한 기록 매체는 예컨대 ROM, RAM 등의 메모리와, CD-ROM, DVD-ROM 등의 저장 매체, 자기 테이프, 플로피 디스크 등의 자기 저장 매체, 광 데이터 저장 장치 등이며, 예컨대 인터넷을 통한 전송 형태로 구현되는 경우도 포함한다. 또한 이러한 컴퓨터로 판독 가능한 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산 방식으로 컴퓨터가 판독 가능한 데이터가 저장되고 실행될 수 있다.A computer readable recording medium refers to any kind of recording device that stores data, that is, data in code or program form, so that it can be read by a computer system. Such computer-readable recording media include, for example, memories such as ROM and RAM, storage media such as CD-ROM and DVD-ROM, magnetic storage media such as magnetic tape and floppy disk, optical data storage devices, and the like. It also includes a case where it is implemented in the form of transmission via. Such computer readable recording media can also be distributed over network coupled computer systems so that the computer readable data is stored and executed in a distributed fashion.

그러나 이러한 컴퓨터로 판독 가능한 기록 매체에 대한 상세한 설명은 도 1내지 도 8을 참조로 설명한 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법과 중복되므로 생략한다.However, a detailed description of such a computer-readable recording medium is omitted because it overlaps with the hidden Markov model-based motion recognition method according to the present invention described with reference to FIGS.

비록 본 발명의 구성이 구체적으로 설명되었지만 이는 단지 본 발명을 예시적으로 설명한 것에 불과한 것으로, 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 변형이 가능할 것이다.Although the configuration of the present invention has been described in detail, these are merely illustrative of the present invention, and various modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. This will be possible.

따라서 본 명세서에 개시된 실시예들은 본 발명을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 사상과 범위가 한정되는 것은 아니다. 본 발명의 범위는 아래의 청구범위에 의해 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다. Therefore, the embodiments disclosed in the present specification are intended to illustrate rather than limit the present invention, and the scope and spirit of the present invention are not limited by these embodiments. It is intended that the scope of the invention be interpreted by the following claims, and that all descriptions within the scope equivalent thereto will be construed as being included in the scope of the present invention.

이상 설명한 바와 같이, 본 발명에 따르면 동작의 특징점들을 추출하고 동작의 특징점들의 시간에 따른 위치 변화를 은닉 마르코프 모델을 이용하여 동작 패턴 모델링을 수행한 후 동작 패턴 모델링과 사용자 동작을 비교하여 동작 인식 및 동작 유사도를 추출할 수 있다. 예컨대 동작 인식 기반 게임, 동작의 반복 훈련 및 훈련 달성 정도 측정, 동작 인식을 이용한 포스쳐 인식 등에 활용이 가능하다. 또한 부분 동작에 대한 유사도를 측정할 수 있으므로 정규 동작과의 비교 측정을 통하여 장애인 재활 훈련에 사용할 수 도 있다.As described above, according to the present invention, after extracting the feature points of the motion and performing the motion pattern modeling using the hidden Markov model of the positional change of the feature points of the motion over time, the motion pattern modeling and the user motion are compared and the motion recognition and Motion similarity can be extracted. For example, it can be used for motion recognition based games, repetitive training and measurement of training achievement, and posture recognition using motion recognition. In addition, since the similarity to partial motion can be measured, it can be used for rehabilitation training for the disabled through comparison with regular motion.

도 1은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법의 예시적인 흐름도.1 is an exemplary flow diagram of a hidden Markov model based motion recognition method in accordance with the present invention.

도 2 내지 도 3은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 특징점의 위치 및 시간에 따른 위치 변화를 이용하여 정규 동작 기호 시퀀스를 생성하는 예를 나타내는 도면.2 to 3 are diagrams illustrating an example of generating a normal motion symbol sequence using a position change of a feature point and a position according to time in a hidden Markov model-based motion recognition method according to the present invention.

도 4는 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 β i (t)를 구하는 예를 나타내는 도면.4 is a diagram illustrating an example of obtaining β i (t) in the hidden Markov model-based motion recognition method according to the present invention.

도 5는 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 추정값을 이용하여 상태 전이 확률 분포(A)와 각 상태에서의 기호 발생 확률 분포(B)를 추출하는 알고리즘의 예를 나타내는 도면.5 is a diagram illustrating an example of an algorithm for extracting a state transition probability distribution A and a symbol occurrence probability distribution B in each state using estimated values in a hidden Markov model-based motion recognition method according to the present invention.

도 6은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 최적 경로를 검색하는 알고리즘의 예를 나타내는 도면.6 illustrates an example of an algorithm for searching for an optimal path in a hidden Markov model-based motion recognition method according to the present invention.

도 7은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 도 6의 알고리즘을 이용하여 생성된 최적 경로를 예시적으로 나타내는 도면.7 is a diagram illustrating an exemplary optimal path generated using the algorithm of FIG. 6 in a hidden Markov model-based motion recognition method according to the present invention.

도 8은 본 발명에 따른 은닉 마르코프 모델 기반 동작 인식 방법에 있어서 부분 동작의 동작 유사도 추출을 위한 단계 동작을 나타내는 도면.8 is a diagram illustrating a step operation for extracting a motion similarity of a partial motion in a hidden Markov model-based motion recognition method according to the present invention.

Claims (13)

(a) 정규 동작의 특징점들의 시간에 따른 위치 변화를 기초로 정규 동작 기호 시퀀스를 생성하는 단계와,(a) generating a normal motion symbol sequence based on a change in position of the feature points of the normal motion over time; (b) 상기 정규 동작 기호 시퀀스에 대해서 은닉 마르코프 모델을 사용하여 동작 패턴 모델링을 수행하는 단계와,(b) performing motion pattern modeling on the regular motion symbol sequence using a hidden Markov model; (c) 사용자 동작의 특징점들의 시간에 따른 위치 변화를 기초로 사용자 동작 기호 시퀀스를 추출하는 단계와,(c) extracting a user action symbol sequence based on a change in position of feature points of the user action over time; (d) 상기 사용자 동작 기호 시퀀스를 상기 단계 (b)에서의 상기 동작 패턴 모델링을 비교하여 상기 사용자 동작을 인식하는 단계(d) comparing the motion pattern modeling in the step (b) with the user motion symbol sequence to recognize the user motion 를 포함하되,Including, (e) 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 비교하여 상기 사용자 동작과 상기 정규 동작의 동작 유사도를 추출하는 단계(e) extracting a motion similarity between the user motion and the normal motion by comparing the user motion symbol sequence with the normal motion symbol sequence; 를 더 포함하는 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method further comprising. 제1항에 있어서,The method of claim 1, 상기 단계 (a)는, (a-1) 상기 정규 동작의 특징점들의 시간에 따른 위치 변화의 방향 벡터가 포함되는 공간에 따라서 상기 정규 동작 기호 시퀀스를 생성하는 단계를 포함하는 것이고,The step (a) includes the step of (a-1) generating the normal motion symbol sequence according to a space including a direction vector of the positional change over time of the feature points of the normal motion, 상기 단계 (c)는, (c-1) 상기 사용자 동작의 특징점들의 시간에 따른 위치 변화의 방향 벡터가 포함되는 공간에 따라서 상기 사용자 동작 기호 시퀀스를 생성하는 단계를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.The step (c) may include (c-1) generating the user gesture symbol sequence according to a space including a direction vector of the positional change over time of the feature points of the user gesture. Motion recognition method. 제2항에 있어서,The method of claim 2, 상기 단계 (a-1)는, (a-2) 상기 정규 동작의 초기 특징점들의 무게 중심과 상기 정규 동작의 초기 특징점들 사이의 방향 벡터가 포함되는 공간에 따라서 상기 정규 동작 기호 시퀀스의 초기 값을 결정하는 단계를 포함하는 것이고,In the step (a-1), (a-2) an initial value of the normal motion symbol sequence according to a space including a direction vector between the center of gravity of the initial feature points of the normal operation and the initial feature points of the normal operation is included. Making a decision, 상기 단계 (c-1)는, (c-2) 상기 사용자 동작의 초기 특징점들의 무게 중심과 상기 사용자 동작의 초기 특징점들 사이의 방향 벡터가 포함되는 공간에 따라서 상기 사용자 동작 기호 시퀀스의 초기 값을 결정하는 단계를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.In the step (c-1), (c-2) the initial value of the user gesture symbol sequence may be determined according to a space including a direction vector between the centers of gravity of the initial feature points of the user motion and the initial feature points of the user motion. And determining the hidden Markov model based motion recognition method. 제1항에 있어서, 상기 단계 (b)는, The method of claim 1, wherein step (b) (b-1) 상기 동작 패턴 모델링을 구성하는 상태의 전이 확률 a ij 와 관측 확률 b jk 를 초기화하는 단계와,(b-1) initializing transition probabilities a ij and observation probabilities b jk of the states constituting the motion pattern modeling; (b-2) 전체 길이 T 이하의 z에 대해서 a ij (z)와 a ij (z-1), b jk (z)와 b jk (z-1)의 차이가 기준값 ε 이하인 경우 다음 수학식을 이용하여 추정값
Figure 112009005183796-pat00036
Figure 112009005183796-pat00037
를 반복적으로 추출하는 단계와,
(b-2) The difference between a ij (z) and a ij (z-1), b jk (z) and b jk (z-1) is less than or equal to the reference value ε for z less than or equal to the total length T Estimate using
Figure 112009005183796-pat00036
And
Figure 112009005183796-pat00037
Extracting it repeatedly;
Figure 112009005183796-pat00038
,
Figure 112009005183796-pat00039
Figure 112009005183796-pat00038
,
Figure 112009005183796-pat00039
[
Figure 112009005183796-pat00040
는 상태 w i (t-1)에서 상태 w j (t)로의 전이 기대 확률, v k 는 정규 동작 기호 시퀀스 내의 기호를 나타냄]
[
Figure 112009005183796-pat00040
Is the expected probability of transition from state w i (t-1 ) to state w j (t) , and v k represents a symbol in the sequence of normal behavior symbols]
(b-3) 최종적으로 추출한
Figure 112009005183796-pat00041
Figure 112009005183796-pat00042
를 전이 확률 a ij 와 관측 확률 b jk 로 지정하는 단계
(b-3) finally extracted
Figure 112009005183796-pat00041
And
Figure 112009005183796-pat00042
Specifying the transition probability a ij and the observation probability b jk
를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method comprising a.
제1항에 있어서, 상기 단계 (d)는, The method of claim 1, wherein step (d) (d-1) 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스 각각의 매칭 확률을 상기 동작 패턴 모델링을 기초로 추출하는 단계와,(d-1) extracting matching probabilities of the user motion symbol sequence and the normal motion symbol sequence based on the motion pattern modeling; (d-2) 상기 매칭 확률의 차이가 미리 지정한 기준값 이하일 때 상기 사용자 동작을 상기 정규 동작으로 인식하는 단계(d-2) recognizing the user's motion as the normal motion when the difference of the matching probability is equal to or less than a predetermined reference value; 를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method comprising a. 삭제delete 제1항에 있어서,The method of claim 1, 상기 단계 (e)는, (e-1) 미리 지정된 기준값에서 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 일치시키는데 발생하는 비용을 감산한 값을 상기 동작 유사도로 추출하는 단계In the step (e), (e-1) extracting a value obtained by subtracting the cost incurred to match the user action sign sequence and the normal action sign sequence from a predetermined reference value as the motion similarity. 를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method comprising a. 제1항에 있어서,The method of claim 1, 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스는 공백을 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.And the user action symbol sequence and the normal action symbol sequence include a space. 제7항에 있어서,The method of claim 7, wherein 상기 비용(Acost)은, The cost (A cost ),
Figure 112010051045752-pat00043
Figure 112010051045752-pat00043
[단 S1'(i)와 S2'(i)는 공백을 포함하는 상기 정규 동작 기호 시퀀스와 상기 사용자 동작 기호 시퀀스의 i번째 기호를 각각 나타내며, s(S1'(i), S2'(i))는 상기 정규 동작 기호 시퀀스와 상기 사용자 동작 기호 시퀀스의 i번째 기호를 정렬하는 비용값을 출력하는 함수를 나타내며, l은 정렬 길이를 나타냄][Wherein S 1 ′ (i) and S 2 ′ (i) indicate the i th symbol of the normal operation symbol sequence and the user operation symbol sequence each including a space, and s (S 1 '(i), S 2 '(i)) represents a function for outputting a cost value for aligning the i-th symbol of the regular motion sign sequence and the user motion sign sequence, and l indicates an alignment length] 을 기초로 추출되는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method that is extracted based on.
제9항에 있어서,10. The method of claim 9, 상기 s(S1'(i), S2'(i))는, The s (S 1 '(i), S 2 ' (i)), 상기 정규 동작 기호 시퀀스의 i번째 기호가 공백이 아니고 상기 사용자 동작 기호 시퀀스의 i번째 기호가 공백일 때 발생하는 삽입 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호가 공백이고 상기 사용자 동작 기호 시퀀스의 i번째 기호가 공백이 아닐 때 발생하는 삭제 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호와 상기 사용자 동작 기호 시퀀스의 i번째 기호가 모두 공백이 아닐 때 발생하는 교체 비용과, 상기 정규 동작 기호 시퀀스의 i번째 기호와 상기 사용자 동작 기호 시퀀스의 i번째 기호가 일치하는 경우 발생하는 정합 비용 중 어느 하나를 출력하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.An insertion cost incurred when the i th symbol of the regular operation symbol sequence is not blank and the i th symbol of the user operation symbol sequence is blank; a deletion cost incurred when the i th symbol is not empty, a replacement cost incurred when both the i th symbol of the regular operation symbol sequence and the i th symbol of the user operation symbol sequence are not empty, and the normal operation symbol sequence And outputting any one of matching costs incurred when the i-th symbol of i and the i-th symbol of the user motion symbol sequence coincide with each other. 제1항에 있어서,The method of claim 1, 상기 단계 (e)는, (e-2) 상기 사용자 동작 기호 시퀀스 또는 상기 정규 동작 기호 시퀀스 내에 동일한 기호가 반복되는 경우 상기 반복되는 기호를 한번만 표시하도록 변환한 후 비교하여 상기 사용자 동작과 상기 정규 동작의 동작 유사도를 추출하는 단계In the step (e), if the same symbol is repeated in the user action symbol sequence or the normal action symbol sequence, the step (e) is converted to display the repeated symbol only once and compared with the user action and the normal action. Extracting motion similarity of 를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method comprising a. 제1항에 있어서,The method of claim 1, 상기 단계 (e)는, (e-3) 상기 사용자 동작이 부분 동작인 경우 상기 사용자 동작 기호 시퀀스와 상기 정규 동작 기호 시퀀스를 비교하여 상기 사용자 동작과 상기 정규 동작의 부분 동작 유사도를 추출하는 단계In the step (e), (e-3) extracting a partial motion similarity between the user motion and the normal motion by comparing the user motion symbol sequence with the normal motion symbol sequence when the user motion is a partial motion. 를 포함하는 것인 은닉 마르코프 모델 기반 동작 인식 방법.Hidden Markov model based motion recognition method comprising a. 제1항 내지 제5항, 제7항 내지 제12항 중 어느 한 항에 따른 은닉 마르코프 모델 기반 동작 인식 방법의 각 단계를 실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for realizing each step of the hidden Markov model-based motion recognition method according to any one of claims 1 to 5 and 13.
KR1020090006554A 2009-01-28 2009-01-28 Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same KR101017449B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090006554A KR101017449B1 (en) 2009-01-28 2009-01-28 Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090006554A KR101017449B1 (en) 2009-01-28 2009-01-28 Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same

Publications (2)

Publication Number Publication Date
KR20100087512A KR20100087512A (en) 2010-08-05
KR101017449B1 true KR101017449B1 (en) 2011-02-25

Family

ID=42754040

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090006554A KR101017449B1 (en) 2009-01-28 2009-01-28 Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same

Country Status (1)

Country Link
KR (1) KR101017449B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101417310B1 (en) * 2012-08-06 2014-07-08 제주대학교 산학협력단 Cosmetic composition containg extract, fraction or compound of Malus sieboldii
KR101693740B1 (en) 2014-05-08 2017-01-06 한양대학교 산학협력단 Apparatus and method for activity recognition by using layered hidden markov model
CN113610124B (en) * 2021-07-23 2024-04-19 中国地质大学(武汉) Human hand track generation method and system based on Markov chain Monte Carlo

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000039192A (en) * 1998-12-11 2000-07-05 정선종 Gesture recognizing system and method by analyzing trace on polar coordinates
JP2007087089A (en) * 2005-09-21 2007-04-05 Fujitsu Ltd Gesture recognition device, gesture recognition program and gesture recognition method
JP2007280219A (en) 2006-04-10 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Motion pattern recognition device, motion pattern recognition method, and motion pattern recognition program
JP2008225734A (en) 2007-03-12 2008-09-25 Mitsubishi Electric Corp Mobile body action analysis device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000039192A (en) * 1998-12-11 2000-07-05 정선종 Gesture recognizing system and method by analyzing trace on polar coordinates
JP2007087089A (en) * 2005-09-21 2007-04-05 Fujitsu Ltd Gesture recognition device, gesture recognition program and gesture recognition method
JP2007280219A (en) 2006-04-10 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Motion pattern recognition device, motion pattern recognition method, and motion pattern recognition program
JP2008225734A (en) 2007-03-12 2008-09-25 Mitsubishi Electric Corp Mobile body action analysis device

Also Published As

Publication number Publication date
KR20100087512A (en) 2010-08-05

Similar Documents

Publication Publication Date Title
Shum et al. Real-time posture reconstruction for microsoft kinect
Green et al. Quantifying and recognizing human movement patterns from monocular video images-part i: a new framework for modeling human motion
Yang et al. Gesture spotting and recognition for human–robot interaction
Yao et al. Contour model-based hand-gesture recognition using the Kinect sensor
Li et al. Category-blind human action recognition: A practical recognition system
Gavrila The visual analysis of human movement: A survey
CN102222431A (en) Hand language translator based on machine
CN110348321A (en) Human motion recognition method based on bone space-time characteristic and long memory network in short-term
Xu et al. Robust hand gesture recognition based on RGB-D Data for natural human–computer interaction
Aran et al. Sign language tutoring tool
WO2013078657A1 (en) A gesture recognition method, an apparatus and a computer program for the same
KR101017449B1 (en) Method for recognizing motion based on hidden markov model and computer-readable medium having thereon program performing function embodying the same
Hassanpour et al. Visionbased hand gesture recognition for human computer interaction: A review
Chang et al. Vision-based tracking and interpretation of human leg movement for virtual reality applications
Kahol et al. Documenting motion sequences with a personalized annotation system
Holden Visual recognition of hand motion
CN114967937B (en) Virtual human motion generation method and system
Otberdout et al. Hand pose estimation based on deep learning depth map for hand gesture recognition
Liu et al. Motion improvisation: 3d human motion synthesis with a transformer
Pai et al. Home Fitness and Rehabilitation Support System Implemented by Combining Deep Images and Machine Learning Using Unity Game Engine.
Shah et al. Gesture recognition technique: a review
CN113807280A (en) Kinect-based virtual ship cabin system and method
Caridakis et al. Automatic sign language recognition: vision based feature extraction and probabilistic recognition scheme from multiple cues
Birdal et al. Region based hand gesture recognition
Shin et al. Deep Learning-based Hand Pose Estimation from 2D Image

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131219

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150123

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160201

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161207

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180219

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190307

Year of fee payment: 9