JP6202157B2 - Hand gesture identification method and apparatus - Google Patents

Hand gesture identification method and apparatus Download PDF

Info

Publication number
JP6202157B2
JP6202157B2 JP2016142487A JP2016142487A JP6202157B2 JP 6202157 B2 JP6202157 B2 JP 6202157B2 JP 2016142487 A JP2016142487 A JP 2016142487A JP 2016142487 A JP2016142487 A JP 2016142487A JP 6202157 B2 JP6202157 B2 JP 6202157B2
Authority
JP
Japan
Prior art keywords
hand
classifier
classification
image
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016142487A
Other languages
Japanese (ja)
Other versions
JP2017027600A (en
Inventor
ホアイシヌ ション
ホアイシヌ ション
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2017027600A publication Critical patent/JP2017027600A/en
Application granted granted Critical
Publication of JP6202157B2 publication Critical patent/JP6202157B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2528Combination of methods, e.g. classifiers, working on the same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/117Biometrics derived from hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は画像処理分野に関し、より具体的には、静態手振り識別に関する。   The present invention relates to the field of image processing, and more specifically to static hand gesture identification.

手振りは、既に各種のヒューマン・コンピュータ・インタラクション・システム、例えば、インタラクティブ投影、インタラクティブディスプレイ、手振り制御テレビ等に広く用いられている。手振りは、人々の提供する直観的な、自然でフレンドリーな、更に人類熟知の対話方式である。手振りは一般に、大きく二種類、即ち動態手振りと静態手振りに分けられる。動態手振りは、様々な手の形態の一連の動き、あるいは手の位置の変化の軌跡であり、静態手振りは、手の形態、即ちある短い時間に手が保持している同一の類似形態を表す。   Hand gestures are already widely used in various human-computer interaction systems such as interactive projection, interactive display, and hand-controlled TV. Hand gestures are an intuitive, natural, friendly, and human-interactive dialogue system provided by people. In general, there are two types of hand gestures: dynamic gestures and static gestures. A dynamic hand gesture is a sequence of movements of various hand forms, or a trajectory of changes in hand position, while a static hand gesture represents a hand form, that is, the same similar form held by a hand for a short period of time. .

動態手振りと異なり、静態手振りは手の形状情報によってのみ区分できる。テンプレートマッピングは、静態手振り識別で広く使用される方法で、手振りの静態テンプレートライブラリーを作成し、テンプレートライブラリーから、最も近い一つを探すことにより識別待ち手振りをマッピングする。通常、一つの手振りは、複数のテンプレートに対応している可能性があり、かつ、手振り識別結果は、主にテンプレートと距離計算の準則に依存するので、当該テンプレートマッピング方法は簡単で直観的ではあるが、弾力性が不十分でロバスト性も十分ではない。   Unlike dynamic gestures, static gestures can be classified only by hand shape information. Template mapping is a method widely used in static gesture identification, and creates a static template library of gestures, and maps the identification waiting gestures by searching for the closest one from the template library. Usually, one hand gesture may correspond to multiple templates, and the hand gesture identification result mainly depends on the template and distance calculation rules, so the template mapping method is simple and intuitive. Although there is insufficient elasticity, it is not robust enough.

その他、幾つかの簡単な手振りについて言えば、顕著性規則判断も、本分野で比較的常用される手振り識別方法である。当該方法は主に区別性の特徴あるいは準則を用いて、異なる手振りを区分する。例えば、指先の個数ならびにその向きによって、幾つかの簡単な手振りを識別することができる。しかし、通常これらの規則が使用する特徴は区分性の特徴だけで記述性のものではなく、手振りの特徴を全面的に反映することができず、また当該方法は完全に規則に依存するので、この方法もロバスト性が十分でなく、かつ実際の使用において、誤ったメッセージを伝える可能性が比較的高い。   In addition, as for some simple hand gestures, saliency rule judgment is also a hand gesture identification method that is relatively commonly used in this field. The method distinguishes different hand gestures mainly using distinctive features or rules. For example, some simple hand gestures can be identified by the number of fingers and their orientation. However, the features usually used by these rules are not only descriptive but only by piecewise features, and cannot fully reflect the features of hand gestures, and the method is completely dependent on the rules, This method is also not robust enough and has a relatively high possibility of transmitting an erroneous message in actual use.

しかし、幾つかの対話の場面、例えば、博物館、図書館、展覧会等の公共の場所では、システムの実際の操作ユーザが皆、訓練を経ていない参加者であることを考慮すると、その用いる手振りは大部分が簡単で直観的で、できる限り自然で、同時にこれらの手振りがロバストに識別され、誤ったメッセージをできる限り少なくすることが望ましい。簡単にテンプレートマッピング、あるいは規則判断を用いて静態手振りを識別する従来方法では、誤ったメッセージを減らす状況において、識別の正確度を高めることができる訳ではない。   However, in some public situations, for example in public places such as museums, libraries, exhibitions, etc., taking into account that the actual operating users of the system are all untrained participants, It is desirable to be mostly simple and intuitive, as natural as possible, and at the same time to identify these gestures robustly and to minimize false messages. The conventional method of easily identifying a static gesture using template mapping or rule judgment cannot increase the accuracy of identification in a situation where erroneous messages are reduced.

以上の問題を考慮し、手振り識別の正確度を高めると同時に、誤判定の可能性を低下させることのできる手振り識別方法と装置を提供できることを望んでいる。   In view of the above problems, it is desired to provide a hand gesture identification method and apparatus that can increase the accuracy of hand gesture identification and reduce the possibility of erroneous determination.

本発明の一つの面により、手を含む目標場面の入力画像を取得し、当該入力画像中から手の画像を抽出すること;分類器を利用して当該手の画像を分類し、これにより識別待ち手振りの分類結果を取得すること;当該手の画像中から規則特徴を抽出すること;及び、当該識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得することを含む手振り識別方法を提供した。   According to one aspect of the present invention, an input image of a target scene including a hand is obtained, and an image of a hand is extracted from the input image; the image of the hand is classified by using a classifier, and thereby identified. Obtaining a classification result of the waiting hand shake; extracting a rule feature from the image of the hand; and applying the rule feature to the classification result of the waiting hand gesture to obtain a hand gesture identification result. Including hand gesture identification method.

前記分類器を利用して当該手の画像を分類し、これにより識別待ち手振り分類結果を取得することは、当該手の画像中から分類特徴を抽出すること、当該分類特徴を当該分類器に応用し、これにより識別待ち手振りの分類結果を取得することを含むことができる。   Classifying the image of the hand using the classifier, and thereby obtaining the classification waiting hand shake classification result, extracting the classification feature from the image of the hand, and applying the classification feature to the classifier Thus, it can include obtaining a classification result of the identification waiting hand shake.

当該手の画像中から抽出した分類特徴には、手輪郭コンベックスハル特徴、手輪郭フーリエ記述子特徴、手輪郭不変マトリックス特徴の少なくとも一つを含むことができる。当該手の画像中から抽出した規則特徴には指の本数、指の長さ、指の指す方位、指の間の相対位置、二本の指の間の夾角の少なくとも一つを含むことができる。   The classification features extracted from the hand image may include at least one of a hand contour convex hull feature, a hand contour Fourier descriptor feature, and a hand contour invariant matrix feature. The rule features extracted from the image of the hand may include at least one of the number of fingers, the length of the finger, the orientation pointed by the finger, the relative position between the fingers, and the depression angle between the two fingers. .

当該分類器は規則特徴を利用して分類戦略を最適化することにより取得した分類器でよく、前記分類戦略には分類の数ならびに分類の指定戦略を含む。   The classifier may be a classifier obtained by optimizing a classification strategy using rule characteristics, and the classification strategy includes a number of classifications and a classification designation strategy.

以下の反復過程、即ち、訓練サンプル集を利用して所定の分類戦略を有する分類器を訓練する過程、サンプル集の評価を訓練する分類器に応用し、これによりサンプル分類結果を取得する過程、所定の規則特徴を前記サンプル分類結果に応用し、これによりサンプル手振り識別結果を取得する過程、前記サンプル手振り識別結果をもとに、当該分類器の分類戦略を最適化する過程の反復により、分類戦略を最適化することができる。   The following iterative process, that is, the process of training a classifier having a predetermined classification strategy using a training sample collection, the process of applying the sample collection evaluation to the classifier that trains the evaluation of the sample collection, thereby obtaining the sample classification result, Applying a predetermined rule feature to the sample classification result, thereby obtaining a sample hand gesture identification result, and repeating the process of optimizing the classifier's classification strategy based on the sample hand gesture identification result Strategy can be optimized.

当該分類器は決定木分類器、ランダムフォレスト分類器、パーセプトロン分類器、ニューラルネットワーク分類器、あるいはSVM分類器でよい。あるいは、当該分類器は、テンプレートマッピング分類技術を用いてもよい。   The classifier may be a decision tree classifier, random forest classifier, perceptron classifier, neural network classifier, or SVM classifier. Alternatively, the classifier may use a template mapping classification technique.

選択的に、当該入力画像は連続したKフレームの入力画像を含む選択をすることができ、もし前記Kフレームの入力画像中に一致するMフレームの手振り識別結果があれば、当該Mフレームの手振り識別結果を当該Kフレームの入力画像中の手振り識別結果と確定し、KとMは所定の正の整数で、かつK>Mである。   Alternatively, the input image can be selected to include a continuous K-frame input image, and if there is a matching M-frame gesture identification result in the K-frame input image, The identification result is determined as the hand gesture identification result in the input image of the K frame, and K and M are predetermined positive integers and K> M.

本発明の別の面により、手を含む目標場面の入力画像を取得し、当該入力画像中から手の画像を抽出する取得部;分類器を利用して当該手の画像を分類し、これにより識別待ち手振りの分類結果を取得する分類部;当該手の画像中から規則特徴を抽出する特徴抽出部;及び、当該識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得する識別部を含む手振り識別装置を提供した。   According to another aspect of the present invention, an acquisition unit that acquires an input image of a target scene including a hand and extracts an image of the hand from the input image; classifies the image of the hand using a classifier; A classification unit that obtains a classification result of an identification waiting hand shake; a feature extraction unit that extracts a rule feature from the image of the hand; and an application of the rule feature to the classification result of the identification waiting hand shake, thereby obtaining a gesture identification result A hand gesture identification device including an identification unit to obtain is provided.

本発明によれば、分類器を利用して手の画像を分類し、これにより無効な手振りを排除して識別待ち手振り分類結果を取得し、引き続き識別待ち手振り分類結果に規則特徴を応用し手振りの最終識別を完成する。当該方法は弱分類器と強規則判定技術を融合したもので、分類器は各種手振りの最終識別に直接用いることはせず、大多数の無効な手振りは分類器のフィルタリング機能により排除されるようにするため、全体的特徴の基礎の上に構築する弱分類器とし、また同時に有効な手振りは最小限の漏れで分類器を確実に通過できるようにする。その後、強規則を分類器の識別待ち手振り分類結果に作用させ、区別性特徴により、更に各種の様々な手振りを区分する。これにより、区別性規則特徴と分類器全体の記述特徴のメリットが相互に補完し合い、手振り識別の正確性を高めると同時に誤判定の可能性を下げ、静態手振りのロバストな識別を実現することができる。   According to the present invention, a classifier is used to classify hand images, thereby eliminating invalid hand gestures to obtain identification waiting hand shake classification results, and subsequently applying rule features to the classification waiting hand shake classification results to perform hand gestures. Complete final identification. The method is a combination of weak classifiers and strong rule decision technology, and classifiers are not used directly for the final identification of various hand gestures, and the majority of invalid hand gestures are eliminated by the filtering function of the classifiers. Therefore, a weak classifier built on the basis of the overall features, and at the same time, valid hand gestures can be reliably passed through the classifier with minimal leakage. After that, the strong rule is applied to the classification waiting hand shake classification result of the classifier, and various kinds of various hand gestures are further classified according to the distinguishing feature. As a result, the distinction rule feature and the description feature of the entire classifier complement each other, improving the accuracy of hand gesture identification and reducing the possibility of misjudgment, and realizing robust recognition of static hand gestures Can do.

本発明の一実施例による手振り識別方法のフローチャートである。5 is a flowchart of a hand gesture identification method according to an embodiment of the present invention. 入力画像の例ならびにその中から抽出した手の二値化シルエット画像を示す図である。It is a figure which shows the example of an input image, and the binarized silhouette image of the hand extracted from it. 分類器を最適化する方法のフローチャートである。6 is a flowchart of a method for optimizing a classifier. 混同マトリックスを示す図である。It is a figure which shows a confusion matrix. 5種類の有効な手振りと、それに対応する二値化シルエット画像を示すである。It shows five types of effective hand gestures and corresponding binarized silhouette images. 上記5種類の手振りの手振り識別過程を示す図である。It is a figure which shows the gesture identification process of said 5 types of gesture. 手の画像の領域分割を示す図である。It is a figure which shows the area | region division of the image of a hand. 表の形式で手振り識別規則を示す図である。It is a figure which shows a gesture identification rule in the format of a table | surface. 手振り識別の一例におけるデータフローを示す図である。It is a figure which shows the data flow in an example of hand gesture identification. 本発明の一実施例による手振り識別装置の機能ブロック図である。It is a functional block diagram of the hand gesture identification device by one Example of this invention. 本発明の一実施例による手振り識別システムのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the gesture identification system by one Example of this invention.

当業者により良く本発明を理解してもらうために、以下、添付図および具体的実施方式と結合して、本発明を更に詳細に説明する。   In order that those skilled in the art may better understand the present invention, the present invention will be described in more detail below in conjunction with the accompanying drawings and specific implementation methods.

以下の順序、即ち、
1.発明思想の概述
2.実施例
2.1 手振り識別方法
2.2 分類器の最適化
2.3 手振り識別方法の応用例
2.4 手振り識別装置
2.5 手振り識別システム
3.まとめ
という順序に従って説明を行う。
The following order:
1. 1. Outline of the inventive idea Example
2.1 Hand gesture identification method
2.2 Optimization of classifier
2.3 Application example of hand gesture identification method
2.4 Hand gesture identification device
2.5 Hand gesture identification system The description will be given in the order of summarization.

<1.発明思想の概述>
上記のように、手振り識別を行う時に識別の正確性を高めると同時に、誤メッセージの可能性を下げる、即ちもともと無効な手振りが有効と識別されることをできる限り避けけたいと考えている。
<1. Overview of Invention Thought>
As described above, when performing hand gesture identification, it is desired to increase the accuracy of the identification and at the same time reduce the possibility of erroneous messages, that is, avoid the identification of invalid hand gestures as valid as much as possible.

手振り識別において、機械学習と分類技術はテンプレートマッピングに対する一種の確率化の延長と見なすことができ、それは主に記述性特徴に注目するが、規則を利用して判別する手振り識別方法において規則の用いる特徴は、通常、区分性特徴である。周知のように、記述性特徴、例えばフーリエ記述子は、手振りを全面的に記述する特徴で、通常、無効な手振りが、誤って有効なものに識別される可能性を避けることができるものの、幾つかの特定の手振りの間では、通常、如何なる区分性も有さず、識別結果を正確に判断できない結果になり、区分性特徴は手振りの区別は良くできるが、これらの特徴が通常、全て局部的特徴なので、偶然性が大きく、判断の誤りを引き起こしやすい。   In hand gesture identification, machine learning and classification techniques can be viewed as a kind of probabilistic extension to template mapping, which focuses primarily on descriptive features, but uses rules in hand gesture identification methods that discriminate using rules. The feature is usually a piecewise feature. As is well known, descriptive features, such as Fourier descriptors, are features that fully describe a gesture, usually avoiding the possibility of invalid gestures being mistakenly identified as valid, Some specific gestures usually do not have any categorization, resulting in inaccurate identification results, and categorical features can be better distinguished from hand gestures, but these features are usually all Because it is a local feature, it is highly contingent and prone to misjudgment.

このことに鑑み、本発明は分類器を利用し分類特徴(記述性特徴)をもとに、入力画像を分類し無効な手振りを排除して識別待ち手振りを取得し、引き続き識別待ち手振り分類結果に規則の区分性特徴を応用し、手振りの識別を完成させる。これにより、本発明中の分類器は、最終的手振り識別任務は負わず、無効な手振りの排除を自己の任務とし、無効な手振りを排除した分類器の分類結果に、規則の区分性特徴を用いて最終的手振り識別を行い、このようにして手振り識別結果の正確性が保証できると同時に、また誤メッセージも少なくすることができる。   In view of this, the present invention uses a classifier to classify the input image based on the classification features (descriptive features), eliminate invalid hand gestures, acquire identification waiting hand gestures, and continue to identify waiting hand shaking classification results Applying the distinctive feature of rules to complete the identification of hand gestures. As a result, the classifier according to the present invention does not bear the final hand gesture identification task, the elimination of invalid hand gestures is its own task, and the classification result of the ruler is added to the classification result of the classifier from which invalid hand gestures are excluded. In this way, the final hand gesture identification is performed. In this way, the accuracy of the hand gesture identification result can be guaranteed, and at the same time, the number of erroneous messages can be reduced.

<2.実施例>
<2.1 手振り識別方法>
図1は、本発明の一実施例による手振り識別方法の全体フローチャートを示したものである。図1に示すように、この実施例による手振り識別方法100は、手を含む目標場面の入力画像を取得し、当該入力画像中から手の画像を抽出するステップS110;分類器を利用して当該手の画像を分類し、これにより識別待ち手振りの分類結果を取得するステップS120;当該手の画像中から、規則特徴を抽出するステップS130;及び、当該識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得するステップS140を含むことができる。
<2. Example>
<2.1 gesture identification method>
FIG. 1 shows an overall flowchart of a gesture identification method according to an embodiment of the present invention. As shown in FIG. 1, the hand gesture identification method 100 according to this embodiment acquires an input image of a target scene including a hand, and extracts a hand image from the input image Step S110; Step S120 for classifying hand images and thereby obtaining a classification result of identification waiting hand gestures; Step S130 for extracting rule features from the hand images; and Step S140 may be included to apply and thereby obtain a hand gesture identification result.

具体的には、ステップS110で、カメラ、撮影機等により手を含む目標場面を撮影し、これにより目標場面の画像を取得し、当該画像に画像処理を行い、これにより、手をカバーできる局部画像を抽出することができる。例えば、撮影機で撮影した所定数の連続フレームの画像中で手の運動を追跡することにより手の領域を確定し、これにより当該手の領域の局部画像を抽出する。入力画像中から、所定の関心領域を抽出することは、当業者にとっては実現簡単なことで、使える方法は上記追跡方法に限られない。   Specifically, in step S110, a target scene including a hand is photographed by a camera, a photographing machine, etc., thereby obtaining an image of the target scene, performing image processing on the image, and thereby locally covering the hand Images can be extracted. For example, the hand region is determined by tracking the movement of the hand in a predetermined number of continuous frame images captured by the photographing machine, thereby extracting a local image of the hand region. It is easy for those skilled in the art to extract a predetermined region of interest from the input image, and a usable method is not limited to the tracking method.

例として、後続ステップで手の画像特徴を抽出しやすくするために、局部画像中から手の部分を分離し手の二値化シルエットを取得することとし、例えば、肌色モデル、深度に基づく閾値分割、あるいは領域拡張分析等の方法で手の二値化シルエットを取得できる。   As an example, in order to make it easier to extract hand image features in subsequent steps, the hand part is separated from the local image and the binarized silhouette of the hand is obtained, for example, skin color model, threshold division based on depth Alternatively, the binarized silhouette of the hand can be acquired by a method such as region extension analysis.

例えば、図2は入力画像の例、ならびにその中から抽出した手の二値化シルエット画像を示した。当該二値化画像では、例えば、背景や手でない部分が影響する可能性のある如何なる要素も既に除去されているので、その中から正確に手自体の特徴を抽出するのに役立つ。もちろん、ここで述べた二値化シルエットは単に本発明の応用可能な手の画像の一例に過ぎず、本発明は他の如何なる適当な画像も用いることができる。   For example, FIG. 2 shows an example of an input image and a binarized silhouette image of a hand extracted from the input image. In the binarized image, for example, any element that may be affected by a background or a part that is not a hand has already been removed, so that it is useful for accurately extracting the features of the hand itself from the elements. Of course, the binarized silhouette described here is merely an example of a hand image to which the present invention can be applied, and the present invention can use any other suitable image.

手の画像を抽出した後、ステップS120で、分類器を利用して当該手の画像を分類し、これにより識別待ち手振りの分類結果を取得する。ここで使用する分類器はあらかじめ訓練し終えた最適化分類戦略を有する分類器である。   After extracting the hand image, in step S120, the classifier is used to classify the hand image, thereby obtaining the classification result of the identification waiting hand shake. The classifier used here is a classifier having an optimized classification strategy that has been trained in advance.

分類戦略は通常、分類の数ならびに分類器の指定モデルの二つの面を含むことができる。例えば、3種の有効な手振りABCと一つの無効な手振りDの識別を例にすると、もし分類数が3とすると、少なくとも3種の異なる分類指定の組み合わせがあり、それぞれ{AB,C,D}、{AC,B,D}および{A,BC,D}となり、もし分類数が2なら、通常、指定モデルは{ABC,D}となる。本発明では、入力する手の画像の表す識別されるべき、あり得る手振りの(何故ならそれは必ずしも有効な手振りとは限らず、必ずしも手振りですらない可能性がある)分類器の分類を経て出力された分類結果は単なる中間結果、言い換えればいわゆる含意層の出力であり、当該識別されるべき、あり得る手振りが有効な手振り(即ち、識別待ち手振り)に分類されるか、あるいは無効な手振りに分類されるか、あるいは多種類の有効な手振りが存在する場合、どの種類の有効な手振りに属す可能性があるかを表しているに過ぎない。手振り識別の最終結果に至っては、その後更に規則によって判断し取得する必要がある。   A classification strategy can typically include two aspects: the number of classifications as well as the specified model of the classifier. For example, taking the identification of three valid gestures ABC and one invalid gesture D as an example, if the number of classifications is 3, there are at least three different combinations of classification designations, {AB, C, D }, {AC, B, D} and {A, BC, D}. If the number of classifications is 2, the designated model is usually {ABC, D}. In the present invention, the output of the input hand image represented through the classification of a possible hand gesture to be identified (because it is not necessarily a valid hand gesture and may not necessarily be a hand gesture). The classified result is merely an intermediate result, in other words, the output of a so-called implication layer, and the possible gesture to be identified is classified as a valid gesture (ie, an identification waiting gesture) or an invalid gesture. If it is classified or there are many types of valid gestures, it simply represents what type of valid gestures it may belong to. When the final result of hand gesture identification is reached, it is necessary to further determine and acquire it according to rules.

ここに述べる識別待ち手振りとは分類器が有効と分類したが、規則により更に判定する必要のある部分の手振り、即ち分類器によって無効な手振りと分類されたもの以外の手振りの分類結果を指し、ここでは便宜上それを識別待ち手振りと呼ぶが、当業者はこれらの識別待ち手振りが、必ずしも最終的に有効な手振りに識別されるとは限らず、なお無効な手振りを含む可能性があり、規則により判断し、更に確定する必要があることをはっきりと理解しなければならない。言い換えれば、前記の識別待ち手振りは擬似識別待ち手振りでもある。   The classification waiting gesture described here refers to the classification result of a gesture that is classified as valid by the classifier but needs to be further determined according to the rules, that is, a gesture other than that classified as invalid by the classifier, For convenience, this is called identification waiting gestures, but those skilled in the art will not necessarily identify these identification waiting gestures as valid gestures in the end, but may still include invalid gestures. It must be clearly understood that it needs to be judged and confirmed. In other words, the identification waiting gesture is also a pseudo identification waiting gesture.

分類の数に似て、分類の指定モデルも独立したものではなく、分類器の分類実行時に利用する分類特徴の凝集性ならびに規則を分類結果に応用して取得する手振り識別結果に依存する。様々な分類戦略が分類特徴の凝集性の良し悪しに影響し更に最終的な識別結果に影響するが、この識別結果の良し悪しの評価もまた規則の分類に対する補完性の助けを借りて考察する必要があるため、分類器の分類戦略の設計と最適化は規則の使用効果を参考とする反復過程である。   Similar to the number of classifications, the classification specification model is not independent, and depends on the classification characteristics obtained when applying classification characteristics to the classification results, and the cohesiveness of classification features used when classifiers execute classification. Various classification strategies affect the agglomeration of classification features and affect the final discrimination result, and this good / bad evaluation is also considered with the aid of complementarity to the rule classification Since there is a need, the design and optimization of the classifier's classification strategy is an iterative process with reference to the effect of using rules.

分類器の具体的訓練および最適化過程は暫く後の部分で詳細に述べることとし、ここでは、最適化した分類戦略を有する分類器が既に取得されたと仮定して、当該分類器を応用してステップS110で取得した手の画像を分類し、これにより識別待ち手振りの分類結果を取得する。   The specific training and optimization process of the classifier will be described in detail later, and here we apply the classifier assuming that a classifier with an optimized classification strategy has already been acquired. The hand images acquired in step S110 are classified, and thereby, the classification waiting hand classification result is acquired.

具体的には、当該分類器を応用して手の画像を分類する時、当該手の画像中から分類特徴を抽出し、当該分類特徴を当該分類器に応用し、これにより識別待ち手振り分類結果を取得することができる。   Specifically, when classifying a hand image by applying the classifier, the classification feature is extracted from the hand image, and the classification feature is applied to the classifier. Can be obtained.

分類特徴は分類器が手の画像を分類する時に用いる特徴であり、できる限り全面的に識別する必要のあるかも知れない全ての手振りを記述し、有効な手振りが誤って無効な手振りに分類され排除されることがなるべくないようにするため、ここで幾つかの全体的な記述性特徴を用いて分類特徴とすることができる。例えば、応用できる分類特徴には手輪郭コンベックスハル特徴、手輪郭フーリエ記述子特徴、手輪郭不変マトリックス特徴等のうちの少なくとも一つあるいは複数を含むことができる。   Classification features are features used by the classifier when classifying hand images, describing all gestures that may need to be identified as fully as possible, and valid gestures are mistakenly classified as invalid gestures. In order to avoid being excluded, some global descriptive features can now be used as classification features. For example, applicable classification features may include at least one or more of hand contour convex hull features, hand contour Fourier descriptor features, hand contour invariant matrix features, and the like.

ステップS110で抽出した手の画像中から分類特徴を抽出した後、抽出した分類特徴を上記の最適化した分類戦略を有する分類器に応用すると、識別待ち手振りの分類結果を取得することができる。   After extracting the classification feature from the hand image extracted in step S110, applying the extracted classification feature to the classifier having the above-described optimized classification strategy, the classification result of the waiting for identification hand shake can be acquired.

分類器の分類結果として、上記のように、もし当該手の画像中に含まれる識別を要する手振りが一組の有効な手振りと分類されたならば、その後規則により判断し、更にそれが具体的に当該有効な手振りの組のうちのどの手振りに対応するかを識別する。もちろん、上記のように、ここでの識別待ち手振りは、それが、当該有効な手振りに分類された組の一つに識別されるとは必ずしも限らないことを表しており、ここで用いる分類器は弱分類器で、これは有効な手振りをなるべく誤って排除しないようにするためであるとはいえ、そのためもともと無効な手振りあるいは手振りが有効な手振りに分類される可能性がなお存在することとなる。   As a result of classification by the classifier, as described above, if a hand gesture that needs to be identified included in the image of the hand is classified as a set of valid hand gestures, then it is judged by a rule, To which hand gesture of the set of valid hand gestures corresponds. Of course, as described above, the waiting gesture for identification here means that it is not necessarily identified as one of the groups classified into the effective gesture, and the classifier used here Is a weak classifier, which is intended to prevent valid gestures from being mistakenly excluded as much as possible, but there is still a possibility that invalid gestures or gestures are classified as valid gestures. Become.

例えば、上記のような分類器が、{ABC,D}を指定モデルとし分類目標を2種類に分類する場合、抽出した手の画像の分類特徴により、当該識別待ち手振りの分類結果を1種類の有効な手振りABCとすることができる。   For example, when the classifier as described above uses {ABC, D} as a specified model and classifies the classification target into two types, the classification result of the waiting hand gesture is classified into one type according to the classification characteristics of the extracted hand image. It can be an effective hand gesture ABC.

言い換えれば、分類器の分類を経て、無効な手振りあるいは手振りではないものを含む幾つかの手の画像を排除することができる。分類器により識別待ち手振りに分類されたそれらのあり得る手振りについては、更に規則により識別が確かに有効な手振りであるか否か、ならびにどの有効な手振りであるかを判断する必要がある。このため、ステップS130では、当該手の画像中から規則特徴を抽出する。   In other words, after classifier classification, some hand images, including invalid or non-invalid gestures, can be eliminated. For those possible gestures classified by the classifier as waiting for identification, further rules need to determine whether the identification is indeed a valid gesture and which valid gestures. For this reason, in step S130, a rule feature is extracted from the image of the hand.

規則特徴とは規則判断を行う時に用いる規則の対応する特徴である。上記のように、一種類の手振りの間で区別ができるように、明らかに区分性を有する幾つかの強規則を用いることができる。上記の全体的分類特徴を補完するために、規則特徴は局部特徴であってよい。例えば、用いることのできる規則特徴には手の画像中の指の本数、指の長さ、指の指す方向、二つの指の間の夾角等のうちの一つあるいは幾つかを含むことができる。   A rule feature is a feature corresponding to a rule used when making a rule decision. As mentioned above, several strong rules with clearly distinctiveness can be used so that a distinction can be made between one type of hand gesture. In order to complement the overall classification feature described above, the rule feature may be a local feature. For example, the rule features that can be used can include one or several of the number of fingers in the hand image, finger length, finger pointing direction, depression angle between two fingers, etc. .

手の画像の規則特徴を抽出した後、ステップS140において、ステップS130中で取得した当該識別待ち手振り分類結果に抽出した規則特徴を応用し、手振り識別の最終結果を取得することができる。言い換えれば、もし当該手の画像中から抽出した規則特徴がステップS120で分類して得られた一種類の識別待ち手振りのうちのどの手振りであれマッチングされるなら、当該手の画像中に含まれる、あり得る手振りは当該手振りであると識別する。他方、もし当該手の画像中から抽出した規則特徴が、当該識別待ち手振りのうちのどの一つの手振りでさえもマッチングされないなら、当該手の画像中に含まれる、あり得る手振りを無効な手振りに識別する。   After extracting the rule feature of the hand image, in step S140, the extracted rule feature can be applied to the identification waiting hand shake classification result obtained in step S130, and the final result of hand gesture identification can be obtained. In other words, if the rule feature extracted from the image of the hand is matched with any one of the types of identification waiting gestures obtained by classification in step S120, it is included in the image of the hand. The possible hand gesture is identified as the hand gesture. On the other hand, if the rule feature extracted from the hand image does not match any one of the hand gestures waiting to be identified, the possible hand gesture included in the hand image is invalidated. Identify.

これにより、本実施例の手振り識別方法100によれば、分類器を利用して手の画像を分類し、これにより無効な手振りを排除し識別待ち手振り分類結果を取得し、引き続き識別待ち手振り分類結果に規則特徴を応用し手振りの最終識別を完成する。当該方法は弱分類器と強規則判定技術を融合したもので、分類器は各種手振りの最終識別に直接用いることはせず、全体的特徴基礎の上に構築する弱分類器とし、大多数の無効な手振りは分類器のフィルタリング機能により排除され、また同時に有効な手振りは最小限の漏れで分類器を確実に通過できるようにする。その後、強規則を分類器の識別待ち手振り分類結果に作用させ、更に各種の様々な手振りを区分する。これにより、規則特徴と分類器特徴のメリットが相互に補完し合い、手振り識別の正確性を高めると同時に誤判定の可能性を下げ、静態手振りのロバストな識別を実現する。   Thus, according to the hand gesture identification method 100 of the present embodiment, the classifier is used to classify the hand images, thereby eliminating invalid hand gestures and obtaining the identification waiting hand shaking classification result, and subsequently continuing the identification waiting hand shaking classification. Apply rule features to the result to complete the final identification of hand gestures. This method is a combination of weak classifiers and strong rule judgment technology, and classifiers are not used directly for final identification of various hand gestures, but are weak classifiers built on the overall feature basis. Invalid hand gestures are eliminated by the filtering function of the classifier, and at the same time valid hand gestures ensure that the classifier can pass with minimal leakage. After that, the strong rule is applied to the classification waiting hand shake classification result of the classifier, and further, various kinds of hand gestures are classified. As a result, the advantages of the rule feature and the classifier feature complement each other, thereby improving the accuracy of hand gesture identification and at the same time reducing the possibility of misjudgment and realizing robust recognition of static hand gestures.

<2.2 分類器の最適化>
具体的な手振り識別に適合する最も優れた分類器を取得するために、機械学習技術により分類器を訓練し、かつ分類結果に対する評価により分類戦略を調整し、これにより最適化された分類器を取得することができる。
<2.2 Optimization of classifier>
In order to obtain the best classifier suitable for specific hand gesture classification, the classifier is trained by machine learning technology, and the classification strategy is adjusted by evaluating the classification result. Can be acquired.

分類器を設計する時、分類特徴と後続識別中に用いる規則は当該分類器に先立って確定しておく必要があり、これは分類器の最適化がこれらの特徴と規則をもとにしているからである。このため、当業者の分類特徴と規則特徴に対する先験的知識をもとに、所定の分類戦略を有する分類器を設計し、反復評価により分類器の最適化された設計を完成することができる。   When designing a classifier, the classification features and the rules used during subsequent identification must be established prior to the classifier, which is based on these characteristics and rules. Because. Therefore, a classifier having a predetermined classification strategy can be designed based on a priori knowledge of classification features and rule features of those skilled in the art, and an optimized design of the classifier can be completed by iterative evaluation. .

以下、図3を参考に分類器の最適化例の方法を説明する。図3は分類器を最適化する方法例のフローチャートを示した。図3に示すように、当該最適化方法は以下のステップ、即ち、訓練サンプル集を利用して所定の分類戦略を有する分類器を訓練するステップS310;テストサンプル集を訓練する分類器に応用しこれによりサンプル分類結果を取得するステップS320;所定の規則特徴を前記サンプル分類結果に応用し、これによりサンプル手振り識別結果を取得するステップS330;及び、前記サンプル手振り識別結果をもとに当該分類器の分類戦略を最適化するステップS340を含むことができる。   Hereinafter, a method of an optimization example of the classifier will be described with reference to FIG. FIG. 3 shows a flowchart of an example method for optimizing the classifier. As shown in FIG. 3, the optimization method is applied to the following steps, ie, training a classifier having a predetermined classification strategy using a training sample collection S310; A step S320 for acquiring a sample classification result thereby; a step S330 for applying a predetermined rule feature to the sample classification result, thereby acquiring a sample hand gesture identification result; and a classifier based on the sample hand gesture identification result. Step S340 may be included to optimize the classification strategy.

ステップS310で、あらかじめ正のサンプルと負のサンプルを有するサンプル集を準備する。例えば、あらかじめ100個のサンプルを含むサンプル集を準備し、そのうち80個のサンプルを訓練サンプルに用い、その残りの20個のサンプルをその後に必要なテストサンプルに用いるが、もちろん、これは単なる例に過ぎず、当業者は必要に応じてサンプルを選択することができる。   In step S310, a sample collection having a positive sample and a negative sample is prepared in advance. For example, a sample collection containing 100 samples is prepared in advance, 80 of which are used for training samples, and the remaining 20 samples are used for the necessary test samples afterwards. However, one skilled in the art can select a sample as needed.

機械学習技術用訓練サンプルにより所定の分類戦略を有する分類器を訓練する。その後、ステップS320で、テストサンプル集をステップS310で訓練した分類器に応用し、これによりサンプル分類結果を取得する。上記のように、様々な分類戦略が分類特徴の凝集性の良し悪しに影響し、更に最終的な識別結果に影響し、識別結果の良し悪しの評価は規則の分類に対する補完性の助けを借りて考察する必要があるため、ステップS330で、当該所定の規則特徴をステップS320で取得したサンプル分類結果に応用し、テストサンプルに手振り識別を行う。これにより、ステップS340で、サンプル手振り識別結果をもとに当該分類器の分類戦略を最適化することができる。   A classifier having a predetermined classification strategy is trained by a training sample for machine learning technology. Thereafter, in step S320, the test sample collection is applied to the classifier trained in step S310, thereby obtaining a sample classification result. As mentioned above, various classification strategies affect the agglomeration of classification features and further affect the final discrimination result, and the evaluation of the discrimination result with the help of complementarity to the rule classification. Therefore, in step S330, the predetermined rule feature is applied to the sample classification result obtained in step S320, and the test sample is subjected to hand gesture identification. Thus, in step S340, the classification strategy of the classifier can be optimized based on the sample hand gesture identification result.

具体的には、テストサンプルの手振り識別結果が正確か否かを評価し、評価結果により分類器の分類戦略を調整する必要があるか否かを決定することができる。評価はテストサンプルの手振り識別結果の混同マトリックスをもとに行うことができる。混同マトリックス中には各テストサンプルに対する予想サンプル識別結果ならびに実際の識別結果を記録してある。   Specifically, it is possible to evaluate whether or not the hand shake identification result of the test sample is accurate, and determine whether or not the classification strategy of the classifier needs to be adjusted based on the evaluation result. The evaluation can be performed based on a confusion matrix of test sample hand gesture identification results. The confusion matrix records the expected sample identification results for each test sample as well as the actual identification results.

図4は、混同マトリックスの一例を示した。例えば、図4に示すように、入力した無効な手振りのサンプルについて、それが無効な手振りに識別される確率は95.1%、親指上向き手振りに識別される確率は1.8%、親指下向き手振りに識別される確率は3.0%である。   FIG. 4 shows an example of a confusion matrix. For example, as shown in Figure 4, the input invalid gesture sample has a 95.1% probability of being identified as an invalid gesture, a 1.8% probability of being identified as a thumb upward gesture, and is identified as a thumb downward gesture. The probability is 3.0%.

評価時に、例えば、もし各手振りの正確な識別率が全て第一所定閾値(例えば90%)以上、かつ識別漏れ率が全て第二所定閾値(例えば10%)以下、あるいは誤メッセージ率が全て第三所定閾値(例えば5%)以下に達していれば、このような手振り識別結果は満足できるものであると考え、この時は分類戦略の調整を必要としない。そうでなく、もし評価して手振り識別結果が人を満足させるものでないと考えれば、分類器の分類戦略の調整、即ち分類の数及び/または分類の指定モデルを調整し、調整後の分類戦略を有する分類器に上記のステップS310-S340を継続実行し、これにより得られた分類戦略が満足できる手振り識別結果を取得できるまで分類戦略を最適化することができる。   At the time of evaluation, for example, if the exact identification rate of each hand gesture is all greater than or equal to the first predetermined threshold (eg 90%) and the omission rate is all less than the second predetermined threshold (eg 10%), If it reaches the predetermined threshold value (for example, 5%) or less, it is considered that such a gesture identification result is satisfactory, and at this time, adjustment of the classification strategy is not required. Otherwise, if it is evaluated and the hand gesture identification result does not satisfy the person, the classification strategy of the classifier is adjusted, that is, the number of classifications and / or the specified model of the classification is adjusted, and the adjusted classification strategy The above-described steps S310 to S340 are continuously executed on the classifier having the above, and the classification strategy can be optimized until a hand gesture identification result that satisfies the obtained classification strategy can be obtained.

言い換えれば、上記例で、分類器の最適化は、「調整−訓練−評価」の反復過程でよい。しかし、実際には、もし当業者が使いたい分類特徴と規則特徴を十分に理解し、それら各々のメリット、デメリット及びその補完性を熟知していれば、分類器の分類戦略を直接設計し、反復過程による必要もなく分類器の最適化を行うことができる。   In other words, in the above example, the classifier optimization may be an iterative process of “adjustment-training-evaluation”. In practice, however, if the person skilled in the art fully understands the classification features and rule features that he or she wants to use and is familiar with the merits, demerits, and complementarity of each of them, the classification strategy of the classifier can be designed directly, The classifier can be optimized without the need for an iterative process.

ここでは、本分野で熟知されている各種分類器、例えば、決定木分類器、ランダムフォレスト分類器、パーセプトロン分類器、ニューラルネットワーク分類器、あるいはSVM分類器等を用いることができる。かつ、ここで述べる分類器は広義の分類器で、他の幾つかの分類手段、例えばテンプレートマッピング技術により分類する分類手段も含むことができる。   Here, various classifiers well-known in the field such as a decision tree classifier, random forest classifier, perceptron classifier, neural network classifier, or SVM classifier can be used. The classifier described here is a broad classifier, and may include some other classifying means, for example, a classifying means for classifying by a template mapping technique.

この分類器の設計は独立して行われるものではなく、規則の使用効果を参照することにより、規則の強化判断を経た後に分類結果が正確な識別結果を出力できるようにする。   The design of this classifier is not performed independently, but by referring to the effect of use of the rule, the classification result can be output with an accurate identification result after the rule is strengthened.

この分類器最適化方法により、最適化した分類戦略を有する分類器を取得することができ、当該分類器は直接各種の手振りの最終識別のために設計されるのではなく、全体的特徴基礎の上に構築され機械学習により得られる弱分類器とし、これにより大多数の無効な手振りが分類器のフィルタリングにより排除され、同時にまた有効な手振りが最小限の漏れで確実に分類器を通過できるようにする。   This classifier optimization method makes it possible to obtain a classifier with an optimized classification strategy, which is not designed directly for the final identification of various hand gestures, but instead of the overall feature basis. A weak classifier built on top of machine learning, which eliminates the majority of invalid gestures by classifier filtering, and at the same time ensures that valid gestures pass through the classifier with minimal leakage. To.

<2.3 手振り識別方法の応用例>
以下、図5〜図9を参考に、本発明の手振り識別方法を応用して、5種の有効な手振りを識別する具体例を説明する。
<2.3 Application example of hand gesture identification method>
Hereinafter, specific examples of identifying five types of effective gestures will be described with reference to FIGS. 5 to 9 by applying the gesture identification method of the present invention.

図5の(a)〜(b)は、5種の有効な手振り及びそれの相応する二値化シルエット画像の例を示す。図5の(a)は5種の識別可能な手振りの例を示し、左から右へそれぞれ、左指し手振り(GA)、右指し手振り(GB)、親指上向き手振り(GC)、親指下向き手振り(GD)、及び掌オープン手振り(GE)であり、左指し手振り(GA)と右指し手振り(GB)は方向指示に用いることができ、親指直立手振り(GC)と親指下向き手振り(GD)は「Nice」あるいは「Bad」で個人の観点をあらわすのに用い、掌オープン手振り(GE)は停止あるいは禁止等を理解することができ、図5の(b)は入力画像中から抽出し、この5種の手振りにそれぞれ対応する二値化シルエット画像の例を示した。   FIGS. 5A to 5B show examples of five effective hand gestures and corresponding binarized silhouette images. Fig. 5 (a) shows five examples of identifiable hand gestures: left to right, left pointing (GA), right pointing (GB), thumb upward (GC), thumb downward ( GD) and palm open hand gesture (GE), left pointing hand gesture (GA) and right pointing hand gesture (GB) can be used for direction indication, thumb upright hand gesture (GC) and thumb down hand gesture (GD) It can be used to express an individual's point of view with “Nice” or “Bad”, and palm open hand gestures (GE) can understand whether it is stopped or prohibited. Figure 5 (b) is extracted from the input image. An example of a binarized silhouette image corresponding to each kind of gesture is shown.

説明の便宜上のために、(GF)で上記5種の手振りに属さない他の全ての入力画像を表す。言い換えれば、以上の5種の手振りを有効な手振りと理解し、(GF)を無効な手振りとして入力する。   For convenience of explanation, (GF) represents all other input images not belonging to the above five types of hand gestures. In other words, the above five types of gestures are understood as effective gestures, and (GF) is input as an invalid gesture.

図6は、上記5種の手振りに対する手振り識別過程の概念図を示した。   FIG. 6 shows a conceptual diagram of the gesture identification process for the above five types of gestures.

図6に示すように、ステップS00で、手を含む目標場面の画像を入力する。ステップS01で、手の二値化シルエット画像を抽出する。ステップS02で、当該手の二値化シルエット画像の分類特徴を抽出する。   As shown in FIG. 6, in step S00, an image of a target scene including a hand is input. In step S01, a binarized silhouette image of the hand is extracted. In step S02, the classification feature of the binarized silhouette image of the hand is extracted.

本例で、指の本数と指の向きはこの5種の手振りの区別において顕著な働きと重要な意義を有しているため、強規則として使用することができる。これらの規則が全て局部的特徴であることを考慮すると、このため幾つかの全体的特徴を選択し分類の記述特徴とすることができる。具体的には、手の画像の二値化シルエット画像上から次のような2種類の特徴、手輪郭コンベックスハル特徴及び手輪郭フーリエ記述子特徴を抽出することができる。   In this example, the number of fingers and the direction of the fingers have a significant function and important significance in distinguishing these five types of hand gestures, and therefore can be used as strong rules. Given that all of these rules are local features, several global features can therefore be selected to be the descriptive features of the classification. Specifically, the following two types of features, a hand contour convex hull feature and a hand contour Fourier descriptor feature can be extracted from the binarized silhouette image of the hand image.

手輪郭コンベックスハル特徴については、コンベックス線の長さと手輪郭線の長さの比(r1と表す)、ならびにコンベックス面積と手輪郭面積の比(r2と表す)の2個の特徴量を計算することができる。   For hand contour convex hull features, two feature quantities are calculated: the ratio of the length of the convex line to the length of the hand contour line (denoted as r1) and the ratio of the convex area to the hand contour area (denoted as r2). be able to.

手の輪郭にフーリエ変換を行うことにより、手輪郭フーリエ記述子を得ることができ、それは各種確率の手の輪郭形状を記述する係数を含むが、ここでは一部の低頻度係数を抽出して手の輪郭形状を表すことができ、例えば、10個の低周波係数、f0、f1、f2、f3、f4、f5、f6、f7、f8、f9を用いることができる。   By performing a Fourier transform on the hand contour, a hand contour Fourier descriptor can be obtained, which includes coefficients describing the hand contour shape with various probabilities, but here we extract some low-frequency coefficients. The contour shape of the hand can be represented. For example, ten low frequency coefficients f0, f1, f2, f3, f4, f5, f6, f7, f8, and f9 can be used.

この2種類の分類特徴は一つの特徴ベクトルを構成することができ、F{r1,r2,r3,r4,r5,r6,r7,r8,r9}と書く。先験的知識により、当該特徴ベクトルF{r1,r2,r3,r4,r5,r6,r7,r8,r9}は、回転、平行移動及び拡大縮小変換に対し特徴不変特性を有し、掌形状の全体特徴を反映し、上記の強規則と補完関係を形成することが分かる。   These two types of classification features can constitute one feature vector and are written as F {r1, r2, r3, r4, r5, r6, r7, r8, r9}. Based on a priori knowledge, the feature vector F {r1, r2, r3, r4, r5, r6, r7, r8, r9} has feature-invariant properties for rotation, translation and scaling, and has a palm shape Reflecting the overall characteristics of the above, it can be seen that a complementary relationship with the above strong rules is formed.

ステップS03で、当該手の画像をあらかじめ訓練した分類器に応用し、これにより識別待ち手振りの分類結果を取得する。ここで、上記の特徴ベクトルF{r1,r2,r3,r4,r5,r6,r7,r8,r9}は、回転、平行移動及び拡大縮小変換に対し、不変特性を有するので、4種の手振り(GA)、(GB)、(GC)、(GD)に対して極めて相似した特徴を有する。この先験的知識に基づき、分類器を設計する時に、分類指定戦略を直接指定して分類器を直接訓練することができる。従ってここで分類する数は3で良く、分類の指定モデルは{CA,CB,CC}で良く、それぞれ{(GA)(GB)(GC)(GD),(GE),(GF)}に対応する。手振り(GA)、(GB)、(GC)、(GD)を1種類のCAに分け、分類特徴の分類時の凝集性をより有効に利用する。分類数が幾つかに拘わらず、最終的に大部分の無効な入力画像CCは最初に分類器により除去され、残りのCAとCBの2種類の手振りはその後の規則により判断され、更に識別される。ここで、分類器が二分した弱分類器の効果を上げていることも見て取れる。このため、別の一実施例では、分類数を2とする、即ち上記5種の有効な手振りを1種類にまとめ、有効でない手振りを1種類にまとめることもできる。   In step S03, the image of the hand is applied to a classifier trained in advance, thereby obtaining a classification result of the identification waiting hand shake. Here, the above feature vector F {r1, r2, r3, r4, r5, r6, r7, r8, r9} has invariant characteristics with respect to rotation, translation, and enlargement / reduction conversion. It has very similar characteristics to (GA), (GB), (GC), (GD). Based on this a priori knowledge, when designing a classifier, the classifier can be trained directly by specifying the classification designation strategy directly. Therefore, the number to be classified here may be 3, and the designated model of classification may be {CA, CB, CC}, and {(GA) (GB) (GC) (GD), (GE), (GF)} respectively. Correspond. Divide hand gestures (GA), (GB), (GC), and (GD) into one type of CA, and more effectively use the cohesiveness when classifying features. Regardless of the number of classifications, finally most invalid input images CC are first removed by the classifier, and the remaining two hand gestures of CA and CB are judged by further rules and further identified. The Here, it can also be seen that the classifier increases the effect of the weak classifier divided into two. For this reason, in another embodiment, the number of classifications is set to 2, that is, the above five types of effective gestures can be combined into one type, and ineffective gestures can be combined into one type.

ステップS04では、当該手の画像中から規則特徴を抽出する。ここでは指の本数ならびに指の相対方向を用いて規則特徴とすることができる。手の画像中の指の本数を検出するために、先に指先の位置を検出することができる。指先の位置の検出は手の輪郭の曲率をもとに計算する。   In step S04, rule features are extracted from the image of the hand. Here, regular features can be obtained by using the number of fingers and the relative direction of the fingers. In order to detect the number of fingers in the hand image, the position of the fingertip can be detected first. The detection of the fingertip position is calculated based on the curvature of the hand contour.

最初に、全ての擬似指先の可能性のある候補位置を探すが、通常、これらの候補位置はコンベックスの頂点にある。図6に指先候補位置点P0の例を示した。   First, it looks for possible candidate positions for all pseudo fingertips, but these candidate positions are usually at the vertices of the convex. FIG. 6 shows an example of the fingertip candidate position point P0.

その後、手の輪郭線上にある、当該指先に近い候補位置点p0、かつそれぞれ当該候補位置点p0の両側に位置する二つの点、p1とp2を選択し、2点間の位置関係をもとに各候補位置点の曲率を計算し、以下の公式(1)−(3)のように表す。   After that, select candidate position point p0 near the fingertip on the contour of the hand and two points p1 and p2 located on both sides of the candidate position point p0, respectively, and based on the positional relationship between the two points Calculate the curvature of each candidate position point and express it as the following formulas (1)-(3).

v1=P1−P0 (1)
v2=P2−P0 (2)
Cur=acos(v1・v2/(|v1|*|v2|)) (3)
式中、v1はp1点からp0点までのベクトルを表し、v2はp2点からp0点までのベクトルを表し、P0、P1及びP2は、それぞれp0、p1及びp2点の位置座標ベクトルであり、Curは当該候補位置点p0の場所の曲率値を表す。
v1 = P1-P0 (1)
v2 = P2-P0 (2)
Cur = acos (v1 ・ v2 / (| v1 | * | v2 |)) (3)
In the formula, v1 represents a vector from the p1 point to the p0 point, v2 represents a vector from the p2 point to the p0 point, and P0, P1, and P2 are position coordinate vectors of the p0, p1, and p2 points, respectively. Cur represents the curvature value at the location of the candidate position point p0.

あらかじめ一つの曲率閾値Ctを設定することにより手の当該候補位置点が指先であるか否かを確定することができる。もしCur<Ctであれば、Curの対応する候補位置点p0が指先の位置に取られ、そうでなければ取られない。   By setting one curvature threshold value Ct in advance, it can be determined whether or not the candidate position point of the hand is the fingertip. If Cur <Ct, Cur's corresponding candidate position point p0 is taken at the fingertip position, otherwise it is not taken.

指の輪郭に比較的大きなノイズがあるため、上記10個の低周波フーリエ記述子にフーリエ逆変換を行って指の輪郭線を再建し、再建した指の輪郭線上で上記の指先の位置計算を行うが、これは再建した輪郭線の方が元の輪郭に比べより滑らかなためである。   Since there is relatively large noise in the finger contour, the above-mentioned 10 low-frequency Fourier descriptors are subjected to inverse Fourier transform to reconstruct the finger contour, and the above fingertip position calculation is performed on the reconstructed finger contour. This is because the reconstructed contour is smoother than the original contour.

これにより、検出した指先の位置をもとに、指の本数を確定することができる。その後、ステップS05で、指の相対方向を検出する。   Thereby, the number of fingers can be determined based on the detected position of the fingertip. Thereafter, in step S05, the relative direction of the finger is detected.

1本の指しか検出されない時は、手の重心点を取り出すことにより指の相対方向を確定させることができる。具体的には、手の重心点を中心に手の画像全体の2次元空間を4個の領域に分割する。   When only one finger is not detected, the relative direction of the finger can be determined by taking out the center of gravity of the hand. Specifically, the two-dimensional space of the entire hand image is divided into four regions around the center of gravity of the hand.

図7は、手の画像の領域分割の例を示した。図7に示すように、この4個の領域は、それぞれA、B、C及びDと標記される。指先がどの領域に位置するかを検出することにより指の相対方向が確定でき、これによりステップS06で上記指の本数と指の相対方向を応用して規則特徴とし手振りを識別することができる。   FIG. 7 shows an example of region segmentation of the hand image. As shown in FIG. 7, these four regions are labeled A, B, C, and D, respectively. By detecting in which region the fingertip is located, the relative direction of the finger can be determined, and in step S06, the number of fingers and the relative direction of the finger can be applied to identify the hand gesture as a regular feature.

図8は表の形式で手振り識別規則の例を提示する。図8に示すように、1本の指だけを検出した時、もし当該指先の位置が領域Aに位置していれば、親指上向き手振りと判定する。その他の場合に、もし当該指先が領域B、C、あるいはDに位置していれば、それぞれ親指下向き手振り、左指し手振り、ならびに右指し手振りと判定する。もちろん、もし4本より多いか等しい指の数を検出したならば、それ以上指の相対方向を検出する必要はなく禁止の手振りと判定する。   FIG. 8 presents an example of hand gesture identification rules in the form of a table. As shown in FIG. 8, when only one finger is detected, if the position of the fingertip is located in the area A, it is determined that the thumb is upwardly waving. In other cases, if the fingertip is located in the region B, C, or D, it is determined that the thumb is downward, left pointing, and right pointing respectively. Of course, if the number of fingers greater than or equal to four is detected, it is not necessary to detect the relative direction of the fingers any more and it is determined as a prohibited gesture.

図9はこの手振り識別例におけるデータフローを示した。図9に示すように、入力した手の画像については、分類器を経て識別待ち手振り(G01)あるいは無効な手振り(G02)に分類される可能性があり、当該識別待ち手振り(G01)に対し更に規則判断を行い、これにより有効な手振り(G011、それはA、B、C、DないしEで良い)あるいは無効な手振り(G012)に識別される。   FIG. 9 shows the data flow in this hand gesture identification example. As shown in FIG. 9, the input hand image may be classified into an identification waiting gesture (G01) or an invalid gesture (G02) via a classifier, and the classification waiting gesture (G01) Further rule judgment is performed, and thereby, it is identified as a valid gesture (G011, which may be A, B, C, D or E) or an invalid gesture (G012).

もちろん、以上は単なる例に過ぎず、具体的な応用時に、識別できる手振りは上記の5種に限られず、他の如何なる可能な手振りでも良く、同時に採用する分類特徴と規則特徴も具体的な識別待ち手振りによって変化できる。   Of course, the above is only an example, and the hand gestures that can be identified in a specific application are not limited to the above five types, and any other possible hand gesture can be used, and the classification features and rule features to be used at the same time are also specifically identified. It can be changed by waiting for you.

その他、実際の応用に当たっては、通常、目標場面の映像を捕捉して静態手振り識別を行うので、本発明による手振り識別方法を応用する時は、捕捉した映像中の所定フレーム数の画像により、投票原則を応用して手振り識別を行うことができる。具体的には、例えば、連続したKフレームの入力画像について、もし前記Kフレームの入力画像中にMフレームの手振り識別結果が一致したならば、当該Mフレームの手振り識別結果を当該Kフレームの入力画像中の手振り識別結果と確定することとし、KとMは所定の正の整数で、かつK>Mである。   In addition, in actual application, the target scene video is usually captured and static hand gesture identification is performed. Therefore, when applying the hand gesture identification method according to the present invention, voting is performed based on a predetermined number of frames in the captured video. Hand gesture recognition can be performed by applying the principle. Specifically, for example, for consecutive K-frame input images, if the M-frame gesture identification result matches the K-frame input image, the M-frame gesture identification result is input to the K-frame input image. It is determined that the result is the hand gesture identification result in the image, and K and M are predetermined positive integers and K> M.

例えば、上記5種の手振りを識別する本例において、映像捕捉速度を毎秒30フレームとする時、もし本発明実施例の手振り識別方法により連続した10フレームの入力画像中に手振り識別結果の一致する8フレーム以上の画像を識別した結果が一致した場合、当該手振り識別結果が当該連続10フレームの入力画像中の手振り識別結果であると考える、「8/10」準則を用いることができる。この時、誤メッセージ率は0に近く、手振り識別精度は99%より大きくなる。もちろん、この投票準則はただの例に過ぎず、当業者は具体的な応用状況を見てそれを調整することができる。   For example, in this example for identifying the above five types of hand gestures, when the video capture speed is 30 frames per second, if the hand gesture identification method of the embodiment of the present invention matches the hand gesture identification results in the continuous 10 frames of the input image. If the result of identifying images of 8 frames or more matches, the “8/10” criterion can be used, in which the hand gesture identification result is considered to be the hand gesture identification result in the input image of the continuous 10 frames. At this time, the error message rate is close to 0, and the gesture identification accuracy is greater than 99%. Of course, this voting rule is only an example, and those skilled in the art can see and adjust the specific application situation.

<2.4 手振り識別装置>
以下、図10を参考にして本発明の別の一実施例による手振り識別装置を説明する。図10は当該手振り識別装置の機能ブロック図を示した。図10に示すように、当該手振り識別装置1000は、手を含む目標場面の入力画像を取得し当該入力画像中から手の画像を抽出する取得部1010;分類器を利用して当該手の画像を分類し、これにより識別待ち手振りの分類結果を取得する分類部1020;当該手の画像中から規則特徴を抽出する特徴抽出部1030;及び、当該識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得する識別部1040を含むことができる。
<2.4 Hand gesture identification device>
Hereinafter, a hand gesture identification apparatus according to another embodiment of the present invention will be described with reference to FIG. FIG. 10 shows a functional block diagram of the hand gesture identification device. As shown in FIG. 10, the hand gesture identification device 1000 acquires an input image of a target scene including a hand and extracts an image of the hand from the input image; an image of the hand using a classifier A classification unit 1020 for obtaining a classification result of a waiting gesture for identification; a feature extraction unit 1030 for extracting a rule feature from the image of the hand; and applying the rule feature to a classification result of the identification waiting gesture Thus, an identification unit 1040 that acquires a hand gesture identification result can be included.

当該特徴抽出部1030は当該手の画像中から分類特徴を抽出することができ、かつ当該分類部1020は当該特徴抽出部1030の抽出した分類特徴を当該分類器に応用し、これにより識別待ち手振り分類結果を取得することができる。   The feature extraction unit 1030 can extract a classification feature from the image of the hand, and the classification unit 1020 applies the classification feature extracted by the feature extraction unit 1030 to the classifier. A classification result can be acquired.

当該特徴抽出部1030の抽出した分類特徴は手輪郭コンベックスハル特徴、手輪郭フーリエ記述子特徴、手輪郭不変マトリックス特徴の少なくとも一つを含むことができる。当該特徴抽出部1030の抽出した規則特徴には指の本数、指の長さ、指の指す方位、指の間の相対位置、二本の指の間の夾角の少なくとも一つを含むことができる。   The classification feature extracted by the feature extraction unit 1030 may include at least one of a hand contour convex hull feature, a hand contour Fourier descriptor feature, and a hand contour invariant matrix feature. The rule feature extracted by the feature extraction unit 1030 may include at least one of the number of fingers, the length of the finger, the orientation pointed by the finger, the relative position between the fingers, and the depression angle between the two fingers. .

当該手振り識別装置は、規則特徴を利用して分類戦略を最適化することにより当該分類器を取得するために用いる最適化部(未表示)も含むことができ、当該分類戦略には分類の数、ならびに分類の指定戦略を含むことができる。当該最適化部は以下の反復過程、即ち、訓練サンプル集を利用して、所定の分類戦略を有する分類器を訓練する過程、サンプル集の評価を訓練する分類器に応用し、これによりサンプルの分類結果を取得する過程、所定の規則特徴を前記サンプルの分類結果に応用し、これによりサンプル手振り識別結果を取得する過程、前記サンプルの手振り識別結果をもとに当該分類器の分類戦略を最適化する過程を行うために配置することができる。   The hand gesture identification device can also include an optimization unit (not shown) used to acquire the classifier by optimizing the classification strategy using the rule feature, and the classification strategy includes the number of classifications. As well as a designation strategy for classification. The optimization unit is applied to the following iterative process, that is, a process for training a classifier having a predetermined classification strategy using a training sample collection, and a classifier for training evaluation of a sample collection. The process of obtaining the classification result, applying a predetermined rule feature to the classification result of the sample, thereby obtaining the sample hand gesture identification result, and based on the hand gesture identification result of the sample, the classification strategy of the classifier is optimized Can be arranged to perform the process.

当該分類器は、決定木分類器、ランダムフォレスト分類器、パーセプトロン分類器、ニューラルネットワーク分類器、あるいはSVM分類器でよい。あるいは、当該分類器はテンプレートマッピング分類技術を用いてもよい。   The classifier may be a decision tree classifier, random forest classifier, perceptron classifier, neural network classifier, or SVM classifier. Alternatively, the classifier may use a template mapping classification technique.

選択的に、当該入力画像は、連続したKフレームの入力画像を含む選択をすることができ、かつもし前記Kフレームの入力画像中に一致するMフレームの手振り識別結果があれば、当該識別部は当該Mフレームの手振り識別結果を当該Kフレームの入力画像中の手振り識別結果と確定し、KとMは所定の正の整数で、かつK>Mである。   Optionally, the input image can be selected to include a continuous K-frame input image, and if there is a matching M-frame gesture identification result in the K-frame input image, the identification unit Confirms the gesture identification result of the M frame as the gesture identification result in the input image of the K frame, where K and M are predetermined positive integers and K> M.

当該手振り識別装置1000の取得部1010、分類部1020、特徴抽出部1030、及び識別部1040の具体的な操作過程は、以上の方法100中のステップS110〜S140での説明を参考にすることができ、ここで繰り返し述べることはしない。   The specific operation processes of the acquisition unit 1010, the classification unit 1020, the feature extraction unit 1030, and the identification unit 1040 of the hand gesture identification apparatus 1000 can be referred to the description in steps S110 to S140 in the above method 100. Yes, I will not repeat it here.

本発明のこの実施例による手振り識別装置1000は、分類器を利用して手の画像を分類し、これにより無効な手振りを排除し、識別待ち手振りの分類結果を取得し、引き続き識別待ち手振りの分類結果に規則特徴を応用し手振りの最終識別を完成する。当該方法は弱分類器と強規則判定技術を融合したもので、分類器は各種手振りの最終識別に直接用いることはせず、全体的特徴基礎の上に構築する弱分類器とし、大多数の無効な手振りは分類器のフィルタリング機能により排除され、また同時に有効な手振りは最小限の漏れで分類器を確実に通過できるようにする。その後、強規則を分類器の識別待ち手振り分類結果に作用させ、更に各種の様々な手振りを区分する。これにより、規則特徴と分類器特徴のメリットが相互に補完し合い、手振り識別の正確性を高めると同時に、誤判定の可能性を下げ、静態手振りのロバストな識別を実現することができる。   The hand gesture identification device 1000 according to this embodiment of the present invention classifies hand images using a classifier, thereby eliminating invalid hand gestures, obtaining classification waiting hand gesture classification results, and continuing to identify hand gestures. Apply the rule features to the classification result to complete the final identification of the hand gesture. This method is a combination of weak classifiers and strong rule judgment technology, and classifiers are not used directly for final identification of various hand gestures, but are weak classifiers built on the overall feature basis. Invalid hand gestures are eliminated by the filtering function of the classifier, and at the same time valid hand gestures ensure that the classifier can pass with minimal leakage. After that, the strong rule is applied to the classification waiting hand shake classification result of the classifier, and further, various kinds of hand gestures are classified. As a result, the merits of the rule feature and the classifier feature complement each other, and the accuracy of hand gesture identification is improved, and at the same time, the possibility of misjudgment is reduced and the robust recognition of the static hand gesture can be realized.

<2.5 手振り識別システム>
続いて、図11を参考に、本発明の一実施例による手振り識別システムを実現するハードウェア配置を説明する。図11に示すように、手振り識別システム1100は、外部から手振り識別を行おうとする画像あるいは映像等を入力するために用い、例えば、キーボード、マウス、ならびに通信ネットワークおよびその接続するリモート入力装置等が含まれる入力装置1110;上記の本発明実施例に従った手振り識別方法の実施、あるいは上記の本発明実施例に従った手振り識別装置の実施に用い、例えばコンピュータのCPUあるいは処理能力を有する他のチップ等が含まれ、インターネット・ネットワーク(未表示)に接続でき、処理プロセスの必要によりネットワークから必要なデータ等を取得する処理装置1120;外部に上記手振り識別結果、即ち当該入力画像中で識別した具体的な手振りの出力、あるいは無効な手振りのアラーム等の出力に用い、例えば、ディスプレイ、プリンタ、ならびに通信ネットワークおよびその接続するリモート出力装置等が含まれる出力装置1130;ならびに揮発性あるいは非揮発性方式で、上記処理過程に関係する画像、データ、取得した結果、命令、ならびに中間データ等を保存するのに用い、例えば、ランダムアクセスメモリー(RAM)、読み取り専用メモリー(ROM)、ハードディスク、あるいは半導体メモリー等の各種揮発性または非揮発性メモリーが含まれるメモリー装置1140を含む。
<2.5 Hand gesture identification system>
Next, with reference to FIG. 11, a hardware arrangement for realizing a hand gesture identification system according to an embodiment of the present invention will be described. As shown in FIG. 11, the hand gesture identification system 1100 is used to input an image or video for hand gesture identification from the outside. For example, a keyboard, a mouse, and a communication network and a remote input device connected thereto are used. Included input device 1110; used for implementation of the hand gesture identification method according to the above-described embodiment of the present invention, or implementation of the hand-shaking identification device according to the above-described embodiment of the present invention. A processing device 1120 that includes a chip, etc., can be connected to the Internet network (not shown), and obtains necessary data from the network according to the necessity of the processing process; externally identified in the above hand gesture identification result, that is, the input image Used to output specific hand gestures or invalid hand gesture alarms, for example, An output device 1130 including a ray, a printer, and a communication network and a remote output device to which the communication network is connected; and images, data, acquired results, commands, and intermediates related to the above-described processing processes in a volatile or non-volatile system It includes a memory device 1140 that is used to store data and includes various volatile or non-volatile memories such as random access memory (RAM), read only memory (ROM), hard disk, or semiconductor memory.

もちろん、簡略化のため、図11には当該システム中、本発明に関係するモジュールの一部しか示しておらず、例えば、バス、入力/出力インタフェイス等のモジュールは省略した。これ以外に、具体的な応用状況に応じて、システム1100は他の如何なる適当なモジュールも含むことができる。   Of course, for simplification, FIG. 11 shows only a part of the modules related to the present invention in the system. For example, modules such as a bus and an input / output interface are omitted. In addition, depending on the specific application situation, the system 1100 may include any other suitable module.

<3.まとめ>
本発明により、手を含む目標場面の入力画像を取得し、当該入力画像中から手の画像を抽出し、分類器を利用して手の画像を分類し、これにより識別待ち手振り分類結果を取得し、当該手の画像中から規則特徴を抽出し、当該識別待ち手振り分類結果に前記規則特徴を応用し、これにより手振り識別を取得する手振り識別方法、装置及びシステムを提供した。これは弱分類器と強規則判定技術を融合したもので、分類器は各種手振りの最終識別に直接用いることはせず、大多数の無効な手振りは分類器のフィルタリング機能により排除されるようにするため、全体的特徴の基礎の上に構築する弱分類器とし、また同時に有効な手振りは最小限の漏れで分類器を確実に通過できるようにする。その後、強規則を分類器の識別待ち手振り分類結果に作用させ、更に各種の様々な手振りを区分する。これにより、規則特徴と分類器特徴のメリットが相互に補完し合い、手振り識別の正確性を高めると同時に誤判定の可能性を下げ、静態手振りのロバストな識別を実現することができる。
<3. Summary>
According to the present invention, an input image of a target scene including a hand is acquired, an image of a hand is extracted from the input image, and a hand image is classified using a classifier, thereby acquiring an identification waiting hand shake classification result Then, a rule feature is extracted from the image of the hand, and the rule feature is applied to the classification waiting hand shake classification result, thereby providing a gesture identification method, apparatus, and system for acquiring the gesture identification. This is a fusion of weak classifiers and strong rule decision technology, and classifiers are not used directly for the final identification of various hand gestures, and the majority of invalid hand gestures are eliminated by the filtering function of the classifiers. Therefore, a weak classifier built on the basis of the overall features, and at the same time, valid hand gestures can be reliably passed through the classifier with minimal leakage. After that, the strong rule is applied to the classification waiting hand shake classification result of the classifier, and further, various kinds of hand gestures are classified. As a result, the merits of the rule feature and the classifier feature complement each other, and the accuracy of the hand gesture identification is enhanced, and at the same time, the possibility of erroneous determination is lowered, and the robust hand gesture recognition can be realized.

以上、既に添付図を参考にしながら本発明の実施例による手振り識別方法と装置を詳細に説明した。本公開で言及した装置、装置、システムのブロック図は、ただの例に過ぎず、かつ必ずブロック図に示された方式で接続、アレンジ、配置しなければならないと要求し、あるいは暗示する意図はない。当業者なら知り得るように、任意の方式でこれらの装置、装置、システムを接続、アレンジ、配置することができる。例えば、「含む」、「包含する」、「有する」等の言葉はオープンな意味の言葉で、「含むがこれに限らない」ことを指し、互いに置き換えて使用できる。ここで使用する言葉、「あるいは」と「及び」は「及び/または」の言葉を指し、前後の文から明らかにこれと違うことを指していない限り、互いに置き換えて使用できる。ここで使用する言葉、「例えば」は「例えば、しかしこれに限らない」というフレーズを指し、互いに置き換えて使用できる。   The hand gesture identification method and apparatus according to the embodiments of the present invention have been described in detail with reference to the accompanying drawings. The block diagrams of the devices, devices, and systems mentioned in this disclosure are only examples and are not intended to require or imply that they must be connected, arranged and arranged in the manner shown in the block diagrams. Absent. Those skilled in the art will know that these devices, devices, and systems can be connected, arranged and arranged in any manner. For example, the words “including”, “including”, “having”, etc. are words having an open meaning, which means “including but not limited to” and can be used interchangeably. The words “or” and “and” as used herein refer to the words “and / or” and can be used interchangeably as long as they are not clearly different from the preceding and following sentences. As used herein, “for example” refers to the phrase “for example but not limited to” and can be used interchangeably.

本公開のステップフローチャートならびに以上の方法の説明はただの例に過ぎず、かつ必ず提示された順序で各実施例のステップを行わなければならないと要求し、あるいは暗示する意図はない。当業者なら知り得るように、任意の順序で以上の実施例のステップの順序を行うことができる。例えば、「その後」、「それから」、「続いて」等の言葉は、ステップの順序を限定する意図はなく、これらの言葉は、ただ読者にこれらの方法の説明を通読させるために用いているだけである。この他、例えば冠詞、「一つの」、「一」あるいは「当該」の使用は、単数的要素の如何なる引用についても当該要素を単数に限定するものと解釈されてはならない。   The step flow charts in the present disclosure and the above method description are merely examples, and are not intended to imply or imply that the steps of each embodiment must be performed in the order presented. As will be appreciated by those skilled in the art, the order of the steps of the above embodiments can be performed in any order. For example, the words “after”, “then”, “follow”, etc. are not intended to limit the order of the steps, and these words are only used to let the reader read through the explanation of these methods Only. In addition, the use of, for example, the article “a”, “a” or “the” should not be construed as limiting any citation of the singular element to the singular.

提案の公開した面における以上の説明は、如何なる当業者にも本発明を行い、あるいは使用できるようにさせるものである。これらの面に対する各種修正も、当業者にとっては極めて見やすいものであり、ここで定義された一般原理は他の面に応用できるが本発明の範囲から外れるものではない。このため、本発明はここに示した面に限定する意図はなく、ここに公開した原理と新規的な特徴に一致する最も広い範囲に従うこととなる。   The foregoing description of the proposed public aspects is intended to enable any person skilled in the art to make or use the present invention. Various modifications to these aspects are also readily apparent to those skilled in the art, and the general principles defined herein can be applied to other aspects, but do not depart from the scope of the invention. For this reason, the present invention is not intended to be limited to the aspects shown here, but is to be accorded the widest scope consistent with the principles and novel features disclosed herein.

Claims (12)

手を含む目標場面の入力画像を取得し、前記入力画像中から手の画像を抽出するステップと、
分類器を利用して前記手の画像を分類し、これにより識別待ち手振りの分類結果を取得するステップと、
前記手の画像中から規則特徴を抽出するステップと、
前記識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得するステップと、を含み、
前記規則特徴とは、規則判断を行う時に用いる規則の対応する特徴である、手振り識別方法。
Obtaining an input image of a target scene including a hand and extracting an image of the hand from the input image;
Classifying the image of the hand using a classifier, thereby obtaining a classification result of the identification waiting hand shake; and
Extracting rule features from the hand image;
Applying the rules characterized classification result of the identification waiting hand gestures, thereby viewing including acquiring a gesture identification result, and
The rule feature is a gesture identification method , which is a feature corresponding to a rule used when making a rule decision .
前記分類器を利用して前記手の画像を分類し、これにより識別待ち手振り分類結果を取得するステップは、
前記手の画像中から分類特徴を抽出するステップと、
前記分類特徴を前記分類器に応用し、これにより識別待ち手振りの分類結果を取得するステップと、を含み、
前記分類特徴とは、前記分類器が前記手の画像を分類する時に用いる特徴である、請求項1に記載の手振り識別方法。
Classifying the image of the hand using the classifier, thereby obtaining the identification waiting hand shake classification result,
Extracting classification features from the hand image;
Applying said classification features to the classifier, thereby viewing including acquiring a classification result of the identification waiting hand waving, a,
2. The gesture identification method according to claim 1, wherein the classification feature is a feature used when the classifier classifies the hand image .
前記分類特徴は、手輪郭コンベックスハル特徴、手輪郭フーリエ記述子特徴、及び手輪郭不変マトリックス特徴のうちの少なくとも一つを含む、請求項2に記載の手振り識別方法。   3. The method according to claim 2, wherein the classification feature includes at least one of a hand contour convex hull feature, a hand contour Fourier descriptor feature, and a hand contour invariant matrix feature. 前記規則特徴は、指の本数、指の長さ、指の指す方位、指の間の相対位置、及び二本の指の間の夾角のうちの少なくとも一つを含む、請求項1〜3のうちの任意の一項に記載の手振り識別方法。   The rule feature includes at least one of the number of fingers, the length of the finger, the orientation pointed by the finger, the relative position between the fingers, and the depression angle between the two fingers. The hand gesture identification method according to any one of the items. 前記分類器は、規則特徴を利用して分類戦略を最適化することにより取得した分類器であり、前記分類戦略には、分類の数ならびに分類の指定戦略を含む、請求項1に記載の手振り識別方法。   The gesture according to claim 1, wherein the classifier is a classifier obtained by optimizing a classification strategy using rule features, and the classification strategy includes a number of classifications and a designation strategy for classification. Identification method. 前記分類戦略の最適化は、以下の反復過程、即ち、
訓練サンプル集を利用して所定の分類戦略を有する分類器を訓練する過程と、
サンプル集の評価を訓練する分類器に応用し、これによりサンプル分類結果を取得する過程と、
所定の規則特徴を前記サンプル分類結果に応用し、これによりサンプル手振り識別結果を取得する過程と、
前記サンプル手振り識別結果をもとに、前記分類器の分類戦略を最適化する過程と、を含む、請求項5に記載の手振り識別方法。
The optimization of the classification strategy involves the following iterative process:
Using a training sample collection to train a classifier having a predetermined classification strategy;
Applying the sample collection evaluation to a classifier that trains, thereby obtaining sample classification results,
Applying predetermined rule features to the sample classification results, thereby obtaining sample hand gesture identification results;
6. The gesture identification method according to claim 5, comprising a step of optimizing a classification strategy of the classifier based on the sample gesture identification result.
前記分類器は、決定木分類器、ランダムフォレスト分類器、パーセプトロン分類器、ニューラルネットワーク分類器、あるいはSVM分類器である、請求項1に記載の手振り識別方法。   The hand gesture identification method according to claim 1, wherein the classifier is a decision tree classifier, a random forest classifier, a perceptron classifier, a neural network classifier, or an SVM classifier. 前記分類器は、テンプレートマッピング分類技術を用いる、請求項1に記載の手振り識別方法。   The hand gesture identification method according to claim 1, wherein the classifier uses a template mapping classification technique. 前記入力画像は連続したKフレームの入力画像を含み、かつもし前記Kフレームの入力画像の中には一致するMフレームの手振り識別結果があれば、前記Mフレームの手振り識別結果を、前記Kフレームの入力画像中の手振り識別結果と確定し、KとMは所定の正の整数で、かつK>Mである、請求項1に記載の手振り識別方法。   The input image includes continuous K-frame input images, and if there is a matching M-frame gesture identification result in the K-frame input image, the M-frame gesture identification result is converted to the K-frame identification result. 2. The hand movement identification method according to claim 1, wherein the hand movement identification result in the input image is determined, K and M are predetermined positive integers, and K> M. 手を含む目標場面の入力画像を取得し、前記入力画像中から手の画像を抽出する取得部と、
分類器を利用して前記手の画像を分類し、これにより識別待ち手振りの分類結果を取得する分類部と、
前記手の画像中から、規則特徴を抽出する特徴抽出部と、
前記識別待ち手振りの分類結果に前記規則特徴を応用し、これにより手振り識別結果を取得する識別部と、を含み、
前記規則特徴とは、規則判断を行う時に用いる規則の対応する特徴である、手振り識別装置。
An acquisition unit for acquiring an input image of a target scene including a hand and extracting an image of the hand from the input image;
Classifying the image of the hand using a classifier, thereby obtaining a classification result of identification waiting hand shake,
A feature extraction unit for extracting regular features from the hand image;
The application of the rules, wherein the classification result of the identification waiting hand gestures, thereby viewing including an identification section, a to get the gesture identification result,
The rule feature is a gesture identification device that is a feature corresponding to a rule used when making a rule decision .
コンピュータに、請求項1〜9のうちの任意の1項に記載の手振り識別方法を実行させるためのプログラム。   A program for causing a computer to execute the hand gesture identification method according to any one of claims 1 to 9. 請求項11に記載のプログラムを記憶したコンピュータ読み取り可能な記憶媒体。   A computer-readable storage medium storing the program according to claim 11.
JP2016142487A 2015-07-23 2016-07-20 Hand gesture identification method and apparatus Expired - Fee Related JP6202157B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510437104.3 2015-07-23
CN201510437104.3A CN106372564A (en) 2015-07-23 2015-07-23 Gesture identification method and apparatus

Publications (2)

Publication Number Publication Date
JP2017027600A JP2017027600A (en) 2017-02-02
JP6202157B2 true JP6202157B2 (en) 2017-09-27

Family

ID=57879891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016142487A Expired - Fee Related JP6202157B2 (en) 2015-07-23 2016-07-20 Hand gesture identification method and apparatus

Country Status (2)

Country Link
JP (1) JP6202157B2 (en)
CN (1) CN106372564A (en)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688823B (en) 2017-07-20 2018-12-04 北京三快在线科技有限公司 A kind of characteristics of image acquisition methods and device, electronic equipment
CN107563333A (en) * 2017-09-05 2018-01-09 广州大学 A kind of binocular vision gesture identification method and device based on ranging auxiliary
CN107608510A (en) * 2017-09-13 2018-01-19 华中师范大学 Method for building up, device and the electronic equipment in gesture model storehouse
CN107562203A (en) * 2017-09-14 2018-01-09 北京奇艺世纪科技有限公司 A kind of input method and device
CN107729823B (en) * 2017-09-28 2020-03-17 江南大学 Online human-computer interaction method based on E-SOINN network
CN110263599A (en) * 2018-03-12 2019-09-20 鸿富锦精密工业(武汉)有限公司 Message transfer system and information transferring method
CN108875579B (en) * 2018-05-15 2022-08-05 厦门大学 Morphology-based close-range gesture recognition method
CN109697407A (en) * 2018-11-13 2019-04-30 北京物灵智能科技有限公司 A kind of image processing method and device
CN109886164B (en) * 2019-01-30 2022-11-04 济南大学 Abnormal gesture recognition and processing method
CN109947257A (en) * 2019-03-30 2019-06-28 哈尔滨理工大学 A kind of images of gestures recognition methods
JP7190987B2 (en) * 2019-08-09 2022-12-16 株式会社日立製作所 Information processing system and information processing method
CN110751082B (en) * 2019-10-17 2023-12-12 烟台艾易新能源有限公司 Gesture instruction recognition method for intelligent home entertainment system
CN110716648B (en) * 2019-10-22 2021-08-24 上海商汤智能科技有限公司 Gesture control method and device
CN111126280B (en) * 2019-12-25 2023-03-21 华南理工大学 Gesture recognition fusion-based aphasia patient auxiliary rehabilitation training system and method
CN111523435A (en) * 2020-04-20 2020-08-11 安徽中科首脑智能医疗研究院有限公司 Finger detection method, system and storage medium based on target detection SSD
CN111881862A (en) * 2020-07-31 2020-11-03 Oppo广东移动通信有限公司 Gesture recognition method and related device
CN112767471B (en) * 2021-01-04 2024-03-29 湖南大学 Tire ground contact area measuring method and device based on image feature extraction
CN113380088A (en) * 2021-04-07 2021-09-10 上海中船船舶设计技术国家工程研究中心有限公司 Interactive simulation training support system
CN113849068B (en) * 2021-09-28 2024-03-29 中国科学技术大学 Understanding and interaction method and system for multi-modal information fusion of gestures
US11983327B2 (en) * 2021-10-06 2024-05-14 Fotonation Limited Method for identifying a gesture
CN114253395B (en) * 2021-11-11 2023-07-18 易视腾科技股份有限公司 Gesture recognition system and method for television control

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2986455B1 (en) * 1998-07-24 1999-12-06 株式会社エイ・ティ・アール知能映像通信研究所 Hand gesture recognition device
CN102236412A (en) * 2010-04-30 2011-11-09 宏碁股份有限公司 Three-dimensional gesture recognition system and vision-based gesture recognition method
JP2012243180A (en) * 2011-05-23 2012-12-10 Sony Corp Learning device, method and program
JP5846552B2 (en) * 2011-06-03 2016-01-20 国立大学法人九州工業大学 Sign language recognition method and apparatus
CN102855488A (en) * 2011-06-30 2013-01-02 北京三星通信技术研究有限公司 Three-dimensional gesture recognition method and system
US9171223B2 (en) * 2012-12-18 2015-10-27 Hyundai Motor Company System and method for effective section detecting of hand gesture
CN103926999B (en) * 2013-01-16 2017-03-01 株式会社理光 Palm folding gesture identification method and device, man-machine interaction method and equipment
CN103455794B (en) * 2013-08-23 2016-08-10 济南大学 A kind of dynamic gesture identification method based on frame integration technology
CN104268514A (en) * 2014-09-17 2015-01-07 西安交通大学 Gesture detection method based on multi-feature fusion

Also Published As

Publication number Publication date
JP2017027600A (en) 2017-02-02
CN106372564A (en) 2017-02-01

Similar Documents

Publication Publication Date Title
JP6202157B2 (en) Hand gesture identification method and apparatus
US20230117712A1 (en) Feature density object classification, systems and methods
Chakraborty et al. An overview of face liveness detection
Raghavendra et al. Novel image fusion scheme based on dependency measure for robust multispectral palmprint recognition
Sikka et al. Multiple kernel learning for emotion recognition in the wild
Shao et al. Computer vision and machine learning with RGB-D sensors
Kähm et al. 2d face liveness detection: An overview
Motiian et al. Online human interaction detection and recognition with multiple cameras
JP2014137818A (en) Method and device for identifying opening and closing operation of palm, and man-machine interaction method and facility
JP5514918B2 (en) Head recognition method
JP2020501264A (en) System and method for performing fingerprint authentication using images captured with a mobile device
KR101647803B1 (en) Face recognition method through 3-dimension face model projection and Face recognition system thereof
KR102399025B1 (en) Improved data comparison method
CN112101208A (en) Feature series fusion gesture recognition method and device for elderly people
JP5879188B2 (en) Facial expression analysis apparatus and facial expression analysis program
Mahmoud et al. Automatic analysis of naturalistic hand-over-face gestures
WO2022068931A1 (en) Non-contact fingerprint recognition method and apparatus, terminal, and storage medium
Akoum et al. Hand gesture recognition approach for asl language using hand extraction algorithm
JP2006293720A (en) Face detection apparatus, face detection method, and face detection program
JP6003367B2 (en) Image recognition apparatus, image recognition method, and image recognition program
Hoque et al. Computer vision based gesture recognition for desktop object manipulation
Poulopoulos et al. PupilTAN: A few-shot adversarial pupil localizer
JP2017084006A (en) Image processor and method thereof
Sun et al. Dual camera based feature for face spoofing detection
Bakheet A fuzzy framework for real-time gesture spotting and recognition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170801

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170814

R151 Written notification of patent or utility model registration

Ref document number: 6202157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees