JP3440641B2 - Operation start position detection method - Google Patents
Operation start position detection methodInfo
- Publication number
- JP3440641B2 JP3440641B2 JP19015495A JP19015495A JP3440641B2 JP 3440641 B2 JP3440641 B2 JP 3440641B2 JP 19015495 A JP19015495 A JP 19015495A JP 19015495 A JP19015495 A JP 19015495A JP 3440641 B2 JP3440641 B2 JP 3440641B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- palm
- face
- shape
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は人間の身振りや手振りの
認識をおこない、認識結果に基づいて人間と機械のイン
ターフェースをおこない、指示装置や手話動作認識など
に利用可能な動作の開始位置検出方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention recognizes human gestures and hand gestures, interfaces humans with machines based on the recognition results, and detects a start position of motions that can be used for pointing devices and sign language motion recognition. Regarding
【0002】[0002]
【従来の技術】人間の身振り、手振りを理解する方法の
中で、動作の開始位置を特定する時に、題名:「動き情
報の検出とヒューマンインターフェースへの応用」(H
C91−33:待井康弘他:電子情報通信学会信学技報
ヒューマンコミュニケーション:1991年)のように
任意の絶対空間の座標を使った位置の特定方式が従来使
われ、また開始位置の代表点として、検出された任意の
物体の重心位置を代表点としている。2. Description of the Related Art In the method of understanding human gestures and hand gestures, when specifying the start position of a motion, the title: "Detection of motion information and application to human interface" (H
C91-33: Yasuhiro Machii et al .: The Institute of Electronics, Information and Communication Engineers, IEICE Technical Report, Human Communication: 1991), a position identification method using coordinates in an arbitrary absolute space has been conventionally used, and as a representative point of the start position. , The detected position of the center of gravity of any object is used as the representative point.
【0003】[0003]
【発明が解決しようとする課題】従来の技術で任意の絶
対空間の座標を使った時には、被験者が違った時に体の
大きさが違うなどで、特定された開始位置の座標値が意
味を持たなくなり、また被験者毎にデータベースを持っ
たのでは、被験者の数に比例してデータベースの数が多
くなってしまうという課題がある。また開始位置の代表
点として重心位置のみを取った時には、被験者が唇に意
味があって指さしても、てのひらの重心位置を取ると、
重心位置では首付近を表していることになり、正しく被
験者が意図する位置が代表点となっていない。When the coordinates of an arbitrary absolute space are used in the prior art, the coordinate value of the specified starting position is significant because the size of the body is different when the subject is different. Moreover, there is a problem that the number of databases will increase in proportion to the number of subjects if there is no database for each subject. Moreover, when only the center of gravity is taken as the representative point of the starting position, even if the subject points at the lips with meaning, if the center of gravity of the palm is taken,
The position of the center of gravity represents the vicinity of the neck, and the position intended by the subject is not the representative point.
【0004】そこで、本発明では開始位置を検出するた
めの空間を、撮影された被験者の身体特徴によって分割
し、開始動作位置を被験者との相対位置で表現すること
が出来、被験者が代わった時にも開始動作位置を特定す
ることが出来、また被験者が、身体の任意の部分を意識
的に指し示した時、指の先端部をてのひらの代表点とす
ることにより被験者の意図を開始動作位置に反映するこ
とが可能となることを目的とする。Therefore, in the present invention, the space for detecting the start position can be divided by the photographed body characteristics of the subject, and the start motion position can be expressed by the relative position with respect to the subject. Can also specify the starting movement position, and when the subject consciously points to any part of the body, the subject's intention is reflected in the starting movement position by making the tip of the finger the representative point of the palm. The purpose is to be able to.
【0005】[0005]
【課題を解決するための手段】上記目的を達成するため
に、本出願発明は少なくとも被験者の上半身を複眼式カ
メラにより撮影する手段と撮影された被験者の身体を抜
き出す手段と、被験者自身の部位に沿った空間領域分割
手段と、顔の中の各部位に沿って領域を分割する手段
と、少なくとも右左どちらかのてのひらを抽出する手段
と、動作の開始タイミングを検出する手段と、てのひら
画像の特徴を抜き出す手段と、てのひら形状が指示形状
かを判定する手段と、顔の中をてのひらが指しているか
を判定する手段と、てのひらの代表点を重心位置とする
か指先の先端位置とするかを決定する手段と検出された
開始動作位置を登録する手段を備えた動作開始位置検出
方法である。In order to achieve the above object, the present invention provides at least means for photographing the upper half of the body of a subject with a compound-eye camera, means for extracting the body of the subject who has been photographed, and the body of the subject. Along the spatial area dividing means, a means for dividing the area along each part of the face, a means for extracting at least either the left or the right palm, a means for detecting the start timing of the operation, the characteristics of the palm image Means for extracting the palm shape, means for determining whether the palm shape is the designated shape, means for determining whether the palm shape is pointing in the face, and determining whether the representative point of the palm is the center of gravity position or the tip position of the fingertip. It is an operation start position detection method including a means for determining and a means for registering the detected start operation position.
【0006】[0006]
【作用】本発明の開始動作位置検出方法では、被験者の
身体特徴に沿って空間領域を分割することにより、被験
者が代わった時も同じ開始動作位置のデータベースを使
用することが出来、被験者が示したてのひらの形状が指
示形状かどうかを判定することにより、被験者が意図す
る開始動作位置を検出することが可能になる。In the starting motion position detecting method of the present invention, the database of the same starting motion position can be used even when the subject is changed by dividing the spatial region according to the body feature of the subject. By determining whether the shape of the vertical palm is the designated shape, it is possible to detect the start motion position intended by the subject.
【0007】[0007]
【実施例】
(実施例1)この発明の1実施例の動作について図1の
フローチャートに沿って説明する。図2に示すように少
なくとも人物の上半身が撮影されている画像から背景の
みの画像の差分を取り人物を抜き出す。Embodiment 1 The operation of one embodiment of the present invention will be described with reference to the flowchart of FIG. As shown in FIG. 2, a person is extracted from the image in which at least the upper half of the person is photographed by subtracting the image of only the background.
【0008】(ステップ1)ステップ1で抜き出した身
体画像を識別関数fgを用いて2値化する。(Step 1) The body image extracted in step 1 is binarized by using the discrimination function fg.
【0009】[0009]
【数1】 [Equation 1]
【0010】なお、閾値に関しては光源の違いにより値
が変わってくるので可変とする。次に身体の外郭線をエ
ッジ抽出フィルタを用い、身体の外郭線を(図3)に示
すように抜き出す。The threshold value is variable because it varies depending on the light source. Next, the contour line of the body is extracted by using an edge extraction filter as shown in (FIG. 3).
【0011】画像の上部より探索をおこない、図4に示
すように人物の外形線とX軸に平行な線とが接した線を
身体の頭を表す線、HULとする。HULに接し、人物
の外形線とY軸に平行な線が交わる線の中で画像中左側
の線を、顔の右側を表す線FRL、右側の線を顔の左側
を表す線FLLとする。FRLを垂直に伸ばし、外形線
と交わった点をfrlp(Xf,Yf)とする。また画
像中の左側から探索をおこない、Y軸に平行で身体の外
形線と交わる点をtempp(Xt,Yt)を求める。
frlpからtempp迄外形線を探索し、曲率が最大
の点を右肩の点shpとする。shpを通り、X軸に平
行な線をSUL、Y軸に平行な線をSHRLとする。ま
たFRLとFLLの中線をMCLとする。MCLの軸を
中心としてSHRLに対称な線をSHLL、ERLに対
象な線をELLとする。またSULとHULの3/4の
位置にあるX軸に平行な線をNEL、SULとX軸の中
線をBMLとする。A search is performed from the upper part of the image, and the line where the outline of the person and the line parallel to the X-axis are in contact with each other as shown in FIG. Of the lines that are in contact with the HUL and intersect with the outline of the person and the lines parallel to the Y axis, the left side line in the image is the line FRL representing the right side of the face, and the right side line is the line FLL representing the left side of the face. The FRL is extended vertically, and the point intersecting the outline is frlp (Xf, Yf). In addition, a search is performed from the left side of the image, and a point that is parallel to the Y axis and intersects with the outline of the body is found as tempp (Xt, Yt).
The contour line is searched from frlp to tempp, and the point having the maximum curvature is set as the right shoulder point shp. A line passing through shp and parallel to the X-axis is SUL, and a line parallel to the Y-axis is SHRL. The middle line between FRL and FLL is MCL. A line symmetrical to SHRL about the axis of MCL is SHLL, and a line symmetrical to ERL is ELL. The line parallel to the X-axis at the position of 3/4 of SUL and HUL is NEL, and the middle line between SUL and X-axis is BML.
【0012】前記ERL、SHRL,FRL,MCL,
FLL,SHLL,ELL,HUL,NEL,SUL,
BMLを使って右カメラ、左カメラ画像の領域を図5の
ように分割する。次に図5に示すように前記の線分によ
って生じた交点を求める。右カメラ、左カメラ画像での
同じ交点番号を左右の対応点とする。交点番号0の画像
上の座標値を(Xr0,Yr0),(Xl0,Yl0)
とすれば、(数3)に代入し、空間位置を計算する。The ERL, SHRL, FRL, MCL,
FLL, SHLL, ELL, HUL, NEL, SUL,
Using BML, the regions of the right camera and left camera images are divided as shown in FIG. Next, as shown in FIG. 5, the intersection point generated by the line segment is obtained. The right and left corresponding points have the same intersection number in the right and left camera images. The coordinate value on the image of intersection number 0 is (Xr0, Yr0), (Xl0, Yl0)
If so, it is substituted into (Equation 3) and the spatial position is calculated.
【0013】[0013]
【数2】 [Equation 2]
【0014】同様に全ての交点についても空間位置の計
算をおこなう。その結果に基づいて空間領域コード(0
〜24)を定義する。空間領域コード(0〜24)から
MCLとSHRLの距離だけ人物の前にある領域を空間
領域コード(25〜49)、さらに前方にある領域を空
間領域コード(50〜74)と定義し、それぞれの定義
された空間領域は空間領域コードテーブルとして空間の
座標値を格納する。このことにより、図6に示すように
被験者自身の部位に沿った領域(顔、首、胸、腹、顔の
横等)の分割が可能となり、空間領域コードが被験者自
身の部位との対応付けを示すことになる。なおこの領域
コードはデータグローブからの計測データ及びキーボー
ドからの指定でも作成できる。Similarly, spatial positions are calculated for all intersections. Based on the result, the spatial domain code (0
~ 24) are defined. The area in front of the person by the distances of MCL and SHRL from the spatial area code (0 to 24) is defined as the spatial area code (25 to 49), and the area further in front is defined as the spatial area code (50 to 74). The space area defined by stores the space coordinate values as a space area code table. This makes it possible to divide the region (face, neck, chest, abdomen, side of face, etc.) along the subject's part as shown in FIG. 6, and associate the spatial region code with the subject's part. Will be shown. This area code can also be created by measuring data from the data glove and specifying from the keyboard.
【0015】(ステップ2)顔を示す領域のテンプレー
ト画像を図7に示す。ここでは画像の大きさをxfac
e,yfaceとして定義する。テンプレート画像内に
目、耳、口、頬、顎、額、鼻の領域を定義する。前記空
間領域コードの顔を示す領域11を上記のテンプレート
画像を用いて正規化する。例えば口領域については図7
のテンプレート画像では開始位置(xt_m,yt_
m)大きさxt_mlen,yt_mlenとする。(Step 2) FIG. 7 shows a template image of an area showing a face. Here, the size of the image is xfac
It is defined as e, yface. Define eye, ear, mouth, cheek, chin, forehead, and nose areas in the template image. The area 11 showing the face of the spatial area code is normalized using the template image. For example, for the mouth area, see FIG.
In the template image of, the start position (xt_m, yt_
m) Let the size be xt_mlen and yt_mlen.
【0016】顔を示す空間領域コード11の大きさが始
点(xf,yf)、高さylen,幅xlenとした
時、正規化をおこなう。、顔の口領域の始点を(xf_
mouth,yf_mouth)、高さをxlen_m
outh、幅をyflen_mouthとすると顔の口
領域は(数3)で表される。When the size of the space area code 11 indicating the face is the starting point (xf, yf), the height ylen, and the width xlen, normalization is performed. , The start point of the mouth area of the face is (xf_
mouth, yf_mouth), the height is xlen_m
If outh and the width are yflen_mouth, the mouth area of the face is expressed by (Equation 3).
【0017】[0017]
【数3】 [Equation 3]
【0018】上記と同様に目、耳、頬、顎、額、鼻領域
の計算をおこない、顔領域の分割をおこなう。Similar to the above, the eye, ear, cheek, chin, forehead, and nose areas are calculated, and the face area is divided.
【0019】(ステップ3)次に色情報をもとに肌色情
報を抜き出した状態を図8に示す。この内てのひらの大
きさを示す閾値に入っている物体をてのひらと特定す
る。てのひらの判定は識別関数fgで(数4)あらわさ
れる。(Step 3) Next, FIG. 8 shows a state in which the skin color information is extracted based on the color information. An object that falls within the threshold value indicating the size of the palm is identified as the palm. The determination of the open palm is expressed by the discriminant function fg (Equation 4).
【0020】[0020]
【数4】 [Equation 4]
【0021】よって図8に示すLab_1,Lab_2
はてのひらと判定され、それぞれ右てのひら、左てのひ
らが特定される。Therefore, Lab_1 and Lab_2 shown in FIG.
The palm on the right is determined, and the palm on the right and the palm on the left are specified.
【0022】(ステップ4)図9に時系列的にてのひら
が抽出された状態を示す。時刻T(n)の時のてのひら
の右カメラの重心を(Xc1_n_r,Yc1_n_
r)、左カメラの重心位置を(Xc1_n_l,Yc1
_n_l)とするとてのひらの空間位置は(数5)で計
算される。(Step 4) FIG. 9 shows a state in which palms are extracted in time series. At time T (n), the center of gravity of the right camera on the palm of the palm is (Xc1_n_r, Yc1_n_
r), the center of gravity of the left camera is (Xc1_n_l, Yc1
_N_l), the spatial position of the palm is calculated by (Equation 5).
【0023】[0023]
【数5】 [Equation 5]
【0024】時刻T(n+1)の時の重心位置から差分
を計算し、移動距離をdとすると(数6)で表される。When the difference is calculated from the position of the center of gravity at time T (n + 1) and the moving distance is d, it is expressed by (Equation 6).
【0025】[0025]
【数6】 [Equation 6]
【0026】少なくとも右、左どちらかのてのひらの移
動距離dが閾値を越えた時、時刻T(n+1)を開始タ
イミングとして検出する。At least when the moving distance d of the right or left palm exceeds the threshold value, the time T (n + 1) is detected as the start timing.
【0027】(ステップ5)ステップ4で抜き出された
少なくとも一方のてのひらの特徴を、(図10)に示す
ように重心位置(Xc1_r(l),Ycl_r
(l))、最大長を示す2点の座標(Xm12_r
(l),Ym12_r(l))(Xm11_r(l),
Ym11_r(l))とX軸に平行な線と最大長を示す
2点を結ぶ線との角度θを(表1)に格納する。(Step 5) As shown in (FIG. 10), the characteristics of at least one of the palms extracted in Step 4 are set at the center of gravity (Xc1_r (l), Ycl_r).
(L)), the coordinates of two points indicating the maximum length (Xm12_r
(L), Ym12_r (l)) (Xm11_r (l),
The angle θ between Ym11_r (l)) and the line parallel to the X axis and the line connecting the two points indicating the maximum length is stored in (Table 1).
【0028】(ステップ6)(Step 6)
【0029】[0029]
【表1】 [Table 1]
【0030】次に請求項5に示すようにステップ4で抜
き出されたてのひらの外形線の曲率を(数7)で求め曲
率がある閾値ここでは1を越えた点を多角形の1点とし
て、てのひらを多角形近似する。次に図11に示すよう
に多角形近似されたてのひらの凸閉包図形を作成する。
凸閉包図形から多角形近似されたてのひらの差分を取
る。この時、凹部があれば図12に示すように残余図形
が残る。残余図形の曲率最大点を図12に示すようPc
urとする。残余図形が1つの時、曲率最大点より最大
長辺へ垂線を下ろし、(数8)に示す識別関数で両側の
辺の比を用いて指示形状かどうかの判定をおこなう。Next, as shown in claim 5, the curvature of the contour line of the fresh palm extracted in step 4 is obtained by (Equation 7), and there is a threshold value of curvature. Here, a point exceeding 1 is defined as one point of the polygon. , The palm is approximated to a polygon. Next, as shown in FIG. 11, a convex closed figure of a freshly approximated polygon is created.
The difference of the freshly-approximated polygons is taken from the convex hull figure. At this time, if there is a concave portion, a residual figure remains as shown in FIG. The maximum curvature point of the residual figure is Pc as shown in FIG.
ur. When there is one residual figure, a perpendicular is drawn from the maximum point of curvature to the longest side, and the discriminant function shown in (Equation 8) is used to determine whether or not the shape is a designated shape by using the ratio of the sides.
【0031】[0031]
【数7】 [Equation 7]
【0032】[0032]
【数8】 [Equation 8]
【0033】図12に示す図形は識別関数(数8)によ
り指示形状と判定される。
(ステップ7)ステップ4で抽出されたてのひら画像の
形状がステップ7で指示形状と判定された時、ステップ
6で求めた最大長を示す2点の座標の内、最大長を示す
2点を結んだ線分に直交する線分を引き、てのひら領域
を示す長さが少ない方を指示形状の先端位置として検出
する。図10ではXmr1_p,Ymr1_pが指示形
状の先端位置と検出される。The figure shown in FIG. 12 is determined to be the indicated shape by the discrimination function (Equation 8). (Step 7) When the shape of the fresh palm image extracted in Step 4 is determined to be the designated shape in Step 7, the two points indicating the maximum length are connected among the coordinates of the two points indicating the maximum length obtained in Step 6. A line segment orthogonal to the elliptical line segment is drawn, and one having a smaller length indicating the palm area is detected as the tip position of the pointing shape. In FIG. 10, Xmr1_p and Ymr1_p are detected as the tip positions of the indicated shape.
【0034】(ステップ8)ステップ8で求められた指
示形状の先端位置の空間位置を右カメラ、左カメラのて
のひら画像の先端位置の座標(Xmr1_p,Ymr1
_p),(Xml1_p,Yml1_p)から(数9)
を用いててのひらの先端位置の空間位置(Xw_p,Y
w_p,Zw_p)を計算する。(Step 8) Coordinates (Xmr1_p, Ymr1) of the tip positions of the palm images of the right camera and the left camera with the spatial position of the tip position of the pointing shape obtained in step 8
_P), (Xml1_p, Yml1_p) to (Equation 9)
The spatial position (Xw_p, Y
w_p, Zw_p) is calculated.
【0035】[0035]
【数9】 [Equation 9]
【0036】求められた空間位置がステップ2で求めら
れた領域(0〜24)に相当する時、身体接触位置にあ
ると判定される。また空間位置がステップ2で求められ
た領域(25〜74)にある時、てのひらは身体接触位
置にはないと判定される。When the obtained spatial position corresponds to the region (0 to 24) obtained in step 2, it is determined that the body contact position is present. When the spatial position is in the area (25 to 74) obtained in step 2, it is determined that the palm is not in the body contact position.
【0037】(ステップ9)ステップ7で指示形状では
ないと判定されるか、指示形状であってもステップ9で
身体接触位置ではないと判定された時、てのひらの代表
点として重心位置が登録される。(Step 9) When it is determined in step 7 that the shape is not the designated shape, or even if the designated shape is not the physical contact position in step 9, the center of gravity position is registered as a representative point of the palm. It
【0038】(ステップ10)ステップ9で身体接触位
置と判定された時、次に先端位置が顔の内部にあるかど
うかの判定をおこなう。ステップ2で求めた空間領域の
うち領域11の所にあるものは顔の内部にあると判定さ
れる。(Step 10) When it is determined in step 9 that the body contact position is present, it is next determined whether or not the tip position is inside the face. Of the spatial areas obtained in step 2, the area in area 11 is determined to be inside the face.
【0039】(ステップ11)ステップ11で顔の内部
と判定された時、身体部分はステップ2で求めた顔の空
間領域11と検出され、ステップ9で検出されたてのひ
らの重心位置が身体位置のどの領域にあるかを検出す
る。(Step 11) When it is determined in step 11 that the inside of the face is present, the body part is detected as the spatial area 11 of the face obtained in step 2, and the position of the center of gravity of the fresh palm detected in step 9 is the body position. Detect which area it is in.
【0040】(ステップ12)ステップ11で顔の内部
を指示、接触していると判定された時、てのひらの代表
点が示す位置がステップ3で検出された顔のどの部位に
相当するかを検出する。(Step 12) When it is determined in step 11 that the inside of the face is instructed and contact is made, it is detected which part of the face detected by step 3 the position indicated by the representative point of the palm corresponds to. To do.
【0041】(ステップ13)検出されたてのひら形状
が指示形状で身体に接触して顔の内部にある時、開始動
作位置コードとして身体部位を示す空間領域コードと顔
の部位を示すコードの2種類を登録する。(Step 13) When the newly detected palm shape is in the indicated shape and is in contact with the body and is inside the face, there are two kinds of codes, a spatial region code indicating the body part and a code indicating the face part, as the start motion position code. To register.
【0042】(ステップ14)ステップ14以外のての
ひら形状の時には、てのひらの代表点を示す空間領域コ
ードを開始動作位置コードとして1種類登録する。(Step 14) When the palm shape is other than that in step 14, one type of spatial area code indicating the representative point of the palm is registered as the start operation position code.
【0043】(ステップ15)本実施例をおこなうこと
で被験者自身の身体特徴による領域の空間分割が可能と
なり、動作開始位置が被験者との相対位置で表現するこ
とが可能となり、また身体の1部を意識的に指している
時その時の指示形状を判定することで正しい開始動作位
置を特定することが出来る。(Step 15) By carrying out this embodiment, it is possible to spatially divide the region according to the body characteristics of the subject, and the movement start position can be expressed by the relative position with respect to the subject. When consciously pointing to, the correct starting motion position can be specified by determining the pointing shape at that time.
【0044】(実施例2)実施例1に述べているステッ
プ3の代わりに、抽出された身体領域の中の顔領域の色
情報をもとに目、口の領域を検出し、その重心位置を求
める。重心位置よりある閾値をもとに目領域、口領域を
決定する。(Second Embodiment) Instead of step 3 described in the first embodiment, the eye and mouth regions are detected based on the color information of the face region in the extracted body region, and the barycentric position thereof is detected. Ask for. The eye region and the mouth region are determined based on a certain threshold from the position of the center of gravity.
【0045】一例として検出された図16にしめすよう
に右目の重心位置を(xre_cen,yre_ce
n)とすると右目領域の開始点、高さ、幅をそれぞれ
o’’(xf_reye,yf_reye),xlen
_reye,ylen_reyrとするとそれぞれ(数
10)で表される。As shown in FIG. 16, which is detected as an example, the center of gravity of the right eye is (xre_cen, yre_ce).
n), the start point, height, and width of the right-eye area are o ″ (xf_reye, yf_reye), xlen, respectively.
If _reye and ylen_reyr, then they are respectively expressed by (Equation 10).
【0046】[0046]
【数10】 [Equation 10]
【0047】同様に左目に関しても計算をおこなう。口
領域の重心位置を(xm_cen,ym_cen)とす
ると口領域の開始点、高さ、幅をそれぞれp’’(xf
_m,yf_m),m_xlen,m_ylenとする
とそれぞれ(数11)で表される。Similarly, the left eye is also calculated. If the position of the center of gravity of the mouth area is (xm_cen, ym_cen), the start point, height, and width of the mouth area are p ″ (xf
_M, yf_m), m_xlen, and m_ylen are represented by (Equation 11).
【0048】[0048]
【数11】 [Equation 11]
【0049】上記の目領域、口領域の位置関係より耳、
額、顎、鼻、頬領域を計算する。耳、額、顎、鼻の領域
開始位置をそれぞれq’’(xf_rear,yf_r
ear),r’’(xf_head,yf_hea
d),t’’(xf_chin,yf_chin),
s’’(xf_nose,yf_nose)とし、幅を
それぞれxlen_ear,xlen_head,xl
en_chin,xlen_noseとし、高さをyl
en_ear,ylen_head,ylen_chi
n,ylen_noseとすると、右耳領域は(数1
2)で額領域は(数13)で、顎領域は(数14)で、
鼻領域は(数15)で表される。From the above-mentioned positional relationship between the eye area and the mouth area,
Calculate forehead, chin, nose and cheek areas. The ear, forehead, chin, and nose area start positions are q ″ (xf_rear, yf_r
ear), r '' (xf_head, yf_hea
d), t '' (xf_chin, yf_chin),
s ″ (xf_nose, yf_nose) and the widths are xlen_ear, xlen_head, xl, respectively.
en_chin, xlen_nose, and height is yl
en_ear, ylen_head, ylen_chi
If n, ylen_nose, the right ear region is (Equation 1
In 2), the forehead area is (Equation 13), the jaw area is (Equation 14),
The nose area is represented by (Equation 15).
【0050】[0050]
【数12】 [Equation 12]
【0051】[0051]
【数13】 [Equation 13]
【0052】[0052]
【数14】 [Equation 14]
【0053】[0053]
【数15】 [Equation 15]
【0054】顔領域の中でそれ以外の領域を頬領域とす
る。本実施例により、目、耳、頬、顎、額、鼻領域の少
なくとも1つの顔領域の分割をおこなう。実施例1のス
テップ3以外は実施例1と同じとする。A region other than the face region is defined as a cheek region. According to this embodiment, at least one face area of the eyes, ears, cheeks, chin, forehead, and nose area is divided. The procedure is the same as that of the first embodiment except step 3 of the first embodiment.
【0055】本実施例をおこなうことで顔の中の目、口
を抽出し、被験者に応じた顔の領域分割が可能となる。By carrying out the present embodiment, it is possible to extract the eyes and mouth in the face and divide the face into areas according to the subject.
【0056】(実施例3)実施例1に示した上記ステッ
プ5の開始タイミングの代わりに、時系列に抽出された
てのひらの画像の隣合うフレーム間で(数16)で表さ
れた式で、画像間の相関を取る。相関値がある任意の値
より低い時、ステップ5で重心位置の移動距離が任意の
閾値以内であっても動作の開始タイミングとし、位置が
同じ場所にあっても手形状の変化で動作開始のタイミン
グを取ることができる。ステップ5以外は実施例1と同
じとする。(Embodiment 3) Instead of the start timing of the above step 5 shown in Embodiment 1, the expression expressed by (Equation 16) is used between adjacent frames of the freshly extracted image of the palm, Correlate images. When the correlation value is lower than an arbitrary value, the operation start timing is set in step 5 even if the moving distance of the center of gravity position is within an arbitrary threshold value, and even if the position is the same, the operation is started by the change of the hand shape. You can get the timing. The steps other than step 5 are the same as those in the first embodiment.
【0057】[0057]
【数16】 [Equation 16]
【0058】画像間の輝度値の相関を取ることにより、
てのひらの重心が動いてなくても形状の変化があった時
にも動作の開始タイミングにすることができる。By taking the correlation of the brightness value between the images,
Even when the center of gravity of the palm is not moved, the operation start timing can be set even when the shape changes.
【0059】(実施例4)実施例のステップ7の変わり
に請求項6に記したアルゴリズムを図13に示した。
(表1)の最大長を示す座標同士を直線で結ぶ。(Embodiment 4) An algorithm described in claim 6 is shown in FIG. 13 instead of step 7 of the embodiment.
The coordinates indicating the maximum length in (Table 1) are connected by a straight line.
【0060】(ステップa)最大長を示す座標の内1点
を中心にθ度アフィン変換をおこなう。アフィン変換が
おこなわれた後の図を図14に示す。(Step a) θ degree affine transformation is performed centering on one of the coordinates showing the maximum length. FIG. 14 shows a diagram after the affine transformation is performed.
【0061】(ステップb)アフィン変換後の画像にY
軸に平行な線を引き、画像のてのひらを示す部分の長さ
を計測する。この時、Y軸に平行な線が反転した回数を
検出する。(Step b) Y is added to the image after affine transformation.
Draw a line parallel to the axis and measure the length of the part showing the palm of the image. At this time, the number of times the line parallel to the Y axis is inverted is detected.
【0062】(ステップc)反転回数が3回以上のライ
ンが存在する時、上記のてのひら形状は非指示形状とし
て判定される。反転回数が2回の時、曲率を求めるモジ
ュールへ進む。(Step c) When there is a line whose number of inversions is 3 or more, the above palm shape is determined as a non-designated shape. When the number of inversions is 2, the process proceeds to the module for obtaining the curvature.
【0063】(ステップd)アフィン変換後の図形のて
のひらの長さを計測した図形の曲率を計算し、閾値を越
えた点を多角形の頂点の1点とし、多角形近似をおこな
う。多角形近似された画像を図15に示す。(Step d) The curvature of the figure in which the length of the palm of the figure after the affine transformation is measured is calculated, and the point exceeding the threshold value is set as one of the vertices of the polygon, and the polygon is approximated. FIG. 15 shows a polygon-approximated image.
【0064】(ステップe)図15に示された画像の頂
点の中で順番にY座標がある閾値以内に存在する頂点の
グループ化をおこなう。図15の画像では頂点1,2,
3,4がグループ1に、頂点5がグループ2に頂点6,
7がグループ3に頂点8,9がグループ4に登録され
る。(Step e) Among the vertices of the image shown in FIG. 15, the vertices whose Y coordinates are present within a certain threshold value are grouped in order. In the image of FIG. 15, vertices 1, 2,
3, 4 are in group 1, vertex 5 is in group 2, vertex 6,
7 is registered in group 3, and vertices 8 and 9 are registered in group 4.
【0065】(ステップf)上記で求められたグループ
のX軸に平行な長さをそれぞれxlen1,xlen
2,xlen3,xlen4とし、その時のY座標の平
均をhigh1,high2,high3,high4
とし、グループの位置関係を(表2)に格納する。(Step f) The lengths of the groups obtained above parallel to the X-axis are xlen1 and xlen, respectively.
2, xlen3, xlen4, and the average of the Y coordinates at that time is high1, high2, high3, high4.
Then, the positional relationship of the groups is stored in (Table 2).
【0066】(ステップg)(Step g)
【0067】[0067]
【表2】 [Table 2]
【0068】表2の値を取り出し、識別関数(数17)
によって指示形状かどうか判定させる。図15に示され
るアフィン変換後の図形は指示形状と判定される。The values in Table 2 are taken out and the discrimination function (Equation 17) is used.
Check to see if it is the indicated shape. The figure after the affine transformation shown in FIG. 15 is determined to be the designated shape.
【0069】[0069]
【数17】 [Equation 17]
【0070】(ステップh)実施例1のステップ7以外
については実施例1と同じ方法を取る。上記の指示形状
の判定を用いることにより、身体の部位を特定している
時に正しい動作開始位置を検出することができる。(Step h) The same method as in Example 1 is adopted except for Step 7 in Example 1. By using the determination of the pointing shape described above, the correct operation start position can be detected when the body part is specified.
【0071】(実施例5)実施例1のステップ7の代わ
りに指示形状を判定するアルゴリズムを示した図を図1
7に記す。ステップ4で抽出されたてのひら画像を任意
の回数、縮退処理をかけた図を図18に示す。次に縮退
をかけた回数分、拡輻処理をかける。拡輻処理をかけた
図を図19に示す。もとのてのひら画像より拡幅画像の
差分を取る。残った画像を図20に示す。差分画像の特
徴を取り、ラベリングの個数が1個であり、長さが任意
の閾値以上であれば、実施例1に示されたステップ4で
抽出されたてのひら画像を指示形状と判定をおこなう。
実施例1のステップ7以外は実施例1と同じ方法を取
る。(Embodiment 5) FIG. 1 is a diagram showing an algorithm for determining a designated shape instead of step 7 of Embodiment 1.
Note in 7. FIG. 18 shows a diagram in which the fresh palm image extracted in step 4 has been subjected to the degeneration process any number of times. Next, the spread processing is applied for the number of times of degeneration. FIG. 19 shows a diagram subjected to the spread processing. The difference of the widened image is taken from the original horizontal image. The remaining image is shown in FIG. If the feature of the difference image is taken, the number of labelings is one, and the length is not less than an arbitrary threshold value, the fresh palm image extracted in step 4 shown in the first embodiment is determined as the designated shape.
The same method as in Example 1 is used except for Step 7 in Example 1.
【0072】上記の指示形状の判定方法を用いることに
より、より簡単に指示形状を検出することが可能にな
る。By using the above-described pointing shape determining method, it becomes possible to detect the pointing shape more easily.
【0073】[0073]
【発明の効果】被験者の身体に沿って空間領域の分割を
おこなっていることで、被験者が違っても同一開始位置
領域で登録することが可能となり、手動作の開始タイミ
ング時に被験者の身体部位を指し示す形状を検出するこ
とにより、被験者自身が意図して始めた開始動作位置を
特定することが可能となる。[Effects of the Invention] Since the spatial region is divided along the body of the subject, it is possible to register at the same start position region even when the subject is different, and the body part of the subject can be registered at the start timing of the manual operation. By detecting the pointing shape, it is possible to specify the starting motion position that the subject himself started.
【0074】顔領域のテンプレート画像を1つ用意し、
実際に抽出された画像によって正規化をすることが出
来、登録しておく顔の部位の領域を最小限に押えること
が出来る。Prepare one template image of the face area,
It is possible to perform normalization by the actually extracted image, and it is possible to minimize the area of the face part to be registered.
【0075】被験者自身の抽出された顔領域の色情報に
より、顔の部位を計算で特定することが出来、テンプレ
ート画像を登録する必要がなくなり、被験者に応じた顔
領域の分割が可能となる。With the color information of the extracted face area of the subject himself / herself, the face part can be specified by calculation, it is not necessary to register the template image, and the face area can be divided according to the subject.
【0076】てのひら領域のフレーム間での画像の相関
をとることにより、てのひらが動いていなくともてのひ
らの形状に変化があったところを動作の開始タイミング
とすることが出来る。By correlating the images between the frames of the palm area, the position where the palm shape changes even when the palm is not moving can be used as the operation start timing.
【0077】てのひらの代表点を身体の一部を指し示し
ている形状を判定することにより、開始動作位置の正確
な位置の特定が可能となる。By determining the shape in which the representative point of the palm is pointing to a part of the body, it is possible to accurately specify the starting operation position.
【図1】第1の実施例のアルゴリズムを示すフローチャ
ートFIG. 1 is a flowchart showing an algorithm of a first embodiment.
【図2】第1の実施例の人物を抜き出した背景差分画像
を示す図FIG. 2 is a diagram illustrating a background difference image in which a person is extracted according to the first embodiment.
【図3】第1の実施例に示される身体外形線を示す図FIG. 3 is a diagram showing body contour lines shown in the first embodiment.
【図4】第1の実施例に示される身体検出線を示す図FIG. 4 is a diagram showing a body detection line shown in the first embodiment.
【図5】第1の実施例の領域分割図と交点を示す図FIG. 5 is a diagram showing a region division diagram and intersections according to the first embodiment.
【図6】第1の実施例の空間領域分割をおこなったこと
を示す図FIG. 6 is a diagram showing that the spatial region division according to the first embodiment is performed.
【図7】第1の実施例の顔各部位テンプレート画像を示
す図FIG. 7 is a diagram showing a template image of each face part according to the first embodiment.
【図8】第1の実施例の肌色情報を抜き出した状態を示
す図FIG. 8 is a diagram showing a state in which skin color information of the first embodiment is extracted.
【図9】第1の実施例の時系列にてのひらが抜き出され
た状態を示す図FIG. 9 is a diagram showing a state in which a palm is extracted in a time series of the first embodiment.
【図10】第1の実施例のてのひらの特徴検出されたこ
とを示す図FIG. 10 is a diagram showing that the features of the palm of the first embodiment have been detected.
【図11】第1の実施例の多角形近似されたてのひら+
てのひら凸閉包図形を示す図FIG. 11 is a polygon-approximated palm of the first embodiment +
Figure showing the palm convex shape
【図12】第1の実施例の残余図形を示す図FIG. 12 is a diagram showing a residual graphic according to the first embodiment.
【図13】第4の実施例の指示形状判定アルゴリズムの
フローチャートFIG. 13 is a flowchart of the pointing shape determination algorithm of the fourth embodiment.
【図14】第4の実施例のアフィン変換後のてのひら図
形を示す図FIG. 14 is a diagram showing a palm figure after affine transformation according to a fourth embodiment.
【図15】第4の実施例の多角形近似されたアフィン変
換後の図形を示す図FIG. 15 is a diagram showing a polygon-approximated figure after the affine transformation of the fourth embodiment.
【図16】第2の実施例の顔部位抽出画像を示す図FIG. 16 is a diagram showing a face part extraction image of the second embodiment.
【図17】第5の実施例のアルゴリズムのフローチャー
トFIG. 17 is a flowchart of the algorithm of the fifth embodiment.
【図18】第5の実施例のてのひらを縮退させたのを示
す図FIG. 18 is a diagram showing a retracted palm of the fifth embodiment.
【図19】第5の実施例の縮退画像を拡輻処理させたこ
とを示す図FIG. 19 is a diagram showing that the degenerated image of the fifth embodiment has been subjected to spread processing.
【図20】第5の実施例のてのひら画像より拡輻画像の
差分を取った画像を示す図FIG. 20 is a diagram showing an image obtained by subtracting the spread image from the palm image of the fifth embodiment.
Xw,Yw,Zw 画像交点の空間位置座標
(Xr0,Yr0) 右カメラの交点番号0の座標
(Xl0,Yl0) 左カメラの交点番号0の座標
ERL(ElbowRightLine) 右肘を示す
線
SHRL(ShoulderRightLine) 右
肩を示す線
FRL(FaceRightLine) 顔の右側を示
す線
MCL(MiddleCenterLine) 体の中
心を示す線
FLL(FaceLeftLine) 顔の左側を示す
線
SHLL(ShoulderLeftLine) 肩の
左側を示す線
ELL(ElbowLeftLine) 左肘を示す線
SUL(ShoulderUpperLine) 肩の
上部を示す線
shp(ShoulderPoint) 肩の位置を示
すポイント
frlp(FaceRightLinePoint)
FRLを垂直に伸ばした外形線と交わった線
tempp(TemporaryPoint) 身体が
Y軸に平行な線と最初に接した線
xface テンプレート画像での顔領域のX方向の長
さ
yface テンプレート画像での顔領域のY方向の長
さ
(xt_m,yt_m) テンプレート画像での口領域
の開始位置
xt_mlen テンプレート画像での口領域のX方向
の長さ
yt_mlen テンプレート画像での口領域のY方向
の長さ
(xf,yf) 抽出画像での顔領域の始点
xlen 抽出画像での顔領域のxlen方向の長さ
ylen 抽出画像での顔領域のylen方向の長さ
(xf_mouth,yf_mouth) 抽出画像の
口領域の始点を示す座標
xlen_mouth 抽出画像の口領域のX方向の長
さ
ylen_mouth 抽出画像の口領域のY方向の長
さ
o’o’’ 右目領域の先頭アドレス
p,p’,p’’ 口領域の先頭アドレス
q’,q’’ 右耳領域の先頭アドレス
r,r’,r’’ 額領域の先頭アドレス
s’,s’’ 鼻領域の先頭アドレス
t’,t’’ 顎領域の先頭アドレス
Lab_1,Lab_2 右,左てのひら領域
Lab_3 顔を示す領域
(Xc1_n_r,Yc1_n_r) 右カメラのnフ
レームの右てのひらを示す重心位置
(Xc1_n_l,Yc1_n_l) 左カメラのnフ
レームの右てのひらを示す重心位置
(Xc1_n+1_r,Yc1_n+1_r) 右カメ
ラのn+1フレームの右てのひらを示す重心位置
(Xc1_n+1_l,Yc1_n+1_l) 左カメ
ラのn+1フレームの左てのひらを示す重心位置
(Xm11_r(l),Ym11_r(l)) 右
(左)カメラのてのひらの最大長を示す点の座標
(Xm12_r(l),Ym12_r(l)) 右
(左)カメラのてのひらの最大長を示す点の座標
(Xw_p,Yw_p,Zw_p) てのひら先端の空
間座標Xw, Yw, Zw Spatial position coordinates (Xr0, Yr0) of the intersection point of the right camera (Xl0, Yl0) Coordinates of the intersection point number 0 of the left camera ERL (ElbowRightLine) Line showing the right elbow SHRL (ShoulderRightLine) Line showing right shoulder FRL (FaceRightLine) line showing right side of face MCL (MiddleCenterLine) line showing center of body FLL (FaceLeftLine) line showing left side of face SHLL (ShoulderLeftLine) line showing left side of shoulder ELL left (ELL) Line indicating the elbow SUL (ShoulderUpperLine) Line indicating the upper part of the shoulder shp (ShoulderPoint) Point indicating the position of the shoulder frlp (FaceRightLineP) int)
A line that intersects the contour line that extends FRL vertically. Tempp (TemporaryPoint) The line that the body first touches the line parallel to the Y axis. Xface The length of the face area in the template image in the X direction. The face area in the yface template image. In the Y direction (xt_m, yt_m) Start position of the mouth area in the template image xt_mlen Length of the mouth area in the X direction in the template image yt_mlen Length of the mouth area in the Y direction in the template image (xf, yf ) Start point xlen of the face area in the extracted image Length of the face area in the xlen direction in the extracted image ylen Length of the face area in the ylen direction in the extracted image (xf_mouth, yf_mouth) Coordinates indicating the start point of the mouth area of the extracted image xlen_mout Extraction of the length of the mouth area of the extracted image in the X direction ylen_mouth Length of the mouth area of the image in the Y direction o'o '' right eye area start address p, p ', p''mouth area start address q', q '' right ear area start address r, r ', r '' forehead area start address s ', s''nose area start address t', t '' jaw area start address Lab_1, Lab_2 right, left palm area Lab_3 face area (Xc1_n_r, Yc1_n_r) right camera Center position (Xc1_n_l, Yc1_n_l) indicating the right palm of the nth frame of the left camera Center of gravity position (Xc1_n + 1_r, Yc1_n + 1_r) indicating the right palm of the nth frame of the left camera (Xc1_n + 1_l_l_l, left) Center of gravity position (Xm11_r (l), Ym11_r (l)) indicating the left palm of the camera n + 1 frame Right (left Maximum point indicating the length coordinates of the palm of the camera (Xm12_r (l), Ym12_r (l)) Right (Left) camera maximum point indicating the length coordinates of the palm (Xw_p, Yw_p, Zw_p) palm tip spatial coordinates of
フロントページの続き (56)参考文献 特開 平2−144675(JP,A) 特開 平7−282235(JP,A) 特開 平8−320920(JP,A) 松尾英明外3名,非接触による手話動 作の認識アルゴリズム,Human I nterface News and Report,社団法人計測自動制御学 会,1995年 1月23日,Vol.10,N o.1,pp.41−46 (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 - 7/60 G06T 1/00 G09B 21/00 JSTPlusファイル(JOIS)Continuation of the front page (56) References JP-A-2-144675 (JP, A) JP-A-7-282235 (JP, A) JP-A-8-320920 (JP, A) Matsuo Hideaki Outside 3 people, non-contact Sign Language Motion Recognition Algorithm, Human Interface News and Report, The Society of Instrument and Control Engineers, January 23, 1995, Vol. 10, No. 1, pp. 41-46 (58) Fields investigated (Int.Cl. 7 , DB name) G06T 7 /00-7/60 G06T 1/00 G09B 21/00 JST Plus file (JOIS)
Claims (7)
者の画像と前記被験者が写っていない同じ場所を写した
背景との画像を差分することにより、前記被験者の身体
を抜きだすステップと、 前記抜き出された記被験者の身体部位に沿って空間領域
を分割するステップと、 前記空間領域の顔を示す領域を特定領域に分割するステ
ップと、 少なくとも右、左いずれかのてのひらの画像を抽出する
ステップと、 前記てのひらの画像の重心を検出し、時間的に後ろに存
在するフレーム間での前記重心位置がずれた時、動作開
始タイミングとして検出するステップと、 前記てのひら画像の前記重心位置、最大長を示す2点の
座標を先端候補位置として格納するステップと、 前記てのひら画像の形状が身体の一部を特定している指
示形状かを判定するステップと、 前記指示形状でなければ重心位置をてのひらの代表点と
するステップと、 前記てのひら画像の形状が指示形状の時、前記2点の先
端位置候補の内手領域が少ない点を前記てのひらの先端
位置として、前記てのひらの代表点とするステップと、 前記てのひらの代表点が前記被験者の顔を示す領域かを
判定し、前記顔の領域を示さない時、前記先端位置が前
記分割された空間領域のどこにあるかを特定し、動作開
始位置コードを1種類登録するステップと、 前記先端位置の代表点が前記被験者の顔の領域を示す領
域を示す時、前記先端位置が前記顔領域の目、耳、唇、
頬、額、顎、鼻のどこにあるかを特定し、前記分割され
た空間の身体部位は顔として特定し、動作開始位置コー
ドを2種類登録するステップを有する手話動作の動作開
始位置検出方法。1. In the motion start position detection of a sign language motion, by subtracting at least the image of a subject whose upper body is imaged by a compound-eye camera and an image of a background showing the same place where the subject is not photographed, A step of extracting the body of the subject, a step of dividing the spatial region along the extracted body part of the subject, a step of dividing the region showing the face of the spatial region into a specific region, at least the right, A step of extracting an image of one of the left palms, a center of gravity of the image of the palm of the left is detected, and a step of detecting as a motion start timing when the barycentric position is displaced between frames that are temporally behind, and Storing the barycentric position of the palm image and the coordinates of two points indicating the maximum length as the tip candidate position; A step of determining whether the shape is a pointing shape that specifies a part of the body, a step of setting the center of gravity as a representative point of the palm if not the pointing shape, and when the shape of the palm image is the pointing shape, the The step of setting the point having a small inner hand area of two tip position candidates as the tip position of the palm, and setting the representative point of the palm as a representative point of the palm is an area showing the face of the subject, When the face area is not shown, a step of specifying where the tip position is in the divided space area and registering one kind of motion start position code; and a representative point of the tip position is the subject's face. When indicating a region indicating a region, the tip position is the eyes, ears, lips of the face region,
A method for detecting a motion start position of a sign language motion, comprising the steps of specifying where on the cheek, forehead, chin, and nose, specifying the body part in the divided space as a face, and registering two types of motion start position codes.
するステップは、 目、耳、唇、頬、額、顎、鼻の少なくとも1つの領域を
モデル化したテンプレート顔領域の空間を準備し、顔の
空間領域の大きさに合わせて前記テンプレート画像を拡
大、縮小することにより、前記顔の空間領域を分割する
請求項1記載の動作開始位置検出方法。2. A step of dividing a region showing a face in a spatial region into specific regions includes preparing a space of a template face region modeling at least one region of eyes, ears, lips, cheeks, foreheads, chins and noses. The operation start position detecting method according to claim 1, wherein the space area of the face is divided by enlarging and reducing the template image according to the size of the space area of the face.
するステップは、 前記空間領域の顔を示す領域の色情報により、目、唇を
抜きだし、前記目、唇の位置関係より、耳、顎、頬、
鼻、額の少なくとも1つの領域を示し、前記顔の空間領
域を分割する請求項1記載の動作開始位置検出方法。3. The step of dividing the area showing the face of the spatial area into specific areas extracts the eyes and lips based on the color information of the area showing the face of the spatial area, and based on the positional relationship between the eyes and the lips, Ears, chin, cheeks,
The operation start position detecting method according to claim 1, wherein at least one area of a nose and a forehead is shown, and the space area of the face is divided.
は、 てのひら画像の抽出領域の連続したフレーム間で自己相
関を取り、任意の閾値を越えた時に動作開始タイミング
とする請求項1記載の動作開始位置検出方法。4. The operation start position according to claim 1, wherein the step of detecting the operation start timing takes an autocorrelation between consecutive frames of all the palm image extraction areas, and sets the operation start timing when an arbitrary threshold value is exceeded. Detection method.
定するステップをてのひら画像の外郭線の曲率を取り、
ある閾値を越えた点を多角形の一点として前記てのひら
を多角形近似し、前記多角形の角を凸部、凹部に分類
し、凹部の角が1つもしくは2つのみ存在する時、前記
指示形状として判定する請求項1記載の動作開始位置検
出方法。5. The curvature of the outer contour line of the palm image obtained by the step of determining whether the shape is a pointing shape that specifies a part of the body,
The palm is approximated to a polygon with a point exceeding a certain threshold as one point of the polygon, and the corners of the polygon are classified into a convex portion and a concave portion, and when the concave portion has only one or two corners, the instruction The operation start position detecting method according to claim 1, wherein the method is determined as a shape.
定するステップは、 てのひら画像の最大長を示す2点の座標を通る直線とX
軸との角度を計算し、前記最大長を示す2点の内1点を
中心として前記てのひら画像を前記角度だけアフィン変
換をおこない、前記アフィン変換後のてのひら画像のY
軸に対する射影をおこない、前記Y軸に対する射影画像
の曲率計算をおこない、ある閾値を越えた点を多角形の
頂点として検出し、多角形近似をおこない、Y軸の値が
任意の閾値内のグループになる時、前記グループ間の関
係より、前記てのひら画像の形状を前記指示形状として
判定する請求項1記載の動作開始検出方法。6. The step of determining whether it is a pointing shape that specifies a part of the body is a straight line passing through the coordinates of two points indicating the maximum length of the palm image and X.
The angle with respect to the axis is calculated, and the palm image is affine-transformed by the angle around one of the two points indicating the maximum length, and Y of the palm image after the affine transformation is calculated.
The projection of the axis is performed, the curvature of the projected image is calculated for the Y axis, the points exceeding a certain threshold are detected as the vertices of the polygon, the polygon approximation is performed, and the value of the Y axis is a group within an arbitrary threshold. 2. The operation start detection method according to claim 1, wherein the shape of the palm image is determined as the designated shape based on the relationship between the groups.
定するステップは、 てのひらの画像を任意の回数、縮退処理をかけ、てのひ
ら縮退画像を作成し、前記てのひら縮退画像を前記任意
回数分拡輻処理をかけた復元画像を前記てのひら画像か
ら差分を取り、てのひら差分画像を作成し、前記てのひ
ら差分画像のラベリング処理をおこない、ラベリング数
が1つで、長さが任意の閾値以上の時、前記てのひら画
像の形状を前記指示形状として判定する請求項1記載の
動作開始検出方法。7. The step of determining whether the shape is a pointing shape that specifies a part of the body is subjected to degeneration processing of the palm image for any number of times to create a degenerate image of the palm image, and the degenerated image of the palm image is the arbitrary image. The restored image that has been subjected to the diffusion process for the number of times is subtracted from the palm image to create a palm difference image, and the palm difference image is labeled. The number of labels is one and the length is equal to or greater than an arbitrary threshold value. The operation start detecting method according to claim 1, wherein at the time of, the shape of the palm image is determined as the designated shape.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19015495A JP3440641B2 (en) | 1995-07-26 | 1995-07-26 | Operation start position detection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19015495A JP3440641B2 (en) | 1995-07-26 | 1995-07-26 | Operation start position detection method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0944668A JPH0944668A (en) | 1997-02-14 |
JP3440641B2 true JP3440641B2 (en) | 2003-08-25 |
Family
ID=16253326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19015495A Expired - Fee Related JP3440641B2 (en) | 1995-07-26 | 1995-07-26 | Operation start position detection method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3440641B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69936620T2 (en) | 1998-09-28 | 2008-05-21 | Matsushita Electric Industrial Co., Ltd., Kadoma | Method and device for segmenting hand gestures |
CN101055620B (en) * | 2006-04-12 | 2011-04-06 | 富士通株式会社 | Shape comparison device and method |
JP4929109B2 (en) * | 2007-09-25 | 2012-05-09 | 株式会社東芝 | Gesture recognition apparatus and method |
JP4719826B2 (en) | 2009-06-08 | 2011-07-06 | パナソニック株式会社 | Work recognition device |
JP5762251B2 (en) * | 2011-11-07 | 2015-08-12 | 株式会社パスコ | Building contour extracting device, building contour extracting method, and building contour extracting program |
JP6349800B2 (en) * | 2014-03-12 | 2018-07-04 | オムロン株式会社 | Gesture recognition device and method for controlling gesture recognition device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779448B2 (en) * | 1988-11-25 | 1998-07-23 | 株式会社エイ・ティ・アール通信システム研究所 | Sign language converter |
JPH07282235A (en) * | 1994-04-15 | 1995-10-27 | Matsushita Electric Ind Co Ltd | Operation recognition device |
JPH08320920A (en) * | 1995-05-24 | 1996-12-03 | Matsushita Electric Ind Co Ltd | Device and method for hand operation recognition |
-
1995
- 1995-07-26 JP JP19015495A patent/JP3440641B2/en not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
松尾英明外3名,非接触による手話動作の認識アルゴリズム,Human Interface News and Report,社団法人計測自動制御学会,1995年 1月23日,Vol.10,No.1,pp.41−46 |
Also Published As
Publication number | Publication date |
---|---|
JPH0944668A (en) | 1997-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahmed et al. | Vision based hand gesture recognition using dynamic time warping for Indian sign language | |
Zhou et al. | A novel finger and hand pose estimation technique for real-time hand gesture recognition | |
Oka et al. | Real-time tracking of multiple fingertips and gesture recognition for augmented desk interface systems | |
US6215890B1 (en) | Hand gesture recognizing device | |
CN101561710B (en) | Man-machine interaction method based on estimation of human face posture | |
JP4653606B2 (en) | Image recognition apparatus, method and program | |
JP7015152B2 (en) | Processing equipment, methods and programs related to key point data | |
CN109145802B (en) | Kinect-based multi-person gesture man-machine interaction method and device | |
CN114072839A (en) | Hierarchical motion representation and extraction in monocular still camera video | |
Pattanaworapan et al. | Signer-independence finger alphabet recognition using discrete wavelet transform and area level run lengths | |
JP3440641B2 (en) | Operation start position detection method | |
JPH08287216A (en) | In-face position recognizing method | |
CN112185515A (en) | Patient auxiliary system based on action recognition | |
Marzec et al. | Methods of face localization in thermograms | |
JPH07282235A (en) | Operation recognition device | |
JP4203279B2 (en) | Attention determination device | |
JP2001005973A (en) | Method and device for estimating three-dimensional posture of person by color image | |
JP3144400B2 (en) | Gesture recognition device and method | |
JPH11174948A (en) | Manual operation confirming device | |
JP3440644B2 (en) | Hand motion recognition device | |
JP4063556B2 (en) | Facial image recognition apparatus and method | |
JPH09305743A (en) | Human face motion detecting system | |
Vančo et al. | Gesture identification for system navigation in 3D scene | |
CN115223240A (en) | Motion real-time counting method and system based on dynamic time warping algorithm | |
Grzejszczak et al. | Tracking of dynamic gesture fingertips position in video sequence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080620 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090620 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100620 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |