JP4102318B2 - 道具動作認識装置および道具動作認識方法 - Google Patents
道具動作認識装置および道具動作認識方法 Download PDFInfo
- Publication number
- JP4102318B2 JP4102318B2 JP2004058301A JP2004058301A JP4102318B2 JP 4102318 B2 JP4102318 B2 JP 4102318B2 JP 2004058301 A JP2004058301 A JP 2004058301A JP 2004058301 A JP2004058301 A JP 2004058301A JP 4102318 B2 JP4102318 B2 JP 4102318B2
- Authority
- JP
- Japan
- Prior art keywords
- tool
- function
- learning
- motion
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
TE.Starner,J.Weaver,and A.Pentland,"Rea1-time american signlanguage recognition using desk and wearable computer based video",IEEE Trans. PAMI,vo1.20,no.12,pp.1371-1375,1998. S.S.Fels and G.E.Hinton,"Glove-talk:a neural network interface which maps gestures to parallel format speech synthesizer controls",IEEE Trans.Neural Network,vol.9,no.1,pp.205-212,1997. J.M.Siskind and Q.Morris,"A maximum-likelihood approach to visual event classification",Proc.Fourth European Conf.Computer Vision,pp.347-360,1996. A.F.Bobick and A.D.Wilson,"A state-based approach to the representation and recognition of gesture",IEEE Trans. PAMI,vol.19,no.12,pp.1325-1337,1997. A.D.Wilson and A.F Bobick,"Parametric Hidden Markov Models for gesture recognition",IEEE Trans. PAMI,vol.21,no.9,pp.884-900,1999. H.K.Lee and J.H.Kim,"An HMM-based threshold model approach for gesture recognition",IEEE Trans. PAMI, vol.21,no.10,pp,961-973,1999. M.H.Yang,N.Ahuja,and M.Tabb,"Extraction of 2D motion trajectories and its application to hand gesture recognition",IEEE Trans. PAMI,vol.24,no.8,pp.1061-1074,2002. A.F.Bobick and J.W.Davis,"The Recognition of Human Movement Using Temporal Templates",IEEE Trans. PAMI,vol.23,no.3,pp.257-267,2001. J.Yamato,J.Ohya,and K.Ishii,"Recognizing human action in time-sequential images using Hidden Markov Mode1",Proc.Computer Vision and Pattern Recognition,pp.379-385,1992. Z.Duric,J.A.Fayman,and E.Rivlin,"Function from motion",IEEE PAMI,vol.18,no.6,pp.579-591,1996. B.D.Lucas and T.Kanade,"An iterative image registration technique with an application in stereo vision",IJCAI-81,pp.674-679. A.Bab-Hadiashar and D.Suter,"Robust optic flow computation,International Journal of Computer Vision,29,1,pp.59-77,1998. E.P.Ong and M.Spann,"Robust optical flow computation based on least-median-of-squares regression",International Journal of Computer Vision,31,1,pp.51-82,1999. N.Cornelius and T.Kanade,"Adapting optical flow to measure object motion in reflectance and X-ray image sequences",ACM SIGGRAPH/SIGART Interdisciplinary Workshop on Motion; Representation and Perception,Toronto,Canada,1983.
(1)道具を手に持たないジェスチャー研究が大半であり,データグローブの使用,指などにカラーマーキングする不自然さがある。
(2)ドライバーを手先で細かく操作するような場合の認識に関しては十分な研究がなされていない。即ち,手や腕による道具へのオクルージョンや不連続性問題での学習・認識の検討が不十分である。
(3)画像パターンを用いたHMMにおいては,入力シンボル数と出力シンボル数と認識率については十分にその性能評価がなされていない。
(4)画像パターンからの出力シンボル変換方法がほとんど研究されていない。
(5)動画からの動き推定では,ノイズや照明変動に耐性のあるオプティカルフロー法が適用されていない。
I(X+U,n+1)=I(X,n)+b(X,n) (1)
と記述される。位置ベクトルXの成分を,X=(x,y),速度ベクトルUの成分を,U=(u,v)とする。
hx =1.0,hy =1.0,
で分割して計算する。ここで,i,jを整数として,0≦i≦M,0≦j≦Nとする。位置ベクトルは,
Xi,j n =(ihx ,jhy )n ,
速度ベクトルは,
Ui,j n =(ui,j ,vi,j )n ,
と離散表示される。各空間項や時間項などの1次微分項を求めるため,差分法により画素点上で離散化近似を次のように行う。画像強度,各係数bについても,時間n,位置(i,j)で各画素上で表されるものとする。
E=Σρ(err) (3)
と定義する。ここで非線形ロバスト関数をρとする。この式が最小値をもつための条件式として,3つの未知数についての1次微分がゼロとなればよい,即ち,
11 画像入力部
12 画像蓄積部
13 速度推定部
14 シンボル時系列生成部
15 学習部
16 認識部
17 出力部
100 動作DB
141 シンボル変換テーブル
Claims (4)
- 時系列画像の動作シーンから,人が各種道具を使用しているときの動作を認識する装置であって,
時系列画像を入力する画像入力手段と,
入力された時系列画像を蓄積する画像蓄積手段と,
前記時系列画像中の動作シーンの速度ベクトルを推定することを目的として,オプティカルフローの枠組みで,速度成分および輝度変動成分を未知数とするローレンツ関数またはバイ・ウエイト関数に基づく非線形なロバスト関数を目的関数として設定し,設定した非線形なロバスト関数の最小化により前記未知数を推定することで速度ベクトルを推定し,各フレームの平均速度ベクトルを求める速度推定手段と,
平均速度ベクトルの大きさおよび方向に応じてシンボルの並びが矩形状パターンまたは同心円状パターンである予め定められた変換対応図を用いて,前記推定された平均速度ベクトルをシンボルへ変換し,変換されたシンボルを用いて認識対象となる複数種類の道具の各道具操作に対するHMMモデルパラメータを計算して学習する学習手段と,
前記画像入力手段に新たに入力された時系列画像の未知の動作シーンについて,前記速度推定手段によって各フレームの平均速度ベクトルを推定し,前記学習手段による学習結果のHMMに基づいて,どの道具操作を行っているかを識別する認識手段と,
道具操作の識別結果を出力する出力手段とを備える
ことを特徴とする道具動作認識装置。 - 請求項1に記載の道具動作認識装置において,
前記速度推定手段は,
前記非線形なロバスト関数の最小化演算に,最急降下法,ニューラルネットまたはレーベンバーグ・マッカート法を用いる
ことを特徴とする道具動作認識装置。 - 請求項1に記載の道具動作認識装置において,
前記速度推定手段は,
前記非線形なロバスト関数を最小化する際に,前記ローレンツ関数またはバイ・ウエイト関数に含まれる分散値を段階的に大きい値から小さい値へ可変させる
ことを特徴とする道具動作認識装置。 - 道具動作認識装置が,時系列画像の動作シーンから,人が各種道具を使用しているときの動作を認識する方法であって,
時系列画像を入力する画像入力ステップと,
入力された時系列画像を蓄積する画像蓄積ステップと,
前記時系列画像中の動作シーンの速度ベクトルを推定することを目的として,オプティカルフローの枠組みで,速度成分および輝度変動成分を未知数とするローレンツ関数またはバイ・ウエイト関数に基づく非線形なロバスト関数を目的関数として設定し,設定した非線形なロバスト関数の最小化により前記未知数を推定することで速度ベクトルを推定し,各フレームの平均速度ベクトルを求める速度推定ステップと,
平均速度ベクトルの大きさおよび方向に応じてシンボルの並びが矩形状パターンまたは同心円状パターンである予め定められた変換対応図を用いて,前記推定された平均速度ベクトルをシンボルへ変換し,変換されたシンボルを用いて認識対象となる複数種類の道具の各道具操作に対するHMMモデルパラメータを計算して学習する学習ステップと,
新たに入力された時系列画像の未知の動作シーンについて,前記速度推定ステップによって各フレームの平均速度ベクトルを推定し,前記学習ステップによる学習結果のHMMに基づいて,どの道具操作を行っているかを識別する認識ステップと,
道具操作の種別結果を出力する出力ステップとを有する
ことを特徴とする道具動作認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004058301A JP4102318B2 (ja) | 2004-03-03 | 2004-03-03 | 道具動作認識装置および道具動作認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004058301A JP4102318B2 (ja) | 2004-03-03 | 2004-03-03 | 道具動作認識装置および道具動作認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005250708A JP2005250708A (ja) | 2005-09-15 |
JP4102318B2 true JP4102318B2 (ja) | 2008-06-18 |
Family
ID=35031143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004058301A Expired - Fee Related JP4102318B2 (ja) | 2004-03-03 | 2004-03-03 | 道具動作認識装置および道具動作認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4102318B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4568697B2 (ja) * | 2006-05-30 | 2010-10-27 | 日本電信電話株式会社 | 映像配信システム |
JP4527747B2 (ja) * | 2007-04-17 | 2010-08-18 | 日本電信電話株式会社 | 水面波挙動検出装置、水面波挙動検出方法、及び、水面波挙動検出プログラム |
JP4992618B2 (ja) * | 2007-09-05 | 2012-08-08 | カシオ計算機株式会社 | ジェスチャー認識装置及びジェスチャー認識方法 |
JP4548542B1 (ja) | 2009-06-30 | 2010-09-22 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7036610B2 (ja) * | 2017-03-16 | 2022-03-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 学習方法およびプログラム |
JP6783713B2 (ja) * | 2017-06-29 | 2020-11-11 | 株式会社 日立産業制御ソリューションズ | 人行動推定システム |
-
2004
- 2004-03-03 JP JP2004058301A patent/JP4102318B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005250708A (ja) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8824802B2 (en) | Method and system for gesture recognition | |
JP7146247B2 (ja) | 動作認識方法及び装置 | |
Amor et al. | Action recognition using rate-invariant analysis of skeletal shape trajectories | |
US6256033B1 (en) | Method and apparatus for real-time gesture recognition | |
Kale et al. | Identification of humans using gait | |
CN110711374B (zh) | 多模态舞蹈动作评价方法 | |
Yang et al. | Extraction of 2d motion trajectories and its application to hand gesture recognition | |
CN103577793B (zh) | 手势识别方法及装置 | |
US8428306B2 (en) | Information processor and information processing method for performing process adapted to user motion | |
US6674877B1 (en) | System and method for visually tracking occluded objects in real time | |
US7324110B2 (en) | Method and system for cleaning motion capture data | |
Bouchard et al. | Semantic segmentation of motion capture using laban movement analysis | |
JP2016099982A (ja) | 行動認識装置、行動学習装置、方法、及びプログラム | |
Bhuyan et al. | Trajectory guided recognition of hand gestures having only global motions | |
KR20140026629A (ko) | 동적 제스처 인식 프로세스 및 저작 시스템 | |
JP4102318B2 (ja) | 道具動作認識装置および道具動作認識方法 | |
CN107346207B (zh) | 一种基于隐马尔科夫模型的动态手势切分识别方法 | |
Rungsarityotin et al. | Finding location using omnidirectional video on a wearable computing platform | |
Hassan et al. | User-dependent sign language recognition using motion detection | |
Zhang et al. | Intelligent sports performance scoring and analysis system based on deep learning network | |
Del Bue et al. | Non-rigid structure from motion using non-parametric tracking and non-linear optimization | |
CN110163142B (zh) | 实时手势识别方法及系统 | |
Bhuyan et al. | Key Video Object Plane Selection by MPEG-7 Visual Shape Descriptor for Summarization and Recognition of Hand Gestures. | |
KR100924795B1 (ko) | 입술움직임 영상 판별 방법 및 그 장치 | |
Kale et al. | Gait-based human identification from a monocular video sequence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080221 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080321 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110328 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120328 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130328 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |