JP4654773B2 - 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP4654773B2
JP4654773B2 JP2005160004A JP2005160004A JP4654773B2 JP 4654773 B2 JP4654773 B2 JP 4654773B2 JP 2005160004 A JP2005160004 A JP 2005160004A JP 2005160004 A JP2005160004 A JP 2005160004A JP 4654773 B2 JP4654773 B2 JP 4654773B2
Authority
JP
Japan
Prior art keywords
moving image
area
image data
unit
frame moving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005160004A
Other languages
English (en)
Other versions
JP2006338170A (ja
Inventor
一 白坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2005160004A priority Critical patent/JP4654773B2/ja
Priority to US11/443,349 priority patent/US8165344B2/en
Publication of JP2006338170A publication Critical patent/JP2006338170A/ja
Application granted granted Critical
Publication of JP4654773B2 publication Critical patent/JP4654773B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は人物の構成部品を識別する基準となる情報を取得する技術に関する。
従来、手話を行う人物などを被写体とした動画像の動きを検知する技術が存在する。例えば特許文献1によると、前フレーム画像と現フレーム画像の差分が所定の閾値以上であることを条件に動作を伴い主なる被写体に次ぐ重要性を持つ対象部を囲んで変動自在の周辺動きウインドウを構成する全画像を矩形の小ブロックに分割して逐次処理を行う方式の下で、ブロックの動画像に伴った動きベクトルを利用して、次のフレームの周辺動きウインドウの位置及び領域を推定し、変動自在の領域にまで周辺動きウインドウを追随させる。
また、特許文献2によると、撮像画像解析装置は、基準カメラであるカメラで撮像された画像(撮像画像)から、その撮像画像内に存在する対象人物の肌色領域を抽出する。具体的には、撮像画像における全画素のRGB値を、色相、明度、彩度からなるHLS空間に変換し、色相、明度、彩度が予め設定された閾値の範囲内にある画素を肌色領域として抽出する。輪郭抽出装置は対象人物の輪郭を抽出する。そして、ジェスチャ認識装置は、対象人物の輪郭情報と肌色領域情報に基づいて、対象人物の実空間上における顔位置と手先位置を検出する。
特開2002−165222号公報 特開2004−303014号公報
特許文献1の技術では動きベクトルで手の位置を推定するため、人物とは無関係の物体の動きを誤って追従してしまうことがある。また、人物の肌の色は個人によって差異があるため、特許文献2の技術のような画一的な肌色の閾値の範囲内では、必ずしも手の肌色を正確に検出できるとは限らない。本発明はこのような問題点に鑑みてなされたもので、特定人物の構成部品を正確に識別できるようにすることを目的とする。
上記課題を解決するため、本発明に係る情報処理装置は、フレーム動画像データを入力する入力部と、入力部に入力されたあるフレーム動画像データに基づいて人物の構成部品を識別する基準となる基準情報を取得する基準情報取得部と、基準情報取得部が取得した基準情報に基づき、人物の構成部品の存在する領域である構成部品領域を、基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出する構成部品領域抽出部と、構成部品領域に基づいて、所定の情報処理を優先的に行う領域である優先領域を基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定する優先領域設定部と、優先領域設定部の設定した優先領域に所定の情報処理を優先的に行う処理部と、を備える。
この発明によると、あるフレーム動画像からある人物の基準情報を取得する。特定人物の基準情報を取得できれば、そのフレーム動画像以後のフレーム動画像における特定人物の構成部品、例えば手や顔の存在領域を正確に追従できる。そして、抽出した特定人物の構成部品の存在領域に基づいて優先的な処理を行う領域を設定することで、人物の構成部品の存在する重要な領域に各種の情報処理を優先して行うことができる。
この情報処理装置は、入力部に入力されたあるフレーム動画像データから人物の顔領域を検出する検出部をさらに備え、基準情報取得部は検出部の検出した人物の顔領域から基準情報を取得するようにしてもよい。
好ましくは、この情報処理装置は、基準情報取得部は人物の顔領域の色情報を基準情報として取得する。
こうすると、各人物の肌の色の情報を人物ごとに取得できる。
好ましくは、検出部は入力部に入力されたあるフレーム動画像データから人物の目、口又は鼻の領域を検出し、基準情報取得部は人物の顔領域から人物の目、口又は鼻の領域を除外した領域の色情報を基準情報として取得する。
こうすれば、特定人物の肌の色の情報を可及的に正確に取得することができる。
基準情報の概念には、基準情報取得部の取得した色情報に基づいて規定される色の範囲を含めることができる。例えば、基準情報は、顔領域における色相、輝度及び彩度の上限値及び下限値で規定される色の範囲とすることができる。あるいは、顔領域中の各画素の色情報の平均値を基準とした所定の誤差範囲としてもよい。
そして、構成部品領域抽出部は色の範囲内に収まる色情報を有する画素領域を構成部品領域として抽出するとよい。
また、優先領域設定部は構成部品領域を包含する領域を優先領域として設定するとよい。
なお、優先領域の大きさや形状は任意であるが、少なくとも、構成部品領域を包含する領域を優先領域に設定すれば、優先領域によって人物の顔や手の可動範囲をカバーでき好ましい。
この情報処理装置は、入力部に入力されたあるフレーム動画像データから人物の目、口又は鼻の位置を検出する検出部をさらに備え、優先領域設定部は検出部の検出した人物の目、口又は鼻の位置に基づいて優先領域を設定してもよい。
本発明に係る動画像符号化装置は、フレーム動画像データを入力する入力部と、入力部に入力されたフレーム動画像データを圧縮する圧縮部と、圧縮部の圧縮したフレーム動画像データを量子化する量子化部と、量子化部の量子化したフレーム動画像データを出力する出力部と、入力部に入力されたあるフレーム動画像データに基づいて人物の構成部品を識別する基準となる基準情報を取得する基準情報取得部と、基準情報取得部が取得した基準情報に基づき、人物の構成部品の存在する領域である構成部品領域を、基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出する構成部品領域抽出部と、構成部品領域に基づいて、量子化の適応レベルを細かくする領域である高レベル量子化領域を基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定する高レベル量子化領域設定部と、を備え、量子化部は高レベル量子化領域の設定された高レベル量子化領域のブロックに対する量子化の適応レベルを細かくするよう調節する。
あるフレーム動画像からある特定人物の基準情報を取得できれば、そのフレーム動画像以後のフレーム動画像における特定人物の構成部品、例えば手や顔の存在領域を正確に追従できる。そして、抽出した特定人物の構成部品の存在領域に基づいて量子化の適応レベルを細かくする領域を設定することで、人物の構成部品の存在する重要な領域の画質を優先的に高めることができる。
なお、フレーム動画像データを入力するステップと、入力されたあるフレーム動画像データに基づいて人物の構成部品を識別する基準となる基準情報を取得するステップと、基準情報に基づき、人物の構成部品の存在する領域である構成部品領域を、基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出するステップと、構成部品領域に基づいて、所定の情報処理を優先的に行う領域である優先領域を基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定するステップと、優先領域に所定の情報処理を優先的に行うステップと、を含む情報処理方法も本発明に含まれる。この方法をコンピュータに実行させるプログラムも本発明に含まれる。
この発明によると、あるフレーム動画像からある特定人物の基準情報を取得できれば、そのフレーム動画像以後のフレーム動画像における特定人物の構成部品、例えば手や顔の存在領域を正確に追従できる。そして、抽出した特定人物の構成部品の存在領域に基づいて優先的な処理を行う領域を設定することで、人物の構成部品の存在する重要な領域に各種の情報処理を優先して行うことができる。
抽出した特定人物の構成部品の存在領域に基づいて量子化の適応レベルを細かくする領域を設定することで、人物の構成部品の存在する重要な領域の画質を優先的に高めることができる。
以下、添付した図面を参照し本発明の好ましい実施形態を説明する。
図1は本発明の好ましい実施形態に係る基準情報取得装置1及び基準情報取得装置1を内蔵した符号化装置100のブロック図である。符号化装置100は、画像入力部11、動きベクトル検出回路14、動き補償回路15、DCT16、適応量子化回路17、可変長符号化器(VLC)18、符号化制御部20、バッファ19、データ送信部21等を備えている。この装置は、動き補償予測符号化と、DCTによる圧縮符号化を組み合わせたMPEG2方式の符号化装置の構成を一部含んでいる。
画像入力部11は、図示しないCCD等の撮像素子を備えた撮像装置などから動画像信号を入力する。
動きベクトル検出回路14は、画像入力部11から入力されたデータが表す現在のフレーム画像を、フレームメモリ22に記憶されている前のフレーム画像と比較することで、動きベクトルを検出する。この動きベクトルの検出は、入力された現在のフレーム画像を複数のマクロブロックに分割し、個々のマクロブロックを単位として、前のフレーム画像上に各々設定した探索範囲内で被探索マクロブロックを適宜動かしながら誤差演算を繰り返すことで、被探索マクロブロックに最も類似しているマクロブロック(誤差が最小となるマクロブロック)を探索範囲内から探し出し、該マクロブロックと被探索マクロブロックとのずれ量及びずれの方向を被探索マクロブロックについての動きベクトルとする。そして、各マクロブロック毎に求めた動きベクトルを各マクロブロック毎の誤差を考慮して合成することで、予測符号化における予測差分を最小とする動きベクトルを求めることができる。
動き補償回路15は、検出した動きベクトルに基づき予測用参照画像に対して動き補償を行うことで予測画像のデータを生成し、減算器23へ出力する。減算器23は、画像入力部11からから入力されたデータが表す現在のフレーム画像から、動き補償回路15から入力されたデータが表す予測画像を減算することで、予測差分を表す差分データを生成する。
減算器23にはDCT(離散コサイン変換)部16、適応量子化回路17、VLC18、バッファ19が順次接続されている。DCT16は、減算器23から入力された差分データを任意のブロック毎に直交変換して出力し、適応量子化回路17は、DCT16から入力された直交変換後の差分データを所定の量子化ステップで量子化してVLC18へ出力する。また、VLC18には動き補償回路15が接続されており、動き補償回路15から動きベクトルのデータも入力される。VLC18は、直交変換・量子化を経た差分データを2次元ハフマン符号により符号化すると共に、入力された動きベクトルのデータもハフマン符号により符号化し、両者を多重化して符号化動画像データとして出力する。符号化動画像データはバッファ19に蓄積され、データ送信部21から画像圧縮情報としてインターネットなどのネットワークにパケット送出される。
適応量子化回路17は、画面を複数のブロックに分割して量子化処理を行う際、量子化ステップをブロック内の特徴量に応じてブロック単位に変化させる適応量子化処理を行う。
図2は本発明に係る基準情報取得装置1の詳細構成を示すブロック図である。基準情報取得装置1は、入力されたあるフレーム画像から人物の構成部品の特徴量(具体的には位置、形状、大きさ)を示すランドマークを検出するランドマーク検出部2と、ランドマーク検出部2によって検出されたランドマークに基づいて基準領域を設定し、設定された基準領域に包含される基準情報を取得する基準情報取得部3とを備える。
ランドマーク検出部2によるランドマーク検出の技術は各種のものを採用しうる。
図3は、ランドマーク検出部2が人物の顔を含んだ画像から検出した、人物の構成部品の一例である目、口、鼻、顔の輪郭の位置、形状、大きさを示すランドマークをドットで示している。
基準情報取得部3の設定する基準領域は、ランドマークの位置に基づいて設定されるが、どのように基準領域を設定するかは特に限定されない。
図4は一例として、顔輪郭のランドマークで囲まれかつ目のランドマークの位置より下の領域から鼻と口のランドマークで囲まれた領域を除外した領域R1を基準領域に設定している。目、鼻、口を除外するのは、特定人物の肌の色の情報を可及的に正確に取得するためである。
基準情報取得部3は、基準領域から基準情報を抽出する。基準情報は、人物の構成部品を識別する基準となる情報であり、好ましくは、基準領域中の各画素の色情報に基づいて規定される。例えば、基準情報は、基準領域中の各画素の色相、輝度及び彩度の上限値及び下限値で規定される色の範囲とすることができる。あるいは、基準領域中の各画素の色情報の平均値を基準とした所定の誤差範囲としてもよい。以下、このような色の範囲を規定する基準情報を、特に基準色範囲と呼ぶ。
なお、どのフレーム画像から基準情報を取得するかは任意であり、入力されたフレーム画像ごとに取得してもよいし、特定のフレーム画像(所定の時間間隔で入力されるフレーム画像ごと)に取得してもよい。
再び図1を参照すると、適応量子化回路17は、構成部品領域抽出部17a及び領域設定部17bを有している。構成部品領域抽出部17aは、基準情報取得装置1があるフレーム画像から取得した基準情報に基づき、人物の構成部品の存在する領域である構成部品領域を、基準情報を抽出したフレーム画像以後のフレーム画像(以後の各フレーム画像あるいは所定の時間を隔てたフレーム画像ごと)から抽出する。領域設定部17bは、構成部品領域に基づき、所定の情報処理を優先的に行う領域である優先領域、具体的には量子化の適応レベルを細かくする領域(以下高レベル量子化領域と称す)を以後の各フレーム画像に設定する。
構成部品領域は、基準情報をパラメータとして検索できる領域であれば何でもよいが、好適には、基準色範囲内に収まる色情報を有する画素領域とする。
また、優先領域は、構成部品領域の位置、形状、大きさなどをパラメータとして決定される領域であれば何でもよいが、好適には、構成部品領域を包含する領域とする。
例えば、ある特定人物の顔部分の領域R1から基準色範囲が取得できれば、その人物の手の肌の色も基準色範囲内に収まると考えられる。このため、図5に示すように、基準色範囲内に収まる色情報を有する画素領域を構成部品領域X1(右手部分)、X2(左手部分)、X3(顔部分)とし、構成部品領域X1〜X3を全部包含する最小面積の多角形領域R2を、優先領域ないし高レベル量子化領域に設定すると、人物の顔部分及び両手部分がこの領域R2に収まる。領域R2の形状は特に限定されず、円形等であってもよい。フレーム画像ごとに構成部品領域X1〜X3の位置は変化しうるが、領域R2は、フレームごとに設定されるため、各フレームにおける構成部品領域X1〜X3の位置に追従して変形することになる。
なお、基準情報を取得したフレーム画像においては、ランドマークの位置に基づいて顔部分に相当する構成部品領域X3を抽出することも可能である。ランドマークの位置、形状、大きさに基づいて構成部品領域X1(右手部分)、X2(左手部分)の可動領域を推定し、この可動領域を優先領域に設定してもよい。
なお、領域設定部17aは、基準情報取得装置1に備えられていてもよい。フレーム画像に設定された優先領域内にのみ、所定の情報処理(例えばエッジ処理などの各種画像処理)を優先的に行ってもよい。
適応量子化回路17は、領域設定部17bの設定した高レベル量子化領域のブロックに対しては量子化の適応レベル(量子化スケール)が細かくなるよう調節し、画像復号による画質の劣化を目立ちにくくする。一方、高レベル量子化領域以外のブロックに対しては、量子化の適応レベルが粗くなるよう調節する。これにより、データ量削減と必要な部分の画質維持を両立することが可能となる。
この符号化装置100は、特にテレビ電話による聴覚障害者の手話通話に有用である。例えば、図5のような高レベル量子化領域R2を設定しておけば、表情と手の位置が刻々変化しても、それに追従する高品質の領域R2で容易に確認できる。かつ、手話通話にとって余り重要でない領域R2以外の部分(主として背景などの動きのない部分)のデータ量は削減できるから、不要なデータ転送による遅延発生を防止でき、手話通話のスムースな実現の一助となる。
以上説明した通り、本発明の基準情報取得装置1は、従来のように画一的な肌色領域でなく、人物ごとに微妙に異なる基準情報を入力した任意のフレーム画像から検出し、また、本発明の領域設定部17bは、動きベクトルでなく基準情報に基づいて優先領域を設定するから、人物とは無関係の物体に領域が追従することもなく、正確・適切に人物の構成部品の存在領域を追従できる。
なお、本実施形態で述べた基準情報取得装置1や符号化装置100を構成する回路は、コンピュータ(演算装置)のプログラム制御によって実現可能であり、その制御の方法も本発明に含めることができる。
符号化装置のブロック図 基準情報取得装置のブロック図 ランドマークの一例を示す図 基準領域の一例を示す図 画像中に設定された高レベル量子化領域の一例を示す図
符号の説明
1:基準情報取得装置、2:ランドマーク検出部、3:基準情報取得部、17b:領域設定部

Claims (12)

  1. フレーム動画像データを入力する入力部と、
    前記入力部に入力されたあるフレーム動画像データから人物の顔領域を検出する検出部と、
    前記検出部の検出した人物の顔領域に基づいて人物の顔および手を含む構成部品を識別する基準となる基準情報を取得する基準情報取得部と、
    前記基準情報取得部が取得した基準情報に基づき、前記人物の顔および手を含む構成部品の存在する領域である構成部品領域を、前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出する構成部品領域抽出部と、
    前記構成部品領域抽出部が抽出した人物の顔および手を含む構成部品領域を包含し、所定の情報処理を優先的に行う領域である優先領域を前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定する優先領域設定部と、
    前記優先領域設定部の設定した優先領域に前記所定の情報処理を優先的に行う処理部と、
    を備える情報処理装置。
  2. 前記基準情報取得部は前記人物の顔領域の色情報を前記基準情報として取得する請求項に記載の情報処理装置。
  3. 前記検出部は前記入力部に入力されたあるフレーム動画像データから前記人物の目、口又は鼻の領域を検出し、
    前記基準情報取得部は前記人物の顔領域から前記人物の目、口又は鼻の領域を除外した領域の色情報を前記基準情報として取得する請求項に記載の情報処理装置。
  4. 前記基準情報は前記基準情報取得部の取得した色情報に基づいて規定される色の範囲を含む請求項又はに記載の情報処理装置。
  5. 前記構成部品領域抽出部は前記色の範囲内に収まる色情報を有する画素領域を構成部品領域として抽出する請求項に記載の情報処理装置。
  6. 前記入力部に入力されたあるフレーム動画像データから人物の目、口又は鼻の位置を検出する検出部をさらに備え、
    前記優先領域設定部は前記検出部の検出した人物の目、口又は鼻の位置に基づいて前記優先領域を設定する請求項1に記載の情報処理装置。
  7. 前記構成部品領域は前記人物の右手および左手を含む請求項1〜6のいずれかに記載の情報処理装置。
  8. 前記処理部は、前記優先領域のブロックに対する量子化の適応レベルを細かくするよう調節する請求項1〜7のいずれかに記載の情報処理装置。
  9. 前記処理部は、前記優先領域以外のブロックに対する量子化の適応レベルを粗くするよう調節し、前記優先領域のブロックおよび前記優先領域以外のブロックに対する量子化の適応レベルに応じた量子化ステップで前記フレーム動画像データを量子化し、テレビ電話の手話通話のデータとして送信する請求項8に記載の情報処理装置。
  10. フレーム動画像データを入力する入力部と、
    前記入力部に入力されたフレーム動画像データを圧縮する圧縮部と、
    前記圧縮部の圧縮したフレーム動画像データを量子化する量子化部と、
    前記量子化部の量子化したフレーム動画像データを出力する出力部と、
    前記入力部に入力されたあるフレーム動画像データから人物の顔領域を検出する検出部と、
    前記検出部の検出した人物の顔領域に基づいて人物の顔および手を含む構成部品を識別する基準となる基準情報を取得する基準情報取得部と、
    前記基準情報取得部が取得した基準情報に基づき、前記人物の顔および手を含む構成部品の存在する領域である構成部品領域を、前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出する構成部品領域抽出部と、
    前記構成部品領域抽出部が抽出した人物の顔および手を含む構成部品領域を包含し、量子化の適応レベルを細かくする領域である高レベル量子化領域を前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定する高レベル量子化領域設定部と、
    を備え、
    前記量子化部は前記高レベル量子化領域の設定された高レベル量子化領域のブロックに対する量子化の適応レベルを細かくするよう調節する動画像符号化装置。
  11. フレーム動画像データを入力するステップと、
    前記入力されたあるフレーム動画像データから人物の顔領域を検出するステップと、
    前記検出した人物の顔領域に基づいて人物の顔および手を含む構成部品を識別する基準となる基準情報を取得するステップと、
    前記基準情報に基づき、前記人物の顔および手を含む構成部品の存在する領域である構成部品領域を、前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出するステップと、
    前記抽出した人物の顔および手を含む構成部品領域を包含し、所定の情報処理を優先的に行う領域である優先領域を前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定するステップと、
    前記優先領域に前記所定の情報処理を優先的に行うステップと、
    を含む情報処理方法。
  12. フレーム動画像データを入力するステップと、
    前記入力されたあるフレーム動画像データから人物の顔領域を検出するステップと、
    前記検出した人物の顔領域に基づいて人物の顔および手を含む構成部品を識別する基準となる基準情報を取得するステップと、
    前記基準情報に基づき、前記人物の顔および手を含む構成部品の存在する領域である構成部品領域を、前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データから抽出するステップと、
    前記抽出した人物の顔および手を含む構成部品領域を包含し、所定の情報処理を優先的に行う領域である優先領域を前記基準情報を抽出したフレーム動画像データ以後に入力されるフレーム動画像データに設定するステップと、
    前記優先領域に前記所定の情報処理を優先的に行うステップと、
    をコンピュータに実行させる情報処理プログラム。
JP2005160004A 2005-05-31 2005-05-31 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム Expired - Fee Related JP4654773B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005160004A JP4654773B2 (ja) 2005-05-31 2005-05-31 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム
US11/443,349 US8165344B2 (en) 2005-05-31 2006-05-31 Image processing apparatus, moving image encoding apparatus, information processing method and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005160004A JP4654773B2 (ja) 2005-05-31 2005-05-31 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2006338170A JP2006338170A (ja) 2006-12-14
JP4654773B2 true JP4654773B2 (ja) 2011-03-23

Family

ID=37558696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005160004A Expired - Fee Related JP4654773B2 (ja) 2005-05-31 2005-05-31 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム

Country Status (2)

Country Link
US (1) US8165344B2 (ja)
JP (1) JP4654773B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538195B2 (en) * 2007-09-17 2013-09-17 Raytheon Company Hyperspectral image dimension reduction system and method
JP4844657B2 (ja) * 2009-07-31 2011-12-28 カシオ計算機株式会社 画像処理装置及び方法
US8811743B2 (en) * 2010-06-09 2014-08-19 Microsoft Corporation Resource-aware computer vision
US8620024B2 (en) * 2010-09-17 2013-12-31 Sony Corporation System and method for dynamic gesture recognition using geometric classification
US9031354B2 (en) 2011-03-31 2015-05-12 Raytheon Company System and method for post-detection artifact reduction and removal from images
US9064308B2 (en) 2011-04-13 2015-06-23 Raytheon Company System and method for residual analysis of images
US8675989B2 (en) 2011-04-13 2014-03-18 Raytheon Company Optimized orthonormal system and method for reducing dimensionality of hyperspectral images
US8842937B2 (en) * 2011-11-22 2014-09-23 Raytheon Company Spectral image dimensionality reduction system and method
US8731323B2 (en) * 2011-11-23 2014-05-20 Stmicroelectronics Asia Pacific Pte Ltd. General banding and codec banding artifact removal
US8655091B2 (en) 2012-02-24 2014-02-18 Raytheon Company Basis vector spectral image compression
US9147265B2 (en) 2012-06-04 2015-09-29 Raytheon Company System and method for rapid cluster analysis of hyperspectral images
US8660360B1 (en) 2012-08-03 2014-02-25 Raytheon Company System and method for reduced incremental spectral clustering
JP5774558B2 (ja) * 2012-08-10 2015-09-09 株式会社東芝 手書き文書処理装置、方法及びプログラム
JP5948200B2 (ja) * 2012-09-27 2016-07-06 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
TWI479430B (zh) * 2012-10-08 2015-04-01 Pixart Imaging Inc 以自然影像進行的手勢辨識方法
US8805115B2 (en) 2012-11-02 2014-08-12 Raytheon Company Correction of variable offsets relying upon scene
JP6006112B2 (ja) * 2012-12-28 2016-10-12 オリンパス株式会社 画像処理装置、画像処理方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000354247A (ja) * 1999-06-10 2000-12-19 Sharp Corp 画像処理装置
JP2004350300A (ja) * 2004-06-07 2004-12-09 Denso Corp 画像信号の復号化装置
JP2005109606A (ja) * 2003-09-29 2005-04-21 Sony Corp 信号処理方法、信号処理装置、記録装置、再生装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2088082C (en) * 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
US6028960A (en) * 1996-09-20 2000-02-22 Lucent Technologies Inc. Face feature analysis for automatic lipreading and character animation
US6343141B1 (en) * 1996-10-08 2002-01-29 Lucent Technologies Inc. Skin area detection for video image systems
JP3749369B2 (ja) * 1997-03-21 2006-02-22 株式会社竹中工務店 ハンドポインティング装置
WO1999022518A1 (de) * 1997-10-28 1999-05-06 Siemens Aktiengesellschaft Verfahren und vorrichtung zur verarbeitung eines digitalisierten bildes
US6148092A (en) * 1998-01-08 2000-11-14 Sharp Laboratories Of America, Inc System for detecting skin-tone regions within an image
JP3549725B2 (ja) * 1998-04-13 2004-08-04 シャープ株式会社 画像処理装置
US6545706B1 (en) * 1999-07-30 2003-04-08 Electric Planet, Inc. System, method and article of manufacture for tracking a head of a camera-generated image of a person
US6526161B1 (en) * 1999-08-30 2003-02-25 Koninklijke Philips Electronics N.V. System and method for biometrics-based facial feature extraction
KR100343223B1 (ko) * 1999-12-07 2002-07-10 윤종용 화자 위치 검출 장치 및 그 방법
JP2001216515A (ja) * 2000-02-01 2001-08-10 Matsushita Electric Ind Co Ltd 人物の顔の検出方法およびその装置
JP3486871B2 (ja) 2000-11-28 2004-01-13 財団法人理工学振興会 動画像情報の高性能符号圧縮システム
TWI276357B (en) * 2002-09-17 2007-03-11 Ginganet Corp Image input apparatus for sign language talk, image input/output apparatus for sign language talk, and system for sign language translation
DE602004006190T8 (de) * 2003-03-31 2008-04-10 Honda Motor Co., Ltd. Vorrichtung, Verfahren und Programm zur Gestenerkennung
JP4153819B2 (ja) 2003-03-31 2008-09-24 本田技研工業株式会社 ジェスチャ認識装置、ジェスチャ認識方法及びジェスチャ認識プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000354247A (ja) * 1999-06-10 2000-12-19 Sharp Corp 画像処理装置
JP2005109606A (ja) * 2003-09-29 2005-04-21 Sony Corp 信号処理方法、信号処理装置、記録装置、再生装置
JP2004350300A (ja) * 2004-06-07 2004-12-09 Denso Corp 画像信号の復号化装置

Also Published As

Publication number Publication date
JP2006338170A (ja) 2006-12-14
US8165344B2 (en) 2012-04-24
US20070009157A1 (en) 2007-01-11

Similar Documents

Publication Publication Date Title
JP4654773B2 (ja) 情報処理装置、動画像符号化装置、情報処理方法及び情報処理プログラム
US10015393B2 (en) Imaging control device, image processing device, imaging controlling method, and image processing method
KR100918480B1 (ko) 스테레오 비전 시스템 및 그 처리 방법
US20160100166A1 (en) Adapting Quantization
US9729870B2 (en) Video coding efficiency with camera metadata
KR100669837B1 (ko) 입체 비디오 코딩을 위한 포어그라운드 정보 추출 방법
US10735724B2 (en) Method and device for compressing image on basis of photography information
KR20100136972A (ko) 관심 특성 색 모델 변수의 적응성 추정을 위한 방법 및 장치
US8873869B2 (en) Image processing apparatus and control method for the same
US20120027076A1 (en) Method for image visual effect improvement of video encoding and decoding
KR100951637B1 (ko) 스테레오 비전 시스템 및 이의 영상 처리 방법
KR20110064722A (ko) 영상 처리 정보와 컬러 정보의 동시 전송을 위한 코딩 장치 및 방법
JP2009055236A (ja) 映像符号化装置及び方法
JP5153660B2 (ja) 画像処理装置および画像処理方法、ならびにプログラム
US11538169B2 (en) Method, computer program and system for detecting changes and moving objects in a video view
Farah et al. Full-reference and reduced-reference quality metrics based on SIFT
KR100493702B1 (ko) 화상통신 시스템 및 그 운용방법
AU2009238382A1 (en) Multiple JPEG coding of same image
KR20070056229A (ko) 영상 부호기 및 이의 관심 영역 검출방법
WO2024077772A1 (en) Method and system for image data processing
JP2008028528A (ja) 画像符号化装置、方法およびシステム
KR100649746B1 (ko) 스케치 연산자 기반 블록 정합 알고리즘을 이용한 움직임추정 방법, 동영상 부호화 방법 및 그 장치
CN110784716A (zh) 媒体数据处理方法、装置及介质
KR100474771B1 (ko) 탬플리트 기반 얼굴 영역 추출방법
JP5644578B2 (ja) 画像処理装置、画像処理方法および画像処理のためのコンピュータープログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100729

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees